FORMATION IA

MLflow et Weights & Biases pour le suivi d'expériences ML

Maîtrisez le suivi d'expériences, les registres de modèles et les sweeps d'hyperparamètres avec MLflow et W&B.

Voir si cette formation est la bonne pour votre équipe, diagnostic gratuit

Format: bootcamp
Durée: 16-24h
Niveau: practitioner
Taille de groupe: 4-16
Prix / participant: €2K-€3K
Prix groupe: €12K-€30K
Public: Ingénieurs ML et data scientists qui entraînent régulièrement des modèles et ont besoin d'une gestion rigoureuse des expériences
Prérequis: Maîtrise de Python et expérience pratique de l'entraînement de modèles ML (scikit-learn, PyTorch ou TensorFlow) ; connaissance basique de Git requise

Ce qu'elle couvre

Ce bootcamp praticien intensif couvre l'intégralité du cycle de vie des expériences ML à l'aide de deux outils de référence : MLflow et Weights & Biases. Les participants apprennent à instrumenter des runs d'entraînement, comparer des expériences, gérer les versions de modèles et exécuter des sweeps d'hyperparamètres automatisés. Le programme aborde également les workflows de collaboration en équipe, la gestion des artefacts et les arbitrages entre déploiement auto-hébergé et SaaS. Le format est très axé sur les travaux pratiques avec des jeux de données réels tout au long de la formation.

À l'issue, vous saurez

Instrumenter tout script d'entraînement basé sur Python avec la journalisation MLflow ou W&B en moins de 15 minutes
Configurer et exécuter un W&B Sweep ou une recherche d'hyperparamètres MLflow sur un vrai modèle pour identifier les configurations optimales
Enregistrer, versionner et promouvoir des modèles via le staging vers la production en utilisant la Model Registry MLflow
Concevoir un workflow de collaboration d'équipe avec des namespaces d'expériences partagés, des conventions de tagging et des politiques de contrôle d'accès
Évaluer et justifier une décision de déploiement auto-hébergé versus SaaS en fonction de la sensibilité des données, du coût et de la taille de l'équipe

Sujets abordés

MLflow tracking : journalisation des métriques, paramètres, artefacts et tags
Weights & Biases : runs, sweeps et le dashboard W&B
Model registry : versioning, staging et workflows de promotion
Optimisation des hyperparamètres avec W&B Sweeps et MLflow Projects
Gestion des artefacts et versioning des datasets
Patterns de collaboration d'équipe : expériences partagées et contrôles d'accès
MLflow auto-hébergé vs W&B SaaS : trade-offs de coût, sécurité et scalabilité
Intégration CI/CD pour des pipelines d'expériences automatisés

Modalité

Dispensé sur deux à trois jours, soit sur site soit à distance via vidéoconférence avec un environnement cloud partagé (par exemple AWS SageMaker Studio ou Google Colab Enterprise). Chaque session suit un ratio 30 % concepts / 70 % labs. Les participants reçoivent des environnements Docker pré-configurés et des notebooks Jupyter. Un exercice capstone les jours 2-3 requiert l'intégration des deux outils dans un mini pipeline ML. La livraison à distance utilise des breakout rooms pour les exercices de pair-lab.

Ce qui fait que ça marche

Établir des conventions de nommage partagées et des standards de tagging avant la première expérience d'équipe
Intégrer la journalisation des expériences dans CI/CD pour que chaque job d'entraînement soit automatiquement loggé sans effort développeur
Désigner un propriétaire de model registry qui examen et approuve les promotions du staging vers la production
Commencer par un petit audit de reproductibilité des expériences passées pour démontrer immédiatement la valeur métier

Erreurs fréquentes

Logger uniquement les métriques finales plutôt que les métriques à chaque étape, rendant impossible le diagnostic de l'instabilité de l'entraînement
Ignorer la model registry et se fier aux chemins de fichiers, causant une reproductibilité brisée lors du passage en production
Exécuter des W&B Sweeps sans stratégie d'arrêt, résultant en des coûts de compute incontrôlés
Choisir un MLflow auto-hébergé sans planifier le backend de stockage et l'authentification proxy, causant des migrations douloureuses plus tard

Quand NE PAS suivre cette formation

Une équipe qui n'a pas encore standardisé son framework d'entraînement (certains utilisant TensorFlow, d'autres PyTorch, d'autres AutoML SaaS) aura du mal à tirer de la valeur de cette formation, établissez d'abord une stack de modélisation commune.

Fournisseurs à considérer

Sources

Cas d'usage que cette formation débloque

Autres formations à ce niveau

Cette formation fait partie d'un catalogue Data & IA construit pour les leaders sérieux sur l'exécution. Lancez le diagnostic gratuit pour voir quelles formations sont prioritaires pour votre équipe.

Lancer le diagnostic Réserver un appel