Altitud
Édition · 25 mai 2026
Toutes les formations

FORMATION IA

MLflow et Weights & Biases pour le suivi d'expériences ML

Maîtrisez le suivi d'expériences, les registres de modèles et les sweeps d'hyperparamètres avec MLflow et W&B.

Voir si cette formation est la bonne pour votre équipe, diagnostic gratuit

Lancer le diagnostic
Format
bootcamp
Durée
16-24h
Niveau
practitioner
Taille de groupe
4-16
Prix / participant
€2K-€3K
Prix groupe
€12K-€30K
Public
Ingénieurs ML et data scientists qui entraînent régulièrement des modèles et ont besoin d'une gestion rigoureuse des expériences
Prérequis
Maîtrise de Python et expérience pratique de l'entraînement de modèles ML (scikit-learn, PyTorch ou TensorFlow) ; connaissance basique de Git requise

Ce qu'elle couvre

Ce bootcamp praticien intensif couvre l'intégralité du cycle de vie des expériences ML à l'aide de deux outils de référence : MLflow et Weights & Biases. Les participants apprennent à instrumenter des runs d'entraînement, comparer des expériences, gérer les versions de modèles et exécuter des sweeps d'hyperparamètres automatisés. Le programme aborde également les workflows de collaboration en équipe, la gestion des artefacts et les arbitrages entre déploiement auto-hébergé et SaaS. Le format est très axé sur les travaux pratiques avec des jeux de données réels tout au long de la formation.

À l'issue, vous saurez

  • Instrumenter tout script d'entraînement basé sur Python avec la journalisation MLflow ou W&B en moins de 15 minutes
  • Configurer et exécuter un W&B Sweep ou une recherche d'hyperparamètres MLflow sur un vrai modèle pour identifier les configurations optimales
  • Enregistrer, versionner et promouvoir des modèles via le staging vers la production en utilisant la Model Registry MLflow
  • Concevoir un workflow de collaboration d'équipe avec des namespaces d'expériences partagés, des conventions de tagging et des politiques de contrôle d'accès
  • Évaluer et justifier une décision de déploiement auto-hébergé versus SaaS en fonction de la sensibilité des données, du coût et de la taille de l'équipe

Sujets abordés

  • MLflow tracking : journalisation des métriques, paramètres, artefacts et tags
  • Weights & Biases : runs, sweeps et le dashboard W&B
  • Model registry : versioning, staging et workflows de promotion
  • Optimisation des hyperparamètres avec W&B Sweeps et MLflow Projects
  • Gestion des artefacts et versioning des datasets
  • Patterns de collaboration d'équipe : expériences partagées et contrôles d'accès
  • MLflow auto-hébergé vs W&B SaaS : trade-offs de coût, sécurité et scalabilité
  • Intégration CI/CD pour des pipelines d'expériences automatisés

Modalité

Dispensé sur deux à trois jours, soit sur site soit à distance via vidéoconférence avec un environnement cloud partagé (par exemple AWS SageMaker Studio ou Google Colab Enterprise). Chaque session suit un ratio 30 % concepts / 70 % labs. Les participants reçoivent des environnements Docker pré-configurés et des notebooks Jupyter. Un exercice capstone les jours 2-3 requiert l'intégration des deux outils dans un mini pipeline ML. La livraison à distance utilise des breakout rooms pour les exercices de pair-lab.

Ce qui fait que ça marche

  • Établir des conventions de nommage partagées et des standards de tagging avant la première expérience d'équipe
  • Intégrer la journalisation des expériences dans CI/CD pour que chaque job d'entraînement soit automatiquement loggé sans effort développeur
  • Désigner un propriétaire de model registry qui examen et approuve les promotions du staging vers la production
  • Commencer par un petit audit de reproductibilité des expériences passées pour démontrer immédiatement la valeur métier

Erreurs fréquentes

  • Logger uniquement les métriques finales plutôt que les métriques à chaque étape, rendant impossible le diagnostic de l'instabilité de l'entraînement
  • Ignorer la model registry et se fier aux chemins de fichiers, causant une reproductibilité brisée lors du passage en production
  • Exécuter des W&B Sweeps sans stratégie d'arrêt, résultant en des coûts de compute incontrôlés
  • Choisir un MLflow auto-hébergé sans planifier le backend de stockage et l'authentification proxy, causant des migrations douloureuses plus tard

Quand NE PAS suivre cette formation

Une équipe qui n'a pas encore standardisé son framework d'entraînement (certains utilisant TensorFlow, d'autres PyTorch, d'autres AutoML SaaS) aura du mal à tirer de la valeur de cette formation, établissez d'abord une stack de modélisation commune.

Fournisseurs à considérer

Sources

Cas d'usage que cette formation débloque

Autres formations à ce niveau

Cette formation fait partie d'un catalogue Data & IA construit pour les leaders sérieux sur l'exécution. Lancez le diagnostic gratuit pour voir quelles formations sont prioritaires pour votre équipe.