- Les grands principes du Machine Learning
- Les modélisations supervisées, non-supervisées et par renforcement
- Les étapes de construction d’un modèle
- L’évaluation des modèles
- Travaux pratique : évaluer et comparer des modèles préparés pour l’exercice
- Préparation des variables
- La nature statistique des données et leurs dimensions
- Représenter les variables, détecter les données aberrantes
- Le ré-échantillonnage de variables
- Réduire le set de variables pour un modèle, faire avec les multi-colinéarités
- Traiter les classes rares
- Les algorithmes
- Présentation de modèles :
- régression linéaire simple, multiple, polynomiale, régression logistique ;
- classification hiérarchique et non hiérarchique (K-means) ;
- classification par arbres de décision et ensemble Naïve Bayes, Random Forest ;
- machines à vecteurs supports ;
- méthodes à noyaux ;
- Gradient Boosting ;
- réseau neuronal
- Mise en pratique
Chaque modèle est accompagné d'un exemple pré-codé. Les exercices s'intercalent dans la présentation pour permettre à chaque équipe de tester les modèles sur leur propre jeu de données.
Matériel nécessaire :
Les accès à un outil informatique en ligne adapté seront fournis au stagiaire avant le démarrage de la formation. Aucun logiciel spécifique n'est à installer. Seule une connexion à Internet est requise