La formation "Data Cleaning avec Pandas pour le Machine Learning [Python] 2021" s'adresse aux Data Scientists, aux développeurs et à tous les professionnels qui souhaitent apprendre à nettoyer et préparer des données pour des tâches de Machine Learning en utilisant la bibliothèque Pandas en Python. Pandas est une bibliothèque populaire et puissante pour la manipulation et l'analyse des données, offrant des fonctionnalités avancées pour la préparation des données avant leur utilisation dans des modèles d'apprentissage automatique.
Chapitre 1: Introduction au nettoyage des données avec pandas
# | Intitulé |
---|
4 | Présentation des concepts de base du nettoyage des données |
---|
4 | Installation et configuration de l'environnement python avec pandas |
---|
Chapitre 2: Manipulation des données avec pandas
# | Intitulé |
---|
4 | Chargement, exploration et visualisation des données avec pandas |
---|
4 | Sélection, filtrage et tri des données |
---|
4 | Transformation des données avec des opérations de fusion, de groupement et de pivotement |
---|
Chapitre 3: Gestion des valeurs manquantes
# | Intitulé |
---|
4 | Identification des valeurs manquantes dans les données |
---|
4 | Techniques de traitement des valeurs manquantes, y compris l'imputation et la suppression des lignes ou des colonnes |
---|
Chapitre 4: Détection et traitement des valeurs aberrantes
# | Intitulé |
---|
4 | Identification des valeurs aberrantes dans les données |
---|
4 | Méthodes de traitement des valeurs aberrantes, y compris l'imputation, la suppression ou le remplacement des valeurs aberrantes |
---|
Chapitre 5: Transformation des données pour le machine learning
# | Intitulé |
---|
4 | Normalisation et mise à l'échelle des données |
---|
4 | Encodage des variables catégorielles |
---|
4 | Sélection et extraction des caractéristiques pertinentes |
---|
Chapitre 6: Validation et évaluation des données nettoyées
# | Intitulé |
---|
4 | Division des données en ensembles de formation, de validation et de test |
---|
4 | Méthodes d'évaluation des modèles d'apprentissage automatique |
---|
Chapitre 7: Automatisation du processus de nettoyage des données
# | Intitulé |
---|
4 | Introduction à l'automatisation du processus de nettoyage des données |
---|
4 | Création de pipelines de nettoyage des données avec pandas |
---|
4 | Utilisation de fonctions et de méthodes personnalisées pour automatiser les tâches de nettoyage |
---|
4 | Application des pipelines de nettoyage aux nouveaux ensembles de données |
---|
4 | Gestion des mises à jour et des modifications dans le pipeline de nettoyage des données
|
---|