Description : Ce notebook fournit une analyse détaillée des données du Titanic. Il vise à explorer, visualiser et modéliser les données pour prédire les chances de survie des passagers.
Contenu :
-
Importation des librairies : Le notebook commence par importer les bibliothèques nécessaires telles que Pandas, NumPy, Matplotlib, Seaborn et sklearn.
-
Chargement des données : Les données du Titanic sont chargées dans un DataFrame Pandas pour l'analyse.
-
Exploration et nettoyage des données : Cette section inclut l'examen des types de données, la gestion des valeurs manquantes et la visualisation des distributions de différentes variables.
-
Analyse exploratoire des données (EDA) : Des visualisations sont utilisées pour explorer les relations entre les variables clés telles que l'âge, le sexe, la classe de cabine, et leur effet sur les chances de survie.
-
Ingénierie des caractéristiques : Transformation et création de nouvelles variables pour améliorer la modélisation, comme le codage des variables catégorielles et la création de nouvelles variables telles que la taille de la famille.
-
Préparation des données pour le modèle : Division des données en ensembles d'apprentissage et de test, et normalisation si nécessaire.
-
Modélisation : Application de différents modèles de machine learning, tels que la régression logistique, les arbres de décision et les forêts aléatoires, pour prédire la survie.
-
Évaluation du modèle : Comparaison des performances des modèles à l'aide de métriques telles que la précision et la matrice de confusion.
-
Conclusion : Résumé des résultats et recommandations pour de futures améliorations ou analyses.
Installation et exécution :
- Assurez-vous d'avoir Python installé sur votre système.
- Installez les packages nécessaires via pip :
pandas
,numpy
,matplotlib
,seaborn
,scikit-learn
. - Ouvrez le notebook dans Jupyter et exécutez chaque cellule séquentiellement.
Utilisation : Ce notebook est utile pour toute personne intéressée par l'analyse de données, l'apprentissage automatique ou pour ceux qui cherchent à comprendre les facteurs influençant la survie lors du naufrage du Titanic.
Auteurs et contributions :
- [Oladé LAOUROU]
- Pour toute contribution, veuillez soumettre une pull request avec les modifications proposées.