Skip to content

A detailed analysis of data from the Titanic, one of the most tragic shipwrecks in maritime history

Notifications You must be signed in to change notification settings

Mac-Aurel/Titanic_DataSet_Analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 

Repository files navigation

Titanic Data Analysis

Description : Ce notebook fournit une analyse détaillée des données du Titanic. Il vise à explorer, visualiser et modéliser les données pour prédire les chances de survie des passagers.

Contenu :

  1. Importation des librairies : Le notebook commence par importer les bibliothèques nécessaires telles que Pandas, NumPy, Matplotlib, Seaborn et sklearn.

  2. Chargement des données : Les données du Titanic sont chargées dans un DataFrame Pandas pour l'analyse.

  3. Exploration et nettoyage des données : Cette section inclut l'examen des types de données, la gestion des valeurs manquantes et la visualisation des distributions de différentes variables.

  4. Analyse exploratoire des données (EDA) : Des visualisations sont utilisées pour explorer les relations entre les variables clés telles que l'âge, le sexe, la classe de cabine, et leur effet sur les chances de survie.

  5. Ingénierie des caractéristiques : Transformation et création de nouvelles variables pour améliorer la modélisation, comme le codage des variables catégorielles et la création de nouvelles variables telles que la taille de la famille.

  6. Préparation des données pour le modèle : Division des données en ensembles d'apprentissage et de test, et normalisation si nécessaire.

  7. Modélisation : Application de différents modèles de machine learning, tels que la régression logistique, les arbres de décision et les forêts aléatoires, pour prédire la survie.

  8. Évaluation du modèle : Comparaison des performances des modèles à l'aide de métriques telles que la précision et la matrice de confusion.

  9. Conclusion : Résumé des résultats et recommandations pour de futures améliorations ou analyses.

Installation et exécution :

  • Assurez-vous d'avoir Python installé sur votre système.
  • Installez les packages nécessaires via pip : pandas, numpy, matplotlib, seaborn, scikit-learn.
  • Ouvrez le notebook dans Jupyter et exécutez chaque cellule séquentiellement.

Utilisation : Ce notebook est utile pour toute personne intéressée par l'analyse de données, l'apprentissage automatique ou pour ceux qui cherchent à comprendre les facteurs influençant la survie lors du naufrage du Titanic.

Auteurs et contributions :

  • [Oladé LAOUROU]
  • Pour toute contribution, veuillez soumettre une pull request avec les modifications proposées.

About

A detailed analysis of data from the Titanic, one of the most tragic shipwrecks in maritime history

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published