Le jeu de données proposé est celui de vente de maisons sur Paris. Nous avons utilisé R pour réaliser un modèle prédectif comme POC technologique.
Nous avons créé un script contenant un modèle de régression linéaire avec R. Dans le but d'estimer les prix des biens immobiliers sur Paris. Et nous avons utilisé les bibliothèques Shiny et GGPlot pour afficher graphiquement les résultats de la prédiction.
Ce projet nous a permis également de comparer à l'usage les deux langages R et Python.
- Avec des fonctions telles que lm, predict, R permet de faire la plupart du travail ;
- R a plus de fonction ‘built-in’ pour analyser des données, Python s’appuie sur des librairies ;
- Python exécute du code C pour économiser les ressources mémoire ;
- Il est généralement plus simple de faire des tâches non statistiques en Python (BeautifulSoup, requests...) ;
- R est plus fonctionnel, Python est plus orienté objet.