Il progetto rappresenta un'analisa statistica condotta in R su un dataset rappresentativo della mobilità e delle condizioni stradali in Italia nel 2019.
Il dataset riporta, per ciascuna regione e provincia autonoma d'Italia, la percentuale di famiglie che hanno espresso un grado di insoddisfazione molto alto riguardo alle seguente problematiche:
- Difficoltà nel trovare un parcheggio;
- Difficoltà di collegamento con i mezzi pubblici;
- Traffico;
- Scarsa illuminazione stradale;
- Scarse condizioni stradali.
L'analisi condotta si è concentrata nello specifico sui seguenti aspetti:
- Data visualization (barplot, boxplot, istogrammi);
- Confronto con il dataset relativo all'anno 2018 (boxplot ad intaglio);
- Analisi di Pareto;
- Statistica descrittiva univariata (funzione di distribuzione empirica continua, media, mediana, classe modale campionarie, mediana per la distribuzione di frequenze, quartili, varianza, deviazione standard, coefficiente di variazione, forma della distribuzione di frequenze);
- Statistica descrittiva bivariata (scatterplot, covarianza e correlazione campionaria, regressione lineare semplice, regressione lineare multipla, regressione non lineare);
- Analisi dei cluster (metodi di enumerazione completa, metodi gerarchici, metodi non gerarchici).