Skip to content

izazupan/APPR-2020-21

 
 

Repository files navigation

Analiza podatkov s programom R

  • Shiny Shiny
  • RStudio RStudio

Tematika

Analiza indeksa človekovega razvoja (HDI)

Opis

Indeks človekovega razvoja je primerjalno merilo za države. Ustvarjen je bil z namenom ocenjevati in primerjati revščino po širših merilih kot le na podlagi dohodkov.

Izračunan je glede na podatke o:

  • zdravju (indeks pričakovane življenjske dobe, LEI),
  • izobrazbi (indeks izobrazbe, EI) in
  • dohodku per capita (BNDpc po pariteti kupne moči, II).

HDI je geometrijsko povprečje teh treh komponent:

Kljub temu pa indeks predstavlja nekaj problemov, saj ne upošteva revščine oz. ekonomske neenakosti znotraj države ali neenakosti med spoloma, visok HDI pa je tudi tesno povezan z visokim ekološkim odtisom, kar pa za razvoj gospodarstva in kvaliteto življenja v prihodnosti ni dobro.

Podatkovni viri

Podatkovne vire sem zbrala v mapi podatki. So v obliki CSV datotek, ki sem jih pridobila s spletnih strani Razvojnega programa Združenih narodov, Our World in Data in Svetovne zdravstvene organizacije.

Podatkovno delo

Za vsako od novih spremenljivk bom izračunala indeks, ki ga bom potem uporabila pri računanju novega HDI: . Indeks je 1, ko je vrednost najmanjša in 0, ko je vrednost največja.

Potem bom izračunala geometrijsko sredino šestih indeksov in primerjala nov HDI s starim, da bom ugotovila, kako nove spremenljivke vplivajo na indeks človekovega razvoja.

Analiza podatkov in cilj projekta

Analizirala bom človekov razvoj zadnjih 20 let, kdaj je rastel/padal, kdaj je kakšna država po razvoju prehitela druge ter kako so na indeks vplivali takratni dogodki (krize, vojne, bolezni, tehnološki napredek).

Izračunala bom nov HDI, ki bo upošteval spremenljivke, povezane z ekologijo, neenakostjo in odzivom na COVID-19, saj so to trenutno zelo pomembni indikatorji za razvitost držav, ki pa jih HDI še ne upošteva.

Cilj projekta je dobiti vpogled v razvoj sveta glede na čas in države ter pokazati, da kljub temu, da je trenutno najbolj dopolnjeno merilo, indeks človekovega razvoja vseeno ni najboljši kriterij. Izboljšati se ga da z dodajanjem novih spremenljivk, ki prav tako vplivajo na človekov razvoj.

Program

Glavni program in poročilo se nahajata v datoteki projekt.Rmd. Ko ga prevedemo, se izvedejo programi, ki ustrezajo drugi, tretji in četrti fazi projekta:

  • obdelava, uvoz in čiščenje podatkov: uvoz/uvoz.r
  • analiza in vizualizacija podatkov: vizualizacija/vizualizacija.r
  • napredna analiza podatkov: analiza/analiza.r

Vnaprej pripravljene funkcije se nahajajo v datotekah v mapi lib/. Podatkovni viri so v mapi podatki/. Zemljevidi v obliki SHP, ki jih program pobere, se shranijo v mapo ../zemljevidi/ (torej izven mape projekta).

Potrebni paketi za R

Za zagon tega vzorca je potrebno namestiti sledeče pakete za R:

  • knitr - za izdelovanje poročila
  • rmarkdown - za prevajanje poročila v obliki RMarkdown
  • shiny - za prikaz spletnega vmesnika
  • DT - za prikaz interaktivne tabele
  • rgdal - za uvoz zemljevidov
  • rgeos - za podporo zemljevidom
  • digest - za zgoščevalne funkcije (uporabljajo se za shranjevanje zemljevidov)
  • readr - za branje podatkov
  • rvest - za pobiranje spletnih strani
  • tidyr - za preoblikovanje podatkov v obliko tidy data
  • dplyr - za delo s podatki
  • gsubfn - za delo z nizi (čiščenje podatkov)
  • ggplot2 - za izrisovanje grafov
  • mosaic - za pretvorbo zemljevidov v obliko za risanje z ggplot2
  • maptools - za delo z zemljevidi
  • tmap - za izrisovanje zemljevidov
  • extrafont - za pravilen prikaz šumnikov (neobvezno)

Binder

Zgornje povezave omogočajo poganjanje projekta na spletu z orodjem Binder. V ta namen je bila pripravljena slika za Docker, ki vsebuje večino paketov, ki jih boste potrebovali za svoj projekt.

Če se izkaže, da katerega od paketov, ki ji potrebujete, ni v sliki, lahko za sprotno namestitev poskrbite tako, da jih v datoteki install.R namestite z ukazom install.packages. Te datoteke (ali ukaza install.packages) ne vključujte v svoj program - gre samo za navodilo za Binder, katere pakete naj namesti pred poganjanjem vašega projekta.

Tako nameščanje paketov se bo izvedlo pred vsakim poganjanjem v Binderju. Če se izkaže, da je to preveč zamudno, lahko pripravite lastno sliko z želenimi paketi.

Če želite v Binderju delati z git, v datoteki gitconfig nastavite svoje ime in priimek ter e-poštni naslov (odkomentirajte vzorec in zamenjajte s svojimi podatki) - ob naslednjem zagonu bo mogoče delati commite. Te podatke lahko nastavite tudi z git config --global v konzoli (vendar bodo veljale le v trenutni seji).

About

Projekt iz analize podatkov s programskim jezikom R

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • R 96.7%
  • Dockerfile 3.1%
  • TeX 0.2%