Skip to content

vitorozman/APPR-2020-21

 
 

Repository files navigation

Analiza podatkov s programom R, 2020/21

Repozitorij z gradivi pri predmetu APPR v študijskem letu 2020/21

  • Shiny Shiny
  • RStudio RStudio

Analiza najbogatejših ljudi na svetu v letu 2020

STRUKTURA

Analiza o najbogatejših ljudeh bo temeljila na štirih vejah. Vsaka veja vsebuje skupno značilnost na kateri bo narejena analiza. Glavne veje sem poimenoval BIO, GEO, PANG in TOP (opisane spodaj). Uradna stran, ki rangira najbogatejše ljudi se nahaja na spletnem portalu Forbes Billionaires 2020. Podatke, ki so v json formatu, pa sem dobil na povezavah pod VIRI.


BIO

Analiza glede na biološke značilnosti kot sta, spol in starost

  • Prikazal bom delž moških in žensk

    • ideja: prikazan delež M in Ž v obliki tortnega diagrama
  • Prikaz povprečnega premoženja glede na starost

    • ideja: stolpični diagram (povprečno premoženje/starost)
  • Izstopajoči odmiki od povprečja

    • ideja: tabela (spol/ekstremi)

GEO

Analiza glede geografsko lego bivanja

  • Za posamezno državo bom analizeral skupno premoženje vseh oseb in najbogatejšega iz med njih
    • ideja: zemljevidni prikaz sveta, kjer so vidne posamezne države in spremenljivke

PANG

Analiza glede na panogo

  • Prikaz povprečnega premoženja in število oseb v posamezni panogi
    • ideja: diagram (povprečno premoženje/panoga) in tortni diagram s številom oseb v panogi

TOP

Analiza nekaj najbogatejših ljudi v letu 2020

  • Prikaz rasti premoženja

    • ideja: diagram (premoženje/leto)
  • Prikaz njabolšega napredka za posamezno osebo v obdobju

    • ideja: stolpični diagram z največjum napredkom

Datoteke se nahajajo v mapi podatki:

  • billionaires20.json
  • billionaires19.json
  • billionaires18.json
  • billionaires17.json
  • billionaires16.json
  • billionaires15.json

VIRI

Lestvica najbogatejših ljudi za leto:

Program

Glavni program in poročilo se nahajata v datoteki projekt.Rmd. Ko ga prevedemo, se izvedejo programi, ki ustrezajo drugi, tretji in četrti fazi projekta:

  • obdelava, uvoz in čiščenje podatkov: uvoz/uvoz.r
  • analiza in vizualizacija podatkov: vizualizacija/vizualizacija.r
  • napredna analiza podatkov: analiza/analiza.r

Vnaprej pripravljene funkcije se nahajajo v datotekah v mapi lib/. Podatkovni viri so v mapi podatki/. Zemljevidi v obliki SHP, ki jih program pobere, se shranijo v mapo ../zemljevidi/ (torej izven mape projekta).

Potrebni paketi za R

Za zagon tega vzorca je potrebno namestiti sledeče pakete za R:

  • knitr - za izdelovanje poročila
  • rmarkdown - za prevajanje poročila v obliki RMarkdown
  • shiny - za prikaz spletnega vmesnika
  • DT - za prikaz interaktivne tabele
  • rgdal - za uvoz zemljevidov
  • rgeos - za podporo zemljevidom
  • digest - za zgoščevalne funkcije (uporabljajo se za shranjevanje zemljevidov)
  • readr - za branje podatkov
  • rvest - za pobiranje spletnih strani
  • tidyr - za preoblikovanje podatkov v obliko tidy data
  • dplyr - za delo s podatki
  • gsubfn - za delo z nizi (čiščenje podatkov)
  • ggplot2 - za izrisovanje grafov
  • mosaic - za pretvorbo zemljevidov v obliko za risanje z ggplot2
  • maptools - za delo z zemljevidi
  • tmap - za izrisovanje zemljevidov
  • extrafont - za pravilen prikaz šumnikov (neobvezno)
  • shinythemes - za temo za shiny
  • data.table - za pretvorbo let v datume
  • rjson - za delo z jason datotekami

Binder

Zgornje povezave omogočajo poganjanje projekta na spletu z orodjem Binder. V ta namen je bila pripravljena slika za Docker, ki vsebuje večino paketov, ki jih boste potrebovali za svoj projekt.

Če se izkaže, da katerega od paketov, ki ji potrebujete, ni v sliki, lahko za sprotno namestitev poskrbite tako, da jih v datoteki install.R namestite z ukazom install.packages. Te datoteke (ali ukaza install.packages) ne vključujte v svoj program - gre samo za navodilo za Binder, katere pakete naj namesti pred poganjanjem vašega projekta.

Tako nameščanje paketov se bo izvedlo pred vsakim poganjanjem v Binderju. Če se izkaže, da je to preveč zamudno, lahko pripravite lastno sliko z želenimi paketi.

Če želite v Binderju delati z git, v datoteki gitconfig nastavite svoje ime in priimek ter e-poštni naslov (odkomentirajte vzorec in zamenjajte s svojimi podatki) - ob naslednjem zagonu bo mogoče delati commite. Te podatke lahko nastavite tudi z git config --global v konzoli (vendar bodo veljale le v trenutni seji).

About

Vzorčni repozitorij za projekt pri predmetu Analiza podatkov s programom R v študijskem letu 2020/21

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • R 97.1%
  • Dockerfile 2.7%
  • TeX 0.2%