Die Verspätungen auf den wichtigsten Pender-Verbindungen sollen analysiert werden. In unsere Analyse wurden die Monate Juni bis November 2022 berücksichtigt.
Die Erkenntnisse aus der Analyse wird am 14. Februar 2023 auf den Tamedia Newsportalen publiziert.
Die Analyse findet in zwei Teilen statt:
- Auslesen der relevanten Verbindungen aus den Rohdaten (R-Script)
- Analysieren und Aufbereiten dieser Verbindungen (R-Script)
Es wurden Daten aus dem Open-Transport-Data Portal verwendet: https://opentransportdata.swiss/de/dataset/istdaten.
Die Skripts wurden in R-Markdown geschrieben und werden am besten mit R-Studio ausgeführt.
--> R-Script "SBB_Verspätung_git.Rmd"
Daten müssen zuerst aus dem Open Data Archiv der SBB heruntergeladen und in einen Ordner entpackt werden. Dieser Ordner muss dann im Skript spezifiziert werden.
Das Skript sucht nun alle relevanten Verbingungen und speichert diese wiederum in einem CSV file (ein file pro Tag).
--> R-Script "SBB_Analyse_git.Rmd"
Dieses Skript liest die CSV Datein mit den Verbindungen ein, die vom vorhergehenden Skript gespeichert wurden. Dann können die Verbindungen ausgewertet aggregiert werden. Die Resultate werden direkt in ein GoogleSheet geschrieben.