Bahn Mining – Pünktlichkeit ist eine Zier

Die Pünktlichkeit der Züge im Fernverkehr lässt sich statistisch auswerten, und ergibt interessante Einblicke. David Kriesel präsentiert beim CCC einen Blick auf alle Fernverkehr-Zugverbindungen in Deutschland innerhalb eines Jahres.
Sendung vom 2022/12/21 17:00:00 GMT+1
Download: pta221221.mp3

Computer

Der Vortrag mit Video: media.ccc.de/v/36c3-10652-bahnmining_-_punktlichkeit_ist_eine_zier

Die Webseite von David Kriesel: www.dkriesel.com

Doku im Fernsehen: www.youtube.com/watch?v=xfnpBEa89Xo

Medienportal des CCC: media.ccc.de

Der Chaos Computer Club: www.ccc.de

Das Camp im nächsten Jahr: events.ccc.de/category/37c3/

Playlist

Transkription

[0:01] Hallo, hier ist das Magazin. Euer gesellschaftspolitisches Magazin hier bei Radio X im Frankfurter Radio.
Schön, dass Sie dabei seid. Schön, dass ihr zuhört.
Wir unterhalten uns heute wieder über Verkehr.
Das wird ja ein Thema. Das wird uns noch länger beschäftigen, weil wir sehen ja mit den Autos Benzin wird immer teurer, wir können nicht alles dafür.
Auf der anderen Seite wollen wir mobil sein, müssen wir mobil sein.
Der öffentliche Personennahverkehr ist eine Sache, die jeder ist. Das ist ein großes Element in dieser Rechnung.
Wir wollen uns das alles ein bisschen näher angucken. Heute haben wir mitgebracht einen Vortrag von dem David, der ist da.
Das ist es also, wissenschaftliche Wissenschaft, der, der sich an große Datenmengen ranmacht und guckt, was da drin stecken kann.
Und er hat ein paar Sachen rausgefunden zum Thema Wie verhält sich das mit der Bahn, mit dem Fernverkehr, mit der Pünktlichkeit im Fernverkehr?
Und was sind dafür Besonderheiten zu beobachten? Wie hängt das alles ein bisschen zusammen?

[1:05] Dieser Vortrag, den hat er gehalten schon vor einiger Zeit, und zwar beim CCC, beim Chaos Communication Congress.
Wir haben ja schon ab und zu in der Vergangenheit mal dort Vorträge, Vorträge von dort vorgestellt.

[1:18] Konkret ist das ein Jahrestreffen, wo sich Mitglieder und Freunde des Chaos Computer Clubs jedes Jahr einmal treffen.
Und dort gibt es ganz viele Aktivitäten. Es gibt dort Plätze, wo man sich austauschen kann, wo man basteln kann an seinen Projekten, Hardware und Software weiter arbeiten kann,
diese Projekte mit anderen Leuten austauschen kann und so einfach gucken kann, wie kann so was funktionieren?
Es gibt da aber auch einen großen Teil an Vorträgen bei diesem Event, das heißt, dort sind Redner, die präsentieren Themen vor einem großen Auditorium, also einer großen Hörerschaft und dort sind immer sehr spannende Sachen dabei.
Der Vortrag, in dem wir jetzt reinhören werden, der wurde schon gehalten im Dezember 2019.
Also ist schon ein bisschen her. Das war beim 36 C3, also beim 36.
Chaos Communication Congress. Trotzdem ist es noch ein aktuelles Thema und wir müssen da dranbleiben.
Dieses Jahr wird es leider keinen Kongress geben, zumindestens nicht in der Form, wie er in der Vergangenheit bekannt war.
Das heißt eine große zentrale Veranstaltung.
Der Chaos Computer Club wird da mehrere kleine Veranstaltungen machen.
Das heißt, es gibt trotzdem Möglichkeiten reinzuschauen und sich mehr Überblick zu verschaffen, was auch dort an Vorträgen zum Beispiel stattfindet.
Wir werden Links dazu auch auf unserer Webseite sammeln, dass ihr auch schon dann dann Startpunkt habt. Wenn ihr euch da schlau machen wollt.

[2:45] Hier ist das Magazin. Euer gesellschaftspolitisches Magazin.
Hier bei Radio X. Wir haben heute einen Vortrag, in denen wir reinhören werden zum Thema Bahn, Bahn Mining. Pünktlichkeit ist eine Zier.
David Christl hat den gehalten und hat sich ein bisschen die Pünktlichkeit im Fernverkehr der Bahn angeschaut.
Er ist Data Scientist und das bedeutet, er guckt sich große Datenmengen an, schaut da hinein, findet Regelmäßigkeiten oder Unregelmäßigkeiten und Zusammenhänge,
und versucht eben, aus einem großen, ungeordneten Datenhaufen interessante,
Dinge abzuleiten, die eben auch auf einer Datenbasis auf Zahlen basieren.
Und eben nicht nur dem groben Gefühl.
Jeder von uns hat vielleicht eine Vorstellung. Ja, in der letzten Zeit ist das mit der Pünktlichkeit der Bahn so eine Sache.
Klappt manchmal, klappt auch, manchmal öfter nicht. Aber dieses diffuse Gefühl, das jeder Einzelne hat, das ist eben schwer zu quantifizieren. Da kann man jetzt nicht sagen, das ist um 10 % besser oder um 10 % schlechter geworden.
Und deswegen ist es eine gute Idee, sich einfach die tatsächlichen Daten anzugucken und zu schauen, Was ist denn da jetzt wirklich los?
Die Bahn stellt Daten zur Verfügung, wann welche Züge wie spät ankommen oder fahren oder nicht fahren.

[4:05] Die Datengrundlage, um die sich der David gekümmert hat, sind jetzt speziell der Fernverkehr, das heißt die Züge, die alle zwischen den Städten verkehren.
Dass die Lage im Nahverkehr, also zum Beispiel, wenn wir jetzt hier als ein Gebiet denken,
die S Bahn, die U Bahn und so, das ist noch mal eine andere Sache, da werden wir uns bestimmt noch mal getrennt zu unterhalten und da ist die Lage vielleicht auch ein bisschen anders bzw.
Auch die wahrgenommene Situation auch anders.
Jetzt also der Vortrag von David im Dezember 2019 beim 36. Chaos Communication Congress.
Mein Name ist David Christl. Ich bin Informatiker aus der Nähe von Bonn.
Im richtigen Leben ist es mein Beruf, interessante Sachen in größeren Datenmengen zu finden.
Neudeutsch heißt das Data Scientist.
Und zusätzlich zum Beruf habe ich verschiedene Hobbyprojekte. Und manchmal nehme ich mir eins davon raus und halte darüber hier einen Vortrag.

[5:07] Ich bin Rheinländer, und bei uns sagt man Ab zweimal ist es Tradition und beim dritten Mal ist es Brauchtum.
Ich bin das dritte Mal hier, das ist also schon voll Brauchtum und ich freue mich, dass es so oft geklappt hat.
Unsere Geschichte heute beginnt im Jahr 2018.
Am Ende des Jahres 2018 hat nämlich die Bahn gesagt, rund 75 % ihrer Fernzüge seien pünktlich gewesen.
Und dafür muss man erst mal wissen Was ist denn pünktlich? Und die Bahn errechnet das folgendermaßen. Die sagen, Wenn ein Zug bei einem Stopp weniger als sechs Minuten zu spät ankommt, dann ist der pünktlich.
Das ist wirklich die Definition und wir übernehmen das einfach. Dann müssen wir da nicht handeln. Irgendwie.
Und dann errechnen Sie den Prozentsatz aller Stopps, bei denen das der Fall ist. Und das wären bei knapp 75 % in 2018 so der Fall gewesen. Und das hat mich in meiner persönlichen Erfahrung irgendwie gestört.

[6:12] In den letzten Jahren bin ich quer durch Deutschland gereist, davon relativ häufig mit der Bahn.
Und dann habe ich mal in meiner Mailbox geguckt und für mehr als die Hälfte meiner Fahrten habe ich diese E Mail von Verspätungsalarm bahnd.
Und da dachte ich, ich bin wohl dieser eine Typ, der aufpassen muss, nicht vom Blitz getroffen zu werden, während er den Sechser im Lotto abholt.

[6:40] Und ich wollte das dann genauer wissen. Also habe ich mal in die Statistiken geguckt, die auf der Webseite der Bahn sind. Und dann habe ich gesehen, da sind kaum welche.
Und die Bahn bietet auf ihrer Webseite nur die Prozent der pünktlichen Stopps pro Monat an.
Fürs Gesamtnetz ja bundesweit noch einmal getrennt in Nah und Fernverkehr. Und das ist zusammengefasst. Damit kann man nichts anfangen.
Man kann da nicht nach bestimmten Verbindungen filtern.
Man kann auch nicht gucken, bei welchen Bahnhöfen die Performance besonders schlecht ist oder gut ist und alles, was interessant ist oder was ich interessant fand, das geht nicht.
Also habe ich am 8. Januar begonnen, die Deutsche Bahn zur Vorratsdatenspeicherung.

[7:21] Und in diesem.

[7:28] Und und in diesen Datensatz gucken wir heute rein.
Und wir werden das auch nicht nur aus, sondern ich werde auch ein bisschen Zeit darauf verwenden, euch zu erklären, wie man so ein Datenprojekt angeht und worauf man achten muss und wie man vor allem merkt, ob man Vertrauen in die Daten haben kann.
Das muss ja nicht sein, dass alles stimmt, was man so runterlädt.

[7:48] Und über den ganzen Vortrag hinweg gebe ich euch immer so ein paar wie mich.
Nenne ich das in Praxistipps, die ihr mit nach Hause nehmen und an die ihr denken könnt, wenn ihr beim. Wenn ihr eine Bahnfahrt bucht.
Disclaimer vorweg Ich habe mit der Bahn nicht über die Auswertungen gesprochen.
Behaltet im Hinterkopf. Am Ende ist das ein kleines Hobby Projekt und es kann durchaus sein, dass ich Fehler gemacht habe.
Aber da wir auch noch über die Vertrauenswürdigkeit der Daten reden, könnt ihr selbst entscheiden, ob ihr meinen Daten vertraut oder nicht.
Und wir gucken uns jetzt endlich mal an, wie die Daten aussehen. Hier sehen wir eine fiktive Fahrt eines ICE.
Ich gebe euch mal kurz fünf Sekunden für den ersten Überblick und danach erkläre ich, die drei Sekunden reichen auch.
Der ICE fährt in München los und jede weitere Zeile ist ein Stopp und irgendwann ist er am Ziel angekommen. Hier Bergen auf Rügen.
Und eine Fahrt ist also die Sequenz aller Stopps, die der Zug von Anfang bis Ende macht. Danach ist das eine neue Fahrt.
Hier sind die Verspätungen pro Stopp. Der Zug ist mit sechs Minuten Verspätung abgefahren und nach der Messmethode der Bahn wäre der so gerade als verspätet zu werden werten an diesem Stopp und dann schwanken die Verspätungen.
In Erfurt sind wir auch mal sechs Minuten zu früh dran gewesen.
Die Verspätung ist negativ.
Das passiert. In der Regel Heißt das übrigens, dass der Zug dann einfach länger bleibt und nicht zu früh wieder abfährt.
Und am Berliner Flughafen, der Der Stopp fällt aus.

[9:12] In 20 Jahren werde ich diese Witze immer noch machen können. Und diese.

[9:22] Und die Stopps und diese Stopps aller Fahrten sind die Grundlage unserer Daten.
Meine Tabelle hat 25 Millionen Zeilen, das sind 25 Millionen Stopps von irgendwelchen Zügen.
Das sind alle Stopps im Fernverkehr von 8. Januar bis jetzt. Und auch der Nahverkehr.
Aber der nur an den Fernbahnhöfen komme ich gleich noch zu.
Und die Tabelle hat auch verschiedenste Spalten, die, die ich hier vorführe und noch einige mehr.
Und wir können in einzelne Orte reingucken, einzelne Fahrten reingucken, in Zeiträume reingucken. Wir können auch kompliziertere Auswertungen fahren. Machen wir auch heute noch.
Und zum Anfang machen wir mal ein paar ganz einfache Sachen mit den Daten, dass es nicht um euch zu langweilen.
Aber wir müssen ja erst mal reinkommen, den Datensatz kennenlernen usw. Und wir sortieren jetzt die ganze Tabelle von Stopps 25 Millionen Stück mal nach Bahnhöfen und dann ermitteln wir die Anzahl der Stopps für jeden Bahnhof über das ganze Jahr hinweg.

[10:14] Und jeder Bummel hier ist so ein Bahnhof mit Fernverkehr und davon haben wir um die 350 Stück. Das sind die wichtigen.
Und die Größe der Bubble gibt die Anzahl der erfassten Halter für den Bahnhof wieder.
Und zwar für alles, was da fährt. Fern und Nahverkehr. Und der größte was das angeht, ist Köln Hauptbahnhof mit im Moment 380.000 Stopps in der Datenbank.
Ich habe die Top sechs mal in der Karte beschriftet. Warum genau die Top sechs?
Weil der sechste Bahnhof genau Hamburg am Tor ist. Und das wollte ich euch nicht vorenthalten. Das war unser letzter Congress Bahnhof.
Der Bahnhof Leipzig Messe ist übrigens deutlich deutlich kleiner. Inklusive Nahverkehr haben wir hier so 60.000 Stopps im Jahr und überhaupt nur ein paar 100 Fernverkehr.
Wo wir schon dabei sind, machen wir jetzt was aus Kundensicht Interessantes und Bahn und und färben mal die Bahnhöfe ein. Und zwar nach der Pünktlichkeit oder nach dem Prozentsatz der Pünktlichkeit der dortigen Stopps im Fernverkehr. Das ist die Pünktlichkeit.

[11:11] Knallrot ist 60 %, knallblau ist 90 % und dazwischen farblos.
Das ist ungefähr der Durchschnitt bei 75.
Als erstes sieht man In Ostdeutschland ist quasi alles blau.
Ja, ich bin sicher, das sind diese.

[11:31] Ich bin sicher, das sind diese blühenden Landschaften, von denen Altkanzler Kohl immer sprach. In Nordrhein Westfalen ist so ziemlich alles rot.
Köln hat nur 66 % Pünktlichkeit. Bonn ist wirklich eines der Schlusslichter mit 59 %.
Das sind die beiden Bahnhöfe, über die ich auch fahre.

[11:52] Generell der ganze dicht besiedelte Raum in Nordrhein Westfalen ist ziemlich schlimm dran und ich habe euch ja gesagt, dass ich das ganze Projekt überhaupt erst gestartet habe, weil ich dachte, die Statistik der Bahn wäre falsch, weil meine Züge so häufig unpünktlich sind.
Die simple Wahrheit ist ich wohne nur schlecht für Hamburg oben. Es ist auch schlimm.
Das finde ich auch gerecht. Warum soll ich der Einzige sein, der irgendwo bei 60 %, je nachdem welchen Bahnhof man erwischt?
Das sieht ja jetzt röth aus als es ist, weil die Dinger transparent sind.
Und was die Pünktlichkeit angeht, haben wir uns mit Leipzig Messe definitiv verbessert. Wir sind hier so bei 80 % oder etwas mehr.

[12:32] Ganz wichtig Ich habe jetzt überall, wo es nicht anders dran steht, nur noch den Fernverkehr.
Überhaupt wird der ganze Vortrag primär über den Fernverkehr gehen, weil das über das wird meistens berichtet in den Medien und über auch gemeckert. Und der Fernverkehr ist das, worüber alle reden.
Aber wenn ich sage, dass ich hier primär über den Fernverkehr heute rede, dann muss ich auch fair sein und das Folgende sagen Der Nahverkehr, den wir jetzt auslassen, erreicht fast flächendeckend Pünktlichkeit.
Werte von besser als 90 %, weil das bitte über den Rest des Vortrages im Hinterkopf. Die Bahn hat auch gute Seiten und bringt gerade im Nahverkehr eine ziemliche Menge Leute jeden Tag zu ihrem Job.
Da geht sicher auch mal was schief, aber deutlich weniger als im Fernverkehr. Und jetzt?
Ich hoffe, die Leute von der Bahn hören zu und hören das jetzt gerade.
Ja, wir ändern jetzt noch mal die Ansicht die Pünktlichkeit.
Pro Bahnhof waren ja interessant für den Kunden, aber wenn man ein bisschen analytisch was machen will und bei der Bahn arbeitet, dann ist da das Interessante, welche Bahnhöfe richtig viel Verspätungen generieren, also dem Netz hinzufügen. Und das ist die Ansicht.
Ganz schlimm sind große Bahnhöfe mit vielen Stopps, die gleichzeitig jeden Zug, der da anhält, noch so ein bisschen Verspätung mit auf den Weg geben.
Die fünf schlimmsten sind Hamburg, Köln, Frankfurt, Flughafen Mannheim.
Die sind alle mit mehr als 50.000 hinzugefügten Verspätungsminuten im Zeitraum.

[14:01] Und der Spitzenreiter ist Frankfurt Hauptbahnhof mit 93.000 generierten Verspätungen. Ich höre, wir haben eine Frankfurtfraktion. Wie seid ihr hergekommen?

[14:13] Die sind heute erst angekommen. Ich hoffe, habt euch nicht gehetzt. Zweiter Tag abends.

[14:21] Gibt aber auch Bahnhöfe, die funktionieren so gut, dass sie insgesamt Verspätungen aus dem Netz rausnehmen.
Die Top drei sind Bremen, Berlin Hauptbahnhof und Berlin Spandau.
Und das hat mich sehr kalt.

[14:37] Das hat mich sehr kalt erwischt, dass mir völlig unverhofft ein Nachweis dieser dieser Größenordnung gelungen ist.
Es gibt tatsächlich etwas an Berlin, das funktioniert und wir machen weiter.
Hier seht ihr im Vergleich von uns anders aus.
Ihr seht immer im Vergleich, wie viele Fahrten es im Nahverkehr, Fernverkehr und von Drittanbietern gibt.
Wie ihr seht, ist das weitaus meisten Nahverkehr hier orange.
Es sind mehr als 5 Millionen Fahrten im Datensatz. Dagegen gibt es nur circa eine ViertelMillion Fahrten im Fernverkehr. Da ist hier blau und es gibt noch auch ziemlich viele Fahrten von Drittanbietern.
Und wir bröseln das jetzt mal in einzelne Zugarten auf, einfach damit wir sehen, was es so gibt, bevor wir richtig einsteigen.
Und wir sehen jetzt, dass sich der Nahverkehr aufspaltet in die drei dicksten Bubble Regionalbahn, Regionalexpress S Bahn und der Fernverkehr in ICE, Intercity, EC und Eurocity etc.
Die Abkürzung verwende ich auch im Folgenden.
Und diese vergleichsweise kleinen blauen Punkte, das sind die eigentlich interessanten Zugarten für heute. Das sind nämlich die Züge, die quer durch Deutschland fahren. Da kann man richtig was sehen. Und jetzt gehen wir einen Schritt weiter.
Wir nehmen diese für uns relevanten Zugarten her, also ICE, Intercity, Eurocity.
Und dann schauen wir einfach mal, welche Zugart generell am spätesten dran ist.

[16:00] Nimmt man gleich weiß, wo man ausweichen muss? Ich wiederhole nochmals für die Bahn das misst Prozentzahl der Stopps, die maximal sechs Minuten zu spät sind, sind pünktlich im Fernverkehr.
Am pünktlichsten sind die Intercity mit gut 76 % dicht danach folgen die ICE und deutlich dahinter die Eurocity.
Davon sind nicht mal 70 % nach der Bahndefinition pünktlich.
Und da muss ich sagen, das kann ich in der Tat aus persönlicher Erfahrung bestätigen.
Nach meinem Eindruck ist die Qualität von den Teilen einfach schlechter in jeder Hinsicht.
Also die Züge sehen, auch wenn ich damit war, immer relativ alt aus. Aber man muss auch fair sein.
Die fahren internationaler als der Rest der Züge. Und wenn die direkt von außen Verspätungen mitbringen, kann die Bahn da nichts für. Und solche Fälle gibt es.
Und es fehlt noch eine Größe, die wir messen können und die wir messen werden.
Und über die schweigt sich die Bahn auf ihren Webseiten aus.
Und wenn man sich sehr konsequent ausschweigt, hat das natürlich zur Folge, dass man sich für eine Analyse bewirbt.

[17:00] Und das ist der Prozentsatz der Ausfälle. Und hier ist er, und das war für mich überraschend.
Es sind ja das Flaggschiff der Bahn und anscheinend fallen die mit weitem Abstand am häufigsten aus.
Eurocity gut 2 %, Intercity gut 3 % und ICE über 5 %.
Also wenn ihr einen ICE bucht, dann taucht er in einem von 20 mal einfach nicht auf.
Und das fand ich ganz schön stramm. Mich hat das überrascht.
Mein Praxistipp an euch lautet also Vorsicht mit den ICEs.
Ich weise fairerweise nochmals darauf hin, dass das eine Auswertung von außen ist. Es besteht die Möglichkeit, dass das nicht stimmt.
Oder dass ewig viele Extrafahrten für die Ausfälle gefahren werden, die gar nicht im Plan standen. Aber alle diese Stopps standen in deren Daten explizit als ausgefallen drin. Die Daten sehen insgesamt realistisch aus. Und im Spiegel hatten sie auch neulich eine Auswertung, wo sie auf ähnliche Werte kam.
Also schlage ich vor, wir betrachten das mal als gegeben, bis die Bahn widerspricht.

[18:02] Übrigens einer der fettesten nicht ausgefallenen Verspätungen in meinem Datensatz war der ICE 576 von Stuttgart nach Hamburg, und zwar am 17. Oktober 2019.
Der hatte 456 Minuten Verspätung.
Das sind mehr als sieben 1/2 Stunden.

[18:21] Und der war nicht ausgefallen. Und um unseren Überblick zu vollenden, gucken wir uns jetzt das Ganze noch mal über die Zeit an.
Hier sehen wir die Fahrten über die Zeit, die für den Fernverkehr in der Datenbank habe.
Die können wir uns mal angucken, wie das funktioniert. Wir sehen, dass wir so um die 800 Fahrten am Tag haben im Fernverkehr.
Die niedersten Zeiten sind immer Samstage, die Hohen sacken immer zwei Tage, dass der Berufsverkehr hier sind, Ostern und Pfingsten. Weihnachten habe ich nicht mehr hingekriegt.
Und was sieht man noch? Man sieht zum Beispiel, dass ich zwischendurch Mist gebaut habe und ein paar Tage Daten verloren habe. Wer meinen letzten Vortrag hier gesehen hat, dem wird das bekannt vorkommen.
Ich mache das jeden Tag, aber ich war besser. Ich finde, diesmal war ich so klug.
Und dann habe ich mir ein vernünftiges Downloadmonitoring gebaut und dann dachte ich, ich wäre cool.
Und dann habe ich es irgendwie geschafft, den DB Server, auf dem das ganze läuft, komplett zu crashen.
Also der hat gar nicht mehr geantwortet. Ich musste die Kiste hart bluten lassen und ich war da gerade in Urlaub und habe das nicht gemerkt. Also diesmal ein technischer Tipp für euch. Baut nicht nur ein Downloadmonitoring, sondern lasst das auch noch auf einem anderen Server laufen als den Download selbst.

[19:41] Und weil wir heute ja auf Bahn Bewerbung hin die Ausfälle besonders genau machen wollen. Hier sind die Ausfälle über die Zeit.
Das sind die Prozent der Stopps pro Tag, die einfach ausgefallen sind und man sieht sofort zwei fette Spikes.
Hier ist der Orkan Eberhard.
Dieser Orkan ist am 10. März über uns hereingebrochen und am Nachmittag war der der Meinung, es würde jetzt mal reichen mit Bahnverkehr.
Und den gucken wir uns auch noch genauer an. Und hier ist der heißeste Tag des Jahres mit der Hitzewelle dieses Jahr.
Und generell sieht man hier, wenn wir mal so ein bisschen genauer guckt, dass es im Hochsommer eine stark erhöhte Ausfallrate gibt.
Wie kommt das? Laut Klimaanlage höre ich da die Ausfälle nach Zeit.
Zerlegen wir jetzt noch mal in die relevanten Zugarten, bevor der alles vorwegnimmt.

[20:33] Und das machen wir jetzt nicht mehr auf der Basis von Tagen, sondern von Wochen. Das ist, das ist einfach etwas Glatteis.
Und die gelbliche Linie sind die ICEs. Und da sieht man erst mal, was für ein fettes Problem die mit den ICEs im Sommer haben.
Und ihr seht, wie die Ausfall der ICEs im Sommer im Vergleich zu den anderen Zugarten richtig stark nach oben ausbrechen. Das sind so um die 8 % Ausfallquote.
Fast an jedem zwölften Stock taucht so ein ICE in der Warmzeit dann einfach nicht auf.
Und in der Woche vom 22. Juli sind in der ganzen Woche sind mehr als 10 % aller ICE Stopps ausgefallen.
Also ich weiß nicht wie euch das geht, aber das geht bei mir über die Fehlertoleranz. Also wenn das jeden Sommer so ist.
Mein nächster Praxistipp für euch. Vorsicht mit ICEs im Sommer.
Und jetzt, wo es kälter wird, fängt das auch wieder so an.

[21:27] Aber ja, wenn man das so anguckt, wir müssen noch ein bisschen abwarten. Es ist noch nicht raus, ob das wirklich so wird.
Also in zwei, drei Monaten wissen wir mehr, wenn es richtig kalt war.
Nee, wir wir machen jetzt noch zwei kleine Sachen und danach reden wir mal darüber, wie man so ein Projekt überhaupt aufbaut und was die Grundregeln sind. Hier ist was Offensichtliches.

[21:48] Ich habe hier die Stopps aller Fahrten sortiert nach der Zeit, die die Zugfahrt bereits vor diesem Stopp gedauert hat.
Von links nach rechts steigt die bereits gefahrene Laufzeit vor dem Stopp an, hier von 0 bis 500 Minuten. Und was sieht man früher in der Fahrt? Ist der Prozentsatz der pünktlichen Züge höher.
Später in der Fahrt sinkt die Prozentuale Pünktlichkeit krass ab.
Bei 500 Minuten sind unter 60 % pünktlich.
Das habt ihr euch wahrscheinlich jetzt alle schon selbst gedacht. Warum sage ich das also?
Weil ich die Bahn ein bisschen in Schutz nehmen möchte. Man sieht nämlich häufiger in den Medien irgendwelche Untersuchungen von Fahrten zwischen weit entfernten Metropolen und da werden dann unglaublich schlechte Pünktlichkeit gemessen.
Und wenn ihr so was seht, lasst mich euch sagen, die machen die Bahn schlimmer als sie ist, weil sie durch weiter entfernen eben nur den Datenteil mit der hohen Verspätung auswählen.
Und ganz ehrlich, die häufigen Probleme mit den japanischen Hochgeschwindigkeitszügen sind aus meiner Sicht auch einfach die, die die verbinden in Japan nur die absolut riesigen Metropolen, die haben ein komplettes Schienennetz für sich.
Alleine der Fernverkehr der Bahn muss durch das Netz mit Güter und Nahverkehr teilen und bindet auch noch die Mittelzentren mit an, also das ist nicht vergleichbar. So vermissen wir schon.
Trotzdem hier wieder mein Praxistipp für euch Vorsicht mit Zügen, die bereits lange unterwegs sind. Ihr könnt ja, wenn ihr bucht, sehen, was das für eine Zuglinie ist und woher die kommt, könnt ihr also mit einbeziehen.
Als nächstes habe ich mich gefragt, ab welcher Verspätung wird es nicht mehr besser?

[23:18] Und dafür habe ich für alle Stopps aller Fahrten geguckt. Wie sehr ist der gerade schon verspätet und das hier ist von links nach rechts aufgetragen.
Links stehen die wenig verspäteten Stopps, rechts rechts die die mit mehr Verspätung.
Und dann habe ich geguckt, wie viel Prozent bauen auf dem Rest ihrer Fahrt 5 % der Verspätung ab und existieren noch, also sind nicht ausgefallen.
Äußerst kompliziert, aber kurz Wie viel Prozent werden noch mal spürbar besser? Oder war es das jetzt?
Und wie man sieht, was man sieht ist, dass bei Verspätungen unter 40 Minuten noch mehr als die Hälfte der Züge am Ende der Fahrten besser dastehen als jetzt gerade und ab 40 Minuten Verspätung.
Da ist eine gut sichtbare Stufe in den Daten die einzige. Da scheint die Bahn die Dinger irgendwie aufzugeben.
Ab da wird es in der Mehrzahl der Fälle bis zum Ende nicht mehr besser. Woran das liegen könnte, darauf kommen wir gleich auch noch.
Praxistipp für euch Also ab einer Verspätung von 40 Minuten erweckt ein anderes Transportmittel.

[24:26] Das war ein Höllenritt. Jetzt haben wir schon diverse Praxistipps abgestaubt.
Ich schlage vor, wir machen jetzt einen Einschub und ich versuche, euch ein paar Anhaltspunkte zu geben, was ihr beachten solltet, wenn ihr Daten Projekte selber hochzieht.
Ich werde das kurz halten, so dass wir wieder in die Daten eintauchen können.
0.1 organisiert den Download. Gut.
Die Bahn hat einige öffentliche Schnittstellen. Es gab hier auch schon einen schönen Vortrag zu eben diesen Schnittstellen.
Ich bin froh, dass jemand ermessen kann, wie viel Schmerzen ich gehabt habe.

[24:56] Über zwei davon kann man Fahrpläne und Veränderungen abrufen.
Wenn ihr in eurem Smartphone mit der Bahn App oder Bahnverbindungen nachschaut, dann macht euer Handy genau das.
In den Fahrplänen steht, wann welcher Zug ankommen soll.
Und in den Änderungen steht, was sich dem gegenüber verändert Ausfälle, Verspätungen usw..
Und das ist ein bisschen anstrengend, denn leider müsst ihr beides in getrennten Abfragen abrufen und wenn ihr die Schnittstellen abruft, erhaltet ihr nur zeitlich begrenzt ein paar Stündchen vor und zurück.
Und leider müsst ihr beides für jeden Bahnhof einzeln abrufen.
Und das bedeutet, wir können uns nicht am Schluss einfach Daten ziehen, sondern wir müssen wirklich über das ganze Jahr hinweg mit ein bisschen Infrastruktur sehr häufig Daten abrufen, die sich überlappen.

[25:44] Ein solches Szenario findet man relativ häufig. Das funktioniert dann so, dass man die Downloads einfach erst mal weggespeichert und konkrete Werte auslesen und Duplikate raus sortieren. Das passiert dann einfach alles später.
Und jetzt machen wir mal eine Nebenrechnung auf. Wir haben sechseinhalb 1000 Bahnhöfe in Deutschland.
Für jeden müssen wir einzeln beides abrufen. Also mal zwei. Und jetzt sagen wir mal, wir machen das alle zehn Minuten für Fahrpläne und Änderungen. Und das macht dann 6600 mal zwei mal 144.
Das sind knapp 2 Millionen Abrufe am Tag.
So ein Abruf hat im Durchschnitt 22 KB bei den Veränderungsdaten, ein bisschen weniger bei den Plan Daten und wir würden dann so bei bei 40 Gigabyte XML landen am Tag.

[26:31] Für das ganze Jahr. Ja, das passt sich auch nicht mehr von alleine an für das.
Für das ganze Jahr wären das dann 14 Terabyte in 700000000 Requests.
Und in diesem Moment kriegen die Admins der Bahn vermutlich einen Herzanfall.
Und wenn die damit fertig sind, dann werden die in ihre Logs schauen, welche Abrufe von mir sind und dann werden die ihren Anwalt anrufen, um mir eine riesige Rechnung zu schicken. Aber die enttäuschen wir jetzt. Natürlich habe ich das nicht so gemacht.
Erst mal hätte ich das dann alles speichern und verarbeiten müssen. Das ist viel zu aufwendig. Und zweitens ist eine Sache ganz wichtig Wenn ihr so was macht, ihr müsst den Traffic minimieren, und zwar aus zwei Gründen. Das sind die Punkte zwei und drei.
0.2 handelt verantwortungsvoll. Das bedeutet, dass ihr bitte nicht so viel Traffic erzeugt, dass ihr die Infrastruktur des Ziels abwürgt oder irgendwie unnötige Kosten verursacht.
Das ist jetzt realistischer, als es sich anhört. Vielleicht nicht bei der Bahn, aber beispielsweise bei den Justizportalen in Deutschland müsst ihr aufpassen. Die sind erstaunlich schwach auf der Brust, habe ich gehört.

[27:48] Meine. Meine Lösung dafür ist ich rufe maximal stündlich ab und auch nur die circa 350 Fernbahnhöfe. Das sind dann statt der 2 Millionen sofort nur noch 16.000 Requests am Tag.
In der Regel ist es noch mal deutlich geringer, weil man das Adaptive machen kann.

[28:06] Und in diesem Moment kriegen die Admins zwar keinen Herzanfall mehr, aber die sind trotzdem enttäuscht, weil sich dafür keine Rechnung mehr lohnt.
0.3 fliegt unter dem Radar. Das soll ja eine Weihnachtsüberraschung bleiben, so was.
Ja, und das wäre es natürlich schlecht gewesen, wenn die Millionen Abrufe vom Server der Krise kommen, irgendwie in ihren Logs stehen haben. Das fällt nämlich irgendwann auf.
Und die Lösung hierfür ist Ihr schickt die Abfragen über tausende Zwischenstationen in der ganzen Welt. In der Fachsprache heißen die anonyme Proxys.

[28:39] Mit anderen Worten, wenn ich Massen, wenn ich Massen von Daten runter lade, dann sieht das für das Ziel aus wie ein Grundrauschen von winzigen Abfragen, die von der ganzen Welt kommen.
Viele von euch werden das auch so machen. Niemand sieht mich, aber in Wirklichkeit laufen die Daten dann einfach im Hintergrund auf meinen Servern wieder zusammen, sofern ich sie nicht kriege.

[29:01] An dieser Stelle hören die Admins der Bahn vermutlich auf, meine Abfragen in ihren Logs zu suchen und ich freue mich, dass die jetzt wieder voll beim Vortrag dabei sind.

[29:10] Damit ich euch nicht abschrecke. So ein Aufwand müsst ihr nicht bei jedem Datenprojekt treiben. Das war vielleicht ein bisschen Overkill, weil weil ich das mal ausprobieren wollte mit den Proxies.
0.4 Es kann passieren, dass ihr nicht sicher seid, was ihr rechtlich dürft, ohne dran zu kommen.
Die meisten unter uns sind keine Juristen und manche AGB sind auch einfach mies formuliert. Und wenn ihr nicht sicher seid, was ihr dürft, dann fragt einen Anwalt, der für euch die AGB liest.
Es gibt im Internet Portale, wo ihr für schmales Geld Anwälten Fragen stellen könnt und danach kriegt ihr eine rechtsverbindliche Antwort.
Wenn das nicht stimmt, haftet der.
Und bei mir kam dann leider raus, dass ich bei der Bahn lieber eine schriftliche Genehmigung erfragen sollte.
Und das war so ein Moment, wo ich kurz dachte, dass das Projekt vielleicht auf der Kippe steht.
Und das wäre schade gewesen, weil ich mir vorab schon ein bisschen Arbeit gemacht hatte.
Also lest zuerst die AGB und 0.5, habt trotz Hindernissen den Mut, es einfach zu tun.
Ich habe dann gepokert und wirklich bei der Bahn nachgefragt, ob ich automatisiert Daten runterladen und darüber zum Beispiel einen kleinen Community Vortrag halten darf.

[30:27] Und sie haben es mir genehmigt, ohne weitere Auflagen und ohne Auflagen. Und ob sie wirklich so offen sind oder einfach vergessen haben zu googeln, weiß ich nicht.
Aber ganz ehrlich, das könnte jetzt mal ein Applaus für die Bahn wert sein, weil das sportlich.

[30:48] Nicht schlecht. Ich. Ich hoffe, Sie hören zu. Und 0.6 seid ihr bei der Auswertung? Wenn ihr Daten für ein Jahr habt, zum Beispiel, dann sucht ihr nicht die vier Monate heraus, wo die Bahn besonders unpünktlich war, damit ihr viel bessere Dinge behaupten könnt.
Gängiges Mittel und das Wichtigste zuletzt 0.7.

[31:07] Ob bei euren eigenen Daten vertrauen könnt. Und das ist gar nicht so einfach und ich führe das jetzt mal vor und dann könnt ihr entscheiden, ob ihr meinen Daten vertraut. Und außerdem ist das jetzt unsere Ausrede, dass wir diesen Einschub verlassen und endlich wieder in die Daten reingucken.
Am besten schafft ihr Vertrauen in euren Datensatz, in dem wir mal eine Analyse komplett nachbaut, die die Quelle des Datensatzes, also hier die Bahn, schon mal gemacht hat.
Und die Bahn gibt auf ihrer Webseite ja pro Monat die Prozentzahl der pünktlichen Stopps an und in ihren Dokumenten steht auch, wie Sie das exakt ausrechnen.
Und die habe ich einfach genau so nachgebaut. Und siehe da, das sieht wirklich fast genauso aus.
Die zwei größten Abweichungen sind die folgenden. Im Januar messe ich die Bahn einen halben Prozentpunkt schlechter als sie ist. Das liegt vermutlich daran, dass ich erst am 8. Januar angefangen habe, Daten aufzunehmen und im September 0,8 Prozentpunkte.
Das ist da, wo mir ein paar Tage fehlen.
Ansonsten scheint bei mir die Bahn sogar generell minimal besser wegzukommen.
Exakt die gleichen Werte werdet ihr nie kriegen. Die meisten Abweichungen sind hier so um 0,1 Prozentpunkte, aber für eine Messung von außen ist das verdammt akkurat.
Wenn. Wenn eure Werte mit denen des Ziels so übereinstimmen, dann seid ihr auf einem guten Weg.
Das heißt externe Verifikation, weil wir was Externes zum Vergleichen hatten. Jetzt kommt die Interne.
Das bedeutet, ihr guckt in den Datensatz rein, ob da alles realistisch aussieht, zum Beispiel anhand der Tageszeiten.

[32:37] Jeder Punkt hier ist wieder ein Fernverkehrsbahnhof. Dass der Tagesbeginn. Null uhr. Vom 9. März dieses Jahres.
Ich gehe jetzt die Zeit Stunde für Stunde durch und dann sehen wir, wie so ein Tag für die Bahn aussieht. Die Bahnhofspunkte schwellen an, wenn in der Stunde mehr Stopps stattgefunden haben.
Und die Farbe markiert die Ausfälle. Blau ist wenig, Rot ist viel, Dunkelrot entspricht 50 % oder mehr Ausfällen.
Und es ist jetzt null uhr und man sieht, dass noch noch einige wenige Züge des Vortages unterwegs sind.
Das sind die, die Lumpensammler sozusagen.
Und das wird jetzt weniger werden. Und die Nachtruhe kehrt ein. Die Zeit vergeht.
Nachtruhe. Und hier erwacht ein neuer Tag.

[33:23] Jetzt ist so langsam voll Betrieb. Es ist 8:00. Wir sehen hier ein paar punktuelle Ereignisse, die für Ausfälle sorgen.
Das sind die roten Flecken, das Unwetter oder so passiert. Keine Notizen.
Es ist 12:00.

[33:42] Jetzt wird es wieder weniger. Der Tag geht seinem Ende entgegen. Die letzte Stunde des Tages.
Ein neuer Tag beginnt, ist der 10. März. Wir sehen wieder die letzten Züge, bevor die Nachtruhe beginnt. Alles schläft.
Der Tag wird älter. Es ist 6:00. Man sieht schon ein bisschen weg. Es ist 9:00. Wir sind wieder im Vollbetrieb.
Es ist 12:00 am 10. März und wir erinnern uns an dem Tag. War ja was.

[34:12] Und hier zeigt der Orkan Eberhardt erste Auswirkungen.

[34:21] Und hier hat er dann in fast ganz Deutschland den Fernverkehr flachgelegt.
Ich musste die Farbskala erweitern, weil man 50 % Ausfälle normal nicht hat.
Und wir lassen diesen sehr schlechten Tag für die Bahn nun ausklingen.
Und hier ist wieder 00:00, die Grenze zum Folgetag. Eine Störung in der Größenordnung zieht natürlich noch einige Tage messbare Verspätungen und Ausfälle nach sich.
Klar, wenn man das auf platte, sieht man, dass mehrere Tage runtergehen.
Die spielen wir jetzt aber nicht alle durch. Aber wir sehen nicht immer ist die Bahn schuld.
Alleine die Daten so auf Plausibilität checkt. Da nützt unbedingt gute Visualisierungen, die am besten gleich mehrere Dimensionen abdecken.
Hier hatten wir Ausfälle, Ort in zwei Dimensionen und die Anzahl der Stopps und die Zeit nach Stunde.
Und der beste Apparat zur Mustererkennung, den wir zurzeit haben, das ist nun mal das Gehirn. Und da gibt es nur eine Breitbandleitung hin und das sind die Augen.
Und wir werden jetzt noch ein paar größere Auswertungen machen.
Und als erstes bitte ich euch, dafür in Gedanken die Seiten zu wechseln.
Stellt euch vor, ihr gebt keine Analysen raus, sondern ihr lest welche. Und wenn ihr Analysen liest, die andere euch geben, dann ist es immer sehr wichtig zu riechen, worüber die anderen mit euch nicht reden möchten.
Und bei Firmen findet man das raus, indem man deren Kennzahlen genau anguckt.

[35:47] Die Bahn hat zum Beispiel gesagt, sie wollte dieses Jahr 76 0,5 pünktliche Stopps haben. Daran wollen sie sich messen.
Dieser Bericht ist aus dem Januar 2019 und Anfang Dezember 2019 haben Sie das Ziel dann kassiert?
Es werden nur unter 75 pünktliche Stopps im Fernverkehr.
In meinen Daten sind es im Moment noch knapp über 75 %. Aber trotzdem eigentliches Ziel wird verfehlt.
Aber was insgesamt auffällt, ist, dass sich die Bahn halt so ausfällen. Ich sagte es schon ganz komisch aus Schweigt.
Und jetzt bitte ich mal um Handzeichen und euch stellt steht. Stellt euch vor, ihr steht am Bahnsteig und der Zug, der fällt einfach aus.
Ihr steht da mit leerem Blick oder kommt einfach nicht. Und ihr dürft jetzt entscheiden Ist der pünktlich oder unpünktlich?
Wer von euch sollte sagen, der ist eher pünktlich?
Es sind zwei Hände, drei im Saal von 5000 Mann. Okay, ist messbar.
Wer würde, würde sagen, der Zug ist eher unpünktlich. Ja, ja, ja, das sind so ziemlich alle.

[36:57] Und so sehe ich das eigentlich auch. Und jetzt schauen wir mal in die Unterlagen der Bahn dazu. Ihr müsst das nicht lesen, ich lese euch das vor. Komplett Ausfälle oder Teilausfälle werden wie übrigens bei den anderen europäischen Bahnen auch nicht in Statistiken eingerechnet.
Zum einen ist es schwierig, dafür ein sinnvolles mathematisches Modell zu hinterlegen.
Und welche Pünktlichkeit ordnet man einem Zug zu, wenn er an einer bestimmten Stelle seiner Fahrt ausfällt?
Wir können binär messen, ob 3/8 Stopps pünktlich oder nicht pünktlich sind, aber mit Ausfall nicht ausgefallen. Das geht nicht.

[37:30] Und zum anderen liegt die sogenannte Erfüllungsquote aller täglich verkehrenden DB Personenzüge über 99 % im Jahresschnitt sowohl für Fern als auch für Nahverkehr.
Also 0.1. Ja, da möchte ich als erstes mal anmerken, dass ich das in der Sache nicht nachvollziehen kann, weil wir schon gesehen hatten, dass alleine der Fernverkehr eine Ausfallquote von mehr als 4 % hat und nicht 1 %.
Das heißt, wir haben insgesamt 103 % Fernverkehr? Ja.

[38:01] Aber vor allem vielleicht ist die Erfüllungsquote auch was anderes.
Was ich hier nicht verstehe. Keine Ahnung. Aber vor allem so ein ausgefallener Zug, der ist nicht unpünktlich, der fährt einfach komplett aus der Wertung.
Die Ausfälle werden statistisch verdeckt, weil man sie angeblich nicht statistisch einbauen kann. Also liebe Leute, ja, ich mache solche Auswertungen ja auch beruflich und da habe ich echt schon manche Ausrede zu hören gekriegt.
Aber das hier, das ist schon krass. Ich nenne sowas den finalen Rettungsschuss.

[38:42] Wenn ihr. Wenn ihr sowas erzählt kriegt, dann wisst ihr ganz genau, ihr habt es gefunden.
Hier müsst ihr gucken und nicht woanders.
Also helfen wir jetzt mit. Und wir entwickeln jetzt eine Idee, wie man die Ausfälle doch sinnvoll in die Statistik reinkriegt.
Hier sehen wir eine Zugfahrt mit vier Stopps. Die beiden weißen Links sind pünktlich.
Der hellblaue ist unpünktlich, größer, sechs Minuten und der rechte in Rot ist ganz ausgefallen.
Und im Moment zählt die Bahn einfach alle Stopps, die nicht ausgefallen sind und misst davon den Prozentsatz der Pünktlichkeit.
Das wären hier 2/3 66 %. Und ich schlage stattdessen vor, wir zählen alle Stopps, die geplant waren, und messen davon den Prozentsatz, der angekommen ist und pünktlich war.
Das wären hier 50 %. Also nehmt das nicht auf die leichte Schulter. Das ist jetzt wirklich große Mathematik.
Und bahnbrechend sozusagen.

[39:47] Und wenn man will. Danke schön. Und wenn man mit den Ausfällen ehrlich umgeht, dann.
Dann liegt die Bahn nicht bei den 76,5. Pünktlichkeit, das waren die angekündigten und auch nicht bei den 75, dass der aktuelle Wert, sondern bei 72 1/2.
Ja und mit jedem Prozent weniger wird es sehr viel unwahrscheinlicher, dass Leute ihre Anschlüsse kriegen.
Also unterschätzt das nicht. Wenn das nochmal 2 % weniger sind, als die behaupten oder drei, Das ist knackig.
Beim Fernverkehr liegt bei denen einiges im Argen.
Und damit möchte ich noch zu einem wichtigen Thema kommen Erfolgskriterien in Unternehmen.
Wenn ihr als Unternehmen eure Erfolgskriterien schlecht setzt, dann schafft ihr Anreize, die das Unternehmen in eine unerwartete Richtung lenken.
Und hier haben wir ein Paradebeispiel dafür. Wenn die Bahn einen unpünktlich pünktlichen Zug einfach spontan ausfallen lässt, dann steht die nach ihrer eigenen Messmethode danach besser und nicht schlechter, weil die Ausfälle einfach komplett aus der Statistik fliegen.
Also müssen wir uns die Frage stellen Wo genau lohnt es sich für die Bahn am meisten, ein paar Ausfälle zu erzeugen, um damit die Pünktlichkeit sstatistik zu pushen?

[41:05] Geklatscht er schon vorher? So kann ich nicht arbeiten.

[41:11] Und die Lösung ist am Ende und am Anfang von Fahrten.
Züge fahren nämlich häufig dieselbe Strecke hin und her. Und der Herr fährt los.
Bis jetzt alles gut gegangen hier oder dann satt Verspätungen angesammelt. Das passiert.
Und an diesem Punkt ist zu erwarten, dass die letzten beiden Halte auch verspätet sein werden.
Und auch die ersten beiden der Rückfahrt natürlich. Das also schlecht für die Statistik. Also lassen wir die doch einfach ausfallen, Blasen wir ab.
Der Zug schmeißt die Fahrgäste raus, dreht an Ort und Stelle um und ist wieder pünktlich. Und wer in den roten Stopps einsteigen und aussteigen will, der steht halt mit leerem Blick am Gleis.
Aber die Verspätungsstatistik verbessert sich, denn die Ausfälle fallen ja einfach unter den Tisch. Aber wie könnte man so was messen?

[42:03] Ganz einfach. Bad Homburg, Hamburg, Hamburg? Oh ja.
Also ganz einfach Hier ist wieder eine. Eine Zugfahrt mit all ihren Stopps.
Und die unterteilen wir einfach in drei Klassen frühe, mittlere und späte Stopps. Die frühen und späten sind die ersten und letzten drei hier grau und die mittleren sind der Rest.
Und für diese drei Arten Stopps machen wir getrennte Auswertungen.

[42:30] Wenn. Wenn Ausfälle aufgrund des technischen Betriebes entstehen, würde man ja erwarten, dass es am Start einer Fahrt statistisch weniger Ausfälle gibt. Und dann werden das über die Zeit mehr.
Und beim ICE ist das auch genauso.
Die Ausfälle steigen nach hinten an und beim ICE dagegen fallen die ersten und letzten Stopps häufiger aus.
Und das passt alles. Genau die scheinen die Dinger einfach hart zu wenden.
Und ich habe dieses Verhalten auch von zwei unabhängigen Quellen bestätigt bekommen und das war vor einiger Zeit schon mal irgendwo klein in der Presse.
Also ich verrate hier keine Staatsgeheimnisse und je nachdem, wen man fragt, heißt dieses Vorgehen entweder nach unserem Verkehrsminister Scheuer Wende.

[43:16] Oder aber nach dem Bahnvorstand, die Pofalla sind. Das müsst ihr jetzt heute Abend beim Bier entscheiden, was ihr besser findet.
Jedenfalls ein weiterer Praxistipp. Vorsicht am Anfang und am Ende eines ICE Zug Laufs. Die fallen gerne mal aus. Die nach Möglichkeit nicht.
Ja, und aus Gründen der Neutralität muss ich dazu sagen. Die Bahn hat natürlich ein Interesse daran, dass das ganze Zugnetz ungefähr im Plan ist.
Also werden die sich denken, dass bei so einem Manöver nicht so viele Passagiere von den Ausfällen betroffen sind.
Dafür aber im weiteren Verlauf deutlich mehr Passagiere in pünktlichen Zug kriegen. Ist eben deren Geschäftsentscheidung.
Es liegt mir fern, da jetzt von der Seitenlinie ohne tieferes Wissen altkluge Ratschläge zu erteilen. Wir sind hier nicht auf Twitter.

[44:02] Aber was ich hier kritisiere ich kritisiere.

[44:07] Und was ich hier kritisieren möchte, ist aber, dass ausschließlich die positive Seite des Manövers danach in der Statistik auftaucht und die negative einfach verschwindet.
Das stört ja. Wir wollen gar nicht wissen, wie viele Leute im Verkehrsministerium denen das abgekauft haben sollen. Wir hatten jetzt schon ein bisschen Praxistipps gesehen, die euch zu Hause beim Buchen vielleicht ein bisschen was bringen.
Vorsicht mit bestimmten Bahnhöfen, Vorsicht mit ICEs im Allgemeinen, ICEs, Vorsicht mit ICEs im Sommer im Speziellen.
Vorsicht, wenn Züge schon lange unterwegs waren. Vorsicht, wenn Sie 40 Minuten oder mehr verspätet sind.
Und jetzt gerade Vorsicht mit ICEs am Anfang und am Ende der Fahrt wegen der Scheuerwenden.

[44:50] Und ich könnte jetzt mit euch noch jede Menge Standardkram machen, der sich irgendwie aus den Daten ergibt. Top Ten Bahnhöfe oder Zuglinien nach Verspätungen, Ausfällen usw.
Aber das hilft doch nur wenigen. Ganz ehrlich. Also machen wir jetzt noch zwei Sachen an. Erstens machen wir unsere letzte große Sache mit den Bahndaten und ich hoffe, dass ihr davon zumindest für ein paar Monate ganz konkret was habt.
Und danach würde ich mit euch gerne kurz über das Ausklingen der Jahrzehnte nachdenken.
Zuerst die Datensache. Wenn ihr einen Bahntickets kauft, könnt ihr wählen. Mit Starticket seid ihr an exakt die Züge, die ihr gebucht habt, gebunden. Oder ihr nehmt ein Flexticket. Das ist deutlich teurer, aber dafür habt ihr keine Zugbindung.
Und interessant ist nun folgende Regel auf den Spart Tickets, wenn sie durch Verschulden der DB ihren Anschlusszug nicht erwischen oder allgemein einer Verspätung von mehr als 20 Minuten erwartet werden muss, wird die Zugsbindung automatisch aufgehoben.
Ich verstehe das so, dass ihr dann eigentlich ein Flexticket habt. Plötzlich.

[45:52] Und dann gucken wir mal auf den Prozentsatz der Stops, die entweder mehr als 20 Minuten zu spät waren oder aber ausgefallen sind. Und insgesamt sind das immerhin 12,4 %.
Und wenn man jetzt diese Stopps erwischt, den verwandeln die einem vielleicht schon vor Abfahrt ein preiswertes Ticket Netflix Ticket. Und das wäre doch total cool, wenn man die vorher wissen könnte.

[46:20] Ich bin, wenn ich so vorhersehbar.

[46:24] Und komplett vorhersehen geht natürlich nicht, aber es gibt Züge, bei denen sowas häufiger auftritt und Bahnhöfe, bei denen sowas häufiger auftritt.
Und es gibt auch Wochentage, bei denen sowas häufiger auftritt.

[46:37] Ja.

[46:40] Und hier ist ein Beispiel. Lest mal mit. Lest mal mit.
Das bedeutet beim Intercity 2221 ist an allen Orten bei Mainz, Hauptbahnhof an allen Mittwoch dieses Jahr mit 53 % Wahrscheinlichkeit die Zugbindung aufgehoben.
Also von allen Stopps, die ich dazu erfasst habe, waren 53 % entweder mehr als 20 Minuten zu spät oder sind ganz ausgefallen und am Freitag das ganze mit 50 %.
Ich muss die Schreibweise so kurz machen und euch das so beibringen. Das Lesen, damit ich jetzt gleich platzsparend arbeiten kann.
Euch schwant vermutlich schon, was ich jetzt mache. Also ich habe für euch mal die Kombination aus allen Wochentagen, allen Bahnhöfen und allen Fernzüge durchsucht und habe dann nur die Kombinationen genommen, wo ich mindestens zehn Datenpunkte hatte, damit das einigermaßen fundiert ist.
Und für die habe ich gemessen, bei wie viel Prozent die Zugbindung dieses Zuges an diesem Wochentag, an diesem Bahnhof gekillt wurde.
Und dann habe ich gesagt, ich will nur die ganz Fiesen haben, wo das mit mindestens 50 % der Fälle der Fall war.
Und herausgekommen sind fast 500 Kombinationen aus Wochentagen, Bahnhöfen und Zügen.

[47:49] Hier sind sie.

[47:54] Also ich würde. Ich würde kein Ticket für teuer Geld kaufen, wenn ich an einem dieser Bahnhöfe einsteige. Aussteigen oder umsteigen an dem Wochentag mit diesem Zug.
Kauf ein Ticket. Und für alle, die das jetzt nicht lesen könnten ich stell den Folien Satz wieder irgendwie bei mir auf die Seite morgen oder so..
Beachtet auch, dass die Daten irgendwann ungültig werden. Behaltet den Zug bitte am Freitag im Auge.
Ich bin nicht schuld, wenn ihr unverhofft doch pünktlich zum Zug eintreten müsst, weil die Kiste halt pünktlich ist.
Also bitte, bitte behandelt diese Daten, als wären sie mit Xerox Geräten gescannt und.

[48:37] Und wenn ihr meint, wenn ihr doch pünktlich da sein müsst, dann ist das ja auch ein gutes Zeichen, weil es nichts anderes bedeutet, als dass die Bahn etwas verbessert.
Verbesserungen passieren nämlich durchaus.
Dieses Jahr wurde zum Beispiel neue ICEtrasse zwischen München und Berlin ausgebaut. Da kann man jetzt unter vier Stunden zwischen beiden Städten hin und her fahren, ohne den Zug zu wechseln.
Und wenn das rund läuft, ist das echt mal eine Alternative zum Flughafen.
Es ist also nicht alles schlecht. Ich hoffe auch ich bin bei aller Kritik fair mit der Bahn umgegangen heute. Ich bin jedenfalls, obwohl ich das alles gesehen habe, mit der Bahn zum Congress gefahren und werde das auch auf dem Rückweg machen.

[49:17] Und für heute möchte ich damit die Bahnbetrachtung abschließen mit den Worten Seid nett zur Bahn mit ihren Fehlern. Wir haben nur diese eine.
Ja, und was bleibt?

[49:34] Das war jetzt David Grasel beim 36. Gast Communication Congress mit seinem Vortrag Bahn Mining.
Pünktlichkeit ist eine Zier.
Ja, also da muss man jetzt ganz klar sagen, das ging jetzt hier um den Fernverkehr in Deutschland.
Der Regional und der Nahverkehr, das ist ja auch noch mal ein bisschen eine andere Geschichte.
Da gibt es andere Züge, andere Strecken, andere Schwerpunkte.
Und das ist aber ein Punkt, den müssen wir uns auf jeden Fall auch noch mal genauer anschauen.
Uns interessiert natürlich, wie ist da der aktuelle Zustand, aber besonders auch wie kann sich das in der Zukunft entwickeln? Was sind die Strategien, um die Herausforderungen anzugehen? Was sagt er, Was sagt die Bahn? Was sagt die S Bahn, die U Bahn, die Straßenbahn?
Wie können Lösung aussehen, dass Leute auch in der großen Stadt oder in einem großen Gebiet hier wie in dem Rhein Main Gebiet auch mobil sein können und vorankommen?
Das war das Politmagazin hier bei Radio X. Schön, dass ihr reingeguckt habt. Schön, dass ihr dabei wart.
Wir haben natürlich wieder die Sendung auf unserer Website Politopia magazin.
In den Sendungsnotizen, also in den Shownotes, werdet ihr auch noch Links finden, die alle Startpunkte sind, wo euch weiter schlau machen könnt und zu diesem Thema noch mehr erfahren könnt.
Schön, dass ihr dabei wird. Bis zum nächsten Mal nächste Woche Mittwoch, 16:00 bei Radio X.