Heute beginnt die Fußball-Weltmeisterschaft. Doch: Wer wird den Pokal gewinnen? Diese Frage treibt Millionen von Fans weltweit um. Darunter auch Wissenschaftler_innen. Deswegen haben vier Statistiker aus Deutschland und Belgien ein Modell entwickelt und berechnet, mit welcher Wahrscheinlichkeit jedes Team den Titel gewinnt. Das Ergebnis: Die Deutsche Fußball Nationalmannschaft wird mit einer Wahrscheinlichkeit von 17,1 Prozent Weltmeister. Top-Favorit auf den Titel ist Spanien (17,8 Prozent) auf Rang drei folgt Brasilien (12,3 Prozent) vor Frankreich (11,2 Prozent).
Deutschland ab dem Achtelfinale Favorit
Interessanterweise ist aber laut Modell eigentlich Deutschland das stärkste Team. Aus einem direkten Duell mit Spanien oder Brasilien würde das Team von Joachim Löw mit der höheren Wahrscheinlichkeit als Sieger hervorgehen. Doch Deutschland trifft zunächst tendenziell auf stärkere Gegner als Spanien. Dies wird vor allem im Achtelfinale deutlich, wo Spanien auf ein Team der Gruppe A (Uruguay, Russland, Saudi-Arabien, Ägypten) trifft und Deutschland auf ein Team der Gruppe E (Brasilien, Schweiz, Costa Rica, Serbien). Während Spanien und Deutschland mit ähnlichen Wahrscheinlichkeiten mindestens das Achtelfinale erreichen (88.4 Prozent bzw. 86.5 Prozent), unterscheiden sich dementsprechend die Wahrscheinlichkeiten mindestens das Viertelfinale zu erreichen (73.1 Prozent bzw. 58.0 Prozent) recht deutlich. Würde Deutschland das Viertelfinale erreichen, wäre die Mannschaft ab diesem Zeitpunkt der Favorit auf den Titel.
Simulation von 100.000 Turnierverläufen
Das Forscherteam bestehend aus Dr. Gunther Schauberger (Lehrstuhl für Epidemiologie von Prof. Dr. Stefanie J. Klug), Prof. Dr. Andreas Groll (TU Dortmund), Prof. Dr. Christophe Ley und Hans Van Eetvelde (beide Ghent University) erzeugte 100.000 simulierte Turnierverläufe, aus denen sich die Wahrscheinlichkeiten ergaben. "In jeder einzelnen Simulation wurde jedes der 48 Spiele der Gruppenphase gemäß unserem Modell prognostiziert, darauf aufbauend wird auch der weitere Turnierverlauf bis zum späteren Weltmeister vorhergesagt.", erklärt Schauberger. Ein Teil des Forscherteams hatte bereits für das Turnier 2014 eine Vorhersage erstellt und prognostizierte den späteren Weltmeister Deutschland bereits im Vorfeld.
Das verwendete Modell ist eine Kombination aus einem sogenannten Random Forest (einer Technik aus dem Machine-Learning) sowie einem Rankingansatz, für den die aktuelle Stärke jedes Teams ähnlich der FIFA-Rangliste berechnet wurde. "Konkrete Aspekte, die in die Modellierung eingehen sind beispielsweise die Quote jedes Teams bei Wettanbietern, der aktuelle Rang in der FIFA-Weltrangliste, der Erfolg der Spieler jedes Teams in der Vorsaison - Letzteres wird operationalisiert durch den Erfolg in der Champions League", erläutert der promovierte Statistiker.
Während des Turniers 2014 zeigte sich, dass die Vorhersage der Gruppe mit Blick auf alle WM-Spiele präziser war als die Prognosen der Wettanbieter. "Mathematisch unterscheidet sich die Vorab-Berechnung der WM nur geringfügig von epidemiologischen Methoden, die zur Vorhersage von Epidemien, zum Beispiel einer Grippewelle, zur Anwendung kommen", sagt Ordinaria Prof. Klug. Die Berechnung der WM sei natürlich in gewissem Sinne eine Spielerei, sie zeige aber auch die Breite des Fachs und was mit soliden statistischen Methoden alles möglich ist, sagt Prof. Klug und fügt hinzu und ergänzt: "Ich hoffe natürlich, dass Deutschland Weltmeister wird."
Zur Homepage des Lehrstuhls für Epidemiologie
Vollständige Veröffentlichung "Prediction of the FIFA World Cup 2018 - A random forest approach with an emphasis on estimated team ability parameters"
Kontakt
Dr. Gunther Schauberger
Lehrstuhl für Epidemiologie
Georg-Brauchle Ring 58
80992 München
E-Mail: Gunther.Schauberger(at)tum.de
Text: Fabian Kautz
Fotos: Pixabay; Groll, Ley, Schauberger & Eetvelde