Mit Katar ist zum ersten Mal in der Fußballgeschichte ein arabisches Land Gastgeber der Fußball-Weltmeisterschaft. Aufgrund der dort herrschenden hohen Temperaturen wird nicht im Sommer, sondern im Winter gespielt. Vom 20. November bis 18. Dezember 2022 kicken die besten Teams der Welt in der Weihnachtszeit um den WM-Titel.
Der (statistische) Favorit ist dieses Mal Brasilien mit einer Gewinnwahrscheinlichkeit von 15 Prozent. Das hat ein internationales Forscher_innen-Team um Dr. Gunther Schauberger (Lehrstuhl für Epidemiologie von Prof. Dr. Stefanie Klug), Prof. Dr. Andreas Groll und Neele Hormann (beide TU Dortmund), Prof. Dr. Christophe Ley (Universität Luxemburg), Hans Van Eetvelde (Universität Gent/Belgien) und Prof. Dr. Achim Zeileis (Universität Innsbruck/Österreich) mit Hilfe von maschinellem Lernen herausgefunden. Die Prognose kombiniert dabei mehrere statistische Modelle für die Spielstärken der Teams mit Informationen über die Team-Struktur (etwa Marktwert oder Anzahl Champions-League-Spieler) sowie sozioökonomische Faktoren des Herkunftslandes (Bevölkerung und Bruttoinlandsprodukt).
Mit den Werten aus dem Modell der Forscher_innen wurde die gesamte WM 100.000 Mal durchsimuliert: Spiel für Spiel, der Turnierauslosung und allen FIFA-Regeln folgend. Damit ergeben sich Wahrscheinlichkeiten für das Weiterkommen aller Teams in die einzelnen Turnierrunden und letztendlich für den WM-Sieg.
"Durch die wiederholte Simulation des gesamten Turniers kann man auch sehen, welche Einflüsse die Auslosung und der Turnierbaum haben können“, erklärt Dr. Schauberger. „Es ist daher nicht immer so, dass die stärkeren Teams auch automatisch bessere Chancen aufs Weiterkommen haben.“ Beispielsweise hat Deutschland durch die vergleichsweise schwere Gruppe mit Spanien geringere Chancen, ins Achtelfinale zu kommen, als Belgien. Nach der Gruppenphase aber überholt Deutschland Belgien im Hinblick auf die Chancen auf ein Weiterkommen.
Favorit für die WM 2022 ist Brasilien mit einer Gewinnwahrscheinlichkeit von 15 Prozent, gefolgt von Argentinien (11,2 Prozent), den Niederlanden (9,7 Prozent), Deutschland (9,2 Prozent) und Frankreich (9,1 Prozent). Trotz des vierten Rangs für Deutschland ist das Turnier natürlich dennoch nicht gelaufen – das zeigen die vergleichsweise niedrigen Gewinnwahrscheinlichkeiten einiger Top-Nationen. Dr. Schauberger verdeutlicht, wie groß die Unsicherheit bezüglich des Ausgangs dieser WM ist: „Unser wahrscheinlichster Tipp Brasilien liegt etwa bei 15 Prozent. Dementsprechend liegt die Wahrscheinlichkeit, dass wir mit diesem Tipp danebenliegen, bei 85 Prozent. Erst wenn man die Wahrscheinlichkeiten der fünf Top-Favoriten zusammenrechnet, liegt man bei einer Wahrscheinlichkeit von über 50 Prozent."
Bisher waren die Prognosen der Forscher_innengruppe durchaus erfolgreich: Das Innsbrucker Modell von Prof. Dr. Achim Zeileis, das auf bereinigten Quoten der Wettanbieter basiert, konnte unter anderem bereits 2008 das EURO-Finale, sowie 2010 und 2012 Welt- und Europameister Spanien richtig vorhersagen. Bei der EURO 2020, die wegen COVID-19 auf 2021 verschoben wurde, wurde Frankreich als Titelgewinner prognostiziert und nicht der tatsächliche Champion Italien.
In diesem Jahr wird es zum zweiten Mal nach der EM 2020 als Teil eines umfassenderen kombinierten Modells eingesetzt, das von den Teams um Prof. Dr. Andreas Groll (TU Dortmund), Dr. Gunther Schauberger (TU München) und Prof. Dr. Christophe Ley (Universität Luxemburg) entwickelt wurde und dessen Vorgänger-Modell bei der Fußball-Weltmeisterschaft 2018 die Prognosegüte der Wettanbieter übertroffen hatte.
Die Berechnung der Forscher_innen basiert auf drei unterschiedlichen Informationsquellen: Ein statistisches Modell für die Spielstärke jedes Teams auf Basis aller Länderspiele der vergangenen acht Jahre (Universitäten Gent und Luxemburg), ein weiteres statistisches Modell für die Spielstärke der Teams auf Basis der Wettquoten von 28 internationalen Buchmachern (Universität Innsbruck) und weitere Informationen über die Teams, zum Beispiel der Marktwert, sowie ihre Herkunftsländer, etwa die Bevölkerungszahl (TU Dortmund und TU München).
Diese unterschiedlichen Informationsquellen wurden nicht nur für das aktuelle Turnier, sondern auch für die vorangegangenen Turniere bis inklusive der WM 2002, erhoben. Mit Hilfe dieser historischen Daten wird ein Machine-Learning-Modell trainiert, das die genannten Informationen mit dem jeweiligen Abschneiden der Teams in den einzelnen Turnieren in Verbindung bringt und dadurch zur Vorhersage von Spielen der aktuellen WM verwendet werden kann. Wie gut das Modell abschneidet, wird man spätestens am Abend des 18. Dezember erfahren, wenn das Finale der Weltmeisterschaft gespielt ist und der neue Weltmeister feststeht.
Neben dem wissenschaftlichen Interesse an der WM beschäftigt das gesamte Forscher_innenteam in diesem Jahr aber auch die Umstände, unter denen die WM in Katar ausgerichtet wird. "Die Medienberichte der letzten Wochen verdeutlichen, wie problematisch die Vergabe der Weltmeisterschaft an Katar ist, insbesondere im Hinblick auf die Menschenrechte sowie die Arbeitsbedingungen beim Bau der Stadien und der Infrastruktur“, so Prof. Klug. „Dadurch liegt ein großer dunkler Schatten über dem Turnier, der es unmöglich macht, das Turnier mit der gewohnten Freude zu verfolgen."
Zur gesamten Prognose mit interaktiven Grafiken
Zur Homepage des Lehrstuhls für Epidemiologie
Kontakt:
Prof. Dr. Stefanie Klug
Lehrstuhl für Epidemiologie
Georg-Brauchle-Ring 56
80992 München
Telefon: 089 289 24950
E-Mail: stefanie.klug(at)tum.de
Dr. Gunther Schauberger
Lehrstuhl für Epidemiologie
Georg-Brauchle-Ring 56
80992 München
Telefon: 089 289 24955
E-Mail: gunther.schauberger(at)tum.de
Text: Uni Innsbruck/Romy Schwaiger
Fotos/Grafiken: Pixabay/privat/Groll, Hormann, Ley, Van Eetvelde, Schauberger & Zeileis