Big Data im Fußball. Was vielen Zuschauer_innen durch Statistiken aus dem Fernsehen oder Zeitungen bekannt ist, nutzen Vereine im Profifußball auch zur Spielanalyse. Steffen Lang, Doktorand am Lehrstuhl für Trainingswissenschaft und Sportinformatik, hat ein Verfahren entwickelt, das automatisch den „In-Game Status“, ob der Ball im Spiel ist oder nicht, bei Fußballspielen bestimmt. Die Ergebnisse der Studie wurden unter dem Titel „Predicting the in-game status in soccer with machine learning using spatiotemporal player tracking data" im Journal „Scientific Reports" veröffentlicht. Die Fachzeitschrift hat einen Impact Faktor von 5,0.
„Der Ballstatus ist eine wichtige Information im Fußball, um ein Spiel strukturieren und analysieren zu können“, erklärt Lang. Diese Information wird bisher im Profifußball „per Hand“ von Dienstleistern erhoben. Für Amateurklubs und semiprofessionelle Vereine steht diese Information jedoch aufgrund des hohen manuellen Aufwandes zumeist nicht zur Verfügung. Allerdings besitzen viele dieser Klubs bereits automatische Trackingsysteme, beispielsweise auf Basis von GPS, die die Positionen von Spielern kontinuierlich erheben. Ziel des Projektes war es, diese Positionsdaten zur Bestimmung des In-Game-Status zu nutzen.
„Das ist wichtige Basisarbeit. Auf Grundlage der Informationen, die unser Modell herleitet, können weitere Analysen automatisch durchgeführt werden. Beispielsweise lässt sich damit automatisch aus den Positionsdaten extrahieren, wann Ecken oder Freistöße stattgefunden haben“, erläutert PD Dr. Daniel Link, der das Promotionsvorhaben von Steffen Lang betreut. Das Projekt wurde in Zusammenarbeit mit dem Lehrstuhl für Decentralized Information Systems and Data Management der TUM School of Computation, Information and Technology durchgeführt.
Die Forscher nutzten Daten von 102 Spielen der Bundesliga und vier „Machine-Learning-Verfahren“. 45 Partien dienten als Trainingsset, um Modelle zu trainieren und eine Generalisierung für weitere Partien herzustellen. Die besten Modelle wurden schließlich auf die restlichen 47 Partien angewendet und erzielten eine Genauigkeit von 93 Prozent bei der Bestimmung. Insgesamt wurden über acht Milliarden Datenpunkte zum Training verwendet – Big Data eben!
Für die Zukunft erwartet Lang eine noch deutlich höhere Genauigkeit und verschiedene Erweiterungen der Methodik. Zukünftig werden Amateurvereine auch Ballpositionen erheben können, beispielsweise durch einen Chip im Ball. „Aber selbst dann weiß man immer noch nicht, ob das Spiel unterbrochen ist oder nicht. Füge ich aber diese Informationen zu unserem Trainings-Algorithmus hinzu, gehen wir davon aus, dass wir sehr, sehr genau werden.“ Der wissenschaftliche Mitarbeiter erklärt außerdem, dass aufbauend auf den Vorhersagen weitere automatische Klassifizierungen erfolgen können. So können im nächsten Schritt Spielereignisse wie Pässe, Zweikämpfe und Torschüsse berechnet werden. „Je mehr Daten wir maschinell erzeugen können, umso mehr kann der Amateursport aufholen. Ich bin überzeugt davon, dass in Zukunft niemand mehr per Hand Daten ermitteln muss.“
Lang beschäftigt sich in seiner Doktorarbeit mit eben jenen Positionsdaten, vorrangig im Fußball. Doch er erklärt auch, dass die verwendeten Methoden grundsätzlich auf andere Sportarten übertragbar seien, „denn auch im Hockey oder Handball gibt es Positionsdaten, nicht nur im Wettkampf, sondern auch im Training. Wir stehen am Anfang der datengetriebenen Trainingswissenschaft“, so Lang.
Zur Publikation im Journal "Scientific Reports"
Zur Homepage des Lehrstuhls für Trainingswissenschaft und Sportinformatik
Kontakt:
PD Dr. Daniel Link
Lehrstuhl für Trainingswissenschaft und Sportinformatik
Georg-Brauchle Ring 60/62
80992 München
Tel.: 089 289 24498
E-Mail: daniel.link(at)tum.de
Steffen Lang
Lehrstuhl für Trainingswissenschaft und Sportinformatik
Georg-Brauchle Ring 60/62
80992 München
Tel.: 089 289 24503
E-Mail: Steffen.Lang(at)tum.de
Text: Bastian Daneyko
Fotos: Pixabay/privat