Applied Data Science UNBOXED

Taktik trifft AI – Wenn Algorithmen im Sport mitspielen

Podcast HSLU Season 1 Episode 7

Folge 7 | Wann wird aus Datenanalyse ein spielentscheidender Vorteil? Sport Data Analytics liefert Antworten.

Fabio Sandmeier spricht mit Martin Rumo und Beat Suter von scoreTec über die Kraft der Zahlen im Sport. 

Wie lassen sich Pressing-Situationen quantifizieren? Was macht einen Spielmacher messbar? Und warum braucht es neben Algorithmen auch Kaffee-Gespräche und vollgeschriebene Flipcharts, um aus Rohdaten echte Erkenntnisse zu gewinnen?

Überblick:
01:16 XY-Koordinaten und Positionsdaten – Wie Algorithmen das Spiel lesen
03:09 Pressing im Fussball – die Daten hinter dem Druck auf den Ball
06:13 Spielmacher im Eishockey – was macht einen echten Playmaker aus?
08:08 Von der Spielphilosophie zur Daten-Pipeline – wie Taktik messbar wird
12:20 Analytics Translation im Master IDS – aus Daten werden Antworten

Applied Data Science UNBOXED – Wissen. Trends. Zukunft. Wir öffnen die Tür zur Welt der Data Science und zeigen, wie Daten unsere Zukunft gestalten.

Ob Data-Science-Enthusiast:in oder Quereinsteiger:in – hier gibt es echte Insights. Renommierte Expert:innen aus Wissenschaft, Industrie und Gesellschaft sprechen über aktuelle Trends, bahnbrechende Innovationen und die spannendsten Herausforderungen im Feld.

Neugierig? Dann reinhören und eintauchen in die Welt der Daten. Mehr erfahren:
🔹 Masterstudium "Applied Information and Data Science" – alle Infos online
🔹 Kostenlose Online-Info-Events – direkt von den Studienverantwortlichen
🔹 Unser Blog – aktuelle Beiträge rund um Data Science
🔹 LinkedIn – vernetzen und keine Updates verpassen

Fabio Sandmeier: [00:00:00] Sport ist verbunden mit Emotionen, doch hinter diesen Emotionen stecken auch Daten. Sport ist auch Data Science. Heute tauchen wir ein in die Welt der Sport Data Analytics. Es geht heute um Taktik und wie man Spielerinnen und Spieler messen kann.

Fabio Sandmeier: Hallo und herzlich willkommen. Mein Name ist Fabio Sandmeier und ihr hört «Applied Data Science Unboxed», ein Podcast der Hochschule Luzern. In jeder Folge schauen wir uns an, wie Data Scientists in der Praxis arbeiten. 

Fabio Sandmeier: Und für diesen Podcast besuche ich Martin Rumo und seinen Geschäftspartner Beat Suter in Schönbühl im Kanton Bern.

Fabio Sandmeier: In einem Industriequartier zwischen Lagerhallen und Bürogebäuden ist die kleine Firma [00:01:00] Biznet zu Hause. Ein Unternehmen, das sich intensiv mit Sportdaten beschäftigt. 

Fabio Sandmeier: Ich werde empfangen bei Café und Gipfeli und Martin Rumo erklärt mir, womit bei ihnen die Arbeit anfängt.

Martin Rumo: Also in den Rohdaten haben wir ja eigentlich die XY-Position der Spieler und auch des Balls Das ist sehr sehr wichtig.

Martin Rumo: Das heisst, wir müssen zuerst einen Worker haben, der uns Überhaupt sagt in welcher zone befindet sich der ball das ist eine sehr einfache aufgabe weil die zone entspricht ein einer gewissen Fläche und wenn die xy die koordinaten in die fläche hinein fallen dann bedeutet es ist in dieser Zone

Fabio Sandmeier: jetzt führen mich die beiden in ihr Sitzungszimmer und ich bin überrascht denn bei einem Data-Science-Team hätte ich eine Menge Bildschirme [00:02:00] erwartet. Aber nein, ich sehe zwei Flipchart-Ständer, voll mit Skizzen Und die Wände sind tapeziert mit Ausdrucken von Diagrammen, Screenshots von Fussballspielen usw.

Fabio Sandmeier: Also alles sehr analog. 

Martin Rumo: Wir möchten ja ein gemeinsames Verständnis eines Phänomens zusammenkriegen.

Martin Rumo: Auf der einen Seite haben wir den Experten, der das Phänomen sehr gut kennt, aber es schlecht in Zahlen ausdrücken kann. Und wir haben den Zahlenexperten der das Übersetzung machen sollte und darum eben das Arbeiten mit Flipcharts mit Bildern. Ich muss sagen, ich habe meinen Hintergrund das war am Anfang sehr wissenschaftlich und dann habe ich gemerkt, dass das in Sports Data Analytics eigentlich nicht genug ist und darum habe ich mich dann weiterbilden lassen im Bereich Design Thinking.

Fabio Sandmeier: Martin sieht sich als Translator, als Übersetzer. [00:03:00] Er hört zunächst einmal gut zu und versucht dann, die richtigen Fragen zu stellen. Ist die Frage einmal klar formuliert, ist die Antwort nicht weit. Wie zum Beispiel beim Thema Pressing also wenn man Druck macht in einem Fussballspiel. 

Martin Rumo: habe eine witzige Anekdote mit dem damaligen U19 oder U20 Nationaltrainer der Schweizer Nationalmannschaft. Es ging darum, dass ich Pressing, also die Art und Weise wie Druck entsteht oder Druck entstehen kann, Und er hat mir da in seiner Fussballsprache das alles probiert zu erklären. Und ich konnte das nie richtig übersetzen in etwas, wo ich mit den Daten, die mir zur Verfügung standen irgendetwas Interessantes anfangen kann.

Martin Rumo: Und dann eines Tages beim Kaffee habe ich ihn dann gefragt, wenn du eine Pressungssituation evaluieren musst, wo [00:04:00] schaust du genau hin, was schaust du? Und er hat gesagt, ja, ich schaue einfach, was sind die zwei bis drei Spieler, die am nächsten sind und wie schnell bewegen sie sich auf den Ball zu.

Martin Rumo: Und plötzlich hat er mir in einem einzigen Satz alles gegeben, was ich brauche, weil das sind alles Messgrössen, die mir zur Verfügung standen Und ich konnte damit da ein bisschen lineare Algebra anwenden Und konnte dann tatsächlich einen Pressing-Index entwickeln, der den Druck auf den Ball zu jedem Zeitpunkt geben konnte.

Martin Rumo: Warum war das wichtig? Mit was für einer Fragestellung hing das zusammen? Das hing damit zusammen, dass ich im Interview mit Coaches immer wieder auf die Fragestellung gestossen bin, Unter wieviel Druck wurde der Pass gespielt. Oder wenn ich hinten in der Viererkette den Ball [00:05:00] links und rechts ein bisschen rumschiebe, dann haben mir die Coaches gesagt, die jetzigen Instrumente, die uns zur Verfügung stehen, die sagen einfach, 80% erfolgreiche Pässe.

Martin Rumo: Aber wenn das einfach nur Pässe in der Viererkette waren, dann erzeugt das kein Eigentlich nutzen. Das heisst sie wollten eher wissen, dort wo hohe Drucksituationen sind, geben in Zone 3 oder sogar in der Box, wer spielt dort noch die effektiven Bälle. Also ich bin immer wieder das gestossen, dass ich Druck irgendwie quantifizieren muss, Qualität eines Passes auch besser beurteilen kann.

Martin Rumo: So wir langsam vor und mehren uns diesen komplexen Konzepten im Fussball. wir da immer näher ran, indem 

Fabio Sandmeier: Das finde ich [00:06:00] faszinierend. Und so langsam begreife ich, wenn man eine Taktik exakt beschreiben kann, kann man sie auch messen. Und alles beginnt mit Videomaterial und XY-Koordinaten. Rumo gibt mir gleich ein zweites Beispiel, dieses Mal aus dem Eishockey. Der HC Davos hat sich gefragt, wie man aus dem etwas schwammigen Begriff «Spielmacher» etwas Konkretes etwas Messbares machen kann.

Fabio Sandmeier: Wie 

Martin Rumo: wir haben dieses Konzept des Spielmachers und jetzt müssten wir genauer Nachfragen ja was ist der spielmacher was ist die beobachtung die ich mache damit ich sage das ist ein spielmacher oder der hat so einen spielmacher der diese Spielmacher-Merkmal und wir haben uns darauf geeinigt dass es der spielmacher ist der der wenn er den park hat hat er die möglichkeit Den nächsten [00:07:00] Spieler zu lancieren, den nächsten Spieler in eine bessere Situation zu bringen, als er selber war.

Martin Rumo: Das heisst, bessere Situation mussten wir wieder, was ist eine bessere Situation? Hier wieder, Analytics Translation, eine bessere Situation ist, wenn ich näher beim Tor, wenn ich... Mit mehr Geschwindigkeit und weniger Druck auf das Tor zu gehen kann. Das ist im Eishockey eine super interessante Situation und die Spieler, die zum Teil auch dann  

Martin Rumo: uneigennützig andere Spieler in solche Situationen bringen, die haben wir als Spielmacher und das hat Das hat uns die Möglichkeit gegeben, dann tatsächlich aus den Daten haben wir die Koordinaten, wir haben die Pässe, wir haben die Schüsse, wir haben die Geschwindigkeit, das haben wir alles.

Martin Rumo: Und so konnten wir das machen und haben wir das auch beim [00:08:00] Spengler-Cup dann vorstellen können. Das war auch eine interessante Aufgabe in Analytics Translation. 

Fabio Sandmeier: Ich bewege mich der Wand des Sitzungszimmers entlang und bleibe hängen an der Spielphilosophie des Schweizerischen Fussballverbandes. Ein Dokument, das eigentlich ziemlich einfach gegliedert ist. Ich erkläre sie kurz. Stell dir vor, du wärst Trainerin oder Trainer der Schweizer Nationalmannschaft. Dein Team spielt stark, aber ihr verliert oft den Ball im Mittelfeld.

Fabio Sandmeier: Warum? Wo genau passiert das und was könnt ihr dagegen tun? Ein Spiel lässt sich immer in eine von vier Phasen einteilen, sozusagen verorten. Man hat den Ball, man verliert den Ball, man hat den Ball nicht, man Oder man erobert den Ball. Und dazu kommen drei Zonen. [00:09:00] Ihr kennt das Spielfeld im Fussball. Es gibt den eigenen Strafraum, das Mittelfeld und den gegnerischen Strafraum.

Fabio Sandmeier: So weit, so klar. Aber diese einfache Philosophie diese einfache Einteilung, die hilft Data Scientists wie Beat Suter bei ihrer Arbeit. 

Beat Suter: Was wird hier erhalten als Inputdaten sind natürlich nur Koordinaten für jedes Objekt, also für alle 22 Spieler plus den Ball.

Beat Suter: Und wenn wir die Spielphilosophie des Fussballverbands anschauen, wir haben den Ball oder wir verlieren den Ball, dann geht es in erster Linie darum zu schauen, wer ist überhaupt im Ballbesitz. Also das sind dann so... Arbeitsschritte, wo wir einzelne Events wie den erobernden Ball oder den verlierenden Ball detektieren.

Beat Suter: Und so wird dann aus den Basisdaten den [00:10:00] XY-Daten, gibt es dann höherwertige Daten, die generiert werden, also sogenannte Event-Daten, wo dann ein Ballverlust detektiert wird ein Zuspiel Solche Sachen. 

Fabio Sandmeier: Jetzt zeigt Beat auf ein Diagramm das so lang ist, dass es sogar zwei A4-Seiten benötigt. Es ist ihre Datenpipeline. Hier sieht man, wie aus einfachen Daten höherwertige Daten werden.

Beat Suter: Ja, also das Ziel ist es ja, dem Analysten etwas zu geben, das er versteht. Wir haben das Videomaterial zum Spiel erhalten plus... Die XY-Roh-Daten und durch diese Pipeline erhalten wir dann gewisse Event-Daten, also wann gibt es einen Ballgewinn, wann ist welches Team im Ballbesitz und das kann man dann über einen Timestamp [00:11:00] mit dem Video Das ist dann was ein Analyst auch brauchen kann, wenn er auf ein Event klickt, das ihn interessiert und er es dann gleich im Video anschauen kann. 

Beat Suter: Es gibt aber auch viele andere Plattformen zum Beispiel Power BI, Um einfach nackte Daten dann auszuwerten und die basieren natürlich auch auf diesen Event-Daten. Also dann habe ich dann nicht mehr unbedingt das Video dabei, aber ich kann auch sonst einfach die Daten über eine zentrale Plattform analysieren und das war ja eigentlich auch Der grosse Pain-Point von unserem Auftraggeber.

Beat Suter: Er hat immer mit Excel gearbeitet, er hat Nächte verbracht, um die Daten zu analysieren und wir haben jetzt hier einen Prozess, der auch während des Spiels bereits diese Daten generiert [00:12:00] und die Daten sind dann auf einer zentralen Plattform und nicht mehr auf Notebook des Analysten.  

Fabio Sandmeier: Aus einfachen Daten werden höherwertige, also ihre Datenpipeline. Und so kann ich letztlich taktische Fragen beantworten. Aber wie lernen Data Scientists eigentlich, solche Prozesse zu entwickeln? Wie schafft man es, dass aus scheinbar chaotischen Daten klare Antworten werden? Genau das lernen die Studierenden im Master IDS an der Hochschule Luzern.

Fabio Sandmeier: IDS steht für Information and Data Science. Und unter anderem lernen sie das bei Martin Rumo.

Martin Rumo: So unterrichte ich das auch meinen Studenten. Also so diese Datenpipelines haben grundsätzlich drei Schritte Natürlich können mehrere dann innerhalb, aber drei [00:13:00] grobe Schritte Das erste ist die ganze Signalverarbeitung das haben wir gesehen. Wir bekommen ein Signal rein. Das heisst wir haben zum Beispiel die Koordinaten der Spieler und des Balls.

Martin Rumo: Irgendwie 25 mal pro sekunde aus dem kann man dann die geschwindigkeit berechnen die beschleunigung des balls der spieler und so weiter oder da wird vor allem auf signalebene wir haben da ein signal dann werden aus dem signal verschiedene events wie zum beispiel da hat ein sprint stattgefunden da wurde ein ball angenommen da wurde ein pass gemacht das sind dann Diskrete Events, die auch mit einem Timespam, aber das ist nicht mehr uniform alle 25, also 25 Mal pro Sekunde, sondern das ist einfach dann, wenn der Event passiert, dann wird er registriert.

Martin Rumo: Da werden ein paar Attribute dran gehängt, wie zum Beispiel das war ein Pass, der hat eine gewisse Länge, der hat eine [00:14:00] Richtung, der hat eine Geschwindigkeit, das kann man dann alles ablegen. Und dann ist das, was der Experte eigentlich möchte. Er möchte ja nicht Daten Was er will, ist Information. Und ich finde die Unterscheidung sehr, sehr wichtig.

Martin Rumo: Information ist alles, was auf eine Fragestellung antwortet. Daten sind einfach mal Daten. Aber ich extrahiere die Information, um auf eine Frage zu antworten Und das ist auch der Analytics Translation Prozess, der dann anfängt eigentlich mit den Fragestellungen. Was hat... Der Coach, der Trainer für Fragestellungen.

Fabio Sandmeier: Martin erzählt mir auch, dass die Studierenden bei ihm im Unterricht ein Stück weit ins kalte Wasser geworfen werden. Sie treffen nämlich Sportexpertinnen und Experten aus der Praxis und müssen ihnen helfen, eine Frage zu beantworten.

Martin Rumo: Sie lernen eigentlich in erster Linie diesen Prozess von Analytics [00:15:00] Translation. Ich bringe Experten rein, die sich in einer Sporart oder in einem Aspekt, Teilaspekt einer Sporart sehr gut auskennen, wie zum Beispiel einen Ein Strength & Conditioning Coach, der zum Beispiel beurteilen muss, ob Spieler überhaupt bereit sind, am Wettkampf teilzunehmen, pezialisten und und dann ein datenset wie zum beispiel aus trainings und und so die gps daten tracking daten wo ich sprints und beschleunigungen drin habe jetzt geht es darum was für informationen möchte der strength and condition coach aus diesen daten heraus haben wie hole ich die raus und wie stelle ich in Die am besten für ihn da ich das vorher gesagt habe das ist eine Co-Kreation wo sehr stark von diesem Dialog lebt also die richtigen Fragen stellen dann entsprechend [00:16:00] vielleicht einen Vorschlag machen präsentieren schauen wie er darauf reagiert Anpassungen machen das kann dann sehr auch iterativ sein 

Fabio Sandmeier: Was ich aus meinem Besuch in Schönbühl mitnehme, ist, man muss gut zuhören können. Und dass Data Science in der Praxis oftmals bedeutet, die richtigen Fragen zu stellen. Und ist die Frage einmal exakt formuliert, ist die Lösung nicht weit. 

Fabio Sandmeier: Und wenn dann alles zusammenkommt, Daten, Taktik und etwas Spielwitz, dann entsteht nicht nur ein Matchplan. Dann entstehen grosse Momente. Dann entsteht Gänsehaut.   

Fabio Sandmeier: Name ist Fabio Sandmeier. Das war Applied Data Science Unboxed ein Podcast der Hochschule Luzern. Mehr über den Master IDS erfährt ihr unter hslu.ch. Bis zum nächsten [00:17:00] Mal.