Logotipo de Zephyrnet

Cómo usar la teoría de grafos para explorar el fútbol

Fecha:

¡No todas las redes son sociales! La teoría de grafos flexionó sus músculos con el auge de las redes sociales. Pero, ¿qué puede hacer por el análisis deportivo? ¿Y si modelamos los pases de fútbol como una red? ¿Podemos saber qué equipo tiene más probabilidades de ganar? ¿Podemos identificar jugadores críticos para presionar al equipo contrario? ¿Podemos identificar oportunidades para mejorar el desempeño de nuestro equipo? 

Para averiguarlo, podemos usar la API de Statsbomb para acceder a datos gratuitos en cada pase en la Copa del Mundo 2018. 

Una 'red' es la palabra común para lo que la ciencia de datos llama un gráfico. En análisis, un gráfico es una forma formal de representar un grupo de objetos interconectados. Esto se toma prestado de las matemáticas, donde los gráficos se definen como pares ordenados que incluyen un conjunto de nodos y un conjunto de aristas.

La terminología tiene más sentido con un ejemplo. Veamos cómo se vería una gráfica de pases de fútbol:

 

Cómo usar la teoría de grafos para explorar el fútbol

 

Para nosotros, un gráfico de pases de equipo es la combinación de estos atributos para todos los partidos jugados por un equipo determinado en la Copa Mundial 2018. 

Ahora veamos qué tipo de análisis gráfico viene listo para usar. Estas son las métricas comunes que podemos usar para investigar las propiedades de la red de pases de un equipo o jugador determinado:

 

Cómo usar la teoría de grafos para explorar el fútbol

 

La centralidad del vector propio (EV) merece una explicación adicional. Implica el concepto de que no todos los nodos son iguales. Pondera cada nodo en función de su influencia relativa. Piense en una red social donde tenga una conexión confiable con Kim Kardashian. 

Este proyecto está codificado en Python usando Google Colaboratory y está disponible en GitHub. El flujo de trabajo es sencillo:

 

Cómo usar la teoría de grafos para explorar el fútbol

 

Use la API de Statsbomb para cargar los datos del evento de la Copa Mundial 2018. Filtre nuestros datos para retener solo los eventos que pasan. Luego cree gráficos ponderados dirigidos para cada uno de los 32 equipos usando los 34,580 28,292 pases observados durante el juego regular. Este número excluye XNUMX pases durante saques de banda, inicios de período, saques de esquina, etcétera. 

Usando métodos 'listos para usar' de la biblioteca NetworkX, calculamos análisis de gráficos básicos para cada equipo y jugador. Veamos algunos hallazgos:

 

Cómo usar la teoría de grafos para explorar el fútbol

 

Tres escuadrones se destacan en el análisis del equipo anterior. Brasil porque ganó en el papel. Se destacan por tener las mejores métricas de pase. Panamá está en el otro extremo del espectro. Francia se destaca porque ganó donde cuenta, en el campo. 

La clave para llevar es que La alta transitividad de la red de pases no garantiza ganar la Copa del Mundo, pero es la apuesta para llegar a las semifinales. Es como dice Billy Beane en Moneyball, “Mi s^%t no funciona en los playoffs. Mi trabajo es llevarnos a los jodidos playoffs. Lo que sucede después de eso es suerte”.

También evaluamos las métricas de la red de pases individuales para cada uno de los 598 jugadores. Toni Kroos subió a lo más alto medido por cercanía, centralidad y grado. Para ver si esto se verifica con evidencia observable, podemos buscar "Muerte de Toni Kroos" en YouTube. Esto arroja 6,240 resultados de video con títulos como: "El rey de los pases", "Pases largos precisos de francotirador", "¡Nadie pasa como Toni Kroos!" y "El arte de pasar". 

Ahora comparemos los dos equipos en los extremos. Brasil se destaca según lo cuantificado por la transitividad de la red de aprobación, que es una medida de qué tan estrechamente está conectado cada subgrupo de tres jugadores. Contrastaremos con Panamá que está en el otro extremo.

Podemos trazar la influencia de cada jugador en la red de pases del equipo en el eje y. Esto se basa en la centralidad del vector propio del jugador durante los partidos. Luego use el eje x para trazar la distancia promedio de pase campo abajo del jugador. Aquí está nuestra comparación de los dos equipos:

 

Cómo usar la teoría de grafos para explorar el fútbol

 

De inmediato vemos que los jugadores de Brasil están más agrupados en comparación con Panamá. Brasil utiliza pases más cortos y hay menos diferencia entre los pasadores más y menos influyentes. Como era de esperar, los backs defensivos (los nodos ligeramente sombreados) tienden a estar a la derecha de la trama con pases que viajan más hacia el campo.

El informe de exploración de Brasil podría sugerir intentar interrumpir a Neymar, que es el jugador más influyente en la red de pases del equipo. Pero esta trama indica que puede ser ineficaz porque no hay una brecha significativa con el resto del equipo. Sin embargo, vemos una gran ventaja entre Neymar y Countinho. Esto sugiere que obstruir las líneas de pase entre estos dos jugadores podría ser útil.

En comparación, el informe de exploración de Panamá destaca que Godoy, el mediocampista central derecho, es el jugador más influyente en la red de pases de Panamá. Poner más presión sobre Godoy puede tener un impacto negativo en el equipo.

Como prueba de concepto, vemos que el análisis gráfico puede ser útil en el fútbol para identificar jugadores influyentes y proporcionar mediciones cuantitativas de los estilos de pase tanto para equipos como para jugadores individuales. 

El código base completo, incluido el acceso a los datos, está disponible en: https://github.com/FauxGrit/Soccer-Graph-Analytics 

Bibliografía

[1] John Laschober y Amanda Harsy. “Análisis de las redes de pases en el fútbol”. vol. 1 N° 1 (2020): Matemáticas y Deportes. 

[2] Javier M. Buldú, Javier Busquets, Johann H. Martínez, José L. Herrera-Diestra, Ignacio Echegoyen, Javier Galeano y Jordi Luque. "Uso de la ciencia de redes para analizar las redes de pases de fútbol: dinámica, espacio, tiempo y la naturaleza multicapa del juego". Octubre 2018: Fronteras en Psicología. 

[3] Arriaza, Enrique & Martin-Gonzalez, Juan & Zuniga, Marcos & Flores, Josh & Saa, Y. & García-Manso, JM. (2017). “Aplicación de gráficos y redes complejas a la interpretación de métricas de fútbol. Ciencias del movimiento humano”. 57. 10.1016/j.humov.2017.08.022.

[4] Benito Santos A, Theron R, Losada A, Sampaio JE, Lago-Peñas C. "Análisis de rendimiento visual basado en datos en el fútbol: un prototipo exploratorio". Psicología frontal. 2018 de diciembre de 5; 9:2416. doi: 10.3389/fpsyg.2018.02416. PMID: 30568611; PMCID: PMC6290627.

[5] Brandt, Markus y Ulf Brefeld. "Enfoques basados ​​en gráficos para analizar la interacción del equipo en el ejemplo del fútbol". MLSA@PKDD/ECML (2015).

 
 
matt semrad es líder en análisis con más de 20 años de experiencia en el desarrollo de capacidades organizacionales en empresas de tecnología de alto crecimiento.
 

punto_img

Información más reciente

punto_img