¿Existen diferencias entre las cuatro principales ligas de fútbol europeas? Un análisis mediante Inteligencia Artificial

Investigadores de la Universidad Politécnica de Madrid han aplicado técnicas de IA para identificar patrones de juego entre las ligas europeas, predecir resultados y ayudar a mejorar el rendimiento de los equipos.

7.11.22

Analizar y comprender el juego en los deportes de equipo, mediante la evaluación de los factores asociados al éxito, resulta fundamental para mejorar el rendimiento de los clubes. Conscientes de esta premisa, investigadores de la Universidad Politécnica de Madrid han llevado a cabo un estudio en el que, a través de Inteligencia Artificial (IA), han analizado las cuatro mejores ligas de fútbol europeas, permitiendo conocer la evolución de los equipos en cuanto a su juego y predecir los resultados.

El objetivo de este estudio, en el que han participado investigadores de la Facultad de Ciencias de la Actividad Física y el Deporte (INEF) de la UPM, junto con profesionales de la Escuela Técnica Superior de Ingenieros Informáticos, era analizar la evolución de las cuatro ligas más importantes e identificar si existen diferencias entre la Premier League inglesa -tomada como referencia porque en 2019 las dos principales competiciones europeas de clubes fueron disputadas por equipos de esta liga- y el resto de las principales ligas europeas: LaLiga española, la Serie A italiana y la Bundesliga alemana.

“El sector de las estadísticas de fútbol ha evolucionado de forma espectacular en los últimos años, gracias a las tecnologías de seguimiento automático o semiautomático que proporcionan flujos de datos de alta fidelidad. La Inteligencia Artificial incluye el conjunto de herramientas y técnicas para poder procesar la enorme cantidad de datos disponibles”, explica Moisés Marquina, uno de los investigadores de INEF que ha participado en este estudio.

El uso de la Inteligencia Artificial aplicada al mundo del deporte permite no solo describir, sino también predecir y, lo que es aún mejor, prescribir, “ayudando a determinar cómo puede comportarse un equipo con determinados jugadores y entrenadores. Estas herramientas ayudarán a los entrenadores a potenciar determinados modelos de juego, identificando cuáles son los ganadores, qué variables potenciar en los equipos para los modelos exitosos y así conocer los diferentes estilos de juego para la preparación de los partidos”, explica Marquina.

Un análisis de 5.000 jugadores

En la temporada 2020-2021, la UEFA señaló que LaLiga española, la Premier League inglesa (EPL), la Serie A italiana y la Bundesliga alemana son las mejores competiciones domésticas europeas, en función de los resultados de cada club en las competiciones de la Liga de Campeones y la Europa League durante las cinco temporadas anteriores.

En base a esa idea, los investigadores de la UPM emplearon Inteligencia Artificial para poder analizar la información y predecir resultados. Los datos obtenidos para el estudio, correspondientes a las temporadas 2014/15 a 2018/19, fueron proporcionados directamente por la empresa OPTA Sportsdata España.

Las estadísticas de equipo se calculan sumando las estadísticas individuales de los jugadores que pertenecen a cada club. Tras filtrar esas temporadas y competiciones concretas sobre los datos brutos, el equipo trabajó sobre unos 5.000 jugadores diferentes, pertenecientes a más de 100 equipos distintos, debido a los descensos y ascensos a lo largo de las temporadas. El número total de partidos analizados supera los 600. Para llevar a cabo el análisis de los datos obtenidos, se definió un subconjunto de variables de juego, un total de 52 variables calculadas para cada jugador que se distribuyeron en acciones ofensivas, defensivas y de construcción de juego.

Con el objetivo de comprobar la evolución de las ligas, se utilizó la técnica de reducción de la dimensionalidad t-SNE. Como se pretendía comprender mejor las diferencias entre ligas y equipos, las variables más discriminantes se obtuvieron como un conjunto de reglas descubiertas por RIPPER, un algoritmo de aprendizaje automático.

“Con la IA es posible ir más allá del conocimiento, ya que permite, con una buena traducción de datos de calidad, llegar y confirmar pruebas que no se pueden percibir. La IA es capaz de analizar miles de datos en cuestión de minutos y tener en cuenta las posibles actualizaciones de los mismos. Gracias a la Inteligencia Artificial se permite la automatización de los procesos, al tiempo que se reducen los errores humanos y se mejora la precisión”, indica Marquina.

Predecir lo imprevisible

A través de la investigación realizada, el equipo de la UPM ha obtenido diversas conclusiones sobre el juego de las principales ligas europeas.

En la temporada 2014-2015, se aprecia una clara diferenciación entre las cuatro ligas. Solo algunos de los equipos de primera categoría europea se agruparon a pesar de pertenecer a diferentes ligas. En la temporada 2016-2017, los equipos de clase media y baja (aquellos que rara vez aparecen en las competiciones europeas de clubes) todavía se pueden distinguir claramente por sus estadísticas. Sin embargo, las diferencias entre los equipos de clase alta europea se redujeron. En el caso de la EPL, equipos como el Arsenal, el Manchester City, el Liverpool, el Chelsea, el Tottenham y el Manchester United están muy alejados de otros como el Bournemouth, el Southampton y el Everton. En la liga alemana, en la Serie A italiana y en LaLiga también se aprecia esta separación.

En la temporada 2018/2019, las anteriores grandes particiones desaparecen, para dar paso a un gran grupo homogéneo donde encontramos a la mayoría de los equipos de LaLiga, Serie A y Bundesliga. Además de este grupo homogéneo, también encontramos un gran clúster de equipos de la EPL, donde es posible distinguir aquellos que suelen terminar en la mitad inferior de la tabla, como el Brighton o el Newcastle y, en el lado opuesto, un grupo con equipos de un nivel muy alto de la EPL, como el Chelsea, el Liverpool o el Manchester City.

Dentro de este grupo homogéneo, se observa que los equipos con mayor potencial económico y que suelen liderar las ligas están más cerca unos de otros, independientemente de la competición a la que pertenezcan. En el extremo opuesto se encuentran equipos con escaso potencial económico, que suelen luchar por evitar el descenso. Esto indica que a través de las estadísticas también se puede conocer “aproximadamente” el nivel de los equipos.

Tras dividir los equipos en grupos de interés, el algoritmo RIPPER permitió definir algunas de las características de los equipos de la EPL frente al resto de las ligas principales: destacan por realizar menos pases largos, por jugar más verticalmente, aún a costa de perder precisión, y por regatear más.

No obstante, los investigadores han concluido que, “más allá de la comparación entre ligas, hay diferencias entre los mismos conjuntos en las mismas ligas. Esto demuestra que hay diferentes estilos, no solo entre competiciones sino también entre la misma liga”, apunta el investigador de INEF, que concluye: “Con estas nuevas técnicas, además de describir lo que ocurre en el terreno de juego, es posible predecir e intentar anticipar lo que va a pasar en un deporte altamente imprevisible”.

García-Aliaga, A., Marquina Nieto, M., Coterón, J., Rodríguez-González, A., Gil Ares, J., & Refoyo Román, I. (2022). A Longitudinal Study on the Evolution of the Four Main Football Leagues Using Artificial Intelligence: Analysis of the Differences in English Premier League Teams. Research Quarterly for Exercise and Sport, 1–9. https://doi.org/10.1080/02701367.2021.2019661