¿Quién será el campeón de la Euroliga 2021-22 según “Pitágoras”?

Si te apasiona el mundo del Big Data, en este post tratamos de adivinar quién será el campeón de la Euroliga según las matemáticas.

iSportCoach

¿Te gustaría adivinar el campeón de la Euroliga? ¿Crees que el Big Data puede ayudarnos a descifrar quién será el ganador? En este post descubrirás cómo las Matemáticas pueden ayudar a descifrar el enigma de quién será el campeón de la Euroliga 2021-22 según “Pitágoras”, o mejor dicho, la expectativa pitagórica.

LAS MATEMÁTICAS Y EL DEPORTE

Uno de los pocos acuerdos que hay entre todos los estamentos del deporte, incluso entre los aficionados, son los fríos y objetivos datos.

Todos quieren saber, tomar decisiones, desatan sus pasiones, etc. en base al resultado final; todos buscamos datos de nuestro jugador favorito para comprobarlo con otro y saber si podemos clasificarlo como una leyenda o no.

Los entrenadores ayudantes analizan datos, vídeos, etc. para conocer al rival y establecer sus patrones de juego, etc. Estos y muchos otros ejemplos nos muestran como la información basada en datos es parte esencial de cualquier deporte.

El deporte se explica en datos y los datos han llegado para quedarse incluso en categorías de formación.

J. Miguel Contreras

En las últimas décadas el deporte se ha beneficiado de la Estadística Avanzada, el Big Data y en especial de la Ciencia de Datos para alcanzar metas no asequibles desde las metodologías tradicionales; reconociendo el valor del enfoque cuantitativo de cualquier deporte (Alamar, 2013) y del papel del “sports analyst” dentro del “sport science” (French y Torres, 2021).

Son muchas las vertientes que encontramos sobre este campo, desde la detección de posibles lesiones (Hübscher et al., 2010) a la mejora del rendimiento en función de variables psicológicas (Bourbousson et al., 2010), pasando por múltiples cuestiones donde el analista de datos procederá a extraer conocimiento de los datos a partir de la recopilación de la información que estos contienen, el procesamiento de estos, el uso de múltiples metodologías estadísticas, matemáticas, de minería de datos, etc., y la interpretación y explotación de los resultados.

¿Y si pudiéramos predecir el porcentaje de victorias de un equipo?

En este artículo mostramos un ejemplo de cómo podemos predecir el porcentaje de victorias de un equipo en una temporada, a partir de la información histórica de esa competición.

La Expectativa Pitagórica fue propuesta por Bill James, como ecuación para estimar el porcentaje de partidos de béisbol que un equipo debería haber ganado en función de las carreras realizadas y recibidas. Su formulación clásica es la siguiente:

Expectativa pitagórica. Big Data. ¿Quién será el campeón de la Euroliga 2021-22 según "Pitágoras"?

Esta ecuación se ha comprobado como eficaz para medir el rendimiento real, no solo de los equipos de béisbol, sino también con otros deportes, tales como el criquet, fútbol americano, hockey sobre hielo, fútbol o el que nos ocupa, el baloncesto.

En los últimos años han aparecido diferentes adaptaciones de esta ecuación buscando una mayor precisión de los resultados y un mayor ajuste a determinados deportes, y eso se hizo ajustando el exponente (el resultado final que aseguraba la victoria). Éste es el caso de:

Ecuación de Clay Davenport y David Smyth y Daryl Morey. ¿Quién será el campeón de la Euroliga 2021-22 según "Pitágoras"?

El método de predicción aplicado a la Euroliga Masculina

En consecuencia, se pretende comprobar como funcionan estos modelos con datos reales del baloncesto FIBA, que, como de todos es sabido, difiere del baloncesto norteamericano en algunos aspectos que afectan a la puntuación, en especial el tiempo de juego o los tipos de defensas que en este se permiten.

Para ello se han tomado los datos históricos de la Euroleague, disponibles en la web oficial de la liga, compuestos por los resultados de todos los partidos disputados en la competición desde su creación en la temporada 2000-2001.

En resumen, se han analizado un total de 21 temporadas, 4922 partidos y 84 equipos. Tomando como variables las puntuaciones anotadas y recibidas de cada partido, así como la variable victoria (1 ganado, 0 perdido), se han calculado el global del “Porcentaje de victoria” y la “Expectativa pitagórica” (clásica) de cada equipo participante en alguna temporada de la competición.

Una de las técnicas básicas, pero que proporcionan mejor rendimiento e interpretabilidad, para el modelado estadístico del comportamiento de una variable continua en función de una o varias variables predictoras, es la regresión lineal.

Balón de la Euroleague. ¿Quién será el campeón de la Euroliga 2021-22 según "Pitágoras"?
Balón de la Euroleague

EXPECTATIVA PITAGÓRICA Y PROPORCIÓN DE VICTORIAS

Esta técnica describe la relación entre la variable dependiente, en nuestro caso la “Proporción de victorias” (PV), en función de una u otras variables independientes, en nuestro primer ejemplo la “Expectativa pitagórica” clásica (EPC).

Es decir, queremos representar la proporción de victorias (Y) en función de la expectativa pitagórica clásica  (X) mediante la  recta: . Donde los  representan los coeficientes de regresión (término independiente y pendiente de la recta) y  el error debido a la aleatoriedad del modelo.

Curso de Analista de Datos de Estadística Avanzada.
Curso de Analista de Datos

Calculado la recta de regresión lineal a partir de los datos definidos anteriormente, se ha obtenido la ecuación:  Con un coeficiente de determinación ; es decir, la proporción de la variación de la “Proporción de victorias” explicada por el modelo es del 84,15%; y un R2 ajustado de 0.8396.

Los resultados obtenidos muestran un modelo bastante razonable, que relaciona las dos variables de estudio y que sirven para modelizar el comportamiento de estas.

Se han comparado los cuatro modelos definidos en el epígrafe anterior para comprobar cuál se ajusta más a los datos.

Además, se han incluido dos modelos que tienen en cuenta únicamente las puntuaciones en cada parte del partido y se han creado uno que relaciona las puntuaciones generales con la obtenida en las partes, y otro que vincula dichas puntuaciones generales con la de los cuartos.

RESULTADOS ESTADÍSTICOS PARA DETERMINAR EL CAMPEÓN DE LA EUROLEAGUE

Los resultados (Tabla 1) nos indican que, de los modelos de la literatura tradicionales, es el de Clay Davenport el que mejor se ajusta a los datos de la Euroleague.

Sin embargo, este dista en casi un punto de los dos modelos que tienen en cuenta la información intermedia de los partidos.

El R2 ajustado nos muestra que el modelo que tiene en cuenta los cuartos, con más información que el anterior, mejora la bondad del ajuste real sin penalizar la inclusión de esta información.

Para finalizar el ejemplo, se han realizado las predicciones de la proporción de victorias para los equipos que disputarán la temporada 2021-2022 de la Euroleague Basketball en función de tres de estos modelos: el clásico de Bill James, el de Clay Davenport y el que relaciona las puntuaciones totales con las obtenidas en los cuartos.

Los resultados, omitiendo al AS Mónaco del que no tenemos información histórica en esta competición, se muestra en la Tabla 2.

Estas ecuaciones se han revelado eficaces para medir el rendimiento real en varios deportes, también en el baloncesto.

José Miguel Contreras García

¿QUIÉN GANARÁ LA EUROLEAGUE 2021-22?

Los datos muestran que, para todos los modelos, será el equipo de Dimitri Itoudis, el CSKA el que mayor porcentaje de victorias consiga en la próxima temporada (Play Off y Final Four incluidos), seguidos del F.C. Barcelona y Real Madrid.

Pero, teniendo en cuenta que los datos son históricos, y dado que hay equipos que han tendido grandes épocas en la competición, por lo que sus predicciones pueden estar sobreestimadas, debería considerarse como referente aquellos equipos con predicciones superiores al 0.5 de proporción de victorias como posibles candidatos a título de este año.

Dimitri Itoudis, coach de CSKA de Moscú en Euroleague en la clase de Procoach de SportCoach. ¿Quién será el campeón de la Euroliga 2021-22 según "Pitágoras"?
Dimitri Itoudis, coach de CSKA de Moscú en Euroleague

CONCLUSIONES SOBRE QUIÉN SERÁ EL CAMPEÓN DE LA EUROLEAGUE

Como conclusión, indicar que este tipo de modelos nos permiten predecir comportamientos; en este caso la proporción de victorias, teniendo en cuenta cierta información disponible desde la finalización del encuentro.

Sin embargo, existe mucha otra información que puede ser utilizada para tales fines (datos históricos, play-by-play, datos en vivo, etc.) que mejoren la viabilidad de los modelos existentes o respondan a otras preguntas de investigación que el mundo del deporte nos proponga.

Esperamos que os haya sido entretenido este post.


Sobre el autor

José Miguel Contreras para SportCoach Academy. El campeón de la Euroliga 2021-22 será....(según la expectativa pitagórica)

José Miguel Contreras García

  • Profesor Titular de la Didáctica de la Matemática en la Universidad de Granada. También ha impartido la asignatura “Didáctica de la Estadística” en el Máster de Didáctica de la Matemática de dicha Universidad. Ha dirigido numerosos proyectos de innovación docente e investigación

Post relacionado: Emprendimiento, estadísticas y futuro en Sport Science

Formación recomendada: Curso de Analista de Datos Nivel 1

Artículos relacionados