El pronóstico de resultados de competencias deportivas siempre ha sido un tema polémico, y en el caso del Mundial de Fútbol mucho más. Es un torneo corto que se juega únicamente cada 4 años, lo cual hace que muchos factores del momento influyan en el resultado y a su vez, que muchas estadísticas tradicionales de futbol no apliquen. Por ejemplo, no existe ventaja por cancha local o visitante, no existen resultados del año actual en la competencia (se compite cada 4 años), se presentan cambios importantes en los jugadores y directores técnicos durante los 4 años, todo esto hace que sea un torneo bastante impredecible.

Por otro lado, toda persona que tiene un gusto por el fútbol, tiene una buena intuición de cuales van a ser los resultados, hemos tratado de traducir esa intuición en términos de datos y vemos que nuestra intuición acerca de la fortaleza de una selección tiene que ver con la reputación histórica de la misma, es la forma en que decidimos a primera instancia quien va a ganar entre Brasil y Costa Rica, adicionalmente, para intuir el marcador apelamos a nuestra memoria de que tan goleadora es una selección, principalmente en función de los jugadores.

El equipo de científicos de datos de Noux, expertos matemáticos, tecnológicos y de negocio diseñaron un modelo matemático predictivo para pronosticar quienes serán los países vencedores de este mundial.

Para interpretar nuestra primera intuición con respecto a la reputación de una selección, la mejor data es el ranking de selecciones FIFA https://www.kaggle.com/tadhgfitzgerald/fifa-international-soccer-mens-ranking-1993now/data adicionalmente le aplicamos un peso al ranking de cada equipo con la información de los mercados de apuestas https://www.betfair.com/sport/football?id=5614746&competitionEventId=27232418&action=loadCompetition&modules=multipickavbId@1007&selectedTabType=COMPETITION , para tratar de capturar los eventos recientes hasta la fecha.

Para nuestra segunda intuición, con respecto a la capacidad goleadora de una selección, el histórico de goles que ha convertido cada selección, en todos sus partidos desde el 2008, sin contar partidos amistosos, https://www.kaggle.com/martj42/international-football-results-from-1872-to-2017/data es una buena fuente de data.

Una vez que tenemos estos datos, corremos una regresión donde queremos determinar, para cada selección, su potencial de goles en función de su ranking FIFA y su histórico de goles. Una vez que tenemos los resultados de la regresión vamos a cada partido y predecimos cuantos goles va a meter cada selección y en función de una distribución Poisson predecimos el resultado final, con esto construimos quien gana, empata o pierde, sumamos los puntos y tenemos a los dos primeros lugares de cada grupo.

Después corremos el mismo modelo en octavos de final, cuartos, semis y final, cuando se presenta un empate, tomamos la segunda mejor probabilidad fuera de un empate, para decidir quién gana el partido y avanza a las siguientes fases.

A continuación, te presentamos los resultados de nuestra predicción, te invitamos a que hagas tus propios intentos predictivos y compares con el nuestro.

¡Que gane el mejor y a disfrutar del mundial!

Los resultados del Mundial de acuerdo con el modelo de Noux:

 

Los 4 finalistas en el orden correspondiente usando únicamente el ranking FIFA para ganar los partidos:

1.       Alemania

2.       Brasil

3.       Portugal

4.       España

Los 4 finalistas en el orden correspondiente usando únicamente las probabilidades de Betfair para ganar los partidos

1.       Alemania

2.       Bélgica

3.       Francia

4.       España

Haz click en el botón de contacto a continuación si quieres conocer más acerca de lo que hacemos en Noux.