El equipo de análisis deportivo de Minnesota llega a la final de la competencia 'Big Data Bowl' de la NFL

El día antes de que la NFL anunciara a los ganadores de su competencia anual Big Data Bowl, Marc Richards fue a su página de Twitter y configuró una notificación para cualquier tweet nuevo del director de análisis de la liga, Michael Lopez, basado puramente en la esperanza y una corazonada.

El nativo de Plymouth envió una nota a Jack Werner, su amigo de San Olaf y uno de los tres habitantes de Minnesota en su equipo Big Data Bowl, diciendo: 'No sé, podríamos tener una oportunidad aquí'.

Minutos después de López anunció los cinco ganadores La mañana del 5 de febrero, Richards transmitió la noticia y puso nervioso al grupo.

'¡Ganamos!' escribió, en un mensaje de texto que enlazaba con el anuncio de López.

Dios mío, respondió Werner.

Sam Walczak, el tercer Minnesotan del equipo, respondió: 'Espera ... ¿ganamos $ 15K?'

Lo que comenzó como una labor de amor por los tres amigos de St. Olaf y Wei Peng, a quienes Richards conoció en su doctorado. programa de estadística en la Universidad de Pittsburgh - se convirtió en una oportunidad para mostrar su trabajo a nivel nacional. La NFL nombró al grupo uno de sus cinco finalistas en la división abierta de la tercera Tazón de Big Data, una competencia en analítica deportiva avanzada.



El grupo ganó $ 15,000 y presentará es trabajo , que utilizó datos de seguimiento de jugadores de la NFL para identificar tipos de coberturas defensivas y evaluar el desempeño de los jugadores, a los ejecutivos de la liga el 18 de marzo con la posibilidad de ganar otros $ 10,000. La presentación se transmitirá en YouTube, Twitch y la aplicación NFL.

Richards, Walczak y Werner asistieron a la escuela secundaria en los suburbios de Twin Cities y se conocieron como estudiantes en St. Olaf, donde formaron parte de un grupo que se unió por su interés en la analítica deportiva. Empezaron Modelo 284 , un sitio web para mostrar algunos de sus trabajos de ciencia de datos en deportes profesionales.

Peng, quien creció en China, era un fanático del fútbol y no había visto mucho fútbol hasta que Richards lo invitó a una fiesta para el Super Bowl de los Chiefs-49ers en 2020.

'Le gusta decir que lo engañé para que viera la NFL y el fútbol, ​​para que pudiéramos hacer la competencia Big Data Bowl juntos', dijo Richards. Simplemente pensamos: 'Con los tiempos de COVID, necesitamos algo que hacer en lugar de salir a comer los fines de semana'. Intentemos abordar esto '. '

•• •

La NFL dio Tazón de Big Data Los concursantes acceden a los datos de seguimiento de jugadores de la temporada 2018 y les solicitan que desarrollen formas de medir el rendimiento defensivo.

Peng, Richards, Walczak y Werner primero construyeron un modelo para determinar si un jugador estaba en cobertura de hombre o zona, según cómo estaban alineados en el centro y cómo se movían una vez que se hacía el centro. Eso les permitió agrupar las asignaciones de cobertura en diferentes grupos, construir un modelo que predice cuántos pases deben completarse en función de qué tan cerca está un defensor en la cobertura y evaluar el rendimiento del jugador frente a esas expectativas.

Se reunieron semanalmente en Zoom para discutir su proyecto y repartirse las tareas individuales. Peng desarrolló un algoritmo que ayudaría al grupo a identificar asignaciones defensivas en cada cuadro de una obra determinada.

La pandemia les dio a Peng y Richards un descanso de invierno prolongado para dedicar horas extra al proyecto, mientras que Walczak y Werner contribuyeron varias horas a la semana en sus trabajos para Holborn Corp. y Wells Fargo en las Ciudades Gemelas.

¿Cuántas horas en total dedicó el grupo desde octubre hasta su presentación final en enero?

'Lo suficiente para ser menos del salario mínimo cuando lo desglosas', dijo Richards riendo.

Sin embargo, el dinero no fue el principal motivador.

'Para mí, fue una buena manera de mantenerme en contacto con amigos que ahora están en diferentes ciudades, y a quienes realmente no estás viendo de todos modos debido a la pandemia', dijo Werner. 'Es bueno tener un proyecto semanal en el que trabajar'.

Después de anunciar a los ganadores en Twitter, López señaló un diagrama de una finalización de Matt Ryan a Julio Jones del proyecto del grupo, que predijo a dónde iría Ryan con el balón en función de dónde miraba el mariscal de campo de los Atlanta Falcons durante cada décima de partido. un segundo en la obra.

Lopez tuiteó: '¿Qué tan genial es este hallazgo? Puede ver la probabilidad objetivo del cambio de los Falcons ** debido a la orientación de Matt Ryan **. Hay alrededor de 8 o 10 hallazgos asombrosos de los proyectos de este año que quiero compartir, pero este me hizo pensar dos veces ''.

Durante la presentación final del grupo al personal de la NFL el próximo mes, parece que se enfrentará a una pregunta que los entrenadores suelen plantear sobre los modelos basados ​​en datos para evaluar a los jugadores: ¿Cómo puede alguien decir si un jugador tenía razón o no sin conocer la asignación del jugador en una jugada determinada?

No vamos a estar al 100 por ciento, como, 'Esto es exactamente lo que se supone que debe hacer este defensor'. Pero lo que estamos haciendo aquí es que estamos creando modelos que ahora alguien no tiene que sentarse y ver toda la película, o podemos deshacernos de parte del trabajo para hacer eso '', dijo Richards. 'Tal vez no estemos 100 por ciento en lo correcto, pero estamos como 90 por ciento u 85. Estamos mejor que 50-50, nos estamos acercando a la respuesta correcta y estamos compensando el tiempo para hacer eso'.

•• •

Después de que Peng se gradúe esta primavera, se unirá a una startup de Pittsburgh que trabaja con datos y aprendizaje automático para detectar el cáncer en sus primeras etapas. Su afición al fútbol es relativamente nueva, pero después del Big Data Bowl, vio el Super Bowl de este año a un nivel más matizado.

'Ahora, cuando veo un partido, trato de ver si tenemos las asignaciones defensivas [correctas] en nuestro proyecto', dijo Peng. “Quiero ver si esta tarea tiene sentido o no en la práctica. Estoy más concentrado en el equipo defensivo que en la ofensiva '.

Richards, que había participado anteriormente en una competencia de datos de la NHL, pasará el verano como pasante en ciencia de datos para el Oklahoma City Thunder, y Walczak está trabajando en una maestría en ciencia de datos en la Universidad de Minnesota.

Queda por ver si alguien en el grupo seguirá una carrera en el análisis deportivo, pero el Big Data Bowl probablemente no será la última vez que ninguno de ellos use sus habilidades para brindar una nueva perspectiva de los juegos que ven.

'Al igual que las cosas de Big Data Bowl, disfruto desarrollando nuevos algoritmos, o simplemente tomando datos y aplicando algoritmos para resolver problemas del mundo real', dijo Richards.

Encuesta deportiva de Star Tribune: ¿Irás a los juegos cuando los fanáticos tengan permiso?

Encuesta deportiva de Star Tribune: ¿Irás a los juegos cuando los fanáticos tengan permiso?

Ha pasado casi un año desde que los aficionados pudieron asistir a eventos deportivos en grandes cantidades. Cuéntanos qué te estás perdiendo de los deportes en vivo.