Título
mlSoccer: ferramenta baseada em aprendizagem automática para investigar fatores que influenciam o sucesso do passe
Autor
Muacho, Hugo Vítor Carapinha
Resumo
pt
Esta dissertação tem como principal objetivo compreender e investigar, através de árvores de decisão e máquinas de vetores de suporte, os fatores que influenciam o sucesso do passe. A metodologia utilizada é o CRISP DM, usando três iterações do seu ciclo de vida. Na primeira iteração utilizaram-se as variáveis: área do Voronoi, distância à baliza e variável de saída a continuação da posse de bola. Segundo o especialista consultado, os resultados estavam longe do esperado. Na segunda iteração é utilizada a mesma base de dados, considerando o penúltimo e último evento (passe) da jogada. Nesta fase não foram encontradas ligações entre a distância à baliza e área total do Voronoi no sucesso ou não do passe.
Na última iteração são realizadas três experiências com diferentes conjuntos de dados obtidos da mesma base de dados: um contendo dados posicionais e área de Voronoi dos jogadores, outro contendo somente os dados do jogador que executa o passe, o terceiro considerando o portador da bola e os companheiros e adversários mais próximos. Os resultados obtidos do primeiro conjunto de dados indicam que a importância relativa das variáveis é dependente do jogo e de alguma forma relacionada com a formação das equipas e missão tática dos jogadores. No segundo conjunto de variáveis os resultados indicam que as variáveis mais importantes são a área do Voronoi e a distância à baliza sendo as coordenadas dos jogadores pouco relevantes. O terceiro conjunto, mais diretamente relacionado ao processo de aprovação, proporcionou uma classificação mais consistente das características. Valores baixos da medida F e precisão mostram que as variáveis e os fatores que levam ao sucesso da aprovação são de fato elusivos.
en
This dissertation has as main objective to understand and investigate, through decision trees and support vector machines, the factors that influence the success of the pass. The methodology used is CRISP DM, using three iterations of its life cycle. In the first iteration the following variables were used: Voronoi area, distance to goal and output variable the continuation of possession. According to the expert consulted,
the results were far from what was expected. In the second iteration the same database is used, considering the penultimate and last event (pass) of the play. At this stage no links were found between the distance to the goal and total area of the Voronoi in the success or not of the pass. In the last iteration three experiments are performed with different data sets from the same database: one containing positional data and Voronoi area of all players, another containing only the data of the player performing the pass, the third considering the ball carrier and the closest teammates and opponents. The results obtained from the first set of data indicate that the relative importance of the variables is game dependent and somewhat related to the formation of the teams and tactical mission of the players. In the second set of variables the results indicate that the most important variables are the Voronoi area and the distance to the goal with the players’ coordinates being of little relevance. The third set, more directly related to the approval process, provided a more consistent classification of characteristics. Low values of the F-measure and hit show that the features and factors that lead to successful passing are indeed elusive.