Beleza, pessoal! Hoje vou contar pra vocês sobre uma parada que fiz, meio na correria, mas que no fim das contas deu um resultado bacana: “corinthians messi”. Não se assustem, não é que o Messi virou corintiano (quem sabe um dia, né?), mas sim um projetinho pessoal que inventei de fazer.

Tudo começou quando eu tava fuçando uns dados do Brasileirão. De repente, me veio a ideia: “E se eu tentasse criar um modelo pra prever quem seria o ‘Messi’ do Corinthians?”. Tipo, aquele cara que desequilibra, que faz a diferença no time.
Primeiro passo: Coletar os dados. Peguei tudo que consegui: estatísticas de jogadores, passes, finalizações, desarmes, sei lá, um monte de coisa! Usei umas APIs de futebol que achei na internet e também raspei uns sites que tinham informações interessantes. Deu um trampo danado, mas consegui montar uma base de dados razoável.
- Segundo passo: Limpar os dados. Essa parte é sempre a mais chata, né? Tinha dado faltando, dado errado, um caos! Usei Python com Pandas pra dar uma geral e deixar tudo bonitinho. Confesso que gastei um tempão aqui.
- Terceiro passo: Escolher as variáveis. Decidi quais estatísticas seriam mais relevantes pra identificar um jogador “Messi”. Chutei algumas, testei outras, fiz umas combinações… Foi meio na tentativa e erro, mas cheguei num conjunto que parecia fazer sentido.
Depois de ter os dados limpos e as variáveis escolhidas, chegou a hora de usar o machine learning. Quarto passo: Rodei uns algoritmos de clustering pra ver se conseguia agrupar os jogadores por características parecidas. Usei o KMeans, que é o mais simples, mas que já deu um resultado interessante.
Quinto passo: Analisar os resultados. O algoritmo me deu uns grupos de jogadores, e aí eu fui ver qual grupo tinha as características que eu considerava mais importantes pra um “Messi”. Tinha um grupo com jogadores que finalizavam muito, outro com jogadores que driblavam bem, e por aí vai.
O Resultado
No fim das contas, o modelo apontou um jogador (não vou falar o nome pra não criar expectativas exageradas, haha!). Lógico que não é uma previsão perfeita, mas foi divertido ver o que o algoritmo “pensou” sobre quem poderia ser o cara que faz a diferença no Corinthians.
Sexto passo (e o mais importante): Compartilhar com a galera! Achei legal mostrar pra vocês como dá pra usar dados e um pouco de machine learning pra tentar entender melhor o futebol. É claro que não é uma ciência exata, mas é uma forma interessante de explorar o esporte que a gente tanto ama.
E aí, curtiram? Se tiverem alguma dúvida ou sugestão, deixem aí nos comentários! Quem sabe a gente não faz um “corinthians messi 2.0” no futuro?