[ARTIGO] Medalha de Ouro para os Dados


Fonte: BI na Prática

Por Grimaldo Oliveira


Quando as olimpíadas foram criadas o seu idealizador, Pierre de Coubertin, imaginava que a busca pelas medalhas seria o enfrentamento do mais forte pelo mais fraco, do mais dedicado versus o mais espirituoso. Disputa esta que seria realizada no campo do chamado "espírito olímpico", onde os mais preparados estariam sempre subindo no púlpito para receber suas honrarias.






Agora as coisas mudaram, nem sempre quem está mais preparado fisicamente, mentalmente e esportivamente pode se considerar em vantagem para ganhar uma medalha olímpica. Hoje os competidores contam com a ajuda de um treinador muito preparado que pode explicar o que acontece com cada participante em uma determinada competição. Esse treinador se chama dados.

Quando o goleiro da seleção olímpica brasileira Weverton terminou o jogo contra a fortíssima Alemanha, disse ao defender a última bola chutada: “Eu sabia que o jogador Petersen tinha chutado n-vezes no canto esquerdo nos últimos jogos e outras n-vezes no canto direito, portanto tentei defender o pênalti conforme os dados que eu já tinha em mente”. O que o nosso inteligente goleiro e a comissão técnica fizeram foi avaliar como a seleção olímpica alemã batia os seus pênaltis, jogador por jogador e quais seriam os lados da trave mais prováveis de defesas, e isso foi decisivo.
24 horas por dia somos abarrotados por uma avalanche de dados da internet e do nosso cotidiano (mensagens por celular, compromissos agendados, compras, etc.). No esporte isso não é diferente. Há diversas fontes que podem ser utilizadas para melhorar o nosso desempenho em quadra ou campo, ajudando no entendimento de como o nosso adversário se comporta e quais são os seus pontos fortes e fracos. No basquete, por exemplo, os treinadores gostariam de saber como marcar as melhores cestas de três pontos. Como poderíamos chegar a estas conclusões? Simplesmente estudando os dados dos jogos e inferir:

“As cestas de três pontos são provavelmente marcadas por atacantes que possuem 2,1 metros, que estão no fundo da quadra e possuem como marcadores adversários com até 1,8 metros e lançam a bola com a mão direita”

Existem diversos sites que publicam estes dados ou estatísticas dos jogos, incluindo o próprio comitê olímpico odf.olympictech.org. Porém, para compreender e melhor analisar esses dados, precisamos entender de assuntos como padrão dos dados, modelos matemáticos e estatísticos, probabilidades, tendências, dentre outros.

No mercado há uma série de ferramentas disponíveis para estudo destes dados. Uma das mais utilizadas é a Linguagem de programação R, criada por Ross Ihaka e por Robert Gentleman no departamento de Estatística da Universidade de AucklandNova Zelândia. Foi desenvolvido de forma colaborativa por várias pessoas no mundo, possuindo diversos programas encapsulados em pacotes matemáticos que são utilizados em processos estatísticos e na ciência de dados, que possui forte embasamento na conhecida Mineração de Dados ou Data Mining. Podemos resumir a Mineração de Dados como:

“Processo de extração de informações, sem conhecimento prévio em um grande banco de dados, das características dos dados e seu uso são para tomada de decisões”




Na Mineração de Dados as respostas começam a serem traçadas. Há diversas maneiras que podem ser utilizadas para extrairmos as saídas aos vários questionamentos, tudo isso por meio do uso das técnicas, tarefas e seus algoritmos. Com tudo, é necessário antes de mais nada, compreender as fases para minerarmos com precisão os dados. São elas:

Definição do problema: Definimos quais serão os dados que iniciaremos o processo de descoberta, podendo ser incrementados à medida que vão surgindo novas conclusões. Para nosso exemplo, baixar todos os dados sobre os pênaltis marcados em todos os jogos do campeonato brasileiro de 2015.

Data Mining: uso do ferramental e do processo de mineração de dados para escolha da melhor técnica e tarefa que nos leve a identificar padrões e probabilidades sobre os dados. Continuando com nosso exemplo, escolheremos a técnica de árvore de decisão e a tarefa de classificação para analisarmos os jogadores e as batidas de pênaltis.

Análise das relações descobertas: Com as primeiras conclusões podemos entender o que os dados querem “dizer”. Podemos concluir que os jogadores ao marcarem os pênaltis, a maioria chuta com a perna esquerda, no canto direito do goleiro, no alto da trave. Os atributos: perna que chuta, canto que sofre o gol, e local da trave que o pênalti é batido, são considerados importantes na análise.

Aplicação das regras descobertas: Com as conclusões encontradas, os treinadores podem conversar com os seus batedores de pênaltis e solicitarem que sigam o padrão das batidas de pênaltis mais assertivas conforme a análise dos dados.

Análise dos resultados: Com o passar dos jogos, com os jogadores instruídos e com os pênaltis sendo realizados conforme a orientação ora passada, é momento de analisar se houve mais sucesso do que fracasso nas batidas de pênaltis. Caso seja necessária inserções de novos atributos ou novos dados, o ciclo deste processo recomeça.

A ciência esportiva evoluiu muito, os atletas estão mais preparados e fisicamente mais fortes, contudo a necessidade de auxílios extra preparação são importantes para que estes garantam uma maior assertividade nos seus resultados. A ciência dos dados é um destes meios "extracampo" que está disponível ao alcance de todos, auxiliando no alcance de objetivos, e quem sabe, na conquista da almejada medalha de ouro.




Compatilhe no Google Plus

Sobre Grimaldo Oliveira

Mestre pela Universidade do Estado da Bahia (UNEB) no Curso de Mestrado Profissional Gestão e Tecnologias Aplicadas à Educação (GESTEC) com o projeto “GESMOODLE – Ferramenta de acompanhamento do aluno de graduação, no ambiente virtual de aprendizagem(MOODLE), no contexto da UNEB“. Possui também Especialização em Análise de Sistemas pela Faculdade Visconde de Cairu e Bacharelado em Estatística pela Universidade Federal da Bahia. Atua profissionalmente como consultor há mais de 15 anos nas áreas de Data Warehouse, Mineração de Dados, Ferramentas de Tomada de Decisão e Estatística. Atualmente é editor do blog BI com Vatapá. Livro: BI COMO DEVE SER - www.bicomodeveser.com.br

0 comentários: