[SABIA?] Não, você ainda não é um cientista de dados

Fonte: Linkedin

O Frenesi causado pela onda do Big Data provocou uma mudança perceptível no “job description” das vagas disponíveis na indústria de Business Intelligence e Business Analytics. Começou a temporada de caça em busca de profissionais de talento para surfar na onda do Big Data. Ávido por se posicionar no mercado, já que você é um produto dele e precisa se apresentar como tal, rapidamente você e muitos outros profissionais de business intelligence atualizaram seu perfil para cientista de dados, data scientist ou business analytics expert, etc.... Só que isso pode não ser a melhor escolha. Minha opinião é que você ainda não é um cientista de dados. Vou explicar os porquês disso logo à frente. O Título desse artigo não tem por objetivo criticar os que fazem, mas contribuir para o esclarecimento do termo. Mesmo nos diversos fóruns de discussão que eu tenho acompanhado esse assunto ainda é bem controverso. Há sempre os puristas, os de direita e os mais ao centro que defendem um perfil generalista para essa nova denominação. Ainda não existe uma uniformidade de papéis e responsabilidades desse velho-novo perfil. Digo velho, pois estatísticos sempre estiveram perambulando por aí e no passado tinham seu campo de atuação limitado aos institutos de pesquisa, no mundo das finanças corporativas com modelagem de risco e outra meia dúzia de áreas de atuação. Hoje não. Foram beneficiados por essa nova onda e catapultados para cima da pirâmide. Outras formações como engenharia, física e exatas também gozam de muito mais prestígio agora. O que mudou tão de repente? A verdade é que em um passado não muito distante eu mesmo não tinha visibilidade de quanto a estatística aplicada era tão relevante para a indústria de BI e para os negócios. Ao longo da minha carreira sempre avaliei que entender de negócios era um plus e era o suficiente para gerar valor para aqueles que se dispuseram a pagar pelos meus serviços. E isso não morreu e ainda faz muita diferença nesse novo cenário. Minha idéia de Business Intelligence como tecnologia era baseada na ideia de que com uma modelagem de dados adequada, um back-end decente com um ETL bem construído garantindo a qualidade do dado e uma boa plataforma de consumo e visualização com Ad-hoc reporting, OLAP, relatórios pré-formatados e dashboards utilizados por bons usuários de negócios, era o suficiente para analisar e extrair o melhor entendimento sobre os dados e informações, habilitando-os para tomar suas decisões de negócio da melhor maneira possível. Mas, eu me enganei. Ao entrar na indústria de software para business analytics em um grande player do mercado (Sem jabá...), eu percebi o quanto eu estava defasado e que a profissão que eu havia escolhido estava mudando de rota. Business Intelligence ainda é muito importante. Mas, agora é commodity e coexiste em um novo ecossistema. Os negócios querem mais do que BI. Querem utilizar ciência para explicar comportamentos observados em grandes volumes de dados. Querem extrair valor de novas fontes de dados estruturados ou não (Mídias sociais, web, logs, sensores, mobile, devices, etc. e agora estão disponíveis graças à um conjunto de novas tecnologias que emergiram no espectro do Big Data, por exemplo HADOOP. E logo acima está a estatística aplicada. Uma infinidade de aplicações com o uso de matemática aplicada e estatística crescem fortemente no mercado devido ao valor gerado através do uso da ciência. Não se trata mais somente de estatística descritiva simples como muitos tiveram contato nos últimos anos. Estamos diante de algoritmos complexos como Redes neurais, clustering, Decision tree, regressão logística e tantos outros que são utilizados para os mais diversos fins, especialmente para criação de modelos preditivos. Yes, meus amigos não é astrologia. Hoje é possível “prever” o futuro utilizando técnicas estatísticas apropriadas e ganhar muito dinheiro com isso. E essa é a questão central desse artigo. Esse trabalho requer “hard skills” e background apropriados para tal. Não basta somente pilotar alguma ferramenta ou front-end. É preciso compreender bem sobre estruturas de dados e isso por si só vai requerer um nível avançado de aprendizado tecnológico. É preciso aprender alguma linguagem, ferramenta estatística ou de data mining tais como SAS, R ou SPSS. É preciso entender bem de negócios, os processos que os permeiam, mercado em que atua, as características dos produtos que vende e seus clientes. Entendo que tudo aquilo que pode impactar na observação ou na confirmação de uma hipótese ou na análise de algum cenário por exemplo de ser objeto de entendimento pleno de um data scientist. Porque não trata-se somente produzir um resultado baseado em uma técnica sofisticada. É preciso explicá-lo de uma forma que faça sentido para o negócio para que os tomadores de decisão compreendam o que é esse resultado e como fazer uso dele, caso contrário, é vazio e nulo. São só números, correlações e “suposições”. Isso faz tanta diferença que na minha opinião deve ser a principal habilidade a ser considerada na contratação de um data scientist. A capacidade de traduzir analytics para a linguagem de negócios. De gerar valor, utilizando modelos que fazem sentido para o contexto em que a organização está inserida. Se você se assustou com isso que estou dizendo aqui fique sabendo que tornar-se um cientista de dados não é o nirvana inatingível para a velha guarda de BI. Entretanto, requer uma bom revival nas disciplinas de exatas, exercício e muita criatividade.










Figure 1 - Como se tornar um Data scientist – By Willian Vorhies
Se você não quiser seguir por esse caminho, não há motivo para desesperar-se. Esse perfil não é único que ganhou força com o fenômeno do Big Data. Arquitetos de dados, administradores de banco de dados, engenheiros e toda a velha guarda do ecossistema dos dados continuam com perfis disputados por todo o mercado e com salários em alta. Esses perfis são frequentemente incluídos em listas de profissões em alta, profissões do futuro e melhores salários por todo o globo. O cenário é bem favorável para quem quiser continuar onde está. Como considero business intelligence uma ciência de negócios e normalmente tem por objetivo obter alguma vantagem competitiva sobre seu concorrente eu diria à você que mover-se em direção à Data Science pode ser um diferencial em posições de maior destaque no futuro. Mas para você chegar lá você vai precisar de um bom background estatístico, conhecimento em negócios, disciplina e criatividade. Afinal, ciência também é arte.
Compatilhe no Google Plus

Sobre Grimaldo Oliveira

Mestre pela Universidade do Estado da Bahia (UNEB) no Curso de Mestrado Profissional Gestão e Tecnologias Aplicadas à Educação (GESTEC) com o projeto “GESMOODLE – Ferramenta de acompanhamento do aluno de graduação, no ambiente virtual de aprendizagem(MOODLE), no contexto da UNEB“. Possui também Especialização em Análise de Sistemas pela Faculdade Visconde de Cairu e Bacharelado em Estatística pela Universidade Federal da Bahia. Atua profissionalmente como consultor há mais de 15 anos nas áreas de Data Warehouse, Mineração de Dados, Ferramentas de Tomada de Decisão e Estatística. Atualmente é editor do blog BI com Vatapá. Livro: BI COMO DEVE SER - www.bicomodeveser.com.br

1 comentários:

Anônimo disse...

Muito bom!