[VISÃO] Ciência de dados, uma profissão cobiçada

Fonte: The Wall Street Journal



Para seu doutorado em astrofísica, Chris Farrell passou cinco anos coletando dados de um acelerador de partículas gigante. Agora ele passa os dias analisando classificações para o site americano de avaliações de produtos e serviços do YelpInc.
Farrell, de 28 anos, é um cientista de dados, cargo que praticamente não existia há três anos. Esses profissionais estão hoje entre os mais procurados no mercado de trabalho de alta tecnologia. De varejistas, bancos e fabricantes de equipamentos pesados até sites de namoro, todos querem especialistas capazes de extrair e interpretar a profusão de dados vindos de cliques na internet, máquinas e smartphones, deflagrando uma corrida para encontrar ou treinar esses profissionais.
"As pessoas os chamam de unicórnios", porque a combinação das competências necessárias é muito rara, diz Jonathan Goldman, chefe da equipe de cientistas de dados do LinkedIn Corp. que em 2007 criou a ferramenta "Pessoas que você talvez conheça". Cinco anos mais tarde, essa ferramenta gera mais da metade dos convites na plataforma de contatos profissionais.
Os empregadores dizem que o candidato ideal deve ter mais que as competências tradicionais exigidas na pesquisa de mercado: a capacidade de encontrar padrões em milhões de dados vindos de diferentes fontes, inferir a partir desses padrões o comportamento dos clientes e elaborar modelos estatísticos que identifiquem gatilhos comportamentais.
No site da operadora de comércio eletrônico Etsy Inc., por exemplo, um doutor em bioestatística que passou anos coletando registros médicos para identificar os primeiros sinais de câncer de mama agora elabora modelos estatísticos para descobrir quais os termos que as pessoas usam quando procuram no Etsy uma nova moda que viram na rua.
Na Square Inc., empresa novata de pagamentos por celular, um doutor em psicologia cognitiva que elaborava modelos estatísticos para examinar como as pessoas mudam suas convicções políticas agora procura padrões de comportamento que identifiquem quais os lojistas com mais probabilidade de ter clientes que exigem devolução do dinheiro.
Outro funcionário de 28 anos do Yelp, com doutorado em matemática aplicada, transformou a pesquisa para sua dissertação sobre o mapeamento do genoma num produto utilizado pela equipe de publicidade da empresa. O mesmo algoritmo de mapeamento do genoma agora é usado para medir o impacto sobre os consumidores quando são feitas diversas pequenas mudanças nos anúncios on-line.
"O mundo acadêmico é lento e só algumas pessoas veem o seu trabalho", diz Scott Clark, que criou o algoritmo de mapeamento do genoma. "No Yelp eu posso fazer experiências que afetam centenas de milhões de pessoas. Quando faço uma pequena alteração no site do Yelp, causo um impacto maior."
Algumas dessas experiências têm gerado alarme. O Facebook Inc. esteve recentemente no centro das atenções devido a uma experiência em que sua equipe de cientistas de dados procurou manipular as emoções dos usuários, alterando o conteúdo dos seus feeds de notícias.
Christian Rudder, presidente do site de namoro OkCupid, da IAC/InterActiveCorp. , divulgou recentemente em seu blog que o site manipulava as informações enviadas aos usuários, aumentando a probabilidade de que duas pessoas fossem compatíveis, para incentivá-las a usar mais o serviço.
Goldman, que agora dirige um novo grupo de ciência de dados na Intuit Inc., disse que os empregadores fazem grandes esforços para conseguir talentos de alto nível. Eles devem estar prontos para fazer uma oferta rapidamente, apenas um ou dois dias depois de entrevistar o candidato, e estar preparados para encontra-los a qualquer hora do dia ou da noite.
Embora um salário inicial de ao menos US$ 100.000 por ano possa ser comum nos Estados Unidos para quem acaba de terminar um doutorado, um cientista de dados com apenas dois anos de experiência pode ganhar de US$ 200.000 a US$ 300.000 por ano, segundo os recrutadores.
Qualquer pessoa que tenha "ciência de dados" no seu cargo numa página do LinkedIn vai receber "100 e-mails por dia de recrutadores", diz Josh Sullivan, que lidera um grupo de 500 cientistas de dados na consultoria Booz Allen Hamilton Holding Corp.
A escassez de profissionais se reflete nos números. Os sites de anúncios de empregos SimplyHired.com e LinkedIn atualmente listam entre 24.000 e 36.000 vagas para cargos que têm "ciência de dados" no título. Dados de um terceiro site mostram que 6.000 empresas estavam recrutando esses profissionais no fim do ano passado.
Em 2012, o ano mais recente para o qual o governo americano divulgou estatísticas, foram concedidos cerca de 2.500 diplomas de doutorado em estatística, bioestatística, física de partículas e ciência da computação —áreas de onde os cientistas de dados normalmente são recrutados, segundo a Fundação Nacional de Ciência. No ano passado, seis universidades americanas, incluindo a Columbia, em Nova York, a de Virgínia e a do Estado de Ohio, lançaram ou anunciaram planos para lançar programas de graduação e de mestrado em ciência de dados, visando sanar a falta de profissionais no mercado.
Alguns cientistas de dados que há cinco anos teriam escolhido a carreira universitária ou a de analistas matemáticos em Wall Street disseram que foram atraídos pelo boom da tecnologia porque o financiamento para a pesquisa científica encolheu durante a recessão.
Saba Zuberi, uma astrofísica que é cientista de dados na TaskRabbit Inc., disse que trabalhar para uma empresa de internet voltada para o consumidor pode ser surpreendentemente gratificante.
No TaskRabbit, uma empresa novata de tecnologia que ajuda a contratar mão de obra temporária para tarefas básicas, como encaixotar objetos ou fazer uma faxina, os usuários veem uma lista de potenciais ajudantes (os "coelhos", ou "rabbits") capazes de fazer as tarefas. Para criar as listas, Zuberi passou seis meses elaborando um modelo que leva em conta a localização do trabalhador, seus horários disponíveis, experiência, as avaliações que já recebeu e a remuneração pedida, além dos atributos da pessoa que fez o pedido. Quanto mais fatores precisam ser ponderados e combinados, mais complexo o modelo, diz ela.
Com o tempo, o software aprende quais fatores são mais importantes para quais clientes e vai refinando as listas. Zuberi diz que criar algoritmos para a TaskRabbit pode não ser um desafio intelectual tão grande como se dispor a provar novas teorias na física de partículas, mas o trabalho parece ter mais sentido.
"Afinal, a pessoa que você decide mostrar [na lista] não é apenas um item", diz ela. "É algo que afeta diretamente o ganha-pão das pessoas."
Compatilhe no Google Plus

Sobre Grimaldo Oliveira

Mestre pela Universidade do Estado da Bahia (UNEB) no Curso de Mestrado Profissional Gestão e Tecnologias Aplicadas à Educação (GESTEC) com o projeto “GESMOODLE – Ferramenta de acompanhamento do aluno de graduação, no ambiente virtual de aprendizagem(MOODLE), no contexto da UNEB“. Possui também Especialização em Análise de Sistemas pela Faculdade Visconde de Cairu e Bacharelado em Estatística pela Universidade Federal da Bahia. Atua profissionalmente como consultor há mais de 15 anos nas áreas de Data Warehouse, Mineração de Dados, Ferramentas de Tomada de Decisão e Estatística. Atualmente é editor do blog BI com Vatapá. Livro: BI COMO DEVE SER - www.bicomodeveser.com.br

0 comentários: