Fonte:CIO
Trabalhar com Ciência de Dados requer uma abordagem alternativa ao negócio em que a lógica se sobrepõe à criatividade e a realidade supera a crença. Em outras palavras, depende de fato e lógica, em vez de imaginar o que poderia ser possível.
A Ciência de Dados é um método para coletar insights de dados estruturados e não estruturados usando abordagens que vão desde a análise estatística até o Machine Learning. Para a maior parte das organizações, a Ciência de Dados é empregada para transformar dados em valor, transformando-os em receita aprimorada, custos reduzidos, agilidade nos negócios, melhor experiência do cliente, desenvolvimento de novos produtos, entre outros.
"A quantidade de dados que a empresa pode pegar é imensa, mas se não estiver fazendo nada com isso, transformando-o em algo interessante, não adianta. A Ciência de Dados significa dar a esses dados um propósito", diz Adam Hunt, cientista chefe de dados da RiskIQ. Veja também: Confira 12 erros comuns em Ciência de Dados que comprometem a tomada de decisão
Ciência de dados vs Analytics
A análise de dados é geralmente vista como um componente da Ciência de Dados, usada para entender como são os dados de uma organização. A Ciência de Dados usa Analytics para resolver problemas.
A análise de dados é geralmente vista como um componente da Ciência de Dados, usada para entender como são os dados de uma organização. A Ciência de Dados usa Analytics para resolver problemas.
"A Ciência de Dados está chegando a conclusões que levam os dados adiante. Se a pessoa não está resolvendo um problema com dados, está apenas fazendo uma investigação, isso é apenas uma análise. A Ciência de Dados tem mais a ver com a resolução de problemas do que com Analytics, o exame e a plotagem de dados", diz Hunt.
Ciência de dados vs Big Data
A Ciência de Dados e o Big Data geralmente são vistos como conceitos conectados, mas os cientistas de dados não trabalham apenas com big data. A Ciência de Dados pode ser usada para extrair valor de dados de todos os tamanhos, sejam eles estruturados, não estruturados ou semi estruturados.
A Ciência de Dados e o Big Data geralmente são vistos como conceitos conectados, mas os cientistas de dados não trabalham apenas com big data. A Ciência de Dados pode ser usada para extrair valor de dados de todos os tamanhos, sejam eles estruturados, não estruturados ou semi estruturados.
Big Data é útil para as equipes de Ciência de Dados em muitos casos, porque quanto mais dados estiver disponíveis, mais parâmetros serão incluídos em um determinado modelo. "Big data ajuda em certos aspectos, mas nem sempre é melhor. Por exemplo, o mercado de ações não funciona em uma linha, então não vai funcionar”, comenta o executivo.
Valor comercial da ciência de dados
O valor comercial da Ciência de Dados depende da organização que a está usando. Ela pode ajudar a criar ferramentas para prever falhas de hardware, permitindo que a empresa realize a manutenção preditiva e evite o tempo de inatividade. Pode ser usada para prever o que colocar nas prateleiras dos supermercados, ou quão popular um produto será baseado em seus atributos.
O valor comercial da Ciência de Dados depende da organização que a está usando. Ela pode ajudar a criar ferramentas para prever falhas de hardware, permitindo que a empresa realize a manutenção preditiva e evite o tempo de inatividade. Pode ser usada para prever o que colocar nas prateleiras dos supermercados, ou quão popular um produto será baseado em seus atributos.
"O maior valor que uma equipe de Ciência de Dados pode ter é ser incorporados às equipes de negócio. Uma pessoa inovadora vai encontrar valor que outras pessoas não esperavam", diz Ted Dunning, arquiteto chefe de aplicações da MapR Technologies.
Ferramentas de Ciência de Dados
As equipes fazem uso de uma ampla gama de ferramentas, incluindo SQL, Python, R, Java e uma infinidade de projetos de código aberto, como Hive, Oozie e TensorFlow. Essas ferramentas são usadas para tarefas relacionadas a dados, desde extrair e limpar dados, até submeter dados a análises algorítmicas via métodos estatísticos ou Inteligência Artificial.
As equipes fazem uso de uma ampla gama de ferramentas, incluindo SQL, Python, R, Java e uma infinidade de projetos de código aberto, como Hive, Oozie e TensorFlow. Essas ferramentas são usadas para tarefas relacionadas a dados, desde extrair e limpar dados, até submeter dados a análises algorítmicas via métodos estatísticos ou Inteligência Artificial.
De acordo com Dunning, o cientista de dados precisa olhar criticamente para aspectos muito simples dos dados. "O profissional precisa de boas ferramentas de visualização e ferramentas de programação - o Python é um favorito das probabilidades neste momento. São necessárias, também, ferramentas que realmente construirão modelos interessantes", diz Dunning.
Habilidades em Ciência de Dados
A Ciência de Dados é uma área em evolução e há muitas maneiras de aprender sobre ela. Porém, ainda que o número de programas de graduação em Ciência de Dados esteja aumentando rapidamente, eles não são necessariamente o que as organizações procuram quando buscam cientistas de dados.
A Ciência de Dados é uma área em evolução e há muitas maneiras de aprender sobre ela. Porém, ainda que o número de programas de graduação em Ciência de Dados esteja aumentando rapidamente, eles não são necessariamente o que as organizações procuram quando buscam cientistas de dados.
O Stange-Tregear, do eBates, diz que busca candidatos com histórico de Estatística, conhecimento do negócio para contextualizar resultados e habilidades de comunicação para apresentar os resultados a usuários corporativos.
"Dou preferência para PhDs, mas não deixaria de lado alguém que tem muita experiência", diz Hunt. "Um PhD é capaz de fazer uma pesquisa muito profunda sobre um tópico e é capaz de disseminar essa informação para os outros. Mas ter um sólido background ou projeto pessoal é incrivelmente interessante."
Hunt diz que ele, particularmente, procura por PhDs em Física, Matemática, Ciência da Computação, Economia ou Ciências Sociais. Ainda que não dispense candidatos com graduação em Ciência de Dados ou Analytics, ele tem reservas. "Minha experiência pessoal é que eles são muito úteis, mas se concentram demasiadamente nas operações dos modelos e não na mentalidade do processo".
Dunning se importa mais com a capacidade do candidato de mostrar algo novo. "O que mais levo em conta é se o entrevistado me ensinou alguma coisa. Não quero contratar pessoas que saibam como fazer o que eu também sei. Eu quero encontrar pessoas que possam fazer coisas que eu não posso fazer, ou que ensinem coisas para o time”, explica.
Para Dunning, alguns dos melhores cientistas de dados ou líderes em grupos de Ciência de Dados têm origens não tradicionais. Ele cita, por exemplo, algumas pessoas que já passaram pela empresa e trabalharam como jardineiro antes de ir para a faculdade, tinham um diploma de literatura francesa ou de jornalismo, com pouco treinamento formal em informática.
Analistas e cientistas de dados são as profissões quentes agora, dado o valor que eles podem entregar para as empresas – especialmente aquelas que estão guardando os grandes volumes de informação digital que estão sendo reunidas a cada minuto.
No entanto, não há profissionais suficientes para preencher todas as posições abertas e isso significa que oportunidades de descobrir novos insights estão sendo perdidas enquanto as empresas se esforçam para preencher esses papéis cruciais.
O principal desafio é que os cientistas de dados têm um conjunto de habilidades muito específico: uma experiência nascida de educação, tempo, experiência e capacidade técnica. Qualquer outro que falte um ou dois aspectos desse conjunto não consegue preencher todos os requisitos que as empresas anseiam.
Mesmo que os avanços da tecnologia ajudem a fazer o que costumava estar na seara de Ph.D’s, ainda há muitas vagas abertas que necessitam de qualidades como perícia na análise de dados, uma tendência que não mostra sinais de reversão a curto prazo.
Cada indústria tem seu próprio grande perfil de profissional de análise de dados. Aqui estão algumas das formas mais comuns em cada indústria, bem como os tipos de análise que o cientista de dados provavelmente será obrigado a realizar.
0 comentários:
Postar um comentário