[ESTUDO] 40 Técnicas utilizadas pelos cientistas de dados


Fonte: Data Science Central



Essas técnicas cobrem a maioria dos dados que os cientistas e profissionais relacionados estão usando em suas atividades diárias, quer eles usem soluções oferecidas por um fornecedor ou se eles criam ferramentas proprietárias. Quando você clica em qualquer um dos 40 links abaixo, você encontrará uma seleção de artigos relacionados à entrada em questão. A maioria desses artigos é difícil de encontrar com uma pesquisa do Google, por isso, de certa forma, isso lhe dá acesso à literatura escondida sobre ciência dos dados, aprendizado de máquinas e ciência estatística. Muitos desses artigos são fundamentais para a compreensão da técnica em questão, e vem com mais referências e código fonte.
As técnicas de classificação (marcadas com um *) pertencem ao que eu chamo de ciência de dados profunda , um ramo da ciência de dados que tem pouco ou mesmo sobreposição com campos estreitamente relacionados, como aprendizado de máquina, ciência da computação, pesquisa operacional, matemática ou estatística. Mesmo as técnicas clássicas de aprendizagem e técnicas de máquinas, tais como agrupamento, estimativa de densidade ou testes de hipóteses, possuem versões robustas, baseadas em dados e robustas, projetadas para processamento automatizado (como em comunicações máquina-máquina) e, portanto, também pertencem a Ciência profunda dos dados . No entanto, essas técnicas não são atualizadas aqui, já que as versões padrão dessas técnicas são mais conhecidas (e, infelizmente, mais usadas) do que o equivalente em ciência profunda de dados .
Para saber mais sobre ciência profunda dos dados,   clique aqui . Note que, ao contrário do aprendizado profundo, a ciência profunda dos dados não é a interseção da ciência dos dados e da inteligência artificial; No entanto, a analogia entre ciência profunda dos dados e aprendizado profundo não é completamente sem sentido, no sentido de que ambos lidam com a automação.
Além disso, para descobrir em que contextos e aplicações as 40 técnicas abaixo são usadas, convido você a ler os seguintes artigos:
Finalmente, ao usar uma técnica, você precisa testar seu desempenho. Leia este artigo  sobre  11 técnicas de avaliação de modelo importantes que todos devem saber.

As 40 técnicas de ciência de dados
  1. Regressão linear 
  2. Regressão Logística 
  3. Regressão Jackknife  *
  4. Estimativa de densidade 
  5. Intervalo de confiança 
  6. Teste de Hipóteses 
  7. Reconhecimento de padrões 
  8. Clustering  - (também conhecido como Learning não supervisionado)
  9. Aprendizagem supervisionada 
  10. Série de tempo 
  11. Árvores de decisão 
  12. Números aleatórios 
  13. Simulação de Monte-Carlo 
  14. Estatísticas Bayesianas 
  15. Bayes nao 
  16. Análise de componentes principais  - (PCA)
  17. Conjuntos 
  18. Redes neurais 
  19. Support Vector Machine  - (SVM)
  20. Vizinhos mais próximos  - (k-NN)
  21. Seleção de características  - (também conhecido como Redução de variável)
  22. Indexação / Catalogação  *
  23. (Geo-) Modelagem espacial 
  24. Recomendação Engine  *
  25. Search Engine  *
  26. Modelagem de Atribuição  *
  27. Filtragem colaborativa  *
  28. Sistema de Regra 
  29. Análise de ligação 
  30. Regras da Associação 
  31. Motor de pontuação 
  32. Segmentação 
  33. Modelagem Preditiva 
  34. Gráficos 
  35. Aprendizagem profunda 
  36. Teoria do jogo 
  37. Imputação 
  38. Análise de sobrevivência 
  39. Arbitragem 
  40. Modelagem de elevação 
  41. Otimização de rendimento
  42. Validação cruzada
  43. Montagem de modelo
  44. Algoritmo de Relevância  *
  45. Design experimental
O número de técnicas é superior a 40 porque atualizamos o artigo e adicionamos outros adicionais.
Compatilhe no Google Plus

Sobre Grimaldo Oliveira

Mestre pela Universidade do Estado da Bahia (UNEB) no Curso de Mestrado Profissional Gestão e Tecnologias Aplicadas à Educação (GESTEC) com o projeto “GESMOODLE – Ferramenta de acompanhamento do aluno de graduação, no ambiente virtual de aprendizagem(MOODLE), no contexto da UNEB“. Possui também Especialização em Análise de Sistemas pela Faculdade Visconde de Cairu e Bacharelado em Estatística pela Universidade Federal da Bahia. Atua profissionalmente como consultor há mais de 15 anos nas áreas de Data Warehouse, Mineração de Dados, Ferramentas de Tomada de Decisão e Estatística. Atualmente é editor do blog BI com Vatapá. Livro: BI COMO DEVE SER - www.bicomodeveser.com.br

0 comentários: