Fonte: Data Science Central
Essas técnicas cobrem a maioria dos dados que os cientistas e profissionais relacionados estão usando em suas atividades diárias, quer eles usem soluções oferecidas por um fornecedor ou se eles criam ferramentas proprietárias. Quando você clica em qualquer um dos 40 links abaixo, você encontrará uma seleção de artigos relacionados à entrada em questão. A maioria desses artigos é difícil de encontrar com uma pesquisa do Google, por isso, de certa forma, isso lhe dá acesso à literatura escondida sobre ciência dos dados, aprendizado de máquinas e ciência estatística. Muitos desses artigos são fundamentais para a compreensão da técnica em questão, e vem com mais referências e código fonte.
As técnicas de classificação (marcadas com um *) pertencem ao que eu chamo de ciência de dados profunda , um ramo da ciência de dados que tem pouco ou mesmo sobreposição com campos estreitamente relacionados, como aprendizado de máquina, ciência da computação, pesquisa operacional, matemática ou estatística. Mesmo as técnicas clássicas de aprendizagem e técnicas de máquinas, tais como agrupamento, estimativa de densidade ou testes de hipóteses, possuem versões robustas, baseadas em dados e robustas, projetadas para processamento automatizado (como em comunicações máquina-máquina) e, portanto, também pertencem a Ciência profunda dos dados . No entanto, essas técnicas não são atualizadas aqui, já que as versões padrão dessas técnicas são mais conhecidas (e, infelizmente, mais usadas) do que o equivalente em ciência profunda de dados .
Para saber mais sobre ciência profunda dos dados, clique aqui . Note que, ao contrário do aprendizado profundo, a ciência profunda dos dados não é a interseção da ciência dos dados e da inteligência artificial; No entanto, a analogia entre ciência profunda dos dados e aprendizado profundo não é completamente sem sentido, no sentido de que ambos lidam com a automação.
Além disso, para descobrir em que contextos e aplicações as 40 técnicas abaixo são usadas, convido você a ler os seguintes artigos:
- 21 sistemas de ciência de dados usados pela Amazon para operar seus negócios
- 24 Usos da modelagem estatística
Finalmente, ao usar uma técnica, você precisa testar seu desempenho. Leia este artigo sobre 11 técnicas de avaliação de modelo importantes que todos devem saber.
As 40 técnicas de ciência de dados
- Regressão linear
- Regressão Logística
- Regressão Jackknife *
- Estimativa de densidade
- Intervalo de confiança
- Teste de Hipóteses
- Reconhecimento de padrões
- Clustering - (também conhecido como Learning não supervisionado)
- Aprendizagem supervisionada
- Série de tempo
- Árvores de decisão
- Números aleatórios
- Simulação de Monte-Carlo
- Estatísticas Bayesianas
- Bayes nao
- Análise de componentes principais - (PCA)
- Conjuntos
- Redes neurais
- Support Vector Machine - (SVM)
- Vizinhos mais próximos - (k-NN)
- Seleção de características - (também conhecido como Redução de variável)
- Indexação / Catalogação *
- (Geo-) Modelagem espacial
- Recomendação Engine *
- Search Engine *
- Modelagem de Atribuição *
- Filtragem colaborativa *
- Sistema de Regra
- Análise de ligação
- Regras da Associação
- Motor de pontuação
- Segmentação
- Modelagem Preditiva
- Gráficos
- Aprendizagem profunda
- Teoria do jogo
- Imputação
- Análise de sobrevivência
- Arbitragem
- Modelagem de elevação
- Otimização de rendimento
- Validação cruzada
- Montagem de modelo
- Algoritmo de Relevância *
- Design experimental
O número de técnicas é superior a 40 porque atualizamos o artigo e adicionamos outros adicionais.
0 comentários:
Postar um comentário