[ENTENDA] Seis buzzwords de Big Data e analytics que você precisa dominar


Fonte:ComputerWorld



A ansiedade das empresas de TI em se classificarem como líderes de mercado desencadeia uma proliferação de novos termos. Muitas dessas buzzwords, contudo, tem significados ainda não bem definidos. Falando especificamente no mundo do Big Data, o hype vem como um novo dialeto. Quer clareza com relação aos termos mais comuns nesse campo? A seguir, apresentamos um breve dicionário.

1. Fast data
A estrela brilhante na constelação de termos é o “fast data”, que começam a aparecer com, cada vez mais, frequência. A expressão se refere a “dados que perderão valor ao longo do tempo”, explica Tony Baer, analista da Ovum, que afirma ter cunhado o termo em 2012.

Assemelha-se a registros de feeds do Twitter ou streaming, que precisam ser capturados e analisados em tempo real, permitindo respostas e decisões instantâneas.
“Fast data pode se referir a algumas coisas: ingestão, transmissão, preparação, análise, resposta, tudo em alta velocidade”, afirma Nik Rouda, analista do Enterprise Strategy Group.

2. Slow data
Exatamente o oposto do termo acima. “Slow data” refere-se aos dados podem ser usados para rotinas de análises menos frequentes e aplicado para tomada de decisões que não necessitam de informações instantâneas. De forma geral, é aquele registro capturado em um data lake para processamento posterior.

3. Small data
O termo significa “tudo aquilo que cabe em um laptop”, classifica Gregory Piatetsky-Shapiro, presidente da consultoria KDnuggets. Essencialmente, a expressão reconhece o fato que “muitas análises continuarão sendo feitas com uma ou poucas fontes de dados, em apps – e as vezes até mesmo em planilhas do Excel”, adiciona Rouda.

4. Medium data
De maneira simplista? Refere-se a algo não tão pequeno quanto o termo anterior. Para dar uma dimensão, quando você fala em muitos petabytes, isso pode ser chamado de Big Data, o que exigirá tecnologias como Hadoop e MapReduze para ser analisado. “Mas, muitos desafios analíticos não envolvem petabytes”, contrapõe Baer. Para um volume intermediário de informações, criou-se o termo “medium data”.

5. Dark data
A expressão refere-se que estão subutilizados ou desconhecidos. “As pessoas, muitas vezes, nem sabem que esses dados existem, como acessá-los, não tem permissão para analisá-los ou os sistemas não foram ajustados para fazer isso”, lista Rouda, citando que eles ficam perdidos nos bancos e armazéns de dados. Em muitos casos, trazer luz para esses dados escuros é uma tarefa de algoritmos de machine learning.

6. Dirty data
Por fim, mas não menos importante, “dirty data” é algo tão divertido quanto o próprio nome sugere: aqueles registros que ainda não foram limpos. “A menos que você desempenhou alguma operação com ele, o dado não necessariamente precisa ser limpo”, afirma Baer, essa operação incluem preparação, enriquecimento e transformação. “Em outro caso, muitas respostas erradas são possíveis”, comenta Rouda.

Só mais uma coisa...
Usar dados para fazer sua empresa avançar é mais do que apenas aprender termos. "Há uma lacuna entre todos os dados disponíveis e nossa capacidade de usá-lo”, reforça Brian Hopkins, vice-presidente da Forrester.

Preencher essa lacuna pode pedir o uso de ferramentas robustas ou pode ser, apenas, uma questão de autoentendimento daqueles recursos. Seja qual for a situação, é preciso criar um elo para gerar ações significativas.

"Os fornecedores e analistas de consultorias são bons em criar novas buzzwords", reconhece Hopkins. “Ao invés de se atolar em termos, o meu conselho para os CIOs é focar em resultados que irão transformar o seu negócio."
Compatilhe no Google Plus

Sobre Grimaldo Oliveira

Mestre pela Universidade do Estado da Bahia (UNEB) no Curso de Mestrado Profissional Gestão e Tecnologias Aplicadas à Educação (GESTEC) com o projeto “GESMOODLE – Ferramenta de acompanhamento do aluno de graduação, no ambiente virtual de aprendizagem(MOODLE), no contexto da UNEB“. Possui também Especialização em Análise de Sistemas pela Faculdade Visconde de Cairu e Bacharelado em Estatística pela Universidade Federal da Bahia. Atua profissionalmente como consultor há mais de 15 anos nas áreas de Data Warehouse, Mineração de Dados, Ferramentas de Tomada de Decisão e Estatística. Atualmente é editor do blog BI com Vatapá. Livro: BI COMO DEVE SER - www.bicomodeveser.com.br

0 comentários: