Fonte: ComputerWorld
Pense da seguinte maneira: Uma pequena quantidade de dados até pode
ser facilmente gerenciada e analisada de forma simples, gerando
aceitáveis níveis de inteligência. Afinal de contas, os volumes e
componentes difusos analisados não são tão grandes assim. Mas quando os
dados ganham novas proporções, crescendo de forma constante, adicionam
problemas até então não vivenciados.
Essa é a visão de Nate Silver. Fundador do site de jornalismo de
dados FiveThirtyEight (agora propriedade da ESPN), ele trabalha
escavando uma montanha de registros. O executivo falou durante uma
conferência promovida pela HP, em Boston, e descreveu os problemas que
podem vir junto com big data.
Ocupam muito espaço
Silver diz que mesmo pequenas quantidades de dados podem ser difíceis
de gerir, tanto em termos de armazenamento quanto de análise. A lógica
sugere que, quanto mais dados as empresas tiverem, mais complexa será a
tarefa de geri-los. Você precisará responder perguntas do tipo: Vale
comprar equipamentos para guardá-los? Melhor armazenar na nuvem? Com que
frequência você precisa acessar esses registros? Como pode lidar com
latência?
Trazem perspectivas difusas
Uma questão relativa à grande quantidade de dados é que isso cria
polarização e diferentes perspectivas. Vamos dizer que existam dois
silos em sua empresa. Parece simples decifrar o que esses dois
recipientes contem de maneira macro. Agora, se você está analisando 100
pesquisas, pode haver muitas nuances dentro desses dados. Certamente, já
deve ter ouvido que os números dizem o que as pessoas querem ouvir e
que, espremidos, podem dizer qualquer coisa. Pois bem, quanto mais dados
tiver, mais espaço de manobra existe para respostas imprecisas.
Geram falsos positivos
Silver cita o livro de Daniel Kahneman intitulado “Thinking, Fast and
Slow” para apontar o fato de que as pessoas tomam decisões baseadas em
um subconjunto de dados a partir do pensamento rápido. A melhor pratica é
o “pensamento lento” e a verdadeira racionalização dos dados. Com big
data, pensamento rápido (e não analisar dados por completo) pode levar a
falsos positivos.
A imensidão é complexa
O especialista usa o termo “encontrar sinal em meio ao barulho”, que
seria uma versão um pouco diferente do velho “agulha no palheiro”.
Quanto mais dados você tem, mais difícil é encontrar algo de fato
valioso naquela montanha.
Nem sempre trazem aquilo que você estava procurando...
Imagine o Google Maps dando-lhe instruções e sugerindo como
alternativa uma rota “mais rápida”. Porém, apenas depois de pegar esse
caminho descobrirá que ele é esburacado ou sem asfalto. Às vezes,
sistemas de big data oferecem atalhos que, na verdade, não são
exatamente aquilo que você estaria procurando.
0 comentários:
Postar um comentário