[SAIBA TUDO] Por dentro do big data

Fonte:Decision Report


O termo big data ganha cada vez mais notoriedade entre as empresas em todo o mundo. Segundo o Gartner, até 2015, cerca de 20% das mil maiores companhias globais terão estratégias focadas na estrutura de informação. Mas, de acordo com Diógenes do Espírito Santo, arquiteto de soluções da Teradata, antes de adotar as tecnologias de análise, é preciso conhecer os formatos de dados mais significativos para os negócios.

Para o especialista, os chamados dados multiestruturados são formados pelos dados estruturados, semi-estruturados e não estruturados, cada um com características e origens próprias:

Com formatação simples, os dados estruturados são encontrados mais facilmente por meio da base de dados relacionados dentro das empresas e podem ser extraídos diretamente para data warehouses. Esses dados são gerados a partir de informações e operações internas como nos setores administrativos, por exemplo, e em desktops e programas corporativos, sem a interferência da mobilidade.

Os dados semi-estruturados, possuem certo grau de estrutura, podem ser identificados com frameworks de linguagem computacional mais avançada do que as tradicionais SQLs. Constituem dados provenientes de logins web e informações de GPS.

Já os dados não estruturados não possuem nenhum tipo de formatação e necessitam de soluções especificas para serem trabalhados. Na categoria, encaixam-se vídeos, músicas, textos, mídias sociais e qualquer outro dado criado por dispositivos web, como smartphones, tablets e notebooks.

“As informações extraídas por meio do big data abrangem todos os formatos de dados, mas para isso é preciso adotar as ferramentas certas”, afirma Diógenes do Espírito Santo. Para os estruturados, já existe soluções consolidadas, a base de dados relacionados e os data warehouses, podendo ser utilizados dentro dos ambientes corporativos de maneira mais simples em comparação aos outros processos de análise, aponta o arquiteto.

Os dados semi e não estruturados necessitaram da criação de uma linguagem específica para suprir a falta de formatação. Segundo Santo, a linguagem SQL não é efetiva para realizar a análise e identificação das informações, por isso o Google desenvolveu o MapsReduce, capaz de quebrar os dados em pequenos pedaços e realinhá-los de maneira estruturada. Em contrapartida, essa solução é muito complexa, exigindo conhecimentos avançados em linguagem computacional.

“Para as empresas tirarem melhor proveito dessa nova tendência, as tecnologias de big data analytics, management e data warehouse precisam conversar entre si. O grande diferencial de disponibilizá-las de forma unificada é permitir a comunicação nativa de uma para outra, evitando erros e atrasos de operações de análise devido à incompatibilidade de sistemas”, diz o especialista.

De acordo com Diógenes, os dados multiestruturados ajudam as companhias a obter mais assertividade nas tomadas de decisões, melhorar o atendimento aos consumidores, identificar quais iniciativas irão aprimorar os negócios e adquirir valor agregado. “Todos os segmentos de mercado podem tirar proveito do big data, mas é preciso ter consciência e procurar informações sobre como as tecnologias podem realmente ajudar cada empresa”, conclui.
Compatilhe no Google Plus

Sobre Grimaldo Oliveira

Mestre pela Universidade do Estado da Bahia (UNEB) no Curso de Mestrado Profissional Gestão e Tecnologias Aplicadas à Educação (GESTEC) com o projeto “GESMOODLE – Ferramenta de acompanhamento do aluno de graduação, no ambiente virtual de aprendizagem(MOODLE), no contexto da UNEB“. Possui também Especialização em Análise de Sistemas pela Faculdade Visconde de Cairu e Bacharelado em Estatística pela Universidade Federal da Bahia. Atua profissionalmente como consultor há mais de 15 anos nas áreas de Data Warehouse, Mineração de Dados, Ferramentas de Tomada de Decisão e Estatística. Atualmente é editor do blog BI com Vatapá. Livro: BI COMO DEVE SER - www.bicomodeveser.com.br

0 comentários: