[ERUPÇÃO] Dataclisma e o pontencial do Big Data


Fonte: CEO

Por Cezar Taurion



Acabei de ler um livro bastante instigante, “Dataclisma, quem somos...quando achamos que ninguém está vendo”, de Christian Rudder. Ele é cofundador e CEO do site de relacionamentos OKCupid e no livro analisa o comportamento humano gerado pelas análises de como as pessoas se comportam na Internet, em sites como o dele e em redes sociais.
A ideia básica é abordar o uso do potencial de Big Data para analisar o comportamento humano, o que pensamos e desejamos. Deixamos uma imensa pegada digital no nosso dia a dia. As redes sociais como o Twitter e Facebook são gigantescos repositórios de opiniões e comentários. Por exemplo, haverá mais palavras escritas no Twitter nos próximos dois anos do que as contidas em todos os livros já impressos. O Facebook com seu mais de 1,4 bilhão de usuários (936 milhões entram todo dia nele) é hoje a maior rede da história da humanidade. Olhando esta imensa quantidade de usuários e considerando que aproximadamente um quarto do mundo tem menos de 14 anos de idade, isso significa que mais ou menos 25% dos adultos do planeta tem conta no Facebook.
Outra fonte inesgotável de informações sobre quem somos é a famosa página inicial do Google, contendo apenas um campo para entrada de dados. É um repositório do id coletivo da humanidade. Ela ouve nossas confissões, preocupações e segredos. Nós digitamos naquele retângulo o que queremos, sem censura. Como são buscas que as pessoas fazem sem censura, expressam nelas sentimentos de ódio e preconceitos, que geralmente são camuflados pelo comportamento social em público. Este é o problema do cientista social: o que ele mais quer saber é justamente o que seus objetos de estudo mais tentam esconder. O simples ato de perguntar algo incômodo gera autocensura. Nas buscas, não... Analisando as buscas conseguimos obter informações praticamente impossíveis de serem obtidas por pesquisas tradicionais. O Google Trends pode gerar excelentes amostras da mente privada, do que as pessoas realmente querem saber e que nem sempre compartilham com outras. Buscam sozinhas. Apenas o Google sabe...Vários projetos já mostram o quanto é possível saber com o Google Trends, como previsão do mercado de ações, o que move a produtividade econômica, epidemias de gripe e dengue, incidência de racismo e preconceitos arraigados, etc.
A World Wide Web é jovem (25 anos) e as redes sociais são fenômeno muito mais recente, mas seus efeitos já começam a ser sentidos. Um exemplo é a pesquisa feita pela Universidade de Michigan, nos EUA, que durante 30 anos aplicou testes de personalidade em mais de 14 mil universitários. A proposta era, através de perguntas, medir o grau de empatia de uma pessoa, ou o quanto ela se importa com as outras. Os resultados foram publicados em 2010 e mostraram que os jovens da geração atual, que cresceram no mundo da Internet, têm 40% menos empatia que os de três décadas atrás. Essa tendência ficou mais nítida a partir dos anos 2000, período que coincide com a popularização da Internet e das primeiras redes sociais turbinadas pela tecnologia. A explicação, segundo o estudo, é que na vida online fica mais fácil ignorar as pessoas quando não queremos ouvir seus problemas e críticas e com o tempo este comportamento indiferente acaba sendo adotado também na vida off line. Outros estudos mostram que muitas demonstrações de intolerância e mesmo ódio são facilitadas pela desinibição causadas pelo mundo online. Como as pessoas não estão frente a frente, se sentem mais à vontade para trocar insultos. No Facebook basta um clique para curtir ou replicar agressões.
Como estamos falando de algo muito recente, existe ainda uma longa caminhada de aprendizado. A Internet é muito jovem como registro humano predominante e o próprio Facebook só ganhou esta proporção toda nos últimos seis anos. As informações sobre o comportamento humano ainda estão sendo construídas e talvez daqui a dez ou vinte anos conseguiremos responder mais precisamente às perguntas como nos relacionamos, como novas ideias se infiltram e se disseminam pela sociedade, como a timeline do Facebook expressará a vida de uma pessoa (hoje ele recebe em média 0,6 Mb de novos dados por usuário, por dia), como os tuites mostrarão a reação da sociedade a determinados eventos e como o retângulo do Google explicitará os cantos das nossas mentes.
Mas, algumas surpresas já começam a aparecer. Por exemplo, é lugar comum dizer que os 140 caracteres do Twitter degrada a linguagem. Análises mostram que, ao contrário, a linguagem no Twitter está longe de ser degradada. O livro faz uma análise interessante, na língua inglesa, usando como comparação o OEC – Oxford English Corpus. O resultado mostrou não uma degradação, mas uma mudança no estilo da comunicação, com ênfase na concisão. O Twitter parece que na verdade pode estar melhorando a escrita dos usuários, pois os obriga a usar menos letras, para escrever frases significativas. Quem tuita não tem opção a não ser de ser conciso e com espaço finito para escrever, os pensamentos acabam sendo resumidos, omitindo palavras desnecessárias. Não são, necessariamente, pensamentos pequenos. Na verdade, se a frase está mal escrita é que a pessoa já escreve mal fora do Twitter ou do Facebook. Outra análise interessante é que os smartphones, por terem teclados menores, fazem com que a mensagens tendam a ser menores ainda que no Twitter. Parece bem claro que a tecnologia altera a maneira de como as pessoas se comunicam.
Um estudo que me chamou atenção foi a dos grafos sociais, a análise da rede de relacionamentos que é construída quando usamos Facebook. A análise de rede existe como ciência há quase 300 anos, mas é potencializada e pode ser estudada em muito mais detalhe e dinamismo com a tecnologia atual. Com isso, análises antes ocultas começam a ser desvendadas, como por exemplo, a possibilidade de propensão de um casal se separar.
Enfim, o livro é altamente recomendado para vermos como podemos, através da tecnologia e do Big Data, compreender mais a nossa sociedade e quem sabe, conseguir aprimorá-la. Vale a leitura.

(*) Cezar Taurion é é CEO da Litteris Consulting, autor de seis livros sobre Open Source, Inovação, Cloud Computing e Big Data
Compatilhe no Google Plus

Sobre Grimaldo Oliveira

Mestre pela Universidade do Estado da Bahia (UNEB) no Curso de Mestrado Profissional Gestão e Tecnologias Aplicadas à Educação (GESTEC) com o projeto “GESMOODLE – Ferramenta de acompanhamento do aluno de graduação, no ambiente virtual de aprendizagem(MOODLE), no contexto da UNEB“. Possui também Especialização em Análise de Sistemas pela Faculdade Visconde de Cairu e Bacharelado em Estatística pela Universidade Federal da Bahia. Atua profissionalmente como consultor há mais de 15 anos nas áreas de Data Warehouse, Mineração de Dados, Ferramentas de Tomada de Decisão e Estatística. Atualmente é editor do blog BI com Vatapá. Livro: BI COMO DEVE SER - www.bicomodeveser.com.br

0 comentários: