[SAIBA] Quais são as revelações do Big Data?


Fonte: EXAME



Algumas semanas atrás, minha mulher me mandou um e-mail com as passagens que comprou para nossa viagem à Bahia. No dia seguinte, percebi algo curioso: minhas férias foram automaticamente marcadas no calendário do Google. E eu passei a receber ofertas de hotel, aluguel de carros, sugestões de passeios…
É fantástico, e ao mesmo tempo assustador, que as máquinas e seus programas tenham adquirido tanta ingerência sobre nós e nossos programas. Por um lado, a digitalização e os sistemas inteligentes nos facilitam a vida e ajudam a organizar nossa memória. Por outro lado, a ininterrupta e abrangente coleta de dados privados nos torna o principal produto das empresas que supostamente nos prestam serviço.
Não é apenas o duopólio digital Google e Facebook que empacotam o conhecimento sobre nós para vender a anunciantes. O Uber desenvolve métodos para cobrar valores diferentes para uma corrida, de acordo com a sua urgência ou o seu perfil; bancos começam a usar a coleta de dados para decidir o quão arriscado é emprestar dinheiro para você; já há consultorias vendendo métodos para prever o quanto um consumidor está disposto a pagar por um produto ou serviço (para extrair o máximo de valor para a empresa).
Este é, digamos, o lado não tão branco da força do que se convencionou chamar de Big Data. Mas há um enorme campo positivo, também. Segundo o analista de dados Seth Stephens-Davidowitz, ex-funcionário do Google e agora colaborador do New York Times, o Big Data pode nos ajudar a cumprir o que recomendava o oráculo de Delfos: conhecer a nós mesmos.
Este é o ponto principal de seu livro, Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are (“Todo mundo mente: Big Data, novos dados e o que a internet pode nos dizer sobre quem nós realmente somos”, numa tradução livre). A premissa de Stephens-Davidowitz é que as pesquisas que embasam grande parte do conteúdo das ciências humanas são falhas. Porque, como diz o título de seu livro, os pesquisados mentem.
Tome-se as pesquisas sobre sexo, por exemplo: as mulheres americanas dizem que fazem amor em média 50 vezes por ano, e usam camisinha 16% das vezes; isso daria, nos Estados Unidos, 1,1 bilhão de camisinhas por ano. Os homens dão números diferentes, que indicariam a venda de 1,6 bilhão de camisinhas. Nem um nem outro grupo está certo. Menos de 600 000 camisinhas são vendidas por ano no país.
A mentira não é o único problema das pesquisas tradicionais. Como apontaram os psicólogos Amos Tversky e Daniel Kahneman, pioneiros da economia comportamental, as ciências humanas são repletas de exemplos da Lei dos Pequenos Números – a crença, falaciosa, de se pode inferir as características de toda a população com base em qualquer amostra, não importa o quão pequena ela seja.
Essa falha é potencializada pela preguiça e pela falta de recursos. A maioria dos estudos acadêmicos é realizada por meio de testes com alunos de graduação, que servem de cobaias dos professores. Mas os alunos raramente são representantes fidedignos de amplas classes da população.
Racismo, machismo, depressão… e o erro de Freud
Para nossa sorte, diz Stephens-Davidowitz, o mundo altamente digitalizado nos oferece hoje um caminho mais seguro. Se tendem a mentir para entrevistadores, as pessoas revelam seus verdadeiros desejos e opiniões nas buscas que fazem na internet, protegidas pelo anonimato.
Assim é, por exemplo, que ele desvendou um nível de racismo nos Estados Unidos bem acima do que indicam as pesquisas tradicionais. Como?
Contabilizando a busca da palavra “nigger” (negro, um termo altamente ofensivo nos país). Em alguns estados, após a eleição de Barack Obama, em 2008, houve mais buscas com os termos “nigger president” do que “primeiro presidente preto (black, o termo mais comum no país)”.
Com base nas pesquisas, Stephens-Davidowitz desenhou um mapa do racismo no país. E era um mapa bem diferente do esperado. “Republicanos no sul podem ser mais propensos a admitir que são racistas. Mas muito democratas no norte têm atitudes semelhantes.”
Na época em que fez esse estudo, as publicações acadêmicas tradicionais o rejeitaram. Acharam que ele exagerava o nível de racismo no país. Quatro anos depois, o jornalista de dados Nate Silver revelou que o fator que mais correlação tinha com o apoio a Donald Trump nas primárias do Partido Republicano para escolha de seu candidato era justamente o mapa de racismo elaborado por Stephens-Davidowitz. As áreas que mais apoiavam Trump eram praticamente as mesmas em que havia maior número de buscas no Google com a palavra “nigger”.
A análise das buscas pode ser usada para desvendar uma série de questões para as quais as pesquisas tradicionais não têm resposta satisfatória. Eis alguns exemplos:
Nos meses de inverno, lugares quentes, como o Havaí, apresentam 40% menos buscas relacionadas à depressão do que lugares frios, como Illinois. Viajar em busca do sol poderia ser um tratamento para a depressão duas vezes mais eficaz do que tomar antidepressivos (cujo efeito é, segundo pesquisas, de 20% de queda no número de casos).
É comum relacionar a ansiedade ao ritmo frenético das grandes cidades. Mas as buscas no Google sugerem que ela tende a ser maior nas áreas rurais, em lugares com nível mais baixo de renda e educação.
O maior receio das mulheres em relação a seus maridos não é que eles as traiam. É que eles sejam gays. Há 10% mais buscas com a frase “meu marido é gay?” do que com “meu marido me trai?”. A preocupação com a orientação sexual do marido é oito vezes maior que a próxima da lista, “meu marido é alcoólatra?”, e dez vezes maior que a seguinte, sobre depressão. E a busca é maior nos estados em que o casamento gay é proibido (onde possivelmente há mais maridos “no armário”).
Boa parte do machismo que cria obstáculos para a ascensão das mulheres vem de casa. É duas vezes mais provável que os pais perguntem na internet se seu filho é um gênio do que se sua filha é. Na realidade, pesquisas mostram que na infância as meninas costumam ter vocabulário mais elaborado e ter raciocínio lógico melhor. Da mesma forma, há o dobro de buscas com “minha filha está acima do peso?” do que “meu filho está acima do peso?”, embora 35% dos meninos americanos tenha sobrepeso, ante 28% das meninas.
O Big Data permite até, em certos casos, testar hipóteses que antes eram impossíveis de submeter ao escrutínio. Stephens-Davidowitz fez isso com algumas teses centrais da psicanálise freudiana.
De acordo com a teoria de Freud, os sonhos revelam desejos íntimos. É comum interpretar o sonho com uma banana, por exemplo, como uma mensagem sexual, dado o seu formato fálico. Idem para o pepino.
Analisando um banco de dados de um aplicativo em que as pessoas descrevem seus sonhos, com dezenas de milhares de entradas, Stephens-Davidowitz notou que bananas são a segunda fruta que mais aparece. Mas ela é também a segunda fruta mais consumida nos Estados Unidos. Pepinos são a sétima mais frequente ocorrência em sonhos… e o sétimo vegetal mais consumido.
A aparição de ambos nos sonhos é exatamente o que se esperaria se a forma não tivesse absolutamente nada a ver com sua presença nos nossos sonhos.
Da mesma forma, o estudo de uma base de dados da Microsoft, com 40.000 erros de tipografia, revelou que os “atos falhos” em que a troca de letras sugere um conteúdo sexual ocorrem na mesma frequência que o acaso sugeriria (levando em conta todas as trocas de letras possíveis, as combinações que sugerem sexualidade aparecem um número de vezes similar ao que apareceriam se um computador estivesse cometendo os erros). Ou seja, elas provavelmente não revelam desejos ocultos.

Compatilhe no Google Plus

Sobre Grimaldo Oliveira

Mestre pela Universidade do Estado da Bahia (UNEB) no Curso de Mestrado Profissional Gestão e Tecnologias Aplicadas à Educação (GESTEC) com o projeto “GESMOODLE – Ferramenta de acompanhamento do aluno de graduação, no ambiente virtual de aprendizagem(MOODLE), no contexto da UNEB“. Possui também Especialização em Análise de Sistemas pela Faculdade Visconde de Cairu e Bacharelado em Estatística pela Universidade Federal da Bahia. Atua profissionalmente como consultor há mais de 15 anos nas áreas de Data Warehouse, Mineração de Dados, Ferramentas de Tomada de Decisão e Estatística. Atualmente é editor do blog BI com Vatapá. Livro: BI COMO DEVE SER - www.bicomodeveser.com.br

0 comentários: