[APRENDA] 13 mandamentos para os cientistas de dados

Fonte:CIO

Mais do que simplesmente bits e bytes, Big Data é agora uma oportunidade de negócio multibilionário. Organizações mais experientes, dos varejistas aos fabricantes, estão rapidamente descobrindo o poder de transformar em insights os códigos postais dos consumidores e seu histórico de compras. Na verdade, o McKinsey Global Institute, braço de pesquisa da McKinsey & Co., estima que o Big Data possa aumentar os lucros no setor de varejo em 60%. E estudo recente do Boston Consulting Group revela que os dados pessoais podem ajudar as empresas a atingirem maior eficiência de negócios e personalizar novos produtos.
Mas ao mesmo tempo que aproveitar o poder da análise de dados é claramente uma vantagem competitiva, a mineração de dados com excesso de zelo pode facilmente sair pela culatra. Com as empresas tornando-se especialistas no fatiamento de dados para revelar detalhes tão pessoais como a inadimplência das hipotecas e os riscos de ataque cardíaco, a ameaça de violações de privacidade cresce.
Basta perguntar a Kord Davis, estrategista digital e autor de Ética da Big Data: Risco de equilíbrio e Inovação. Segundo ele, "os valores que você infundir em suas práticas de manipulação de dados pode ter algumas consequências muito reais".
"As organizações que são transparentes sobre o seu uso de dados são capaz de usar isso como uma vantagem competitiva", afirma Davis. "As pessoas estão começando a se tornar muito interessadas no que pode acontecer lá fora, com seus dados. Portanto, organizações éticas no compartilhamento de informações estarão uma posição muito melhor par se tornarem confiáveis."
Honestidade é realmente a melhor política 
Profissionais de TI estão descobrindo que equilibrar o poder de algoritmos sofisticados com os direitos do consumidor é mais do que evitar a má publicidade ou a perda de vendas. Nos dias de hoje, vale a pena ser honesto - literalmente.

Muitos CIOs e cientistas de dados já enfrentam o desafio de calcular o valor real dos dados confidenciais e seus insights respeitando os direitos dos consumidores e até mesmo procurando ganhar a sua confiança. Como a disponibilidade de dados cresce, e as técnicas de manipulação se multiplicam, alguns profissionais de TI estão tomando o assunto em suas próprias mãos, com abordagens inovadoras para a prevenção de abusos.
A empresa de análise de dados californiana Retention Science é um exemplo perfeito. Usa algoritmos de previsão e dados, como renda familiar, histórico de compras e pontuação de crédito para ajudar as empresas a preverem a probabilidade de compra de um cliente e criarem campanhas de retenção. Além dos dados fornecidos pelo cliente, a Retention Science também conta com os dados que licencia de terceiros para atingir os consumidores certos, no momento certo.
Para criar campanhas direcionadas respeitando a privacidade dos consumidores a Retention Science estabeleceu regras rígidas e rápidas que regem o uso de dados. Por um lado, a empresa se recusa a compartilhar dados entre clientes. Por exemplo, se a Gap fosse cliente, e tivesse fornecido dados de consumidores à Retention Science, essa informação jamais seria compartilhada - mesmo anonimamente - com outros clientes de varejo.
Além disso, apesar de lidar com terabytes de dados confidenciais, a Retention Science obriga que todos os seus cientistas de dados, muitos dos quais professores e pesquisadores, assinem acordos de confidencialidade. "Eles não têm permissão para compartilhar ou usar os dados em qualquer outro lugar ou para suas próprias publicações", diz Jerry Jao, CEO da companhia.
Além de manter seus próprios funcionários responsáveis pela confidencialidade dos dados, a Retention Science também "só trabalha com empresas totalmente empenhadas em obter o consentimento dos consumidores antes de usar seus dados", diz Jao. "Nós não queremos incluir informações de indivíduos se eles não concederem no acesso a elas em primeiro lugar."
Transparência também é importante 
Embora a definição de controles internos ajude, as empresas interessadas na mineração de dados podem dar um passo adiante, oferecendo aos consumidores acesso em primeira mão sobre tudo o que sabem sobre eles. A BlueKai, de Cupertino, também na Califórnia, é um bom exemplo de política de livro aberto. Ela oferece uma plataforma de gerenciamento de dados na qual comerciantes e editores podem gerenciar e ativar dados para a construção de campanhas de marketing direcionadas. Em 2008, a BlueKai decidiu lançar um portal online onde os consumidores pudessem descobrir os cookies da BlueKai e de seus parceiros e os dados recolhidos a partir deles, item por item, com base em seus históricos de navegação.

Considere, por exemplo, uma mulher interessada em comprar uma bicicleta vermelha. Como ela visita diferentes sites de artigos esportivos que fazem parceria com BlueKai, uma coleção de cookies anônimos são armazenados em seu browser. Com base nesse histórico de navegação, parceiros de marketing da BlueKai exibem anúncios comportamentais no computador da mulher, relevantes para sua busca pela bicicleta vermelha ideal.
A BlueKai torna esse processo mais transparente, e ainda permite que os visitantes optem por sair do registro totalmente ou por atualizar seus perfis anônimos, alterando as suas preferencias.
De acordo com Omar Tawakol, CEO da BlueKai, o pensamento por trás dessa prática da companhia é o de que, "se há dados conhecidos e negociáveis, eles devem ser completamente controlados pelos consumidores." Por esta razão, a BlueKai também incentiva seus parceiros a promoverem uma maior transparência, adotando a prática em seus próprios sites.
"A beleza do que fazemos é que não quero saber quem você é", diz Tawakol. "Nós não queremos saber o nome de ninguém. Nós não queremos saber nada reconhecível sobre o consumidor. Tudo o que queremos é mostrar a ele que os cookies são acessíveis, e têm atributos associados a eles."
A BlueKai não é o único grande player do mercado de análise de dados a distribuir passes para os bastidores. O marketing da empresa de tecnologia Acxiom ganhou as manchetes recentemente ao lançar o AboutTheData.com, um site gratuito onde as pessoas podem ver algumas das informações que a empresa reúne sobre elas. Detalhes variam do estado civil ao tipo de veículo que elas dirigem. Basta digitar informações pessoais chave para descobrir o que os anunciantes estão usando para ajudar a adequar as suas mensagens de marketing.
O fato de que poderosos corretores de dados, como a Acxiom, estejam ajudando a desmistificar as iniciativas de marketing baseadas em dados não é nenhuma surpresa para Tawakol, CEO da BlueKai. Ele acredita que as empresas não têm escolha, a não ser responder positivamente às mudanças sentimento do consumidor em torno de privacidade de dados. "Anos atrás, as pessoas construíram empresas de dados nas sombras onde os consumidores não tinham qualquer controle", diz ele. "Estamos em uma era diferente agora - os consumidores querem e devem estar no controle."
Mas na opinião de Kord Davis, o movimento em direção a uma maior transparência é cínico. Observando que "as organizações estão começando a enfrentar um escrutínio cada vez mais rigoroso em torno de suas práticas de dados", Davis alerta que muitas iniciativas que prometem às pessoas uma visão sobre como estão sendo monitoradas não passam de jogadas de marketing. "Eles não revelam, de fato, quem está comprando esses dados e o que estão fazendo com ele", argumenta o estrategistas.
Políticas de uso sob ataque 
Infelizmente, a maior transparência nem sempre se traduz em uma maior compreensão. As políticas de privacidade dos titãs da indústria, tais como Facebook e Google têm estado sob fogo cerrado, por serem de difícil compreensão. Apresentadas como um tratado de 70 páginas cheias de termos vagos como "informações não pessoalmente identificáveis," algumas políticas têm provocado arrepios nos reguladores norte-americanos.

"As pessoas não entendem o que estão aceitando", diz Davis. "As organizações tornam os termos de uso muito mais complicados do que deveriam ser." Além disso, acrescenta, "ler todos os termos de serviços que recebemos levaria 76 dias do ano."
Isso não significa que as políticas de privacidade não tenham valor no mundo do Big Data. Apenas que as empresas precisam "comunicar melhor o valor que os consumidores receberão em troca das informações que entregam".
Em uma recente pesquisa global, realizada pela Infosys, 39% dos entrevistados disseram que consideram que a mineração de dados invasiva. E 72% disseram que não sentem que as promoções online ou e-mails que recebam estejam diretamente relacionados aos seus interesses e necessidades pessoais. No entanto, segundo Nans Sivaram, da Infosys, "os consumidores estão dispostos a fornecer informações pessoais, desde que haja boa razão para isso."
Por um lado, os consumidores querem receber produtos e serviços altamente direcionados e personalizado. Por outro lado, não querem sentir que seus dados pessoais estejam sendo usados para gerar lucro.
"Os varejistas precisam fazer um trabalho muito melhor de uso dos dados que já possuem para atingir seus clientes", diz Sivaram. "Têm que ter cuidado para que esse uso não seja visto como invasivo, para não terem problemas e perderem a confiança de seus clientes." Então, qual é a solução? De acordo com Sivaram, a resposta é "estabelecer os incentivos corretos" para que as pessoas concordem em divulgar seus dados pessoais.
A mesma regra de reciprocidade se aplica ao conteúdo online. Diz Tawakol, da BlueKai: "Quando você pergunta se as pessoas preferem pagar por seu conteúdo ou terem anúncios direcionados ao lado desse conteúdo, geralmente 90% das pessoas preferem ter conteúdo patrocinado. "
A definição de um código de conduta 
No entanto, nem todos acreditam que a carga deve ser colocada sobre o consumidor. Não de trata apenas de fazê-lo concordar alegremente em compartilhar seus dados, decifrar as confusas políticas de privacidade ou pontuações de crédito para a troca de cupons de supermercado. Na opinião de Michael Walker, os profissionais Big Data devem adotar um código de ética. Sócio-gerente da Rosa Business Technologies, integradora de sistemas com base em Denver, Walker elaborou um código de conduta para os profissionais de Big Data que cobre tudo, desde o papel dos cientistas de dados até suas responsabilidades diárias.

De acordo com Michael Walker, os cientistas de dados devem ser considerados a altos níveis de padrões éticos, assim como médicos e advogados. Para esse fim ele criou um conjunto de mandamentos para os trituradores de dados – uma lista que tem como objetivo manter os cientistas de dados na conduta correta enquanto preserva a privacidade do consumidor.
Na visão de Walker, os cientistas de dados não devem:
1. Falhar em utilizar métodos científicos no desempenho da ciência de dados.
2. Falhar em classificar a qualidade da evidência de uma maneira razoável e compreensível para o cliente.
3. Alegar que evidências fracas ou incertas sejam evidências fortes.
4. Fazer mau uso de evidências fracas ou incertas para comunicar uma realidade falsa ou promover uma ilusão de compreensão.
5. Falhar em classificar a qualidade dos dados de modo razoável e compreensível para o cliente.
6. Alegar que dados ruins ou incertos são dados bons.
7. Fazer mau uso de dados de qualidade ruim ou incerta para comunicar uma realidade falsa ou promover uma ilusão de compreensão.
8. Falhar em divulgar tudo e todos os resultados de ciência de dados ou envolver- se no ocultamento de evidências.
9. Falhar em tentar replicar os resultados da ciência de dados.
10. Falhar em divulgar que tais resultados de ciência de dados não puderam ser replicados.
11. Fazer mal uso dos resultados da ciência de dados para comunicar uma realidade falsa ou promover uma ilusão de compreensão.
12. Falhar em divulgar experimentos fracassados ou evidências refutativas familiares ao cientista de dados para ser diretamente adverso à posição do cliente.
13. Oferecer evidência que o cientista de dados sabe ser falsa.
Caso um cientista de dados questione a qualidade dos dados ou evidência, ele deve divulgar isto para o cliente. Caso um cientista tenha oferecido evidência material e depois descubra que a mesma é falsa, ele deve tomar as medidas corretivas razoáveis, incluindo a divulgação para o cliente. Um cientista de dados deve divulgar e rotular as evidências que ele acredita razoavelmente serem falsas.
"As empresas estão começando a entender o perigo de utilizações secundárias de informação e dos abusos com os dados pessoais das pessoas", diz Walker. "Uma vez que elas começam a pensar sobre isso, passam a ser muito favoráveis à adoção de um código de ética."
De fato, em uma pesquisa de agosto de 2013, conduzida pela Revolution Analytics, 80% dos entrevistados disseram concordar com a existência de um quadro ético para coleta e uso de dados. E mais da metade dos cientistas de dados pesquisados concordaram que a ética já desempenha um papel importante em suas pesquisas.
"A minha solução é ter algum tipo de código de conduta profissional que os cientistas de dados concordem voluntariamente a seguir para proteger os dados confidenciais das pessoas", diz Walker. Só através da criação de uma espécie de Juramento de Hipócrates para profissionais de análises de dados, Walker acredita que os cientistas de dados venham a ter as bases morais e legais para se recusarem a usar dados de maneiras que ameacem violar os direitos de privacidade dos consumidores.
Walker não é o primeiro a conceber um código de ética para os analistas. No início deste ano, o Institute for Operations Research and the Management Sciences (INFORMS) elaborou um código de ética para acompanhar o lançamento do seu programa de certificação Certified Professional Analytics (CAP).
No entanto, Davis acredita que apesar das nobres intenções nobres, é muito fácil deixar de cumprir um código de ética” escrito em um pedaço de papel e esquecido no fundo de uma gaveta". O desafio, diz ele, "é compreender o que você realmente faz com dados e alinhar com os valores compartilhados na organização." Infelizmente, diz ele, determinar os reais valores de uma organização, e se as suas práticas de dados refletem ou não essas prioridades, é uma conversa muito diferente da que estamos acostumados a ver em um ambiente “empresarial."
Há ainda profissionais de TI que sustentem a tese de que a proteção da privacidade simplesmente não é trabalho de um cientista de dados. “O trabalho deles é extrair insights interessantes a partir dos dados", diz Ryan Kalember, diretor de produto da WatchDox, fornecedora de ferramentas de segurança de Palo Alto, na Califórnia.
Mercado irá conduzir respostas 
Na opinião de Tawakol, as mudanças na consciência do consumidor sobre a privacidade de dados (ou a falta dela) têm muito mais chance de estimular reformas nas práticas de coleta de dados do que as legislações. Empresas que continuarem insistindo em não serem transparentes serão ultrapassadas.

"Há muitas vantagens em ter os dados analisados e empresas adaptando produtos e serviços específicos para as preferências dos clientes. Mas é realmente interesse das empresas respeitarem os dados privados das pessoas?", pergunta ele.
Compatilhe no Google Plus

Sobre Grimaldo Oliveira

Mestre pela Universidade do Estado da Bahia (UNEB) no Curso de Mestrado Profissional Gestão e Tecnologias Aplicadas à Educação (GESTEC) com o projeto “GESMOODLE – Ferramenta de acompanhamento do aluno de graduação, no ambiente virtual de aprendizagem(MOODLE), no contexto da UNEB“. Possui também Especialização em Análise de Sistemas pela Faculdade Visconde de Cairu e Bacharelado em Estatística pela Universidade Federal da Bahia. Atua profissionalmente como consultor há mais de 15 anos nas áreas de Data Warehouse, Mineração de Dados, Ferramentas de Tomada de Decisão e Estatística. Atualmente é editor do blog BI com Vatapá. Livro: BI COMO DEVE SER - www.bicomodeveser.com.br

0 comentários: