[CONTEÚDO] 11 bases de dados gratuitas para mineração, estudos e testes

Fonte: Big Data Business 



Este artigo foi originalmente publicado em 02/05/16 e seu conteúdo foi atualizado e estendido em 25/05/2017
Se dados são o novo petróleo da humanidade, como dizem as máximas sobre Big Data, nada mais justo que irmos em busca de novas “fontes de perfuração” (ou seja, novas bases de dados).
O trabalho de Big Data é interessante, sobretudo, por sua versatilidade. Se já podemos tirar grandes insights fazendo estudos e análises de databases internas de qualquer empresa, imagine os insights possíveis quando cruzamos essas informações com diferentes fontes de dados externos.
Em alguns casos, o cruzamento dessa variedade de dados é o maior diferencial para um trabalho poderoso de mineração.
As empresas que decidiram dar um passo rumo ao futuro e investir em Big Data Analytics já costumam ter em mente as fontes de informação que querem trabalhar de forma mais esclarecida, mas nem sempre esse é o cenário. E mesmo que a decisão da empresa seja trabalhar com dados internos, é sempre um exercício positivo olharmos o “lado de fora” e buscar novas bases.
Mas, afinal de contas, onde podemos encontrar dados externos de fontes confiáveis?
Selecionamos algumas bases de dados públicos que poderão te inspirar a trabalhar, estudar e testar técnicas de Big Data ou que simplesmente serão úteis no seu dia a dia. Confira:

1 – European Soccer Database (Kaggle)

Kaggle é um dos principais sites de Data Science do mundo. Dentre os vários recursos que você encontra nele, um dos melhores é a seção específica para bases de dados, com milhares de opções disponibilizadas aos usuários.
Uma das bases mais legais do Kaggle é esta, de dados do futebol europeu. Se você gosta de explorar e visualizar dados do esporte bretão, ela é um prato cheio.
A base reúne milhares de dados das temporadas europeias de 2008 a 2016, incluindo aí mais de 25 mil partidas (e todas as estatísticas desses jogos, como posse de bola, número de faltas, de escanteios e por aí vai), 10 mil jogadores – como Zlatan Ibrahimovic, que ilustra este artigo – e escalações das equipes.

2 – Portais de transparência

Graças à recente Lei de Acesso à Informação, todas as entidades públicas têm a obrigação de divulgarem todos os detalhes de suas gestões. Isso tem sido feito através dos chamados Portais de Transparência.
Você pode pesquisar o da sua cidade, do seu estado ou visitar alguns dos exemplos a seguir:

LEIA MAIS EM .... BIG DATA BUSINESS 
Compatilhe no Google Plus

Sobre Grimaldo Oliveira

Mestre pela Universidade do Estado da Bahia (UNEB) no Curso de Mestrado Profissional Gestão e Tecnologias Aplicadas à Educação (GESTEC) com o projeto “GESMOODLE – Ferramenta de acompanhamento do aluno de graduação, no ambiente virtual de aprendizagem(MOODLE), no contexto da UNEB“. Possui também Especialização em Análise de Sistemas pela Faculdade Visconde de Cairu e Bacharelado em Estatística pela Universidade Federal da Bahia. Atua profissionalmente como consultor há mais de 15 anos nas áreas de Data Warehouse, Mineração de Dados, Ferramentas de Tomada de Decisão e Estatística. Atualmente é editor do blog BI com Vatapá. Livro: BI COMO DEVE SER - www.bicomodeveser.com.br

0 comentários: