Por Grimaldo Oliveira
Muitas ferramentas de Data Discovery e OLAP possuem em seu portfólio a exibição de dados em mapas geográficos que necessitam da localização (coordenadas geográficas) dos municípios do Brasil. O uso de dados geoespacializados, ou seja, informações exibidas em um mapa com pontos de latitude e longitude devem ser sempre analisados para que os pontos exibidos no mapa estejam de forma correta. Muitas vezes as ferramentas possuem aplicativos incorporados que permitem que as referências geográficas sejam encontradas através da denominação PAIS-CIDADE-ESTADO, mas nem sempre isso é tão perfeito.
Em busca de resolver este problema com mapeamento das coordenadas geográficas, mostrarei neste artigo um arquivo contendo todas as informações necessárias para as principais ferramentas de exibição de dados do mercado. Culminarei o artigo com um exemplo na ferramenta Power BI da Microsoft.
1- Passo
Inicialmente busquei nos órgãos do governo como o IBGE, uma das principais fontes de dados geográficos arquivos que resolvessem o problema. Baixei diversos arquivos sem sucesso, encontrei o que estava procurando no site http://www.monolitonimbus.com.br/coordenadas-geograficas-das-cidades-do-brasil/
que facilitou e muito minha busca. Ele possui um arquivo com os dados do IBGE no formato KML (é um formato de arquivo usado para exibir dados geográficos em um navegador da Terra, como Google Earth, Google Maps e Google Maps para celular), mas que deve ser transformado para um formato fácil de ser utilizado pelas ferramentas de mercado, para isso procurei convertê-lo para o formato CSV (formato de arquivo texto extraído da ferramenta Excel) que é facilmente carregado.
Baixei o arquivo: coordenadas_BR.kml
2-Passo
Utilizei um software especifico para leitura de arquivo coordenads_Br.kml. Para facilitar a conversão utilizei o software FME Data Inspector, que permite a gravação no formato desejado, ou seja, em CSV.
3-Passo
Foram gerados 8 arquivos de dados extraídos do arquivo coordenadas_BR.kml, dentre os arquivos gerados foi escolhido o que possui o seguinte layout:
ID - Identificação única do registro
CD_GEOCODSD - Geocódigo interno do IBGE
CD_GEOCODDS - Descritivo do Geocódigo interno do IBGE
NM_DISTRITO - Nome do Distrito
CD_IBGE- Código do IBGE
NM_MUNICIPIO - Nome do Município
NM_MICRO - Nome Microregião
NM_UF - Unidade Federativa
NM_CATEGORIA - Nome da Categoria da Localidade
NM_LOCALIDADE - Nome da Localidade
LONG - Longitude
LAT - Latitude
ALT - Altitude
Um exemplo do formato do arquivo :
A partir deste ponto, o arquivo pode ser utilizado para exibição dos dados.
4- Passo
Para aplicabilidade e demonstração da funcionalidade do arquivo que foi tratado, foi utilizada a ferramenta Power BI da Microsoft unido a um outro arquivo contendo dados fictícios sobre a localização das regiões que possuem mais casos de ZIKA e CHICUNGUNYA.
Os dados de Latitude e Longitude são colocados em locais específicos do objeto MAPA do Power BI, veja:
O campo valor é a quantidade de casos das doenças, as latitudes e longitudes são colocados em seus campos específicos, o Power BI exige que os campos sejam agregados pela média.
Nas principais ferramentas de mercado você encontrará as posições para colocação de latitude e longitude que estão contidas no arquivo MUNICIPIOS-LATITUDE E LONGITUDE-BRASIL.csv
Abaixo o arquivo para seu download.
0 comentários:
Postar um comentário