Espacios. Vol. 37 (Nº 19) Año 2016. Pág. 26
Felicia DE LUCIA Castillo 1; Celso Alberto SAIBEL Santos 2
Recibido: 08/03/16 • Aprobado: 12/04/2016
RESUMO: A apresentação visual dos dados permite uma melhor compreensão por parte dos usuários. Este estudo tem como objetivo fazer uma Revisão Sistemática da Literatura (SLR) existente, sobre a visualização de dados em sistemas de informações geográficas, a fim de abordar questões de pesquisa específicas, resumir os resultados, classificar as pesquisas com pontos em comum e identificar as necessidades de pesquisas futuras. Como resultado, foram revisados e analisados 28 documentos, considerando a informação geral, fontes, ano de publicação, questões de pesquisa e os aspectos relevantes da visualização de dados como: tipos de visualização, atributos visuais, mineração de dados, etc. |
ABSTRACT: The data visual presentation, allows users to get a better and clearer understanding of them. This study aims a systematic literature review (SLR) existing about data visualization concerning a geographic information system, in order to achieve specific research questions, summarize the results, sort the research on common ground and identify future research needs. In that sense, it was reviewed and analyzed 28 documents, considering the general information sources, year of publication, research issues and relevant aspects of data visualization, display types, visual attributes, data mining, among others. |
A Visualização de Dados consiste no uso de interfaces interativas [5], a fim de representar, com mínima entropia visual, um conjunto de dados para um usuário final [8]. Ou seja, a visualização de dados é caracterizada por ser inter-relacional, transformar dados "brutos" em informações relevantes, buscar ter o mínimo de perda de informações, e chegar aos usuários que interagem, transformam e interpretam essas informações.
Além disso, a Visualização de Dados é responsável pela representação do conteúdo visual (dados) para facilitar a compreensão, interpretação, processamento e comunicação desses conteúdos através dos recursos visuais. As representações gráficas de dados ou visualização de dados são construídas com unidades gráficas elementares como linhas, pontos, áreas (superfícies e volumes) com cores planas ou com unidades gráficas complexas como as unidades icônicas capturadas ou de desenho, ou incolores [24].
Entre os benefícios da Visualização de Dados está a possibilidade de observar grandes quantidades de dados rapidamente, facilitar a compreensão de um problema e a descoberta de novos conhecimentos, ajudar a criar uma visão compartilhada de uma situação. Em suma, a Visualização de Dados ajuda na transformação da informação em conhecimento e [30] idealmente deve comunicar com clareza, mas deve também incentivar a participação e atenção do espectador.
1.1. Visualização de dados geoespaciais
A informação geográfica se distingue de outras informações por referir-se a objetos ou fenômenos com uma localização específica no espaço e, portanto, tem um endereço espacial [16]. Devido a essa característica, os locais dos objetos ou fenômenos podem ser visualizados, e essas visualizações, chamadas de mapas, mostram como os objetos do mundo real, como casas, estradas, campos ou montanhas, podem ser abstraídos como um modelo de paisagem digital, de acordo com alguns critérios pré-determinados, e armazenados em Sistemas de Informações Geográficas (SIG), com pontos, linhas, áreas ou volumes.
A Revisão Sistemática da Literatura, constitui um instrumento fundamental para a realização de pesquisas baseadas em evidências. A intenção de uma SLR é abordar uma questão de pesquisa bastante específica, a fim de determinar onde existe agrupamento de estudos que poderiam apoiar uma análise mais completa. A SLR envolve uma pesquisa da literatura capaz de determinar os estudos sobre Visualização de Dados e Sistemas de Informação Geográfica [18] [9].
Nesta seção são apresentados o principal foco e os objetivos da pesquisa, assim como as questões que o trabalho procura responder, e quais obras pesquisadas foram incluídas na investigação.
Os resultados da pesquisa revelam informações importantes sobre a visualização de dados. As conclusões são baseadas em uma análise sistemática dos dados recolhidos. Os métodos de pesquisa são analisados para fornecer uma visão geral das abordagens utilizadas pelos pesquisadores e sua contribuição [18] [9].
Além disso, as questões a serem respondidas por esse trabalho são as seguintes:
A Fase 1 da pesquisa consistiu na busca por informações confiáveis de documentos, artigos científicos, revisões, artigos de conferências, publicações de revistas, repositórios de documentos digitais e institucionais, e livros, reconhecidos pela comunidade acadêmica internacional sobre Visualização de Informação. A biblioteca digital usada para essa busca foi o Google Scholar [3].
Foi escolhido esse motor de busca porque permite o uso de expressões lógicas. Além disso, inclui publicações científicas recentes ou tópicos relacionados com a temática pesquisada. Esse banco de dados é comumente utilizado para a Revisão Sistemática da Literatura.
A definição dos termos para buscar a literatura foi feita através da combinação das seguintes palavras-chave: visualization, visualización, visualização, information, información, informação, geovisualization, geographic information system e Datamining. Utilizando os operadores booleanos OR e AND, foram feitas combinações de termos para formação das expressões lógicas de pesquisa. A sequência lógica booleana utilizada na pesquisa realizada está listada na Tabela 1.
Tabela 1 - Strings da pesquisa
Strings da Pesquisa |
(information visualization OR visualización información OR data visualization OR visualização de informação) |
AND (geographic information system OR geovisualization) |
AND Datamining |
Na Fase 2, os critérios de exclusão e inclusão são aplicados para filtrar literatura irrelevante encontrada na Fase 1, que consistia de 484 trabalhos. Apenas os trabalhos publicados no período de 2005-2015 foram considerados nesta pesquisa, uma vez que 2005 foi o ano do surgimento do Google Earth e a Visualização de Dados em Mapas Web não era viável antes disso.
Os critérios de exclusão e os critérios de inclusão são listados abaixo.
Inclusão
Exclusão
A pesquisa realizada nas bases de dados permitiu a seleção de 32 publicações.
Na Fase 3, os 32 artigos foram lidos. Ao ler o texto completo e responder as perguntas feitas no questionário, foi possível identificar novos documentos que combinavam com os critérios de exclusão, algo que não era possível com as leituras apenas do título e do resumo. Essa fase também foi usada para extrair os dados a serem analisados posteriormente.
Nesta seção, são apresentados os dados extraídos das 28 publicações restantes da Fase 3.
A distribuição dos documentos coletados é mostrada na Figura 1. Pode ser observado que há publicações desde o ano 2005 até o ano 2014. Pode-se inferir que, com o passar do tempo, a visualização de dados ganhou importância, como é mostrado no gráfico. A maioria dos documentos aparecem publicados nos últimos cinco anos, com dois picos importantes em 2012 e 2014.
Figura 1 – Publicações por ano.
Na Tabela 2 são apresentadas as principais fontes de publicação dos artigos.
Tabela 2 - Fontes de Publicações
Fontes de Publicações |
Anuário do Instituto de Geociências |
Business Management and Electronic Information (BMEI) |
Communications and Networking |
Conference on Human Factors in Computing Systems |
Congresso Linked Open Data Brasil |
El profesional de la información |
Expert Systems with Applications |
I Jornadas de SIG Libre |
IEEE Transactions on Visualization & Computer Graphics |
Interactions |
Journal of Visual Languages & Computing |
No Solo Usabilidad |
Presenting Data Effectively |
Revista Avances en Sistemas e Informática |
Revista Cubana de Información en Ciencias de la Salud |
Revista del Grupo de Estudios sobre Geografía y Análisis Espacial con Sistemas de Información Geográfica (GESIG) |
Revista Forestal Latinoamericana |
Revista Geografía y Sistemas de Información Geográfica |
Revista Información Tecnológica |
Revista Ingeniería y Universidad |
Revista Investigaciones Regionales |
Revista Latina de Comunicación Social |
Visual Languages. Proceedings IEEE Symposium |
XV Congreso Nacional de Tecnologías de la Información Geográfica |
Workshop de Investigadores en Ciencias de la Computación |
O tipo de visualização mais apropriada para cada situação está relacionado à representação de dados [23]. A informação geográfica se distingue de outras informações por referir-se a objetos ou fenômenos com uma localização específica no espaço e, portanto, tem um endereço espacial [18]. Alguns autores explicam que devido a essa característica, os locais dos objetos ou fenômenos podem ser visualizados, e essas visualizações, chamadas de mapas, mostram como os objetos do mundo real, por exemplo: casas, estradas, campos ou montanhas, podem ser abstraídos como um modelo de paisagem digital, de acordo com alguns critérios pré-determinados, como pontos, linhas, áreas ou volumes.
Nesta seção, os resultados da pesquisa são relatados segundo a análise da literatura e podem ser visualizados na Figura 2.
Figura 2 – Tipos de Visualização de Dados
Visualização de camadas vetoriais: Visualização de camadas vetoriais representam objetos geométricos na forma de pontos, linhas e polígonos. As camadas vetoriais mantêm semelhança com os elementos clássicos de um cartógrafo em um mapa [20, 13, 25, 21, 1]. Visualização de camadas raster: Visualização de camadas raster é uma camada vetorial de polígonos. Se para cada polígono que faz parte de uma camada raster é atribuído uma cor, o mapa resultante é equivalente a um mapa coropletas [20, 25, 21, 1]. Visualização tridimensional: A terceira dimensão torna mais fácil interpretar uma grande parte da informação mostrada, assim a exibição fica mais acessível e fácil de compreender. Em comparação ao mapa impresso ou a representação na tela bidimensional, a representação em três dimensões é muito mais intuitiva e real. Para ser mais natural e próximo da realidade que representa, um mapa tridimensional é percebido menos como um elemento simbólico e mais como uma realidade [20, 25].
Quando a informação geográfica é apresentada na tela e no contexto de um SIG, diferente de um mapa impresso, ela apresenta interatividade. Quando visualizamos qualquer informação geográfica ou de qualquer elemento gráfico na tela de um computador, ele está sendo usado para transmitir uma linguagem visual. O uso correto da linguagem pode comunicar grandes quantidades de informação e se tornar uma ferramenta muito útil [19, 16, 11, 20, 14, 2, 27, 28]. Exemplos da utilização de atributos visuais podem ser visualizados na Figura 3.
Posição: No caso de um mapa, a posição já está associada com a informação a ser transmitida, isto é, a posição real na zona geográfica do referido objeto que está sendo simbolizado [20, 2, 27].
Tamanho: O tamanho refere-se ao tamanho do símbolo. O tamanho determina a percepção visual de outras variáveis, especialmente quando se trata de pequenos tamanhos [16, 11, 20, 14, 2].
Forma: A forma se aplica principalmente aos símbolos específicos, o posicionamento de uma determinada forma sobre as coordenadas exatas do ponto a ser representado [16, 11, 20, 14, 2, 27, 28].
Cor: A variável cor é a mais importante das variáveis visuais, e que exige um maior grau de detalhe em sua apresentação, devido à complexidade que apresenta e as possibilidades que oferece [16, 11, 20, 14, 2, 27]. A cor usada deve ser escolhida levando em consideração as limitações que os usuários possam ter [16].
Textura: A textura refere-se ao preenchimento de um símbolo, por algum padrão [20, 27].
Orientação: Aplica-se em símbolos específicos, sempre que eles não apresentam simetrias, de maneira que pode haver um problema na percepção da orientação correta [20, 27].
Texto: Nos casos em que é necessário incluir texto, ele deve ser legível, concreto e preciso, de preferência horizontal e suscetível a uma aplicação direta sobre os elementos do gráfico ou diagrama [4, 17, 11, 20, 27, 28].
Figura 3 - Exemplo de utilização de atributos visuais: posição, forma, tamanho, cor, textura e orientação - Fonte: [20]
Nesta seção, os resultados da pesquisa são relatados conforme a análise das publicações. A contribuição da literatura é baseada na mineração de dados espacial e visual, e aplicações destas metodologias nos Sistemas de Informação Geográfica [3, 17, 26, 4, 6, 22, 12, 10, 7, 15, 29]. Mineração de dados espaciais: segundo [29], a mineração de dados espaciais se dá através de um processo de extração de informação factual, inovadora, interessante, oculta, desconhecida, potencialmente útil e compreensível de um conjunto de dados geográficos [3, 17, 26, 4, 22, 12]. Integração de Spatial Data Mining com SIG: a mineração de dados espaciais pode ser integrada com um SIG, devido à composição de suas estruturas de dados, a sua capacidade para analisar a informação geográfica e seu mecanismo de consulta complexa [3, 17, 26, 4]. Pré-processamento de dados espaciais: o pré-processamento de dados espaciais deve ser feito sempre para a descoberta de conhecimentos [3, 26, 4, 22]. Aplicação: [3, 17, 26, 4, 6, 22, 10] apresentam o processo de análise automática, através da implementação de algoritmos, fornecendo a capacidade de procurar correlações não óbvias e potencialmente úteis entre objetos georreferenciados. Mineração de Dados Visual: conforme [17, 26, 4, 6, 22, 18], a mineração de dados visual é um tipo de mineração de apoio à visualização de informação. Descoberta de padrões: a descoberta de padrões na mineração de dados espacial, leva em conta a identificação, localização e distinção dos objetos, além dos padrões correspondentes a dados categóricos e numéricos da mineração de dados tradicional [26, 4, 12, 10].
A distribuição destes artigos e as porcentagens que representa é mostrada na Figura 4.
Figura 4 – Características das pesquisas sobre Mineração de Dados
Como se pode observar, a mineração de dados espaciais tem maior porcentagem nas questões de pesquisa. A mineração de dados espaciais é considerada uma área de mineração de dados tradicional e enfatiza a extração de conhecimento relevante inerente à natureza espacial dos dados.
Atualmente, os Sistemas de Informação Geográfica envolvem o armazenamento e processamento de grandes volumes de dados espaciais com atributos que fornecem informações diretamente associadas a uma localização no espaço, no entanto, existem padrões de comportamento de dados geográficos que podem fornecer novas informações, úteis, relevantes e importantes [3].
A mineração de dados espaciais é o processo de análise automática, através da implementação de algoritmos, fornecendo a capacidade de procurar correlações não óbvias e potencialmente úteis entre objetos geográficos [3]. A aplicação de mineração de dados espaciais leva à descoberta de conhecimento implícito que pode ser demonstrado na informação de dados geográficos, em deduzir padrões ou categorizações, na informação convencional das bases de dados e, no caso de objetos geográficos associativamente, sob a forma de estruturas, de grupos, e vários tipos de relações espaciais [6].
A mineração de dados também é importante na visualização de informação porque ela lida com o desenvolvimento da teoria e métodos que facilitem a construção do conhecimento através de digitalização visual, análise de dados geoespaciais e implementação de ferramentas visuais [3]. A mineração de dados visual enfatiza o desenvolvimento de mapas altamente interativos e ferramentas associadas para exploração de dados, geração de hipóteses e a geração de conhecimento.
A pesquisa apresentou os resultados do estudo da Visualização de Dados em Sistemas de Informação Geográfica. O propósito deste trabalho é disponibilizar aos pesquisadores um mapeamento sobre as características da temática abordada. O estudo utilizou técnicas da revisão sistemática da literatura para a captura de dados que possibilitaram a identificação de padrões da literatura científica e mostrou, assim, que pesquisas deste tipo podem ser promissoras para auxiliar os pesquisadores nessa área de estudo.
Conclui-se que o número de pesquisas nesta área é crescente e é concentrado principalmente nos tipos de visualização de dados geral e na mineração de dados. Além disso, é importante continuar com o desenvolvimento da pesquisa sobre os métodos de Visualização de Dados e os atributos visuais para representar melhor os dados em mapas. A Visualização de Dados, representa neste tempo um grande desafio da gestão de informação, incentivar as pesquisas nesta área e divulgar seus resultados, pode gerar muitos benefícios.
1. Univ. Federal do Espírito Santo. Email: feldlucyca@gmail.com
2. Univ. Federal do Espírito Santo. Email: saibel@inf.ufes.br
3. https://scholar.google.com