Espacios. Vol. 37 (Nº 19) Año 2016. Pág. 26

Visualização de dados em Sistemas de Informação Geográfica: uma revisão sistemática da literatura

Viewing data in geographic information Systems: a systematic review of the literature

Felicia DE LUCIA Castillo 1; Celso Alberto SAIBEL Santos 2

Recibido: 08/03/16 • Aprobado: 12/04/2016


Conteúdo

1. Introdução

2. Método

3. Resultados

4. Conclusão

Referências


RESUMO:

A apresentação visual dos dados permite uma melhor compreensão por parte dos usuários. Este estudo tem como objetivo fazer uma Revisão Sistemática da Literatura (SLR) existente, sobre a visualização de dados em sistemas de informações geográficas, a fim de abordar questões de pesquisa específicas, resumir os resultados, classificar as pesquisas com pontos em comum e identificar as necessidades de pesquisas futuras. Como resultado, foram revisados e analisados 28 documentos, considerando a informação geral, fontes, ano de publicação, questões de pesquisa e os aspectos relevantes da visualização de dados como: tipos de visualização, atributos visuais, mineração de dados, etc.
Palavras chave: Visualização, visualização de dados, SIG, dados, mapas.

ABSTRACT:

The data visual presentation, allows users to get a better and clearer understanding of them. This study aims a systematic literature review (SLR) existing about data visualization concerning a geographic information system, in order to achieve specific research questions, summarize the results, sort the research on common ground and identify future research needs. In that sense, it was reviewed and analyzed 28 documents, considering the general information sources, year of publication, research issues and relevant aspects of data visualization, display types, visual attributes, data mining, among others.
Keywords: Visualization, data visualization, GIS, data, map.

1. Introdução

A Visualização de Dados consiste no uso de interfaces interativas [5], a fim de representar, com mínima entropia visual, um conjunto de dados para um usuário final [8]. Ou seja, a visualização de dados é caracterizada por ser inter-relacional, transformar dados "brutos" em informações relevantes, buscar ter o mínimo de perda de informações, e chegar aos usuários que interagem, transformam e interpretam essas informações.

Além disso, a Visualização de Dados é responsável pela representação do conteúdo visual (dados) para facilitar a compreensão, interpretação, processamento e comunicação desses conteúdos através dos recursos visuais. As representações gráficas de dados ou visualização de dados são construídas com unidades gráficas elementares como linhas, pontos, áreas (superfícies e volumes) com cores planas ou com unidades gráficas complexas como as unidades icônicas capturadas ou de desenho, ou incolores [24].

Entre os benefícios da Visualização de Dados está a possibilidade de observar grandes quantidades de dados rapidamente, facilitar a compreensão de um problema e a descoberta de novos conhecimentos, ajudar a criar uma visão compartilhada de uma situação. Em suma, a Visualização de Dados ajuda na transformação da informação em conhecimento e [30] idealmente deve comunicar com clareza, mas deve também incentivar a participação e atenção do espectador.

1.1. Visualização de dados geoespaciais

A informação geográfica se distingue de outras informações por referir-se a objetos ou fenômenos com uma localização específica no espaço e, portanto, tem um endereço espacial [16]. Devido a essa característica, os locais dos objetos ou fenômenos podem ser visualizados, e essas visualizações, chamadas de mapas, mostram como os objetos do mundo real, como casas, estradas, campos ou montanhas, podem ser abstraídos como um modelo de paisagem digital, de acordo com alguns critérios pré-determinados, e armazenados em Sistemas de Informações Geográficas (SIG), com pontos, linhas, áreas ou volumes.

2. Método

A Revisão Sistemática da Literatura, constitui um instrumento fundamental para a realização de pesquisas baseadas em evidências. A intenção de uma SLR é abordar uma questão de pesquisa bastante específica, a fim de determinar onde existe agrupamento de estudos que poderiam apoiar uma análise mais completa. A SLR envolve uma pesquisa da literatura capaz de determinar os estudos sobre Visualização de Dados e Sistemas de Informação Geográfica [18] [9].

 2.1. Desenho do estudo

Nesta seção são apresentados o principal foco e os objetivos da pesquisa, assim como as questões que o trabalho procura responder, e quais obras pesquisadas foram incluídas na investigação.

Os resultados da pesquisa revelam informações importantes sobre a visualização de dados. As conclusões são baseadas em uma análise sistemática dos dados recolhidos. Os métodos de pesquisa são analisados para fornecer uma visão geral das abordagens utilizadas pelos pesquisadores e sua contribuição [18] [9].

Além disso, as questões a serem respondidas por esse trabalho são as seguintes:

  1. Como poderiam se classificar os tipos de visualização de dados em sistemas de informação geográfica?
  2. Quais são os atributos visuais para a visualização de dados em sistemas de informação geográfica?
  3. Qual é o tipo de conhecimento extraído a partir dos dados em sistemas de informação geográfica?

2.2. Realização

A Fase 1 da pesquisa consistiu na busca por informações confiáveis de documentos, artigos científicos, revisões, artigos de conferências, publicações de revistas, repositórios de documentos digitais e institucionais, e livros, reconhecidos pela comunidade acadêmica internacional sobre Visualização de Informação. A biblioteca digital usada para essa busca foi o Google Scholar [3].

Foi escolhido esse motor de busca porque permite o uso de expressões lógicas. Além disso, inclui publicações científicas recentes ou tópicos relacionados com a temática pesquisada. Esse banco de dados é comumente utilizado para a Revisão Sistemática da Literatura.

A definição dos termos para buscar a literatura foi feita através da combinação das seguintes palavras-chave: visualization, visualización, visualização, information, información, informação, geovisualization, geographic information system e Datamining. Utilizando os operadores booleanos OR e AND, foram feitas combinações de termos para formação das expressões lógicas de pesquisa. A sequência lógica booleana utilizada na pesquisa realizada está listada na Tabela 1.

Tabela 1 - Strings da pesquisa

Strings da Pesquisa

(information visualization OR visualización información OR data visualization OR visualização de informação)

AND (geographic information system OR geovisualization)

AND Datamining

Na Fase 2, os critérios de exclusão e inclusão são aplicados para filtrar literatura irrelevante encontrada na Fase 1, que consistia de 484 trabalhos. Apenas os trabalhos publicados no período de 2005-2015 foram considerados nesta pesquisa, uma vez que 2005 foi o ano do surgimento do Google Earth e a Visualização de Dados em Mapas Web não era viável antes disso.

Os critérios de exclusão e os critérios de inclusão são listados abaixo.

Inclusão

  1. Tem foco na visualização de dados georreferenciados;
  2. Avalia métodos de visualização de dados georreferenciados;
  3. Analisa a visualização de dados georreferenciados em mapas Web;
  4. Apresenta ferramenta, sistema ou componente para visualização de dados georreferenciados;
  5. Apresenta estudos de mapeamentos, surveys ou revisões de literatura a respeito de visualização de dados georreferenciados;

Exclusão

  1. Não trata de visualização de dados georreferenciados;
  2. Relaciona visualização de dados em sistemas diferentes dos sistemas de informação geográfica;
  3. Utiliza sistema de visualização fora do ambiente Web;
  4. Monografias, prefácios, sumários, entrevistas, notícias, tutoriais e pôsteres;
  5. Publicações que não estejam em espanhol, inglês ou português;
  6. Publicações com acesso restrito.

A pesquisa realizada nas bases de dados permitiu a seleção de 32 publicações.

Na Fase 3, os 32 artigos foram lidos. Ao ler o texto completo e responder as perguntas feitas no questionário, foi possível identificar novos documentos que combinavam com os critérios de exclusão, algo que não era possível com as leituras apenas do título e do resumo. Essa fase também foi usada para extrair os dados a serem analisados posteriormente.

3. Resultados

Nesta seção, são apresentados os dados extraídos das 28 publicações restantes da Fase 3.

3.1. Visão Geral

A distribuição dos documentos coletados é mostrada na Figura 1. Pode ser observado que há publicações desde o ano 2005 até o ano 2014. Pode-se inferir que, com o passar do tempo, a visualização de dados ganhou importância, como é mostrado no gráfico. A maioria dos documentos aparecem publicados nos últimos cinco anos, com dois picos importantes em 2012 e 2014.

 

Figura 1 – Publicações por ano.

 

Na Tabela 2 são apresentadas as principais fontes de publicação dos artigos.

Tabela 2 - Fontes de Publicações

Fontes de Publicações

Anuário do Instituto de Geociências

Business Management and Electronic Information (BMEI)

Communications and Networking

Conference on Human Factors in Computing Systems

Congresso Linked Open Data Brasil

El profesional de la información

Expert Systems with Applications

I Jornadas de SIG Libre

IEEE Transactions on Visualization & Computer Graphics

Interactions

Journal of Visual Languages & Computing

No Solo Usabilidad

Presenting Data Effectively

Revista Avances en Sistemas e Informática

Revista Cubana de Información en Ciencias de la Salud

Revista del Grupo de Estudios sobre Geografía y Análisis Espacial con Sistemas de Información Geográfica (GESIG)

Revista Forestal Latinoamericana

Revista Geografía y Sistemas de Información Geográfica

Revista Información Tecnológica

Revista Ingeniería y Universidad

Revista Investigaciones Regionales

Revista Latina de Comunicación Social

Visual Languages. Proceedings IEEE Symposium

XV Congreso Nacional de Tecnologías de la Información Geográfica

Workshop de Investigadores en Ciencias de la Computación

 3.2. Tipos de visualização de dados

O tipo de visualização mais apropriada para cada situação está relacionado à representação de dados [23]. A informação geográfica se distingue de outras informações por referir-se a objetos ou fenômenos com uma localização específica no espaço e, portanto, tem um endereço espacial [18]. Alguns autores explicam que devido a essa característica, os locais dos objetos ou fenômenos podem ser visualizados, e essas visualizações, chamadas de mapas, mostram como os objetos do mundo real, por exemplo: casas, estradas, campos ou montanhas, podem ser abstraídos como um modelo de paisagem digital, de acordo com alguns critérios pré-determinados, como pontos, linhas, áreas ou volumes.

Nesta seção, os resultados da pesquisa são relatados segundo a análise da literatura e podem ser visualizados na Figura 2.

Figura 2 – Tipos de Visualização de Dados

Visualização de camadas vetoriais: Visualização de camadas vetoriais representam objetos geométricos na forma de pontos, linhas e polígonos. As camadas vetoriais mantêm semelhança com os elementos clássicos de um cartógrafo em um mapa [20, 13, 25, 21, 1]. Visualização de camadas raster: Visualização de camadas raster é uma camada vetorial de polígonos. Se para cada polígono que faz parte de uma camada raster é atribuído uma cor, o mapa resultante é equivalente a um mapa coropletas [20, 25, 21, 1]. Visualização tridimensional: A terceira dimensão torna mais fácil interpretar uma grande parte da informação mostrada, assim a exibição fica mais acessível e fácil de compreender. Em comparação ao mapa impresso ou a representação na tela bidimensional, a representação em três dimensões é muito mais intuitiva e real. Para ser mais natural e próximo da realidade que representa, um mapa tridimensional é percebido menos como um elemento simbólico e mais como uma realidade [20, 25].

3.3. Atributos visuais

Quando a informação geográfica é apresentada na tela e no contexto de um SIG, diferente de um mapa impresso, ela apresenta interatividade. Quando visualizamos qualquer informação geográfica ou de qualquer elemento gráfico na tela de um computador, ele está sendo usado para transmitir uma linguagem visual. O uso correto da linguagem pode comunicar grandes quantidades de informação e se tornar uma ferramenta muito útil [19, 16, 11, 20, 14, 2, 27, 28]. Exemplos da utilização de atributos visuais podem ser visualizados na Figura 3.

Atributos Visuais

Posição: No caso de um mapa, a posição já está associada com a informação a ser transmitida, isto é, a posição real na zona geográfica do referido objeto que está sendo simbolizado [20, 2, 27].

Tamanho: O tamanho refere-se ao tamanho do símbolo. O tamanho determina a percepção visual de outras variáveis, especialmente quando se trata de pequenos tamanhos [16, 11, 20, 14, 2].

Forma: A forma se aplica principalmente aos símbolos específicos, o posicionamento de uma determinada forma sobre as coordenadas exatas do ponto a ser representado [16, 11, 20, 14, 2, 27, 28].

Cor: A variável cor é a mais importante das variáveis visuais, e que exige um maior grau de detalhe em sua apresentação, devido à complexidade que apresenta e as possibilidades que oferece [16, 11, 20, 14, 2, 27]. A cor usada deve ser escolhida levando em consideração as limitações que os usuários possam ter [16].

Textura: A textura refere-se ao preenchimento de um símbolo, por algum padrão [20, 27].

Orientação: Aplica-se em símbolos específicos, sempre que eles não apresentam simetrias, de maneira que pode haver um problema na percepção da orientação correta [20, 27].

Texto: Nos casos em que é necessário incluir texto, ele deve ser legível, concreto e preciso, de preferência horizontal e suscetível a uma aplicação direta sobre os elementos do gráfico ou diagrama [4, 17, 11, 20, 27, 28].

Figura 3 - Exemplo de utilização de atributos visuais: posição, forma, tamanho, cor, textura e orientação - Fonte: [20]

3.4. Mineração de Dados

Nesta seção, os resultados da pesquisa são relatados conforme a análise das publicações. A contribuição da literatura é baseada na mineração de dados espacial e visual, e aplicações destas metodologias nos Sistemas de Informação Geográfica [3, 17, 26, 4, 6, 22, 12, 10, 7, 15, 29]. Mineração de dados espaciais: segundo [29], a mineração de dados espaciais se dá através de um processo de extração de informação factual, inovadora, interessante, oculta, desconhecida, potencialmente útil e compreensível de um conjunto de dados geográficos [3, 17, 26, 4, 22, 12]. Integração de Spatial Data Mining com SIG:  a mineração de dados espaciais pode ser integrada com um SIG, devido à composição de suas estruturas de dados, a sua capacidade para analisar a informação geográfica e seu mecanismo de consulta complexa [3, 17, 26, 4]. Pré-processamento de dados espaciais: o pré-processamento de dados espaciais deve ser feito sempre para a descoberta de conhecimentos [3, 26, 4, 22]. Aplicação: [3, 17, 26, 4, 6, 22, 10] apresentam o processo de análise automática, através da implementação de algoritmos, fornecendo a capacidade de procurar correlações não óbvias e potencialmente úteis entre objetos georreferenciados. Mineração de Dados Visual: conforme [17, 26, 4, 6, 22, 18], a mineração de dados visual é um tipo de mineração de apoio à visualização de informação. Descoberta de padrões: a descoberta de padrões na mineração de dados espacial, leva em conta a identificação, localização e distinção dos objetos, além dos padrões correspondentes a dados categóricos e numéricos da mineração de dados tradicional [26, 4, 12, 10].

A distribuição destes artigos e as porcentagens que representa é mostrada na Figura 4.

Figura 4 – Características das pesquisas sobre Mineração de Dados

Como se pode observar, a mineração de dados espaciais tem maior porcentagem nas questões de pesquisa. A mineração de dados espaciais é considerada uma área de mineração de dados tradicional e enfatiza a extração de conhecimento relevante inerente à natureza espacial dos dados.

Atualmente, os Sistemas de Informação Geográfica envolvem o armazenamento e processamento de grandes volumes de dados espaciais com atributos que fornecem informações diretamente associadas a uma localização no espaço, no entanto, existem padrões de comportamento de dados geográficos que podem fornecer novas informações, úteis, relevantes e importantes [3].

A mineração de dados espaciais é o processo de análise automática, através da implementação de algoritmos, fornecendo a capacidade de procurar correlações não óbvias e potencialmente úteis entre objetos geográficos [3]. A aplicação de mineração de dados espaciais leva à descoberta de conhecimento implícito que pode ser demonstrado na informação de dados geográficos, em deduzir padrões ou categorizações, na informação convencional das bases de dados e, no caso de objetos geográficos associativamente, sob a forma de estruturas, de grupos, e vários tipos de relações espaciais [6].

A mineração de dados também é importante na visualização de informação porque ela lida com o desenvolvimento da teoria e métodos que facilitem a construção do conhecimento através de digitalização visual, análise de dados geoespaciais e implementação de ferramentas visuais [3]. A mineração de dados visual enfatiza o desenvolvimento de mapas altamente interativos e ferramentas associadas para exploração de dados, geração de hipóteses e a geração de conhecimento.

4. Conclusão

A pesquisa apresentou os resultados do estudo da Visualização de Dados em Sistemas de Informação Geográfica. O propósito deste trabalho é disponibilizar aos pesquisadores um mapeamento sobre as características da temática abordada. O estudo utilizou técnicas da revisão sistemática da literatura para a captura de dados que possibilitaram a identificação de padrões da literatura científica e mostrou, assim, que pesquisas deste tipo podem ser promissoras para auxiliar os pesquisadores nessa área de estudo.

Conclui-se que o número de pesquisas nesta área é crescente e é concentrado principalmente nos tipos de visualização de dados geral e na mineração de dados. Além disso, é importante continuar com o desenvolvimento da pesquisa sobre os métodos de Visualização de Dados e os atributos visuais para representar melhor os dados em mapas. A Visualização de Dados, representa neste tempo um grande desafio da gestão de informação, incentivar as pesquisas nesta área e divulgar seus resultados, pode gerar muitos benefícios. 

Referências

  1. ARRANZ, A., PUEYO, A., ZÚÑIGA, M., SALINAS, C., LÓPEZ, C. (2014). Valoración de las herramientas de geovisualización para la visualización y elaboración de cartografía temática. Em: Actas XV Congreso Nacional de Tecnologías de la Información Geográfica: Tecnologías de la información geográfica en el contexto del cambio global, p 529-534.
  2. BACIC, L. A., DELLADIO, M., MIGNANI, M. R. (2012). Estructuras Espaciales para la Representación de Mapas. Em: Workshop de Investigadores en Ciencias de la Computación, p 72-76.
  3. BERTOLOTTO, M., COMPIETA, P., DI MARTINO, S., FERRUCCI, F., KECHADI, T. (2007). Exploratory spatio-temporal data mining and visualization. Em: Journal of Visual Languages & Computing, vol 18, n 3, p 255-279.
  4. CANGREJO, D., AGUDELO, J. (2011). Minería de datos espaciales. Em: Revista Avances en Sistemas e Informática, vol 8, n 3.
  5. CARD, S., MACKINLAY, J. D., SHNEIDERMAN, B. (2009). Information visualization. Human-computer interaction: design issues, solutions, and applications, vol 181
  6. CASTRO, A., SIFUENTES, E., GONZÁLEZ, S., RASCÓN, L. (2014). Uso de Minería de Datos en el manejo de Información Geográfica. Em: Revista Información Tecnológica. vol 25, n 5, p 95-102.
  7. CHAU, D., NGAIA, E., XIUB, L. (2009). Application of data mining techniques in customer relationship management: A literature review and classification. Em: Expert Systems with Applications, vol 36, n 2, p 2592-2602.
  8. CÓRDOBA, C., ALATRISTE, Y. (2012). Hacia una taxonomía de investigación entre Visualización de Información y Diseño. Em: No Solo Usabilidad, n 11.
  9.  COSTA, R. M., SAIBEL, C. A. (2014). Systematic Review of Multiple Contents Synchronization in Interactive Television Scenario. Em: Communications and Networking, vol 2014, p 1-17, 2014.
  10. DUEÑAS, M. (2009). Minería de datos espaciales en búsqueda de la verdadera información. Em: Revista Ingeniería y Universidad, vol 13, n 1.
  11. EVERGREEN, S., EMERY, A. K. (2014). Data Visualization Checklist. Em: Presenting Data Effectively.
  12. GONZÁLEZ, L., PÉREZ, Y. (2013). Spatial data mining and its application in health and epidemiology studies. Em: Revista Cubana de Información en Ciencias de la Salud, vol 24, n 4, p 482-489.
  13. GOODCHILD, M. F., HAINING, R. P. (2005). GIS and spatial data analysis: converging perspectives. Em: Revista Investigaciones Regionales, n 6, p 175-201.
  14. HEER, J., BOSTOCK, M. (2010). Crowdsourcing Graphical Perception: Using Mechanical Turk to Assess Visualization Design. Em: Conference on Human Factors in Computing Systems, ACM, p 203-212.
  15.  KRAAK, J. M, OBERLING, F. (1996). Cartography: Visualization of Spatial Data, Longman, Essex, U.K.
  16. Lantares Solutions (2015). Visualización de Datos: El poder de lo visual en la presentación de tus reportes.
  17. LÓPEZ, J.F., GUERRERO, A.F. (2014). Uso de minería de datos en Sistemas de Información Geográfica para la prevención de riesgos en vehículos. Estado del arte. Em: Revista Geografía y Sistemas de Información Geográfica, ano 6, n 6, seção I, p 55-65.
  18. NEVES, P. C., ENGRÁCIA, J. E., SILVA, F. (2014). Visualização de dados abertos vinculados em sistemas de informações geográficas: uma revisão sistemática da literatura. Em: Congresso Linked Open Data Brasil.
  19. NUALART, J., PÉREZ, M., WHITELAW, M. (2014). How we draw texts: a review of approaches to text visualization and exploration. Em: El profesional de la información, v 23, n 3, p 221-235.
  20. OLAYA, V. (2012). Sistemas de Información Geográfica. Editorial: Bubok. Tomo I. España.
  21. PACHECO, C. E., BARRIOS, A. G., LÓPEZ, J. I. (2007). Comparación de métodos de digitalización para el ingreso de información espacial a los sistemas de información geográfica. Em: Revista Forestal Latinoamericana, vol 22, n 41, pp. 57-74.
  22. RAMÍREZ, L. (2011). Minería de datos visual. Em: Revista Digital Universitaria, vol 12, n 8.  
  23. SHNEIDERMAN, B. (1996). The eyes have it: A task by data type taxonomy for information visualizations. Em: Visual Languages. Proceedings IEEE Symposium, pp 336–343.
  24. VALERO, J. L., CATALÀ, J., MARÍN, B. E. (2014). Aproximación a una taxonomía de la visualización de datos. Em: Revista Latina de Comunicación Social, n 69, p 486-507.
  25. VARELA, F. A., HERNÁNDEZ, L. A., PENA, J. T., SEOANE, A., VARELA, J. I. (2007). Ampliación de las capacidades de visualización de un SIG libre mediante la comunicación con un navegador 3D. Em: I Jornadas de SIG Libre.
  26. VÁZQUEZ, R., PÉREZ, C., TORRES, J. C. (2013). A Novel Visual Data Mining Module for the Geographical Information System. Em: Anuário do Instituto de Geociências – UFRJ, vol 36, n 1, p 98-111.
  27. VIDAL, M. J., MORENO, A., CAÑADA, R. (2012). Geovisualización avanzada para la exploración de patrones y relaciones socio-ambientales con sistemas de información geográfica: aplicación a la ciudad de Madrid. Em: Revista del Grupo de Estudios sobre Geografía y Análisis Espacial con Sistemas de Información Geográfica (GESIG), ano 4, n 4, p 215-238.
  28.  VIÉGAS, F. B., WATTENBERG, M. (2008). Timelines tag clouds and the case for vernacular visualization. Em: Interactions, vol 15, n 4, p 49-52.
  29. WANG, J., CHEN, X., ZHOU, K., ZHANG, H. (2011). Research of GIS-based Spatial Data Mining Model. Em: Business Management and Electronic Information (BMEI), International Conference, vol 1.
  30. WATTENBERG, M., VIÉGAS, F. B. (2008). The Word Tree, an Interactive Visual Concordance. Em:  IEEE Transactions on Visualization & Computer Graphics, vol 14, n 6, p 1221-1228.

1. Univ. Federal do Espírito Santo. Email: feldlucyca@gmail.com
2. Univ. Federal do Espírito Santo. Email: saibel@inf.ufes.br
3. https://scholar.google.com

 


Revista Espacios. ISSN 0798 1015
Vol. 37 (Nº 19) Año 2016

[Índice]

[En caso de encontrar algún error en este website favor enviar email a webmaster]