Identificação da cobertura espacial de documentos usando mineração de textos.
Identificação da cobertura espacial de documentos usando mineração de textos.
Author(s): VARGAS, R. N. P.; MOURA, M. F.; SPERANZA, E. A.; REZENDE, S. O.
Summary: Resumo. Atualmente, é comum que usuários levem em consideração o contexto geográfico dos documentos nos processos de Recuperação de Informação. No entanto, os sistemas convencionais de extração de informação que estão baseados em palavras-chave não consideram que as palavras podem representar entidades geográficas espacialmente relacionadas com outras entidades nos documentos. Para resolver esse problema, é necessário viabilizar o georreferenciamento dos textos, ou seja, identificar as entidades geográficas presentes e associá-las com sua correta localização espacial. A identificação e desambiguação das entidades geográficas apresenta desafios importantes, principalmente do ponto de vista linguístico,Assim, a principal estratégia para superar os problemas de ambiguidade, compreende a identificação de evidências que auxiliem na identificação e desambiguação das localidades nos textos. O presente trabalho propõe uma metodologia que permite identificar e determinar a cobertura espacial dos documentos, denominada SpatialCIM. A metodologia SpatialCIM tem o objetivo de organizar os processos de resolução de topônimos. Para isso, foram propostas e desenvolvidas as abordagens de (1) Desambiguação por Pontos e a (2) Desambiguação Textual e Estrutural. Essas abordagens, exploram duas técnicas diferentes de desambiguação de topônimos, as quais, geram e desambiguam os caminhos geográficos associados aos topônimos reconhecidos para cada documento. A partir dos resultados obtidos, foi possível demostrar que as técnicas de desambiguação melhoram a precisão e revocação na classificação espacial dos documentos. Demonstrou-se também o impacto positivo do uso de uma ferramenta linguística no processo de reconhecimento das entidades geográficas. Assim, foi demostrada a utilidade dos processos de desambiguação para a obtenção da cobertura espacial dos documentos.
Publication year: 2012
Types of publication: Paper in annals and proceedings
Keywords: Cobertura espacial, Mineração de texto, Text mining, Vegetation cover
Observation
Some of Embrapa's publications are published as ePub files. To read them, use or download one of the following free software options to your computer or mobile device. Android: Google Play Books; IOS: iBooks; Windows and Linux: Calibre.
Access other publications
Access the Agricultural Research Database (BDPA) to consult Embrapa's full library collection and records.
Visit Embrapa Bookstore to purchase books and other publications sold by Embrapa.