Uma ferramenta para expansão do vocabulário com base em coocorrência.
Uma ferramenta para expansão do vocabulário com base em coocorrência.
Autoria: SILVA JÚNIOR, E. L.; SINOARA, R. A.; REZENDE, S. O.; MARCACINI, R. M.; MOURA, M. F.
Resumo: Neste trabalho é apresentado um módulo desenvolvido para a experimentação de algumas técnicas de pré-processamento visando uma boa representação de coleções de documentos. As técnicas experimentadas são voltadas à expansão de vocabulário do domínio por meio da inclusão de termos coocorrentes. Um módulo, chamado DATool, foi desenvolvido em Java e experimentos estão sendo realizados. Caso os resultados sejam positivos, as técnicas serão transformadas em filtros de pré-processamento e indexação a serem incorporados ao arcabouço de ferramentas do projeto CRITIC@.
Ano de publicação: 2015
Tipo de publicação: Artigo em anais e proceedings
Unidade: Embrapa Agricultura Digital
Palavras-chave: Coocorrência de termos, Mineração de textos, Pré-processamento de textos, Text mining
Observações
1 - Por padrão são exibidas publicações dos últimos 20 anos. Para encontrar publicações mais antigas, configure o filtro ano de publicação, colocando o ano a partir do qual você deseja encontrar publicações. O filtro está na coluna da esquerda na busca acima.
2 - Para ler algumas publicações da Embrapa (apenas as que estão em formato ePub), é necessário ter, no celular ou computador, um desses softwares gratuitos. Sistemas Android: Google Play Livros; IOS: iBooks; Windows e Linux: software Calibre.
Acesse outras publicações
Acesse a Base de Dados da Pesquisa Agropecuária (BDPA) para consultar o acervo completo das bibliotecas da Embrapa.