Easily labelling hierarchical document clusters.

Informe múltiplos e-mails separados por vírgula.

imagem

Resumo: One of the problems of automatic models that generate topic taxonomies is the process of creating the most significant term list that discriminates each document group. In this paper, a new method to label document hierarchical clusters is proposed, which is completely independent from the clustering method. This method automatically decides the number of the words in each label list, avoids word repetitions in a tree branch and provides a kind of cutting for the cluster tree. The obtained results were tested as search queries in a retrieval process and showed a very good performance. Additionally, the use of the method was experimented by some specialists in the text collection domain, trying to evaluate their understanding and expectations over the results.

Ano de publicação: 2008

Tipo de publicação: Artigo em anais e proceedings

Observações

1 - Por padrão são exibidas publicações dos últimos 20 anos. Para encontrar publicações mais antigas, configure o filtro ano de publicação, colocando o ano a partir do qual você deseja encontrar publicações. O filtro está na coluna da esquerda na busca acima. 

2 - Para ler algumas publicações da Embrapa (apenas as que estão em formato ePub), é necessário ter, no celular ou computador, um desses softwares gratuitos. Sistemas Android: Google Play Livros; IOS: iBooks; Windows e Linux: software Calibre.

 


Acesse outras publicações

Acesse a Base de Dados da Pesquisa Agropecuária (BDPA) para consultar o acervo completo das bibliotecas da Embrapa.