TIENA- Tecnologias Inovadoras em mineração de textos para apoio à Espacialização de Notícias Agrícolas - piloto cana-de-açúcar
TIENA- Tecnologias Inovadoras em mineração de textos para apoio à Espacialização de Notícias Agrícolas - piloto cana-de-açúcar
*Content only available in Portuguese
Este projeto tem o objetivo de organizar notícias agrícolas sobre uma dada cultura, por meio de técnicas inovadoras em mineração de textos, em três categorias: tópicos ou assuntos, cobertura temporal e cobertura espacial. A cobertura temporal visa em primeiro plano um estudo da evolução daquele tópico ou assunto em relação aos demais, em intervalos de tempo, ou seja, como foi a tendência de dispersão desse tópico ao longo do tempo e futuramente como ela se relaciona aos modelos de previsão de safra. A cobertura espacial visa compreender qual é a cobertura geográfica daquela notícia, podendo ser de caráter geral (nacional) ou relativa a alguma micro ou macrorregião geográfica, e, também futuramente poder-se-á analisar esse fator junto aos modelos de previsão de safra, para avaliar se o fator penaliza os modelos ou não. Como essas notícias são altamente dinâmicas, pois são, no mínimo, diárias, devem ser tratadas em tempo real; logo, os tópicos também devem ter uma evolução bastante dinâmica, que deve ser considerada em seu tratamento. Obter essa organização de dados e atualizá-la em tempo real visa a uma ação futura de analisar séries temporais dessas notícias; e, então fazer a análise cruzada desses modelos com os modelos de previsão de safra obtidos por meio de fatores agroambientais. Assim, o escopo da proposta deste projeto é englobar todas as etapas desse processo até a formação da base de dados tópico-espaço-temporal, com as notícias categorizadas em três dimensões: conceitual (tópicos), espacial e temporal. E, para isso, serão desenvolvidas tecnologias em mineração de textos para a extração e identificação de tópicos altamente dinâmicos, extração de informação temporal dos textos e classificação dos textos em relação a sua cobertura espacial.
Ecosystem: Atlantic Forest, Mid-North, Caatinga Region and Mixed forests
Status: Completed Start date: Wed Sep 01 00:00:00 GMT-03:00 2010 Conclusion date: Fri Aug 31 00:00:00 GMT-03:00 2012
Head Unit: Embrapa Digital Agriculture
Project leader: Maria Fernanda Moura
Contact: maria-fernanda.moura@embrapa.br
Keywords: cana-de-açúcar, espacialização, mineração de textos, notícias, previsão de safra