TIENA- Tecnologias Inovadoras em mineração de textos para apoio à Espacialização de Notícias Agrícolas - piloto cana-de-açúcar
TIENA- Tecnologias Inovadoras em mineração de textos para apoio à Espacialização de Notícias Agrícolas - piloto cana-de-açúcar
Este projeto tem o objetivo de organizar notícias agrícolas sobre uma dada cultura, por meio de técnicas inovadoras em mineração de textos, em três categorias: tópicos ou assuntos, cobertura temporal e cobertura espacial. A cobertura temporal visa em primeiro plano um estudo da evolução daquele tópico ou assunto em relação aos demais, em intervalos de tempo, ou seja, como foi a tendência de dispersão desse tópico ao longo do tempo e futuramente como ela se relaciona aos modelos de previsão de safra. A cobertura espacial visa compreender qual é a cobertura geográfica daquela notícia, podendo ser de caráter geral (nacional) ou relativa a alguma micro ou macrorregião geográfica, e, também futuramente poder-se-á analisar esse fator junto aos modelos de previsão de safra, para avaliar se o fator penaliza os modelos ou não. Como essas notícias são altamente dinâmicas, pois são, no mínimo, diárias, devem ser tratadas em tempo real; logo, os tópicos também devem ter uma evolução bastante dinâmica, que deve ser considerada em seu tratamento. Obter essa organização de dados e atualizá-la em tempo real visa a uma ação futura de analisar séries temporais dessas notícias; e, então fazer a análise cruzada desses modelos com os modelos de previsão de safra obtidos por meio de fatores agroambientais. Assim, o escopo da proposta deste projeto é englobar todas as etapas desse processo até a formação da base de dados tópico-espaço-temporal, com as notícias categorizadas em três dimensões: conceitual (tópicos), espacial e temporal. E, para isso, serão desenvolvidas tecnologias em mineração de textos para a extração e identificação de tópicos altamente dinâmicos, extração de informação temporal dos textos e classificação dos textos em relação a sua cobertura espacial.
Ecossistema: Floresta Atlântica, Meio Norte, Região Caatinga e Florestas deciduais
Situação: concluído Data de Início: Wed Sep 01 00:00:00 GMT-03:00 2010 Data de Finalização: Fri Aug 31 00:00:00 GMT-03:00 2012
Unidade Lider: Embrapa Agricultura Digital
Líder de projeto: Maria Fernanda Moura
Contato: maria-fernanda.moura@embrapa.br
Palavras-chave: cana-de-açúcar, espacialização, mineração de textos, notícias, previsão de safra