Unidade
Embrapa Gado de Leite
Modelos computacionais para estabelecimento de meios e procedimentos metodológicos para análise de dados em bioinformática - MCBio
A computação utilizada como ferramenta pela pesquisa científica revolucionou as ciências biológicas, assim como fez com diversos outros campos da ciência e, considerando a quantidade exponencialmente crescente e a complexidade dos dados científicos que estão sendo gerados e que necessitam ser eficientemente manuseados, traduzidos, processados e comunicados, são necessários novos recursos computacionais para o tratamento eficaz de todo esse volume de dados que possibilite transformá-lo em conhecimento e, em seguida, como última instância desse processo, seja possível aplicar o conhecimento gerado para permitir ou incrementar avanços tecnológicos que, por sua vez, provocam a modernização dos setores produtivos. A utilização de modelos computacionais e matemáticos como uma ferramenta para a pesquisa faz com que seja possível não só a interpretação do conteúdo facilmente identificado em dados depositados em diversas bases, mas, também, com a utilização dos recursos computacionais apropriados para processar as grandes quantidades de dados científicos, possibilita a conversão de dados científicos em tecnologias, serviços ou produtos (TSP) inovadores, a partir da identificação de padrões e relações que não foram percebidas a priori. A utilização de modelos computacionais e matemáticos adequados, fundamentados sobre conceitos e aplicações de ciência de dados, permite que questões científicas possam ser abordadas sob uma nova ótica de análise de resultados, como uma nova estratégia metodológica de observação desses resultados, com a proposta de que novas formas de análise possam trazer novas TSPs. A proposta de que sejam adotados modelos computacionais para essa análise, vem complementar métodos frequentemente utilizados, como a abordagem estatística que, em geral, baseia-se no teste de experimentos frente a uma hipótese anteriormente definida. Entretanto, as necessidades atuais dos projetos de pesquisas requerem a geração e avaliação de centenas e até milhares de hipóteses, o que faz com que somente sejam avaliadas por modelos computacionais. Esse cenário é ainda mais desafiador quando se percebe o quanto são complexos os conjuntos de dados atualmente gerados, cujas caraterísticas, entre outras, incluem grande volume de dados, onde conjuntos de dados da ordem de terabytes estão se tornando comuns; alta dimensionalidade, quando se trabalha com centenas ou milhares de atributos; heterogeneidade, visto que, diferentemente de métodos tradicionais de análise, os modelos computacionais são adequados a dados de diferentes tipos, descontínuos e não categorizados; múltipla localização física dos conjuntos de dados, uma vez que é comum que tais conjuntos estejam distribuídos ou dispersos em diversos repositórios. O interesse público e os benefícios para a sociedade são notados a partir da aplicação da metodologia e demais recursos desenvolvidos em seu escopo por projetos outros de pesquisa que, assim, serão mais eficientes na busca por seus resultados. Isto é, em termo de resultados potenciais, o MCBio desenvolveu novos recursos de investigação em grandes massas de dados - em específico, bases de dados genômicas - para que seus resultados fossem utilizados pelo seu público alvo, que são comunidades científicas e acadêmicas. Dessa forma, os resultados do MCBio, potencialmente, possibilitam, que as comunidades científicas e acadêmicas contribuam de forma aplicada e/ou finalística para a sociedade, alavancando ações e resultados de seus estudos e pesquisas ao utilizarem a metodologia e os demais resultados obtidos pelo projeto em questão.
Situação: concluído Data de Início: Fri Apr 01 00:00:00 GMT-03:00 2011 Data de Finalização: Mon Mar 31 00:00:00 GMT-03:00 2014
Unidade Lider: Embrapa Gado de Leite
Líder de projeto: Wagner Antonio Arbex
Contato: wagner.arbex@embrapa.br