08/03/17 |

Dados digitais apoiam estudos genômicos

Informe múltiplos e-mails separados por vírgula.

Foto: Neide Makiko Furukawa

Neide Makiko Furukawa -

Bytes, megabytes, gigabytes, terabytes e petabytes. Nesta era do Big Data, em que é cada vez maior o volume de dados gerados pelas pesquisas científicas, armazená-los de forma organizada e processá-los, possibilitando análises integradas, tornaram-se desafios para os cientistas. Na seleção genômica, em programas de melhoramento genético animal envolvendo grandes populações, a incorporação de tecnologias de genotipagem em larga escala implica no armazenamento e no processamento de centenas de milhares de marcadores (genótipos) para milhares de animais.

No desenvolvimento dessas pesquisas, é preciso contar com uma avançada infraestrutura computacional composta por ferramentas de processamento, banco de dados, servidores e cluster – conjunto de computadores que usam sistema distribuído – de alto desempenho. A Rede Genômica Animal já dispõe da  infraestrutura de computação de alto desempenho do Laboratório Multiusuário de Bioinformática (LMB), na Embrapa Informática Agropecuária (SP), para projetos de pesquisa envolvendo montagens de genoma, tecnologias de genotipagem em larga escala, análises de transcriptoma e expressão gênica de vários organismos estudados pela Rede. Dentre os resultados obtidos por meio dessa infraestrutura, estão as montagens dos genomas dos peixes cachara do Amazonas e tambaqui e a do gado Nelore, que está sendo finalizada.

A Embrapa também está investindo na criação de um parque computacional que dará suporte às pesquisas que lidam com armazenamento e análise de grandes volumes de dados. Um centro de dados (data center) está sendo construído nas instalações da Embrapa Informática Agropecuária, com softwares e dezenas de servidores e equipamentos de armazenamento (storage) de última geração.

“Assim, quando o pesquisador for propor um projeto, ele não precisará se preocupar em conseguir recursos computacionais, comprar e configurar as máquinas. Ele poderá partir direto para o problema de pesquisa, contando com todo esse suporte institucional”, explica o pesquisador da Embrapa Informática Agropecuária Roberto Higa, coordenador do DataExp, como está sendo chamada essa infraestrutura computacional. Segundo ele, a estrutura deve estar operacional em 2017.

Com isso, será possível uma visão global dos dados experimentais gerados pelas pesquisas e a realização de análises conjuntas. A ideia é que o acesso seja feito por nuvem (cloud) para facilitar o uso colaborativo dos recursos tecnológicos, além de reduzir custos com aquisição e manutenção de recursos computacionais.

O conjunto de projetos de pesquisa voltados a estudos de genética molecular para produção sustentável de carne bovina, denominado MaxBife, usará esses recursos computacionais para organizar e analisar dados relativos aos fenótipos, pedigree e genótipos de rebanhos de corte, além de dados econômicos e ambientais referentes aos sistemas produtivos.

Essa infraestrutura também beneficia pesquisas relacionadas a outras áreas, como mudanças climáticas e estudos geoespaciais, além de dados experimentais, cujos resultados precisam ser armazenados, processados e analisados de forma integrada para a geração de tecnologias e apoio a políticas públicas.

É o caso das redes de estações meteorológicas e de satélites, que coletam diariamente uma série de imagens e dados usados para calibrar modelos de simulação de cenários futuros devido às mudanças climáticas e alimentar sistemas de zoneamento de risco climático e alertas fitossanitários. O programa de Zoneamento Agrícola de Risco Climático (Zarc), instrumento de política agrícola do Ministério da Agricultura, Pecuária e Abastecimento (Mapa), já está usando os equipamentos do futuro data center na simulação de cenários agrícolas.

De acordo com Silvia Massruhá, chefe-geral da Embrapa Informática Agropecuária, o DataExp vai fortalecer a interação entre diferentes grupos de pesquisa e o estabelecimento de estratégias comuns, garantindo a regulamentação de acesso, uso e propriedade das informações experimentais. •

CONSTRUÇÃO DO CONHECIMENTO

A genômica animal é uma área ainda nova no campo científico e em constante evolução e, por isso, segundo a pesquisadora da Embrapa Recursos Genéticos e Biotecnologia Natália Martins, demanda treinamento e capacitação. Para atender a essas necessidades, um projeto componente foi criado no âmbito da Rede Genômica Animal exclusivamente para oferecer capacitação e construir conhecimento, além de divulgar os resultados gerados para a comunidade científica dentro e fora da Embrapa.

Martins, responsável por esse projeto, explica que, primeiro, foram identificados os pontos estratégicos. Depois, foi elaborada uma programação em quatro níveis: o primeiro é voltado ao público interno. O segundo, que abrange reuniões e eventos, já resultou na realização de duas edições do evento denominado Talking about Computing and Genomics (TACG), em 2013 e 2016. O objetivo é integrar professores, pesquisadores e profissionais das áreas de melhoramento genético animal, genômica, bioinformática e genética molecular, entre outras, para trocar experiências e prospectar novas oportunidades de pesquisa, além de compartilhar conhecimento gerado e capacitar os participantes para uso dos resultados obtidos.

O terceiro, voltado ao público externo, incluindo estudantes de pós-graduação, pesquisadores de outras Unidades da Embrapa que não compõem a Rede e professores, entre outros, levou à realização de cursos presenciais e visitas.

O quarto e último destina-se à publicação de livros nas áreas de bioinformática e genômica animal. O I TACG resultou na publicação do volume I, em 2015, que está disponível na Livraria da Embrapa. O segundo volume ficará pronto em 2017.

De acordo com a pesquisadora, a perspectiva é investir e promover cursos virtuais. “As ações de capacitação e divulgação trazem para a Rede o retorno de multiplicadores de conhecimento e tecnologia. Agregam muito valor ao trabalho”, finaliza.

 

Leia também

 

Nadir Rodrigues
Embrapa Informática Agropecuária

Beatriz Guimarães (colaboradora)
Embrapa Informática Agropecuária

Mais informações sobre o tema
Serviço de Atendimento ao Cidadão (SAC)
www.embrapa.br/fale-conosco/sac/

Encontre mais notícias sobre:

revistaxxi15