Embrapa Agricultura Digital
Laboratório Multiusuário de Bioinformática (LMB)
Diversas áreas do conhecimento, especialmente a biologia molecular, experimentaram nas 3 últimas décadas um crescimento exponencial na capacidade de gerar dados e, consequentemente, do volume de dados disponível. A Bioinformática, embora originalmente lidasse com sequências protéicas na década de 1960, ganhou momento e foi reconhecida como área distinta a partir do papel decisivo nos primeiros projetos Genoma, no final da década de 1980. Desde então, passou a atuar também nas áreas de expressão gênica, marcadores moleculares, evolução, regulação da expressão, modelagem de sistemas biológicos, predição de estrutura protéica e interação molecular, entre outras.
Desde 2001, com a contratação contínua de Bioinformatas e a realização de Workshops em 2003, 2006 e 2008, a Embrapa reconhece institucionalmente a importância da Bioinformática e se articula para estruturar os esforços nesta área, crítica para uma série de programas da empresa, como aqueles relacionados a recursos genéticos, biotecnologia e melhoramento.
A necessidade de capacidade computacional de alto desempenho e competência multidisciplinar para operá-la e acompanhar as rápidas mudanças de paradigma da área requer ações estratégicas que visem a otimização dos recursos físicos e humanos. Neste contexto foi proposta a implantação de um Laboratório Multiusuário de Bioinformática fortemente integrado às competências e demandas já existentes na Embrapa.
Missão:
Viabilizar soluções de Bioinformática para projetos de pesquisa, desenvolvimento e inovação na Embrapa em um ambiente colaborativo.
Objetivos:
- Contribuir para o avanço na fronteira do conhecimento e incorporar novas tecnologias em Bioinformática.
- Viabilizar soluções eficientes para demandas em Bioinformática.
- Disponibilizar acesso à infraestrutura computacional de alto desempenho.
- Prover a Embrapa com competências em Bioinformática.
Modelo de Gestão:
Infraestrutura
A lógica empregada na escolha dos equipamentos pretende complementar a estrutura existente nos laboratórios parceiros, provendo recursos difíceis de serem encontrados, mantendo altíssima disponibilidade e com possibilidade de expansão futura.
Um dos fatores limitantes na montagem de novo (sem genoma de referência) de eucariotos é o total de memória RAM disponível para um único processo (como quando se construi um grafo de Bruijn, e.g.). Para o Laboratório Multiusuário de Bioinformática foram adquiridos dois servidores com 512GB de RAM e 48 núcleos HT cada um. Servidores com especificações semelhantes foram empregados nas recentes montagens de novo dos genomas do Panda (Li et al., 2010) e Humano (Gnerre et al., 2011). Cada um dos servidores do Laboratório Multiusuário de Bioinformática pode ter o total de memória expandido até 3TB.
Um segundo aspecto das tecnologias de sequenciamento atuais é o volume considerável de dados gerados. Ambos servidores estão conectados, através de Fibra Ótica, a um terceiro servidor de armazenamento, onde existem 2 partições de 50TB cada.
Para garantir a persistência dos dados experimentais, uma biblioteca de fitas LTO5 está conectada aos servidores, permitindo a realização de backups diários, além da armazenagem off line de dados empregados nas análises por longos períodos .
Além da redundância de componentes em cada uma das máquinas, o sistema todo está hospedado em uma sala de servidores com climatização, eletricidade e segurança redundantes.
A estrutura computacional do LMB e é composta por:
Dois servidores de gerenciamento com 256G e 24 núcleos;
Um servidor de processamento com 160 núcleos HT e 2T de memória RAM;
Doze servidores de processamento com 64 núcleos e 512G de memória RAM;
Três servidores de armazenamento totalizando uma capacidade de armazenamento de 346T.
Como utilizar a infraestrutura do LMB no seu projeto
O Laboratório Multiusuário de Bioinformática (LMB) tem uma política de acesso bastante simplificada.
Com essa política, o objetivo é, na medida do possível, facilitar ao máximo o acesso tanto à infraestrutura quanto à colaboração na realização de análises de Bioinformática.
Estão previstas duas formas de uso da infra estrutura do LMB:
- Utilização da infraestrutura computacional de alto desempenho através do preenchimento do Formulário A ;
- Colaboração de equipe especializada para planejar e executar a parte de Bioinformática de seus projetos através do preenchimento do Formulário B.
Para utilizar a infraestrutura do LMB para suas análises ou solicitar colaboração, você também pode entrar em contato através do e-mail cnptia.gbio@embrapa.br com cópia para leandro.cintra@embrapa.br, inserindo as informações: nome do requerente; Instituição; projeto ao qual as atividades estão vinculadas; código do projeto; descrição do projeto; nome do pesquisador principal do projeto; e-mail do pesquisador principal.
Veja em nossa Política de Uso (English version) como utilizar a infraestrutura do LMB no seu projeto.
Análises de Dados
- Análise funcional de genes (GO e vias metabólicas)
- Identificação de CNVs
- Análise de CNVs
- Montagem de Metagenomas
- Análise de Diversidade Microbiana
- Análise Comparativa de metagenomas
- Predição de genes codificadores de proteínas
- Predição de genes codificadores de tRNAs
- Predição de genes codificadores de rRNAs
- Computação de árvores filogenéticas
- Predição de homologia
- Identificação de SNPs
- Imputação de SNPs
- Anotação automática de genes
- Identificação de sequências repetitivas
- Análise de qualidade de sequências
- Mapeamento de sequências em genoma referência
- Identificação de transcritos
- Expressão gênica diferencial
- Montagem de genoma
- Análise comparativa de genomas
Equipe
Michel Eduardo Beleza Yamagishi
Localização: https://goo.gl/maps/zanvmBrQsuQeBJgp8