Bioinformática. Trabalho prático enunciado complementar. Notas complementares ao 1º enunciado



Documentos relacionados
Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Ciências Biomédicas, Engenharia Biológica. João Varela

Introdução ao SRS Sequence Retrieval System. Marcelo Falsarella Carazzolle

Anotação de Genomas. Fabiana G. S. Pinto

Bioinformática Aula 01

Hoje estudaremos a bioquímica dos ácidos nucléicos. Acompanhe!

Replicação Quais as funções do DNA?

Organização do Material Genético nos Procariontes e Eucariontes

Seminário de Genética BG Principal Resumo Professores Componentes Bibliografia Links

O fluxo da informação é unidirecional

ÁCIDOS NUCLEÍCOS RIBOSSOMO E SÍNTESE PROTEÍCA

Universidade Federal de Pelotas Faculdade de Agronomia Eliseu Maciel Programa de Pós-Graduação em Agronomia CENTRO DE GENOMICA E FITOMELHORAMENTO

Projeto Genoma e Proteoma

Miguel Rocha Dep. Informática - Universidade do Minho. BIOINFORMÁTICA: passado, presente e futuro!!

O que são domínios protéicos

Bacteria Archaea Eukarya

Modelagem por Homologia passo-a-passo. Prof. Rommel Ramos

MEDICINA VETERINÁRIA. Disciplina: Genética Animal. Prof a.: D rd. Mariana de F. Gardingo Diniz

PROGRAMA TEÓRICO. 2. O Dogma Central da Biologia Molecular

BIBLIOTECA ANACOM MANUAL DO UTILIZADOR

Mitocôndrias e Cloroplastos

FUNDAÇÃO UNIVERSIDADE FEDERAL DE RONDÔNIA - UNIR NÚCLEO DE CIÊNCIAS E TECNOLOGIA - NCT DEPARTAMENTO DE BIOLOGIA. Carga Horária: 100 horas/aula

As bactérias operárias

CONTROLE DO METABOLISMO GENES

20 Escola Digital Manual do Utilizador Professor

Transcrição e Tradução. Profa. Dra. Juliana Garcia de Oliveira Disciplina: Biologia Celular e Molecular Turmas: Biologia, enfermagem, nutrição e TO.

Informe Técnico n. 67, de 1º de setembro de 2015.

LeYa Educação Digital

12 EXCEL MACROS E APLICAÇÕES

Aula 01 - Formatações prontas e condicionais. Aula 01 - Formatações prontas e condicionais. Sumário. Formatar como Tabela

Núcleo Celular. Biomedicina primeiro semestre de 2012 Profa. Luciana Fontanari Krause

REGULAMENTO BOLSA DE ÁRVORES AUTÓCTONES

Análise de Dados de Expressão Gênica

Analise filogenética baseada em alinhamento de domínios

Regulamento de Vigilâncias de Provas Escritas de Avaliação do DEEC

Figura 1: Bosque de Casal do Rei, alguns meses após o incêndio que ocorreu no Verão de 2005.

Resposta: Interbits SuperPro Web

PLANIFICAÇÃO MODULAR ANO LECTIVO 2015 / 2016

APRESENTAÇÃO DE AÇÃO DE FORMAÇÃO NAS MODALIDADES DE ESTÁGIO, PROJETO, OFICINA DE FORMAÇÃO E CÍRCULO DE ESTUDOS

iconnect 3.3 Atualizações Pesquisa Dinâmica

Princípios moleculares dos processos fisiológicos

ROTEIRO PARA CRIAÇÃO DE UM ARTIGO CIENTÍFICO

BIOTECNOLOGIA E ENGENHARIA GENÉTICA. Profa. Maria Paula

EVOLUÇÃO DE SOFTWARE

DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS

Complexo principal de histocompatibilidade

Introdução a computação móvel. Middlewares para Rede de Sensores sem Fio. Uma avaliação na ótica de Adaptação ao Contexto

ANÁLISE DE RISCO - sistematização de informações disponíveis visando identificar o perigo potencial e avaliar a possibilidade de exposição.

Painéis Do Organismo ao Genoma

UNIVERSIDADE FEDERAL DE VIÇOSA BIOINFORMÁTICA ESTRUTURAL: PREDIÇÃO DE ESTRUTURA 3D DE PROTEÍNAS

Gestão Ambiental. Aula 5 Prof. Pablo Bosco

DO GENE À PROTEÍNA ALGUNS CONCEITOS BASICOS COMO SE ORGANIZAM OS NUCLEÓTIDOS PARA FORMAR O DNA?

ANÁLISE GENÔMICA, MAPEAMENTO E ANÁLISE DE QTLs

Colónias satélite: ao fim de 2 dias (a e b) e de 4 (c)

NÚCLEO e DIVISÃO CELULAR

Metabolismo de RNA: Transcrição procarioto/eucarioto

MODULO DE GESTÃO MANUTENÇÃO DE MATRÍCULA. O módulo de Gestão tem por objetivo gerenciar as atividades que ocorrem durante um ano letivo.

BANCO DE AULAS E PROJETOS MANUAL DO APLICATIVO

BASES MACROMOLECULARES DA CONSTITUIÇÃO CELULAR

Escola EB 2,3 de António Feijó

Professor Antônio Ruas

GERENCIADOR DE CONTEÚDO

Pag: 1/20. SGI Manual. Controle de Padrões

Explorando bancos de dados genômicos e introdução à bioinformática. Guilherme Targino Valente Marcos Tadeu Geraldo. Bioinformática

PORTO EDITORA AREAL EDITORES LISBOA EDITORA. Manual do Utilizador. Aluno.

Gerar o Ficheiro de Inventário

TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO - TIC 10º C. Planificação de. Curso Profissional de Técnico de Secretariado

ESCOLA BÁSICA 2 / 3 DE MARTIM DE FREITAS TIC Tecnologias de informação e comunicação - Ano lectivo de 2014 / 2015

Caros alunos do curso de Biologia

My Cisco Perguntas mais frequentes

Planificação TIC - 8.º Ano 2012/2013

Novell. Novell Teaming 1.0. novdocx (pt-br) 6 April 2007 EXPLORAR O PORTLET BEM-VINDO DESCUBRA SEU CAMINHO USANDO O NOVELL TEAMING NAVIGATOR

Desenvolvimento de Interfaces Prototipação

TIC Unidade 2 Base de Dados. Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado.

Jornal Oficial da União Europeia L 150/71

Manual do Usuário - ProJuris Web - Biblioteca Jurídica Página 1 de 20

DIFUSÃO E DIVULGAÇÃO DA BIOTECNOLOGIA PARA ALUNOS DO ENSINO FUNDAMENTAL NO MUNICÍPIO DE CAMPOS DOS GOYTACAZES RJ

1- Como realizar um trabalho de pesquisa no Secundário

ROTEIRO PARA TREINAMENTO DO SAGRES DIÁRIO Guia do Docente

Regulação do metabolismo do glicogênio

Técnicas de PCR: Aplicações e Padronização de Reações

INSTITUTO SUPERIOR DE COMUNICAÇÃO EMPRESARIAL REGULAMENTO DE ACTIVIDADE PROFISSIONAL RELATÓRIO FINAL

Escola EB António Feijó

MODULO DE GESTÃO MANUTENÇÃO DE MATRÍCULA. O módulo de Gestão tem por objetivo gerenciar as atividades que ocorrem durante um ano letivo.

RNA: transcrição e processamento

RNA: extrema. plasticidade... funcional. Estrutura do RNA: extrema plasticidade. Estrutura do RNA: um mundo de. diferenças. & extrema plasticidade

Voltado para novos usuários, este capítulo fornece uma instrução para edição de Leiaute do SILAS e suas funções.

Gestão inteligente de documentos eletrônicos

Programação Orientada a Objetos com PHP & MySQL Sistema Gerenciador de Banco de Dados: Introdução e configuração de bases de dados com Postgre e MySQL

BIOLOGIA MOLECULAR. Prof. Dr. José Luis da C. Silva

Casa Agrícola do Exemplo Relatório de Auditoria de Gestão

Ajuda ao SciEn-Produção O Artigo Científico da Pesquisa Experimental

TRANSCRICAO E PROCESSAMENTO DE RNA

Bases de Dados. Lab 1: Introdução ao ambiente. Figura 1. Base de dados de exemplo

Escola Superior de Educação João de Deus. Regulamento dos Regimes de Mudança de Curso, Transferência e Reingresso no Ensino Superior

Transcrição:

Bioinformática Trabalho prático enunciado complementar Neste texto, enunciam- se algumas considerações adicionais ao 1º enunciado e uma lista de possíveis tarefas que complementam o enunciado original e que podem ser realizadas no âmbito do trabalho. Termina- se com um conjunto de links para ferramentas e bases de dados de interesse. Notas complementares ao 1º enunciado O objetivo primordial do trabalho em curso passa pela anotação funcional do genoma do organismo de interesse, i.e. a atribuição de funções ao máximo número possível de genes e proteínas do organismo. Assim, as ferramentas estudadas, e outras que considere de interesse, devem ser usadas com este propósito, validando as anotações originais já disponíveis para as sequências do organismo e procurando complementá- las ou corrigi- las nos casos em que estas eram inconclusivas, incompletas ou erróneas. Este processo passará pela integração de informação dada pelas bases de dados disponíveis e pelo uso de ferramentas bioinformáticas. Neste caso, as ferramentas de procura de homologias serão de especial relevo, requerendo que os resultados obtidos para cada pesquisa sejam analisados procurando inferir pelas sequências homólogas as possíveis funções da sequência original (query). Este processo implica analisar a lista de sequências homólogas e identificar padrões consistentes ao nível da função desempenhada por estas. Estes processos deverão ser, sempre que possível, automatizados, mas não se dispensará em muitos casos a análise manual dos resultados. O processo anterior poderá, e deverá, ser complementado pela análise de literatura que auxiliará o processo de curação manual. Note- se que, dado que se pretende identificar a função de genes individuais, as pesquisas bibliográficas

terão que ser em muitos casos específicas, usando- se nas queries nomes de genes/proteínas, processos/funções biológicas, vias metabólicas, etc. Dada a natureza do trabalho, um dos resultados esperados será uma tabela (em língua inglesa) onde se resumam as anotações dos genes/ proteínas atribuídos a cada grupo. Esta tabela (poderá ter a forma de uma folha de cálculo) deverá conter como informação mínima as seguintes colunas: Identificação do gene (GeneID NCBI, Accession number NCBI, locus tag, nome do gene, strand) Identificação da proteína: Uniprot ID (se disponível) e grau de revisão, Accession number NCBI da proteína, nome da proteína Propriedades da proteína: nº de aminoácidos, localização celular Lista de termos do GeneOntology (GO) associados ao gene/ proteína EC number(s) ou TC number(s) associado(s) (se existirem) Descrição: campo de texto livre para a função da proteína Comentários (livre, pode ser usado para algum comentário relevante sobre gene ou processo de inferência da função) Esta tabela poderá ter outros campos que se julguem relevantes e deverá ser complementada por um ficheiro com um relatório mais documentado sobre cada gene/ proteína, que inclua a lista de resultados desse gene e a forma como foi inferida a sua função. Poderá ainda incluir- se uma classificação da função das proteína que possa facilmente ser usada para listar proteínas com determinado tipo de função. Como exemplo, são dadas as seguintes classes (não necessariamente exclusivas): Metabolismo (enzimas com função metabólica) Transportadores (entre compartimentos e para o exterior/interior da célula) Regulação (fatores de transcrição e outras proteínas regulatórias) Sinalização (proteínas envolvidas nas vias de transdução de sinal) Movimento (Quimiotaxia, motilidade, fagocitose)

Processamento do DNA e RNA: reparação, replicação, transcrição, degradação, modificação Síntese e processamento de proteínas: tradução, degradação, assemblagem do ribossoma, modificações, encaminhamento Outras funções Função desconhecida Genes codificando RNA (trna, rrna) Adicionalmente, pretende- se que cada grupo possa identificar autonomamente o conjunto de genes envolvido em processos de patogenicidade e de resistência a antibióticos com a respetiva indicação das funções biológicas e processos nos quais está envolvido. Como nota final complementar ao 1º enunciado note- se que o objetivo de colaboração entre os grupos exige um conjunto de práticas de ética que permitam a correta avaliação dos trabalhos. Assim, reforça- se a ideia de que todas as scripts de código e outra documentação deverão conter claramente a autoria da mesma e referir possíveis contribuições de outros grupos. No caso do código python, tal deverá ser realizado no cabeçalho dos ficheiros de código fonte. Sugestões de tarefas complementares Bases de dados de domínios de proteínas Nas aulas da unidade curricular foram abordadas bases de dados de domínios de proteínas, das quais se destaca a NCBI CDD (conserved domain database) do NCBI. Esta base de dados, ou outras similares, pode ser usada para confirmar a anotação de proteínas de interesse, sendo de particular utilidade quando subsistem dúvidas sobre a anotação, quer esta provenha da anotação original, quer provenha de resultados de homologia (e.g. Blast). A CDD permite a pesquisa de proteínas individuais ou pesquisa em batch que podem ser úteis para

automatizar processos de procura de conjuntos de proteínas de interesse em simultâneo de forma automática. Alinhamento múltiplo e filogenia As ferramentas estudadas na aula que permitem o alinhamento múltiplo de sequências podem ser úteis no estudo mais aprofundado de alguns dos genes/ proteínas de interesse. Neste caso, pode por exemplo selecionar- se a sequência de interesse do organismo e um conjunto de sequências homólogas (e.g. provenientes de um processo de Blast) de organismos/ estirpes selecionadas, realizar o seu alinhamento múltiplo e complementarmente determinar a árvore filogenética correspondente. O resultado do alinhamento múltiplo poderá permitir analisar zonas de maior/ menor conservação e conduzir à identificação de domínios conservados de proteínas e permitir dar mais confiança a anotações ou mesmo conduzir a hipóteses ainda não determinadas por outros métodos. Por seu lado, a análise da árvore filogenética poderá levar à identificação de situações de evolução distintas entre genes distintos (e.g. transferência horizontal de genes). Redes metabólica e regulatória Um desafio complementar à anotação do genoma será a construção de um modelo/ rede metabólica, complementada com interações regulatórias conhecidas. Nesse sentido, o primeiro passo será a compilação das funções metabólicas do organismo e esta tarefa será facilitada pela coleção dos genes anotados com este tipo de função (e seus EC numbers) e sua interligação com a bases de dados KEGG, nomeadamente as reações químicas e vias metabólicas aí definidas. Esta informação poderá ser recolhida numa tabela com colunas: identificadores dos genes (NCBI, KEGG), lista de EC number(s), KEGG ortholog, Kegg reactions IDs e KEGG pathways (KEGG). Complementarmente, as proteínas transportadoras podem ser identificadas numa tabela similar com TC numbers no lugar de EC numbers, sendo identificados os compostos (famílias de compostos) transportados.

Finalmente, pode ser compilada uma lista de fatores de transcrição anotados e os genes que são regulados por estas proteínas e sinal da respetiva regulação (ativação ou inibição). Links para sítios com informação / ferramentas de interesse: Base de dados PATRIC - recursos para organismos patogénicos: http://patricbrc.vbi.vt.edu/portal/portal/patric/home KEGG: http://www.genome.jp/kegg/ (código do organismo: lpn) coleção alargada de recursos, com destaque para voltados para vias metabólicas BioCyc e MetaCyc: http://metacyc.org/, http://biocyc.org/, http://biocyc.org/organism- summary?object=lpne272624 Ferramenta e base de dados PSORT para previsão sub- celular: http://www.psort.org/psortb/, http://db.psort.org/, http://db.psort.org/browse/genome?id=11876 Base de dados de transportadores: http://www.membranetransport.org/, http://www.membranetransport.org/all_type_btab.php?ooid=lpne1 Base de dados de fatores de transcrição previstos: http://www.transcriptionfactor.org/ Base de dados/ previsão de genes com funções de sinalização (two- component systems) - http://www.p2cs.org/