Anotação de Genomas. Fabiana G. S. Pinto



Documentos relacionados
Dezembro Bioinformática. e Anotação. Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP

Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Ciências Biomédicas, Engenharia Biológica. João Varela

Introdução ao SRS Sequence Retrieval System. Marcelo Falsarella Carazzolle

Tutorial Introdução a anotação e comparação de genomas Tiago Mendes Doutorando em Bionformática

Explorando bancos de dados genômicos e introdução à bioinformática. Guilherme Targino Valente Marcos Tadeu Geraldo. Bioinformática

Banco de Dados aplicado a Sistemas Biológicos

Bioinformática Aula 01

Bioinformática. João Varela Aula T4 CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, CIÊNCIAS BIOMÉDICAS E ENGENHARIA BIOLÓGICA

Bioinformática. Trabalho prático enunciado complementar. Notas complementares ao 1º enunciado

O que são domínios protéicos

Bancos de dados de biomacromoléculas e recuperação de informação

Bioinformática. Alinhamento de Sequências. Prof. Msc. Rommel Ramos

O surgimento da Bioinformática Banco de Dados Biológicos

O fluxo da informação é unidirecional

CONHECIMENTOS ESPECÍFICOS

Miguel Rocha Dep. Informática - Universidade do Minho. BIOINFORMÁTICA: passado, presente e futuro!!

Bioinformática. Tipos de Bases de Dados (BD) Principais BD Primárias. Bases de dados Não-Redundantes. 3 - Bases de dados

Sumário. Tutorial: Editor de Exercícios Online para o professor

MEDICINA VETERINÁRIA. Disciplina: Genética Animal. Prof a.: D rd. Mariana de F. Gardingo Diniz

Sistema Web para Projeto de PCR

Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica. João Varela

Banco de Dados Biológicos

Modelagem por Homologia passo-a-passo. Prof. Rommel Ramos

O processo da Expressão Gênica

UNIVERSIDADE FEDERAL DE ALAGOAS INSTITUTO DE CIÊNCIAS BIOLÓGICAS E DA SAÚDE SETOR DE BIOLOGIA CELULAR E MOLECULAR

Turma de terça-feira 14 hs. Total: 31 alunos

MANUAL. Laudos Online Convênios & Empresas.

ANÁLISE GENÔMICA, MAPEAMENTO E ANÁLISE DE QTLs

Manual de instalação das cadeias AC SOLUTI AC Soluti - Goiânia. Versão 1.0 de 1 de Fevereiro de Classificação: Ostensiva

Equipe de Biologia. Biologia

Manual de Instalação. SafeSign Standard (Para MAC OS 10.7)

Universidade Federal de Pelotas Faculdade de Agronomia Eliseu Maciel Programa de Pós-Graduação em Agronomia CENTRO DE GENOMICA E FITOMELHORAMENTO

UTILIZAÇÃO DE RECURSOS AVANÇADOS DO EXCEL TABELA

CONTROLE DO METABOLISMO GENES

Curso de Verão Bioinformática


MANUAL BACKUP XDENTAL 2012

BANCO DE DADOS BIOLÓGICOS Aula 11

Bases de Dados. Freqüentemente usadas em. Bioinformática

Como Digitalizar e Enviar seus Documentos

Manual de baixa do Certificado Digital AR SOLUTI. Versão 2.0 de 22 de Maio de Classificação: Ostensiva

Universidade Federal de Pelotas Faculdade de Agronomia Eliseu Maciel Programa de Pós-Graduação em Agronomia CENTRO DE GENOMICA E FITOMELHORAMENTO

Metabolismo de RNA: Transcrição procarioto/eucarioto

Programas de Alinhamento. Sumário

Adapti - Technology Solutions Leonor cardoso nº 331 Fone : (041) Curitiba - PR MANUAL DO USUÁRIO

Replicação do DNA a Nível Molecular

Bem-vindo ao Connect Bank do HSBC. A ferramenta online para a gestão financeira da sua empresa.

Banco de Dados Oracle 10g

PORTAL DO ALUNO MANUAL PARA ESCOLAS CNA

Manual Operacional Expansão Nono Digito

BEM-VINDO AO dhl PROVIEW

BIOLOGIA MOLECULAR. Prof. Dr. José Luis da C. Silva

SÍNTESE DE PRIMERS. 1- Abra o site selecione a espécie no quadro da direita (ex. Mus musculus)

BLOG ESCOLAS. Após acessar o seu respectivo blog, você será direcionado a tela a seguir. Vamos conhecê-la um pouco melhor.

Nova Central de Atendimento Logicorp

UNIVERSIDADE FEDERAL DE VIÇOSA BIOINFORMÁTICA ESTRUTURAL: PREDIÇÃO DE ESTRUTURA 3D DE PROTEÍNAS

MANUAL DE UTILIZAÇÃO SISTEMA DE CADASTRO INTRANET

Bem- Vindo ao manual de instruções do ECO Editor de COnteúdo.

GUIA BÁSICO DA SALA VIRTUAL

Construtor de sites SoftPixel GUIA RÁPIDO - 1 -

Métodos de alinhamento de sequências biológicas. Marcelo Falsarella Carazzolle

Aprovação da Ficha de Tratamento Beneficiários Correios.

Flex. MANUAL DE USO DA FERRAMENTA FLEX O Flex como gerenciador de conteúdo

Do Corpo Humano ao DNA. Noções de Biologia Molecular. Nucleotídeos - DNA RNA. Dogma central. Prof a. Dr a. Mônica B.

Tutorial Plone 4. Manutenção de Sites. Universidade Federal de São Carlos Departamento de Sistemas Web Todos os direitos reservados

Portal do Projeto Tempo de Ser

Status. Barra de Título. Barra de Menu. Barra de. Ferramentas Padrão. Caixa de nomes. Barra de. Ferramentas de Formatação. Indicadores de Coluna

Solute Manager Gerenciador de Conteúdo Manual de Utilização

Sumário. Tutorial: Baú de Ideias 1

Versão Apresentação. Parte I. Vivaldo Armelin Júnior

Escritório Virtual Administrativo

Introdução à Bioinformática

Planilha Eletrônica. = Usado para iniciar fórmulas e Somente no MS Excel permite iniciar funções. ^ Usado para expoente e raiz

Acordo Ortográfico no Linux Educacional

SISTEMA INTEGRADO DE BIBLIOTECAS

1 Loja de Internet Web & Marketing Digital (27)

Sistema de Gerenciamento Remoto

UFPel CDTec Biotecnologia. Anotação de genomas. MSc. Frederico schmitt Kremer

CURSO SOBRE ACESSO ÀS BIBLIOTECAS ON-LINE DA MEDLINE/PubMed

APRESENTAÇÃO DE PROPOSTA DE CURSO: DNA NA ESCOLA

Portal Sindical. Manual Operacional Empresas/Escritórios

SuperLogo: aprendendo com a sua criatividade

Tutorial Baú de Ideias

Gerenciamento de Contatos

1 Essa é a tela de login do Sistema de Atendimento Online, siga o passo a passo abaixo.

- Ácido ribonucléico (ARN ou RNA): participa do processo de síntese de proteínas.

Técnicas de PCR: Aplicações e Padronização de Reações

Tutorial Introdução a anotação e comparação de genomas Tiago Mendes Doutorando em Bionformática

COMUNICAÇÃO DA INFORMAÇÃO NAS MOLÉCULAS DE DNA E RNA

COMO COLABORAR NO WIKI DO MOODLE 1. Orientações para produção escolar colaborativa no wiki do Moodle:

Tel. (0xx11) Fax (0xx11)

Treinamento. Módulo. Escritório Virtual. Sistema Office. Instruções para configuração e utilização do módulo Escritório Virtual do sistema Office

TUTORIAL AUTODESK 360 COLABORAÇÃO E ARMAZENAMENTO DE ARQUIVOS

Manual do Portal do Fornecedor. isupplier

Esse produto é um produto composto e tem subprodutos

Manual de baixa do Certificado Digital AR SOLUTI. Versão 2.0 de 7 de Maio de Classificação: Ostensiva

1 Cadastre-se Mozilla Firefox. AQUI Esqueci a senha Login Senha. Esqueci a senha Login Enviar Solicitação OBS: Nome: Login:

MANUAL DE UTILIZAÇÃO

Transcrição:

Anotação de Genomas Fabiana G. S. Pinto

Obtenção de Seqüências geradas pelo MegaBace 1000 Dados brutos (medidas analógicas) de saída do seqüênciamento Base calling BIOINFORMÁTICA * PHRED: - Transforma os dados brutos em seqüências de bases, atribuí valores de qualidade a cada base na seqüência e gera arquivos de saída FASTA e PHD * PHRAP: - Leitura Montagem dos pequenos fragmentos de DNA seqüenciados em seqüências maiores: CONTIG * CONSED: - Visualização e edição das montagens das seqüências de alta qualidade

Valores de qualidade gerados pelo PHRED Quando arquivos de seqüências de DNA são analisados pelo phred a cada base é assinada um valor de qualidade, o qual é uma estimativa da probabilidade de erro para essa base. Bases com um valor de qualidade de 20 são consideradas com um alto valor de qualidade. q = -10 log 10 (pe) onde pe= erro estimado q20 = 1/100 probabilidade de erro q30= 1/1000 probabilidade de erro q40= 1/10000 probabilidade de erro

Regiões genômicas que podem ser melhoradas re-seqüênciamento.

Análise e Montagem das Seqüências Seqüências shotgun analisadas Phred, Phrap e Consed Resultado Seqüências ordenadas com consenso formam um CONTIG

Anotação de Genomas Fabiana G. S. Pinto ANOTAÇÃO DE NUCLEOTÍDEOS ANOTAÇÃO DE PROTEÍNAS ANOTAÇÃO DE PROCESSOS Onde estão os genes? Quais são os genes? Cómo os genes interagem? GLIMMER - GENEMARK Predições de ORF Open Reading Frame 6 frames

Gerar todas as possíveis ORFs (open reading frames) nos seis sentidos e sobrepostas CONTIG GERADO APÓS ANOTAÇÃO PELO GLIMMER OU GENEMARK...

CONTIG APÓS A ANOTAÇÃO MANUAL... O anotador decide qual ORF tem que eliminar ou validar. Requere-se de conhecimento e de muito critério.

Análise de Seqüências: Bioinformática Fabiana G. S. Pinto

CONTIG APÓS A ANOTAÇÃO MANUAL... O anotador decide qual ORF tem que eliminar ou validar. Requere-se de conhecimento e de muito critério.

Banco de Dados Biológicos Fabiana G. S. Pinto Banco de Dados (DataBase) Banco de Dados Públicos Bancos Primários INSDC International Nucleotide Sequence Database Colaboration Bancos Secundários Bancos Funcionais Sistema de Gerenciamento de Banco de Dados - SGBD Bancos primários Bancos secundários GenBank EBI - European Bioinformatics Institute DDBJ DNA DataBase of Japan PDB - Protein Data Bank PIR Protein Information Resource SIWSS-PROT. InterPro. COG Orthologous KEGG Kyoto Encyclopedia of Genes and Genomes Atualizações em Nucleic Acids Research http:// www3.oup.co.uk/nar/database/

Procurar pelo gene polc (dnae, DNA Polimerase III)

Procurar pelo gene polc (dnae,dna Polimerase III)

Entrez: procurar pelo gene polc (dnae) AND E coli

Entrez: procurar pelo gene polc (dnae) AND E coli

Resgatar seqüências de genes em formato FASTA

Resgatar seqüências de genes em formato FASTA Seqüência FASTA em nucleotídeos Seqüência FASTA do produto gênico em aminoácidos Coordenadas do gene no contexto do genoma total

seqüência FASTA do gene dnae Fabiana G. S. Pinto Começa com codon de iniciação, no caso ATG (metionina) e continua sem espaços até um codon de finalização Começa com símbolo maior e descrição do gene e do organismo sem espaços

Informação adicional do gene dnae, Polimerase III subunidade alfa Link para referencias bibliográficas no PubMed Processo celular envolvido e localização do produto gênico

Informação adicional do gene dnae, Polimerase III subunidade alfa EcoCyc. Informação do site de enciclopédia e genes de E coli http://ecocyc.org/ Classificação de COG. Genes Ortólogos Classificação EC number. Número de Enzima

CONCEITOS PARA LEMBRAR HOMÓLOGOS Fabiana G. S. Pinto ORTÓLOGOS PARÁLOGOS ORTÓLOGOS E. coli S.meliloti R. tropici R. tropici S.meliloti E coli Gene dnae Alpha subunit Gene dnae Delta subunit Duplicação gênica Gene DNA Polimerase III inicial

Classificação de Gene Ortólogo para dnae COG0587 Relação Filogenética para COG0587 entre 50 espécies

Link para Procurar números de enzimas http://www.genome.jp/dbget-bin/get_htext?ectable

EC para Polimerase III : 2.7.7.7 Fabiana G. S. Pinto

EC para Polimerase III : 2.7.7.7 Fabiana G. S. Pinto

EC para Polimerase III: 2.7.7.7 Fabiana G. S. Pinto

Alinhamento das Seqüências Fabiana G. S. Pinto Finalidade: procurar determinar o grau de similaridade entre duas ou mais seqüências. Alinhamento entre mais de uma seqüência é Múltiplo. Programas on-line: ClustalW, Multialin, FASTA, BLAST... Qualidade: soma dos pontos obtidos por cada unidade (match) menos a penalidades pela introdução dos gaps (mismatch) Alinhamento global ou Local Global: ClustalW-X Multialin Local: BLAST (Basic Local Alignment Search Tool)

Blast no NCBI: http://www.ncbi.nlm.nih.gov/blast/

Vamos procurar similaridades através do Blastx do gene dnae de E coli (resgatar seq FASTA do entrez gene)

Colar a seqüência FASTA com os dados iniciais. Este é nosso query

Blastar Fabiana G. S. Pinto

Clicar Format para abrir nova janela Fabiana G. S. Pinto

Qualidade do Alinhamento

Score elevado Ver Subject: Salmonella typhymurium E value máximo: 0.0. Fabiana G. S. Pinto Ótimo: a partir de e-60 (e diminuindo para mais negativo) Aceitável: entre e-30 a e-60 E value maiores indicam alinhamento ao acaso: maior a 0.0 até e-10 - e-30 Identidade difere de positivos. Positivo procura analogia do aminoácido na seq da proteína

http://www.ebi.ac.uk/clustalw/ Fabiana G. S. Pinto

http://www.ebi.ac.uk/clustalw/ Fabiana G. S. Pinto

Resgatar seq FASTA em Entrez Genes: RNA Polymerase sigma subunit AND alpha proteobacteria

Copiar quatro seqüências FASTA (1, 6, 10 e 17) e colar em bloco de notas

Selecionar tudo copiar e colar na janela do ClastalW. Run!

O asterisco mostra identidade. Este alinhamento auxilia quando é preciso desenhar primers PCR para amplificar um gene de interesse. Buscamos seqüências do gene em espécies próxima da que estamos estudando

No final mostra uma árvore filogenética Fabiana G. S. Pinto

Banco de proteínas http://us.expasy.org/sprot/sprot-top.html Fabiana G. S. Pinto

Banco Funcional: enciclopédia de genes e genomas http://www.genome.jp/kegg/kegg2.html

Procariotos Polimerase III subunidade alfa Fabiana G. S. Pinto

Genes para 2.7.7.7 seqüenciados em vários organismos Fabiana G. S. Pinto

Gene dnae em E. coli K-12 com muita informação e links! Fabiana G. S. Pinto

Seqüência FASTA em aminoácidos Seqüência FASTA em nucleotídeos

Também podem navegar na lista de genomas seqüenciados http://www.genome.jp/kegg/catalog/org_list.html