Bioinformática. Alinhamento de Sequências. Prof. Msc. Rommel Ramos



Documentos relacionados
Explorando bancos de dados genômicos e introdução à bioinformática. Guilherme Targino Valente Marcos Tadeu Geraldo. Bioinformática

UNIVERSIDADE FEDERAL DE VIÇOSA BIOINFORMÁTICA ESTRUTURAL: PREDIÇÃO DE ESTRUTURA 3D DE PROTEÍNAS

Anotação de Genomas. Fabiana G. S. Pinto

Métodos de alinhamento de sequências biológicas. Marcelo Falsarella Carazzolle

Alinhamento de sequências

O que são domínios protéicos

Princípios moleculares dos processos fisiológicos

Hoje estudaremos a bioquímica dos ácidos nucléicos. Acompanhe!

Modelagem por Homologia passo-a-passo. Prof. Rommel Ramos

COMPARAÇÃO DE SEQÜÊNCIAS DE DNA

Alinhamento de seqüências

Dezembro Bioinformática. e Anotação. Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP

Miguel Rocha Dep. Informática - Universidade do Minho. BIOINFORMÁTICA: passado, presente e futuro!!

Equipe de Biologia. Biologia

Analise filogenética baseada em alinhamento de domínios

Disciplina de Projetos e Análise de Algoritmos

1. (Unesp) A ilustração apresenta o resultado de um teste de paternidade obtido pelo método do DNA-Fingerprint, ou "impressão digital de DNA".

As bactérias operárias

MEDICINA VETERINÁRIA. Disciplina: Genética Animal. Prof a.: D rd. Mariana de F. Gardingo Diniz

MARCO TÚLIO NOGUEIRA SILVA

Alinhamento local- Utilização do BLAST

> ESTUDO DO RNA. (C) O ácido nucléico I é DNA e o II, RNA. (D) O ácido nucléico I é RNA e o II, DNA. (E) I é exclusivo dos seres procariontes.

GABARITO BIOLOGIA REVISÃO 01 3 ANO A/B ENSINO MÉDIO

BANCO DE QUESTÕES - BIOLOGIA - 1ª SÉRIE - ENSINO MÉDIO ==============================================================================================

Alinhamento de Seqüências Biológicas

alinhamento global-alinhamento múltiplo de seqüências

Bioinformática. João Varela Aula T4 CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, CIÊNCIAS BIOMÉDICAS E ENGENHARIA BIOLÓGICA

Alinhamento de Seqüências

O fluxo da informação é unidirecional

Bioinformática. Trabalho prático enunciado complementar. Notas complementares ao 1º enunciado

DNA A molécula da vida. Prof. Biel Série: 9º ano

17/10/2012. Bases Instrumentais de bioinformática aplicada à Epidemiologia Molecular das doenças transmissíveis. Fábio Gregori. O que é?

Alinhamentos e Busca de Similaridade. Ariane Machado Lima

Algoritmos para Alinhamento de Sequências

- Ácido ribonucléico (ARN ou RNA): participa do processo de síntese de proteínas.

Universidade do Estado do Rio de Janeiro Centro de Tecnologia e Ciências Faculdade de Engenharia

Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Ciências Biomédicas, Engenharia Biológica. João Varela

Pesquisador em Saúde Pública Prova Discursiva INSTRUÇÕES

CONHECIMENTOS ESPECÍFICOS

Criado e Desenvolvido por: Todos os direitos são reservados

ALINHAMENTO DE SEQUÊNCIAS

BIOLOGIA - 1 o ANO MÓDULO 08 RIBOSSOMOS E SÍNTESE PROTEICA

COMUNICAÇÃO DA INFORMAÇÃO NAS MOLÉCULAS DE DNA E RNA

Criado e Desenvolvido por: RONNIELLE CABRAL ROLIM Todos os direitos são reservados

CONTROLE DO METABOLISMO GENES

Bancos de dados de biomacromoléculas e recuperação de informação

O processo fisiológico que está representado no gráfico é

Estrutura e função dos ácidos nucléicos. Profa. Melissa de Freitas Cordeiro-Silva

DO GENE À PROTEÍNA ALGUNS CONCEITOS BASICOS COMO SE ORGANIZAM OS NUCLEÓTIDOS PARA FORMAR O DNA?

Universidade Federal do Espírito Santo Programa de Pós Graduação em Biotecnologia Bioinformática. Kellyn Joselyn Andino Lopez Mariana Lugon Lima

Bases Moleculares da Hereditariedade

A matemática e o genoma. Resumo

Dra. Kátia R. P. de Araújo Sgrillo.

Tutorial Introdução a anotação e comparação de genomas Tiago Mendes Doutorando em Bionformática

NÚCLEO e DIVISÃO CELULAR

O DNA é formado por pedaços capazes de serem convertidos em algumas características. Esses pedaços são

Introdução ao SRS Sequence Retrieval System. Marcelo Falsarella Carazzolle

O processo da Expressão Gênica

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

Alinhamento de Seqüências Biológicas

Curso de Verão Bioinformática

Núcleo Celular. Biomedicina primeiro semestre de 2012 Profa. Luciana Fontanari Krause

Balanceamento de Carga

Mitocôndrias e Cloroplastos

Modelos e Métodos de Resolução para Problemas de Escalonamento de Projetos

Linkage Probabilístico de Bases de Dados Método. Cláudia Medina Coeli

Introdução a Bioinformática Curso de Verão Nivelamento na área de Biológicas

ALGORITMOS DE ORDENAÇÃO. Algoritmos de comparação-e-troca. Bubble Sort Merge Sort Quick Sort

Aula 7 Ácidos nucléicos

Comunicado Técnico. Análise Preliminar de um Processo para Identificação e Alinhamento de Seqüências Homólogas para Proteínas com Estrutura Resolvida

Genética Humana. Prof. João Ronaldo Tavares de Vasconcellos Neto

Genes. Menor porção do DNA capaz de produzir um efeito que pode ser detectado no organismo. Região do DNA que pode ser transcrita em moléculas de RNA.

Introdução à genética quantitativa usando os recursos do R

Universidade de Brasília

Mutações. Disciplina: Fundamentos de Genética e Biologia Molecular Turma: Fisioterapia (1 o Ano)

Os primeiros indícios de que o DNA era o material hereditário surgiram de experiências realizadas com bactérias, sendo estas indicações estendidas

DNA E SÍNTESE PROTEICA

Duplicação do DNA e Síntese de PROTEÍNAS

Folhas de BioInformática e Análise de sequências Eduardo Rocha

Arquitetura de domínios proteícos

O que queremos. Processamento Estatístico da Linguagem Natural. Parsing Morfológico. Regras Simples. Adicionando palavras. Regras Derivacionais

DETERMINAÇÃO DA ESTRUTURA TRIDIMENSIONAL DE PROTEÍNAS POR DIFRAÇÃO DE RAIOS-X

BIOLOGIA MOLECULAR. Ácidos Nucléicos e Síntese de Proteínas

Algoritmo de Comparação de Strings para Integração de Esquemas de Dados

Programação Básica em STEP 7 Símbolos. SITRAIN Training for Automation and Drives Página 4-1

Transcrição e Tradução. Profa. Dra. Juliana Garcia de Oliveira Disciplina: Biologia Celular e Molecular Turmas: Biologia, enfermagem, nutrição e TO.

Transcrição:

Bioinformática Alinhamento de Sequências Prof. Msc. Rommel Ramos 2013

Sumário 1. Comparação de Sequências 2. O que é alinhamento? 3. Tipos de Alinhamento 4. Algoritmos 5. Métodos de Alinhamento

Comparação de Sequências Objetivo: Identificar semelhanças/diferenças entre sequências de DNA, RNA e de Proteínas. DNA (nucleotídeos) ADENINA CITOSINA GUANITA TIMINA RNA (nucleotídeos) ADENINA CITOSINA GUANITA Uracila Proteínas DNA RNA Proteína

Comparação de Sequências Proteínas Códon: Trinca de nucleotídeos;

Comparação de Sequências O que fazer? 1. Analisar duas ou mais sequências; 2. Identificar diferenças Como fazer? Alinhar

Alinhamento de Sequências Significado de acordo com o dicionário Aurélio Alinhar v.t.d. Dispor-se em linha reta. Colocar lado a lado na mesma linha: alinhar tijolos. Exemplo de alinhar um texto Universidade Federal do Pará Curso de Verão Data: XX/XX/XXXX Alinhado à esquerda

Alinhamento de Sequências Definição: Segundo Lesk (2005), consiste na determinação da correspondência entre pares de resíduos. Uma das técnicas mais utilizadas na bioinformática Formato tradicional das sequências: Fasta

Alinhamento de Sequências Exemplo: GTCGATCGATCGAGCTAGCTAGCTA ATTGATCCAGCT-GCTAGAT Match: Correspondência correta entre pares de resíduos; Mismatch: Falso alinhamento; Gap: Sequência de espaços ou apenas um no alinhamento;

Alinhamento de Sequências Objetivos 1. Medir a similaridade entre duas ou mais sequências 2. Inferir relações evolucionárias 3. Observar padrões de conservação e variabilidade para predições estruturais e funcionais.

Alinhamento de Sequências Definição de termos 1. Identidade: Quantos idênticos; 2. Similaridade: Quantos parecidos; 3. Homologia: Relação evolutiva entre duas sequências, ou seja: se tem ancestral comum. 4. Query: Sequência alvo, sequência de Busca; 5. Subject: Sequência(s) de Referência

Tipos de Alinhamento Alinhamento Global Algoritmo de Needleman-Wunsch (1970); Compara sequências em toda sua extensão; Espera-se semelhanças por toda a extensão da sequência; Programas:ClustalW e ALIGN t Fonte: http://www.tactic-tech.com/blog/application-of-sequence-alignment/

Tipos de Alinhamento Alinhamento Local Algoritmo de Smith-Waterman (1981); Modificação do algoritmo de Needleman-Wunsch; Encontra o melhor alinhamento de algum segmento de uma sequência contra o segmento de outra; Programas: FASTA e BLAST S1: S2: AGTATACCTGCGCAGCGAATT CAATCACCTGCGCATTAGGGG AGTATACCTGCGCAGCGTTAG CAATCACCTGCGCATTAGGGG

Tipos de Alinhamento Comparação entre Alinhamento Local e Global S1: S2: TCCCAGTTATGTCAGGGGACACGAGCATGCAGAGAC AATTGCCGCCGTCGTTTTCAGCAGTTATGTCAGATC Alinhamento Global --T--CC-C-AGT--TATGT-CAGGGGACACG--AGCATGCAGA-GAC AATTGCCGCC-GTCGT-T-TTCAG----CA-GTTATG T-CAGAT--C Alinhamento Local TCCCAGTTATGTCAGGGGACACGAGCATGCAGAGAC AATTGCCGCCGTCGTTTTCAGCAGTTATGTCAGATC

Tipos de Alinhamento Alinhamento Semi-global Similar ao alinhamento global mas ignora os espaços nos extremos das sequências.

Tipos de Alinhamento Alinhamento Semi-global --------CAGCACTTGGATTAGAC TACCTGCGCAGCG-TGG-------Aplicações:Montagem de fragmentos

Alinhamentos entre sequências são pontuados ATCGATGCGTAGC TACCTGCGTAGCG +2 ATCGATGCGTATC TAGCTGCGTAGCG +2 ATCGATGCGTA-A TAGCTGCGTAGCG -1 ATCGATGCGT-C TGCGGCGTAGCG 0 Match: +1 Mismatch: -1 Abertura de Gap: -2 Extensão de Gap: -1

Faça os alinhamentos e os pontue Seq1 Seq2 Seq1 Seq2 ATCGA TGCGT AGCGC TAGCT AGCATG TAGCT AGCAT GTGCG TAGCG GGGTT ACAAC ACCCG GTACG TGGTA CACCG GTACG TGGTA Seq1 TCGGT CATCA GTCATT AAACA ACA Seq2 CGATC GTAGG TCGAT GTCAT CA Seq1 TCGGT CATCA GTACA ACTAC AACA Seq2 ACAAC AACAA CAGAT GTCAT CA

Respostas Seq1 Seq2 ATCGATGCGTAGCGCTAGCTAGCATG TAGCTAGCATGTGCGTAGCG Seq1 GGGTTACAACACCCGGTACGTGGTA Seq2 CA-CCGGTACGTGGTA Seq1 Seq2 Seq1 Seq2 TCG--GTCATCAGTCATTAAACAACA CGATCGTAGGTCGATGTCATCA TCGGTCATCAGTACAACTACAACA ACAACAACAACAGATGTCATCA

TCGGTCATCAGTACAACAACAACA ACAACAACAACAGATGTCATCA Errado: TCGGTCATCAGTACAACAACAACAACAACAGATGTCATCA Ref TCGGTCATCAGTACAACAACAACA------GATGTCATCA

Métodos de Alinhamento Comparando sequências Distância Hammig: Quantidade de mal pareamentos e sequências de mesmo comprimento; GCTAGCTTGCTATTAGCTA GCTAGCTAGCTAGTAGCTA 2 GTGACTGATGCTAGCTAGG GTGACTGATGCTAGCTAGC 1

Métodos de Alinhamento Comparando sequências Distância Levenshtein: Quantidade de edições necessárias para transformar uma sequência em outra. (inserção, deleção ou substituição de caracteres); GCTAGCTTG-TATTAGCTA GCTAGCTAGCTAGTAGCTA 3 GTG---GATGCTAGCTAGG GTGACTGATGCTAGCTAGC 4

Métodos de Alinhamento Matriz de Pontos - Permite observar a similaridade entre sequências; - Consiste em um matriz, cujas linhas e colunas representam sequências; - Pontos são deixados em branco quando os caracteres são diferentes; - Pontos são preenchidos quando os caracteres são iguais;

Métodos de Alinhamento Matriz de Pontos Fonte: Lesk(2008)

Métodos de Alinhamento Programação Dinâmica Termo utilizado pela primeira vez em 1950 por Richard Bellman; Utilizado por Needleman e Wunsch e Smith-Waterman; Divide um problema em sub-problemas, que devem ter soluções ótimas; Retorna uma solução ótima global: o score ótimo; Aplicado a alinhamentos: globais, locais e semi-globais;

Métodos de Alinhamento Programação Dinâmica LIMITAÇÕES Elevado tempo computacional; Não é indicado para busca de sequências em bancos de dados ou comparações todos contra todos ;

Métodos de Alinhamento Método de Palavras Heurístico Motivação: Pesquisa em bancos de dados com PD muito lenta. Não garantem a obtenção de um resultado ótimo; Exemplos: FASTA (Pearson & Lipman, 1988) e BLAST (Altschul et al., 1990)

Métodos de Alinhamento Método de Palavras Basic Local Alignment Search Tool (BLAST) Heurística + Programação dinâmica 1. Algoritmo Heurístico Procura sementes(seeds) com alto escore de alinhamento; 2. Programação Dinâmica Extensão dos alinhamentos identificados no passo anterior;

Métodos de Alinhamento Alinhamento Multiplos Definição: Segundo Lesk(2005), é alinhamento que utiliza 3 ou mais sequências, podendo ser local ou global; Objetivo: Caracterização de famílias proteicas; Identificar padrões de conservação de aminoácidos; Identificar relações distantes; Aplicações: Perfis PSI-Blast HMM