alinhamento global-alinhamento múltiplo de seqüências

Documentos relacionados
Alinhamento de seqüências

Alinhamento de sequências

Alinhamento local- Utilização do BLAST

Métodos de alinhamento de sequências biológicas. Marcelo Falsarella Carazzolle

Análise de significância de. alinhamentos

Alinhamentos de Múltiplas Seqüências. Rogério T. Brito Orientador: José A. R. Soares

Alinhamentos de sequências e Busca de Similaridade

Principais algoritmos de alinhamento de sequências genéticas. Alexandre dos Santos Cristino

Comparação e alinhamento de. sequências

Comparação e alinhamento de sequências

Alinhamentos e Busca de Similaridade. Ariane Machado Lima

Programas de Alinhamento. Sumário

PAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE

Capítulo 11. GRÁFICOS COM WGNUPLOT

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro

Cap. 6: Métodos para alinhamento de múltiplas seqüências

Nome da atividade: Identificação de uma proteína a partir da sua seqüência nucleotídica e determinação da sua estrutura e função

Análise de dados provenientes de técnicas moleculares

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...

ALINHAMENTO DE SEQUÊNCIAS

Alinhamento de Seqüências Biológicas

Bioinformática: QBQ-5722 Anotação Artemis: Passo-a-passo. Prof. Dr. João Carlos Setubal

Alinhamento de Seqüências

Banco de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri. Banco de Dados Processamento e Otimização de Consultas

Nada em Biologia faz sentido senão à luz da evolução.

IQB723 - Bioinformática Básica Prof. Rafael Dias Mesquita

Estatísticas e Relatórios. Treinamento OTRS Help Desk

Capítulo I Introdução ao Sistema SALT

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Protein Homology detection by HMM-comparation.

Mais Informações sobre Itens do Relatório

Gauss-Seidel para Solução de Sistemas com Matrizes Banda Usando Armazenamento Especial

Manual do Usuário. VpetConverter Ferramenta para adequação de documentos para Petições Eletrônicas.

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro

Animação de Imagens. Manual do usuário. DSA/CPTEC/INPE 27 de abril de 2016 Versão 1.0

Objetivo: Teste de Ponto e Teste de Busca da característica (zonas).

Aprender a utilizar o aplicativo Gnuplot para fazer gráficos

1º No módulo de Gestão Contábil é possível acessar o relatório através do menu Relatórios Diário.

Como funciona: A tela de Pedido de Compras é utilizada para registrar e controlar os pedidos de compras efetuados em uma empresa.

IACB 1º Semestre de 2014/2015. Exercicios de Preparação para o Teste 1

Longarinas de madeira

Um ambiente super amigável de trabalho com recursos poderosos de análise e acesso a uma ampla base de dados da economias brasileira e internacional.

SISTEMA DE GESTÃO DE RECURSOS HUMANOS

RPPA. Coordenador. (51)

Alinhamento Múltiplo de Seqüências Através de Técnicas de Agrupamento

INTRODUÇÃO À TECNOLOGIA DA INFORMAÇÃO ACESSO, ATRIBUTOS E OPERAÇÕES COM ARQUIVOS PROFESSOR CARLOS MUNIZ

Mais de 12 mil séries de tempo relativas às economias brasileira e mundial, selecionadas por sua relevância e que podem ser acessadas de forma

GUIA RÁPIDO. MDIForms. Sintel Informática Ltda. Rua Vergueiro, nº º andar Vila Mariana, São Paulo - SP CEP:

Como usar Tabela Dinâmica (Pivot Table) Exemplo Prático. Este conteúdo faz parte da série: Excel Tabelas e Tabelas Dinâmicas Ver 5 posts dessa série

[GUIA RÁPIDO: OFFICE SWAY]

Word. Introdução. Introdução. Introdução. Interface padrão Margem esquerda da página. Interface padrão

Conhecendo a aba Início

Projeto de Mestrado desenvolvido pela aluna Eveline Batista Rodrigues, no Departamento de Engenharia Elétrica da Universidade de São Paulo São

1164 BIOLOGIA ESTRUTURAL Aula 4 Prof. Dr. Valmir Fadel

PhyCon Manual do Usuário

7 Prototipação do SGWBio

PLANILHA, CÉLULAS E CONTEÚDO

neelo MANUAL DE IDENTIDADE CORPORATIVA

Bioinformática. Alinhamento de Sequências. Prof. Msc. Rommel Ramos

ASD 535. ASD PipeFlow. For your safety

Compiladores. Geração de Código Objeto

Cadastro Nacional de Produtos - CNP

Manual dos Ajustes de Medidas do DomusCAD 2012

Manual do programa de cálculo de grelhas equivalentes

Versão Melhorias e Correções Patch. Versão Fevereiro de 2018 Versão Correções e Melhorias

4 Algoritmo de reconstrução de curvas

Visualização de Hélices

INSTITUTO DE PÓS GRADUAÇÃO ICPG GESTÃO DA TECNOLOGIA DA INFORMAÇÃO

CENTRO PAULA SOUZA ETEC PADRE JOSÉ NUNES DIAS APLICATIVOS INFORMATIZADOS WORD 2007 PROFESSORA: ALINE PRISCILA SCHMIDT ALUNO:

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro

2 Contexto e Motivações

Objetivos do Documento. Mudanças

Linguagem e Técnicas em Programação. Gilson de Souza Carvalho

Biologia Estrutural. Qualidade de modelos estruturais Prof. Dr. Walter F. de Azevedo Jr. wfdaj.sites.uol.com.br Dr. Walter F. de Azevedo Jr.

Menu Editar. Tipos de Tela

Microsoft PowerPoint. A seguir podemos observar a janela do Microsoft PowerPoint. Observe: Slide

LibreOffice Calc: aula 3

Lógica de Programação

Universidade Federal do Espírito Santo Programa de Pós Graduação em Biotecnologia Bioinformática. Kellyn Joselyn Andino Lopez Mariana Lugon Lima

Manual Sistema de Automação de Pedidos Data C

Integração com o Ambiente Virtual de Aprendizagem Moodle

Bem-vindo ao tópico sobre os relatórios de imposto ampliados.

Identificação de genes por similaridade de seqüência

AUTOCORRELAÇÃO ESPACIAL. Flávia F. Feitosa

Últimas Implementações / Ajustes Notwin

Informática Prof. Rodrigo Schaeffer

3 Algoritmos Genéticos

aplicativo: Índice Situação: 20/06/2017

Organização de Arquivos. SCE-183 Algoritmos e Estruturas de Dados II

Bioinformática. iphy Sistema de Apoio à filógenética para a análise de supermatrizes. Trabalho realizado por: João Pedro Teixeira

Tabela Hash. Disciplina de Algoritmos e Estrutura de Dados III. Prof. Marcos Antonio Schreiner 15/05/2015

RELEASE NOTES SQUATRO - 1_42 - TTI - DEMANDAS PCMAT

Sumário. 1 DKWeb Alunos Configuração de Parâmetros. Configuração de Parâmetros DKWeb Alunos 1.5. Guia de uso Revisão 10/09/2015

TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO DE GRADUAÇÃO

TUTORIAL. Projetos utilizando o Assistente para Dialux Lighting

Spectrum Miner. Versão 8.0. Guia do usuário para a integração do Portrait Dialogue

MANUAL DO USUÁRIO SISTEMA GERENCIADOR DE SENHAS VERSÃO SERVIDOR

Funções Escolhendo as bases de dados Aqui se escolhe quais das bases de dados serão usadas na busca.

Sistema de Atendimento Telefônico Automático. Manual do Usuário

PROVAS Ciência da Computação. 2 a Prova: 13/02/2014 (Quinta) Reavaliação: 20/02/2014 (Quinta)

Transcrição:

alinhamento global-alinhamento múltiplo de seqüências

Alinhamento múltiplos de seqüências Qual a importância de se realizar alinhamentos múltiplos em oposição a alinhamentos em pares?

Alinhamento múltiplos de seqüências Usos do alinhamento múltiplo de seqüências -Estabelecer relações filogenéticas entre diferentes proteínas -Predizer domínios conservados, incluindo resíduos críticos para a função da proteína -Comparar a proteína de interesse de forma mais detalhada com membros da mesma família de proteínas

Alinhamento múltiplo de seqüências Ao se alinhar 3 seqüências pode-se calcular o alinhamento ótimo através do dynamic programming, entretanto neste caso você passa a ter que calcular uma matriz tridimensional. Caso mais seqüências fossem adicionada seria necessário uma matriz N dimensional onde N é o numero de seqüências alinhadas Isso cria um problema computacional pois o numero de comparações a serem feitas será o numero de aminoácidos elevado ao numero de seqüências alinhadas

Alinhamento progressivo (Clustal) Com a finalidade de solucionar este problema um método heurístico foi desenvolvido de modo a fazer um alinhamento progressivo de seqüências baseado na sua proximidade em uma arvore filogenética baseada em alinhamentos par a par Apesar deste tipo de método gerar bons alinhamentos em tempo razoável, ele não garante que o melhor alinhamento possível será obtido

Alinhamento progressivo (Clustal) Figura mostra o principio do alinhamento progressivo. Alinhamentos são realizados seqüencialmente baseado na arvore filogenética estimada criada a partir dos alinhamentos par a par realizados.

Alinhamento progressivo (Clustal) Ao realizar cada alinhamento são gerados pesos para cada seqüências dependendo da sua distancia em relação as outras seqüências do alinhamento. O objetivo deste procedimento é evitar a criação de vieses gerados pela escolhas de muitas seqüências próximas em oposição a poucas seqüências divergentes.

Alinhamento progressivo (Clustal) Exemplo de calculo de escore em alinhamento progressivo a partir de dois pares de seqüências alinhadas. Note que cada seqüência possui um peso especifico mesmo já estando alinhada com uma outra seqüência. Escores de substituição ou identidade entre seqüências já alinhadas (Seq A e B, no exemplo acima) não são computados visto que o alinhamento entre A e B não vai mais variar.

Problemas do método de alinhamento progressivo Este tipo de algoritmo é altamente dependente da qualidade dos alinhamentos iniciais, visto que ao longo do processo eles não serão mais alterados Dificuldade é maior quando mesmo as seqüências mais próximas são distantemente relacionadas Dificuldade em estabelecer parâmetro ótimos de alinhamento

Uso de aproximação sucessiva para refinar alinhamentos Devido a limitações impostas devido ao alinhamento progressivo foi implementado nas ultimas versões do clustal um algoritmo utilizando aproximação sucessiva (iteration) para minimizar este tipo de problema O algoritmo realiza após cada alinhamento um procedimento no qual ele seleciona uma seqüência e realinha esta com o resto do alinhamento, caso o escore resultante for melhor que o inicial o novo alinhamento é mantido. Isto e realizado sucessivamente com todas as seqüências do alinhamento.

ClustalX Seqüências em formato multi-fasta ou aln pode ser carregadas no clustalx através do comando load sequences

ClustalX Cada linha representa uma seqüência Gráfico com Indicação do grau de conservação

Sistema de cores do clustal O fundo colorido do clustal tem duas funções: chamar a atenção de regiões conservadas e para o caráter dos aminoácidos

Alinhando seqüências no clustalx Menu alignment permite acessar diversos comandos incluindo menus de ajuste de parâmetros de alinhamentos

Alinhando seqüências no clustalx Clicando no item multiple aligment parameters é possível acessar um menu onde é possivel ajustar os seguintes parametros Gap opening- Penalização de escore para iniciar uma região de gap Gap extension- Penalização de escore para extender uma região de gap (normalmente menor que o Gap opening) Delay divergent sequences- Atraso de alinhamento de seqüências divergentes que somente serão alinhadas após as outras sequencias (porcentagem de identidade abaixo da qual que faz a seqüência seja considerada divergente)

Alinhando seqüências no clustalx Transition weight (somente DNA)- da a transições (A<->G, T<->C) um escore diferente de 0. Use negative matrix- permite o uso de matrizes negativas, importante quando as seqüências forem relacionadas somente em uma pequena porção. Em condições normais prejudica um pouco o alinhamento Protein Weight Matrix- Matriz de substituição a ser utilizada. Note que voce só escolhe a serie de matriz: Blosum, PAM, etc..., o tipo de matriz dentro desta serie (por exemplo Blosum 62, blosum 80) é escolhido automaticamente pelo programa

Alinhando seqüências no clustalx Residue specific penalty- Considera a vizinhança de alguns resíduos como mais ou menos favoráveis para abertura de gaps Hydrophilic penalties- aumentqa a chance de gaps em regiões ricas em resíduos hidrofílicos, que usualmente representam regiões menos estruturadas. Hydrophilic residues- especifica que residuos são considerados hidrofilicos Gap separation distance- numero de resíduos de distancia de uma região com gap na qual é penalizada uma nova abertura de gap Considera o gap no final da seqüência normalmente para o parâmetro acima

Alinhando seqüências no clustalx Como realiza um alinhamento global o clustal tentará realizar o alinhamento de toda a proteína não jogando fora pedaços como ocorre no caso de alinhamento por blast. Em adição não há a geração de um parâmetro de confiança que permita você avaliar a significância do seu alinhamento Deste modo o clustal é uma ferramenta muito pobre para identificação de função de proteínas. O seu principal uso é para uma caracterização mais fina após a determinação da identidade e domínios presentes na seqüência.

Alinhando seqüências no clustalx É muito importante que haja uma seleção criteriosa de que seqüências e quais regiões destas seqüência serão alinhadas Muitas vezes ao invés de selecionarmos proteínas inteiras, que podem conter um mosaico de regiões com diversas origens evolutivas, é preferível alinhar somente regiões de domínios em comum

Alinhando seqüências no clustalx Alinhamento de múltiplas seqüências são bastante influenciados pelas penalizações de abertura e extensão de gaps e ao fazer alinhamentos o usuário normalmente deve ajustar estes parâmetros de modo a obter um bom alinhamento Para o alinhamento de seqüências mais divergentes é necessário a utilização de penalizações menores para a abertura de gaps

Alinhando seqüências no clustalx Devido aos problemas do algoritmo de alinhamento progressivo quando alinhamos seqüências distantes é sempre recomendável inserir no alinhamento múltiplo seqüências adicionais que sejam mais próximas das seqüências analisadas De modo geral, ter um numero razoável de seqüência ajuda o programa de alinhamento múltiplo e facilita a interpretação dos dados

Resultado de alinhamento ClustalX Símbolos indicam conservação de resíduos ou grupos de resíduos em uma coluna

Resultado de alinhamento ClustalX Low scoring segments- existe a opção de mostrar em cinza regiões com baixo escore e que portanto não seriam muito confiáveis

Visualização do resultado de alinhamento ClustalX Exporta o alinhamento em formato postscript

Visualização do resultado de alinhamento ClustalX Resultado de alinhamento em arquivo postscript

Visualização do resultado de alinhamento ClustalX Box shade- ferramenta para visualização de alinhamentos. Aceita formato aln (clustal). Pode exportar em formato rtf http://www.ch.embnet.org/software/box_form.html

Visualização do resultado de alinhamento ClustalX