Comparação entre sequências biológicas

Tamanho: px
Começar a partir da página:

Download "Comparação entre sequências biológicas"

Transcrição

1 Comparação entre sequências biológicas Extraíndo e analisando os sinais contidos em biopolímeros ( Alinhamentos ) Prof. Dr. Alessandro Varani UNESP - FCAV

2 Objetivos Abordagens práticas para comparação de sequências; Como comparar? Inferências biológicas e evolutivas geradas a partir da comparação de sequências. Como analisar e interpretar os resultados?

3 Parte 1 Introdução e Conceitos

4 O primeiro fato na análise de sequências biológicas. Dan Gusfield (1997) "Em sequências biomoleculares, uma alta similaridade de sequência frequentemente implica em grande similaridade funcional e estrutural." "Em sequências biomoleculares, alta similaridade de sequência também implica, muito frequentemente, em relação evolutiva."

5 Prólogo (1): Conceitos Básicos Dilema da causalidade ovo ou a galinha? Estrutura de uma biomolécula Genômica estrutural Tábuas da Saúde (Tacuinum sanitatis) Pode ser fisicamente definida: (a) Amostra pura da proteína; (b) Um local apropriado para crescer os cristais; (c) Uma linha de luz sincroton. Sítio catalítico da transposase Bacteriófago Mu

6 Prólogo (2): Conceitos Básicos Função de uma biomolécula Genômica Funcional (Bioquímica) Não é somente uma característica física, mas a descrição de um determinado processo biológico; Só pode ser determinada dentro de um contexto biológico; A função também envolve interações com outras moléculas que também precisam ser identificadas e com função desvendada;

7 Prólogo (3): Conceitos Básicos Função de uma biomolécula Genômica Funcional (Bioquímica) Normalmente, para se definir a função biológica de uma biomolécula, é preciso verificar as interações de muitos componentes num extrato celular, na célula inteira, nos organismos vivos, ou dentro de um ecossistema no qual o organismo seja uma parte. Logo que a função de uma proteína é realizada, sua estrutura pode mudar. Protein Structural Change upon Ligand Binding Correlates with Enzymatic Reaction Mechanism Koike et al., 2008

8 Prólogo (4): Conceitos Básicos Estrutura e Função de uma Biomolécula Apesar de serem geralmente observáveis, não é uma correlação trivial a ser feita! Durante um projeto que envolva a análise e comparação de sequencias biomoleculares, levar em consideração todas as nuances possíveis entre a relação estrutura e função é de fundamental importância. Não basta apenas apelar para o resultado que o computador fornece.

9 Prólogo (5): Conceitos Básicos Com base na similaridade de sequencias: Similaridade de estrutura Similaridade de função Ancestralidade comum Hoffmann et al., PNAS (2010)

10 Prólogo (6): Conclusões A inferência de estrutura e função é inseparável da inferência evolutiva; Quando sequências provenientes de duas biomoléculas são comparadas, nosso caminho a partir da similaridade de sequência até chegar à conclusão sobre similaridade funcional e estrutural nunca é direta; Inversamente, sempre inferimos primeiramente a ancestralidade comum entre sequências e, só a partir daí é que se pode partir para a inferência de estrutura e função. Essa lógica não é óbvia quando a similaridade é muito alta, mas se duas sequências são mais distantemente e relacionadas uma à outra, essa cadeia de raciocínio precisa tornar-se explícita.

11 Prólogo (7): Conclusões Medimos a similaridade entre sequências e imediatamente usamos estatísticas para comparar a similaridade observada com o que seria esperado ao acaso; Se a similaridade é muito alta para ocorrer ao acaso, isso é frequentemente considerado suficiente para a realização de predições sobre a função protéica e estrutural. A única razão pela qual este raciocínio funciona é porque a única forma de uma similaridade de sequência não-aleatória ocorrer é através da descendência a partir de um ancestral comum das duas sequências. (O que é chamado de inferência por homologia) ; Portanto, a inferência das relações evolutivas, torna-se um pré-requisito para a proposição de outras relações, como a estrutura e a função.

12 Prólogo (8): Proteínas Em contrapartida com funções similares não precisam ter sequências similares, e proteínas com estruturas similares também podem apresentar sequências diferentes; Biomoléculas apresentando funções similares podem ter perdido a similaridade de sequência mas, de outra forma, elas podem não ter nunca compartilhado similaridades mas terem convergido para a mesma função a partir de sequências completamente divergentes evolutivamente. Este princípio se aplica a estruturas também: a similaridade de estruturas na ausência de similaridade de sequência pode representar tanto a extrema divergência de sequencias que foram inicialmente similares quanto a convergência de sequências que não eram similares inicialmente; A distinção entre divergência e convergência em nível molecular é um dos problemas mais importantes.

13 Como inferir a ancestralidade comum, estrutura e função? B A C Somente A foi estudada Gene Pti1: Codifica uma serina/treonina kinase Praticamente idênticas Parecida (bastante próxima) Nem todos os resíduos de aminoácidos precisam ser conservados entre A e B para determinar o ancestralidade comum. Por exemplo, podemos não considerar os sítios conservados exclusivamente entre A e B porque não precisamos destes resíduos para reconhecer a similaridade entre A e a sequência mais distante C, tanto quanto a similaridade entre B e C.

14 Como inferir a ancestralidade comum, estrutura e função? B A C Somente A foi estudada Gene Pti1: Codifica uma serina/treonina kinase Praticamente idênticas Parecida (bastante próxima) De outra forma, quando fazemos a seguinte inferência: "as sequências proximamente relacionadas A e B são mais prováveis de apresentarem a mesma função, mas a sequência mais distante C pode apresentar uma função diferente" nós, na verdade, estamos usando a informação sobre os sítios conservados apenas entre A e B, mas não entre cada uma delas de C. Assim, as informações evolutivas, estruturais e funcionais estão entremeadas nas sequências de forma sutil.

15 Como inferir a ancestralidade comum, estrutura e função? Os biopolímeros contêm informação sobre sua evolução, estrutura e função; e esses três tipos de sinal podem interagir em diferentes formas, algumas vezes aumentando e outras vezes interferindo umas com as outras. LUCA Serina / treonina kinase

16 "Nothing in Biology Makes Sense Except in the Light of Evolution (1973)" Theodosius Dobzhansky ( ) " Quase nada no campo da biologia computacional (bioinformática) faz sentido, exceto à luz da comparação de sequencias biomoleculares "

17 Definição de Conceitos Homologia: Mesmo ancestral comum; Parálogos: Duplicação; Analogia: Mesma função origem diferente; Xenólogos: Transferência Lateral Ortologia: Especiação; Kristensen D M et al. Brief Bioinform 2011;12:

18 Introdução: A Semântica O Alfabeto Aminoácidos e nucleotídeos Nucleotídeos

19 Introdução: A Semântica O Alfabeto Aminoácidos

20 Introdução:A sintaxe: regras para a leitura da Inf. Biológica Código Genético

21 Introdução: A sintaxe, regras para a leitura da inf. Biológica Quadros de Leitura 5' ATGACCAATCAAATTACAATACCTAGTGGCCCCGACCTGATGATGCGTAA GACCAATCAAATTACAATACCTAGTGGCCCCGACCTGATGATGCGTAA TGACCAATCAAATTACAATACCTAGTGGCCCCGACCTGATGATGCGTAA ATGACCAATCAAATTACAATACCTAGTGGCCCCGACCTGATGATGCGTAA AATACCAATCAAATTACAATACCTAGTGGCCCCGACCTGATGATGCGGTA AATACCAATCAAATTACAATACCTAGTGGCCCCGACCTGATGATGCGGT AATACCAATCAAATTACAATACCTAGTGGCCCCGACCTGATGATGCGG 3'

22 Parte 2 Alinhamentos de Sequências

23 Análise Comparativa: Alinhamentos Objetivo Encontrar sinais biológicos a respeito da evolução, estrutura e função através do estudo da similaridade entre as sequências par ); (Ex. Alinhamento par-a- Estudo de similaridades (identificação de domínios) entre sequências que já sabemos que são relacionadas, e que conhecemos, pelo menos em parte, de seus sinais biológicos (Ex. Alinhamento Múltiplo ). Não é apenas a construção de um alinhamento...

24 Análise Comparativa: Alinhamentos Demanda Este é atualmente um dos problemas mais importante de toda a bioinformática (biologia computacional), dado o número e diversidade de seqüências existentes e dada a frequência com que ele precisa ser resolvido diariamente pelo mundo a fora.

25 Alinhamentos Análise por comparação entre sequências biomoleculares Uso de algoritmos que permitem comparar uma sequência objeto com um banco de dados de sequências biomoleculares; A comparação é feita alinhando-se a sequência objeto a sequências alvo de um banco de dados; A cada comparação é dado um valor, que é a medida de similaridade entre um par de sequências; A discriminação entre pares reais e artificiais é feita através de uma estimativa da probabilidade que o pareamento tenha ocorrido ao acaso. Algoritmos Conjunto finito de instruções, bem definidas e não ambíguas, sendo executadas em um período de tempo finito e com a quantidade de esforço finito.

26 Algoritmo : Princípio

27 Algoritmo : Princípio

28 Alinhamentos Análise por comparação entre sequências biomoleculares Em termos simples: Fazer um encaixe

29 Alinhamentos Conceito de escore (score ou pontuação) Forma de quantificar os alinhamentos; Caso Simples de Pontuação: +1 para quando ocorrer o pareamento entre polímeros idênticos, -1 quando não há pareamento, -2 para quando houver um gap (abertura de uma lacuna para favorecer o pareamento em outra região)

30 Alinhamentos Conceito de escore (score ou pontuação) Matriz bidimensional de substituição Logo voltamos a falar...

31 Alinhamentos Conceito de escore (score ou pontuação) Novo score

32 Alinhamentos: Conceitos e Desafios Alinhamento pode ser entre pares de sequências ou múltiplos ; Métodos de alinhamento de sequencias: GLOBAL ou LOCAL : Global Needleman-Wunsch 1970 Local Smith-Waterman 1981 Estatísticas para alinhamentos LOCAIS são bem definidas, enquanto para alinhamentos GLOBAIS ainda não são (Altschul, 2006); É importante definir se a similaridade é GLOBAL ou LOCAL.

33 Alinhamentos: Conceitos e Desafios Exemplos: global vs local

34 Alinhamentos: Conceitos e Desafios Alinhamento entre pares de sequências Programação Dinâmica Busca por soluções de problemas por meio de uma sequências de sub problemas semelhantes Menor número de operações para determinar a similaridade Este método resolve o problema de otimização do algoritmo, porém não resolve o X biológico da questão; Sensitividade tem que ser definida pela similaridade e distância entre as sequências que serão comparadas. <<Matriz de Pontuação>>

35 Alinhamentos: Conceitos e Desafios Programação Dinâmica (PD) A abordagem convencional testa todos os possíveis alinhamentos e é n exponencial ao tamanho da sequências ( n ); Se duas sequências a serem comparadas que tem 100bp a comparação leva 1 segundo, duas sequências de 1.000bp levariam =? PD procura por todas as soluções possíveis e encontra a solução ótima, e o tempo 2 de processamento fica quadrático ( n ); Também pode ser muito lento e custoso em termos computacionais, dependendo do tamanho das sequências: Se duas sequências de 100bp levam 1 segundo, duas de 1.000bp levaria 100 segundos, porém: Por exemplo, a comparação entre o genoma de dois fungo com 20 Mb, levaria aproximadamente 750 anos.

36 Alinhamentos: Conceitos e Desafios Problema do Caixeiro-Viajante NP-Completo: Complexidade Exponencial

37 Alinhamentos: Conceitos e Desafios Exemplo 1 - GLOBAL Alinhando as palavras "PELICAN" and "COELACANTH." Iniciando a matriz de alinhamento!

38 Alinhamentos: Conceitos e Desafios Exemplo 1 - GLOBAL Iniciando o alinhamento: Direção -> Flanco superior esquerdo ao flanco inferior direito Movimentos na vertical ou horizontal indicaram lacunas (gaps) As setas indicam a origem/direção do alinhamento.

39 Alinhamentos: Conceitos e Desafios Exemplo 1 - GLOBAL Alinhando P com C e calculando o score +1 para semelhanças / -1 para diferenças Cálculo do score: -1 Maior valor Indica para onde a seta vai apontar +1 Match -1 Mismatch Ordem: Azul escuro, verde vermelho

40 Alinhamentos: Conceitos e Desafios Exemplo 1 - GLOBAL Continuando o processo Score = -2 (Verde + Azul Escuro) + o valor anterior

41 Alinhamentos: Conceitos e Desafios Exemplo 1 - GLOBAL Seguindo o mesmo método completa-se a matriz

42 Alinhamentos: Conceitos e Desafios Exemplo 1 - GLOBAL O melhor alinhamento é escolhido através do método de rastreamento COELACANTH -PELICAN-Começa aqui

43 Alinhamentos: Conceitos e Desafios No alinhamento GLOBAL o alinhamento é construído a partir do extremo da matriz, enquanto no alinhamento LOCAL a primeira linha e coluna são inicializadas com zero e o alinhamento é construído a partir do maior score da matriz e para quando encontra zero. Também há uma terceira modalidade de alinhamento chamada de Alinhamento Semi-Global, cujo princípio não penaliza as extremidades do alinhamento. (Ex. Montagem de Genomas, em programas como por exemplo phrap e CAP3) CAGCA CTTGGATTCTCGC CAGCA CTTGGATTCTCGC CAGCGTGG CAGC G- T Semi-global Global

44 Alinhamentos: Conceitos e Desafios Mesmo utilizando-se boas metodologias de pontuação, o algoritmo de alinhamento irá alinhar qualquer coisas, contendo ou não um sinal biológico. O algoritmo nunca irá dizer se a melhor pontuação é boa o suficiente para indicar o sinal biológico que está sendo procurado; Para escolher sinais biologicamente importantes é necessário uma abordagem estatística para avaliar os alinhamentos e compará-los com um padrão (O programa BLAST por exemplo); Porém mesmo assim, muitos resultados de alinhamentos permanecem em uma região chamada de twilight zone ou na bordas da significância estatística. (ou seja, a homologia não é garantida!) exemplos mais pra frente!

45 Alinhamentos: Conceitos e Desafios Desafio A B C S -> e o alinhamento entre A e B apresenta uma pontuação alta e se o alinhamento entre B e C também apresentar uma pontuação boa, isso não informará absolutamente nada a respeito da pontuação entre A e C. P -> orém em muitas buscas por comparação em banco de dados, muitos resultados indistinguíveis (twilight zone) não são mostrados ( A e C ) a menos que o investigador já conheça a respeito da similaridade entre A e B.

46 Alinhamentos: Conceitos e Desafios A questão da introdução de gaps (lacunas) -> Durante o alinhamento, gaps são introduzidos deliberadamente de acordo com a regras de pontuação; -> Processos biológicos de replicação, recombinação, e reparo, podem ocasionalmente levar a inserção ou deleção de nucleotídeos; -> OK! Justificamos a função de introdução de gaps nos alinhamentos; -> Porém quando introduzidos no alinhamento indicam sinais biológicos; -> As garantias da qualidade da introdução de gaps depende também dos métodos de pontuação do alinhamento. PAWHEAE HEAGAWGHEE ---PAW-HEAE HEAGAWGHEE-

47 Alinhamentos: Conceitos e Desafios A questão da introdução de gaps (lacunas) Métodos de pontuação de gaps foram selecionados por tentativa e erro nos últimos anos... e a maioria dos programas de alinhamento possuem um mesmo valor padrão de pontuação. Se os usuários precisarem utilizar pontuações diferentes, não haverá garantias que os resultados serão apropriados... Uma pontuação alta para abertura de um gap e uma pontuação menor para extensão de um gap tem provado ser a melhor escolha... (Altschul, 2006) Tutorial on-line do BLAST PAWHEAE HEAGAWGHEE ---PAW-HEAE HEAGAWGHEE-

48 Alinhamentos: Conceitos e Desafios Matrizes de pontuação A -> ssociar a informação que temos a respeito da similaridade e distância dos sinais biológicos dos biopolímeros que estão sendo comparados para ser utilizado como forma de pontuar o alinhamento; C -> ontém valores proporcionais a probabilidade de um aminoácido x ser substituído por um aminoácido y ; -> 4x4 = 16 combinações possíveis para nucleotídeos -> 20x20 = 400 Combinações possíveis para aminoácidos

49 Alinhamentos: Conceitos e Desafios Matrizes de pontuação Inicialmente discutido no trabalho seminal de Zuckerkandl e Pauling em 1965 Molecules as Documents of Evolutionary History ; -> Problema: Precisam ser valores numéricos, porém como quantificar? Ácido Aspártico e Glutâmico (D e E) apresentam grupos carboxila na cadeia lateral e são facilmente permutáveis Lisina e Arginina (K e R) apresentam um grupo amino na cadeia lateral e podem ser permutáveis

50 Alinhamentos: Conceitos e Desafios Matrizes de pontuação Ácido Aspártico D Ácido Glutâmico E Uma mudança entre D para K altera a polaridade e tamanho da cadeia lateral deve receber uma pontuação bem diferente do que em relação uma alteração entre D para E. Mas a pontuação deve ser MUITO ou POUCA diferente, como quantificar? Deve ser negativa? E a pontuação entre as trocas entre D->E e K->R? Lisina K Arginina R Como comparar D->K e E->R? A pontuação deve ser simétrica???

51 Alinhamentos: Matrizes de pontuação

52 Alinhamentos: Matrizes de pontuação -> A solução surgiu a partir da era de sequenciamento de DNA e proteínas, entre 1960 e 1970 Dayhoff e colaboradors redefiniram o problema em busca da melhor pontuação: -> Ao invés de se perguntarem sobre o custo de cada tipo de substituição, eles se perguntaram sobre qual a frequência que cada par de aminoácido é alinhado em famílias de proteinas relacionadas. Margaret Oakley Dayhoff Foi a primeira a introduzir o termo Score de Alinhamento"

53 Alinhamentos: Matrizes de pontuação A questão: Como inventar uma matriz de pontuação boa o suficiente? É aqui que entra em cena as matrizes BLOSUM e PAM PAM -> Point Accepted Mutation, ou Percentage Accepted Mutation PAM 250 (Dayhoff et al., 1965; Dayhoff e Eck, 1968)

54 Alinhamentos: Matrizes de pontuação PAM -> São baseadas em alinhamentos globais de proteínas com parentesco próximo; -> PAM 1 é a matriz calculada a partir da comparação entre sequências com menos de 1% de divergência (probabilidade de 1 aminoácido ser substituído a cada 100 aminoácidos) ; -> Outras matrizes PAM são extrapoladas a partir da matriz PAM1 -> Como pode ter 250% (PAM250) de mudanças? -> Saturação

55 Alinhamentos: Matrizes de pontuação BLOSUM -> Desenvolvida por Stephen e Jorja Henikoff de Centro de Pesquisa para o Câncer em Seattle e Howard Hughes Medical Institute a partir de um estudo de alinhamento de proteínas relacionadas (1992 e 1993); -> Desenvolvida mais de 20 anos depois da matriz PAM (muito mais famílias proteicas estavam disponíveis); -> BLOSUM = BLOCK SUBSTITUTION MATRIX -> Os valores são baseados nas observações das frequências de substituição, em bloco de alinhamentos locais de proteínas relacionadas (Focado em fragmentos BLOCOS do alinhamento escolhidos a dedo ).

56 Alinhamentos: Matrizes de pontuação BLOSUM -BLOSUM62 = Calculada a partir de comparações entre sequências, com divergência mínima de 62%

57 Alinhamentos: Matrizes de pontuação BLOSUM -> Inicialmente cada BLOCO foi gerado a partir do banco de dados BLOCKS que foi baseado em padrões do PROSITE (Bairoch, 1992); -> A principal razão do PROSITE ser utilizado na construção dos BLOCOS estava relacionada ao fato que cada padrão do PROSITE foi manualmente curado e verificado e usualmente apresentavam uma função molecular conhecida.

58 Alinhamentos: Matrizes de pontuação Vantagens e desvatagens BLOSUM -> São baseadas em observações reais; -> Detectam melhor sequências com relações biológicas (detectam melhor domínios conservados entre proteínas); -> Não é possível gerar um modelo evolutivo.

59 Alinhamentos: Matrizes de pontuação Vantagens e desvatagens PAM -> É possível montar um modelo evolutivo e assim gerar novas matrizes a partir da primeira; -> Preferencialmente usadas para determinar questões evolutivas (Rastrear proteínas ancestrais) ; -> São baseadas na frequência de substituição encontrada em proteínas de parentesco muito próximo. Portanto são melhores para detectar relações próximas entre proteínas.

60 Alinhamentos: Matrizes de pontuação Vantagens e desvantagens Para comparar seqs mais parecidas (8090% similar) Para comparar seqs mais divergentes (30-40% similar) Sensitividade tem que ser definida pela similaridade e distância entre as sequências que serão comparadas. <<Matriz de Pontuação>> No dia-a-dia a matriz BLOSUM62 tem demonstrado ótimos resultados É a matriz padrão para o programa BLAST

61 Alinhamentos: Conceitos e Desafios Similaridade ou Homologia? O -> grau de similaridade pode ser estimado, por exemplo duas proteína podem ser 75% idênticas; -> Homologia é uma afirmação sobre a história evolucionária de um caractere; Duas sequências são 75% homólogas mais homólogo Duas sequências são 75% idênticas ou similares

62 Alinhamentos Alinhamento Múltiplos -> Processo utilizado para a elucidação de temas biologicamente significantes (estudo de domínios e motivos protéicos por exemplo). -> O alinhamento múltiplo é uma generalização natural do caso de par de sequências. O objetivo é transformar, por meio de gaps, todas as sequências em outras de mesmo comprimento.

63 Alinhamentos Alinhamento Múltiplos -> O alinhamento pode ser visto na forma de uma tabela onde cada linha está associada a uma sequência. -> É uma técnica utilizada em sequências de proteínas.

64 Alinhamentos Alinhamento Múltiplos Motivações: -> Detecção de regiões conservadas em grande número de sequências; -> -> Definição de famílias protéicas; Detecção de resíduos conservados (sítios de fosforilação, glicosilação, ligação com metal, com substrato, com íon, localização celular); -> -> Predição estrutural; Passo para reconstrução filogenética;

65 Alinhamentos Alinhamento Múltiplos: Conceitos -> Motivo: sítios catalíticos, resíduos estruturais importantes; -> Domínio: relacionados a uma função da proteína, pressupõem homologia; -> Família: grupo de proteínas relacionadas evolutivamente; -> Padrão: sintaxe (expressão regular) descrevendo combinações possíveis de resíduos; -> Profile: descreve variabilidade dentro de uma família protéica;

66 Alinhamentos Múltiplos Como são construídos os alinhamentos múltiplos? PD: analisa todos alinhamentos possíveis (100n segundos para n seqüências); Progressive pairwise alignment: analisa todos pares de sequências, constrói uma matriz e uma árvore NJ, seleciona um par inicial e vai adicionando as outras seqs (segundo a árvore). Ex: Clustal, T-Coffee Iterative alignment: começa com um alinhamento feito, e passos consecutivos de iterações são feitos até que o alinhamento não possa mais ser melhorado. Ex: Muscle Anchor-based: partem de subseqüências comuns, e regiões não alinhadas são tratadas posteriormente. Ex: MAFFT Probabilistic methods: pré-computam probabilidades de substituição baseando-se em alinhamentos conhecidos, e procuram aquele com o maior número esperado de predições corretas. Ex: ProbCons

67 Alinhamento Múltiplos Visualização pode parecer fácil

68 Alinhamento Múltiplos Ou um pouco mais complicado...

69 Alinhamento Múltiplos Problemas... Proteínas com muitos domínios, e com rearranjos, não são possíveis de alinhar. Difícil alinhar as proteínas em toda sua extensão. Não funciona abaixo de ~30% de similaridade (twilight zone): isso pode ser corrigido se houver informação de estrutura Como fazer um bom alinhamento? Seleção correta de sequências (>30% similaridade) >80 sítios Identificação de resíduos importantes (por mutantes ou estrutura 3D) Baseado em estrutura secundária

70 Alinhamentos: Para terminar... -> Alinhamento GLOBAL e LOCAL exemplos práticos de uso: -> LOCAL: WATER, MATCHER, LALIGN -> GLOBAL: NEEDLE, STRETCHER Ambos utilizam Programação Dinâmica, para garantir o melhor resultado Porém o custo computacional é alto, e devido a necessidade atual (NGS) e das últimas décadas, de se realizar comparações, essa abordagem se torna inviável. Desta forma foi criada uma abordagem alternativa para comparação de sequências (alinhamento) -> Nesta abordagem alternativa não é garantido encontrar o melhor alinhamento, porém é significativamente mais rápida em termos computacionais, e em termos práticos também é muito eficiente. HEURÍSTICA

71 Parte 3 BLAST

72 BLAST Basic Local Alignment Search Tool Segundo o Google Acadêmico Artigo de > citações Artigo de > citações

73 BLAST -> É um conjunto de algoritmos que busca um alinhamento local ótimo da seqüência objeto com seqüência alvo de um banco de dados; ->O algoritmo BLAST é extremamente simples e se baseia no conceito de par de segmentos ; -> Dada duas seqüêcias, um par de segmentos é definido como um par de sub sequêcias de mesmo comprimento que forma um alinhamento sem gap; -> Este algoritmo determina todos os pares de segmentos entre as sequêcias do banco de dados e a sequência em exame que apresentam um score acima de um valor limiar préfixado pelo usuário; -> Os pares de segmentos (do inglês HSP, High Scoring Pairs) são apresentados como resultado do programa, assim como os valores estatísticos associados; -> A grande inovação do BLAST foi relacionada a capacidade de calcular uma significância estatística para cada resultado de alinhamento;

74 BLAST High Scoring Pairs Summary Geralmente apresentado no final da visualização da busca Number of Hits to DB: 3816 Number of Sequences: 63 Number of extensions: 123 Number of successful extensions: 1 Number of sequences better than 1.0e-01: 0 Number of HSP's better than 0.1 without gapping: 0 Number of HSP's successfully gapped in prelim test: 0 Number of HSP's that attempted gapping in prelim test: 1 Number of HSP's gapped (non-prelim): 0 length of query: 152 length of database: 12,629 effective HSP length: 45

75 BLAST Método -> Utiliza um subconjunto de sequencias, da sequencia objeto, denominadas palavras ou W (word), para criar as sementes do alinhamento; -> Busca fragmentos indênticos a W, com um valor mínimo de T (threshold), utlizando a matriz de substituição; -> Se T é alcançado, W é extendido em ambas as direções, tentando gerar um alinhamento com um valor S (score) inicial.

76 BLAST Método -> Quando maior o valor para W haverá menores possibilidades para matches ; -> Uma vez alinhada a semente, o programa extende o alinhamento em ambas as direções e este é o processo que mais consome tempo; -> Estas variáveis podem ser administradas pelo usário.

77 BLAST Método: Exemplo

78 BLAST

79 BLAST

80 BLAST Significância estatística E-Value (expect value) : Calculado para cada alinhamento, proporciona uma estimativa do número de falsos positivos esperados em uma busca -> Altos valores de E sugerem grande chance do alinhamento ocorrer de forma randômica De uma maneira geral, quando mais próximo a 0 melhor. E< > Provavelmente homólogos ou identicos E<10-3 -> Podem ser relacionados E>1 Provavelmente não há relação 0,5 < E < 1 -> Twilight Zone

81 BLAST Analisando os Resultados

82 BLAST Analisando os Resultados

83 BLAST Analisando os Resultados

84 BLAST Analisando os Resultados

85 BLAST Tipos de comparações Query BD Compara Programa nt nt nt blastn nt (trad) aa aa blastx aa aa aa blastp aa nt (trad) aa tblastn nt (trad) nt (trad) aa tblastx

86 BLAST PHI-BLAST e PSI-BLAST -> PHI-BLAST : É um BLASTP refinado: Opção de indicar uma sequencia curta ou padrão para ser utilizado como referência para a construção do alinhamento -> PSI-BLAST: É também um BLASTP refinado, só que aqui o blastp é interativo. É reconstruída uma matriz com base nos alinhamentos resultantes da primeira consulta. É útil para encontrar membros distantes de famílias protéicas. -> Blast2Seq: Compara duas sequencias <<alinhamento par-a-par>>

87 Epílogo: Busca em banco de dados e alinhamentos Informações evolutivas, estruturais e funcionais

88 Dúvidas, perguntas?

Métodos de alinhamento de sequências biológicas. Marcelo Falsarella Carazzolle

Métodos de alinhamento de sequências biológicas. Marcelo Falsarella Carazzolle Métodos de alinhamento de sequências biológicas Marcelo Falsarella Carazzolle Resumo - Introdução - Alinhamentos ótimos - Global - Local (Smith-Waterman) - Semi global - Matrizes de alinhamento (BLOSUM)

Leia mais

Alinhamentos de sequências e Busca de Similaridade

Alinhamentos de sequências e Busca de Similaridade Alinhamentos de sequências e Busca de Similaridade Ariane Machado Lima ariane.machado@usp.br Escola de Artes, Ciências e Humanidades - USP Contexto http://www.ekac.org/gene.html http://www.fuzzco.com/news/wp-content/uploads/27//genome.jpg

Leia mais

Alinhamentos e Busca de Similaridade. Ariane Machado Lima

Alinhamentos e Busca de Similaridade. Ariane Machado Lima Alinhamentos e Busca de Similaridade Ariane Machado Lima Busca de identidade Identificar o que é determinada seqüência Ex.acabou de seqüenciar, seria contaminante? Outras fases de um projeto de seqüenciamento

Leia mais

Alinhamento de seqüências

Alinhamento de seqüências Alinhamento de seqüências Qual a importância do alinhamento de seqüências Permite estabelecer identidades entre sequências Permite a dedução de função de proteínas baseado em similaridade Permite a definição

Leia mais

Alinhamento de sequências

Alinhamento de sequências Pontifícia Universidade Católica de Goiás Departamento de Biologia Alinhamento de sequências Prof. Macks Wendhell Gonçalves, Msc mackswendhell@gmail.com Definição O alinhamento de sequências consiste no

Leia mais

Alinhamento local- Utilização do BLAST

Alinhamento local- Utilização do BLAST Alinhamento local- Utilização do BLAST BLAST Tipos de BLAST (blastn) Compara nucleotídeos (blastp) Compara proteínas Utiliza nucleotídeo como query, este é traduzido nos seus 6 quadros de leitura e é comparado

Leia mais

Principais algoritmos de alinhamento de sequências genéticas. Alexandre dos Santos Cristino

Principais algoritmos de alinhamento de sequências genéticas. Alexandre dos Santos Cristino Principais algoritmos de alinhamento de sequências genéticas Alexandre dos Santos Cristino http://www.ime.usp.br/~alexsc e-mail: alexsc@ime.usp.br Definição de alinhamento de sequências Comparação de duas

Leia mais

Alinhamento de Sequências e Genômica Comparativa

Alinhamento de Sequências e Genômica Comparativa Encontro França-Brasil de Bioinformática Universidade Estadual de Santa Cruz (UESC) Ilhéus-BA - Brasil Alinhamento de Sequências e Genômica Comparativa Maria Emília M. T. Walter Departamento de Ciência

Leia mais

Nada em Biologia faz sentido senão à luz da evolução.

Nada em Biologia faz sentido senão à luz da evolução. Marcos T. Geraldo ADAPTABILIDADE Nada em Biologia faz sentido senão à luz da evolução. Theodosius Dobzhansky (1973) 1 Processo de evolução em moléculas de DNA, RNA e proteínas Reconstrução das relações

Leia mais

alinhamento global-alinhamento múltiplo de seqüências

alinhamento global-alinhamento múltiplo de seqüências alinhamento global-alinhamento múltiplo de seqüências Alinhamento múltiplos de seqüências Qual a importância de se realizar alinhamentos múltiplos em oposição a alinhamentos em pares? Alinhamento múltiplos

Leia mais

Análise de significância de. alinhamentos

Análise de significância de. alinhamentos Análise de significância de alinhamentos Análise de significância de um alinhamento Tão importante como escolher o método de scoring ou encontrar o alinhamento que maximiza o score é saber avaliar a significância

Leia mais

PAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE

PAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE CONCEITOS EM EPIDEMIOLOGIA E FILOGENIA MOLECULARES PAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE DE

Leia mais

Biologia Molecular Computacional Homologia

Biologia Molecular Computacional Homologia Biologia Molecular Computacional Homologia Luiz Thibério Rangel O que é homologia? Conceito básico para estudos de genômica comparativa; Passo inicial para estudos de filogenia(omica); Importante para

Leia mais

Alinhamento de Seqüências

Alinhamento de Seqüências 18 CAPÍTULO 3 Alinhamento de Seqüências 3.1. Introdução O alinhamento de seqüências consiste no processo de comparar duas seqüências (de nucleotídeos ou proteínas) de forma a se observar seu nível de identidade.

Leia mais

Protein Homology detection by HMM-comparation.

Protein Homology detection by HMM-comparation. UNIVERSIDADE FEDERAL DE PERNAMBUCO Cin Centro de Informática Pós-Graduação em Ciência da Computação Protein Homology detection by HMM-comparation. Johannes Soding Vol. 21 no. 7 2005, BIOINFORMATICS Recife,

Leia mais

Identificação de genes por similaridade de seqüência

Identificação de genes por similaridade de seqüência Identificação de genes por similaridade de seqüência Evolução do genoma Os genes evoluem a partir de genes ancestrais comuns acumulando mutações Homologia Genes ancestrais estão presentes nas espécies

Leia mais

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven para BMI/CS 576, UW-Madison

Leia mais

Programas de Alinhamento. Sumário

Programas de Alinhamento. Sumário Programas de Alinhamento Departamento de Genética FMRP- USP Alynne Oya Chiromatzo alynne@lgmb.fmrp.usp.br Sumário Introdução para buscas em base de dados Fasta Blast Programa para alinhamento Clustal 1

Leia mais

TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO DE GRADUAÇÃO

TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO DE GRADUAÇÃO 1 U NIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2 0 1 6. 1 TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO

Leia mais

Alinhamentos de Múltiplas Seqüências. Rogério T. Brito Orientador: José A. R. Soares

Alinhamentos de Múltiplas Seqüências. Rogério T. Brito Orientador: José A. R. Soares 1 Alinhamentos de Múltiplas Seqüências Rogério T. Brito Orientador: José A. R. Soares 2 Motivação Problema em Biologia: saber qual é o grau de parentesco entre um conjunto de espécies (construção de árvores

Leia mais

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven/C. David Page para BMI/CS 576,

Leia mais

IBM1029 Introdução à Bioinformática. O Início da Bioinformática 27/03/2017. Aula 2. O Início. Bioionformática: definição

IBM1029 Introdução à Bioinformática. O Início da Bioinformática 27/03/2017. Aula 2. O Início. Bioionformática: definição IBM1029 Introdução à Bioinformática Profa Dra Silvana Giuliatti Departamento de Genética FMRP silvana@fmrp.usp.br O Início da Bioinformática Aula 2 O Início Trabalho de Margaret Dayhoff e colaboradores:

Leia mais

Evolução Molecular. "Nothing in Biology Makes Sense Except in the Light of Evolution. Theodosius Dobzhansky

Evolução Molecular. Nothing in Biology Makes Sense Except in the Light of Evolution. Theodosius Dobzhansky "Nothing in Biology Makes Sense Except in the Light of Evolution Theodosius Dobzhansky Evolução Evolução Evolução Genótipo + Ambiente = Fenótipo Parental F1 F2 Evolução Evolução = mudança (características

Leia mais

Elisa Boari de Lima Orientador: Thiago de Souza Rodrigues

Elisa Boari de Lima Orientador: Thiago de Souza Rodrigues Uma Metodologia para Identificação de Módulos Formadores de Sequências de Proteínas Mosaicas do Trypanosoma cruzi a partir do Transcriptoma do Parasito Utilizando a Ferramenta BLAST Elisa Boari de Lima

Leia mais

Inteligência Artificial. Algoritmos Genéticos. Aula I Introdução

Inteligência Artificial. Algoritmos Genéticos. Aula I Introdução Universidade Estadual do Oeste do Paraná Curso de Bacharelado em Ciência da Computação Inteligência Artificial Algoritmos Genéticos Aula I Introdução Roteiro Introdução Computação Evolutiva Algoritmos

Leia mais

Bioinformática. João Varela Aulas T7-T8 CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, E ENGENHARIA BIOLÓGICA

Bioinformática. João Varela Aulas T7-T8 CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, E ENGENHARIA BIOLÓGICA Bioinformática CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, E ENGENHARIA BIOLÓGICA João Varela jvarela@ualg.pt Aulas T7-T8 Esquema de anotação Annothaton 1. Determinar a localização das ORFs presentes

Leia mais

3 Algoritmos Genéticos

3 Algoritmos Genéticos Técnicas de Inteligência Computacional 33 3 Algoritmos Genéticos Este capítulo resume os principais conceitos sobre o algoritmo evolucionário empregado nesta dissertação. É apresentada uma breve explicação

Leia mais

Comparação e alinhamento de. sequências

Comparação e alinhamento de. sequências Comparação e alinhamento de sequências Comparar sequências A comparação de sequências de proteínas ou DNA/RNA é uma ferramenta essencial na procura da existência de relações de semelhança entre o todo

Leia mais

P E R N AMBUCO UMA FERRAMENTA WEB PARA INFERÊNCIA DE HAPLÓTIPOS PROPOSTA DE TRABALHO DE GRADUAÇÃO

P E R N AMBUCO UMA FERRAMENTA WEB PARA INFERÊNCIA DE HAPLÓTIPOS PROPOSTA DE TRABALHO DE GRADUAÇÃO U NIVERSIDADE FEDERAL DE P E R N AMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA UMA FERRAMENTA WEB PARA INFERÊNCIA DE HAPLÓTIPOS PROPOSTA DE TRABALHO DE GRADUAÇÃO Aluno Ranieri Valença

Leia mais

Estrutura covalente de proteínas estrutura tridimensional. Proteina: estrutura covalente com muitas restrições conformacionais

Estrutura covalente de proteínas estrutura tridimensional. Proteina: estrutura covalente com muitas restrições conformacionais Estrutura covalente de proteínas estrutura tridimensional Proteina: estrutura covalente com muitas restrições conformacionais M. Teresa Machini IQ/USP Análise de sequência de aminoácidos Conteúdo de aminoácidos

Leia mais

Comparação e alinhamento de sequências

Comparação e alinhamento de sequências Comparação e alinhamento de sequências Comparar sequências A comparação de sequências de proteínas ou DNA/RNA é uma ferramenta essencial na procura da existência de relações de semelhança entre o todo

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 06 Algoritmos Genéticos Edirlei Soares de Lima Algoritmos Genéticos Método de busca local. Boa abordagem para lidar com espaços de busca muito

Leia mais

A matemática e o genoma. Resumo

A matemática e o genoma. Resumo I Coloquio Regional da Região Centro-Oeste, 3 a 6 de novembro de 2009 Universidade Federal de Mato Grosso do Sul Mini-curso A matemática e o genoma Nalvo F. Almeida Jr. Resumo Os avanços da biotecnologia

Leia mais

IDENTIFICAÇÃO ESTRUTURAL EM REDES DE PROTEÍNAS

IDENTIFICAÇÃO ESTRUTURAL EM REDES DE PROTEÍNAS IDENTIFICAÇÃO ESTRUTURAL EM REDES DE PROTEÍNAS Tópicos Especiais em Redes Complexas II Professor: Daniel Ratton Figueiredo Aluno: Vitor Borges Coutinho da Silva Artigos Comparative Analysis of Protein

Leia mais

ALINHAMENTO DE SEQUÊNCIAS

ALINHAMENTO DE SEQUÊNCIAS Disciplina de BIOLOGIA COMPUTACIONAL Mestrado em ENGENHARIA BIOMÉDICA 4º Ano, 1º Semestre 2007/08 ALINHAMENTO DE SEQUÊNCIAS Relatório 2 Ana Calhau Ângela Pisco Nuno Santos 54605 55748 55746 Palavras-Chave:

Leia mais

Metahuerísticas: Algoritmos Genéticos. Sistemas de Informação/Ciências da Computação UNISUL Aran Bey Tcholakian Morales, Dr. Eng.

Metahuerísticas: Algoritmos Genéticos. Sistemas de Informação/Ciências da Computação UNISUL Aran Bey Tcholakian Morales, Dr. Eng. Metahuerísticas: Algoritmos Genéticos Sistemas de Informação/Ciências da Computação UNISUL Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 8) Meta-heurísticas Classificação de métodos heurísticos: os métodos

Leia mais

Resumo - capítulo 3 - Alinhamento de pares de sequências

Resumo - capítulo 3 - Alinhamento de pares de sequências Resumo - capítulo 3 - Alinhamento de pares de sequências Pedro Ivo Gomes de Faria Sumário 1 Introdução 3 1.1 Definição de alinhamento de sequências............. 3 1.1.1 Alinhamento global....................

Leia mais

Capítulo 8. Versão 0.4. Filogenômica

Capítulo 8. Versão 0.4. Filogenômica Capítulo 8 Versão 0.4 Filogenômica O termo "Filogenômica" é definido de várias maneiras, mas, em geral, a definição é relacionada com a intersecção dos campos da Genômica e da evolução biológica. Aqui,

Leia mais

DEFINIÇÕES EM EPIDEMIOLOGIA MOLECULAR E CONCEITOS BÁSICOS EM BIOLOGIA MOLECULAR

DEFINIÇÕES EM EPIDEMIOLOGIA MOLECULAR E CONCEITOS BÁSICOS EM BIOLOGIA MOLECULAR DEFINIÇÕES EM E DEFINIÇÕES EM E CONCEITOS BÁSICOS EM BIOLOGIA PARA QUE SERVE ESTA AULA 1. DEFINIÇÕES EM CONCEITUAÇÃO DE DIFERENCIAÇÃO ENTRE, TAXONOMIA E FILOGENIA 2. CONCEITOS EM BIOLOGIA APRESENTAR (REVER)

Leia mais

1164 BIOLOGIA ESTRUTURAL Aula 4 Prof. Dr. Valmir Fadel

1164 BIOLOGIA ESTRUTURAL Aula 4 Prof. Dr. Valmir Fadel Apesar da grande quantidade de seqüências determinadas (260.175 seqüências e 3.874.166 transcrições no UniProtKB/TrEMBL em 06/03/2007) a quantidade de estruturas tridimensionais determinadas é significativamente

Leia mais

Profa. Dra. Cecília Dias Flores

Profa. Dra. Cecília Dias Flores Profa. Dra. Cecília Dias Flores Regente pela Disciplina de Bioinformática - Curso de Biomedicina Depto. Ciências Exatas e Sociais Aplicadas Coordenadora do curso Informática Biomédica PPG em Ciências da

Leia mais

Análise de dados provenientes de técnicas moleculares

Análise de dados provenientes de técnicas moleculares CIIMAR Curso de formação Análise de dados provenientes de técnicas moleculares Formadores: Filipe Pereira e Filipe Lopes Manual do Curso 1 Índice Objetivo Geral do Curso... 3 Público-alvo... 3 Objetivos

Leia mais

Dados Moleculares x Morfológicos

Dados Moleculares x Morfológicos Evolução Molecular Dados Moleculares x Morfológicos Hereditários Descrição não ambígua Mais fácil estabelecer homologia Permite comparações de espécies distantes Abundantes Fatores ambientais Diferenças

Leia mais

Problemas de otimização

Problemas de otimização Problemas de otimização Problemas de decisão: Existe uma solução satisfazendo certa propriedade? Resultado: sim ou não Problemas de otimização: Entre todas as soluções satisfazendo determinada propriedade,

Leia mais

Transcritômica. João Carlos Setubal IQ/USP outubro de 2013

Transcritômica. João Carlos Setubal IQ/USP outubro de 2013 Transcritômica João Carlos Setubal IQ/USP outubro de 2013 Objetivo Obter, analisar, e interpretar dados de expressão gênica mrnas (que vão virar proteína) RNAs (que não vão virar proteína; ncrnas) O gene

Leia mais

Bioinformática. Alinhamento de Sequências. Prof. Msc. Rommel Ramos

Bioinformática. Alinhamento de Sequências. Prof. Msc. Rommel Ramos Bioinformática Alinhamento de Sequências Prof. Msc. Rommel Ramos 2013 Sumário 1. Comparação de Sequências 2. O que é alinhamento? 3. Tipos de Alinhamento 4. Algoritmos 5. Métodos de Alinhamento Comparação

Leia mais

Evolução e diversidade biológica

Evolução e diversidade biológica Evolução e diversidade biológica Charles Darwin (1809-1882) - Mecanismo da seleção natural - Mundo dinâmico - Separação: mundo físico e biológico - Adequação de representações gráficas para relações entre

Leia mais

Resumo - capítulo 5 - Predição da estrutura secundária do RNA

Resumo - capítulo 5 - Predição da estrutura secundária do RNA Resumo - capítulo 5 - Predição da estrutura secundária do RNA Pedro Ivo Gomes de Faria Sumário 1 Introdução 2 1.1 Fundamentos da predição da estrutura do RNA........ 2 1.2 Características da estrutura

Leia mais

ALGORITMOS AVANÇADOS UNIDADE I Análise de Algoritmo - Notação O. Luiz Leão

ALGORITMOS AVANÇADOS UNIDADE I Análise de Algoritmo - Notação O. Luiz Leão Luiz Leão luizleao@gmail.com http://www.luizleao.com Conteúdo Programático 1.1 - Algoritmo 1.2 - Estrutura de Dados 1.2.1 - Revisão de Programas em C++ envolvendo Vetores, Matrizes, Ponteiros, Registros

Leia mais

Identificação de fatores de transcrição a partir de dados de expressão.

Identificação de fatores de transcrição a partir de dados de expressão. Identificação de fatores de transcrição a partir de dados de expressão. Márcio Augusto Afonso de Almeida Laboratório de Genética e Cardiologia Molecular InCor. Introdução Técnicas de expressão global permitem

Leia mais

Predição de modificações em proteínas

Predição de modificações em proteínas Predição de modificações em proteínas Modificações de proteína Ao representarmos uma proteína como uma seqüência de caracteres representando os seus aminoácidos (estrutura primaria) estamos representando

Leia mais

Introdução à Bioquímica

Introdução à Bioquímica Introdução à Bioquímica Nucleotídeos e Ácidos Nucléicos Dra. Fernanda Canduri Laboratório de Sistemas BioMoleculares. Departamento de Física.. UNESP São José do Rio Preto - SP. Genoma! O genoma de um organismo

Leia mais

Algoritmos Genéticos. Princípio de Seleção Natural. Sub-áreas da Computação Evolutiva. Idéias básicas da CE. Computação Evolutiva

Algoritmos Genéticos. Princípio de Seleção Natural. Sub-áreas da Computação Evolutiva. Idéias básicas da CE. Computação Evolutiva Computação Evolutiva Algoritmos Genéticos A computação evolutiva (CE) é uma área da ciência da computação que abrange modelos computacionais inspirados na Teoria da Evolução das Espécies, essencialmente

Leia mais

Teoria dos Grafos Aula 17

Teoria dos Grafos Aula 17 Teoria dos Grafos Aula 17 Aula passada Problema da soma do subconjunto (subset sum) Programação dinâmica Problema da mochila Aula de hoje Alinhamento de sequências Programação dinâmica Caminho mais curto

Leia mais

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven/C. David Page para BMI/CS 576,

Leia mais

Aminoácidos e peptídeos. Prof.: Matheus de Souza Gomes Disciplina: Bioquímica I

Aminoácidos e peptídeos. Prof.: Matheus de Souza Gomes Disciplina: Bioquímica I Aminoácidos e peptídeos Prof.: Matheus de Souza Gomes Disciplina: Bioquímica I Patos de Minas 2017 Conteúdo Aminoácidos e peptídeos Constituição das proteínas Aminoácidos Estrutura Classificação Ácido

Leia mais

Alinhamento de Seqüências Biológicas

Alinhamento de Seqüências Biológicas O que se cmpara? Alinhament de Seqüências Bilógicas A cmparaçã de seqüências de DNA, RNA e prteínas é uma das bases da biinfrmática. Citsina Uracila Timina Prfª Drª Silvana Giuliatti Departament de Genética

Leia mais

Modelagem Comparativa de Proteínas

Modelagem Comparativa de Proteínas Modelagem Comparativa de Proteínas Bioinformática Estrutural Aula 3 3 de Junho de 2013 Paula Kuser Falcão Laboratório de Bioinformática Aplicada Embrapa Informática Agropecuária Por que predizer a estrutura?

Leia mais

étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UNIVERSIDADE DE JOÃO DEL-REI PRÓ-REITORIA DE PESQUISA CENTRO

Leia mais

ESCLEROSE LATERAL AMIOTRÓFICA ANÁLISES IN SILICO DAS MUTAÇÕES A4V E A4F DA PROTEÍNA SOD1

ESCLEROSE LATERAL AMIOTRÓFICA ANÁLISES IN SILICO DAS MUTAÇÕES A4V E A4F DA PROTEÍNA SOD1 ESCLEROSE LATERAL AMIOTRÓFICA ANÁLISES IN SILICO DAS MUTAÇÕES A4V E A4F DA PROTEÍNA SOD1 Aloma Nogueira Rebello da Silva Bióloga (UNIRIO) Programa de Pós-Graduação em Biologia Molecular e Celular aloma.nogueira@gmail.com

Leia mais

Dados Moleculares x Morfológicos

Dados Moleculares x Morfológicos Evolução Molecular Dados Moleculares x Morfológicos Hereditários Descrição não ambígua Mais fácil estabelecer homologia Permite comparações de espécies distantes Abundantes Fatores ambientais Diferenças

Leia mais

Correção Ortográfica. Processamento Estatístico da Linguagem Natural. Correção de Erros. Distância Mínima de Edição. Distância Mínima de Edição

Correção Ortográfica. Processamento Estatístico da Linguagem Natural. Correção de Erros. Distância Mínima de Edição. Distância Mínima de Edição Processamento Estatístico da Linguagem Natural Aula 6 Professora Bianca (Sala 302 Bloco E) bianca@ic.uff.br http://www.ic.uff.br/~bianca/peln/ Correção Ortográfica Três tipos de problemas: Detecção de

Leia mais

2 Contexto e Motivações

2 Contexto e Motivações 2 Contexto e Motivações Existem duas principais famílias de algoritmos que realizam comparações de biosseqüências, a FASTA (Pearson, 1991) e a BLAST (Altschul et al., 1990). Estas ferramentas realizam

Leia mais

Montagem de regiões gênicas

Montagem de regiões gênicas Montagem de regiões gênicas Pedro Ivo Gomes de Faria Departamento de Ciência da Computação Instituto de Matemática e Estatística Universidade de São Paulo Orientador: Prof. Dr. Alan Durham Pedro Ivo Gomes

Leia mais

Princípios de Sistemática Molecular

Princípios de Sistemática Molecular ! Ciências teóricas e sistemática biológica "! DNA, genes, código genético e mutação! Alinhamento de seqüências! Mudanças evolutivas em seqüências de nucleotídeos! Otimização em espaços contínuos e discretos!

Leia mais

Métodos de Busca. Inteligência Artificial. Algoritmos Genéticos. Algoritmos Evolucionários. Prof. Ms. Luiz Alberto Contato:

Métodos de Busca. Inteligência Artificial. Algoritmos Genéticos. Algoritmos Evolucionários. Prof. Ms. Luiz Alberto Contato: Inteligência Artificial Prof. Ms. Luiz Alberto Contato: lasf.bel@gmail.com Métodos de Busca Busca Cega ou Exaustiva: Não sabe qual o melhor nó da fronteira a ser expandido. Apenas distingue o estado objetivo

Leia mais

Algoritmos Genéticos. Pontos fracos dos métodos tradicionais. Características de alguns problemas. Tamanho do espaço de busca- Ex. caixeiro viajante:

Algoritmos Genéticos. Pontos fracos dos métodos tradicionais. Características de alguns problemas. Tamanho do espaço de busca- Ex. caixeiro viajante: Algoritmos Genéticos Prof. Luis Otavio Alvares INE/UFSC Características de alguns problemas Tamanho do espaço de busca- Ex. caixeiro viajante: 10 cidades: 181.000 soluções 20 cidades: 10.000.000.000.000

Leia mais

Teoria da Computação. Complexidade computacional classes de problemas

Teoria da Computação. Complexidade computacional classes de problemas Teoria da Computação Complexidade computacional classes de problemas 1 Universo de problemas Problemas indecidíveis ou não-computáveis Não admitem algoritmos Problemas intratáveis Não admitem algoritmos

Leia mais

Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica. João Varela

Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica. João Varela Bioinformática Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica João Varela jvarela@ualg.pt Docentes João Varela (bioinformática: conceitos, bases de dados, aplicações, pesquisa

Leia mais

3 Estimação e Compensação de movimento na codificação de vídeo

3 Estimação e Compensação de movimento na codificação de vídeo Estimação e Compensação de movimento na codificação de vídeo 36 3 Estimação e Compensação de movimento na codificação de vídeo O objetivo do modelo temporal (que engloba as fases de estimação e compensação

Leia mais

Busca de motivos em sequências. João Carlos Setubal IQ-USP 2014

Busca de motivos em sequências. João Carlos Setubal IQ-USP 2014 Busca de motivos em sequências João Carlos Setubal IQ-USP 2014 Motivos do tipo I AACT(G A)N 12 AGTT Q-[LIV]-H-H-[SA]-x(2)-D-G-[FY]-H Chloramphenicol acetyltransferase active site (do PROSITE) Posições

Leia mais

2 Contexto Biológico Genômica

2 Contexto Biológico Genômica 15 2 Contexto Biológico Neste capítulo abordaremos o contexto biológico para o entendimento deste trabalho. Serão abordados os aspectos gerais da genômica, expostos os processos do sequenciamento genético

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 04 Algoritmos Genéticos Introdução Algoritmos genéticos são bons para abordar espaços de buscas muito grandes e navegálos

Leia mais

Explorando genomas: predição de genes e elementos transponíveis Proporção de diferentes sequências no genoma

Explorando genomas: predição de genes e elementos transponíveis Proporção de diferentes sequências no genoma Explorando genomas: predição de genes e elementos transponíveis Proporção de diferentes sequências no genoma 1 Especies Genoma Genes 11 O número de genes varia entre as espécies 2 Anotação do Genoma 1

Leia mais

Introdução a Bioinformática

Introdução a Bioinformática Pontifícia Universidade Católica de Goiás Departamento de Biologia Disciplina: Bioinformática Bio1015 Introdução a Bioinformática Prof. Macks Wendhell Gonçalves, Msc mackswendhell@gmail.com EMENTA Introdução

Leia mais

Programa Analítico de Disciplina BQI460 Bioinformática

Programa Analítico de Disciplina BQI460 Bioinformática 0 Programa Analítico de Disciplina Departamento de Bioquímica e Biologia Molecular - Centro de Ciências Biológicas e da Saúde Número de créditos: Teóricas Práticas Total Duração em semanas: 15 Carga horária

Leia mais

Programa de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas. Seleção de Mestrado 2012-A

Programa de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas. Seleção de Mestrado 2012-A Programa de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas Seleção de Mestrado 2012-A INSTRUÇÕES (LEIA ATENTAMENTE ANTES DE PREENCHER A PROVA): a. Identifique sua prova unicamente com

Leia mais

Recursos Genéticos Vegetais

Recursos Genéticos Vegetais Recursos Genéticos Vegetais Caracterização x Avaliação Caracterização Alta herdabilidade Pouca influência ambiental Avaliação Baixa herdabilidade Muita influência ambiental Caracterização: Caracterização

Leia mais

Busca de motivos em sequências. João Carlos Setubal 2015

Busca de motivos em sequências. João Carlos Setubal 2015 Busca de motivos em sequências João Carlos Setubal 2015 Cadeias exatas Podem ser encontradas com o mecanismo de busca de qualquer editor de textos Que algoritmo é executado? O mais simples (e que é muito

Leia mais

Alinhamento de Sequências de Proteínas. Modelagem por homologia Estratégia/aplicação Etapas do processo Exemplo

Alinhamento de Sequências de Proteínas. Modelagem por homologia Estratégia/aplicação Etapas do processo Exemplo Objetivos FFI0776 Modelagem e Engenharia de Proteínas Prof. Rafael V. C. Guido rvcguido@ifsc.usp.br Aula 06 Alinhamento de Sequências de Proteínas Determinação da sequência de aa Características do alinhamento

Leia mais

IACB 1º Semestre de 2014/2015. Exercicios de Preparação para o Teste 1

IACB 1º Semestre de 2014/2015. Exercicios de Preparação para o Teste 1 IACB 1º Semestre de 2014/2015 Exercicios de Preparação para o Teste 1 Introdução (0 ou 1 questão no teste 1) 1. O que é a BioInformática? Resposta: Bioinformática é um campo interdisciplinar que aplica

Leia mais

Prof. João Carlos Setubal

Prof. João Carlos Setubal Prof. João Carlos Setubal QBQ 102 Aula 5 (biomol) Sequenciamento de DNA, genomas e bioinformática Replicação de DNA 5ʹ 3ʹ A replicação pára Reação da DNA Polimerase com dntps síntese de DNA Purina ou

Leia mais

Resumo - capítulo 4 - Alinhamento múltiplo de sequências

Resumo - capítulo 4 - Alinhamento múltiplo de sequências Resumo - capítulo 4 - Alinhamento múltiplo de sequências Pedro Ivo Gomes de Faria Sumário 1 Introdução 3 1.1 Sequenciamento de genomas................... 3 1.2 Usos de alinhamentos múltiplos de sequências.........

Leia mais

INSTITUTO DE PÓS GRADUAÇÃO ICPG GESTÃO DA TECNOLOGIA DA INFORMAÇÃO

INSTITUTO DE PÓS GRADUAÇÃO ICPG GESTÃO DA TECNOLOGIA DA INFORMAÇÃO INSTITUTO DE PÓS GRADUAÇÃO ICPG GESTÃO DA TECNOLOGIA DA INFORMAÇÃO Prof. Msc. Saulo Popov Zambiasi (saulopz@gmail.com) Informação - ICPG - Criciuma - SC 1 Características Gerais, operadores, algoritmo.

Leia mais

UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS BIOLÓGICAS E DA SAÚDE PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA E EVOLUÇÃO

UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS BIOLÓGICAS E DA SAÚDE PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA E EVOLUÇÃO UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS BIOLÓGICAS E DA SAÚDE PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA E EVOLUÇÃO ALINHAMENTO DE SEQÜÊNCIAS BIOLÓGICAS COM O USO DE ALGORITMOS GENÉTICOS Sabrina

Leia mais

Introdução à Bioquímica Celular

Introdução à Bioquímica Celular Pontifícia Universidade Católica de Goiás Departamento de Biologia Introdução à Bioquímica Celular Prof. Msc. Macks Wendhell Gonçalves mackswendhell@gmail.com O que é Biologia Celular? É o ramo da ciência

Leia mais

5 Resultados e Discussões

5 Resultados e Discussões 5 Resultados e Discussões Este capítulo apresenta os resultados obtidos no presente trabalho assim como sua discussão. São apresentados os resultados do registro realizado nas imagens capturadas empregando

Leia mais

Capítulo 4. Versão 0.7. Alinhamento entre duas sequências

Capítulo 4. Versão 0.7. Alinhamento entre duas sequências Capítulo 4 Versão 0.7 Alinhamento entre duas sequências Teoria Um dos procedimentos centrais da Bioinformática é o alinhamento entre os monômeros de duas sequências macromoleculares. Ao fazer esse alinhamento,

Leia mais

Bioinformática para o Citrus EST Project (CitEST)

Bioinformática para o Citrus EST Project (CitEST) Bioinformática para o Citrus EST Project (CitEST) Marcelo da Silva Reis 1 1 Instituto de Matemática e Estatística, Universidade de São Paulo 20 de maio de 2009 Organização da Apresentação Esta apresentação

Leia mais

introdução ao curso

introdução ao curso introdução ao curso http://www.ifsc.usp.br/~rdemarco/ffi0760/ffi0760.htm Cronograma aulas teóricas Aulas teóricas (Segundas-feiras - Sala 146) 30/07-introdução ao curso. 06/08-Busca em bancos de dados

Leia mais

Montagem de Genomas. Prof. Dr. Alessandro Varani UNESP - FCAV

Montagem de Genomas. Prof. Dr. Alessandro Varani UNESP - FCAV Montagem de Genomas Prof. Dr. Alessandro Varani UNESP - FCAV Conceitos da Genômica O que é um genoma? O conjunto de DNA que compõe um determinado (micro) organismo - Cromossomos; - Organelas: Mitocôndria

Leia mais

Número de genes versus número de proteínas em eucariotos

Número de genes versus número de proteínas em eucariotos Número de genes versus número de proteínas em eucariotos Bioquímica II SQM0416 Júlia Assirati Tomie Kuriyama Victória Montenegro de Campos Resumo Introdução Características do genoma humano Como foram

Leia mais

Bioinformática DCC/FCUP

Bioinformática DCC/FCUP Bioinformática DCC/FCUP 2012/2013 Pedro Ribeiro Unidade 3 Alinhamento de Sequências (baseado nos slides de Vítor Costa/DCC-FCUP e Sushmita Roy/UWisconsin) Objectivos desta unidade Homologia Alinhamento

Leia mais

ESTATÍSTICAS PARA INFERIR PADRÕES SELECÇÃO

ESTATÍSTICAS PARA INFERIR PADRÕES SELECÇÃO ESTATÍSTICAS PARA INFERIR PADRÕES DEMOGRÁFICOS E SELECÇÃO Inferências demográficas e selectivas Os fenómenos demográficos (expansão ou redução do efectivo populacional, subdivisão, migração) e selectivos

Leia mais

Sequenciamento de genoma e transcriptomas

Sequenciamento de genoma e transcriptomas Sequenciamento de genoma e transcriptomas Por que seqüenciar genomas? O seqüenciamento de genomas é o primeiro passo para obter uma descrição completa da composição molecular de cada organismo, pois todas

Leia mais

Anotação de genomas II

Anotação de genomas II Anotação de genomas II Anotação de genomas Uma vez descrito a seqüência do genoma de um organismo e realizada a anotação dos genes presentes obtemos uma extensa lista de potenciais transcritos. Como vimos

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais

Cap. 6: Métodos para alinhamento de múltiplas seqüências

Cap. 6: Métodos para alinhamento de múltiplas seqüências Cap. 6: Métodos para alinhamento de múltiplas seqüências Organização O que é um alinhamento múltiplo Escores para alinhamentos múltiplos Relação entre alinhamento múltiplo e análise filogenética Métodos

Leia mais