Comparação entre sequências biológicas
|
|
- Armando Carreiro da Cunha
- 6 Há anos
- Visualizações:
Transcrição
1 Comparação entre sequências biológicas Extraíndo e analisando os sinais contidos em biopolímeros ( Alinhamentos ) Prof. Dr. Alessandro Varani UNESP - FCAV
2 Objetivos Abordagens práticas para comparação de sequências; Como comparar? Inferências biológicas e evolutivas geradas a partir da comparação de sequências. Como analisar e interpretar os resultados?
3 Parte 1 Introdução e Conceitos
4 O primeiro fato na análise de sequências biológicas. Dan Gusfield (1997) "Em sequências biomoleculares, uma alta similaridade de sequência frequentemente implica em grande similaridade funcional e estrutural." "Em sequências biomoleculares, alta similaridade de sequência também implica, muito frequentemente, em relação evolutiva."
5 Prólogo (1): Conceitos Básicos Dilema da causalidade ovo ou a galinha? Estrutura de uma biomolécula Genômica estrutural Tábuas da Saúde (Tacuinum sanitatis) Pode ser fisicamente definida: (a) Amostra pura da proteína; (b) Um local apropriado para crescer os cristais; (c) Uma linha de luz sincroton. Sítio catalítico da transposase Bacteriófago Mu
6 Prólogo (2): Conceitos Básicos Função de uma biomolécula Genômica Funcional (Bioquímica) Não é somente uma característica física, mas a descrição de um determinado processo biológico; Só pode ser determinada dentro de um contexto biológico; A função também envolve interações com outras moléculas que também precisam ser identificadas e com função desvendada;
7 Prólogo (3): Conceitos Básicos Função de uma biomolécula Genômica Funcional (Bioquímica) Normalmente, para se definir a função biológica de uma biomolécula, é preciso verificar as interações de muitos componentes num extrato celular, na célula inteira, nos organismos vivos, ou dentro de um ecossistema no qual o organismo seja uma parte. Logo que a função de uma proteína é realizada, sua estrutura pode mudar. Protein Structural Change upon Ligand Binding Correlates with Enzymatic Reaction Mechanism Koike et al., 2008
8 Prólogo (4): Conceitos Básicos Estrutura e Função de uma Biomolécula Apesar de serem geralmente observáveis, não é uma correlação trivial a ser feita! Durante um projeto que envolva a análise e comparação de sequencias biomoleculares, levar em consideração todas as nuances possíveis entre a relação estrutura e função é de fundamental importância. Não basta apenas apelar para o resultado que o computador fornece.
9 Prólogo (5): Conceitos Básicos Com base na similaridade de sequencias: Similaridade de estrutura Similaridade de função Ancestralidade comum Hoffmann et al., PNAS (2010)
10 Prólogo (6): Conclusões A inferência de estrutura e função é inseparável da inferência evolutiva; Quando sequências provenientes de duas biomoléculas são comparadas, nosso caminho a partir da similaridade de sequência até chegar à conclusão sobre similaridade funcional e estrutural nunca é direta; Inversamente, sempre inferimos primeiramente a ancestralidade comum entre sequências e, só a partir daí é que se pode partir para a inferência de estrutura e função. Essa lógica não é óbvia quando a similaridade é muito alta, mas se duas sequências são mais distantemente e relacionadas uma à outra, essa cadeia de raciocínio precisa tornar-se explícita.
11 Prólogo (7): Conclusões Medimos a similaridade entre sequências e imediatamente usamos estatísticas para comparar a similaridade observada com o que seria esperado ao acaso; Se a similaridade é muito alta para ocorrer ao acaso, isso é frequentemente considerado suficiente para a realização de predições sobre a função protéica e estrutural. A única razão pela qual este raciocínio funciona é porque a única forma de uma similaridade de sequência não-aleatória ocorrer é através da descendência a partir de um ancestral comum das duas sequências. (O que é chamado de inferência por homologia) ; Portanto, a inferência das relações evolutivas, torna-se um pré-requisito para a proposição de outras relações, como a estrutura e a função.
12 Prólogo (8): Proteínas Em contrapartida com funções similares não precisam ter sequências similares, e proteínas com estruturas similares também podem apresentar sequências diferentes; Biomoléculas apresentando funções similares podem ter perdido a similaridade de sequência mas, de outra forma, elas podem não ter nunca compartilhado similaridades mas terem convergido para a mesma função a partir de sequências completamente divergentes evolutivamente. Este princípio se aplica a estruturas também: a similaridade de estruturas na ausência de similaridade de sequência pode representar tanto a extrema divergência de sequencias que foram inicialmente similares quanto a convergência de sequências que não eram similares inicialmente; A distinção entre divergência e convergência em nível molecular é um dos problemas mais importantes.
13 Como inferir a ancestralidade comum, estrutura e função? B A C Somente A foi estudada Gene Pti1: Codifica uma serina/treonina kinase Praticamente idênticas Parecida (bastante próxima) Nem todos os resíduos de aminoácidos precisam ser conservados entre A e B para determinar o ancestralidade comum. Por exemplo, podemos não considerar os sítios conservados exclusivamente entre A e B porque não precisamos destes resíduos para reconhecer a similaridade entre A e a sequência mais distante C, tanto quanto a similaridade entre B e C.
14 Como inferir a ancestralidade comum, estrutura e função? B A C Somente A foi estudada Gene Pti1: Codifica uma serina/treonina kinase Praticamente idênticas Parecida (bastante próxima) De outra forma, quando fazemos a seguinte inferência: "as sequências proximamente relacionadas A e B são mais prováveis de apresentarem a mesma função, mas a sequência mais distante C pode apresentar uma função diferente" nós, na verdade, estamos usando a informação sobre os sítios conservados apenas entre A e B, mas não entre cada uma delas de C. Assim, as informações evolutivas, estruturais e funcionais estão entremeadas nas sequências de forma sutil.
15 Como inferir a ancestralidade comum, estrutura e função? Os biopolímeros contêm informação sobre sua evolução, estrutura e função; e esses três tipos de sinal podem interagir em diferentes formas, algumas vezes aumentando e outras vezes interferindo umas com as outras. LUCA Serina / treonina kinase
16 "Nothing in Biology Makes Sense Except in the Light of Evolution (1973)" Theodosius Dobzhansky ( ) " Quase nada no campo da biologia computacional (bioinformática) faz sentido, exceto à luz da comparação de sequencias biomoleculares "
17 Definição de Conceitos Homologia: Mesmo ancestral comum; Parálogos: Duplicação; Analogia: Mesma função origem diferente; Xenólogos: Transferência Lateral Ortologia: Especiação; Kristensen D M et al. Brief Bioinform 2011;12:
18 Introdução: A Semântica O Alfabeto Aminoácidos e nucleotídeos Nucleotídeos
19 Introdução: A Semântica O Alfabeto Aminoácidos
20 Introdução:A sintaxe: regras para a leitura da Inf. Biológica Código Genético
21 Introdução: A sintaxe, regras para a leitura da inf. Biológica Quadros de Leitura 5' ATGACCAATCAAATTACAATACCTAGTGGCCCCGACCTGATGATGCGTAA GACCAATCAAATTACAATACCTAGTGGCCCCGACCTGATGATGCGTAA TGACCAATCAAATTACAATACCTAGTGGCCCCGACCTGATGATGCGTAA ATGACCAATCAAATTACAATACCTAGTGGCCCCGACCTGATGATGCGTAA AATACCAATCAAATTACAATACCTAGTGGCCCCGACCTGATGATGCGGTA AATACCAATCAAATTACAATACCTAGTGGCCCCGACCTGATGATGCGGT AATACCAATCAAATTACAATACCTAGTGGCCCCGACCTGATGATGCGG 3'
22 Parte 2 Alinhamentos de Sequências
23 Análise Comparativa: Alinhamentos Objetivo Encontrar sinais biológicos a respeito da evolução, estrutura e função através do estudo da similaridade entre as sequências par ); (Ex. Alinhamento par-a- Estudo de similaridades (identificação de domínios) entre sequências que já sabemos que são relacionadas, e que conhecemos, pelo menos em parte, de seus sinais biológicos (Ex. Alinhamento Múltiplo ). Não é apenas a construção de um alinhamento...
24 Análise Comparativa: Alinhamentos Demanda Este é atualmente um dos problemas mais importante de toda a bioinformática (biologia computacional), dado o número e diversidade de seqüências existentes e dada a frequência com que ele precisa ser resolvido diariamente pelo mundo a fora.
25 Alinhamentos Análise por comparação entre sequências biomoleculares Uso de algoritmos que permitem comparar uma sequência objeto com um banco de dados de sequências biomoleculares; A comparação é feita alinhando-se a sequência objeto a sequências alvo de um banco de dados; A cada comparação é dado um valor, que é a medida de similaridade entre um par de sequências; A discriminação entre pares reais e artificiais é feita através de uma estimativa da probabilidade que o pareamento tenha ocorrido ao acaso. Algoritmos Conjunto finito de instruções, bem definidas e não ambíguas, sendo executadas em um período de tempo finito e com a quantidade de esforço finito.
26 Algoritmo : Princípio
27 Algoritmo : Princípio
28 Alinhamentos Análise por comparação entre sequências biomoleculares Em termos simples: Fazer um encaixe
29 Alinhamentos Conceito de escore (score ou pontuação) Forma de quantificar os alinhamentos; Caso Simples de Pontuação: +1 para quando ocorrer o pareamento entre polímeros idênticos, -1 quando não há pareamento, -2 para quando houver um gap (abertura de uma lacuna para favorecer o pareamento em outra região)
30 Alinhamentos Conceito de escore (score ou pontuação) Matriz bidimensional de substituição Logo voltamos a falar...
31 Alinhamentos Conceito de escore (score ou pontuação) Novo score
32 Alinhamentos: Conceitos e Desafios Alinhamento pode ser entre pares de sequências ou múltiplos ; Métodos de alinhamento de sequencias: GLOBAL ou LOCAL : Global Needleman-Wunsch 1970 Local Smith-Waterman 1981 Estatísticas para alinhamentos LOCAIS são bem definidas, enquanto para alinhamentos GLOBAIS ainda não são (Altschul, 2006); É importante definir se a similaridade é GLOBAL ou LOCAL.
33 Alinhamentos: Conceitos e Desafios Exemplos: global vs local
34 Alinhamentos: Conceitos e Desafios Alinhamento entre pares de sequências Programação Dinâmica Busca por soluções de problemas por meio de uma sequências de sub problemas semelhantes Menor número de operações para determinar a similaridade Este método resolve o problema de otimização do algoritmo, porém não resolve o X biológico da questão; Sensitividade tem que ser definida pela similaridade e distância entre as sequências que serão comparadas. <<Matriz de Pontuação>>
35 Alinhamentos: Conceitos e Desafios Programação Dinâmica (PD) A abordagem convencional testa todos os possíveis alinhamentos e é n exponencial ao tamanho da sequências ( n ); Se duas sequências a serem comparadas que tem 100bp a comparação leva 1 segundo, duas sequências de 1.000bp levariam =? PD procura por todas as soluções possíveis e encontra a solução ótima, e o tempo 2 de processamento fica quadrático ( n ); Também pode ser muito lento e custoso em termos computacionais, dependendo do tamanho das sequências: Se duas sequências de 100bp levam 1 segundo, duas de 1.000bp levaria 100 segundos, porém: Por exemplo, a comparação entre o genoma de dois fungo com 20 Mb, levaria aproximadamente 750 anos.
36 Alinhamentos: Conceitos e Desafios Problema do Caixeiro-Viajante NP-Completo: Complexidade Exponencial
37 Alinhamentos: Conceitos e Desafios Exemplo 1 - GLOBAL Alinhando as palavras "PELICAN" and "COELACANTH." Iniciando a matriz de alinhamento!
38 Alinhamentos: Conceitos e Desafios Exemplo 1 - GLOBAL Iniciando o alinhamento: Direção -> Flanco superior esquerdo ao flanco inferior direito Movimentos na vertical ou horizontal indicaram lacunas (gaps) As setas indicam a origem/direção do alinhamento.
39 Alinhamentos: Conceitos e Desafios Exemplo 1 - GLOBAL Alinhando P com C e calculando o score +1 para semelhanças / -1 para diferenças Cálculo do score: -1 Maior valor Indica para onde a seta vai apontar +1 Match -1 Mismatch Ordem: Azul escuro, verde vermelho
40 Alinhamentos: Conceitos e Desafios Exemplo 1 - GLOBAL Continuando o processo Score = -2 (Verde + Azul Escuro) + o valor anterior
41 Alinhamentos: Conceitos e Desafios Exemplo 1 - GLOBAL Seguindo o mesmo método completa-se a matriz
42 Alinhamentos: Conceitos e Desafios Exemplo 1 - GLOBAL O melhor alinhamento é escolhido através do método de rastreamento COELACANTH -PELICAN-Começa aqui
43 Alinhamentos: Conceitos e Desafios No alinhamento GLOBAL o alinhamento é construído a partir do extremo da matriz, enquanto no alinhamento LOCAL a primeira linha e coluna são inicializadas com zero e o alinhamento é construído a partir do maior score da matriz e para quando encontra zero. Também há uma terceira modalidade de alinhamento chamada de Alinhamento Semi-Global, cujo princípio não penaliza as extremidades do alinhamento. (Ex. Montagem de Genomas, em programas como por exemplo phrap e CAP3) CAGCA CTTGGATTCTCGC CAGCA CTTGGATTCTCGC CAGCGTGG CAGC G- T Semi-global Global
44 Alinhamentos: Conceitos e Desafios Mesmo utilizando-se boas metodologias de pontuação, o algoritmo de alinhamento irá alinhar qualquer coisas, contendo ou não um sinal biológico. O algoritmo nunca irá dizer se a melhor pontuação é boa o suficiente para indicar o sinal biológico que está sendo procurado; Para escolher sinais biologicamente importantes é necessário uma abordagem estatística para avaliar os alinhamentos e compará-los com um padrão (O programa BLAST por exemplo); Porém mesmo assim, muitos resultados de alinhamentos permanecem em uma região chamada de twilight zone ou na bordas da significância estatística. (ou seja, a homologia não é garantida!) exemplos mais pra frente!
45 Alinhamentos: Conceitos e Desafios Desafio A B C S -> e o alinhamento entre A e B apresenta uma pontuação alta e se o alinhamento entre B e C também apresentar uma pontuação boa, isso não informará absolutamente nada a respeito da pontuação entre A e C. P -> orém em muitas buscas por comparação em banco de dados, muitos resultados indistinguíveis (twilight zone) não são mostrados ( A e C ) a menos que o investigador já conheça a respeito da similaridade entre A e B.
46 Alinhamentos: Conceitos e Desafios A questão da introdução de gaps (lacunas) -> Durante o alinhamento, gaps são introduzidos deliberadamente de acordo com a regras de pontuação; -> Processos biológicos de replicação, recombinação, e reparo, podem ocasionalmente levar a inserção ou deleção de nucleotídeos; -> OK! Justificamos a função de introdução de gaps nos alinhamentos; -> Porém quando introduzidos no alinhamento indicam sinais biológicos; -> As garantias da qualidade da introdução de gaps depende também dos métodos de pontuação do alinhamento. PAWHEAE HEAGAWGHEE ---PAW-HEAE HEAGAWGHEE-
47 Alinhamentos: Conceitos e Desafios A questão da introdução de gaps (lacunas) Métodos de pontuação de gaps foram selecionados por tentativa e erro nos últimos anos... e a maioria dos programas de alinhamento possuem um mesmo valor padrão de pontuação. Se os usuários precisarem utilizar pontuações diferentes, não haverá garantias que os resultados serão apropriados... Uma pontuação alta para abertura de um gap e uma pontuação menor para extensão de um gap tem provado ser a melhor escolha... (Altschul, 2006) Tutorial on-line do BLAST PAWHEAE HEAGAWGHEE ---PAW-HEAE HEAGAWGHEE-
48 Alinhamentos: Conceitos e Desafios Matrizes de pontuação A -> ssociar a informação que temos a respeito da similaridade e distância dos sinais biológicos dos biopolímeros que estão sendo comparados para ser utilizado como forma de pontuar o alinhamento; C -> ontém valores proporcionais a probabilidade de um aminoácido x ser substituído por um aminoácido y ; -> 4x4 = 16 combinações possíveis para nucleotídeos -> 20x20 = 400 Combinações possíveis para aminoácidos
49 Alinhamentos: Conceitos e Desafios Matrizes de pontuação Inicialmente discutido no trabalho seminal de Zuckerkandl e Pauling em 1965 Molecules as Documents of Evolutionary History ; -> Problema: Precisam ser valores numéricos, porém como quantificar? Ácido Aspártico e Glutâmico (D e E) apresentam grupos carboxila na cadeia lateral e são facilmente permutáveis Lisina e Arginina (K e R) apresentam um grupo amino na cadeia lateral e podem ser permutáveis
50 Alinhamentos: Conceitos e Desafios Matrizes de pontuação Ácido Aspártico D Ácido Glutâmico E Uma mudança entre D para K altera a polaridade e tamanho da cadeia lateral deve receber uma pontuação bem diferente do que em relação uma alteração entre D para E. Mas a pontuação deve ser MUITO ou POUCA diferente, como quantificar? Deve ser negativa? E a pontuação entre as trocas entre D->E e K->R? Lisina K Arginina R Como comparar D->K e E->R? A pontuação deve ser simétrica???
51 Alinhamentos: Matrizes de pontuação
52 Alinhamentos: Matrizes de pontuação -> A solução surgiu a partir da era de sequenciamento de DNA e proteínas, entre 1960 e 1970 Dayhoff e colaboradors redefiniram o problema em busca da melhor pontuação: -> Ao invés de se perguntarem sobre o custo de cada tipo de substituição, eles se perguntaram sobre qual a frequência que cada par de aminoácido é alinhado em famílias de proteinas relacionadas. Margaret Oakley Dayhoff Foi a primeira a introduzir o termo Score de Alinhamento"
53 Alinhamentos: Matrizes de pontuação A questão: Como inventar uma matriz de pontuação boa o suficiente? É aqui que entra em cena as matrizes BLOSUM e PAM PAM -> Point Accepted Mutation, ou Percentage Accepted Mutation PAM 250 (Dayhoff et al., 1965; Dayhoff e Eck, 1968)
54 Alinhamentos: Matrizes de pontuação PAM -> São baseadas em alinhamentos globais de proteínas com parentesco próximo; -> PAM 1 é a matriz calculada a partir da comparação entre sequências com menos de 1% de divergência (probabilidade de 1 aminoácido ser substituído a cada 100 aminoácidos) ; -> Outras matrizes PAM são extrapoladas a partir da matriz PAM1 -> Como pode ter 250% (PAM250) de mudanças? -> Saturação
55 Alinhamentos: Matrizes de pontuação BLOSUM -> Desenvolvida por Stephen e Jorja Henikoff de Centro de Pesquisa para o Câncer em Seattle e Howard Hughes Medical Institute a partir de um estudo de alinhamento de proteínas relacionadas (1992 e 1993); -> Desenvolvida mais de 20 anos depois da matriz PAM (muito mais famílias proteicas estavam disponíveis); -> BLOSUM = BLOCK SUBSTITUTION MATRIX -> Os valores são baseados nas observações das frequências de substituição, em bloco de alinhamentos locais de proteínas relacionadas (Focado em fragmentos BLOCOS do alinhamento escolhidos a dedo ).
56 Alinhamentos: Matrizes de pontuação BLOSUM -BLOSUM62 = Calculada a partir de comparações entre sequências, com divergência mínima de 62%
57 Alinhamentos: Matrizes de pontuação BLOSUM -> Inicialmente cada BLOCO foi gerado a partir do banco de dados BLOCKS que foi baseado em padrões do PROSITE (Bairoch, 1992); -> A principal razão do PROSITE ser utilizado na construção dos BLOCOS estava relacionada ao fato que cada padrão do PROSITE foi manualmente curado e verificado e usualmente apresentavam uma função molecular conhecida.
58 Alinhamentos: Matrizes de pontuação Vantagens e desvatagens BLOSUM -> São baseadas em observações reais; -> Detectam melhor sequências com relações biológicas (detectam melhor domínios conservados entre proteínas); -> Não é possível gerar um modelo evolutivo.
59 Alinhamentos: Matrizes de pontuação Vantagens e desvatagens PAM -> É possível montar um modelo evolutivo e assim gerar novas matrizes a partir da primeira; -> Preferencialmente usadas para determinar questões evolutivas (Rastrear proteínas ancestrais) ; -> São baseadas na frequência de substituição encontrada em proteínas de parentesco muito próximo. Portanto são melhores para detectar relações próximas entre proteínas.
60 Alinhamentos: Matrizes de pontuação Vantagens e desvantagens Para comparar seqs mais parecidas (8090% similar) Para comparar seqs mais divergentes (30-40% similar) Sensitividade tem que ser definida pela similaridade e distância entre as sequências que serão comparadas. <<Matriz de Pontuação>> No dia-a-dia a matriz BLOSUM62 tem demonstrado ótimos resultados É a matriz padrão para o programa BLAST
61 Alinhamentos: Conceitos e Desafios Similaridade ou Homologia? O -> grau de similaridade pode ser estimado, por exemplo duas proteína podem ser 75% idênticas; -> Homologia é uma afirmação sobre a história evolucionária de um caractere; Duas sequências são 75% homólogas mais homólogo Duas sequências são 75% idênticas ou similares
62 Alinhamentos Alinhamento Múltiplos -> Processo utilizado para a elucidação de temas biologicamente significantes (estudo de domínios e motivos protéicos por exemplo). -> O alinhamento múltiplo é uma generalização natural do caso de par de sequências. O objetivo é transformar, por meio de gaps, todas as sequências em outras de mesmo comprimento.
63 Alinhamentos Alinhamento Múltiplos -> O alinhamento pode ser visto na forma de uma tabela onde cada linha está associada a uma sequência. -> É uma técnica utilizada em sequências de proteínas.
64 Alinhamentos Alinhamento Múltiplos Motivações: -> Detecção de regiões conservadas em grande número de sequências; -> -> Definição de famílias protéicas; Detecção de resíduos conservados (sítios de fosforilação, glicosilação, ligação com metal, com substrato, com íon, localização celular); -> -> Predição estrutural; Passo para reconstrução filogenética;
65 Alinhamentos Alinhamento Múltiplos: Conceitos -> Motivo: sítios catalíticos, resíduos estruturais importantes; -> Domínio: relacionados a uma função da proteína, pressupõem homologia; -> Família: grupo de proteínas relacionadas evolutivamente; -> Padrão: sintaxe (expressão regular) descrevendo combinações possíveis de resíduos; -> Profile: descreve variabilidade dentro de uma família protéica;
66 Alinhamentos Múltiplos Como são construídos os alinhamentos múltiplos? PD: analisa todos alinhamentos possíveis (100n segundos para n seqüências); Progressive pairwise alignment: analisa todos pares de sequências, constrói uma matriz e uma árvore NJ, seleciona um par inicial e vai adicionando as outras seqs (segundo a árvore). Ex: Clustal, T-Coffee Iterative alignment: começa com um alinhamento feito, e passos consecutivos de iterações são feitos até que o alinhamento não possa mais ser melhorado. Ex: Muscle Anchor-based: partem de subseqüências comuns, e regiões não alinhadas são tratadas posteriormente. Ex: MAFFT Probabilistic methods: pré-computam probabilidades de substituição baseando-se em alinhamentos conhecidos, e procuram aquele com o maior número esperado de predições corretas. Ex: ProbCons
67 Alinhamento Múltiplos Visualização pode parecer fácil
68 Alinhamento Múltiplos Ou um pouco mais complicado...
69 Alinhamento Múltiplos Problemas... Proteínas com muitos domínios, e com rearranjos, não são possíveis de alinhar. Difícil alinhar as proteínas em toda sua extensão. Não funciona abaixo de ~30% de similaridade (twilight zone): isso pode ser corrigido se houver informação de estrutura Como fazer um bom alinhamento? Seleção correta de sequências (>30% similaridade) >80 sítios Identificação de resíduos importantes (por mutantes ou estrutura 3D) Baseado em estrutura secundária
70 Alinhamentos: Para terminar... -> Alinhamento GLOBAL e LOCAL exemplos práticos de uso: -> LOCAL: WATER, MATCHER, LALIGN -> GLOBAL: NEEDLE, STRETCHER Ambos utilizam Programação Dinâmica, para garantir o melhor resultado Porém o custo computacional é alto, e devido a necessidade atual (NGS) e das últimas décadas, de se realizar comparações, essa abordagem se torna inviável. Desta forma foi criada uma abordagem alternativa para comparação de sequências (alinhamento) -> Nesta abordagem alternativa não é garantido encontrar o melhor alinhamento, porém é significativamente mais rápida em termos computacionais, e em termos práticos também é muito eficiente. HEURÍSTICA
71 Parte 3 BLAST
72 BLAST Basic Local Alignment Search Tool Segundo o Google Acadêmico Artigo de > citações Artigo de > citações
73 BLAST -> É um conjunto de algoritmos que busca um alinhamento local ótimo da seqüência objeto com seqüência alvo de um banco de dados; ->O algoritmo BLAST é extremamente simples e se baseia no conceito de par de segmentos ; -> Dada duas seqüêcias, um par de segmentos é definido como um par de sub sequêcias de mesmo comprimento que forma um alinhamento sem gap; -> Este algoritmo determina todos os pares de segmentos entre as sequêcias do banco de dados e a sequência em exame que apresentam um score acima de um valor limiar préfixado pelo usuário; -> Os pares de segmentos (do inglês HSP, High Scoring Pairs) são apresentados como resultado do programa, assim como os valores estatísticos associados; -> A grande inovação do BLAST foi relacionada a capacidade de calcular uma significância estatística para cada resultado de alinhamento;
74 BLAST High Scoring Pairs Summary Geralmente apresentado no final da visualização da busca Number of Hits to DB: 3816 Number of Sequences: 63 Number of extensions: 123 Number of successful extensions: 1 Number of sequences better than 1.0e-01: 0 Number of HSP's better than 0.1 without gapping: 0 Number of HSP's successfully gapped in prelim test: 0 Number of HSP's that attempted gapping in prelim test: 1 Number of HSP's gapped (non-prelim): 0 length of query: 152 length of database: 12,629 effective HSP length: 45
75 BLAST Método -> Utiliza um subconjunto de sequencias, da sequencia objeto, denominadas palavras ou W (word), para criar as sementes do alinhamento; -> Busca fragmentos indênticos a W, com um valor mínimo de T (threshold), utlizando a matriz de substituição; -> Se T é alcançado, W é extendido em ambas as direções, tentando gerar um alinhamento com um valor S (score) inicial.
76 BLAST Método -> Quando maior o valor para W haverá menores possibilidades para matches ; -> Uma vez alinhada a semente, o programa extende o alinhamento em ambas as direções e este é o processo que mais consome tempo; -> Estas variáveis podem ser administradas pelo usário.
77 BLAST Método: Exemplo
78 BLAST
79 BLAST
80 BLAST Significância estatística E-Value (expect value) : Calculado para cada alinhamento, proporciona uma estimativa do número de falsos positivos esperados em uma busca -> Altos valores de E sugerem grande chance do alinhamento ocorrer de forma randômica De uma maneira geral, quando mais próximo a 0 melhor. E< > Provavelmente homólogos ou identicos E<10-3 -> Podem ser relacionados E>1 Provavelmente não há relação 0,5 < E < 1 -> Twilight Zone
81 BLAST Analisando os Resultados
82 BLAST Analisando os Resultados
83 BLAST Analisando os Resultados
84 BLAST Analisando os Resultados
85 BLAST Tipos de comparações Query BD Compara Programa nt nt nt blastn nt (trad) aa aa blastx aa aa aa blastp aa nt (trad) aa tblastn nt (trad) nt (trad) aa tblastx
86 BLAST PHI-BLAST e PSI-BLAST -> PHI-BLAST : É um BLASTP refinado: Opção de indicar uma sequencia curta ou padrão para ser utilizado como referência para a construção do alinhamento -> PSI-BLAST: É também um BLASTP refinado, só que aqui o blastp é interativo. É reconstruída uma matriz com base nos alinhamentos resultantes da primeira consulta. É útil para encontrar membros distantes de famílias protéicas. -> Blast2Seq: Compara duas sequencias <<alinhamento par-a-par>>
87 Epílogo: Busca em banco de dados e alinhamentos Informações evolutivas, estruturais e funcionais
88 Dúvidas, perguntas?
Métodos de alinhamento de sequências biológicas. Marcelo Falsarella Carazzolle
Métodos de alinhamento de sequências biológicas Marcelo Falsarella Carazzolle Resumo - Introdução - Alinhamentos ótimos - Global - Local (Smith-Waterman) - Semi global - Matrizes de alinhamento (BLOSUM)
Leia maisAlinhamentos de sequências e Busca de Similaridade
Alinhamentos de sequências e Busca de Similaridade Ariane Machado Lima ariane.machado@usp.br Escola de Artes, Ciências e Humanidades - USP Contexto http://www.ekac.org/gene.html http://www.fuzzco.com/news/wp-content/uploads/27//genome.jpg
Leia maisAlinhamentos e Busca de Similaridade. Ariane Machado Lima
Alinhamentos e Busca de Similaridade Ariane Machado Lima Busca de identidade Identificar o que é determinada seqüência Ex.acabou de seqüenciar, seria contaminante? Outras fases de um projeto de seqüenciamento
Leia maisAlinhamento de seqüências
Alinhamento de seqüências Qual a importância do alinhamento de seqüências Permite estabelecer identidades entre sequências Permite a dedução de função de proteínas baseado em similaridade Permite a definição
Leia maisAlinhamento de sequências
Pontifícia Universidade Católica de Goiás Departamento de Biologia Alinhamento de sequências Prof. Macks Wendhell Gonçalves, Msc mackswendhell@gmail.com Definição O alinhamento de sequências consiste no
Leia maisAlinhamento local- Utilização do BLAST
Alinhamento local- Utilização do BLAST BLAST Tipos de BLAST (blastn) Compara nucleotídeos (blastp) Compara proteínas Utiliza nucleotídeo como query, este é traduzido nos seus 6 quadros de leitura e é comparado
Leia maisPrincipais algoritmos de alinhamento de sequências genéticas. Alexandre dos Santos Cristino
Principais algoritmos de alinhamento de sequências genéticas Alexandre dos Santos Cristino http://www.ime.usp.br/~alexsc e-mail: alexsc@ime.usp.br Definição de alinhamento de sequências Comparação de duas
Leia maisAlinhamento de Sequências e Genômica Comparativa
Encontro França-Brasil de Bioinformática Universidade Estadual de Santa Cruz (UESC) Ilhéus-BA - Brasil Alinhamento de Sequências e Genômica Comparativa Maria Emília M. T. Walter Departamento de Ciência
Leia maisNada em Biologia faz sentido senão à luz da evolução.
Marcos T. Geraldo ADAPTABILIDADE Nada em Biologia faz sentido senão à luz da evolução. Theodosius Dobzhansky (1973) 1 Processo de evolução em moléculas de DNA, RNA e proteínas Reconstrução das relações
Leia maisalinhamento global-alinhamento múltiplo de seqüências
alinhamento global-alinhamento múltiplo de seqüências Alinhamento múltiplos de seqüências Qual a importância de se realizar alinhamentos múltiplos em oposição a alinhamentos em pares? Alinhamento múltiplos
Leia maisAnálise de significância de. alinhamentos
Análise de significância de alinhamentos Análise de significância de um alinhamento Tão importante como escolher o método de scoring ou encontrar o alinhamento que maximiza o score é saber avaliar a significância
Leia maisPAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE
CONCEITOS EM EPIDEMIOLOGIA E FILOGENIA MOLECULARES PAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE DE
Leia maisBiologia Molecular Computacional Homologia
Biologia Molecular Computacional Homologia Luiz Thibério Rangel O que é homologia? Conceito básico para estudos de genômica comparativa; Passo inicial para estudos de filogenia(omica); Importante para
Leia maisAlinhamento de Seqüências
18 CAPÍTULO 3 Alinhamento de Seqüências 3.1. Introdução O alinhamento de seqüências consiste no processo de comparar duas seqüências (de nucleotídeos ou proteínas) de forma a se observar seu nível de identidade.
Leia maisProtein Homology detection by HMM-comparation.
UNIVERSIDADE FEDERAL DE PERNAMBUCO Cin Centro de Informática Pós-Graduação em Ciência da Computação Protein Homology detection by HMM-comparation. Johannes Soding Vol. 21 no. 7 2005, BIOINFORMATICS Recife,
Leia maisIdentificação de genes por similaridade de seqüência
Identificação de genes por similaridade de seqüência Evolução do genoma Os genes evoluem a partir de genes ancestrais comuns acumulando mutações Homologia Genes ancestrais estão presentes nas espécies
Leia maisTópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro
Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven para BMI/CS 576, UW-Madison
Leia maisProgramas de Alinhamento. Sumário
Programas de Alinhamento Departamento de Genética FMRP- USP Alynne Oya Chiromatzo alynne@lgmb.fmrp.usp.br Sumário Introdução para buscas em base de dados Fasta Blast Programa para alinhamento Clustal 1
Leia maisTITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO DE GRADUAÇÃO
1 U NIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2 0 1 6. 1 TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO
Leia maisAlinhamentos de Múltiplas Seqüências. Rogério T. Brito Orientador: José A. R. Soares
1 Alinhamentos de Múltiplas Seqüências Rogério T. Brito Orientador: José A. R. Soares 2 Motivação Problema em Biologia: saber qual é o grau de parentesco entre um conjunto de espécies (construção de árvores
Leia maisTópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro
Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven/C. David Page para BMI/CS 576,
Leia maisIBM1029 Introdução à Bioinformática. O Início da Bioinformática 27/03/2017. Aula 2. O Início. Bioionformática: definição
IBM1029 Introdução à Bioinformática Profa Dra Silvana Giuliatti Departamento de Genética FMRP silvana@fmrp.usp.br O Início da Bioinformática Aula 2 O Início Trabalho de Margaret Dayhoff e colaboradores:
Leia maisEvolução Molecular. "Nothing in Biology Makes Sense Except in the Light of Evolution. Theodosius Dobzhansky
"Nothing in Biology Makes Sense Except in the Light of Evolution Theodosius Dobzhansky Evolução Evolução Evolução Genótipo + Ambiente = Fenótipo Parental F1 F2 Evolução Evolução = mudança (características
Leia maisElisa Boari de Lima Orientador: Thiago de Souza Rodrigues
Uma Metodologia para Identificação de Módulos Formadores de Sequências de Proteínas Mosaicas do Trypanosoma cruzi a partir do Transcriptoma do Parasito Utilizando a Ferramenta BLAST Elisa Boari de Lima
Leia maisInteligência Artificial. Algoritmos Genéticos. Aula I Introdução
Universidade Estadual do Oeste do Paraná Curso de Bacharelado em Ciência da Computação Inteligência Artificial Algoritmos Genéticos Aula I Introdução Roteiro Introdução Computação Evolutiva Algoritmos
Leia maisBioinformática. João Varela Aulas T7-T8 CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, E ENGENHARIA BIOLÓGICA
Bioinformática CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, E ENGENHARIA BIOLÓGICA João Varela jvarela@ualg.pt Aulas T7-T8 Esquema de anotação Annothaton 1. Determinar a localização das ORFs presentes
Leia mais3 Algoritmos Genéticos
Técnicas de Inteligência Computacional 33 3 Algoritmos Genéticos Este capítulo resume os principais conceitos sobre o algoritmo evolucionário empregado nesta dissertação. É apresentada uma breve explicação
Leia maisComparação e alinhamento de. sequências
Comparação e alinhamento de sequências Comparar sequências A comparação de sequências de proteínas ou DNA/RNA é uma ferramenta essencial na procura da existência de relações de semelhança entre o todo
Leia maisP E R N AMBUCO UMA FERRAMENTA WEB PARA INFERÊNCIA DE HAPLÓTIPOS PROPOSTA DE TRABALHO DE GRADUAÇÃO
U NIVERSIDADE FEDERAL DE P E R N AMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA UMA FERRAMENTA WEB PARA INFERÊNCIA DE HAPLÓTIPOS PROPOSTA DE TRABALHO DE GRADUAÇÃO Aluno Ranieri Valença
Leia maisEstrutura covalente de proteínas estrutura tridimensional. Proteina: estrutura covalente com muitas restrições conformacionais
Estrutura covalente de proteínas estrutura tridimensional Proteina: estrutura covalente com muitas restrições conformacionais M. Teresa Machini IQ/USP Análise de sequência de aminoácidos Conteúdo de aminoácidos
Leia maisComparação e alinhamento de sequências
Comparação e alinhamento de sequências Comparar sequências A comparação de sequências de proteínas ou DNA/RNA é uma ferramenta essencial na procura da existência de relações de semelhança entre o todo
Leia maisINF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 06 Algoritmos Genéticos Edirlei Soares de Lima Algoritmos Genéticos Método de busca local. Boa abordagem para lidar com espaços de busca muito
Leia maisA matemática e o genoma. Resumo
I Coloquio Regional da Região Centro-Oeste, 3 a 6 de novembro de 2009 Universidade Federal de Mato Grosso do Sul Mini-curso A matemática e o genoma Nalvo F. Almeida Jr. Resumo Os avanços da biotecnologia
Leia maisIDENTIFICAÇÃO ESTRUTURAL EM REDES DE PROTEÍNAS
IDENTIFICAÇÃO ESTRUTURAL EM REDES DE PROTEÍNAS Tópicos Especiais em Redes Complexas II Professor: Daniel Ratton Figueiredo Aluno: Vitor Borges Coutinho da Silva Artigos Comparative Analysis of Protein
Leia maisALINHAMENTO DE SEQUÊNCIAS
Disciplina de BIOLOGIA COMPUTACIONAL Mestrado em ENGENHARIA BIOMÉDICA 4º Ano, 1º Semestre 2007/08 ALINHAMENTO DE SEQUÊNCIAS Relatório 2 Ana Calhau Ângela Pisco Nuno Santos 54605 55748 55746 Palavras-Chave:
Leia maisMetahuerísticas: Algoritmos Genéticos. Sistemas de Informação/Ciências da Computação UNISUL Aran Bey Tcholakian Morales, Dr. Eng.
Metahuerísticas: Algoritmos Genéticos Sistemas de Informação/Ciências da Computação UNISUL Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 8) Meta-heurísticas Classificação de métodos heurísticos: os métodos
Leia maisResumo - capítulo 3 - Alinhamento de pares de sequências
Resumo - capítulo 3 - Alinhamento de pares de sequências Pedro Ivo Gomes de Faria Sumário 1 Introdução 3 1.1 Definição de alinhamento de sequências............. 3 1.1.1 Alinhamento global....................
Leia maisCapítulo 8. Versão 0.4. Filogenômica
Capítulo 8 Versão 0.4 Filogenômica O termo "Filogenômica" é definido de várias maneiras, mas, em geral, a definição é relacionada com a intersecção dos campos da Genômica e da evolução biológica. Aqui,
Leia maisDEFINIÇÕES EM EPIDEMIOLOGIA MOLECULAR E CONCEITOS BÁSICOS EM BIOLOGIA MOLECULAR
DEFINIÇÕES EM E DEFINIÇÕES EM E CONCEITOS BÁSICOS EM BIOLOGIA PARA QUE SERVE ESTA AULA 1. DEFINIÇÕES EM CONCEITUAÇÃO DE DIFERENCIAÇÃO ENTRE, TAXONOMIA E FILOGENIA 2. CONCEITOS EM BIOLOGIA APRESENTAR (REVER)
Leia mais1164 BIOLOGIA ESTRUTURAL Aula 4 Prof. Dr. Valmir Fadel
Apesar da grande quantidade de seqüências determinadas (260.175 seqüências e 3.874.166 transcrições no UniProtKB/TrEMBL em 06/03/2007) a quantidade de estruturas tridimensionais determinadas é significativamente
Leia maisProfa. Dra. Cecília Dias Flores
Profa. Dra. Cecília Dias Flores Regente pela Disciplina de Bioinformática - Curso de Biomedicina Depto. Ciências Exatas e Sociais Aplicadas Coordenadora do curso Informática Biomédica PPG em Ciências da
Leia maisAnálise de dados provenientes de técnicas moleculares
CIIMAR Curso de formação Análise de dados provenientes de técnicas moleculares Formadores: Filipe Pereira e Filipe Lopes Manual do Curso 1 Índice Objetivo Geral do Curso... 3 Público-alvo... 3 Objetivos
Leia maisDados Moleculares x Morfológicos
Evolução Molecular Dados Moleculares x Morfológicos Hereditários Descrição não ambígua Mais fácil estabelecer homologia Permite comparações de espécies distantes Abundantes Fatores ambientais Diferenças
Leia maisProblemas de otimização
Problemas de otimização Problemas de decisão: Existe uma solução satisfazendo certa propriedade? Resultado: sim ou não Problemas de otimização: Entre todas as soluções satisfazendo determinada propriedade,
Leia maisTranscritômica. João Carlos Setubal IQ/USP outubro de 2013
Transcritômica João Carlos Setubal IQ/USP outubro de 2013 Objetivo Obter, analisar, e interpretar dados de expressão gênica mrnas (que vão virar proteína) RNAs (que não vão virar proteína; ncrnas) O gene
Leia maisBioinformática. Alinhamento de Sequências. Prof. Msc. Rommel Ramos
Bioinformática Alinhamento de Sequências Prof. Msc. Rommel Ramos 2013 Sumário 1. Comparação de Sequências 2. O que é alinhamento? 3. Tipos de Alinhamento 4. Algoritmos 5. Métodos de Alinhamento Comparação
Leia maisEvolução e diversidade biológica
Evolução e diversidade biológica Charles Darwin (1809-1882) - Mecanismo da seleção natural - Mundo dinâmico - Separação: mundo físico e biológico - Adequação de representações gráficas para relações entre
Leia maisResumo - capítulo 5 - Predição da estrutura secundária do RNA
Resumo - capítulo 5 - Predição da estrutura secundária do RNA Pedro Ivo Gomes de Faria Sumário 1 Introdução 2 1.1 Fundamentos da predição da estrutura do RNA........ 2 1.2 Características da estrutura
Leia maisALGORITMOS AVANÇADOS UNIDADE I Análise de Algoritmo - Notação O. Luiz Leão
Luiz Leão luizleao@gmail.com http://www.luizleao.com Conteúdo Programático 1.1 - Algoritmo 1.2 - Estrutura de Dados 1.2.1 - Revisão de Programas em C++ envolvendo Vetores, Matrizes, Ponteiros, Registros
Leia maisIdentificação de fatores de transcrição a partir de dados de expressão.
Identificação de fatores de transcrição a partir de dados de expressão. Márcio Augusto Afonso de Almeida Laboratório de Genética e Cardiologia Molecular InCor. Introdução Técnicas de expressão global permitem
Leia maisPredição de modificações em proteínas
Predição de modificações em proteínas Modificações de proteína Ao representarmos uma proteína como uma seqüência de caracteres representando os seus aminoácidos (estrutura primaria) estamos representando
Leia maisIntrodução à Bioquímica
Introdução à Bioquímica Nucleotídeos e Ácidos Nucléicos Dra. Fernanda Canduri Laboratório de Sistemas BioMoleculares. Departamento de Física.. UNESP São José do Rio Preto - SP. Genoma! O genoma de um organismo
Leia maisAlgoritmos Genéticos. Princípio de Seleção Natural. Sub-áreas da Computação Evolutiva. Idéias básicas da CE. Computação Evolutiva
Computação Evolutiva Algoritmos Genéticos A computação evolutiva (CE) é uma área da ciência da computação que abrange modelos computacionais inspirados na Teoria da Evolução das Espécies, essencialmente
Leia maisTeoria dos Grafos Aula 17
Teoria dos Grafos Aula 17 Aula passada Problema da soma do subconjunto (subset sum) Programação dinâmica Problema da mochila Aula de hoje Alinhamento de sequências Programação dinâmica Caminho mais curto
Leia maisTópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro
Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven/C. David Page para BMI/CS 576,
Leia maisAminoácidos e peptídeos. Prof.: Matheus de Souza Gomes Disciplina: Bioquímica I
Aminoácidos e peptídeos Prof.: Matheus de Souza Gomes Disciplina: Bioquímica I Patos de Minas 2017 Conteúdo Aminoácidos e peptídeos Constituição das proteínas Aminoácidos Estrutura Classificação Ácido
Leia maisAlinhamento de Seqüências Biológicas
O que se cmpara? Alinhament de Seqüências Bilógicas A cmparaçã de seqüências de DNA, RNA e prteínas é uma das bases da biinfrmática. Citsina Uracila Timina Prfª Drª Silvana Giuliatti Departament de Genética
Leia maisModelagem Comparativa de Proteínas
Modelagem Comparativa de Proteínas Bioinformática Estrutural Aula 3 3 de Junho de 2013 Paula Kuser Falcão Laboratório de Bioinformática Aplicada Embrapa Informática Agropecuária Por que predizer a estrutura?
Leia maisétodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA
étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UNIVERSIDADE DE JOÃO DEL-REI PRÓ-REITORIA DE PESQUISA CENTRO
Leia maisESCLEROSE LATERAL AMIOTRÓFICA ANÁLISES IN SILICO DAS MUTAÇÕES A4V E A4F DA PROTEÍNA SOD1
ESCLEROSE LATERAL AMIOTRÓFICA ANÁLISES IN SILICO DAS MUTAÇÕES A4V E A4F DA PROTEÍNA SOD1 Aloma Nogueira Rebello da Silva Bióloga (UNIRIO) Programa de Pós-Graduação em Biologia Molecular e Celular aloma.nogueira@gmail.com
Leia maisDados Moleculares x Morfológicos
Evolução Molecular Dados Moleculares x Morfológicos Hereditários Descrição não ambígua Mais fácil estabelecer homologia Permite comparações de espécies distantes Abundantes Fatores ambientais Diferenças
Leia maisCorreção Ortográfica. Processamento Estatístico da Linguagem Natural. Correção de Erros. Distância Mínima de Edição. Distância Mínima de Edição
Processamento Estatístico da Linguagem Natural Aula 6 Professora Bianca (Sala 302 Bloco E) bianca@ic.uff.br http://www.ic.uff.br/~bianca/peln/ Correção Ortográfica Três tipos de problemas: Detecção de
Leia mais2 Contexto e Motivações
2 Contexto e Motivações Existem duas principais famílias de algoritmos que realizam comparações de biosseqüências, a FASTA (Pearson, 1991) e a BLAST (Altschul et al., 1990). Estas ferramentas realizam
Leia maisMontagem de regiões gênicas
Montagem de regiões gênicas Pedro Ivo Gomes de Faria Departamento de Ciência da Computação Instituto de Matemática e Estatística Universidade de São Paulo Orientador: Prof. Dr. Alan Durham Pedro Ivo Gomes
Leia maisPrincípios de Sistemática Molecular
! Ciências teóricas e sistemática biológica "! DNA, genes, código genético e mutação! Alinhamento de seqüências! Mudanças evolutivas em seqüências de nucleotídeos! Otimização em espaços contínuos e discretos!
Leia maisMétodos de Busca. Inteligência Artificial. Algoritmos Genéticos. Algoritmos Evolucionários. Prof. Ms. Luiz Alberto Contato:
Inteligência Artificial Prof. Ms. Luiz Alberto Contato: lasf.bel@gmail.com Métodos de Busca Busca Cega ou Exaustiva: Não sabe qual o melhor nó da fronteira a ser expandido. Apenas distingue o estado objetivo
Leia maisAlgoritmos Genéticos. Pontos fracos dos métodos tradicionais. Características de alguns problemas. Tamanho do espaço de busca- Ex. caixeiro viajante:
Algoritmos Genéticos Prof. Luis Otavio Alvares INE/UFSC Características de alguns problemas Tamanho do espaço de busca- Ex. caixeiro viajante: 10 cidades: 181.000 soluções 20 cidades: 10.000.000.000.000
Leia maisTeoria da Computação. Complexidade computacional classes de problemas
Teoria da Computação Complexidade computacional classes de problemas 1 Universo de problemas Problemas indecidíveis ou não-computáveis Não admitem algoritmos Problemas intratáveis Não admitem algoritmos
Leia maisBioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica. João Varela
Bioinformática Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica João Varela jvarela@ualg.pt Docentes João Varela (bioinformática: conceitos, bases de dados, aplicações, pesquisa
Leia mais3 Estimação e Compensação de movimento na codificação de vídeo
Estimação e Compensação de movimento na codificação de vídeo 36 3 Estimação e Compensação de movimento na codificação de vídeo O objetivo do modelo temporal (que engloba as fases de estimação e compensação
Leia maisBusca de motivos em sequências. João Carlos Setubal IQ-USP 2014
Busca de motivos em sequências João Carlos Setubal IQ-USP 2014 Motivos do tipo I AACT(G A)N 12 AGTT Q-[LIV]-H-H-[SA]-x(2)-D-G-[FY]-H Chloramphenicol acetyltransferase active site (do PROSITE) Posições
Leia mais2 Contexto Biológico Genômica
15 2 Contexto Biológico Neste capítulo abordaremos o contexto biológico para o entendimento deste trabalho. Serão abordados os aspectos gerais da genômica, expostos os processos do sequenciamento genético
Leia maisINF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 04 Algoritmos Genéticos Introdução Algoritmos genéticos são bons para abordar espaços de buscas muito grandes e navegálos
Leia maisExplorando genomas: predição de genes e elementos transponíveis Proporção de diferentes sequências no genoma
Explorando genomas: predição de genes e elementos transponíveis Proporção de diferentes sequências no genoma 1 Especies Genoma Genes 11 O número de genes varia entre as espécies 2 Anotação do Genoma 1
Leia maisIntrodução a Bioinformática
Pontifícia Universidade Católica de Goiás Departamento de Biologia Disciplina: Bioinformática Bio1015 Introdução a Bioinformática Prof. Macks Wendhell Gonçalves, Msc mackswendhell@gmail.com EMENTA Introdução
Leia maisPrograma Analítico de Disciplina BQI460 Bioinformática
0 Programa Analítico de Disciplina Departamento de Bioquímica e Biologia Molecular - Centro de Ciências Biológicas e da Saúde Número de créditos: Teóricas Práticas Total Duração em semanas: 15 Carga horária
Leia maisPrograma de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas. Seleção de Mestrado 2012-A
Programa de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas Seleção de Mestrado 2012-A INSTRUÇÕES (LEIA ATENTAMENTE ANTES DE PREENCHER A PROVA): a. Identifique sua prova unicamente com
Leia maisRecursos Genéticos Vegetais
Recursos Genéticos Vegetais Caracterização x Avaliação Caracterização Alta herdabilidade Pouca influência ambiental Avaliação Baixa herdabilidade Muita influência ambiental Caracterização: Caracterização
Leia maisBusca de motivos em sequências. João Carlos Setubal 2015
Busca de motivos em sequências João Carlos Setubal 2015 Cadeias exatas Podem ser encontradas com o mecanismo de busca de qualquer editor de textos Que algoritmo é executado? O mais simples (e que é muito
Leia maisAlinhamento de Sequências de Proteínas. Modelagem por homologia Estratégia/aplicação Etapas do processo Exemplo
Objetivos FFI0776 Modelagem e Engenharia de Proteínas Prof. Rafael V. C. Guido rvcguido@ifsc.usp.br Aula 06 Alinhamento de Sequências de Proteínas Determinação da sequência de aa Características do alinhamento
Leia maisIACB 1º Semestre de 2014/2015. Exercicios de Preparação para o Teste 1
IACB 1º Semestre de 2014/2015 Exercicios de Preparação para o Teste 1 Introdução (0 ou 1 questão no teste 1) 1. O que é a BioInformática? Resposta: Bioinformática é um campo interdisciplinar que aplica
Leia maisProf. João Carlos Setubal
Prof. João Carlos Setubal QBQ 102 Aula 5 (biomol) Sequenciamento de DNA, genomas e bioinformática Replicação de DNA 5ʹ 3ʹ A replicação pára Reação da DNA Polimerase com dntps síntese de DNA Purina ou
Leia maisResumo - capítulo 4 - Alinhamento múltiplo de sequências
Resumo - capítulo 4 - Alinhamento múltiplo de sequências Pedro Ivo Gomes de Faria Sumário 1 Introdução 3 1.1 Sequenciamento de genomas................... 3 1.2 Usos de alinhamentos múltiplos de sequências.........
Leia maisINSTITUTO DE PÓS GRADUAÇÃO ICPG GESTÃO DA TECNOLOGIA DA INFORMAÇÃO
INSTITUTO DE PÓS GRADUAÇÃO ICPG GESTÃO DA TECNOLOGIA DA INFORMAÇÃO Prof. Msc. Saulo Popov Zambiasi (saulopz@gmail.com) Informação - ICPG - Criciuma - SC 1 Características Gerais, operadores, algoritmo.
Leia maisUNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS BIOLÓGICAS E DA SAÚDE PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA E EVOLUÇÃO
UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS BIOLÓGICAS E DA SAÚDE PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA E EVOLUÇÃO ALINHAMENTO DE SEQÜÊNCIAS BIOLÓGICAS COM O USO DE ALGORITMOS GENÉTICOS Sabrina
Leia maisIntrodução à Bioquímica Celular
Pontifícia Universidade Católica de Goiás Departamento de Biologia Introdução à Bioquímica Celular Prof. Msc. Macks Wendhell Gonçalves mackswendhell@gmail.com O que é Biologia Celular? É o ramo da ciência
Leia mais5 Resultados e Discussões
5 Resultados e Discussões Este capítulo apresenta os resultados obtidos no presente trabalho assim como sua discussão. São apresentados os resultados do registro realizado nas imagens capturadas empregando
Leia maisCapítulo 4. Versão 0.7. Alinhamento entre duas sequências
Capítulo 4 Versão 0.7 Alinhamento entre duas sequências Teoria Um dos procedimentos centrais da Bioinformática é o alinhamento entre os monômeros de duas sequências macromoleculares. Ao fazer esse alinhamento,
Leia maisBioinformática para o Citrus EST Project (CitEST)
Bioinformática para o Citrus EST Project (CitEST) Marcelo da Silva Reis 1 1 Instituto de Matemática e Estatística, Universidade de São Paulo 20 de maio de 2009 Organização da Apresentação Esta apresentação
Leia maisintrodução ao curso
introdução ao curso http://www.ifsc.usp.br/~rdemarco/ffi0760/ffi0760.htm Cronograma aulas teóricas Aulas teóricas (Segundas-feiras - Sala 146) 30/07-introdução ao curso. 06/08-Busca em bancos de dados
Leia maisMontagem de Genomas. Prof. Dr. Alessandro Varani UNESP - FCAV
Montagem de Genomas Prof. Dr. Alessandro Varani UNESP - FCAV Conceitos da Genômica O que é um genoma? O conjunto de DNA que compõe um determinado (micro) organismo - Cromossomos; - Organelas: Mitocôndria
Leia maisNúmero de genes versus número de proteínas em eucariotos
Número de genes versus número de proteínas em eucariotos Bioquímica II SQM0416 Júlia Assirati Tomie Kuriyama Victória Montenegro de Campos Resumo Introdução Características do genoma humano Como foram
Leia maisBioinformática DCC/FCUP
Bioinformática DCC/FCUP 2012/2013 Pedro Ribeiro Unidade 3 Alinhamento de Sequências (baseado nos slides de Vítor Costa/DCC-FCUP e Sushmita Roy/UWisconsin) Objectivos desta unidade Homologia Alinhamento
Leia maisESTATÍSTICAS PARA INFERIR PADRÕES SELECÇÃO
ESTATÍSTICAS PARA INFERIR PADRÕES DEMOGRÁFICOS E SELECÇÃO Inferências demográficas e selectivas Os fenómenos demográficos (expansão ou redução do efectivo populacional, subdivisão, migração) e selectivos
Leia maisSequenciamento de genoma e transcriptomas
Sequenciamento de genoma e transcriptomas Por que seqüenciar genomas? O seqüenciamento de genomas é o primeiro passo para obter uma descrição completa da composição molecular de cada organismo, pois todas
Leia maisAnotação de genomas II
Anotação de genomas II Anotação de genomas Uma vez descrito a seqüência do genoma de um organismo e realizada a anotação dos genes presentes obtemos uma extensa lista de potenciais transcritos. Como vimos
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
Leia maisCap. 6: Métodos para alinhamento de múltiplas seqüências
Cap. 6: Métodos para alinhamento de múltiplas seqüências Organização O que é um alinhamento múltiplo Escores para alinhamentos múltiplos Relação entre alinhamento múltiplo e análise filogenética Métodos
Leia mais