Alinhamentos e Busca de Similaridade. Ariane Machado Lima
|
|
- Sebastião Domingues Amaral
- 7 Há anos
- Visualizações:
Transcrição
1 Alinhamentos e Busca de Similaridade Ariane Machado Lima
2 Busca de identidade Identificar o que é determinada seqüência Ex.acabou de seqüenciar, seria contaminante? Outras fases de um projeto de seqüenciamento
3 Seqüenciamento shot-gun
4 Mascaramento de vetor
5 Montagem
6 Inferência de função a partir de similaridade
7 Nem sempre funciona...
8 Estrutura 3D de proteínas
9 2 seqüências cacttttaactctctttccaaagtccttttcatctttccttcacagtacttgttcactat cacttttaactctctttccaaagaacttttcatctttccctcacggtacttgtttgctat
10 Processo evolutivo
11
12 Similaridade (e não identidade) entre os aminoácidos
13 Evolução convergente CUIDADO: Duas seqüências similares e com a mesma função podem não ter o mesmo ancestral...
14 Homologia, paralogia e ortologia Homologia: 2 seqüências são homólogas se elas possuem uma seqüência ancestral comum Paralogia: homologia por duplicação Ortologia: homologia por especiação
15 Homologia, paralogia e ortologia Paralogia Ortologia
16 Identidade, similaridade e homologia Se duas (ou mais) seqüências são parecidas: elas podem ser homólogas elas podem ter funções similares elas podem ter a mesma estrutura
17 Busca de similaridade Predição de genes Predição de função Predição de estrutura Inferência de árvores filogenéticas
18 Alinhamentos Pairwise: 2 seqüências Múltiplo: mais de 2 seqüências
19 Alinhamentos de 2 seqüências (pairwise) Deixar 2 seqüências o mais parecidas possível Ajustando as posições de suas letras, se necessário usando espaços: ROSAVERMELHA AMOROSOVERME ---ROSAVERMELHA AMOROSOVERME---
20 ROSAVERMELHA AMOROSOVERME Identidade: 8% (1/12) ---ROSAVERMELHA AMOROSOVERME--- Identidade: 53% (8/15)
21 Sistema de scores Pontos para match (ex: +2) Penalidades para mismatch (ex: -1) Penalidades para gap abertura (ex: -3) extensão (ex: -1)
22 ROSAVERMELHA AMOROSOVERME Identidade: 8% (1/12) SCORE:??? ---ROSAVERMELHA AMOROSOVERME--- Identidade: 53% (8/15) SCORE:???
23 Identidade, similaridade e homologia Tipo de Medida Sentido Identidade Quantitativa quantos idênticos Similaridade Quantitativa quantos parecidos Homologia QUALITATIVA TEM ou NÃO TEM um ancestral comum
24 Tipos de alinhamentos Global Local Semi-global
25 Alinhamento global QUERIDA---ROSAVERMELHA QUEROUMAMOROSOVERME---
26 Alinhamento global Aplicação: comparar 2 proteínas (ex. para inferir estrutura secundária)
27 Alinhamento global Algoritmo Needleman-Wunsch Programas: needle (EMBOSS) stretcher (EMBOSS) (demora mais, mas economiza memória) FASTA
28 Alinhamento local QUERIDA---ROSAVERMELHA QUEROUMAMOROSOVERME--- QUER QUER ROSAVERME ROSOVERME
29 Alinhamento local Aplicações: Encontrar um gene em um genoma Identificar éxons Identificar domínios proteicos Identificar possíveis homólogos em um banco de dados
30 Alinhamento Local Algoritmo Smith-Waterman Programas water (EMBOSS) matcher (demora mais, mas economiza memória) cross_match (swat) bom para mascaramento FASTA BLAST BLAT
31 Alinhamento semi-global ---ROSAVERMELHA AMOROSOVERME---
32 Alinhamento semi-global Aplicação: montagem de genomas!
33 Alinhamento múltiplo
34 Resumindo Alinhamento pairwise global local semi-global Alinhamento múltiplo (sempre global)
35 Voltando ao sistema de score... Match/mismatch pode ser substituído por uma matriz 4x4 (nucleotídeos) uma matriz 20x20 (aminoácidos)
36 Similaridade entre os aminoácidos
37 Matrizes de score (matrizes de substituição) q ij : probabilidade do aa i ser substituído pelo aa j p i : probabilidade do aa i m ij = log (q ij / p i p j ) = m ij M ij = 1/λ log (q ij / p i p j ) = M ij
38 Matrizes de score (matrizes de substitição) Como achar q ij, p i e p j? Algumas matrizes: PAMs BLOSUMs
39 Matrizes PAM de aminoácidos Point Accepted Mutation Dayhoff, 1978 Processo: Alinhamento de conjuntos de seqüências relacionadas (85% id) Construção de árvores filogenéticas Cálculo da freqüência de substituição de cada par de aa Normalização das freqüências: 1% de mudança ~ 50 milhões de anos (PAM1)
40 Matrizes PAM de aminoácidos Point Accepted Mutation Em um período de 2 PAMs, pode ter havido A?, e então? D Extrapolação: PAM2 = PAM1 x PAM1 PAMy = PAM1 x PAM1 x... x PAM1 PAM120: 40% de identidade PAM250: 20% de identidade
41 Diagonal PAM250 Hidrofóbicos Hidrofílicos
42 Problemas das PAMs Inferida por um conjunto restrito de proteínas Extrapolação Muitas novas proteínas foram seqüênciadas desde 78...
43 Matrizes BLOSUM de aminoácidos Henikoff & Henikoff, 1992 Alinhamentos de blocos de vários grupos de proteínas relacionadas (banco de dados BLOCKS) Cálculo de freqüência de substituição de cada par de aa BLOSUMx: blocos de seqüências com no máximo x% de identidade Ex: BLOSUM62 e BLOSUM85
44 BLOSUM62 Reference: Henikoff, S. and Henikoff, J. G. (1992). Amino acid substitution matrices from protein blocks. Proc. Natl. Acad. Sci. USA 89: A R N D C Q E G H I L K M F P S T W Y V B Z X * A R N D C Q E G H I L K M F P S T W Y V B Z X *
45 PAMs e BLOSUMs Para encontrar alinhamentos mais curtos e com maior similaridade: PAMs mais baixas BLOSUMs mais altas Para encontrar alinhamentos mais longos e com menor similaridade: PAMs mais altas BLOSUMs mais baixas
46 Papel dos gaps Veremos na aula prática...
47 Significância de scores Scores e a distribuição de Gumbel P-value (s): probabilidade de obter um score tão bom ou melhor que s puramente por chance em um banco de dados aleatório, do mesmo tamanho e com a mesma composição de bases E-value (s): número de hits com score tão bom ou melhor que s puramente por chance em um banco de dados aleatório, do mesmo tamanho e com a mesma composição de bases
48 Significância de scores E-value é um número real não negativo Quanto menor melhor!!!! E-value depende de... E(S) = Kmne -λs... por isso não existe número mágico
49 BLAST Basic Local Alignment Search Tool NCBI BLAST ou WU-BLAST Heurísticas
50 Palavras do BLAST (W) MLIIKRDELVISWASHERE MLI LII IIK IKR KRD RDE DEL ELV LVI VIS ISW SWA WAS ASH SHE HER ERE seqüência query todas as palavras de tamanho 3 com sobreposição
51
52 Outros programas BLAST PSI-BLAST Position-Specific Iterated BLAST: busca iterativa a partir de seqüências encontradas PHI-BLAST Pattern-Hit Initiated BLAST: expressões regulares + alinhamento local nos matches MEGABLAST: algoritmo guloso para acelerar buscas de seqüências altamente similares (até 10x)
53 BLAT Blast Like Alignment Tool Mais rápido e mais preciso (para seqüências altamente similares) Aplicação: mapeamento de seqüências (ex: transcritos) Mantém um índice de todo o banco em memória (non-overlapping k-mers)
54 Formato FASTA >Identificador da seqüência GCCCCCGGCCCCGCCCCGGCCCCGCCCCCGGCCCCGCCCCGCAAGGGTC ACAGGTCACGGGGCGGGGCCGAGGCGGAAGCGCCCGCAGCCCGGTACCG GCTCCTCCTGGGCTCCCTCTAGCGCCTTCCCCCCGGCCCGACTCCGCTG GTCAGCGCCAAGTGACTTACGCCCCCGACCTCTGAGCCCGGACCGCTAG
55 Programas standalone Programas como Blast, BLAT e muuuuitos outros: via web server standalone (linha de comando) Perl scripts!!!! netblast: linha de comando, mas executa remotamente
56
57 Similaridade de seqüências Aula Prática
58 Ex.1: Identidade e similaridade Qual é o melhor alinhamento? a) 100% (10/10) b) 91% (95/104) c) 74% (80/108) d) 53% (59/111)
59 Alinhamento global Needleman-Wunsch Programas: needle (EMBOSS) stretcher (EMBOSS) (demora mais, mas economiza memória) FASTA Alinhamento múltiplo: ClustalW T-Coffee
60 Alinhamento local Smith-Waterman Programas water (EMBOSS) matcher (demora mais, mas economiza memória) cross_match (swat) FASTA BLAST
61 Ex.2: needle Vamos alinhar as seqüências de uma hemoglobina humana e outra de camundongo
62 Ex.2: needle Vamos alinhar as seqüências de uma hemoglobina humana e outra de cavalo ex2
63 Ex.2: needle Gaps default (10.0 ; 0.5) Conservador (100.0 ; 10.0) Flexível (1.0 ; 0.1)
64 Ex.3: water Vamos alinhar as seqüências do ex. 2 Gaps default (10.0 ; 0.5) Homework: Conservador (100.0 ; 10.0) Flexível (1.0 ; 0.1)
65 Ex.4: needle Vamos alinhar as seqüências de um mrna de hemoglobina de camundongo com seu locus genômico Gaps default (10.0 ; 0.5) Conservador (100.0 ; 10.0) Flexível (1.0 ; 0.1)
66 Ex.5: water Vamos alinhar as seqüências do exercício 4 Gaps default (10.0 ; 0.5) Conservador (100.0 ; 10.0) Flexível (1.0 ; 0.1)
67 Ex.6 - Matrizes BLOSUM Usando a matriz de escore default BLOSUM62, você encontrou duas proteínas que divergiram bem recentemente. Se você quiser refinar seu alinhamento, que matriz você deveria usar (com número mais alto ou mais baixo)?
68 Ex. 7 - Score e E-value Ordene por relevância: a) Score = 155 bits (393), Expect = 4e-37 Identities = 79/150 (52%), Positives = 101/150 (67%), Gaps = 1/150 (0%) b) Score = 74.3 bits (181), Expect = 2e-12 Identities = 36/105 (34%), Positives = 57/105 (54%), Gaps = 0/105 (0%) c) Score = 347 bits (889), Expect = 1e-94 Identities = 167/167 (100%), Positives = 167/167 (100%), Gaps = 0/167 (0%) d) Score = 189 bits (480), Expect = 3e-47 Identities = 88/151 (58%), Positives = 114/151 (75%), Gaps = 1/151 (0%) e) Score = 89.7 bits (221), Expect = 4e-17 Identities = 52/127 (40%), Positives = 68/127 (53%), Gaps = 5/127 (3%)
69 Ex. 8 - BLAST e filtros Vamos buscar seqüências similares a Qual um programa apropriado? 1) Ligue os filtros 2) Desligue os filtros
70 Ex. 9 - BLASTP Busque no SWISSPROT seqüências similares à hemoglobina de camundongo
71 Ex. 10 -? Você seqüenciou uma seqüência de DNA Agora você quer encontrar seqüências similares com alta qualidade de anotação Assim, você quer começar fazendo uma busca no SWISSPROT Que programa usar?
72 Ex. 11 -? Você tem uma seqüência de proteína (hemoglobina de camundongo) e quer saber em qual chromossomo está o gene desta proteína. Qual programa usar?
73 Ex: 12 - Seqüências de proteína x DNA Seqüências de DNA são menos conservadas que seqüências de aminoácidos, que por sua vez são menos conservadas que a estrutura de uma proteína Se você quer inferir função, qual das duas usar? Se você quer detalhes mais finos (ex: distância evolutiva), qual usar?
74 Ex.13 - BLAT Útil para buscar seqüências altamente similares (de forma mais rápida) Utilize a seqüência de hemoglobina de camundongo para fazer seu mapeamento no genoma de camundongo
75 Ex.14 - BLAT Dá para fazer o mesmo com seqüência de proteína? Utilize a seqüência de hemoglobina de proteína de camundongo para fazer seu mapeamento no genoma de camundongo
76 Ex PSI-BLAST Você se pergunta se há parentes próximos da família de antígenos de membrana no SWISSPROT. Para buscá-las, você decide usar o PSI-BLAST que usa seqüências similares à sua seqüência query (antígeno de membrana) para obter uma descrição mais flexível dessa família.
77 Ex PHI-BLAST Além das vantagens do PSI-BLAST, você também quer definir um padrão que as seqüências devem ter
78 Referências Básico: O'Reilly - Caprichado: Mount - BLAST:
Alinhamentos de sequências e Busca de Similaridade
Alinhamentos de sequências e Busca de Similaridade Ariane Machado Lima ariane.machado@usp.br Escola de Artes, Ciências e Humanidades - USP Contexto http://www.ekac.org/gene.html http://www.fuzzco.com/news/wp-content/uploads/27//genome.jpg
Leia maisAlinhamento de sequências
Pontifícia Universidade Católica de Goiás Departamento de Biologia Alinhamento de sequências Prof. Macks Wendhell Gonçalves, Msc mackswendhell@gmail.com Definição O alinhamento de sequências consiste no
Leia maisMétodos de alinhamento de sequências biológicas. Marcelo Falsarella Carazzolle
Métodos de alinhamento de sequências biológicas Marcelo Falsarella Carazzolle Resumo - Introdução - Alinhamentos ótimos - Global - Local (Smith-Waterman) - Semi global - Matrizes de alinhamento (BLOSUM)
Leia maisAlinhamento de seqüências
Alinhamento de seqüências Qual a importância do alinhamento de seqüências Permite estabelecer identidades entre sequências Permite a dedução de função de proteínas baseado em similaridade Permite a definição
Leia maisPrincipais algoritmos de alinhamento de sequências genéticas. Alexandre dos Santos Cristino
Principais algoritmos de alinhamento de sequências genéticas Alexandre dos Santos Cristino http://www.ime.usp.br/~alexsc e-mail: alexsc@ime.usp.br Definição de alinhamento de sequências Comparação de duas
Leia maisIdentificação de genes por similaridade de seqüência
Identificação de genes por similaridade de seqüência Evolução do genoma Os genes evoluem a partir de genes ancestrais comuns acumulando mutações Homologia Genes ancestrais estão presentes nas espécies
Leia maisComparação entre sequências biológicas
Comparação entre sequências biológicas Extraíndo e analisando os sinais contidos em biopolímeros ( Alinhamentos ) Prof. Dr. Alessandro Varani UNESP - FCAV Objetivos Abordagens práticas para comparação
Leia maisAnálise de significância de. alinhamentos
Análise de significância de alinhamentos Análise de significância de um alinhamento Tão importante como escolher o método de scoring ou encontrar o alinhamento que maximiza o score é saber avaliar a significância
Leia maisNada em Biologia faz sentido senão à luz da evolução.
Marcos T. Geraldo ADAPTABILIDADE Nada em Biologia faz sentido senão à luz da evolução. Theodosius Dobzhansky (1973) 1 Processo de evolução em moléculas de DNA, RNA e proteínas Reconstrução das relações
Leia maisAlinhamento local- Utilização do BLAST
Alinhamento local- Utilização do BLAST BLAST Tipos de BLAST (blastn) Compara nucleotídeos (blastp) Compara proteínas Utiliza nucleotídeo como query, este é traduzido nos seus 6 quadros de leitura e é comparado
Leia maisAlinhamento de Seqüências
18 CAPÍTULO 3 Alinhamento de Seqüências 3.1. Introdução O alinhamento de seqüências consiste no processo de comparar duas seqüências (de nucleotídeos ou proteínas) de forma a se observar seu nível de identidade.
Leia maisTópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro
Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven/C. David Page para BMI/CS 576,
Leia maisProgramas de Alinhamento. Sumário
Programas de Alinhamento Departamento de Genética FMRP- USP Alynne Oya Chiromatzo alynne@lgmb.fmrp.usp.br Sumário Introdução para buscas em base de dados Fasta Blast Programa para alinhamento Clustal 1
Leia maisResumo - capítulo 3 - Alinhamento de pares de sequências
Resumo - capítulo 3 - Alinhamento de pares de sequências Pedro Ivo Gomes de Faria Sumário 1 Introdução 3 1.1 Definição de alinhamento de sequências............. 3 1.1.1 Alinhamento global....................
Leia maisalinhamento global-alinhamento múltiplo de seqüências
alinhamento global-alinhamento múltiplo de seqüências Alinhamento múltiplos de seqüências Qual a importância de se realizar alinhamentos múltiplos em oposição a alinhamentos em pares? Alinhamento múltiplos
Leia maisProtein Homology detection by HMM-comparation.
UNIVERSIDADE FEDERAL DE PERNAMBUCO Cin Centro de Informática Pós-Graduação em Ciência da Computação Protein Homology detection by HMM-comparation. Johannes Soding Vol. 21 no. 7 2005, BIOINFORMATICS Recife,
Leia maisBiologia Molecular Computacional Homologia
Biologia Molecular Computacional Homologia Luiz Thibério Rangel O que é homologia? Conceito básico para estudos de genômica comparativa; Passo inicial para estudos de filogenia(omica); Importante para
Leia maisComparação e alinhamento de. sequências
Comparação e alinhamento de sequências Comparar sequências A comparação de sequências de proteínas ou DNA/RNA é uma ferramenta essencial na procura da existência de relações de semelhança entre o todo
Leia maisTópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro
Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven para BMI/CS 576, UW-Madison
Leia maisALINHAMENTO DE SEQUÊNCIAS
Disciplina de BIOLOGIA COMPUTACIONAL Mestrado em ENGENHARIA BIOMÉDICA 4º Ano, 1º Semestre 2007/08 ALINHAMENTO DE SEQUÊNCIAS Relatório 2 Ana Calhau Ângela Pisco Nuno Santos 54605 55748 55746 Palavras-Chave:
Leia maisBioinformática para o Citrus EST Project (CitEST)
Bioinformática para o Citrus EST Project (CitEST) Marcelo da Silva Reis 1 1 Instituto de Matemática e Estatística, Universidade de São Paulo 20 de maio de 2009 Organização da Apresentação Esta apresentação
Leia maisDados Moleculares x Morfológicos
Evolução Molecular Dados Moleculares x Morfológicos Hereditários Descrição não ambígua Mais fácil estabelecer homologia Permite comparações de espécies distantes Abundantes Fatores ambientais Diferenças
Leia maisComparação e alinhamento de sequências
Comparação e alinhamento de sequências Comparar sequências A comparação de sequências de proteínas ou DNA/RNA é uma ferramenta essencial na procura da existência de relações de semelhança entre o todo
Leia maisElisa Boari de Lima Orientador: Thiago de Souza Rodrigues
Uma Metodologia para Identificação de Módulos Formadores de Sequências de Proteínas Mosaicas do Trypanosoma cruzi a partir do Transcriptoma do Parasito Utilizando a Ferramenta BLAST Elisa Boari de Lima
Leia maisAlinhamento de Sequências e Genômica Comparativa
Encontro França-Brasil de Bioinformática Universidade Estadual de Santa Cruz (UESC) Ilhéus-BA - Brasil Alinhamento de Sequências e Genômica Comparativa Maria Emília M. T. Walter Departamento de Ciência
Leia maisMarcelo Reis. Centro APTA Citros Sylvio Moreira. 18 de julho de 2007
I n t r o d u ç ã o à B i o i n f o r m á t i c a Marcelo Reis Centro APTA Citros Sylvio Moreira 18 de julho de 2007 Duração estimada: ~ 2,5h (manhã) ~ 2,5h (tarde) A g e n d a Manhã: Que trem é esse,
Leia maisMontagem de regiões gênicas
Montagem de regiões gênicas Pedro Ivo Gomes de Faria Departamento de Ciência da Computação Instituto de Matemática e Estatística Universidade de São Paulo Orientador: Prof. Dr. Alan Durham Pedro Ivo Gomes
Leia maisTITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO DE GRADUAÇÃO
1 U NIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2 0 1 6. 1 TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO
Leia maisResumo - capítulo 4 - Alinhamento múltiplo de sequências
Resumo - capítulo 4 - Alinhamento múltiplo de sequências Pedro Ivo Gomes de Faria Sumário 1 Introdução 3 1.1 Sequenciamento de genomas................... 3 1.2 Usos de alinhamentos múltiplos de sequências.........
Leia mais2 Contexto e Motivações
2 Contexto e Motivações Existem duas principais famílias de algoritmos que realizam comparações de biosseqüências, a FASTA (Pearson, 1991) e a BLAST (Altschul et al., 1990). Estas ferramentas realizam
Leia maisExplorando genomas: predição de genes e elementos transponíveis Proporção de diferentes sequências no genoma
Explorando genomas: predição de genes e elementos transponíveis Proporção de diferentes sequências no genoma 1 Especies Genoma Genes 11 O número de genes varia entre as espécies 2 Anotação do Genoma 1
Leia maisDados Moleculares x Morfológicos
Evolução Molecular Dados Moleculares x Morfológicos Hereditários Descrição não ambígua Mais fácil estabelecer homologia Permite comparações de espécies distantes Abundantes Fatores ambientais Diferenças
Leia maisAlinhamento de Seqüências Biológicas
O que se cmpara? Alinhament de Seqüências Bilógicas A cmparaçã de seqüências de DNA, RNA e prteínas é uma das bases da biinfrmática. Citsina Uracila Timina Prfª Drª Silvana Giuliatti Departament de Genética
Leia maisTópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro
Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven/C. David Page para BMI/CS 576,
Leia mais3 Análise do programa BlastP
27 3 Análise do programa BlastP Este capítulo inicia-se com a apresentação das principais características do programa BLAST e continua com uma visão detalhada da implementação do NCBI-BLAST. Também será
Leia maisEste capítulo possui uma discussão preliminar do contexto biológico necessário para o entendimento e motivação deste trabalho.
17 2 Preliminares Este capítulo possui uma discussão preliminar do contexto biológico necessário para o entendimento e motivação deste trabalho. Na discussão do contexto biológico serão apresentados os
Leia maisProf. João Carlos Setubal
Prof. João Carlos Setubal QBQ 102 Aula 5 (biomol) Sequenciamento de DNA, genomas e bioinformática Replicação de DNA 5ʹ 3ʹ A replicação pára Reação da DNA Polimerase com dntps síntese de DNA Purina ou
Leia maisSequenciamento de genoma e transcriptomas
Sequenciamento de genoma e transcriptomas Por que seqüenciar genomas? O seqüenciamento de genomas é o primeiro passo para obter uma descrição completa da composição molecular de cada organismo, pois todas
Leia maisComparação de sequências
Comparação de sequências João Carlos Setubal IQ-USP 2013 9/26/2013 J. C. Setubal 1 Referência J.C. Setubal Chapter A05 Similarity Search http://www.ncbi.nlm.nih.gov/books/nbk6831 Motivação: Por que comparar
Leia maisCapítulo 4. Versão 0.7. Alinhamento entre duas sequências
Capítulo 4 Versão 0.7 Alinhamento entre duas sequências Teoria Um dos procedimentos centrais da Bioinformática é o alinhamento entre os monômeros de duas sequências macromoleculares. Ao fazer esse alinhamento,
Leia maisEstrutura covalente de proteínas estrutura tridimensional. Proteina: estrutura covalente com muitas restrições conformacionais
Estrutura covalente de proteínas estrutura tridimensional Proteina: estrutura covalente com muitas restrições conformacionais M. Teresa Machini IQ/USP Análise de sequência de aminoácidos Conteúdo de aminoácidos
Leia maisCap. 6: Métodos para alinhamento de múltiplas seqüências
Cap. 6: Métodos para alinhamento de múltiplas seqüências Organização O que é um alinhamento múltiplo Escores para alinhamentos múltiplos Relação entre alinhamento múltiplo e análise filogenética Métodos
Leia maisPAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE
CONCEITOS EM EPIDEMIOLOGIA E FILOGENIA MOLECULARES PAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE DE
Leia maisUniversidade Federal do Espírito Santo Centro de Ciências da Saúde Programa de Pós-Graduação em Biotecnologia
Universidade Federal do Espírito Santo Centro de Ciências da Saúde Programa de Pós-Graduação em Biotecnologia Mestrandas: Jucimara e Lígia Ramos Disciplina: Bioinformática Vitória 2016 Índice Introdução
Leia maisBases de Dados. Freqüentemente usadas em. Bioinformática
Bases de Dados Freqüentemente usadas em Bioinformática Ana Carolina Q. Simões anakqui@yahoo.com Organização da aula NCBI Translate tool Genome Browser EBI SwissProt KEGG Gene Ontology SMD Revistas relevantes
Leia maisProtein Classification Tool: Uma ferramenta para anotação de proteínas utilizando bases secundárias
João de Abreu e Tôrres Protein Classification Tool: Uma ferramenta para anotação de proteínas utilizando bases secundárias Dissertação apresentada ao Departamento de Ciência da Computação da UFMG como
Leia maisBioinformática DCC/FCUP
Bioinformática DCC/FCUP 2012/2013 Pedro Ribeiro Unidade 3 Alinhamento de Sequências (baseado nos slides de Vítor Costa/DCC-FCUP e Sushmita Roy/UWisconsin) Objectivos desta unidade Homologia Alinhamento
Leia maisEnglish version at the end of this document
English version at the end of this document Ano Letivo 2016-17 Unidade Curricular FUNDAMENTOS DE BIOINFORMÁTICA Cursos CIÊNCIAS BIOMÉDICAS (1.º ciclo) Unidade Orgânica Reitoria - Centro de Novos Projectos
Leia maisBioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica. João Varela
Bioinformática Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica João Varela jvarela@ualg.pt Docentes João Varela (bioinformática: conceitos, bases de dados, aplicações, pesquisa
Leia maisAncoragem de genomas incompletos em genomas completos
Ancoragem de genomas incompletos em genomas completos André Chastel Lima Dissertação de Mestrado Orientação: Prof. Dr. Nalvo Franco de Almeida Junior Área de Concentração: Biologia Computacional Dissertação
Leia maisUNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS BIOLÓGICAS E DA SAÚDE PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA E EVOLUÇÃO
UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS BIOLÓGICAS E DA SAÚDE PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA E EVOLUÇÃO ALINHAMENTO DE SEQÜÊNCIAS BIOLÓGICAS COM O USO DE ALGORITMOS GENÉTICOS Sabrina
Leia maisVIVIAN MAYUMI YAMASSAKI PEREIRA. Reconstrução filogenética de procariotos com base em famílias de genes
UNIVERSIDADE DE SÃO PAULO ESCOLA DE ARTES, CIÊNCIAS E HUMANIDADES PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO VIVIAN MAYUMI YAMASSAKI PEREIRA Reconstrução filogenética de procariotos com base em
Leia maisIntrodução a Bioinformática
Pontifícia Universidade Católica de Goiás Departamento de Biologia Disciplina: Bioinformática Bio1015 Introdução a Bioinformática Prof. Macks Wendhell Gonçalves, Msc mackswendhell@gmail.com EMENTA Introdução
Leia maisAlinhamentos de Múltiplas Seqüências. Rogério T. Brito Orientador: José A. R. Soares
1 Alinhamentos de Múltiplas Seqüências Rogério T. Brito Orientador: José A. R. Soares 2 Motivação Problema em Biologia: saber qual é o grau de parentesco entre um conjunto de espécies (construção de árvores
Leia maisAlinhamento de Sequências de Proteínas. Modelagem por homologia Estratégia/aplicação Etapas do processo Exemplo
Objetivos FFI0776 Modelagem e Engenharia de Proteínas Prof. Rafael V. C. Guido rvcguido@ifsc.usp.br Aula 06 Alinhamento de Sequências de Proteínas Determinação da sequência de aa Características do alinhamento
Leia maisTurma de terça-feira 14 hs. Total: 31 alunos
n. alunos Turma de terça-feira 14 hs 14 Distribuição de notas 12 10 8 6 4 2 Média = 6,7 0 0 -- 2 2 -- 4 4 -- 6 6 -- 8 8 -- 10 notas 18 alunos Total: 31 alunos BANCO DE DADOS BIOLÓGICOS Aula 12 Estudo dirigido
Leia mais1164 BIOLOGIA ESTRUTURAL Aula 4 Prof. Dr. Valmir Fadel
Apesar da grande quantidade de seqüências determinadas (260.175 seqüências e 3.874.166 transcrições no UniProtKB/TrEMBL em 06/03/2007) a quantidade de estruturas tridimensionais determinadas é significativamente
Leia maisDEFINIÇÕES EM EPIDEMIOLOGIA MOLECULAR E CONCEITOS BÁSICOS EM BIOLOGIA MOLECULAR
DEFINIÇÕES EM E DEFINIÇÕES EM E CONCEITOS BÁSICOS EM BIOLOGIA PARA QUE SERVE ESTA AULA 1. DEFINIÇÕES EM CONCEITUAÇÃO DE DIFERENCIAÇÃO ENTRE, TAXONOMIA E FILOGENIA 2. CONCEITOS EM BIOLOGIA APRESENTAR (REVER)
Leia maisBioinformática. João Varela Aulas T7-T8 CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, E ENGENHARIA BIOLÓGICA
Bioinformática CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, E ENGENHARIA BIOLÓGICA João Varela jvarela@ualg.pt Aulas T7-T8 Esquema de anotação Annothaton 1. Determinar a localização das ORFs presentes
Leia maisTranscritômica. João Carlos Setubal IQ/USP outubro de 2013
Transcritômica João Carlos Setubal IQ/USP outubro de 2013 Objetivo Obter, analisar, e interpretar dados de expressão gênica mrnas (que vão virar proteína) RNAs (que não vão virar proteína; ncrnas) O gene
Leia maisExplorando bancos de dados genômicos e introdução à bioinformática. Guilherme Targino Valente Marcos Tadeu Geraldo. Bioinformática
Explorando bancos de dados genômicos e introdução à bioinformática Guilherme Targino Valente Marcos Tadeu Geraldo 22/07/2011 Bioinformática É a aplicação de estatística e ciência da computação no campo
Leia maisAnotação de Genomas. Fabiana G. S. Pinto
Anotação de Genomas Fabiana G. S. Pinto Obtenção de Seqüências geradas pelo MegaBace 1000 Dados brutos (medidas analógicas) de saída do seqüênciamento Base calling BIOINFORMÁTICA * PHRED: - Transforma
Leia maisInstruções 6 Técnicas
Instruções 6 Técnicas ISSN Dezembro, 2001 Campinas, SP Entendendo e Interpretando os Parâmetros Utilizados por BLAST Roberto Hiroshi Higa 1 O advento da tecnologia de obtenção rápida de seqüências de DNA,
Leia maisPredição de novo de genes
Anotação de genomas Predição de novo de genes Conforme vimos na aula anterior o simples seqüenciamento de um genoma de um organismo eucarioto não fornece de modo imediato a informação sobre as proteínas
Leia maisBioinformática. Alinhamento de Sequências. Prof. Msc. Rommel Ramos
Bioinformática Alinhamento de Sequências Prof. Msc. Rommel Ramos 2013 Sumário 1. Comparação de Sequências 2. O que é alinhamento? 3. Tipos de Alinhamento 4. Algoritmos 5. Métodos de Alinhamento Comparação
Leia maisNome da atividade: Identificação de uma proteína a partir da sua seqüência nucleotídica e determinação da sua estrutura e função
Caros Alunos, Para desenvolver a atividade abaixo vocês precisarão de um computador conectado à internet banda larga, do arquivo.txt (bloco de notas) disponível no Constructore e deste arquivo com as coordenadas
Leia maisIACB 1º Semestre de 2014/2015. Exercicios de Preparação para o Teste 1
IACB 1º Semestre de 2014/2015 Exercicios de Preparação para o Teste 1 Introdução (0 ou 1 questão no teste 1) 1. O que é a BioInformática? Resposta: Bioinformática é um campo interdisciplinar que aplica
Leia maisPrograma Analítico de Disciplina BQI460 Bioinformática
0 Programa Analítico de Disciplina Departamento de Bioquímica e Biologia Molecular - Centro de Ciências Biológicas e da Saúde Número de créditos: Teóricas Práticas Total Duração em semanas: 15 Carga horária
Leia maisBusca de motivos em sequências. João Carlos Setubal IQ-USP 2016
Busca de motivos em sequências João Carlos Setubal IQ-USP 2016 Cadeias exatas Podem ser encontradas com o mecanismo de busca de qualquer editor de textos Que algoritmo é executado? O mais simples (e que
Leia maisBusca de motivos em sequências. João Carlos Setubal 2015
Busca de motivos em sequências João Carlos Setubal 2015 Cadeias exatas Podem ser encontradas com o mecanismo de busca de qualquer editor de textos Que algoritmo é executado? O mais simples (e que é muito
Leia maisA ABSTRACÇÃO É NOSSA AMIGA
A ABSTRACÇÃO É NOSSA AMIGA Prever estruturas, comparar e procurar motivos no RNA [Robert Giegerich, Faculty of Technology Bielefeld University, Vienna 2007] Bioinformática DCC - FCUP Teresa Costa 03/06/2011
Leia maisProfa. Dra. Cecília Dias Flores
Profa. Dra. Cecília Dias Flores Regente pela Disciplina de Bioinformática - Curso de Biomedicina Depto. Ciências Exatas e Sociais Aplicadas Coordenadora do curso Informática Biomédica PPG em Ciências da
Leia maisProtein Classification Tool: Uma ferramenta para anotação de proteínas utilizando bases secundárias
João de Abreu e Tôrres Protein Classification Tool: Uma ferramenta para anotação de proteínas utilizando bases secundárias Dissertação apresentada ao Departamento de Ciência da Computação da UFMG como
Leia maisUNIVERSIDADE FEDERAL DE SÃO CARLOS DEFINIÇÃO DO BANCO DE DADOS DOG PARA OBTENÇÃO DE ORTOLOGIA EM MÚLTIPLOS PROTEOMAS ATRAVÉS DO PADRÃO PVOM
UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO DEFINIÇÃO DO BANCO DE DADOS DOG PARA OBTENÇÃO DE ORTOLOGIA EM MÚLTIPLOS PROTEOMAS
Leia maisIntrodução a Bioinformática
Pontifícia Universidade Católica de Goiás Departamento de Biologia Disciplina: Bioinformática Bio1015 Introdução a Bioinformática Prof. Macks Wendhell Gonçalves, Msc mackswendhell@gmail.com EMENTA Introdução
Leia maisBusca em banco de dados
Busca em banco de dados Busca em banco de dados A quantidade imensa de dados existentes nos bancos públicos torna critica a existência de ferramentas eficientes que permitam a recuperação de dados desejados
Leia maisBLAST FERRAMENTA BÁSICA DE LOCALIZAÇÃO DE ALINHAMENTO LOCAL
BLAST FERRAMENTA BÁSICA DE LOCALIZAÇÃO DE ALINHAMENTO LOCAL O algoritmo BLAST e o programa computacional que o implementa foram desenvolvidos, na década de 1980, nos Estados Unidos ( ALTSCHUL et al. 1990)
Leia maisBusca de motivos em sequências. João Carlos Setubal IQ-USP 2014
Busca de motivos em sequências João Carlos Setubal IQ-USP 2014 Motivos do tipo I AACT(G A)N 12 AGTT Q-[LIV]-H-H-[SA]-x(2)-D-G-[FY]-H Chloramphenicol acetyltransferase active site (do PROSITE) Posições
Leia maisMotantagem de Contigs de sequências de genomas e Transcriptomas. Introdução
Motantagem de Contigs de sequências de genomas e Transcriptomas Introdução As novas tecnologias de sequenciamento conseguem produzir uma quantidade de dados muito grande com custos baixos. A velocidade
Leia maisCodificação de Seqüências de Aminoácidos e sua Aplicação na Classificação de Proteínas com Redes Neurais Artificiais. Thiago de Souza Rodrigues
Codificação de Seqüências de Aminoácidos e sua Aplicação na Classificação de Proteínas com Redes Neurais Artificiais Thiago de Souza Rodrigues Universidade Federal de Minas Gerais Instituto de Ciências
Leia maisBANCO DE DADOS BIOLÓGICOS Aula 11
BANCO DE DADOS BIOLÓGICOS Aula 11 Estudo dirigido 1. O que fazer com uma sequência de DNA? 2. Bancos de dados públicos e internacionais: GenBank, ENA, DDBJ; 3. NCBI; EMBL; DDBJ; 4. Sequências completas
Leia maisCONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS Tendo em vista que a busca pela identificação de genes e o estudo das funções da Arabidopsis thaliana que, no ano 2000, foi a primeira planta a ter seu genoma sequenciado muito
Leia maisSequenciamento Montagem Anotação
O GENOMA HUMANO Sequenciamento Montagem Anotação Conceitos Conceitos Sequência bruta: sequências de nucleotídeos originadas de cada inserto clonado (reads) Sequências de final pareado: leituras obtidas
Leia maisCapítulo 6. Alinhamentos múltiplos de sequências macromoleculares.
Capítulo 6. Alinhamentos múltiplos de sequências macromoleculares. versão 0.5 Como vimos no capítulo anterior, o procedimento de alinhamento entre sequências de macromoléculas equivale ao estabelecimento
Leia maisUniversidade Estadual de Maringá - UEM
Universidade Estadual de Maringá - UEM Disciplina: Biologia Molecular 6855 T1 e T2 Ciências Biológicas Transcriptoma metodologia ORESTES Profa. Dra. Maria Aparecida Fernandez Estratégia ORESTES ESTs de
Leia maisUniversidade Federal do Espírito Santo Programa de Pós Graduação em Biotecnologia Bioinformática. Kellyn Joselyn Andino Lopez Mariana Lugon Lima
Universidade Federal do Espírito Santo Programa de Pós Graduação em Biotecnologia Bioinformática Kellyn Joselyn Andino Lopez Mariana Lugon Lima Alinhamento é...... Comparação de sequências oriundas de
Leia maisBioinformática. João Varela Aula T7
Bioinformática C U R S O S E M B I O L O G I A, B I O Q U Í M I C A, B I O T E C N O L O G I A, C I Ê N C I A S B I O M É D I C A S E E N G E N H A R I A B I O L Ó G I C A João Varela jvarela@ualg.pt Aula
Leia maisTécnicas para Comparação e Visualização de Similaridades entre Seqüências Genéticas
Técnicas para Comparação e Visualização de Similaridades entre Seqüências Genéticas Felipe Fernandes Albrecht (FURB/DSC) albrecht@inf.furb.br Resumo. Este artigo apresentará técnicas para comparação e
Leia maisIdentificação de fatores de transcrição a partir de dados de expressão.
Identificação de fatores de transcrição a partir de dados de expressão. Márcio Augusto Afonso de Almeida Laboratório de Genética e Cardiologia Molecular InCor. Introdução Técnicas de expressão global permitem
Leia maisTeoria e Prática de Sistemática Filogenética
Disciplina BOT-99 PPG-BOT-INPA 2015 Teoria e Prática de Sistemática Filogenética Alberto Vicentini alberto.vicentini@inpa.gov.br Mário Henrique Terra Araujo araujo.mht@gmail.com Programa de Pós-Graduação
Leia maisAnálise de dados provenientes de técnicas moleculares
CIIMAR Curso de formação Análise de dados provenientes de técnicas moleculares Formadores: Filipe Pereira e Filipe Lopes Manual do Curso 1 Índice Objetivo Geral do Curso... 3 Público-alvo... 3 Objetivos
Leia maisIBM1029 Introdução à Bioinformática. O Início da Bioinformática 27/03/2017. Aula 2. O Início. Bioionformática: definição
IBM1029 Introdução à Bioinformática Profa Dra Silvana Giuliatti Departamento de Genética FMRP silvana@fmrp.usp.br O Início da Bioinformática Aula 2 O Início Trabalho de Margaret Dayhoff e colaboradores:
Leia maisintrodução ao curso
introdução ao curso http://www.ifsc.usp.br/~rdemarco/ffi0760/ffi0760.htm Cronograma aulas teóricas Aulas teóricas (Segundas-feiras - Sala 146) 30/07-introdução ao curso. 06/08-Busca em bancos de dados
Leia maisCapítulo 8. Versão 0.4. Filogenômica
Capítulo 8 Versão 0.4 Filogenômica O termo "Filogenômica" é definido de várias maneiras, mas, em geral, a definição é relacionada com a intersecção dos campos da Genômica e da evolução biológica. Aqui,
Leia maisAnotação de genomas II
Anotação de genomas II Anotação de genomas Uma vez descrito a seqüência do genoma de um organismo e realizada a anotação dos genes presentes obtemos uma extensa lista de potenciais transcritos. Como vimos
Leia maisComparação de sequências
Comparação de sequências João Carlos Setubal IQ-USP 2014 9/18/2014 J. C. Setubal 1 Esta aula está em www.iq.usp.br/setubal/bmc/2013/bmc.html Alinhamentos e comparações Referência J.C. Setubal Chapter A05
Leia maisANÁLISE ESTRUTURAL IN SILICO
ANÁLISE ESTRUTURAL IN SILICO INTRODUÇÃO Este estudo visa apresentar as bases de dados repositórias de estruturas (primária, terciária e quaternária) de proteínas de diversos organismos e, a partir delas,
Leia maisSequenciamento de genoma e transcriptomas
Sequenciamento de genoma e transcriptomas Durante décadas o método de Sanger foi praticamente a única opção utilizada para sequenciamento de DNA Nos últimos anos surgiram novas tecnologias de sequenciamento
Leia maisComparação de sequências
Comparação de sequências João Carlos Setubal IQ-USP 2016 9/22/2016 J. C. Setubal 1 Motivação Ciccarelli et al, Science, 2006 Como foi possível criar tal árvore? Determinar genes que são compartilhados
Leia mais