Métodos de alinhamento de sequências biológicas. Marcelo Falsarella Carazzolle
|
|
- Adriana Mirandela Sintra
- 7 Há anos
- Visualizações:
Transcrição
1 Métodos de alinhamento de sequências biológicas Marcelo Falsarella Carazzolle
2 Resumo - Introdução - Alinhamentos ótimos - Global - Local (Smith-Waterman) - Semi global - Matrizes de alinhamento (BLOSUM) - Alinhamentos heurísticos - BLAST -PHI-BLAST, PSI-BLAST, MEGABLAST e BLAST2SEQS
3 Introdução? - Uma forma rápida de agregar alguma informação sobre uma sequência desconhecida é compará-la com um banco de dados de sequências com funções conhecidas - Esta comparação é feita através de alinhamentos par a par entre as sequências. Isto é, se o banco de dados possuir 1000 sequências conhecidas serão realizados 1000 alinhamentos
4 - Tipicamente são usados os bancos de dados mundiais (NCBI, EMBL) Fonte: - Atualmente uma busca nesses bancos faz 100,000,000 de alinhamentos
5 - Existem vários programas de alinhamentos com diferentes metodologias, sendo que o mais utilizado é o BLAST
6 Relevância biológica - Essencialmente esses alinhamentos devem tentar indicar uma homologia entre as sequências (ou pelos menos terem uma similaridade estatisticamente significante) - Similaridade x Homologia - identidade = número que indica a quantidade de nucleotídeos alinhados - similaridade = é uma medida que considera a probabilidade do alinhamento ter ocorrido por acaso (e-value). Considera todos os outros possíveis alinhamentos - homologia = similaridade entre sequências que dividem a mesma ancestralidade. Possui um significado evolutivo
7
8 E-value x probabilidade E-v value = 1 x 10-5 = 1e -5 1e -10 1e -50 1e e Probabilidade do alinham mento ocorrer por acaso Quanto maior o banco de dados, maior o e-value
9 Outras aplicações de alinhamentos - Reconstrução da sequência consensu a partir de sobreposições de fragmentos de sequências (montagens de sequências de DNA) - Alinhamento entre sequências de ESTs e DNA genômico - Comparação entre proteínas e DNA - Construção de mapas físicos - Comparação entre genomas -...
10 Alinhamentos - A comparação entre sequências de DNA de organismos diferentes é baseada no conceito de que estes organismos originaram-se de um ancestral comum. - No contexto de evolução as sequências de DNA sofrem mutações. Estas modificações locais entre os nucleotídeos podem ser : - Inserções : inserção de uma base ou várias bases na sequência - Deleções : deleção de uma base ou mais bases na sequência - Substituições : substituição de uma base por outra - Portanto um programa de alinhamento de sequências biológicas tem que considerar essas mutações
11 Exemplo : Gap = -2 Match = 1 Mismatch = -1 - Gaps representam as inserções e deleções entre as sequências - O melhor alinhamento entre duas sequências é aquele que maximiza o score : - Score = #Matchs * (1) + #Mismatch * (-1) + #Gaps * (-2) = = 10
12 - Alinhamento global Modelos para alinhamentos - útil quando as duas sequências tem tamanhos próximos - Exemplo de programa : CLUSTAL - Alinhamento local - útil para alinhamento entre sequências de tamanhos diferentes e também para sequências com apenas alguns trechos conservados - Exemplo de programa : BLAST E FASTA - Alinhamento semi-global (ou pontas livres) - útil para encontrar sobreposições de fragmentos de sequenciamento - Exemplo de programa : PHRAP E CAP3
13 Programação dinâmica - Motivação : gerar e testar o score de todos os possíveis alinhamentos é exponencial no tamanho das seqüências (n n ), onde n é o tamanho das sequências : - Se o alinhamento de 2 sequências de 100 pb leva 1 segundo, o alinhamento de duas sequências de 1000 bp levaria trilhões de anos. - Abordagem alternativa : programação dinâmica. Com programação dinâmica o tempo de processamento e memória ficam quadráticos (n 2 ): - Se o alinhamento de 2 sequências de 100 pb leva 1 segundo, o alinhamento de 2 sequências de 1000 pb leva 100 segundos - Mas ainda não está bom, pois alinhamento de sequências de 10 Mpb (genoma de Saccharomyces) levaria 377 anos
14 Alinhamento global - Alinhamento de GACATTG com GATCAATG 1 a linha e 1 a coluna da matriz são fáceis de computar: - G A C A T T G G -2 A -4 G GA T -6 C -8 A -10 A -12 T -14 G Lembre-se, penalidade de 1 gap = -2 e de dois gaps = -4
15 - G A C A T T G G -2 A -4 T -6 C -8 A -10 A -12 [i,j]=p(i,j) T -14 G Para um elemento da matriz [i,j] qualquer, temos p(i,j) = 1 se for um match e p(i,j) = -1 se for um mismatch.
16 - G A C A T T G G -2 A -4 T -6 C -8 A -10 A -12 T -14 G -16 [i-1,j-1] [i,j-1] [i-1,j] [i,j] = max([i-1,j] - 2, [i-1,j-1] + p(i,j), [i,j-1] - 2) - O valor de [i,j] é definido exclusivamente pelos elementos [i-1,j-1] (diagonal), [i,j-1] (esquerda) e [i-1,j] (acima).
17 - Construindo o alinhamento A 0-2 G C -4-6 A A A C No alinhamento global o alinhamento deve ser construído a partir do extremo da matriz
18 Alinhamento local (Smith-Waterman) - G A C A T T G G 0 A 0 T 0 C 0 A 0 A 0 T 0 G 0 [i-1,j-1] [i,j-1] [i-1,j] [i,j] = max([i-1,j] - 2, [i-1,j-1] + p(i,j), [i,j-1] 2, 0 zero) - No alinhamento local a primeira linha e coluna são inicializadas com zeros e os valores [i,j] da matriz inteira nunca ficam menores que zero
19 No alinhamento local o alinhamento deve ser construído partir do maior score da matriz e para quando encontrar um score=0
20 Alinhamento semi-global - Não penaliza espaços nas extremidades do alinhamento. - Exemplo CAGCA CTTGGATTCTCGC CAGCGTGG No global teríamos, CAGCA CTTGGATTCTCGC CAGC G- T Qual dos dois alinhamentos é mais interessante?
21 - No alinhamento semi-global a primeira linha e coluna são inicializadas com zeros. O resto é igual ao alinhamento global
22 - A abordagem de programação dinâmica é importante pois garante o melhor alinhamento entre duas seguências, mas ainda temos um problema : - Lembram-se disso : se o alinhamento de 2 sequências de 100 pb leva 1 segundo, o alinhamento de sequências de 10 Mpb (genoma de Saccharomyces) leva 377 anos - A abordagem alternativa é conhecida como o método de k-tuplas, no qual não é garantido encontrar o alinhamento ótimo (heurística) mas é significantemente mais rápido. Com esse método os conceitos de alinhamento discutidos acima foram modificados dando origem aos programas de alinhamento local : - BLAST (Basic Local Align Sequence Tool) : Nucleic Acid Research 25 (1990), FASTA : PNAS 85 (1988), Basicamente este método identifica uma série de palavras curtas em uma das sequências (word size) e depois realiza uma busca exata por essas palavras nas sequências a serem comparadas, filtrando assim os possíveis candidatos.
23 Alinhando proteínas - Alinhamento proteína-proteína - Alinhamento nucleotídeo-proteína - Alinhamento proteína-nucleotídeo - Alinhamento nucleotídeo-nucleotídeo (feito em proteínas)
24 Matrizes de substituição - BLOSUM (BLOcks of amino acid SUbstitution Matrix ) - I e V => Hidrofóbicos - D e W => D (carga negativa) e W (aromático) - C => pontes de sulfeto (estrutural)
25 - A matriz foi construída a partir de alinhamentos múltiplos globais de 504 grupos de proteínas - BLOSUM 62 : grupos com similaridade >62% - BLOSUM 80 : grupos com similaridade >80% - BLOSUM 45 : grupos com similaridade >45% Query Length Substitution Matrix <35 PAM PAM BLOSUM-80 >85 BLOSUM-62 PNAS 89 (1992),
26 BLAST Basic Local Alignment Search Tool Algoritmo BLAST (Alstchul et al.; 1990 J. Biol., 215, ) Implementações: NCBI BLAST e WU-BLAST Acesso via web / local (linux) Consulta de seqüências em BDs biológicos (nt ou proteínas) Alinhamento sobreposição de trechos semelhante de duas seqüências (seqs). BLAST traz pontuação e mostra alinhamentos. Similaridade grau de semelhança de seqs num alinhamento. Homologia genes com ancestral comum
27 BDs nucleotídeos, proteínas, domínios, genomas específicos, dados particulares Blastp prot / prot (distantes) Blastn nt / nt (próximos) Blastx nt trad / prot (novas seqs) Tblastn prot / nt trad (regiões não anotadas) Tblastx nt trad / nt trad
28 Query BD Compara Programa nt nt nt blastn nt (trad) aa aa blastx aa aa aa blastp aa nt (trad) aa tblastn nt (trad) nt (trad) aa tblastx Query = formato da seq de entrada. BD = formato das seqs do BD. nt (trad) = seq em nt traduzida pelo programa. Compara = o que é comparado, nucleotídeos (nt) ou aminoácidos (aa). Programa = um dos cinco principais tipos de blast.
29 BLAST interface
30 BLASTp
31 Limita a região da sequência que será usada na consulta Pode ser usado um arquivo com várias sequências gravadas no formato fasta Pode ser colocado várias sequências ao mesmo tempo ou vários GI s (genbank identifier)
32 Filtro por organismo, use o banco de taxonomia do NCBI para ver a forma correta de escrever o organismo Banco de dados de proteínas do NCBI Filtros mais elaborados usando as opções avançadas de busca do NCBI : protease NOT hiv1[organism] => retornará apenas resultados com proteases que não sejam do organismo HIV 1 Banco de dados de proteínas curadas pelo EBI Banco de dados de proteínas com a estrutura tridimensional conhecida
33 Número máximo de sequências alinhadas E-value de corte Número de bases que serão utilizados para formar as k-tuplas Altera as penalidades de criação e extensão de gaps no alinhamento Mascara regiões de repetição
34
35
36 Link Corte 1e -5
37 1 64 query subject
38 BLASTx diferenças importantes Diferentes códigos genéticos para diferentes organismos
39 A mudança no frame de leitura gera a quebra do alinhamento formando dois HSP s (high scoring pair) query subject
40 Pode ser instalado localmente Bancos de dados próprios e atualizações Facilidades Velocidade de buscas Maleabilidade Automatização Dados locais Independe de internet BLAST local
41 PHI-BLAST - É um blastp com a opção de passar uma outra sequência curta ou um padrão servindo como um vínculo para a consulta N - Qualquer nucleotídeo N(3) - Uma sequência de três nucleotídeos N(2,4) - Uma sequência de 2,3 ou 4 nucleotídeos [AC] - pode ser um A ou um C {AG} - não pode ser nem A e nem G Ex : [CG](5)TG{A}N(1,5)C
42 PSI-BLAST - É um blastp interativo no qual a matriz (BLOSUM), após a primeira interação, é refeita com base nos alinhamentos entre as proteínas resultantes da consulta : - uma posicão conservada no alinhamento recebe um score alto e uma posição não conservada um score baixo - É útil para encontrar membros distantes de famílias de proteínas
43 BL2SEQS - Faz um alinhamento de uma sequência contra a outra (blastn/blastx/blastp/tblastx/tblastn) -
44 Spliced alignments
45 Alinhamento de genomas
46 FIM
Alinhamento local- Utilização do BLAST
Alinhamento local- Utilização do BLAST BLAST Tipos de BLAST (blastn) Compara nucleotídeos (blastp) Compara proteínas Utiliza nucleotídeo como query, este é traduzido nos seus 6 quadros de leitura e é comparado
Leia maisAlinhamento de sequências
Pontifícia Universidade Católica de Goiás Departamento de Biologia Alinhamento de sequências Prof. Macks Wendhell Gonçalves, Msc mackswendhell@gmail.com Definição O alinhamento de sequências consiste no
Leia maisProgramas de Alinhamento. Sumário
Programas de Alinhamento Departamento de Genética FMRP- USP Alynne Oya Chiromatzo alynne@lgmb.fmrp.usp.br Sumário Introdução para buscas em base de dados Fasta Blast Programa para alinhamento Clustal 1
Leia maisPrincipais algoritmos de alinhamento de sequências genéticas. Alexandre dos Santos Cristino
Principais algoritmos de alinhamento de sequências genéticas Alexandre dos Santos Cristino http://www.ime.usp.br/~alexsc e-mail: alexsc@ime.usp.br Definição de alinhamento de sequências Comparação de duas
Leia maisAlinhamentos de sequências e Busca de Similaridade
Alinhamentos de sequências e Busca de Similaridade Ariane Machado Lima ariane.machado@usp.br Escola de Artes, Ciências e Humanidades - USP Contexto http://www.ekac.org/gene.html http://www.fuzzco.com/news/wp-content/uploads/27//genome.jpg
Leia maisAlinhamentos e Busca de Similaridade. Ariane Machado Lima
Alinhamentos e Busca de Similaridade Ariane Machado Lima Busca de identidade Identificar o que é determinada seqüência Ex.acabou de seqüenciar, seria contaminante? Outras fases de um projeto de seqüenciamento
Leia maisAlinhamento de seqüências
Alinhamento de seqüências Qual a importância do alinhamento de seqüências Permite estabelecer identidades entre sequências Permite a dedução de função de proteínas baseado em similaridade Permite a definição
Leia maisDezembro - 2006. Bioinformática. e Anotação. Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP
Dezembro - 2006 Bioinformática e Anotação Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Hoje 1. Introdução à Genômica 2. Introdução à Bioinformática 3. Introdução à Anotação
Leia maisIdentificação de genes por similaridade de seqüência
Identificação de genes por similaridade de seqüência Evolução do genoma Os genes evoluem a partir de genes ancestrais comuns acumulando mutações Homologia Genes ancestrais estão presentes nas espécies
Leia maisalinhamento global-alinhamento múltiplo de seqüências
alinhamento global-alinhamento múltiplo de seqüências Alinhamento múltiplos de seqüências Qual a importância de se realizar alinhamentos múltiplos em oposição a alinhamentos em pares? Alinhamento múltiplos
Leia maisElisa Boari de Lima Orientador: Thiago de Souza Rodrigues
Uma Metodologia para Identificação de Módulos Formadores de Sequências de Proteínas Mosaicas do Trypanosoma cruzi a partir do Transcriptoma do Parasito Utilizando a Ferramenta BLAST Elisa Boari de Lima
Leia maisComparação entre sequências biológicas
Comparação entre sequências biológicas Extraíndo e analisando os sinais contidos em biopolímeros ( Alinhamentos ) Prof. Dr. Alessandro Varani UNESP - FCAV Objetivos Abordagens práticas para comparação
Leia maisTópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro
Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven/C. David Page para BMI/CS 576,
Leia maisNada em Biologia faz sentido senão à luz da evolução.
Marcos T. Geraldo ADAPTABILIDADE Nada em Biologia faz sentido senão à luz da evolução. Theodosius Dobzhansky (1973) 1 Processo de evolução em moléculas de DNA, RNA e proteínas Reconstrução das relações
Leia maisAnálise de significância de. alinhamentos
Análise de significância de alinhamentos Análise de significância de um alinhamento Tão importante como escolher o método de scoring ou encontrar o alinhamento que maximiza o score é saber avaliar a significância
Leia maisBioinformática. Alinhamento de Sequências. Prof. Msc. Rommel Ramos
Bioinformática Alinhamento de Sequências Prof. Msc. Rommel Ramos 2013 Sumário 1. Comparação de Sequências 2. O que é alinhamento? 3. Tipos de Alinhamento 4. Algoritmos 5. Métodos de Alinhamento Comparação
Leia mais2 Contexto e Motivações
2 Contexto e Motivações Existem duas principais famílias de algoritmos que realizam comparações de biosseqüências, a FASTA (Pearson, 1991) e a BLAST (Altschul et al., 1990). Estas ferramentas realizam
Leia maisAlinhamento de Seqüências
18 CAPÍTULO 3 Alinhamento de Seqüências 3.1. Introdução O alinhamento de seqüências consiste no processo de comparar duas seqüências (de nucleotídeos ou proteínas) de forma a se observar seu nível de identidade.
Leia maisTurma de terça-feira 14 hs. Total: 31 alunos
n. alunos Turma de terça-feira 14 hs 14 Distribuição de notas 12 10 8 6 4 2 Média = 6,7 0 0 -- 2 2 -- 4 4 -- 6 6 -- 8 8 -- 10 notas 18 alunos Total: 31 alunos BANCO DE DADOS BIOLÓGICOS Aula 12 Estudo dirigido
Leia maisAlinhamento de Sequências e Genômica Comparativa
Encontro França-Brasil de Bioinformática Universidade Estadual de Santa Cruz (UESC) Ilhéus-BA - Brasil Alinhamento de Sequências e Genômica Comparativa Maria Emília M. T. Walter Departamento de Ciência
Leia maisBioinformática para o Citrus EST Project (CitEST)
Bioinformática para o Citrus EST Project (CitEST) Marcelo da Silva Reis 1 1 Instituto de Matemática e Estatística, Universidade de São Paulo 20 de maio de 2009 Organização da Apresentação Esta apresentação
Leia maisBases de Dados. Freqüentemente usadas em. Bioinformática
Bases de Dados Freqüentemente usadas em Bioinformática Ana Carolina Q. Simões anakqui@yahoo.com Organização da aula NCBI Translate tool Genome Browser EBI SwissProt KEGG Gene Ontology SMD Revistas relevantes
Leia maisBusca em banco de dados
Busca em banco de dados Busca em banco de dados A quantidade imensa de dados existentes nos bancos públicos torna critica a existência de ferramentas eficientes que permitam a recuperação de dados desejados
Leia maisBusca em banco de dados
Busca em banco de dados Busca em banco de dados A quantidade imensa de dados existentes nos bancos públicos torna critica a existência de ferramentas eficientes que permitam a recuperação de dados desejados
Leia maisProtein Homology detection by HMM-comparation.
UNIVERSIDADE FEDERAL DE PERNAMBUCO Cin Centro de Informática Pós-Graduação em Ciência da Computação Protein Homology detection by HMM-comparation. Johannes Soding Vol. 21 no. 7 2005, BIOINFORMATICS Recife,
Leia maisBANCO DE DADOS BIOLÓGICOS Aula 11
BANCO DE DADOS BIOLÓGICOS Aula 11 Estudo dirigido 1. O que fazer com uma sequência de DNA? 2. Bancos de dados públicos e internacionais: GenBank, ENA, DDBJ; 3. NCBI; EMBL; DDBJ; 4. Sequências completas
Leia mais3 Análise do programa BlastP
27 3 Análise do programa BlastP Este capítulo inicia-se com a apresentação das principais características do programa BLAST e continua com uma visão detalhada da implementação do NCBI-BLAST. Também será
Leia maisBioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica. João Varela
Bioinformática Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica João Varela jvarela@ualg.pt Docentes João Varela (bioinformática: conceitos, bases de dados, aplicações, pesquisa
Leia maisBioinformática. João Varela Aulas T7-T8 CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, E ENGENHARIA BIOLÓGICA
Bioinformática CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, E ENGENHARIA BIOLÓGICA João Varela jvarela@ualg.pt Aulas T7-T8 Esquema de anotação Annothaton 1. Determinar a localização das ORFs presentes
Leia maisMarcelo Reis. Centro APTA Citros Sylvio Moreira. 18 de julho de 2007
I n t r o d u ç ã o à B i o i n f o r m á t i c a Marcelo Reis Centro APTA Citros Sylvio Moreira 18 de julho de 2007 Duração estimada: ~ 2,5h (manhã) ~ 2,5h (tarde) A g e n d a Manhã: Que trem é esse,
Leia maisUniversidade Estadual de Maringá - UEM
Universidade Estadual de Maringá - UEM Disciplina: Biologia Molecular 6855 T1 e T2 Ciências Biológicas Transcriptoma metodologia ORESTES Profa. Dra. Maria Aparecida Fernandez Estratégia ORESTES ESTs de
Leia maisAnotação de Genomas. Fabiana G. S. Pinto
Anotação de Genomas Fabiana G. S. Pinto Obtenção de Seqüências geradas pelo MegaBace 1000 Dados brutos (medidas analógicas) de saída do seqüênciamento Base calling BIOINFORMÁTICA * PHRED: - Transforma
Leia maisTutorial Introdução a anotação e comparação de genomas Tiago Mendes Doutorando em Bionformática
Tutorial Introdução a anotação e comparação de genomas Tiago Mendes Doutorando em Bionformática Hoje iremos trabalhar com dois programas free desenvolvidos pelo Sanger institute: Artemis e ACT. Artemis
Leia maisBanco de Dados Biológicos
Pontifícia Universidade Católica de Goiás Departamento de Biologia Disciplina: Bioinformática Bio1015 Banco de Dados Biológicos Prof. Macks Wendhell Gonçalves, Msc mackswendhell@gmail.com INTRODUÇÃO BANCO
Leia maisExplorando bancos de dados genômicos e introdução à bioinformática. Guilherme Targino Valente Marcos Tadeu Geraldo. Bioinformática
Explorando bancos de dados genômicos e introdução à bioinformática Guilherme Targino Valente Marcos Tadeu Geraldo 22/07/2011 Bioinformática É a aplicação de estatística e ciência da computação no campo
Leia maisIdentificação de Padrões em Proteínas Utilizando a Ferramenta de Bioinformática CD- Search
4ª Jornada Científica e Tecnológica e 1º Simpósio de Pós-Graduação do IFSULDEMINAS 16, 17 e 18 de outubro de 2012, Muzambinho MG Identificação de Padrões em Proteínas Utilizando a Ferramenta de Bioinformática
Leia maisPAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE
CONCEITOS EM EPIDEMIOLOGIA E FILOGENIA MOLECULARES PAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE DE
Leia maisBioinformática: QBQ-5722 Anotação Artemis: Passo-a-passo. Prof. Dr. João Carlos Setubal
Bioinformática: QBQ-5722 Anotação Artemis: Passo-a-passo Prof. Dr. João Carlos Setubal Na área de trabalho, dentro da pasta QBQ2507, dê um duplo clique no ícone Artemis; O Artemis será carregado. Clique
Leia maisInstituto Superior de Ciências da Saúde-Norte Curso de Bioquímica 2ºAno Projecto Tutorial BIOINFORMÁTICA
Instituto Superior de Ciências da Saúde-Norte Curso de Bioquímica 2ºAno Projecto Tutorial 2006-2007 BIOINFORMÁTICA Bioinformática PROJECTO TUTORIAL YFP YOUR FAVORITE PROTEIN Introdução A bioinformática
Leia maisTranscritômica. João Carlos Setubal IQ/USP outubro de 2013
Transcritômica João Carlos Setubal IQ/USP outubro de 2013 Objetivo Obter, analisar, e interpretar dados de expressão gênica mrnas (que vão virar proteína) RNAs (que não vão virar proteína; ncrnas) O gene
Leia maisExplorando genomas: predição de genes e elementos transponíveis Proporção de diferentes sequências no genoma
Explorando genomas: predição de genes e elementos transponíveis Proporção de diferentes sequências no genoma 1 Especies Genoma Genes 11 O número de genes varia entre as espécies 2 Anotação do Genoma 1
Leia maisMIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin
MIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin Orientador: Prof. Dr. Ricardo Rodrigues Ciferri Agenda Introdução Bancos de dados
Leia maisALINHAMENTO DE SEQUÊNCIAS
Disciplina de BIOLOGIA COMPUTACIONAL Mestrado em ENGENHARIA BIOMÉDICA 4º Ano, 1º Semestre 2007/08 ALINHAMENTO DE SEQUÊNCIAS Relatório 2 Ana Calhau Ângela Pisco Nuno Santos 54605 55748 55746 Palavras-Chave:
Leia maisTITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO DE GRADUAÇÃO
1 U NIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2 0 1 6. 1 TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO
Leia mais2 Contexto Biológico Genômica
15 2 Contexto Biológico Neste capítulo abordaremos o contexto biológico para o entendimento deste trabalho. Serão abordados os aspectos gerais da genômica, expostos os processos do sequenciamento genético
Leia maisUniversidade Federal de Pelotas Faculdade de Agronomia Eliseu Maciel Programa de Pós-Graduação em Agronomia CENTRO DE GENOMICA E FITOMELHORAMENTO
Universidade Federal de Pelotas Faculdade de Agronomia Eliseu Maciel Programa de Pós-Graduação em Agronomia CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática Professores: Luciano Maia Antonio
Leia maisA matemática e o genoma. Resumo
I Coloquio Regional da Região Centro-Oeste, 3 a 6 de novembro de 2009 Universidade Federal de Mato Grosso do Sul Mini-curso A matemática e o genoma Nalvo F. Almeida Jr. Resumo Os avanços da biotecnologia
Leia maisTópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro
Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven para BMI/CS 576, UW-Madison
Leia maisAlinhamentos de Múltiplas Seqüências. Rogério T. Brito Orientador: José A. R. Soares
1 Alinhamentos de Múltiplas Seqüências Rogério T. Brito Orientador: José A. R. Soares 2 Motivação Problema em Biologia: saber qual é o grau de parentesco entre um conjunto de espécies (construção de árvores
Leia maisAlinhamento de Seqüências Biológicas
O que se cmpara? Alinhament de Seqüências Bilógicas A cmparaçã de seqüências de DNA, RNA e prteínas é uma das bases da biinfrmática. Citsina Uracila Timina Prfª Drª Silvana Giuliatti Departament de Genética
Leia maisBioinformática e Genética Animal. Pâmela A. Alexandre Doutoranda
Bioinformática e Genética Animal Pâmela A. Alexandre Doutoranda Descoberta da estrutura do DNA» Watson e Crick, 1953 DNA RNA Proteína Projeto Genoma Humano» 1990» 18 países» US$ 2,7 Bi» 13 anos (previsão
Leia maisEste capítulo possui uma discussão preliminar do contexto biológico necessário para o entendimento e motivação deste trabalho.
17 2 Preliminares Este capítulo possui uma discussão preliminar do contexto biológico necessário para o entendimento e motivação deste trabalho. Na discussão do contexto biológico serão apresentados os
Leia maisMARCADORES MOLECULARES
ESALQ/USP MARCADORES MOLECULARES Base genética dos marcadores e usos no melhoramento de plantas e em estudos de diversidade genética e conservação Departamento de Genética ESTUDO DIRIGIDO 1. O que são
Leia maisDEFINIÇÕES EM EPIDEMIOLOGIA MOLECULAR E CONCEITOS BÁSICOS EM BIOLOGIA MOLECULAR
DEFINIÇÕES EM E DEFINIÇÕES EM E CONCEITOS BÁSICOS EM BIOLOGIA PARA QUE SERVE ESTA AULA 1. DEFINIÇÕES EM CONCEITUAÇÃO DE DIFERENCIAÇÃO ENTRE, TAXONOMIA E FILOGENIA 2. CONCEITOS EM BIOLOGIA APRESENTAR (REVER)
Leia maisCapítulo 10. versão 0.5. Estrutura de ácidos nucleicos
Capítulo 10 versão 0.5 Estrutura de ácidos nucleicos Todos os livros de biologia molecular, em qualquer nível, mostram em detalhes a estrutura "Watson e Crick cis" do DNA, onde duas fitas polinucleotídicas
Leia mais3 Uma Ontologia para Sistemas de Gerência de Análises em Biossequências 3.1 Introdução
3 Uma Ontologia para Sistemas de Gerência de Análises em Biossequências 3.1 Introdução Este capítulo apresenta uma ontologia que direciona o sistema de gerência de análises em biossequências. Serão tratados
Leia maisDados Moleculares x Morfológicos
Evolução Molecular Dados Moleculares x Morfológicos Hereditários Descrição não ambígua Mais fácil estabelecer homologia Permite comparações de espécies distantes Abundantes Fatores ambientais Diferenças
Leia maisANÁLISE DE TANDEM REPEATS CODIFICANTES EM GENOMAS BACTERIANOS
5ª Jornada Científica e Tecnológica e 2º Simpósio de Pós-Graduação do IFSULDEMINAS 06 a 09 de novembro de 2013, Inconfidentes/MG ANÁLISE DE TANDEM REPEATS CODIFICANTES EM GENOMAS BACTERIANOS Vinícius A.
Leia maisMARCADORES MOLECULARES: DO MELHORAMENTO A CONSERVAÇÃO. Aula 10. Maria Carolina Quecine Departamento de Genética
MARCADORES MOLECULARES: DO MELHORAMENTO A CONSERVAÇÃO Aula 10 LGN232 Genética Molecular Maria Carolina Quecine Departamento de Genética mquecine@usp.br RELEMBRANDO. kit de genética molecular ENZIMAS DE
Leia maisBioinformática Aplicada ao Estudo e Análise de Genes e Genomas. Prof. Dr. Alessandro de M. Varani Dep. de Tecnologia - UNESP, FCAV
Bioinformática Aplicada ao Estudo e Análise de Genes e Genomas Prof. Dr. Alessandro de M. Varani Dep. de Tecnologia - UNESP, FCAV Conteúdo Introdução ao GenBank; Introdução ao GOLD (Genomes Online) Database;
Leia maisTópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro
Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven/C. David Page para BMI/CS 576,
Leia maisBiologia Molecular Computacional Homologia
Biologia Molecular Computacional Homologia Luiz Thibério Rangel O que é homologia? Conceito básico para estudos de genômica comparativa; Passo inicial para estudos de filogenia(omica); Importante para
Leia maisBLAST FERRAMENTA BÁSICA DE LOCALIZAÇÃO DE ALINHAMENTO LOCAL
BLAST FERRAMENTA BÁSICA DE LOCALIZAÇÃO DE ALINHAMENTO LOCAL O algoritmo BLAST e o programa computacional que o implementa foram desenvolvidos, na década de 1980, nos Estados Unidos ( ALTSCHUL et al. 1990)
Leia maisDocumentos. ISSN 0102-0110 Dezembro, 2007 224. O programa BLAST: guia prático de utilização
Documentos ISSN 0102-0110 Dezembro, 2007 224 X O programa BLAST: guia prático de utilização ISSN 0102 0110 Dezembro, 2007 Empresa Brasileira de Pesquisa Agropecuária Embrapa Recursos Genéticos e Biotecnologia
Leia maisUNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS BIOLÓGICAS E DA SAÚDE PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA E EVOLUÇÃO
UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS BIOLÓGICAS E DA SAÚDE PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA E EVOLUÇÃO ALINHAMENTO DE SEQÜÊNCIAS BIOLÓGICAS COM O USO DE ALGORITMOS GENÉTICOS Sabrina
Leia maisNome da atividade: Identificação de uma proteína a partir da sua seqüência nucleotídica e determinação da sua estrutura e função
Caros Alunos, Para desenvolver a atividade abaixo vocês precisarão de um computador conectado à internet banda larga, do arquivo.txt (bloco de notas) disponível no Constructore e deste arquivo com as coordenadas
Leia maisCap. 6: Métodos para alinhamento de múltiplas seqüências
Cap. 6: Métodos para alinhamento de múltiplas seqüências Organização O que é um alinhamento múltiplo Escores para alinhamentos múltiplos Relação entre alinhamento múltiplo e análise filogenética Métodos
Leia maisEstrutura covalente de proteínas estrutura tridimensional. Proteina: estrutura covalente com muitas restrições conformacionais
Estrutura covalente de proteínas estrutura tridimensional Proteina: estrutura covalente com muitas restrições conformacionais M. Teresa Machini IQ/USP Análise de sequência de aminoácidos Conteúdo de aminoácidos
Leia maisComparação e alinhamento de. sequências
Comparação e alinhamento de sequências Comparar sequências A comparação de sequências de proteínas ou DNA/RNA é uma ferramenta essencial na procura da existência de relações de semelhança entre o todo
Leia maisBioJava. Análise e breve comparação com outras Bio* frameworks. Rui Marques. Bioinformática - MIERSI. Faculdade de Ciências da Universidade do Porto
BioJava Análise e breve comparação com outras Bio* frameworks Rui Marques Bioinformática - MIERSI Faculdade de Ciências da Universidade do Porto up030307060@alunos.dcc.fc.up.pt BioJava Criado em 1999 por
Leia maisResumo - capítulo 3 - Alinhamento de pares de sequências
Resumo - capítulo 3 - Alinhamento de pares de sequências Pedro Ivo Gomes de Faria Sumário 1 Introdução 3 1.1 Definição de alinhamento de sequências............. 3 1.1.1 Alinhamento global....................
Leia maisIACB 1º Semestre de 2014/2015. Exercicios de Preparação para o Teste 1
IACB 1º Semestre de 2014/2015 Exercicios de Preparação para o Teste 1 Introdução (0 ou 1 questão no teste 1) 1. O que é a BioInformática? Resposta: Bioinformática é um campo interdisciplinar que aplica
Leia maisBioinformática DCC/FCUP
Bioinformática DCC/FCUP 2012/2013 Pedro Ribeiro Unidade 3 Alinhamento de Sequências (baseado nos slides de Vítor Costa/DCC-FCUP e Sushmita Roy/UWisconsin) Objectivos desta unidade Homologia Alinhamento
Leia maisBioinformática aplicada ao estudo e análise de Genes e Genomas Aula Teórico e Prá/ca
Bioinformática aplicada ao estudo e análise de Genes e Genomas Aula Teórico e Prá/ca Prof. Dr. Alessandro de M. Varani Dep. de Tecnologia - UNESP, FCAV Conteúdo da Aula de Hoje Introdução ao GenBank; GOLD
Leia maisCapítulo 4. Versão 0.7. Alinhamento entre duas sequências
Capítulo 4 Versão 0.7 Alinhamento entre duas sequências Teoria Um dos procedimentos centrais da Bioinformática é o alinhamento entre os monômeros de duas sequências macromoleculares. Ao fazer esse alinhamento,
Leia maisAnálise de dados provenientes de técnicas moleculares
CIIMAR Curso de formação Análise de dados provenientes de técnicas moleculares Formadores: Filipe Pereira e Filipe Lopes Manual do Curso 1 Índice Objetivo Geral do Curso... 3 Público-alvo... 3 Objetivos
Leia maisTutorial Introdução a anotação e comparação de genomas Tiago Mendes Doutorando em Bionformática
Tutorial Introdução a anotação e comparação de genomas Tiago Mendes Doutorando em Bionformática Hoje iremos trabalhar com dois programas free desenvolvidos pelo Sanger institute: Artemis e ACT. Artemis
Leia maisMontagem de regiões gênicas
Montagem de regiões gênicas Pedro Ivo Gomes de Faria Departamento de Ciência da Computação Instituto de Matemática e Estatística Universidade de São Paulo Orientador: Prof. Dr. Alan Durham Pedro Ivo Gomes
Leia maisMotantagem de Contigs de sequências de genomas e Transcriptomas. Introdução
Motantagem de Contigs de sequências de genomas e Transcriptomas Introdução As novas tecnologias de sequenciamento conseguem produzir uma quantidade de dados muito grande com custos baixos. A velocidade
Leia mais3 Similaridade e tamanho da seqüência de consulta no BLAST
3 Similaridade e tamanho da seqüência de consulta no BLAST Quando se planeja construir aplicativos que utilizam um agrupamento de computadores no intuito de paralelizar ou distribuir processamento, se
Leia maisProtein Classification Tool: Uma ferramenta para anotação de proteínas utilizando bases secundárias
João de Abreu e Tôrres Protein Classification Tool: Uma ferramenta para anotação de proteínas utilizando bases secundárias Dissertação apresentada ao Departamento de Ciência da Computação da UFMG como
Leia maisProf. Marcelo Langer. Curso de Biologia. Aula 26 Genética
Prof. Marcelo Langer Curso de Biologia Aula 26 Genética MATERIAL GENÉTICO A primeira atividade é a de orientação do DNA para formar a proteína, que será responsável pela característica genética. DNA é
Leia maisProf. João Carlos Setubal
Prof. João Carlos Setubal QBQ 102 Aula 5 (biomol) Sequenciamento de DNA, genomas e bioinformática Replicação de DNA 5ʹ 3ʹ A replicação pára Reação da DNA Polimerase com dntps síntese de DNA Purina ou
Leia maisA Biologia na Era da Computação. Hugo Brandão Uchôa Laboratório de Sistemas Biomoleculares IBILCE-UNESP
A Biologia na Era da Computação Hugo Brandão Uchôa Laboratório de Sistemas Biomoleculares IBILCE-UNESP Tópicos Motivação Áreas da Computação Parmodel BioLinux MyODB Conclusão Motivação Grande desenvolvimento
Leia maisIDENTIFICAÇÃO ESTRUTURAL EM REDES DE PROTEÍNAS
IDENTIFICAÇÃO ESTRUTURAL EM REDES DE PROTEÍNAS Tópicos Especiais em Redes Complexas II Professor: Daniel Ratton Figueiredo Aluno: Vitor Borges Coutinho da Silva Artigos Comparative Analysis of Protein
Leia mais1164 BIOLOGIA ESTRUTURAL Aula 4 Prof. Dr. Valmir Fadel
Apesar da grande quantidade de seqüências determinadas (260.175 seqüências e 3.874.166 transcrições no UniProtKB/TrEMBL em 06/03/2007) a quantidade de estruturas tridimensionais determinadas é significativamente
Leia maisIdentificação de fatores de transcrição a partir de dados de expressão.
Identificação de fatores de transcrição a partir de dados de expressão. Márcio Augusto Afonso de Almeida Laboratório de Genética e Cardiologia Molecular InCor. Introdução Técnicas de expressão global permitem
Leia maisPrograma Analítico de Disciplina BQI460 Bioinformática
0 Programa Analítico de Disciplina Departamento de Bioquímica e Biologia Molecular - Centro de Ciências Biológicas e da Saúde Número de créditos: Teóricas Práticas Total Duração em semanas: 15 Carga horária
Leia maisPrograma de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas. Seleção de Mestrado 2012-A
Programa de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas Seleção de Mestrado 2012-A INSTRUÇÕES (LEIA ATENTAMENTE ANTES DE PREENCHER A PROVA): a. Identifique sua prova unicamente com
Leia maisUFPel CDTec Biotecnologia. Anotação de genomas. MSc. Frederico schmitt Kremer
UFPel CDTec Biotecnologia Anotação de genomas MSc. Frederico schmitt Kremer A anotação de um genoma consiste na identificação de suas regiões funcionais ou de relevância biológico, o que pode incluir:
Leia maisComparação e alinhamento de sequências
Comparação e alinhamento de sequências Comparar sequências A comparação de sequências de proteínas ou DNA/RNA é uma ferramenta essencial na procura da existência de relações de semelhança entre o todo
Leia maisProfa. Dra. Cecília Dias Flores
Profa. Dra. Cecília Dias Flores Regente pela Disciplina de Bioinformática - Curso de Biomedicina Depto. Ciências Exatas e Sociais Aplicadas Coordenadora do curso Informática Biomédica PPG em Ciências da
Leia mais- Sequenciamento de genomas nada mais é que a determinação da ordem linear dos nucleotídeos ou bases nitrogenadas de um genoma.
Sequenciamento de genomas - Sequenciamento de genomas nada mais é que a determinação da ordem linear dos nucleotídeos ou bases nitrogenadas de um genoma. O sequenciamento de um genoma é geralmente referido
Leia maisSequenciamento Montagem Anotação
O GENOMA HUMANO Sequenciamento Montagem Anotação Conceitos Conceitos Sequência bruta: sequências de nucleotídeos originadas de cada inserto clonado (reads) Sequências de final pareado: leituras obtidas
Leia maisInstruções 6 Técnicas
Instruções 6 Técnicas ISSN Dezembro, 2001 Campinas, SP Entendendo e Interpretando os Parâmetros Utilizados por BLAST Roberto Hiroshi Higa 1 O advento da tecnologia de obtenção rápida de seqüências de DNA,
Leia maisPrincípios de Sistemática Molecular
! Ciências teóricas e sistemática biológica "! DNA, genes, código genético e mutação! Alinhamento de seqüências! Mudanças evolutivas em seqüências de nucleotídeos! Otimização em espaços contínuos e discretos!
Leia maisBioinformática. iphy Sistema de Apoio à filógenética para a análise de supermatrizes. Trabalho realizado por: João Pedro Teixeira
Bioinformática iphy Sistema de Apoio à filógenética para a análise de supermatrizes Trabalho realizado por: João Pedro Teixeira 1 Bioinformática Objectivo do trabalho Análise de um artigo sobre um software
Leia maisIBM1029 Introdução à Bioinformática. O Início da Bioinformática 27/03/2017. Aula 2. O Início. Bioionformática: definição
IBM1029 Introdução à Bioinformática Profa Dra Silvana Giuliatti Departamento de Genética FMRP silvana@fmrp.usp.br O Início da Bioinformática Aula 2 O Início Trabalho de Margaret Dayhoff e colaboradores:
Leia maisIntrodução a Bioinformática Curso de Verão Nivelamento na área de Biológicas
Introdução a Bioinformática Curso de Verão 2011 Nivelamento na área de Biológicas 1 O que é genoma? Um genoma é o DNA completo de um organismo, incluindo os genes. Os genes levam a informação para produzir
Leia mais