Alinhamento local- Utilização do BLAST

Tamanho: px
Começar a partir da página:

Download "Alinhamento local- Utilização do BLAST"

Transcrição

1 Alinhamento local- Utilização do BLAST

2 BLAST

3 Tipos de BLAST (blastn) Compara nucleotídeos (blastp) Compara proteínas Utiliza nucleotídeo como query, este é traduzido nos seus 6 quadros de leitura e é comparado contra banco de proteína Utiliza proteína como query, esta é comparada contra banco de nucleotídeo traduzido nos 6 quadros de leitura Utiliza nucleotídeo como query, este é traduzido nos seus 6 quadros de leitura e é comparado contra banco de nucleotídeo traduzido nos 6 quadros de leitura

4 Submissão de seqüências Blastn Seqüência a ser alinhada ou numero de acesso Bases de dados Busca por palavra chave Programa Megablast + rapido

5 Parâmetros do blastn Programa: Megablast utiliza seeds maiores (28 bases) fazendo com que o algoritmo seja mais rápido Discontiguos megablast- Utiliza seeds maiores, mas exige que apenas algumas bases sejam coincidentes dentro de um padrão definido. Blastn- seeds menores (11 bases, podendo ser ajustado ate 7 bases). Mais sensível mas também mais lento

6 Parâmetros do blastn Max Target sequences- Numero de alinhamentos mostrados Short queries- Ajuste automático de parâmetros para seqüências pequenas Expect threshold- Ajuste da exigência mínima de relevância estatistica para seqüência ser mostrada Word size- Tamanho do seed

7 Parâmetros do blastn Match/Mismatch scores- escores para alinhamento coreto e incorreto Gap costs- Penalização para abertura de gaps Filtros- Filtragem de região de baixa complexidade ou repetições Mascaras- Filtragem de seqüências para busca dos seeds e mascaramento dado pelo usuario

8 Interpretação do resultado do blast

9 Interpretação do resultado do blast Accesion Numero de acesso para seqüência alinhada Description- Descrição breve da seqüência Max score- escore máximo resultante de um único HSPs (High-scoring Segment Pairs) Total score- Escore resultante da soma de HSPs Query coverage- Porcentagem da seqüência submetida ao programa que é coberta pelo alinhamento E-value- Parâmetro de confiança Max identity- Identidade máxima obtida por um HSP

10 Escore do blast Escore do blast O escore do blast é normalizado e é dado pela seguinte equação: l e K são parâmetros estatísticos utilizados utilizada que buscam normalizar os escores de resultados derivados de diferentes matrizes e espaços de busca

11 expected value (e-value) Parâmetro de confiança do alinhamento Onde E = expect value m e n-tamanho das seqüências alinhadas S - escore normalizado

12 Relação entre e-value e p-value E p

13 Interpretação de e-value O e-value permite-nos ter uma idéia de quão significativos são os alinhamentos que obtemos. Entretanto a interpretação de um resultado nem sempre é trivial e muitas vezes dependo do que o usuário busca (definição de função, busca de motivos conservados, etc..) e também do tamanho da seqüência submetida (seqüências muito pequenas nunca obterão um e-value muito baixo mesmo obtendo um alinhamento perfeito) O fato de termos um e-value significativo não implica que necessariamente podemos postular a função de uma proteína, pois em alguns casos isso reflete meramente a conservação de algum motivo ou domínio que podem esta presentes em proteínas com funções diversas

14 Interpretação do resultado do blast Traços verticais representam identidade entre nucleotídeos Letras minúsculas em cinza representam trechos mascarados Traços horizontais representam gaps Query- seqüência submetida ao programa Subject- seqüência do banco de dados alinhada a seqüência submetida

15 Interpretação do resultado do blast Resultado tem dois HSPs (High-scoring Segment Pairs), estatísticas para cada um deles é dada.

16 Submissão de seqüências Blastp Basicamente o mesmo que o blastn Podem ser utilizados 3 programas: Blastp- algoritimo normal PSI-Blast- Matriz modificada PHI-BLAST-Busca sequencias contendo um motivo indicado pelo usuário Proteína X proteína

17 Submissão de seqüências Blastp Word size padrão para proteínas é 3 (contra 7 dos nucleotideos), entretanto somente aqueles mais significativos são utilizados como seeds Parâmetros do PSI-blast

18 Interpretação do resultado do blastp Espaços com letras na linha do meio do alinhamento indicam conservação do aminoácido Sinal + neste espaço indica uma substituição com escore positivo segundo a matriz de substituição utilizada

19 PSI-BLAST O PSI-blast inicia-se como um blastp normal e recupera proteínas contendo similaridades com a proteína inserida. Entretanto o algoritmo se utiliza das seqüências resultantes desta primeira pesquisa que obtiveram um escore acima de um certo limite para criar uma nova matriz (position-specific score matrix) baseada no alinhamento destas seqüências Esta matriz tenderá a fornecer escores mais altos para regiões conservadas dentro desta família e escores baixos para regiões pouco conservadas Uma nova busca é realizada com esta matriz e com os novos alinhamentos formados uma nova matriz pode ser criada

20 PSI-Blast Resultado primeiro alinhamento

21 PSI-Blast Resultado Primeiro alinhamento

22 PSI-Blast Resultado terceiro alinhamento

23 Primeiro alinhamento melhor hit Terceiro alinhamento melhor hit Terceiro alinhamento melhor hit do primeiro alinhamento

24 Interpretação do resultado do blastx Quadro de leitura da tradução da seqüência submetida

25 Interpretação do resultado do tblastn Quadro de leitura da tradução da seqüência do banco de dados

26 Interpretação do resultado do tblastx Quadro de leitura da tradução da seqüência submetida Quadro de leitura da tradução da seqüência do banco Provável resultado espúrio devido a conservação de bases no quadro de leitura positivo

27 Interpretação do resultado do tblastx Quando utilizamos o tblastx muitas vezes temos alinhamentos em quadros de leitura que não possuem nenhum sentido biológico, mas que são similares entre as seqüências devido a pouca divergência entre elas É recomendável quando analisamos uma seqüência de nucleotídeos tentarmos deduzir primeiramente a proteína codificada por este (através da dedução do quadro de leitura mais longo) e após isso utilizar o programa tblastn

28 Blast 2 sequences Permite a realização de alinhamento local entre duas seqüências Parâmetros semelhante ao do blast

29 Blast 2 sequences Estatísticas são calculadas levando-se em conta o banco nr do NCBI

30 BLAST Assembled Genomes

31 BLAST Assembled Genomes Ab-initio RNA ou proteinseqüências deduzidas a partir de programas de predição de genes utilizando a informação disponível para o organismo Build RNA ou protein- Combinação dos dados de ref- Seq mais as seqüências abinitio (dando preferência a primeira) Traces- Dados brutos de seqüenciamento em larga escala

Métodos de alinhamento de sequências biológicas. Marcelo Falsarella Carazzolle

Métodos de alinhamento de sequências biológicas. Marcelo Falsarella Carazzolle Métodos de alinhamento de sequências biológicas Marcelo Falsarella Carazzolle Resumo - Introdução - Alinhamentos ótimos - Global - Local (Smith-Waterman) - Semi global - Matrizes de alinhamento (BLOSUM)

Leia mais

Alinhamento de seqüências

Alinhamento de seqüências Alinhamento de seqüências Qual a importância do alinhamento de seqüências Permite estabelecer identidades entre sequências Permite a dedução de função de proteínas baseado em similaridade Permite a definição

Leia mais

Elisa Boari de Lima Orientador: Thiago de Souza Rodrigues

Elisa Boari de Lima Orientador: Thiago de Souza Rodrigues Uma Metodologia para Identificação de Módulos Formadores de Sequências de Proteínas Mosaicas do Trypanosoma cruzi a partir do Transcriptoma do Parasito Utilizando a Ferramenta BLAST Elisa Boari de Lima

Leia mais

Programas de Alinhamento. Sumário

Programas de Alinhamento. Sumário Programas de Alinhamento Departamento de Genética FMRP- USP Alynne Oya Chiromatzo alynne@lgmb.fmrp.usp.br Sumário Introdução para buscas em base de dados Fasta Blast Programa para alinhamento Clustal 1

Leia mais

Alinhamento de sequências

Alinhamento de sequências Pontifícia Universidade Católica de Goiás Departamento de Biologia Alinhamento de sequências Prof. Macks Wendhell Gonçalves, Msc mackswendhell@gmail.com Definição O alinhamento de sequências consiste no

Leia mais

Identificação de genes por similaridade de seqüência

Identificação de genes por similaridade de seqüência Identificação de genes por similaridade de seqüência Evolução do genoma Os genes evoluem a partir de genes ancestrais comuns acumulando mutações Homologia Genes ancestrais estão presentes nas espécies

Leia mais

alinhamento global-alinhamento múltiplo de seqüências

alinhamento global-alinhamento múltiplo de seqüências alinhamento global-alinhamento múltiplo de seqüências Alinhamento múltiplos de seqüências Qual a importância de se realizar alinhamentos múltiplos em oposição a alinhamentos em pares? Alinhamento múltiplos

Leia mais

Análise de significância de. alinhamentos

Análise de significância de. alinhamentos Análise de significância de alinhamentos Análise de significância de um alinhamento Tão importante como escolher o método de scoring ou encontrar o alinhamento que maximiza o score é saber avaliar a significância

Leia mais

Alinhamentos e Busca de Similaridade. Ariane Machado Lima

Alinhamentos e Busca de Similaridade. Ariane Machado Lima Alinhamentos e Busca de Similaridade Ariane Machado Lima Busca de identidade Identificar o que é determinada seqüência Ex.acabou de seqüenciar, seria contaminante? Outras fases de um projeto de seqüenciamento

Leia mais

Principais algoritmos de alinhamento de sequências genéticas. Alexandre dos Santos Cristino

Principais algoritmos de alinhamento de sequências genéticas. Alexandre dos Santos Cristino Principais algoritmos de alinhamento de sequências genéticas Alexandre dos Santos Cristino http://www.ime.usp.br/~alexsc e-mail: alexsc@ime.usp.br Definição de alinhamento de sequências Comparação de duas

Leia mais

Busca em banco de dados

Busca em banco de dados Busca em banco de dados Busca em banco de dados A quantidade imensa de dados existentes nos bancos públicos torna critica a existência de ferramentas eficientes que permitam a recuperação de dados desejados

Leia mais

Bases de Dados. Freqüentemente usadas em. Bioinformática

Bases de Dados. Freqüentemente usadas em. Bioinformática Bases de Dados Freqüentemente usadas em Bioinformática Ana Carolina Q. Simões anakqui@yahoo.com Organização da aula NCBI Translate tool Genome Browser EBI SwissProt KEGG Gene Ontology SMD Revistas relevantes

Leia mais

Alinhamento de Seqüências

Alinhamento de Seqüências 18 CAPÍTULO 3 Alinhamento de Seqüências 3.1. Introdução O alinhamento de seqüências consiste no processo de comparar duas seqüências (de nucleotídeos ou proteínas) de forma a se observar seu nível de identidade.

Leia mais

Bioinformática. João Varela Aulas T7-T8 CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, E ENGENHARIA BIOLÓGICA

Bioinformática. João Varela Aulas T7-T8 CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, E ENGENHARIA BIOLÓGICA Bioinformática CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, E ENGENHARIA BIOLÓGICA João Varela jvarela@ualg.pt Aulas T7-T8 Esquema de anotação Annothaton 1. Determinar a localização das ORFs presentes

Leia mais

2 Contexto e Motivações

2 Contexto e Motivações 2 Contexto e Motivações Existem duas principais famílias de algoritmos que realizam comparações de biosseqüências, a FASTA (Pearson, 1991) e a BLAST (Altschul et al., 1990). Estas ferramentas realizam

Leia mais

Bioinformática: QBQ-5722 Anotação Artemis: Passo-a-passo. Prof. Dr. João Carlos Setubal

Bioinformática: QBQ-5722 Anotação Artemis: Passo-a-passo. Prof. Dr. João Carlos Setubal Bioinformática: QBQ-5722 Anotação Artemis: Passo-a-passo Prof. Dr. João Carlos Setubal Na área de trabalho, dentro da pasta QBQ2507, dê um duplo clique no ícone Artemis; O Artemis será carregado. Clique

Leia mais

Nada em Biologia faz sentido senão à luz da evolução.

Nada em Biologia faz sentido senão à luz da evolução. Marcos T. Geraldo ADAPTABILIDADE Nada em Biologia faz sentido senão à luz da evolução. Theodosius Dobzhansky (1973) 1 Processo de evolução em moléculas de DNA, RNA e proteínas Reconstrução das relações

Leia mais

Busca em banco de dados

Busca em banco de dados Busca em banco de dados Busca em banco de dados A quantidade imensa de dados existentes nos bancos públicos torna critica a existência de ferramentas eficientes que permitam a recuperação de dados desejados

Leia mais

3 Análise do programa BlastP

3 Análise do programa BlastP 27 3 Análise do programa BlastP Este capítulo inicia-se com a apresentação das principais características do programa BLAST e continua com uma visão detalhada da implementação do NCBI-BLAST. Também será

Leia mais

Predição de novo de genes

Predição de novo de genes Anotação de genomas Predição de novo de genes Conforme vimos na aula anterior o simples seqüenciamento de um genoma de um organismo eucarioto não fornece de modo imediato a informação sobre as proteínas

Leia mais

Bioinformática para o Citrus EST Project (CitEST)

Bioinformática para o Citrus EST Project (CitEST) Bioinformática para o Citrus EST Project (CitEST) Marcelo da Silva Reis 1 1 Instituto de Matemática e Estatística, Universidade de São Paulo 20 de maio de 2009 Organização da Apresentação Esta apresentação

Leia mais

Alinhamentos de sequências e Busca de Similaridade

Alinhamentos de sequências e Busca de Similaridade Alinhamentos de sequências e Busca de Similaridade Ariane Machado Lima ariane.machado@usp.br Escola de Artes, Ciências e Humanidades - USP Contexto http://www.ekac.org/gene.html http://www.fuzzco.com/news/wp-content/uploads/27//genome.jpg

Leia mais

Explorando bancos de dados genômicos e introdução à bioinformática. Guilherme Targino Valente Marcos Tadeu Geraldo. Bioinformática

Explorando bancos de dados genômicos e introdução à bioinformática. Guilherme Targino Valente Marcos Tadeu Geraldo. Bioinformática Explorando bancos de dados genômicos e introdução à bioinformática Guilherme Targino Valente Marcos Tadeu Geraldo 22/07/2011 Bioinformática É a aplicação de estatística e ciência da computação no campo

Leia mais

Uso de microarrays e RNA-seq para a medida de níveis relativos de transcrição

Uso de microarrays e RNA-seq para a medida de níveis relativos de transcrição Uso de microarrays e RNA-seq para a medida de níveis relativos de transcrição Medidas dos níveis de mrna O nível de mrna de uma célula reflete (as vezes de forma grosseira) os níveis de proteínas da mesma.

Leia mais

Transcritômica. João Carlos Setubal IQ/USP outubro de 2013

Transcritômica. João Carlos Setubal IQ/USP outubro de 2013 Transcritômica João Carlos Setubal IQ/USP outubro de 2013 Objetivo Obter, analisar, e interpretar dados de expressão gênica mrnas (que vão virar proteína) RNAs (que não vão virar proteína; ncrnas) O gene

Leia mais

Dezembro - 2006. Bioinformática. e Anotação. Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP

Dezembro - 2006. Bioinformática. e Anotação. Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Dezembro - 2006 Bioinformática e Anotação Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Hoje 1. Introdução à Genômica 2. Introdução à Bioinformática 3. Introdução à Anotação

Leia mais

Universidade Estadual de Maringá - UEM

Universidade Estadual de Maringá - UEM Universidade Estadual de Maringá - UEM Disciplina: Biologia Molecular 6855 T1 e T2 Ciências Biológicas Transcriptoma metodologia ORESTES Profa. Dra. Maria Aparecida Fernandez Estratégia ORESTES ESTs de

Leia mais

Tutorial Introdução a anotação e comparação de genomas Tiago Mendes Doutorando em Bionformática

Tutorial Introdução a anotação e comparação de genomas Tiago Mendes Doutorando em Bionformática Tutorial Introdução a anotação e comparação de genomas Tiago Mendes Doutorando em Bionformática Hoje iremos trabalhar com dois programas free desenvolvidos pelo Sanger institute: Artemis e ACT. Artemis

Leia mais

Anotação de genomas II

Anotação de genomas II Anotação de genomas II Anotação de genomas Uma vez descrito a seqüência do genoma de um organismo e realizada a anotação dos genes presentes obtemos uma extensa lista de potenciais transcritos. Como vimos

Leia mais

3 Similaridade e tamanho da seqüência de consulta no BLAST

3 Similaridade e tamanho da seqüência de consulta no BLAST 3 Similaridade e tamanho da seqüência de consulta no BLAST Quando se planeja construir aplicativos que utilizam um agrupamento de computadores no intuito de paralelizar ou distribuir processamento, se

Leia mais

Explorando genomas: predição de genes e elementos transponíveis Proporção de diferentes sequências no genoma

Explorando genomas: predição de genes e elementos transponíveis Proporção de diferentes sequências no genoma Explorando genomas: predição de genes e elementos transponíveis Proporção de diferentes sequências no genoma 1 Especies Genoma Genes 11 O número de genes varia entre as espécies 2 Anotação do Genoma 1

Leia mais

Comparação entre sequências biológicas

Comparação entre sequências biológicas Comparação entre sequências biológicas Extraíndo e analisando os sinais contidos em biopolímeros ( Alinhamentos ) Prof. Dr. Alessandro Varani UNESP - FCAV Objetivos Abordagens práticas para comparação

Leia mais

Alinhamento de Sequências e Genômica Comparativa

Alinhamento de Sequências e Genômica Comparativa Encontro França-Brasil de Bioinformática Universidade Estadual de Santa Cruz (UESC) Ilhéus-BA - Brasil Alinhamento de Sequências e Genômica Comparativa Maria Emília M. T. Walter Departamento de Ciência

Leia mais

Sequenciamento de genoma e transcriptomas

Sequenciamento de genoma e transcriptomas Sequenciamento de genoma e transcriptomas Por que seqüenciar genomas? O seqüenciamento de genomas é o primeiro passo para obter uma descrição completa da composição molecular de cada organismo, pois todas

Leia mais

Banco de Dados Biológicos

Banco de Dados Biológicos Pontifícia Universidade Católica de Goiás Departamento de Biologia Disciplina: Bioinformática Bio1015 Banco de Dados Biológicos Prof. Macks Wendhell Gonçalves, Msc mackswendhell@gmail.com INTRODUÇÃO BANCO

Leia mais

MIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin

MIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin MIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin Orientador: Prof. Dr. Ricardo Rodrigues Ciferri Agenda Introdução Bancos de dados

Leia mais

Tutorial Introdução a anotação e comparação de genomas Tiago Mendes Doutorando em Bionformática

Tutorial Introdução a anotação e comparação de genomas Tiago Mendes Doutorando em Bionformática Tutorial Introdução a anotação e comparação de genomas Tiago Mendes Doutorando em Bionformática Hoje iremos trabalhar com dois programas free desenvolvidos pelo Sanger institute: Artemis e ACT. Artemis

Leia mais

Programa de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas. Seleção de Mestrado 2012-A

Programa de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas. Seleção de Mestrado 2012-A Programa de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas Seleção de Mestrado 2012-A INSTRUÇÕES (LEIA ATENTAMENTE ANTES DE PREENCHER A PROVA): a. Identifique sua prova unicamente com

Leia mais

UFPel CDTec Biotecnologia. Anotação de genomas. MSc. Frederico schmitt Kremer

UFPel CDTec Biotecnologia. Anotação de genomas. MSc. Frederico schmitt Kremer UFPel CDTec Biotecnologia Anotação de genomas MSc. Frederico schmitt Kremer A anotação de um genoma consiste na identificação de suas regiões funcionais ou de relevância biológico, o que pode incluir:

Leia mais

Bioinformática. Alinhamento de Sequências. Prof. Msc. Rommel Ramos

Bioinformática. Alinhamento de Sequências. Prof. Msc. Rommel Ramos Bioinformática Alinhamento de Sequências Prof. Msc. Rommel Ramos 2013 Sumário 1. Comparação de Sequências 2. O que é alinhamento? 3. Tipos de Alinhamento 4. Algoritmos 5. Métodos de Alinhamento Comparação

Leia mais

Análise de transcriptoma usando a base de dados Kegg Orthology

Análise de transcriptoma usando a base de dados Kegg Orthology Análise de transcriptoma usando a base de dados Kegg Orthology BLAST usando 25 mil CDS humanas como query e 500 mil transcritos de tumor de mama como database: $megablast -i h.sapiens.nuc -d tumor.seq

Leia mais

Marcelo Reis. Centro APTA Citros Sylvio Moreira. 18 de julho de 2007

Marcelo Reis. Centro APTA Citros Sylvio Moreira. 18 de julho de 2007 I n t r o d u ç ã o à B i o i n f o r m á t i c a Marcelo Reis Centro APTA Citros Sylvio Moreira 18 de julho de 2007 Duração estimada: ~ 2,5h (manhã) ~ 2,5h (tarde) A g e n d a Manhã: Que trem é esse,

Leia mais

Protein Classification Tool: Uma ferramenta para anotação de proteínas utilizando bases secundárias

Protein Classification Tool: Uma ferramenta para anotação de proteínas utilizando bases secundárias João de Abreu e Tôrres Protein Classification Tool: Uma ferramenta para anotação de proteínas utilizando bases secundárias Dissertação apresentada ao Departamento de Ciência da Computação da UFMG como

Leia mais

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven/C. David Page para BMI/CS 576,

Leia mais

Protein Classification Tool: Uma ferramenta para anotação de proteínas utilizando bases secundárias

Protein Classification Tool: Uma ferramenta para anotação de proteínas utilizando bases secundárias João de Abreu e Tôrres Protein Classification Tool: Uma ferramenta para anotação de proteínas utilizando bases secundárias Dissertação apresentada ao Departamento de Ciência da Computação da UFMG como

Leia mais

Protein Homology detection by HMM-comparation.

Protein Homology detection by HMM-comparation. UNIVERSIDADE FEDERAL DE PERNAMBUCO Cin Centro de Informática Pós-Graduação em Ciência da Computação Protein Homology detection by HMM-comparation. Johannes Soding Vol. 21 no. 7 2005, BIOINFORMATICS Recife,

Leia mais

Bioinformática e Genética Animal. Pâmela A. Alexandre Doutoranda

Bioinformática e Genética Animal. Pâmela A. Alexandre Doutoranda Bioinformática e Genética Animal Pâmela A. Alexandre Doutoranda Descoberta da estrutura do DNA» Watson e Crick, 1953 DNA RNA Proteína Projeto Genoma Humano» 1990» 18 países» US$ 2,7 Bi» 13 anos (previsão

Leia mais

Universidade Federal de Pelotas Faculdade de Agronomia Eliseu Maciel Programa de Pós-Graduação em Agronomia CENTRO DE GENOMICA E FITOMELHORAMENTO

Universidade Federal de Pelotas Faculdade de Agronomia Eliseu Maciel Programa de Pós-Graduação em Agronomia CENTRO DE GENOMICA E FITOMELHORAMENTO Universidade Federal de Pelotas Faculdade de Agronomia Eliseu Maciel Programa de Pós-Graduação em Agronomia CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática Professores: Luciano Maia Antonio

Leia mais

PAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE

PAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE CONCEITOS EM EPIDEMIOLOGIA E FILOGENIA MOLECULARES PAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE DE

Leia mais

Introdução à Bioquímica

Introdução à Bioquímica Introdução à Bioquímica Nucleotídeos e Ácidos Nucléicos Dra. Fernanda Canduri Laboratório de Sistemas BioMoleculares. Departamento de Física.. UNESP São José do Rio Preto - SP. Genoma! O genoma de um organismo

Leia mais

introdução ao curso

introdução ao curso introdução ao curso http://www.ifsc.usp.br/~rdemarco/ffi0760/ffi0760.htm Cronograma aulas teóricas Aulas teóricas (Segundas-feiras - Sala 146) 30/07-introdução ao curso. 06/08-Busca em bancos de dados

Leia mais

Sequenciamento de genoma e transcriptomas

Sequenciamento de genoma e transcriptomas Sequenciamento de genoma e transcriptomas Durante décadas o método de Sanger foi praticamente a única opção utilizada para sequenciamento de DNA Nos últimos anos surgiram novas tecnologias de sequenciamento

Leia mais

ELISA BOARI DE LIMA UMA METODOLOGIA PARA IDENTIFICAÇÃO DE MÓDULOS FORMADORES DE SEQUÊNCIAS DE PROTEÍNAS MOSAICAS DO

ELISA BOARI DE LIMA UMA METODOLOGIA PARA IDENTIFICAÇÃO DE MÓDULOS FORMADORES DE SEQUÊNCIAS DE PROTEÍNAS MOSAICAS DO ELISA BOARI DE LIMA UMA METODOLOGIA PARA IDENTIFICAÇÃO DE MÓDULOS FORMADORES DE SEQUÊNCIAS DE PROTEÍNAS MOSAICAS DO Trypanosoma cruzi A PARTIR DO TRANSCRIPTOMA DO PARASITO UTILIZANDO A FERRAMENTA BLAST

Leia mais

Número de genes versus número de proteínas em eucariotos

Número de genes versus número de proteínas em eucariotos Número de genes versus número de proteínas em eucariotos Bioquímica II SQM0416 Júlia Assirati Tomie Kuriyama Victória Montenegro de Campos Resumo Introdução Características do genoma humano Como foram

Leia mais

Instituto Superior de Ciências da Saúde-Norte Curso de Bioquímica 2ºAno Projecto Tutorial BIOINFORMÁTICA

Instituto Superior de Ciências da Saúde-Norte Curso de Bioquímica 2ºAno Projecto Tutorial BIOINFORMÁTICA Instituto Superior de Ciências da Saúde-Norte Curso de Bioquímica 2ºAno Projecto Tutorial 2006-2007 BIOINFORMÁTICA Bioinformática PROJECTO TUTORIAL YFP YOUR FAVORITE PROTEIN Introdução A bioinformática

Leia mais

Cap. 6: Métodos para alinhamento de múltiplas seqüências

Cap. 6: Métodos para alinhamento de múltiplas seqüências Cap. 6: Métodos para alinhamento de múltiplas seqüências Organização O que é um alinhamento múltiplo Escores para alinhamentos múltiplos Relação entre alinhamento múltiplo e análise filogenética Métodos

Leia mais

Capítulo 8. Versão 0.4. Filogenômica

Capítulo 8. Versão 0.4. Filogenômica Capítulo 8 Versão 0.4 Filogenômica O termo "Filogenômica" é definido de várias maneiras, mas, em geral, a definição é relacionada com a intersecção dos campos da Genômica e da evolução biológica. Aqui,

Leia mais

Resumo - capítulo 5 - Predição da estrutura secundária do RNA

Resumo - capítulo 5 - Predição da estrutura secundária do RNA Resumo - capítulo 5 - Predição da estrutura secundária do RNA Pedro Ivo Gomes de Faria Sumário 1 Introdução 2 1.1 Fundamentos da predição da estrutura do RNA........ 2 1.2 Características da estrutura

Leia mais

Biologia Molecular Computacional Homologia

Biologia Molecular Computacional Homologia Biologia Molecular Computacional Homologia Luiz Thibério Rangel O que é homologia? Conceito básico para estudos de genômica comparativa; Passo inicial para estudos de filogenia(omica); Importante para

Leia mais

Bioinformática. João Varela jvarela@ualg.pt. Aula T4 CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, CIÊNCIAS BIOMÉDICAS E ENGENHARIA BIOLÓGICA

Bioinformática. João Varela jvarela@ualg.pt. Aula T4 CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, CIÊNCIAS BIOMÉDICAS E ENGENHARIA BIOLÓGICA Bioinformática CURSOS EM BIOLOGIA, BIOQUÍMICA, BIOTECNOLOGIA, CIÊNCIAS BIOMÉDICAS E ENGENHARIA BIOLÓGICA João Varela jvarela@ualg.pt Aula T4 Esquema de anotação Annothaton 1. Determinar a localização das

Leia mais

IBM1029 Introdução à Bioinformática. O Início da Bioinformática 27/03/2017. Aula 2. O Início. Bioionformática: definição

IBM1029 Introdução à Bioinformática. O Início da Bioinformática 27/03/2017. Aula 2. O Início. Bioionformática: definição IBM1029 Introdução à Bioinformática Profa Dra Silvana Giuliatti Departamento de Genética FMRP silvana@fmrp.usp.br O Início da Bioinformática Aula 2 O Início Trabalho de Margaret Dayhoff e colaboradores:

Leia mais

- Sequenciamento de genomas nada mais é que a determinação da ordem linear dos nucleotídeos ou bases nitrogenadas de um genoma.

- Sequenciamento de genomas nada mais é que a determinação da ordem linear dos nucleotídeos ou bases nitrogenadas de um genoma. Sequenciamento de genomas - Sequenciamento de genomas nada mais é que a determinação da ordem linear dos nucleotídeos ou bases nitrogenadas de um genoma. O sequenciamento de um genoma é geralmente referido

Leia mais

Busca de motivos em sequências. João Carlos Setubal IQ-USP 2014

Busca de motivos em sequências. João Carlos Setubal IQ-USP 2014 Busca de motivos em sequências João Carlos Setubal IQ-USP 2014 Motivos do tipo I AACT(G A)N 12 AGTT Q-[LIV]-H-H-[SA]-x(2)-D-G-[FY]-H Chloramphenicol acetyltransferase active site (do PROSITE) Posições

Leia mais

Teoria dos Grafos Aula 17

Teoria dos Grafos Aula 17 Teoria dos Grafos Aula 17 Aula passada Problema da soma do subconjunto (subset sum) Programação dinâmica Problema da mochila Aula de hoje Alinhamento de sequências Programação dinâmica Caminho mais curto

Leia mais

UMA METODOLOGIA PARA IDENTIFICAÇÃO DE MÓDULOS FORMADORES DE SEQUÊNCIAS DE PROTEÍNAS MOSAICAS DO

UMA METODOLOGIA PARA IDENTIFICAÇÃO DE MÓDULOS FORMADORES DE SEQUÊNCIAS DE PROTEÍNAS MOSAICAS DO UMA METODOLOGIA PARA IDENTIFICAÇÃO DE MÓDULOS FORMADORES DE SEQUÊNCIAS DE PROTEÍNAS MOSAICAS DO Trypanosoma cruzi A PARTIR DO TRANSCRIPTOMA DO PARASITO UTILIZANDO A FERRAMENTA BLAST Elisa Boari de Lima

Leia mais

3 Uma Ontologia para Sistemas de Gerência de Análises em Biossequências 3.1 Introdução

3 Uma Ontologia para Sistemas de Gerência de Análises em Biossequências 3.1 Introdução 3 Uma Ontologia para Sistemas de Gerência de Análises em Biossequências 3.1 Introdução Este capítulo apresenta uma ontologia que direciona o sistema de gerência de análises em biossequências. Serão tratados

Leia mais

Instruções 6 Técnicas

Instruções 6 Técnicas Instruções 6 Técnicas ISSN Dezembro, 2001 Campinas, SP Entendendo e Interpretando os Parâmetros Utilizados por BLAST Roberto Hiroshi Higa 1 O advento da tecnologia de obtenção rápida de seqüências de DNA,

Leia mais

6 Instanciações do Framework para Sistemas de Gerência de Análises de Biossequências 6.1 Introdução

6 Instanciações do Framework para Sistemas de Gerência de Análises de Biossequências 6.1 Introdução 6 Instanciações do Framework para Sistemas de Gerência de Análises de Biossequências 6.1 Introdução Este capítulo apresenta instanciações do framework para sistemas de gerência de análises em biossequências

Leia mais

Busca de motivos em sequências. João Carlos Setubal 2015

Busca de motivos em sequências. João Carlos Setubal 2015 Busca de motivos em sequências João Carlos Setubal 2015 Cadeias exatas Podem ser encontradas com o mecanismo de busca de qualquer editor de textos Que algoritmo é executado? O mais simples (e que é muito

Leia mais

Análise de dados provenientes de técnicas moleculares

Análise de dados provenientes de técnicas moleculares CIIMAR Curso de formação Análise de dados provenientes de técnicas moleculares Formadores: Filipe Pereira e Filipe Lopes Manual do Curso 1 Índice Objetivo Geral do Curso... 3 Público-alvo... 3 Objetivos

Leia mais

Tipos de gráficos disponíveis

Tipos de gráficos disponíveis Página 1 de 18 Excel > Gráficos > Criando gráficos Tipos de gráficos disponíveis Mostrar tudo O Microsoft Excel dá suporte a vários tipos de gráficos para ajudar a exibir dados de maneiras que sejam significativas

Leia mais

Análise do pangenoma de Streptococcus pneumoniae e comparação de genomas dos serótipos 1 e 3

Análise do pangenoma de Streptococcus pneumoniae e comparação de genomas dos serótipos 1 e 3 Universidade de Lisboa. Faculdade de Ciências. Departamento de Informática Análise do pangenoma de Streptococcus pneumoniae e comparação de genomas dos serótipos 1 e 3 Adriana Domingos Policarpo Dissertação

Leia mais

ALINHAMENTO DE SEQUÊNCIAS

ALINHAMENTO DE SEQUÊNCIAS Disciplina de BIOLOGIA COMPUTACIONAL Mestrado em ENGENHARIA BIOMÉDICA 4º Ano, 1º Semestre 2007/08 ALINHAMENTO DE SEQUÊNCIAS Relatório 2 Ana Calhau Ângela Pisco Nuno Santos 54605 55748 55746 Palavras-Chave:

Leia mais

A matemática e o genoma. Resumo

A matemática e o genoma. Resumo I Coloquio Regional da Região Centro-Oeste, 3 a 6 de novembro de 2009 Universidade Federal de Mato Grosso do Sul Mini-curso A matemática e o genoma Nalvo F. Almeida Jr. Resumo Os avanços da biotecnologia

Leia mais

Identificação de fatores de transcrição a partir de dados de expressão.

Identificação de fatores de transcrição a partir de dados de expressão. Identificação de fatores de transcrição a partir de dados de expressão. Márcio Augusto Afonso de Almeida Laboratório de Genética e Cardiologia Molecular InCor. Introdução Técnicas de expressão global permitem

Leia mais

Seqüenciamento de DNA

Seqüenciamento de DNA Seqüenciamento de DNA Profa. Dra. Aline Maria da Silva Instituto de Química- USP Bibliografia: Recombinant DNA James Watson & Michael Gilman Guia de Rotas na Tecnologia do Gene Matthew Walker & Ralph Rapley

Leia mais

ANÁLISE DE TANDEM REPEATS CODIFICANTES EM GENOMAS BACTERIANOS

ANÁLISE DE TANDEM REPEATS CODIFICANTES EM GENOMAS BACTERIANOS 5ª Jornada Científica e Tecnológica e 2º Simpósio de Pós-Graduação do IFSULDEMINAS 06 a 09 de novembro de 2013, Inconfidentes/MG ANÁLISE DE TANDEM REPEATS CODIFICANTES EM GENOMAS BACTERIANOS Vinícius A.

Leia mais

MARCADORES MOLECULARES

MARCADORES MOLECULARES ESALQ/USP MARCADORES MOLECULARES Base genética dos marcadores e usos no melhoramento de plantas e em estudos de diversidade genética e conservação Departamento de Genética ESTUDO DIRIGIDO 1. O que são

Leia mais

TE073 PDS II Programa de Graduação em Engenharia Elétrica

TE073 PDS II Programa de Graduação em Engenharia Elétrica TE073 PDS II Programa de Graduação em Engenharia Elétrica Prof. Alessandro Zimmer zimmer@eletrica.ufpr.br www.eletrica.ufpr.br/~zimmer/te073 Processamento Digital de Imagens PDI: Segmentação Os algoritmos

Leia mais

Este capítulo possui uma discussão preliminar do contexto biológico necessário para o entendimento e motivação deste trabalho.

Este capítulo possui uma discussão preliminar do contexto biológico necessário para o entendimento e motivação deste trabalho. 17 2 Preliminares Este capítulo possui uma discussão preliminar do contexto biológico necessário para o entendimento e motivação deste trabalho. Na discussão do contexto biológico serão apresentados os

Leia mais

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven para BMI/CS 576, UW-Madison

Leia mais

1. OBJETIVO: Análises prévias para submissão de sequências utilizadas para desenho de Assays TaqMan (Expressão Gênica e Genotipagem).

1. OBJETIVO: Análises prévias para submissão de sequências utilizadas para desenho de Assays TaqMan (Expressão Gênica e Genotipagem). 1. OBJETIVO: Análises prévias para submissão de sequências utilizadas para desenho de Assays TaqMan (Expressão Gênica e Genotipagem). 2. RESPONSÁVEIS: Todos os usuários de Custom TaqMan Assays. 3. DESCRIÇÃO

Leia mais

Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica. João Varela

Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica. João Varela Bioinformática Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica João Varela jvarela@ualg.pt Docentes João Varela (bioinformática: conceitos, bases de dados, aplicações, pesquisa

Leia mais

Prof. Marcelo Langer. Curso de Biologia. Aula 26 Genética

Prof. Marcelo Langer. Curso de Biologia. Aula 26 Genética Prof. Marcelo Langer Curso de Biologia Aula 26 Genética MATERIAL GENÉTICO A primeira atividade é a de orientação do DNA para formar a proteína, que será responsável pela característica genética. DNA é

Leia mais

Turma de terça-feira 14 hs. Total: 31 alunos

Turma de terça-feira 14 hs. Total: 31 alunos n. alunos Turma de terça-feira 14 hs 14 Distribuição de notas 12 10 8 6 4 2 Média = 6,7 0 0 -- 2 2 -- 4 4 -- 6 6 -- 8 8 -- 10 notas 18 alunos Total: 31 alunos BANCO DE DADOS BIOLÓGICOS Aula 12 Estudo dirigido

Leia mais

DEFINIÇÕES EM EPIDEMIOLOGIA MOLECULAR E CONCEITOS BÁSICOS EM BIOLOGIA MOLECULAR

DEFINIÇÕES EM EPIDEMIOLOGIA MOLECULAR E CONCEITOS BÁSICOS EM BIOLOGIA MOLECULAR DEFINIÇÕES EM E DEFINIÇÕES EM E CONCEITOS BÁSICOS EM BIOLOGIA PARA QUE SERVE ESTA AULA 1. DEFINIÇÕES EM CONCEITUAÇÃO DE DIFERENCIAÇÃO ENTRE, TAXONOMIA E FILOGENIA 2. CONCEITOS EM BIOLOGIA APRESENTAR (REVER)

Leia mais

Processamento Digital de Imagens

Processamento Digital de Imagens Ciência da Computação Processamento Digital de Imagens Propriedades de Imagem Digital Prof. Sergio Ribeiro Tópicos Propriedades de uma Imagem Digital Vizinhança Conectividade Operações Lógicas e Aritméticas

Leia mais

Anotação de genomas. João C. Setubal 2016

Anotação de genomas. João C. Setubal 2016 Anotação de genomas João C. Setubal 2016 Sumário Dado um genoma completo, sem buracos ou erros Achar os genes codificadores de proteína Sequência codificadora (CDS) (às vezes aparece ORF) promotores Achar

Leia mais

Processamento Digital de Imagens

Processamento Digital de Imagens Ciência da Computação Processamento Digital de Imagens Propriedades de Imagem Digital Prof. Sergio Ribeiro Tópicos Propriedades de uma Imagem Digital Vizinhança e Aritméticas Efeitos de em Pixel a Pixel

Leia mais

O que são domínios protéicos

O que são domínios protéicos Domínios protéicos O que são domínios protéicos Domínios protéicos é uma parte da cadeia polipeptídica que pode de enovelar independentemente para formar uma estrutura compacta e estável A existência de

Leia mais

Identificação de Padrões em Proteínas Utilizando a Ferramenta de Bioinformática CD- Search

Identificação de Padrões em Proteínas Utilizando a Ferramenta de Bioinformática CD- Search 4ª Jornada Científica e Tecnológica e 1º Simpósio de Pós-Graduação do IFSULDEMINAS 16, 17 e 18 de outubro de 2012, Muzambinho MG Identificação de Padrões em Proteínas Utilizando a Ferramenta de Bioinformática

Leia mais

Montagem de regiões gênicas

Montagem de regiões gênicas Montagem de regiões gênicas Pedro Ivo Gomes de Faria Departamento de Ciência da Computação Instituto de Matemática e Estatística Universidade de São Paulo Orientador: Prof. Dr. Alan Durham Pedro Ivo Gomes

Leia mais

Pesquisador em Saúde Pública Prova Discursiva INSTRUÇÕES

Pesquisador em Saúde Pública Prova Discursiva INSTRUÇÕES Bioinformática Pesquisador em Saúde Pública Prova Discursiva 1. Você recebeu do fiscal o seguinte material: INSTRUÇÕES a) Este Caderno de Questões contendo o enunciado das 2 (duas) questões da prova discursiva.

Leia mais

Fundamentos da Computação Gráfica

Fundamentos da Computação Gráfica Fundamentos da Computação Gráfica Trabalho 2 Visão. Detecção de cantos. Manuel Alejandro Nodarse Moreno (1322198) Introdução. Detecção de cantos é uma abordagem utilizada em sistemas de visão computacional

Leia mais

A ABSTRACÇÃO É NOSSA AMIGA

A ABSTRACÇÃO É NOSSA AMIGA A ABSTRACÇÃO É NOSSA AMIGA Prever estruturas, comparar e procurar motivos no RNA [Robert Giegerich, Faculty of Technology Bielefeld University, Vienna 2007] Bioinformática DCC - FCUP Teresa Costa 03/06/2011

Leia mais

Gene de um organismo Eukariota. Intrões. Codão STOP UTR 5 3. Codão ATG. Exões. Transcrição. 5 Cap 3 poly-a. Splicing. Proteína 3/17/2005 3

Gene de um organismo Eukariota. Intrões. Codão STOP UTR 5 3. Codão ATG. Exões. Transcrição. 5 Cap 3 poly-a. Splicing. Proteína 3/17/2005 3 lgoritmos para a Detecção de Promotores otores em Sequências de DN na eresa Freitas INES-ID/IS ID/IS 3/17/5 1 omo analisar todos estes dados? 3/17/5 1 ene de um organismo Eukariota SS Região promotora

Leia mais

TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO DE GRADUAÇÃO

TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO DE GRADUAÇÃO 1 U NIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2 0 1 6. 1 TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO

Leia mais

IACB 1º Semestre de 2014/2015. Exercicios de Preparação para o Teste 1

IACB 1º Semestre de 2014/2015. Exercicios de Preparação para o Teste 1 IACB 1º Semestre de 2014/2015 Exercicios de Preparação para o Teste 1 Introdução (0 ou 1 questão no teste 1) 1. O que é a BioInformática? Resposta: Bioinformática é um campo interdisciplinar que aplica

Leia mais

TE073 PDS II Programa de Graduação em Engenharia Elétrica

TE073 PDS II Programa de Graduação em Engenharia Elétrica TE073 PDS II Programa de Graduação em Engenharia Elétrica Prof. Alessandro Zimmer zimmer@eletrica.ufpr.br www.eletrica.ufpr.br/~zimmer/te073 Processamento Digital de Imagens PDI: Segmentação Os algoritmos

Leia mais