Busca em banco de dados

Documentos relacionados
Busca em banco de dados

Bases de Dados. Freqüentemente usadas em. Bioinformática

Banco de Dados Biológicos

Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica. João Varela

Turma de terça-feira 14 hs. Total: 31 alunos

Sequenciamento de genoma e transcriptomas

introdução ao curso

BANCO DE DADOS BIOLÓGICOS Aula 11

Sequenciamento de genoma e transcriptomas

Número de genes versus número de proteínas em eucariotos

Bioinformática aplicada ao estudo e análise de Genes e Genomas Aula Teórico e Prá/ca

Sequenciamento Montagem Anotação

Universidade Estadual de Maringá - UEM

Uso de microarrays e RNA-seq para a medida de níveis relativos de transcrição

Programa Doutoral Genética Médica 2009

Programas de Alinhamento. Sumário

Identificação de Padrões em Proteínas Utilizando a Ferramenta de Bioinformática CD- Search

Bioinformática Aplicada ao Estudo e Análise de Genes e Genomas. Prof. Dr. Alessandro de M. Varani Dep. de Tecnologia - UNESP, FCAV

IBM1029 Introdução à Bioinformática. O Início da Bioinformática 27/03/2017. Aula 2. O Início. Bioionformática: definição

MIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin

Organização Gênica de Eucariotos. Prof. Odir A. Dellagostin

ANÁLISE DE TANDEM REPEATS CODIFICANTES EM GENOMAS BACTERIANOS

Bioinformática e Genética Animal. Pâmela A. Alexandre Doutoranda

Bancos de Dados Biológicos. CCM205 Sistema de Bancos de Dados Ugo Henrique Pereira da Silva Professora Maria Camila N. Barioni

Sequenciamento de Nova Geração (NGS) Msc. Frederico Schmitt Kremer // doutorando PPGB

Alinhamento local- Utilização do BLAST

- Sequenciamento de genomas nada mais é que a determinação da ordem linear dos nucleotídeos ou bases nitrogenadas de um genoma.

Bioinformática para o Citrus EST Project (CitEST)

ORGANIZAÇÃO DO GENOMA HUMANO. Departamento de Genética. Nilce M. Martinez Rossi

Bioinformática. Tipos de Bases de Dados (BD) Principais BD Primárias. Bases de dados Não-Redundantes. 3 - Bases de dados

P E R N AMBUCO UMA FERRAMENTA WEB PARA INFERÊNCIA DE HAPLÓTIPOS PROPOSTA DE TRABALHO DE GRADUAÇÃO

Métodos de alinhamento de sequências biológicas. Marcelo Falsarella Carazzolle

Transcritômica. João Carlos Setubal IQ/USP outubro de 2013

Tecnologia do DNA recombinante. John Wiley & Sons, Inc.

Prof. João Carlos Setubal

Introdução a Bioinformática Curso de Verão Nivelamento na área de Biológicas

Anotação de genomas II

Seqüenciamento de DNA

DESVENDANDO O GENOMA HUMANO

Banco de Dados Biológicos conceitos básicos, indexação, VSTree

CONSTRUÇÃO DE UMA BASE DE DADOS GENÉTICOS A PARTIR DE UM INVENTÁRIO DE INTRONS PROCESSADOS EM GENOMA HUMANO

BASE DE DADOS PUBMED MEDLINE

Instituto Superior de Ciências da Saúde-Norte Curso de Bioquímica 2ºAno Projecto Tutorial BIOINFORMÁTICA

PUBMED MEDLINE BASE DE DADOS. PUBMED - MEDLINE PUBMED - MEDLINE PUBMED - MEDLINE PUBMED - MEDLINE PUBMED - MEDLINE PUBMED - MEDLINE

O que é Bioinformática?

Departamento de Genética Nilce M. Martinez Rossi

Créditos. Introdução. Sumário. Agradecimento. Introdução. Análise de Expressão Gênica. Tecnologia de Microarray

Introdução à Bioquímica

Marcelo Reis. Centro APTA Citros Sylvio Moreira. 18 de julho de 2007

CONHECIMENTOS ESPECÍFICOS

ANÁLISE GENÔMICA, MAPEAMENTO E ANÁLISE DE QTLs

PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA E BIODIVERSIDADE UNIVERSIDADE FEDERAL DA BAHIA INSTITUTO DE BIOLOGIA PROCESSO SELETIVO 2012

Predição de novo de genes

A síntese proteica envolve várias fases, que culminam na síntese de proteínas nos ribossomas, tendo como base a informação genética do DNA. Classifica

UFPel CDTec Biotecnologia. Anotação de genomas. MSc. Frederico schmitt Kremer

Do DNA à Proteína: Síntese proteica. Prof. Dr. Marcelo Ricardo Vicari

Introdução à Bioinformática e Aplicações

BIBLIOTECAS DE DNA E HIBRIDIZAÇÃO. FABIANA SEIXAS

IMPORTÂNCIA DA GENÉTICA PARA ÁREA DA SAÚDE: Diagnóstico clínico: alteração no número ou estrutura dos cromossomos (síndrome de Down)

Metagenômica e sequenciamento de nova geração. Fabrício Campos 25 de junho de 2015

Genômica. Desenvolvimento e Aplicações. Prof. Manoel Victor

Estudos das ômicas: Genômica; Transcriptomica; Metagenômica. Aula 7

Universidade Federal do Espírito Santo Centro de Ciências da Saúde Programa de Pós-Graduação em Biotecnologia

Bases de dados de interesse biológico

Bases de dados de interesse biológico

1 de 7 19/12/ :16

Genômica. Mapeamento Molecular

Universidade Federal de Pelotas Programa de Pós-Graduação em Biotecnologia Biologia Molecular. Prof. Odir Dellagostin

2 Contexto Biológico Genômica

MARCADORES MOLECULARES

Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Ciências Biomédicas, Engenharia Biológica. João Varela

UFPel CDTec PPGB. Plataformas de NGS. Frederico Kremer

GOIÂNIA, / / PROFESSOR: FreD. DISCIPLINA: Biologia SÉRIE: 1º. ALUNO(a):

Bases de dados de interesse biológico

Explorando genomas: predição de genes e elementos transponíveis Proporção de diferentes sequências no genoma

Avanços no entendimento da relação entre genótipo e fenótipo através de marcadores genéticos

Introdução às Tecnologias de Sequeciamento: Sanger e Nova Geração (NGS)

Ácidos nucleicos (DNA e RNA) e os genes

Sumário. Parte I: O DNA Contém A Informação Biológica

SEQUENCIAMENTO DE GENOMAS TUMORAIS

Profa. Dra. Viviane Nogaroto

DNA, Cromossomos e Replicação. Capítulos 5 e 6 (pág ) - Fundamentos da Biologia Celular - Alberts- 2ª edição

Prof. Dr. Rodrigo Matheus Pereira. Faculdade de Ciências Biológicas e Ambentais FCBA-UFGD

TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO DE GRADUAÇÃO

MARCADORES MOLECULARES: DO MELHORAMENTO A CONSERVAÇÃO. Aula 10. Maria Carolina Quecine Departamento de Genética

Introdução às Tecnologias de Sequeciamento: Sanger e Nova Geração (NGS)

Universidade Federal de Pelotas Faculdade de Agronomia Eliseu Maciel Programa de Pós-Graduação em Agronomia CENTRO DE GENOMICA E FITOMELHORAMENTO

Estudo Dirigido Sequenciamento de DNA

Anotação de Genomas. Fabiana G. S. Pinto

Montagem de Genomas. Prof. Dr. Alessandro Varani UNESP - FCAV

Sequenciamento de DNA e PCR QBQ 102 Aula 6 (biomol)

Cadastramento de UC Eletiva - Campus São Paulo

Profa. Dra. Cecília Dias Flores

Gene: evolução do conceito

Secretaria de Educação Profissional e Tecnológica Prática Prospecção gênica e Bioinformática

disciplina Genética Humana (e Evolução)

Bioinformática. iphy Sistema de Apoio à filógenética para a análise de supermatrizes. Trabalho realizado por: João Pedro Teixeira

disciplina Genética Humana

O IMPACTO DE NOVAS BIOTÉCNICAS GENÉTICAS APLICADAS A PROGRAMAS DE MELHORAMENTO DE BUBALINOS

Transcrição:

Busca em banco de dados

Busca em banco de dados A quantidade imensa de dados existentes nos bancos públicos torna critica a existência de ferramentas eficientes que permitam a recuperação de dados desejados Existem diversas formas através das quais os bancos podem ser interrogados para obtenção da informação desejada

NCBI Um dos maiores repositórios de informações biológicas existentes Parte do NIH (National Institutes of Health) dos EUA. http://www.ncbi.nlm.nih.gov/

Estrutura do NCBI

Bancos de dados do NCBI

PubMed Busca por palavra chave ou nome de autor (sobrenome seguido de iniciais) Busca por referencias bibliográfica

PubMed Acesso ao artigo completo Titulo do artigo, nome dos autores e resumo do artigo Artigos relacionados

PubMed Permite acesso a seqüências descritas no artigo, artigos citados por este artigo, entre outros

Entrez nucleotide

Bases de dados de nucleotídeos A base de dados de nucleotídeos é subdividida em diversas bancos dependendo da origem da seqüência (DNA, RNA) e da metodologia utilizada na obtenção desta seqüência Estes bancos podem ser pesquisados em conjunto através da primeira pagina de busca do ENTREZ nucleotide ou separadamente

Bases de dados de nucleotídeos GenBank Seqüências de cdna ou DNA anotadas e divididas em bancos relacionados com a taxonomia (invertebrados (INV),primatas (PRI),roedores (ROD), etc..) Alem disso existem bancos a parte que refletem certas estratégias de seqüenciamento

Bases de dados de nucleotídeos Bancos a parte do GenBank: EST (Expressed Sequence Tag)- Resultante de seqüenciamento em larga escala de mrna. Seqüências são single pass, podendo ter baixa qualidade e só representam parte da molécula. STS (Sequence-Tagged Sites) Seqüências únicas em um genoma, utilizadas no mapeamento físico de cromossomos GSS (Genome Survey sequences)- Seqüência de amostragem do genoma, normalmente single pass,. Mais da metade das seqüências são de pontas de BACs (Bacterial Artificial Chromosome)

Bases de dados de nucleotídeos Bancos a parte do GenBank: ENV (environmental sample sequences)amostragem de seqüência de uma amostra ambiental sem que se determine os organismos que estão sendo seqüenciados HTG (High-throughput genomic)- Derivadas se seqüenciamento em larga escala de genoma, mas que ainda não foram finalizadas. HTC (high-throughput cdna)-derivadas de seqüenciamento em larga escala de moléculas completas de mrna,, mas que ainda não foram finalizadas.

Bases de dados de nucleotídeos WGS (Whole Genome Shotgun)- Genomas produzidos utilizando a estratégia de WGS TPA (Thrid party anotation)- Re-anotação de seqüências por grupos que não produziram o dado original (é necessário uma publicação relacionada) RefSeq (Reference sequences)- Banco inclusivo, não redundante de seqüências anotadas (DNA, proteína e mrna).

Resultado busca nucleotídeos Seqüências derivadas de mrna Seqüências do tipo single-pass Seqüências de referencia

Exemplo de um registro Detalhes do registro Numero de acesso Organismo Publicação

Exemplo de um registro Atributo da seqüência Descrição de trecho codificante para uma proteína

Seqüência em formato FASTA Formato mais utilizado para reconhecimento de seqüências por programa de bioinformática Primeira linha possui um sinal > seguido pela descrição da seqüência Linhas seguinte contem a seqüência Alguns programas aceitam formato multi-fasta

Bases de dados de proteínas Ao contrario do DNA, proteínas não são facilmente seqüenciáveis Praticamente não existem depósitos em bancos de dados de seqüenciamento direto destas moléculas Entretanto devido ao fato de poder se deduzir facilmente seqüências protéicas a partir da informação do mrna existem diversos bancos de seqüências protéicas deduzidas.

Resultado busca proteína Seqüências que possuem seqüências similares com estrutura tridimensional resolvida Seqüências de referencia

Exemplo de um registro Link para seqüência de nucleotídeo a partir da qual este proteína foi deduzida

Buscando entender a função de uma proteína através dos dados disponíveis Exemplo de um deposito Qual será a função desta proteína?

Buscando entender a função de uma proteína através dos dados disponíveis Depósitos de alguns bancos (Swiss-prot por exemplo) já possuem no deposito uma descrição da função da proteína

Buscando entender a função de uma proteína através dos dados disponíveis Muitos depósitos apontam para referencias que realizaram estudos com a proteína em questão

Buscando entender a função de uma proteína através dos dados disponíveis É possível obter informações sobre a proteína depositada em outros bancos do NCBI, no exemplo é mostrado o OMIM que é um catalogo de genes humanos e desordens geneticas

Busca por organismo no taxonomy browser Depósitos nos diferentes bancos de dados de informações relacionadas a este organismo