BANCO DE DADOS BIOLÓGICOS Aula 11

Documentos relacionados
Turma de terça-feira 14 hs. Total: 31 alunos

Estudos das ômicas: Genômica; Transcriptomica; Metagenômica. Aula 7

Bioinformática aplicada ao estudo e análise de Genes e Genomas Aula Teórico e Prá/ca

Identificação de Padrões em Proteínas Utilizando a Ferramenta de Bioinformática CD- Search

Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica. João Varela

Banco de Dados Biológicos

Bases de Dados. Freqüentemente usadas em. Bioinformática

Busca em banco de dados

Bioinformática Aplicada ao Estudo e Análise de Genes e Genomas. Prof. Dr. Alessandro de M. Varani Dep. de Tecnologia - UNESP, FCAV

Busca em banco de dados

ANÁLISE DE TANDEM REPEATS CODIFICANTES EM GENOMAS BACTERIANOS

IBM1029 Introdução à Bioinformática. O Início da Bioinformática 27/03/2017. Aula 2. O Início. Bioionformática: definição

Bioinformática e Genética Animal. Pâmela A. Alexandre Doutoranda

Bioinformática. Tipos de Bases de Dados (BD) Principais BD Primárias. Bases de dados Não-Redundantes. 3 - Bases de dados

Introdução à Bioinformática e Aplicações

Banco de Dados aplicado a Sistemas Biológicos

Prof. Dr. Rodrigo Matheus Pereira. Faculdade de Ciências Biológicas e Ambentais FCBA-UFGD

ESTUDOS DAS ÔMICAS: GENÔMICA VS TRANSCRIPTÔMICA E METAGENÔMICA. Aula 7. Maria Carolina Quecine Departamento de Genética

Número de genes versus número de proteínas em eucariotos

Bioinformática para o Citrus EST Project (CitEST)

- Sequenciamento de genomas nada mais é que a determinação da ordem linear dos nucleotídeos ou bases nitrogenadas de um genoma.

Instituto Superior de Ciências da Saúde-Norte Curso de Bioquímica 2ºAno Projecto Tutorial BIOINFORMÁTICA

Programa Analítico de Disciplina BQI460 Bioinformática

O surgimento da Bioinformática Banco de Dados Biológicos

IDENTIFICAÇÃO DE SEQUÊNCIAS POR HIBRIDIZAÇÃO E SEQUENCIAMENTO. Aula 5. Maria Carolina Quecine Departamento de Genética

Marcelo Reis. Centro APTA Citros Sylvio Moreira. 18 de julho de 2007

O que é Bioinformática?

MIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin

Universidade Estadual de Maringá - UEM

Anotação de Genomas. Fabiana G. S. Pinto

introdução ao curso

Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Ciências Biomédicas, Engenharia Biológica. João Varela

Introdução a Bioinformática

BIBLIOTECAS DE DNA E HIBRIDIZAÇÃO. FABIANA SEIXAS

Princípios de Genética Molecular e Introdução a Genômica

Bancos de Dados Biológicos. CCM205 Sistema de Bancos de Dados Ugo Henrique Pereira da Silva Professora Maria Camila N. Barioni

O quarto paradigma: a ciência da análise de dados

Métodos de alinhamento de sequências biológicas. Marcelo Falsarella Carazzolle

Transcrição do DNA. Dogma central. O fluxo da informação é unidirecional. Refutação definitiva da herança dos caracteres adquiridos 26/04/2015

((lambda (h q) (list h (list q h) (list q q))) (quote (lambda (h q) (list h (list q h) (list q q)))) (quote quote))

Universidade Federal do Espírito Santo Centro de Ciências da Saúde Programa de Pós-Graduação em Biotecnologia

Banco de Dados Biológicos conceitos básicos, indexação, VSTree

Princípios de Sistemática Molecular

ANÁLISE ESTRUTURAL IN SILICO

Este capítulo possui uma discussão preliminar do contexto biológico necessário para o entendimento e motivação deste trabalho.

RENATO APARECIDO FRIZANCO UM ESTUDO SOBRE A BIOINFORMÁTICA: DISTINÇÃO DOS TIPOS DE DADOS E AS DIFERENTES BASES DE DADOS EXISTENTES

Cadastramento de UC Eletiva - Campus São Paulo

Uso de microarrays e RNA-seq para a medida de níveis relativos de transcrição

Introdução a Bioinformática Curso de Verão Nivelamento na área de Biológicas

ORGANIZAÇÃO DO GENOMA HUMANO. Departamento de Genética. Nilce M. Martinez Rossi

Introdução a Bioinformática

DATAMINING DOS GENES DA CELULOSE SINTASE RELACIONADOS COM ESTs DE Eucalyptus spp. (NOTA CIENTÍFICA) 1

Transcritômica. João Carlos Setubal IQ/USP outubro de 2013

UNIVERSIDADE ABERTA DO BRASIL/UNIVERSIDADE FEDERAL DE SÃO PAULO ESPECIALIZAÇÃO EM INFORMÁTICA EM SAÚDE TRABALHO DE CONCLUSÃO DE CURSO 2016/2

Departamento de Genética Nilce M. Martinez Rossi

UFPel CDTec Biotecnologia. Anotação de genomas. MSc. Frederico schmitt Kremer

BIOLOGIA. Moléculas, células e tecidos. Transcrição e tradução Parte 1. Professor: Alex Santos

A BIOINFORMÁTICA APLICADA NO MELHORAMENTO DE PLANTAS

Organização Gênica de Eucariotos. Prof. Odir A. Dellagostin

Roteiro. Principais Tarefas. Biologia Computacional e Bioinformática. Motivação. Motivação. Biologia Molecular, IA e bioinformática

CONSTRUÇÃO DE UMA BASE DE DADOS GENÉTICOS A PARTIR DE UM INVENTÁRIO DE INTRONS PROCESSADOS EM GENOMA HUMANO

Aula 2 - Revisão DNA RNA - PROTEÍNAS

Profa. Dra. Cecília Dias Flores

Versão 0.3 Capítulo 5. Bancos de dados. Estrutura e modelos de dados

Plano de Ensino. Qualificação/link para o Currículo Lattes: Teoria Exercício Laboratório 45 15

Profa. Dra. Viviane Nogaroto

Metagenômica e sequenciamento de nova geração. Fabrício Campos 25 de junho de 2015

DOGMA CENTRAL DA BIOLOGIA MOLECULAR

Genômica. Desenvolvimento e Aplicações. Prof. Manoel Victor

Transcrição: Síntese de RNA Tradução: Síntese Proteica

Elisa Boari de Lima Orientador: Thiago de Souza Rodrigues

Bases e aplicações. da tecnologia do DNA recombinante

Programas de Alinhamento. Sumário

Organização do genoma e variação individual

Seqüenciamento de DNA

Sequenciamento de genoma e transcriptomas

Transcrição gênica. Prof. Mateus Grangeiro

Prof. João Carlos Setubal

UNIVERSIDADE DE CAXIAS DO SUL Centro de Computação e Tecnologia da Informação Curso de Bacharelado em Sistemas de Informação DOUGLAS PICOLOTTO

Prof. Marcelo Langer. Curso de Biologia. Aula 26 Genética

A atuação profissional do graduado em Biotecnologia.

Anotação de Genomas. Prof. Dr. Alessandro Varani UNESP - FCAV

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro

IMPLANTAÇÃO DE METODOLOGIAS PARA ANÁLISE COMPARATIVA DE SEQUÊNCIAS GENÔMICAS RELACIONADAS AO CÂNCER DE PELE

Sequenciamento Montagem Anotação

Aula 3 - Revisão Replicação, Transcrição, Tradução

IV Congresso Brasileiro de Mamona e I Simpósio Internacional de Oleaginosas Energéticas, João Pessoa, PB 2010 Página 255

TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO DE GRADUAÇÃO

Ferramentas de bioinformática na caracterização de alvos de medicamentos

Metagenômica. João Carlos Setubal IQ/USP

Predição de novo de genes

Biologia Molecular e Celular- 2019

Gene: evolução do conceito

AVALIAÇÃO DE SOFTWARES PARA PREDIÇÃO DE CLUSTERS GÊNICOS: UMA ANÁLISE

GENOMAS. Prof. Dr. Marcelo Ricardo Vicari

Sistema Web para Processamento de Dados Genômicos

DNA, Cromossomos e Replicação. Capítulos 5 e 6 (pág ) - Fundamentos da Biologia Celular - Alberts- 2ª edição

Introdução à Bioquímica

1 de 7 19/12/ :16

ÁCIDOS NUCLÉICOS 15/6/2010. Universidade Federal de Mato Grosso Disciplina de Bioquímica. - Desoxirribose, presente no DNA; - Ribose, presente no RNA.

Transcrição:

BANCO DE DADOS BIOLÓGICOS Aula 11

Estudo dirigido 1. O que fazer com uma sequência de DNA? 2. Bancos de dados públicos e internacionais: GenBank, ENA, DDBJ; 3. NCBI; EMBL; DDBJ; 4. Sequências completas de genomas de organismos dos três domínios; 5. Definição de Bioinformática; 6. Análise da sequência no GenBank; 7. Busca de sequências por similaridade; 8. BLAST e Banco de dados de sequências.

DOGMA CENTRAL Informação da sequência do genôma GENOMA Informação da expressão gênica: mrna; cdna; EST. RNAseq TRANSCRIPTOMA Informação proteína: inferência ou sequenciamento direto PROTEOMA INFORMAÇÕES DE FUNÇÃO

Sequências de Nucleotídeos Sequências de Proteínas Estrutura das Proteínas Função das Proteínas NCBI EMBL DDBJ UniProt PIR TrEMBL PDB Merops Enzyme TCDB

Sequencing costs NIH: https://www.genome.gov/sequencingcostsdata/

2.365,5 trilhões de bases 18 trilhões de sequências Nucleic Acids Research, 2016, Vol. 44, Database issue doi: 10.1093/nar/gkv1323

Total de Projetos no GOLD (domínios da vida) BACTERIA : 87 651 EUKARYA : 36 577 ARCHAEA: 1 560 https://gold.jgi-psf.org/statistics Vírus: 8 844 Metagenômica: 26 642

TTCATACTTGGTTAAGACCTTTACAAGCCGACCAACGTGGTGACAGTGTCGTCCTTTA CGCACCGAATCCCTTTATCATTGAATTAGTAGAAGAGCGATACTTAGGACGTCTTCGG ATGGAATCTTGGTCCCGTTGCCTGGAACGTCTTGAAACTGAATTCCCGCCAGAAGATG TTCATACTTGGTTAAGACCTTTACAAGCCGACCAACGTGGTGACAGTGTCGTCCTTTA CGCACCGAATCCCTTTATCATATTGAATTAGTAGAAGAGCGATACTTAGGACGTCTTC GGGAATTGTTATCCTATTTCTCAGGAATACGTGAAGTAGTCCTTGCAATTGGCTCACG ACCTAAAACAACAGAACTACCCGTACCAGTAGACACTACAGGACGTTTGTCTTCAACA GTCCCATTTAACGGAAATCTCGACACACACTATAACTTTGATAATTTTGTTGAGGGAC GAAGCAATCAACTCGCTCGTGCTGCAGCTTGGCAAGCGGCACAGAAACCGGGAGACCG TACTCACAACCCTCTATTGCTCTATGGTGGGACTGGTTTGGGTAAAACCCATTTAATG TTTGCTGCAGGTAACGTAATGCGGCAAGTAAACCCAACTTATAAAGTAATGTATCTTC GTTCGGAACAGTTTTTCAGCGCCATGATAAGAGCGTACAAGATAAAAGTATGGATCAT AAGGGTAAAACCCATTTAATGTTTGCTGCAGGTAACGTAATGCGGCAAGTAAACCCAA CTTATAAAGTAATGTATCTTCGTTCGGAACAGTTTTTCAGCGCCATGATAAGAGCGTA CAAGATAAAAGTATGGATCATAAGGGTAAAACCCATTTAATGTTTGCTGCAGGTAACG TAATGCGGCAAGTAAACCCAACTTATAAAGTAATGTATCTTCGTTCGGAACAGTTTTT CAGCGCCATGATAAGAGCGTACAAGATAAAAGTATGGATCATAAAACGTAATGCGGCA AGTAAACCCAACTTATAAAGTAATGTATCTTCGTTCGGAACAGGGTAAAACCCATTTA ATGTTTGCTGCAGGTAACGTAATGCGGCAAGTAAACCCAACTTATAAAGTAATGTATC TTCGTTCGGAACAGTTTTTCAGCGCCATGATAAGAGCGTACAAGATAAAAGTATGGAT CATAAAACGTAATGCGGCAAGTAAACCCAACTTATAAAGTAATGTATCTTCGTTCGGA ACAAAAACGTAATGCGGCAAGTAAACCCAACTTATAAAGTAATGTATCTTCGTTCGGA

Reverse genetics: https://en.wikipedia.org/wiki/reverse_genetics

A C G C A G A T A T C A G C T A A C G C A G A T A T C A G C T A A C G C A G A T A T C A G C T A A C G C A G A T A T C A G C T A A C G C A G A T A T C A G C T A A C G C A G A T A T C A G C T A A C G C A G A T A T C A G C T A Fita de DNA Quadro de leitura +1 Quadro de leitura +2 Quadro de leitura +3 Quadro de leitura -1 Quadro de leitura -2 Quadro de leitura -3

Bioinformática A bioinformática consiste no desenvolvimento de métodos computacionais, matemáticos e estatísticos para organizar e analisar informações biológicas em grande escala e de maneira integrada. Organização e Armazenamento - Bancos de Dados Biológicos Visualização e Análise - Ferramentas computacionais - Montagem de genomas - Compreensão do significado biológico

Bancos de dados Japan CIB/NIG 667.903 espécies representadas (UniProtKB/TrEMBL 2016_07) 15.536 genomas (Eukarya, Archeae, Bacteria) (GOLD database) National Center for Biotechnology Information (NCBI) National Institutes of Health (NIH) Maryland, EUA USA NCBI/NLM INSDC http://www.insdc.org/ Europe EBI/EMBL European Molecular Biology Laboratory (EMBL) European Bioinformatics Institute (EBI) Hinxton, Inglaterra DNA Data Bank of Japan (DDBJ) Center for Information Biology and DNA Data Bank of Japan (CIB-DDBJ) Mishima, Japão

National Center for Biotechnology Information (NCBI) http://www.ncbi.nlm.nih.gov/

Ocean pout vive em regiões polares http://www.unilever.com/innovation/productinnovations/coolicecreaminnovations/ http://academicsreview.org/reviewed-content/genetic-roulette/section-7/part-7-3/

http://www.ncbi.nlm.nih.gov/nuccore/x07506?

FORMATO FASTA?? NUCLEOTÍDEOS >gi 47933333 gb AY262820.1 Pinus radiata cellulose synthase (CesA10) mrna, complete cds GCACGAGGATTTAATCGAACTCGGTAATTGTTATCATCGTGGTGAGGACTAGTGCTTGATATTTTAGTTT TATTCTCGAAATTTCATAATAGCTTGGGCTTTCTAAAAAGGGGAATGGTGGAATGGGTGTGAGAGTGAAG AGGAATGGTATCGAACCACTAAGAAAAGTAGTCGTGCAAGTATTAGATGGTTGGCTGTGATAGTTGGAAA PROTEÍNAS >gi 47933334 gb AAQ63935.1 cellulose synthase [Pinus radiata] MEARTNTAAGSNKRNVRVSVRDDGELGPKPPQHINSHICQICGEDVGLAADGEFFVACNECAFPVCRPCY EYEWKDGNQSCPQCKTRYKWHKGSPQVDGDKEDECADDLDHDFNSTQGNRNEKQQIAEAMLHWQMAYGRG EDVGPSRSESQELPQLQVPLITNGQAISGELPAGSSEYRRIAAPPTGGGSGKRVHPLPFPDSTQTGQVRA >LINHA DO NOME MÁXIMA DE 80 CARACTERES POR LINHA

https://blast.ncbi.nlm.nih.gov/blast.cgi

BLAST (NCBI)

BLAST (NCBI) QUIZ Formato FASTA: formato universalmente aceito para se processado >sequência 1 PQLVALGLALLCAVAGPAAAQNCGCQPNVCCSKFGYCGTTDEYCGDGCQSGPCRSGRGGGGSGGGGANVA SVVTSSFFNGIKNQAGSGCEGKNFYTRSAFLSAVKGYPGFAHGGSQVQGKREIAAFFAHATHETGHFCYI SEINKSNAYCDPTKRQWPCAAGQKYYGRGPLQISWNYNYGPAGRAIGFDGLGDPGRVARDAVVAFKAALW FWMNSVHGVVPQGFGATTRAMQRALECGGNNPAQMNARVGYYRQYCRQLGVDPGPNLTC >sequência 2 ATGTTAGATACTAATAAAGTTTATGAAATAAGCAATCTTGCTAATGGATTATATACATCAACTTATTTAA GTCTTGATGATTCAGGTGTTAGTTTAATGAGTAAAAAGGATGAAGATATTGATGATTACAATTTAAAATG GTTTTTATTTCCTATTGATAATAATCAATATATTATTACAAGCTATGGAGCTAATAATTGTAAAGTTTGG AATGTTAAAAATGATAAAATAAATGTTTCAACTTATTCTTCAACAAACTCTGTACAAAAATGGCAAATAA AAGCTAAAGATTCTTCATATATAATACAAAGTGATAATGGAAAGGTCTTAACAGCAGGAGTAGGTGAATC TCTTGGAATAGTACGCCTAACTGATGAATTTCCAGAGAATTCTAACCAACAATGGAATTTAACTCCTGTA CAAACAATTCAACTCCCACAAAAACCTAAAATAGATGAAAAATTAAAAGATCATCCTGAATATTCAGAAA CCGGAAATATAAATCCTAAAACAACTCCTCAATTAATGGGATGGACATTAGTACCTTGTATTATGGTAAA TGATTCAGGAATAGATAAAAACACTCAAATTAAAACTACTCCATATTATATTTTTAAAAAATATAAATAC TGGAATCTAGCAAAAGGAAGTAATGTATCTTTACTTCCACATCAAAAAAGATCATATGATTATGAATGGG GTACAGAAAAAAATCAAAAAACATCTATTATTAATACAGTAGGATTGCAAATTAATATAGATTCAGGAAT GAAATTTGAAGTACCAGAAGTAGGAGGAGGTACAGAAGACATAAAAACACAATTAACTGAAGAATTAAAA GTTGAATATAGCACTGAAACCAAAATAATGACGAAATATCAAGAACACTCAGAGATAGATAATCCAACTA ATCAACCAATGAATTCTATAGGACTTCTTATTTATACTTCTTTAGAATTATATCGATATAACGGTACAGA AATTAAGATAATGGACATAGAAACTTCAGATCATGATACTTACACTCTTACTTCTTATCCAAATCATAAA GAAGCATTATTACTTCTCACAAACCATTCGTATGAAGAAGTAGAAGAAATAACAAAAATACCTAAGCATA CACTTATAAAATTGAAAAAACATTATTTTAAAAAATAA

Exercício: http://www.ncbi.nlm.nih.gov/nuccore/m63845.1 http://www.uniprot.org/uniprot/p0a370 1) Quantos nucleotídeos tem o gene que codifica a proteina? 2) Quantos nucleodídeos tem a região codante? 3) Qual a localização das regiões regulatórias? 4) Quantos exons e introns tem o gene?

Estudo dirigido 1. O que fazer com uma sequência de DNA? 2. Bancos de dados públicos e internacionais: GenBank, ENA, DDBJ; 3. NCBI; EMBL; DDBJ; 4. Sequências completas de genomas de organismos dos três domínios; 5. Definição de Bioinformática; 6. Análise da sequência no GenBank; 7. Busca de sequências por similaridade; 8. BLAST e Banco de dados de sequências.