Turma de terça-feira 14 hs. Total: 31 alunos

Documentos relacionados
BANCO DE DADOS BIOLÓGICOS Aula 11

Estudos das ômicas: Genômica; Transcriptomica; Metagenômica. Aula 7

Bioinformática aplicada ao estudo e análise de Genes e Genomas Aula Teórico e Prá/ca

Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica. João Varela

Identificação de Padrões em Proteínas Utilizando a Ferramenta de Bioinformática CD- Search

Busca em banco de dados

Banco de Dados Biológicos

Bases de Dados. Freqüentemente usadas em. Bioinformática

Busca em banco de dados

Bioinformática Aplicada ao Estudo e Análise de Genes e Genomas. Prof. Dr. Alessandro de M. Varani Dep. de Tecnologia - UNESP, FCAV

IBM1029 Introdução à Bioinformática. O Início da Bioinformática 27/03/2017. Aula 2. O Início. Bioionformática: definição

ANÁLISE DE TANDEM REPEATS CODIFICANTES EM GENOMAS BACTERIANOS

ESTUDOS DAS ÔMICAS: GENÔMICA VS TRANSCRIPTÔMICA E METAGENÔMICA. Aula 7. Maria Carolina Quecine Departamento de Genética

introdução ao curso

Bioinformática. Tipos de Bases de Dados (BD) Principais BD Primárias. Bases de dados Não-Redundantes. 3 - Bases de dados

- Sequenciamento de genomas nada mais é que a determinação da ordem linear dos nucleotídeos ou bases nitrogenadas de um genoma.

Introdução à Bioinformática e Aplicações

Bioinformática para o Citrus EST Project (CitEST)

Bioinformática e Genética Animal. Pâmela A. Alexandre Doutoranda

IDENTIFICAÇÃO DE SEQUÊNCIAS POR HIBRIDIZAÇÃO E SEQUENCIAMENTO. Aula 5. Maria Carolina Quecine Departamento de Genética

Banco de Dados aplicado a Sistemas Biológicos

Número de genes versus número de proteínas em eucariotos

Programa Analítico de Disciplina BQI460 Bioinformática

Instituto Superior de Ciências da Saúde-Norte Curso de Bioquímica 2ºAno Projecto Tutorial BIOINFORMÁTICA

Prof. Dr. Rodrigo Matheus Pereira. Faculdade de Ciências Biológicas e Ambentais FCBA-UFGD

O que é Bioinformática?

Anotação de Genomas. Fabiana G. S. Pinto

Métodos de alinhamento de sequências biológicas. Marcelo Falsarella Carazzolle

Introdução a Bioinformática

O surgimento da Bioinformática Banco de Dados Biológicos

Sequenciamento de genoma e transcriptomas

Marcelo Reis. Centro APTA Citros Sylvio Moreira. 18 de julho de 2007

BIBLIOTECAS DE DNA E HIBRIDIZAÇÃO. FABIANA SEIXAS

Sequenciamento de genoma e transcriptomas

Universidade Federal do Espírito Santo Centro de Ciências da Saúde Programa de Pós-Graduação em Biotecnologia

Universidade Estadual de Maringá - UEM

Transcrição do DNA. Dogma central. O fluxo da informação é unidirecional. Refutação definitiva da herança dos caracteres adquiridos 26/04/2015

ORGANIZAÇÃO DO GENOMA HUMANO. Departamento de Genética. Nilce M. Martinez Rossi

Prof. João Carlos Setubal

Este capítulo possui uma discussão preliminar do contexto biológico necessário para o entendimento e motivação deste trabalho.

Transcritômica. João Carlos Setubal IQ/USP outubro de 2013

Introdução a Bioinformática

Programas de Alinhamento. Sumário

Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Ciências Biomédicas, Engenharia Biológica. João Varela

Cadastramento de UC Eletiva - Campus São Paulo

Departamento de Genética Nilce M. Martinez Rossi

O quarto paradigma: a ciência da análise de dados

Princípios de Genética Molecular e Introdução a Genômica

MIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin

Bancos de Dados Biológicos. CCM205 Sistema de Bancos de Dados Ugo Henrique Pereira da Silva Professora Maria Camila N. Barioni

ANÁLISE ESTRUTURAL IN SILICO

Sequenciamento Montagem Anotação

Uso de microarrays e RNA-seq para a medida de níveis relativos de transcrição

Elisa Boari de Lima Orientador: Thiago de Souza Rodrigues

Genômica. Desenvolvimento e Aplicações. Prof. Manoel Victor

Introdução a Bioinformática Curso de Verão Nivelamento na área de Biológicas

RENATO APARECIDO FRIZANCO UM ESTUDO SOBRE A BIOINFORMÁTICA: DISTINÇÃO DOS TIPOS DE DADOS E AS DIFERENTES BASES DE DADOS EXISTENTES

Sistema Web para Processamento de Dados Genômicos

UNIVERSIDADE ABERTA DO BRASIL/UNIVERSIDADE FEDERAL DE SÃO PAULO ESPECIALIZAÇÃO EM INFORMÁTICA EM SAÚDE TRABALHO DE CONCLUSÃO DE CURSO 2016/2

CONSTRUÇÃO DE UMA BASE DE DADOS GENÉTICOS A PARTIR DE UM INVENTÁRIO DE INTRONS PROCESSADOS EM GENOMA HUMANO

((lambda (h q) (list h (list q h) (list q q))) (quote (lambda (h q) (list h (list q h) (list q q)))) (quote quote))

Biologia Molecular e Celular- 2019

Banco de Dados Biológicos conceitos básicos, indexação, VSTree

Princípios de Sistemática Molecular

Sessão 1: Os Princípios e as Técnicas da Biologia Molecular do Séc XXI

Bases e aplicações. da tecnologia do DNA recombinante

Enzimas de restrição

DATAMINING DOS GENES DA CELULOSE SINTASE RELACIONADOS COM ESTs DE Eucalyptus spp. (NOTA CIENTÍFICA) 1

Plano de Ensino. Qualificação/link para o Currículo Lattes: Teoria Exercício Laboratório 45 15

A BIOINFORMÁTICA APLICADA NO MELHORAMENTO DE PLANTAS

Profa. Dra. Cecília Dias Flores

Introdução à Bioquímica

2 Contexto Biológico Genômica

UFPel CDTec Biotecnologia. Anotação de genomas. MSc. Frederico schmitt Kremer

Organização Gênica de Eucariotos. Prof. Odir A. Dellagostin

Tecnologia do DNA recombinante. John Wiley & Sons, Inc.

Roteiro. Principais Tarefas. Biologia Computacional e Bioinformática. Motivação. Motivação. Biologia Molecular, IA e bioinformática

DOGMA CENTRAL DA BIOLOGIA MOLECULAR

Aula 2 - Revisão DNA RNA - PROTEÍNAS

Prof. Marcelo Langer. Curso de Biologia. Aula 26 Genética

UFPel CDTec PPGB. Plataformas de NGS. Frederico Kremer

Créditos. Introdução. Sumário. Agradecimento. Introdução. Análise de Expressão Gênica. Tecnologia de Microarray

U n i v e rsidade Es tadual de Maringá Centro de Ciências Biológicas /... Res. 022/2012-CI/CCB fl. 1

Transcrição: Síntese de RNA Tradução: Síntese Proteica

Anotação de Genomas. Prof. Dr. Alessandro Varani UNESP - FCAV

Metagenômica e sequenciamento de nova geração. Fabrício Campos 25 de junho de 2015

Transcrição gênica. Prof. Mateus Grangeiro

Seqüenciamento de DNA

IV Congresso Brasileiro de Mamona e I Simpósio Internacional de Oleaginosas Energéticas, João Pessoa, PB 2010 Página 255

BIOLOGIA. Moléculas, células e tecidos. Transcrição e tradução Parte 1. Professor: Alex Santos

Principais algoritmos de alinhamento de sequências genéticas. Alexandre dos Santos Cristino

SERVIÇO PÚBLICO FEDERAL UNIVERSIDADE FEDERAL DE GOIÁS CÃMPUS JATAÍ PLANO DE ENSINO

Versão 0.3 Capítulo 5. Bancos de dados. Estrutura e modelos de dados

Profa. Dra. Viviane Nogaroto

Programa Doutoral Genética Médica 2009

DNA recombinante. Nilce M. Martinez Rossi Depto de Genética

Ferramentas de bioinformática na caracterização de alvos de medicamentos

GENOMAS. Prof. Dr. Marcelo Ricardo Vicari

Introdução às Tecnologias de Sequeciamento: Sanger e Nova Geração (NGS)

Transcrição:

n. alunos Turma de terça-feira 14 hs 14 Distribuição de notas 12 10 8 6 4 2 Média = 6,7 0 0 -- 2 2 -- 4 4 -- 6 6 -- 8 8 -- 10 notas 18 alunos Total: 31 alunos

BANCO DE DADOS BIOLÓGICOS Aula 12

Estudo dirigido 1. O que fazer com uma sequência de DNA? 2. Bancos de dados públicos e internacionais: GenBank, ENA, DDBJ; 3. NCBI; EMBL; DDBJ; 4. Sequências completas de genomas de organismos dos três domínios; 5. Definição de Bioinformática; 6. Análise da sequência no GenBank; 7. Busca de sequências por similaridade; 8. BLAST e Banco de dados de sequências.

DOGMA CENTRAL Informação da sequência do genôma GENOMA Informação da expressão gênica: mrna; cdna; EST. RNAseq TRANSCRIPTOMA Informação proteína: inferência ou sequenciamento direto PROTEOMA INFORMAÇÕES DE FUNÇÃO

Sequências de Nucleotídeos Sequências de Proteínas Estrutura das Proteínas Função das Proteínas NCBI EMBL DDBJ UniProt PIR TrEMBL PDB Merops Enzyme TCDB

Montagem de Genomas DNA genômico Fragmentos (enzimas de restrição) que serão clonados e sequenciados Seqências Contínuas Alinhadas Sequência Final Consenso

Developments in high throughput sequencing July 2016 edition

Sequencing costs NIH: https://www.genome.gov/sequencingc ostsdata/

2.365,5 trilhões de bases 18 trilhões de sequências Nucleic Acids Research, 2016, Vol. 44, Database issue doi: 10.1093/nar/gkv1323

Total de Projetos no GOLD (domínios da vida) BACTERIA : 38,872 EUKARYA : 9,324 Relevância dos Projetos ARCHAEA: 931 https://gold.jgi-psf.org/statistics

TTCATACTTGGTTAAGACCTTTACAAGCCGACCAACGTGGTGACAGTGTCGTCCTTTA CGCACCGAATCCCTTTATCATTGAATTAGTAGAAGAGCGATACTTAGGACGTCTTCGG ATGGAATCTTGGTCCCGTTGCCTGGAACGTCTTGAAACTGAATTCCCGCCAGAAGATG TTCATACTTGGTTAAGACCTTTACAAGCCGACCAACGTGGTGACAGTGTCGTCCTTTA CGCACCGAATCCCTTTATCATATTGAATTAGTAGAAGAGCGATACTTAGGACGTCTTC GGGAATTGTTATCCTATTTCTCAGGAATACGTGAAGTAGTCCTTGCAATTGGCTCACG ACCTAAAACAACAGAACTACCCGTACCAGTAGACACTACAGGACGTTTGTCTTCAACA GTCCCATTTAACGGAAATCTCGACACACACTATAACTTTGATAATTTTGTTGAGGGAC GAAGCAATCAACTCGCTCGTGCTGCAGCTTGGCAAGCGGCACAGAAACCGGGAGACCG TACTCACAACCCTCTATTGCTCTATGGTGGGACTGGTTTGGGTAAAACCCATTTAATG TTTGCTGCAGGTAACGTAATGCGGCAAGTAAACCCAACTTATAAAGTAATGTATCTTC GTTCGGAACAGTTTTTCAGCGCCATGATAAGAGCGTACAAGATAAAAGTATGGATCAT AAGGGTAAAACCCATTTAATGTTTGCTGCAGGTAACGTAATGCGGCAAGTAAACCCAA CTTATAAAGTAATGTATCTTCGTTCGGAACAGTTTTTCAGCGCCATGATAAGAGCGTA CAAGATAAAAGTATGGATCATAAGGGTAAAACCCATTTAATGTTTGCTGCAGGTAACG TAATGCGGCAAGTAAACCCAACTTATAAAGTAATGTATCTTCGTTCGGAACAGTTTTT CAGCGCCATGATAAGAGCGTACAAGATAAAAGTATGGATCATAAAACGTAATGCGGCA AGTAAACCCAACTTATAAAGTAATGTATCTTCGTTCGGAACAGGGTAAAACCCATTTA ATGTTTGCTGCAGGTAACGTAATGCGGCAAGTAAACCCAACTTATAAAGTAATGTATC TTCGTTCGGAACAGTTTTTCAGCGCCATGATAAGAGCGTACAAGATAAAAGTATGGAT CATAAAACGTAATGCGGCAAGTAAACCCAACTTATAAAGTAATGTATCTTCGTTCGGA ACAAAAACGTAATGCGGCAAGTAAACCCAACTTATAAAGTAATGTATCTTCGTTCGGA

Reverse genetics: https://en.wikipedia.org/wiki/reverse_genetics

Bioinformática A bioinformática consiste no desenvolvimento de métodos computacionais, matemáticos e estatísticos para organizar e analisar informações biológicas em grande escala e de maneira integrada. Organização e Armazenamento - Bancos de Dados Biológicos Visualização e Análise - Ferramentas computacionais - Montagem de genomas - Compreensão do significado biológico

Bancos de dados Japan CIB/NIG 667.903 espécies representadas (UniProtKB/TrEMBL 2016_07) 15.536 genomas (Eukarya, Archeae, Bacteria) (GOLD database) National Center for Biotechnology Information (NCBI) National Institutes of Health (NIH) Maryland, EUA USA NCBI/NLM INSDC http://www.insdc.org/ Europe EBI/EMBL European Molecular Biology Laboratory (EMBL) European Bioinformatics Institute (EBI) Hinxton, Inglaterra DNA Data Bank of Japan (DDBJ) Center for Information Biology and DNA Data Bank of Japan (CIB-DDBJ) Mishima, Japão

National Center for Biotechnology Information (NCBI) http://www.ncbi.nlm.nih.gov/

Ocean pout vive em regiões polares http://www.unilever.com/innovation/productinnovations/coolicecreaminnovations/ http://academicsreview.org/reviewed-content/genetic-roulette/section-7/part-7-3/

http://www.ncbi.nlm.nih.gov/nuccore/x07506?

FORMATO FASTA?? NUCLEOTÍDEOS >gi 47933333 gb AY262820.1 Pinus radiata cellulose synthase (CesA10) mrna, complete cds GCACGAGGATTTAATCGAACTCGGTAATTGTTATCATCGTGGTGAGGACTAGTGCTTGATATTTTAGTTT TATTCTCGAAATTTCATAATAGCTTGGGCTTTCTAAAAAGGGGAATGGTGGAATGGGTGTGAGAGTGAAG AGGAATGGTATCGAACCACTAAGAAAAGTAGTCGTGCAAGTATTAGATGGTTGGCTGTGATAGTTGGAAA PROTEÍNAS >gi 47933334 gb AAQ63935.1 cellulose synthase [Pinus radiata] MEARTNTAAGSNKRNVRVSVRDDGELGPKPPQHINSHICQICGEDVGLAADGEFFVACNECAFPVCRPCY EYEWKDGNQSCPQCKTRYKWHKGSPQVDGDKEDECADDLDHDFNSTQGNRNEKQQIAEAMLHWQMAYGRG EDVGPSRSESQELPQLQVPLITNGQAISGELPAGSSEYRRIAAPPTGGGSGKRVHPLPFPDSTQTGQVRA >LINHA DO NOME MÁXIMA DE 80 CARACTERES POR LINHA

A C G C A G A T A T C A G C T A A C G C A G A T A T C A G C T A A C G C A G A T A T C A G C T A A C G C A G A T A T C A G C T A A C G C A G A T A T C A G C T A A C G C A G A T A T C A G C T A A C G C A G A T A T C A G C T A Fita de DNA Quadro de leitura +1 Quadro de leitura +2 Quadro de leitura +3 Quadro de leitura -1 Quadro de leitura -2 Quadro de leitura -3

https://blast.ncbi.nlm.nih.gov/blast.cgi

BLAST (NCBI)

BLAST (NCBI) QUIZ Formato FASTA: formato universalmente aceito para se processado >sequência 1 PQLVALGLALLCAVAGPAAAQNCGCQPNVCCSKFGYCGTTDEYCGDGCQSGPCRSGRGGGGSGGGGANVA SVVTSSFFNGIKNQAGSGCEGKNFYTRSAFLSAVKGYPGFAHGGSQVQGKREIAAFFAHATHETGHFCYI SEINKSNAYCDPTKRQWPCAAGQKYYGRGPLQISWNYNYGPAGRAIGFDGLGDPGRVARDAVVAFKAALW FWMNSVHGVVPQGFGATTRAMQRALECGGNNPAQMNARVGYYRQYCRQLGVDPGPNLTC >sequência 2 ATGTTAGATACTAATAAAGTTTATGAAATAAGCAATCTTGCTAATGGATTATATACATCAACTTATTTAA GTCTTGATGATTCAGGTGTTAGTTTAATGAGTAAAAAGGATGAAGATATTGATGATTACAATTTAAAATG GTTTTTATTTCCTATTGATAATAATCAATATATTATTACAAGCTATGGAGCTAATAATTGTAAAGTTTGG AATGTTAAAAATGATAAAATAAATGTTTCAACTTATTCTTCAACAAACTCTGTACAAAAATGGCAAATAA AAGCTAAAGATTCTTCATATATAATACAAAGTGATAATGGAAAGGTCTTAACAGCAGGAGTAGGTGAATC TCTTGGAATAGTACGCCTAACTGATGAATTTCCAGAGAATTCTAACCAACAATGGAATTTAACTCCTGTA CAAACAATTCAACTCCCACAAAAACCTAAAATAGATGAAAAATTAAAAGATCATCCTGAATATTCAGAAA CCGGAAATATAAATCCTAAAACAACTCCTCAATTAATGGGATGGACATTAGTACCTTGTATTATGGTAAA TGATTCAGGAATAGATAAAAACACTCAAATTAAAACTACTCCATATTATATTTTTAAAAAATATAAATAC TGGAATCTAGCAAAAGGAAGTAATGTATCTTTACTTCCACATCAAAAAAGATCATATGATTATGAATGGG GTACAGAAAAAAATCAAAAAACATCTATTATTAATACAGTAGGATTGCAAATTAATATAGATTCAGGAAT GAAATTTGAAGTACCAGAAGTAGGAGGAGGTACAGAAGACATAAAAACACAATTAACTGAAGAATTAAAA GTTGAATATAGCACTGAAACCAAAATAATGACGAAATATCAAGAACACTCAGAGATAGATAATCCAACTA ATCAACCAATGAATTCTATAGGACTTCTTATTTATACTTCTTTAGAATTATATCGATATAACGGTACAGA AATTAAGATAATGGACATAGAAACTTCAGATCATGATACTTACACTCTTACTTCTTATCCAAATCATAAA GAAGCATTATTACTTCTCACAAACCATTCGTATGAAGAAGTAGAAGAAATAACAAAAATACCTAAGCATA CACTTATAAAATTGAAAAAACATTATTTTAAAAAATAA

Estudo dirigido 1. O que fazer com uma sequência de DNA? 2. Bancos de dados públicos e internacionais: GenBank, ENA, DDBJ; 3. NCBI; EMBL; DDBJ; 4. Sequências completas de genomas de organismos dos três domínios; 5. Definição de Bioinformática; 6. Análise da sequência no GenBank; 7. Busca de sequências por similaridade; 8. BLAST e Banco de dados de sequências.

Estudar: http://www.ncbi.nlm.nih.gov/nuccore/m63845.1 Gene da Cecropin A de Hyalophora cecropia: 1) Quantos nucleotídeos tem o gene que codifica para a proteína cecropin A? 2) Quantos nucleodídeos tem a região codante? 3) Qual a localização das regiões regulatórias? 4) Quantos exons e introns tem o gene?