Sequenciamento de genoma e transcriptomas

Documentos relacionados
Sequenciamento de genoma e transcriptomas

Estudos das ômicas: Genômica; Transcriptomica; Metagenômica. Aula 7

Sequenciamento de DNA e PCR QBQ 102 Aula 6 (biomol)

Sequenciamento de DNA e PCR 2018 s1

Prof. João Carlos Setubal

UFPel CDTec PPGB. Plataformas de NGS. Frederico Kremer

Tecnologia do DNA recombinante. John Wiley & Sons, Inc.

Número de genes versus número de proteínas em eucariotos

Genômica. Mapeamento Molecular

Bases da análise genômica: estado da arte

Introdução às Tecnologias de Sequeciamento: Sanger e Nova Geração (NGS)

BIBLIOTECAS DE DNA E HIBRIDIZAÇÃO. FABIANA SEIXAS

Estratégias de clonagem

Transcrição do DNA. Dogma central. O fluxo da informação é unidirecional. Refutação definitiva da herança dos caracteres adquiridos 26/04/2015

DNA recombinante. Nilce M. Martinez Rossi Depto de Genética

Enzimas de restrição

Prof. Marcelo Langer. Curso de Biologia. Aula 26 Genética

O Sequenciamento de DNA

Introdução às Tecnologias de Sequeciamento: Sanger e Nova Geração (NGS)

Busca em banco de dados

Sessão 1: Os Princípios e as Técnicas da Biologia Molecular do Séc XXI

- Sequenciamento de genomas nada mais é que a determinação da ordem linear dos nucleotídeos ou bases nitrogenadas de um genoma.

ESTUDOS DAS ÔMICAS: GENÔMICA VS TRANSCRIPTÔMICA E METAGENÔMICA. Aula 7. Maria Carolina Quecine Departamento de Genética

Clonagem de genes e fragmentos de DNA de interesse

Transcrição gênica. Prof. Mateus Grangeiro

Profa. Dra. Viviane Nogaroto

DOGMA CENTRAL DA BIOLOGIA MOLECULAR

Introdução à Bioquímica

Replicação do DNA. Experimentos de Meselson-Stahl demonstraram a natureza semi-conservativa da replicação

Organização Gênica de Eucariotos. Prof. Odir A. Dellagostin

SEQUENCIAMENTO DE DNA

Bases e aplicações. da tecnologia do DNA recombinante

DNA RNA Proteínas. Organização estrutural e funcional do núcleo 04/04/2017. Processamento (Splicing) Tradução (citoplasma) Replicação.

Transcritômica. João Carlos Setubal IQ/USP outubro de 2013

Transcrição: Síntese de RNA Tradução: Síntese Proteica

Análises moleculares - DNA

Marcadores Moleculares

Sequenciamento de Nova Geração (NGS) Msc. Frederico Schmitt Kremer // doutorando PPGB

IDENTIFICAÇÃO DE SEQUÊNCIAS POR HIBRIDIZAÇÃO E SEQUENCIAMENTO. Aula 5. Maria Carolina Quecine Departamento de Genética

GENOMAS. Prof. Dr. Marcelo Ricardo Vicari

Biologia Molecular e Celular- 2019

CLONAGEM MOLECULAR E TRANSFORMAÇÃO BACTERIANA. Atualmente é muito comum ouvirmos falar de clonagem em meios de

Perguntas para o roteiro de aula. 1) Descreva as principais características estruturais gerais das moléculas de DNA e

Transcrição é a primeira etapa da expressão do gene. Envolve a cópia da sequência de DNA de um gene para produzir uma molécula de RNA

Actividade prática: Constrói os teus Kits de Genética!

MARCADORES MOLECULARES: DO MELHORAMENTO A CONSERVAÇÃO. Aula 10. Maria Carolina Quecine Departamento de Genética

Genes e Genomas Eucariotos

Motantagem de Contigs de sequências de genomas e Transcriptomas. Introdução

MARCADORES MOLECULARES

PROGRAMA DE PG EM BIOLOGIA EXPERIMENTAL - PGBIOEXP

Introdução a Bioinformática Curso de Verão Nivelamento na área de Biológicas

Tecnologia do DNA recombinante

DESVENDANDO O GENOMA HUMANO

((lambda (h q) (list h (list q h) (list q q))) (quote (lambda (h q) (list h (list q h) (list q q)))) (quote quote))

TECNOLOGIA DO DNA RECOMBINANTE PARTE I HISTÓRICO ENZIMAS DE RESTRIÇÃO VETORES ELETROFORESE. Patricia Schaker

Introdução à Bioquímica

7.012 Conjunto de Problemas 4

Prof. Dr. Júlio César Borges. Eduardo Nazaré Felipe Gonçalves Renato Capelo

Seqüenciamento de DNA

IMPORTÂNCIA DA GENÉTICA PARA ÁREA DA SAÚDE: Diagnóstico clínico: alteração no número ou estrutura dos cromossomos (síndrome de Down)

Seleção de clones e screening de bibliotecas genômicas

Lista de Exercícios - Monitorias

Polimerase Chain Reaction PCR

Organização do genoma e variação individual

Resoluções das atividades

Sequenciamento de DNA

QBQ 0102 Educação Física. Carlos Hotta. Transcrição 12/06/15

RNA-Seq parte II: Análise SEM um genoma de referência

GENÉTICA DNA AMINOÁCIDOS PROTEÍNAS TRADUÇÃO TRANSCRIÇÃO MRNA

Transcrição e tradução QBQ 102

Sequenciamento do DNA e suas aplicações

PS 4 Soluções Pergunta 1

Aplicações. Enzimas de restrição

Unidade III: Tecnologia do DNA Recombinante

Hibridação de ácidos nucleicos. de cromossomo a chip de DNA

Análise de SNPs. MSc. Frederico Schmitt Kremer Doutorando do PPGB (UFPel)

Transcrição e tradução QBQ 204 Aula 4 (biomol)

Princípios de Sistemática Molecular

ÁCIDOS NUCLEICOS E BIOLOGIA MOLECULAR. Prof.: Anderson Marques de Souza 2016

PROCESSAMENTO DE RNA. Prof. Marcelo A. Soares. Universidade Federal do Rio de Janeiro

DNA, Cromossomos e Replicação. Capítulos 5 e 6 (pág ) - Fundamentos da Biologia Celular - Alberts- 2ª edição

Transcrição e Processamento de RNA

Departamento de Genética Nilce M. Martinez Rossi

Transcrição:

Sequenciamento de genoma e transcriptomas

Durante décadas o método de Sanger foi praticamente a única opção utilizada para sequenciamento de DNA Nos últimos anos surgiram novas tecnologias de sequenciamento em larga escala que foram denominadas como Next-Generation Sequencing (NGS)

Next Generation sequencing Apesar de serem apresentadas como um conjunto as varias tecnologias que fazem parte do NGS apresentam principio bem diferentes Em comum elas tem a paralelização de diversos processos levando a analise simultânea de milhares de moléculas : Sanger ~10 4 nucleotídeos sequenciados/corrida, NGS ~10 8-10 nucleotídeos sequenciados/corrida

Estratégias para captura de DNA 2 tipos principais de estratégias: 1- Amplificação clonal: utilização de PCR em emulsão ou amplificação em fase solida 2- detecção a partir de uma única molécula: Imobilização de moléculas em um suporte solido

Métodos de sequencamento Diferentes métodos podem ser utilizados para o sequenciamento das moléculas de DNA: -Terminação ciclo-reversivel -Sequenciamento por ligação -pirosequenciamento -Sequenciamento em tempo real

Terminação ciclo reversível Adição de nucleotídeos bloqueados ligados a moléculas florescentes Desbloqueio de nucleotídeo permite sucessivos ciclos

Sequenciamento por ligação Sondas ligadas a moléculas fluorescentes fluorescentes reconhecem 2 bases por ciclo. Necessidade de diversos ciclos de ligação para sequenciar molécula

Pirosequenciamento Reação luminescente acoplada a incorporação de nucleotídeos Sinal fluorescente é proporcional ao numero de nucleotídeos incorporados

Sequenciamento em tempo real Nucleotídeos acoplados a moléculas fluorescentes ligados a quenchers, somente quando ocorre incorporação há detecção de fluorescência

Por que seqüenciar genomas? O seqüenciamento de genomas é o primeiro passo para obter uma descrição completa da composição molecular de cada organismo, pois todas informações necessária para construção estão presentes no DNA genômico (Entretanto a interpretação estas informações ainda é um problema) Comparação de genomas de diversos indivíduos permitira correlacionar características e síndromes com mutações de determinados locus do genoma (mesmo que não tenhamos idéia da função deste locus) Comparações entre genomas de espécies próximas permite o melhor entendimento dos mecanismos de evolução de genomas Um melhor conhecimento do genoma permite com que manipulemos este com maior facilidade

Tamanho de genomas É possível notar que não há uma correlação direta entre tamanho do genoma e complexidade do organismo

Seqüenciamento de genomas Genomas possuem grande numero de bases em seu genoma (10 5 a 10 12 ) e ate o momento as técnicas existentes de seqüenciamento conseguem amostrar apenas algumas centenas de bases por reação. Deste modo, o genoma tem que ser seqüenciado de forma descontinua com milhares de reações sendo realizadas em paralelo para obtenção da informação necessária Isto gera uma grande quantidade de seqüências derivadas do genoma que se apresentam de forma desconexa, visto que não existe nenhuma propriedade intrínseca que permite a ordenação inequívoca destas Deste modo um dos grandes desafio ao seqüenciar genomas é a montagem destas sequencias de modo que elas possam reproduzir a ordenação encontrada nos cromossomos

Seqüenciamento de DNA por fragmentação Esquematização da estratégia básica de seqüenciamento de genomas Quebra do DNA pode ser feita com enzimas de restrição ou via nebulização Clonagem de fragmentos com tamanho aproximado conhecido é importante para a posterior montagem das seqüências

Estratégias de seqüenciamento de genomas Existem duas estratégias básicas de sequenciamento de genomas : Seqüenciamento de clones- DNA é cortado em fragmentos grandes (utilizando enzimas de restrição) e clonado em BACs (Cromossomo Artificial de Bactéria), que aceitam fragmentos de até ~200 mil bases Após isso são selecionados clones que são separadamente cortados (por nebulização) e sub-clonados em plamideos. Seqüenciamento destes sub-clones permitirá a reconstituição do clone do BAC Apesar te ter sido a técnica de referencia no inicio de sequenciamento de genomas, não é mais utilizada com freqüência.

Estratégias de seqüenciamento de genomas Whole Genome Shotgun (WGS)- O genoma inteiro é picotado em pedaços de alguns poucos milhares de pares de bases (por nebulização) e clonado em plasmideos. São realizada clonagens de fragmentos maiores em vetores apropriados (BACs, Fosmideos, etc..) mas somente as pontas são seqüenciadas. Seqüenciamento das duas extremidade de cada clone é realizada e utilizando a informação de seqüência e a estimativa de distancia entre as duas pontas do clone busca-se montar o genoma inteiro Após a montagem das seqüências obteremos pedaços que são denominados contigs, no melhor cenário cada contig deveria representar um cromossomo, mas normalmente o que ocorre é a formação de mais de 1 contig por cromossomo devido a regiões que apresentam problemas e que não são montadas de modo apropriado

Cobertura de sequenciamento Devido ao caráter randômico de seqüenciamento utilizando a técnica de WGS é necessário seqüenciar uma quantidade de bases muito maior do que o numero de bases do genoma (pelo menos 8X mais) devido a redundância do sequenciamento

Problemas na montagem do DNA Devido ao alto numero de seqüências repetitivas existe uma alta probabilidade que duas seqüências não contiguas mas que possuam a mesma repetição em sua extremidade possam ser sobrepostas na montagem Par evitar isso em adição ao algoritmo de alinhamento de DNA utiliza-se a informação de distancia entre as seqüências das pontas de cada clone na montagem do genoma

Montagem do esqueleto do genoma Apesar de idealmente ser possível a composição de um único contig por cromossomo, não é isso que ocorre de fato, devido a presença de sequências repetitivas, regiões não clonaveis, etc.. Devido a isso, a analise resultará em diversos contigs por cromossomos. Apesar de não ser possível sobrepor estas sequencias para obter um contig único é possível ordená-las e estimar a distancia entre elas a fim de produzir um esqueleto do cromossomo. As técnicas de FISH e mapeamento por segregação são muito utilizadas para esta finalidade.

Mapeamento físico de seqüências por FISH Um vez que obtemos os contigs é importante a determinação da região de que cromossomo esta seqüência é localizada Para isso utiliza-se uma técnica de hibridização em cromossomos (FISH), que utiliza uma sonda que represente uma região única no genoma que esteja representada no contig de interesse, o resultado mostrará a região de qual cromossomo esta seqüência se localiza Com esta informação é possível utilizar os contig para montar um esqueleto de cada cromossomo.

Mapeamento de sequencias por segregação Construído a partir das taxas de recombinação meiótica (crossing-over) de marcadores no genoma Centimorgan- probabilidade de 1% que dois genes se separem em evento de mitose.

Analise de genomas Uma vez que obtemos a sequência extensiva do genoma de um organismo é possível analisá-la com o intuito de obter uma maior compreensão sobre a informação contida no mesmo. No entanto tal analise não é trivial devido a composição e organização de genomas.

Complexidade de genomas Experimentos de cinética de reassociação permitem obter uma estimativa da complexidade de cada genoma De modo geral genomas de eucariotos possuem uma grande fração de regiões repetitivas

Complexidade de genomas Experimentos utilizado pequena quantidade de moléculas de mrna permitem ver que a maior fração do que é expresso pela célula provem de regiões não repetitivas Este experimentos permitem deduzir que o DNA composto em grande parte por elementos repetitivos, mas os RNAs são transcritos principalmente de regiões não-repetitivas.

Complexidade de genomas A presença destas regiões repetitivas explica em parte porque o tamanho dos genomas não é proporcional a complexidade do organismo visto que uma serie de organismos menos completos possuem uma alta quantidade de DNA repetitivo. Este DNA repetitivo não possui uma função clara e por isso muitas vezes é referido como junk DNA

Correlação entre o genoma e a complexidade de organismos É possível notar um tendência de organismos mais complexos possuírem genes com um maior numero de exons.

Seqüenciamento de transcriptomas Conforme mostrado no slide anterior organismos mais complexos tendem a possuir genes com um alto numero de exons. Além disso, o genoma destes organismos possuem uma alta quantidade de seqüências nãocodificantes e portanto a predição da estrutura de genes não é trivial. Deste modo o seqüenciamento direto das moléculas de mrna pode fornecer informações a respeito da estrutura de um gene, pois representa a molécula madura formada após os eventos de splicing Além disso, o seqüenciamento de mrna permite a amostragem direta das seqüências codificantes permitindo com que um menor volume de seqüenciamento se obtenha maior informações sobre as proteínas deste organismo

Seqüenciamento de transcriptomas Após o isolamento das moléculas de mrna é realizada a reação de transcriptase reversa que irá gerar um fita de cdna a partir de um mrna molde. Normalmente esta transcrição é realizada com um oligo-dt como primer o que permite com que o mrna interio seja transcrito Os cdna produzidos são clonados e o conjunto de plasmideos produzidos é denominado biblioteca

Seqüenciamento de transcriptomas Entretanto a abundancia de diferente mrnas em uma célula varia muito. Existem alguns poucos mrnas que possuem um numero de moléculas até 1000 X maior que a maioria dos mrnas. Deste modo, seqüenciamentos de bibliotecas de mrnas tendem a amostrar muito umas poucas moléculas e pouco um conjunto grande Além disso, nem todos os mrna vão estar sendo expressos em um único tecido ou fase de vida do organismo e por isso para obter uma descrição completa dos mrnas de um organismos vários destes deverão se amostrados

Utilização de sequências de RNA para identificação de genes Devido ao fato das sequências de RNA serem derivadas de sequências genomicas é possível utilizar ferramentas de alinhamento para deduzir a origem da sequência de RNA. Com isso é possível definir a estrutura de introns e exons de um gene.

Splicing alternativo Seqüenciamento de transcritos permite a dedução de eventos de splicing alternativo a partir do mapeamento deste nas seqüências de DNA genomico

Spidey Programa de mapeamento de seqüências de mrna em porções de DNA genômico Possui vantagens em relação a alinhamento no blast2sequences pois o programa busca os sítios de splicing e permite apenas um alinhamento por região do RNA, alem disso o seu algoritimo busca evitar o alinhamento em porções do gene em pseudogenes ou copias do gene adjacentes a este

Spidey

Spidey

Spidey Exemplo de alinhamento de um exon