Sequenciamento de genomas 1 o genoma completo vírus OX174 5.000 nt (Sanger et al. 1977) em 1977 1000 pb sequenciados por ano neste ritmo genoma E. coli K-12 4.6-Mbp levaria mais de 1000 anos para ser completo genoma humano mais de 1.000.000 anos Inovações tecnológicas permitiram sequenciamento em larga escala
Genomas completos 1995-1 o genoma bacteriano completo, 20 anos após OX174 Haemophilus influenza - 1,83 Mb 2009 ~1000 genomas já sequenciados + 800 projetos genoma em progresso
Projetos genoma hoje
Projetos genoma hoje
Genomas completos Inovações tecnológicas determinantes: novos métodos de clonagem automação do sequenciamento de DNA novos métodos de sequenciamento de DNA Análise computacional - bioinformática
novos métodos de clonagem Com base no método de sequenciamento de DNA por terminação de cadeia Lê até 1000 pares de base sequências maiores devem ser subdivididas em fragemntos menores para serem sequenciadas depois os fragmentos são remontados nas sequências originais
novos métodos de clonagem sequenciamento por shotgun, sequencia fragmentos aleatórios (rápido) mas requer método para remontar os fragementos em ordem
clonagem / sequenciamento shotgun DNA é clivado aleatoriamente (por enzimas ou métodos fisicos) em fragmentos fragmentos clonados em vetores diferentes de acordo com seu tamanho conjunto de vetores forma uma biblioteca que deve cobrir todo o genoma clones são sequenciados diversas vezes mas não se sabe a relação entre as sequencias obtidas muito mais rápido do que seguir em ordem o sequenciamento do DNA Depois se cria um mapa físico que ordena as sequencias com base em trechos de sobreposição. Recursos computacionais Abordagem usada para sequenciamento do genoma do camundongo, humano e mosca
clonagem / sequenciamento shotgun Generated by Foxit PDF Creator Foxit Software
novos métodos de sequenciamento de DNA shotgun era o mais avançado entre 1995-2005 Novas tecnologias Produzem leituras menores (25-500bp) mas um número muito maior de leituras em pouco tempo Resulta em alta cobertura, mas o processo de montagem requer muito mais capacidade computacional. desvantagem é que a precisão é menor - o que é compensado pela alta cobertura. Ex: pirosequenciamento
Pirosequenciamento: sequenciamento por síntese Um primer é hibridizado a um amplicon de PCR fita-simples que serve de molde. O 1º dntp é adicionado. A DNA pol o incorpora na fita de DNA, se for complementar à base do molde. Cada evento de incorporação causa a liberação de pirofosfato (PPi) em quantidade equimolar ao do dntp incorpotado.
ATP sulfurilase converte PPi a ATP na presença de adenosina 5' fosfosulfato (APS). Este ATP permite a conversão pela luciferase de luciferina a oxiluciferina, o que gera luz em quantidade proporcionais a quantidade de ATP. A luz é detectada por um chip CCD (charge coupled device) e vista como um pico no output (Pyrograma). A altura de cada pico é proporcional ao numero de nts incorporado. A enzima Apirase, continuamente degrada nts não incorporados e ATP. Quando a degradação está completa, outro nt é adicionado. A adição de dntps é sequencial. Deoxiadenosina alfa-thio trifosfato (datp S) é usado em vez do similar datp normal; é usado pela DNA pol, mas não é reconhecido pela luciferase. À medida que o processo continua, a fita de DNA complementar é alongada e a sequência de nts determinada a partir dos picos no Pyrograma.
Pirosequenciamento etapas: Preparação da amostra DNA fracionado em fragmentos de 300-800 bp. amplicons PCR uso direto para amplificação..
Preparação da biblioteca Adaptadores curtos (A e B) adicionados às extremidades 3' e 5' de cada fragmento. Adaptadores usados para amplificação e sequenciamento. Fragmentos de fita simples com adaptadores formarão a biblioteca.
One Fragment = One Bead A biblioteca de DNA fita simples é imobilizada em beads de captura de DNA. Cada bead carreia um único fragmento fita simples. O fragmento ligado à bead é emulsificado com reagentes de amplificação (mistura água-óleo). Formam-se microreatores.
Emulsion PCR Amplification Cada fragmento único da biblioteca é amplificado. Amplificação de cada fragmento resulta em milhões de cópias por bead. Finalmente a emulsão de PCR se desfaz e os fragmentos ficam ligados às beads Fragmentos amplificados prontos para sequencimento. Microplaca: uma bead por poço.
One Bead = One Read Adição de enzimas. Nucleotídeos individualmente adicionados em ordem a cada poço. Adição de um nucleotideo complementar ao molde gera sinal quimioluminescente que é detectado.
Análise de Dados Combinação de intensidade de sinal e posição na placa permite ao software determinar a sequência de mais de 100.000 a 1.000.000 de reads em 10 horas. Ferramentas de bioinformática : montagem de 400 megabases; comparação com sequência de genoma conhecida.
Projeto genoma Geração de sequências de genomas completos Bioinformática bancos de dados e análise dos dados N o de cromossomos, nucleotídeos, genes, tamanho médio dos genes, % de seqüências codificantes, localização de genes, regiões reguladoras, identificação de genes, predição de funções (anotação)
Era Pós-genômica Mais e mais genomas completos de importantes modelos biológicos disponíveis Nova abordagem para estudo molecular de sistemas biológicos em larga escala experimentos em paralelo à hierarquia biológica: transcrição tradução produção de pequenas moléculas genômica funcional proteômica metabolômica Investigações globais sobre o funcionamento da célula ou do organismo
Relação esquemática entre diferentes disciplinas omicas em relação ao fluxo de informação desde o genoma através da transcrição até síntese de proteínas e pequenas moléculas. De genômica até proteômica, a complexidade aumenta enquanto a maturidade das tecnologias diminui
Era pós-genômica - genômica funcional visa determinar a função biológica dos genes e de seus produtos, além de mecanismos de controle genético interações gênicas regulação da expressão gênica redes de regulação Respostas celulares globais Análises globais de perfis de expressão transcriptoma
genômica funcional Tecnologia que a define é a hibridização em microarray, que determina o nível de mrna em células ou tecidos ou seus níveis relativos em dois estados análise comparativa
Os mesmos genes, qual a diferença? Análise comparativa de perfis globais de expressão
Transcriptoma conjunto dos RNAs expressos pela célula em certa condição e momento análise global dos transcritos em diferentes condições hibridização de pool de RNAs ou (cdnas) com coleção de sondas simultaneamente. Expansão do Northern blot
arranjo de DNA / microarray Gene chips, DNA chips - superfície sólida na qual o DNA (sonda) é imobilizado para ser hibridizado com cdna ou mrna alvos centenas ou milhares de genes imobilizados síntese das sondas in situ ou robôs adicionam sondas nas lâminas por ex. todo o genoma humano (~35 K genes) em um chip
DNA microarray - etapas
DNA microarray - etapas laser excita a 532nm (Cy3) e a 635nm (Cy5), padrões de fluorescência registrados em scanner confocal mistura das duas amostras (vermelha e verde) terá cor resultante de acordo com a intensidade de cada uma (se iguais a cor resultante é amarelo, se não houver sinal hibridização a célula será preta). scanning laser 2 laser 1 emission
DNA microarray - respostas de transcrição dos genes de um organismo sob várias condições perfil de expressão gênica permite entender a regulação gênica em resposta a sinais segue-se análise individual nos casos de genes de interesse
transcriptoma perfis de mrna (microarrays) podem revelar alterações moleculares entre dois estados biológicos (transcrição) MAS não captam mecanismos de regulação envolvendo localização celular de proteínas, interação com outras proteínas, taxas de degradação
genômica funcional proteômica genoma representa apenas o 1º nível de complexidade Função biológica não é exercida pelo genoma estático mas sim pela população dinâmica de proteínas relação entre regulação da expressão de genes e de expressão de proteínas em resposta a sinais o conjunto final de proteínas maduras não pode ser previsto a partir do genoma inclui variantes geradas por splicing e modificações póstraducionais, que influenciam as suas taxas de síntese e sua função Proteínas, próximo nível de complexidade