The next generation sequencing Cesar Martins (cmartins@ibb.unesp.br) Departamento de Morfologia Instituto de Biociências, UNESP Universidade Estadual Paulista Botucatu, SP 1
Métodos Atuais Sequenciamento de próxima geração 1 - melhor custo-benefício para projetos de alta demanda de dados; 2 custo por bp muito menor; 3 sequenciamento muito mais rápido e eficiente (> 40 Gbase/corrida). 4 versatilidade Genomas, expressão gênica, diagnóstico, gen. população, epigenética, metagenômica, entre outros The next generation technologies Roche 454 Solid Illumina/Solexa Sequenciamento de segunda geração Ion Torrent PacBio Nanopore Sequenciamento de terceira geração Sequenciamento de quarta geração 2
September-2001 March-2002 September-2002 March-2003 October-2003 January-2004 April-2004 July-2004 October-2004 January-2005 April-2005 July-2005 October-2005 January-2006 April-2006 July-2006 October-2006 January-2007 April-2007 July-2007 October-2007 January-2008 April-2008 July-2008 October-2008 January-2009 April-2009 July-2009 October-2009 January-2010 April-2010 July-2010 October-2010 January-2011 April-2011 July-2011 Jan-2012 (EST) September-2001 March-2002 September-2002 March-2003 October-2003 January-2004 April-2004 July-2004 October-2004 January-2005 April-2005 July-2005 October-2005 January-2006 April-2006 July-2006 October-2006 January-2007 April-2007 July-2007 October-2007 January-2008 April-2008 July-2008 October-2008 January-2009 April-2009 July-2009 October-2009 January-2010 April-2010 July-2010 October-2010 January-2011 April-2011 July-2011 Jan-2012 (EST) 9/7/2013 5.500,00 4.500,00 5.292,39 CUSTO DO SEQUENCIAMENTO POR BASE 3.500,00 2.500,00 1.500,00 Roche 454 Illumina Solid e Helicos 500,00 0,09-500,00 http://genome.gov/splash.htm 100.000.000 90.000.000 95.263.072 http://genome.gov/splash.htm CUSTO DO SEQUENCIAMENTO POR GENOMA 80.000.000 70.000.000 60.000.000 50.000.000 40.000.000 30.000.000 20.000.000 Roche 454 Illumina Solid e Helicos 10.000.000 0 7.950 Genoma humano U$ 2 bi; ~3 bilhões bp; 11 anos; ~12X Genoma U$ 2.500,00; ~1 bilhão bp; alguns dias; ~40X 3
seq u en cia m en t o de DN A 100 Gbase Mardis. Science 2011 e on DNA sequencing technology. Nature, 2011. Illumina HiSeq: 600 Gb 4
Kahn SD. Science 2011 Antes e hoje Genoma humano - ~3 bilhões x 1= ~800 Alberts, 10 anos Genoma da tilápia- ~1 bilhão x 40= ~40 bilhões = ~10.600 Alberts, alguns dias 5
Hoje Objetivo rastrear as variações genéticas em populações humanas Objetivo gerar conhecimento sobre o genoma de câncer com o intuito de gerar tratamentos e diagnósticos Hoje Objetivo analisar o genoma de 10 mil espécies de vertebrados Objetivo analisar o genoma de 5 mil espécies de insetos e outros artrópodos 6
Estocagem Montagem Análise Maiores problemas dos sequenciamentos em larga escala!!! 454 Roche Vídeo Illumina Vídeo http://www.wellcome.ac.uk/educationresources/teaching-andeducation/animations/dna/wtx056046.htm http://www.wellcome.ac.uk/educationresources/teaching-andeducation/animations/dna/wtx056051.htm 7
Roche 454 Solid Illumina/Solexa Sequenciamento de segunda geração Ion Torrent Roche 454 2 nd generation 2004-2005 Roche 454 Life science Utiliza tecnologia de pirosequenciamento - 1986 8
Princípio Mecanismo do Pirosequenciamento ATP-sulfurilase Conversão PPi ATP Luciferase Usa ATP p/ converter luciferina oxyluciferina = LUZ Apirase degrada os ATPs e nucleotideos livres 9
Streptavidin Biotin tag Zhou et al., 2010. Protein Cell http://www.youtube.com/watch?v=bfnjxkhp8jc http://www.youtube.com/watch?v=jnqxglkozku 10
Amplificação maciça utilizando uma emulsão com milhares de beads de agarose, com primers ancoradores aos adapt. A reação de PCR é realizada e o sequen. ocorre na placa PTP (picotite plate). Roche GS FLX System 11
SOLiD Life Technologies SOLiD Life Technologies 2 Overview of Sequencing Technology Platforms 13 P1 and P2 adaptors Emulsion PCR http://gtc.soe.ucsc.edu/content/solidtechnology-overview 12
13
14
15
Química da reação 16
Comparando metodologias 454, Solid Illumina 17
ION TORRENT Não utiliza scaner e câmeras Ion PGM TM Sequencer Ion Proton TM Sequencer 18
Chip: Array of microwells 1 dntp de cada vez ñ utiliza nucleotídeos modificados e cascatas enzimáticas ñ utiliza detecção óptica (fluorescência e quimioluminescência) DETECÇÃO DO SINAL Chip: Array of microwells 19
DETECÇÃO DO SINAL ISFET Ion Sensitive Field-Effect Transistor DETECÇÃO DO SINAL 20
DETECÇÃO DO SINAL http://www.youtube.com/user/iontorrent PacBio RS sequencer Sequenciamento de terceira geração 21
Nanopore Sequenciamento de quarta geração 22
Constituintes Principais Camada lipídica Constituintes Principais Exonuclease 23
Métodos do futuro próximo Oxford Nanopore Technologies, based in Oxford, UK expects to start selling its new machine in the second half of this year and also plans to launch the sequencer the MinION which will retail for less than US$900. 24
Comparação diferenttes plataformas Plataf. FLX Comp (bp) Tempo de corrida (dias) Gb por corrida Prós Contras 500-1kb 0,35 0,45 Reads longos; agilidade *Illumina 100-150 9 35 Plataforma mais utilizada SOLiD 3 50 14 50 Sistema de correção de erros PacificBioscience 3-20kb?? Reads mais longos Alto erro Nanopore 100kb 15 min? Reads mais longos Alto erro Alto custo dos reagentes; alto erro Baixa capacidade multiplexar amostras Demora na corrida * HiSeq2000 gera um output com 600 Gb por corrida. Maior output atual. Sequenciamento de próxima geração, 2ª, 3ª, 4ª geração!!!! AHHHHHH... Assim eu não aguento!!!...5ª geração, quando será que sai??!! 25
Curso de Férias 08-11 de Julho de 2013 Instituto de Biociências, UNESP, Botucatu, SP 26