Novas Tecnologias de Sequenciamento
Tecnologias de sequenciamento Sanger (Capilaridade) Uma das inovações tecnológicas de maior influência na pesquisa biológica, desde que foi lançada em 1977 Abordagem sequencing-by-synthesis surgiu após 20 anos, no final dos anos 90: Pirosequenciamento: 454 Life Sciences (Roche): capaz de gerar 500.000.000 de sequências brutas em poucas horas Solexa (Illumina) SOLiD (Applied Biosystems) (Pettersson et al, 2009) Bilhões de bases em uma única corrida Aplicação em estudos de transcriptoma e proteoma Redução dos custos
17/04/2009
21/04/2009
Haemophilus influenzae Rd KW20, seqüenciado pelo TIGR (1995)
Tecnologias de sequenciamento 454 (Roche) MegaBace (Sanger) Solexa (Illumina) SOLiD (Applied Biosystems)
Pirosequenciamento 454 FLX Técnica baseia-se na liberação de pirofosfato após a incorporação de um nucleotídeo. O pirofosfato desencadeia uma série de reações químicas que, em última instância, libera luz.
Pirosequenciamento 454 FLX Preparação da amostra Quebrar o DNA em fragmentos de 400 a 600 pb; Colocar adaptadores nos fragmentos ; Separar as cadeias.
Pirosequenciamento 454 FLX Colocar amostra nas beads Fragmentos de DNA, beads de agarose, reagentes para PCR numa mistura de àgua são colocados em óleo.
Pirosequenciamento 454 FLX Sequenciamento As beads são colocadas no PTP (Pico TiterPlate) com outras várias pequenas beads de enzimas. Cada PTP possui 1,6 milhões de orifícios. Cada orifício comporta apenas uma bead.
Pirosequenciamento 454 FLX Sequenciamento
Pirosequenciamento 454 FLX Sequenciamento Cada um dos nucleotídeos A, T, C, G é adicionado separadamente e na mesma ordem. Se um nucleotídeo é incorporado, ocorre emissão de luz. Esta é detectada por uma câmera CCD (charge-coupled device). A emissão de luz é proporcional ao número de nucleotídeos incorporados. Os primeiros quatro nucleotídeos no fragmento adaptador permitem ao software calibrar a luz emitida pra um nucleotídeo. 400.00 reads sao obtidas em paralelo
Pirosequenciamento 454 FLX Sequenciamento
Pirosequenciamento 454 FLX Sequenciamento
Especificações do Illumina Gera aproximadamente 200 milhões de reads com 75bp (15 GB bases por corrida) Demanda de 100ng - 1µg de material Reads de 25 35 bp (fabricante informa até 75bp) Acurácia por base = 98,5%
Preparação das Amostras
Fixação das Amostras
Fixação das Amostras
Leitura das seqüências
Especificações do SOLiD
SOLiD Gera 10 GB bases por corrida 35 bases Sistema acurado baseado na identificação de dois nucleotídeos: verificação do seqüenciamento inerente ao sistema Possibilidade de processar dois slides e podendo subdividi-los em oito quadrantes
ABI SOLiD
Princípio de Funcionamento: Di- Base Sequencing AA AC AA GA AT GA AA AC AC CC CA CC TC CG TC CC CA CA GG GT GG AG GC AG GG GT GT TT TG TT CT TA CT TT TG TG A A C C T A G G T G
Questões em aberto Média Illumina - 55% passam pelo filtro 77% alinhadas Solid 35% passam pelo filtro 96% alinhadas 454 95% da sequências usáveis Somente 43% e 34% das sequências do Illumina e Solid respectivamente são usáveis. Super representação do final do amplicon representam 2,3% da amostra Illumina 56% do que é usado Solid amplicon depletion end protocol 11% 454 5%
Questões em aberto Viés na geração das sequências Variação na profundidade da cobertura de elementos únicos e repetitivos Dificuldades para detectar INDELS com reads pequenas Erros sistemáticos das novas tecnologias que impactam acurácia de base variantes (polimorfismos) Os erros são efeitos de: Efeitos combinados do métodos recomendados pelo fabricante, ferramentas de leitura e alinhamento utilizadas, e os algoritmos utilizados para o base calling
Desafios bioinformáticos para as novas tecnologias de sequenciamento Capilar: fragmentos com tamanho médio de 900 pb 454: 250 pb Illumina: 35 pb Principal desafio: montagem Gera contigs muito fragmentados Ausência de genomas relacionados Presença de genomas relacionados Segundo desafio: anotação como lidar com tantos erros? Como que os métodos já consolidados podem ser adaptados? Aumento da frequência de CDSs com stop codons in frame (Pop & Salzberg, 2008)