Polimorfismos, Marcadores Moleculares e Identificação de Genes de Interesse Luiz Lehmann Coutinho Laboratório de Biotecnologia Animal ESALQ - USP
Conceito
Polimorfismo: Cromossomo 5 ATAAC GCGC AAT CACACACA... CTGACTGATATGTA TATTGCGCGTTAGTGTGTGT...GACTGACTATACAT Cromossomo 5 ATAAC G T GC AAT CACACACA CACA CTGACTGATATGTA TATTGCACGTTAGTGTGTGTGTGTGACTGACTATACAT
Gene Halotano: receptor de ryanodina. Mutação associada com aumento na % de músculo na carcaça. Maior susceptibilidade ao estresse. Associado com pior qualidade de carne.
Como encontrar os genes de interesse e os polimorfismos associados com a característica de desejada?
Estratégias: Genes candidatos Procura em todo o genoma
Identificar genes responsáveis pela prolificidade em suínos. Estratégia: Genes Candidatos Análise de genes conhecidos com base em informações de fisiologia (hormônio ou receptores ligados a reprodução). Mutações observadas em outras espécies. Resultados observados em animais transgênicos.
Prolificidade em suínos Animais da raça Meishan chinesa tem um maior número de leitões por leitegada. Investigação de genes ligados ao sistema reprodutivo, por exemplo: ESR1 Detecção do polimorfismo por PCR e digestão com enzima de restrição.
1) Identificação da sequencia do gene. 2) Desenho de primers e amplificação do gene. 3) Sequenciamento em diversos indivíduos para detecção de polimorfimsos.
4. Detecção de SNP
5. Estudo do efeito do polimorfismo na prolificidade 1. Não explica toda a variação observada 2. A marcador pode estar ligado a mutação causal
Gene candidato: Resultados e limitações Esta estratégia tem gerado bons resultados. Pode gerar muitos falso positivos Depende de um conhecimento prévio do gene de interesse É mais fácil achar associação de um polimorfismo do que identificar a mutação causal do fenótipo Grande interesse no uso de marcadores moleculares
Polimorfismo: Cromossomo 5 ATAAC GCGC AAT CACACACA... CTGACTGATATGTA TATTGCGCGTTAGTGTGTGT...GACTGACTATACAT Cromossomo 5 ATAAC G T GC AAT CACACACA CACA CTGACTGATATGTA TATTGCACGTTAGTGTGTGTGTGTGACTGACTATACAT
Microssatélites (SSR) ACTTCATTAA TGTCTTAGGT GGCAGAATAC TTTGATGCAA CAATTTCAAG GGGTGCTGAC ATTAAGTTGG CTGCCAATTG GATAATGGGT GATATTGCTG CCTATATGAA AAATGAAAAG CTTTCTATTA ATGAGATCAA ACTTATGCCA GAAGAGCTAG TAGAGCTGAT AGCTTCCATT AAAGGTGGGA CTATCAGTGG AAAGATTGGA AAGGAGGTAA GCATTTGCTT CTTTNACTGA TGCCACTTTC ATGTTCAAAC ATTTGTTAGT AATCCTGTCT ATTTATTTTC ATGGAAGAAT TTTACTAGCT ATTATTCTCC ACTGTGTAGA TGTGATTTTA TAGTTTGTTT GGATATATAA TTATTGTTCG TGTTTTTTTT TTTAATCCAA ACTTTATAAT CTTTCCAAGT GCTTTTCTCC TCCCTGTCTT TTTCCTCTAC CACACACACA CACACACACA CACACTCATA CAGAAAAAGG AAAAAGGAAA GAAAGAGAAC AGGAGATATA AAAACCTTTT TTCTTTATCA ATTAGATAAT TAGTTATAAA AGTTTTTCTC CTGCTTCTTA TCCCTCCGCT AAATGCCTGA TTAACTTTCT GCTGGTAAAG ATTTAAAATA ACTTGTTAAT TTTGGACATG Primer FOR NNNNNNNNNNNNNNNNNNNNN CACACACACACACACACAC NNNNNNNNN NNNNN NNNNNNNNNNNNNNNNNNNNN GTGTGTGTGTGTGTGTGTG NNNNNNNNNNNNNN Repetição CA Primer REV
Microssatélites (SSR) (TC) 15 (AG) 14
>ZZFIGCO001g_A04_.g_033_Rome.ab1 CHROMAT_FILE: CGATTGGGCCGACGTCCATGCTCCGGNNCGCATGTCGGCCGCGGGAATTCGATTCTCTTGCTTACGCGTGGACTAGCTTACAATA GAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGTTTTGGCTGATGCCTTATCTCAAAAG AAGAAACGACCCTATATATAGAAAAGAAAAAAACAGAAAGAATCTATGCACAGTAAAGTAGGTCCCATATGTGGGTCCCTTATACAGT GTATTTACTGTGTATACAATATTTCTACTATATAAACAATGTATCTACTGTTGAGTGGGTCGGCGGCCTCACTGTTGATCATATTCCAC GTCTCTCTAATTCTTTCATCTGTTGGATGAAATCTTCCGCATTTTCTACAGCTTCGTCAGATAATATCTTCTCCGATTGAATAGGCTGA GAATCTTCTGCAATATCATCGTTGCTTGTTTCACTTCGCATTAAAGTGTCAGATTTTTCATACTGGTTAATAGATTGAAGTAAGTTTCTT TTTACTTCTTCCAAATACTTATTAATCAATTTCTATAAGATAAACATATAAGTTCAGATCCAGGCACATAATTATAACCATGCGTTTTCA CACGTATTTGTCAAAATAAGTCTGCATTTCTCACTTCTTTTTCCTGGTTAAGACCCGTTATACCCTCCAATTATACTTGGAACACCTTT TATCGGCGCTATTTATCCTTTTACTAGCATAGATTCTAAAGGATTTACCACAACTTATAAAAATAAAAGAATAGGTTATACCTTTGTTAC CGATCCCGTAACTAGGGGATATAATGGCTTTATTAGATATAAATCCAAAATATATT (AG) 30
Microssatélites Seta: alelos genoma B
TESTE DE PATERNIDADE Inclusão do suposto pai Exclusão do suposto pai
Mapeamento de QTLs Não necessita de informação prévia da localização do loco ou gene de interesse. A busca é feita em todo o genoma com marcadores microssatélite ou SNP. Necessita de uma estrutura de família Cruzamento entre linhagens ou raças contrastantes Dentro de uma raça (desenho de netas) Bastante trabalhosa Pode resultar na localização do loco de interesse, mas podem existir muitos genes na região.
Bases Genéticas de Mapeamento: Segregação Recombinação Polimorfismo
Bases Genéticas do Mapeamento Gametas Crossing-over e recombinação durante a meiose
Mapeamento de QTL: A M A M a m a m B B b b A M a m B b A M A M A M a m A M A M A M a m B B B b b B B B
Mapeamento de genes de crescimento e qualidade de carne em aves (Embrapa ESALQ) Cruzamento entre uma linhagen de corte (TT) e uma de postura (CC). Características fenotípicas (F2). Ganho de peso, consumo, conversão alimentar. Composição de carcaça Rendimento de partes Genotipagem (F2): Microssatélite SNP
Linhagem de corte (TT)
Linhagem de Postura (CC)
Caracterização dos Parentais e F1 Grupos Genét. Peso 41d Carc. Peito Gord. Pulmão Coração Hemat. CC 514 a 330 a 73 a 0,8 a 4,4 a 4,7 a 32,2 a TT 2395 b 1776 d 486 d 57,2 b 17,1 d 13,3 d 34,6 c LLc 1689 c 1185 b 284 b 37,8 c 11,9 b 9,8 b 30,4 b CT 1573 d 1129 b 292 b 30,8 d 11,4 b 8,9 b 31,7 ab TC 1193 e 832 c 206 c 18,1 e 9,9 c 7,0 c 32,6 a
Indivíduos F2
O genoma da galinha doméstica apresenta 39 pares de cromossomos (n), totalizando 78 cromossomos (2n). - 8 macro, 30 micro e os cromossomos sexuais (Cheng, 1997).
Microssatélite Amplificação por PCR: Cromossomo 5 ATAAC G C GC AAT CACACACA CTGACTGATATGTA TATTGCGCGTTAGTGTGTGTGACTGACTATACAT Cromossomo 5 ATAAC G T GC AAT CACACACA CACA CTGACTGATATGTA TATTGCGCGTTAGTGTGTGTGTGTGACTGACTATACAT TEXAN 15 Sample sizer BM1224 150pb 50-500bp sizer 150pb 200pb Profiles of a run by automatic DNA- Sequencer (ALF- Pharmacia ) for two microsatelites - BM1224 e TEXAN15
Após... 2 anos de trabalho de 3 alunos de PG Genotipagem de 180 animais para 96 marcadores em genotipagem seletiva Genotipagem de 650 animais para 40 marcadores distribuídos em 5 cromossomos Aproximadamente 26.000 análises...
14 Cromossomo 1 PN P42 12 P35 P41 F 10 8 6 Ligação significativa a 1% Ligação significativa a 5% 4 2 0 0 50 100 150 200 250 300 350 400 450 500 173 cm 259 cm Distância em cm Valores da análise de QTLs para peso corporal ao nascer (PN), 35 (P35), 41 (P41) e 42 (P42) dias de idade.
Mapeamento de QTL para crescimento Cromossomo (cm) Peso vivo (dias) Intervalo (cm) F 3 (88) 1 70-150 21,45 12 (65) 1 25-85 4,70 18 (17) 1 0 20 5,88 2 (180) 35 0-250 5,02 3 (96) 35 0-200 9,66 18 (0) 35 0-20 4,43 2 (200) 41 0-250 4,56 3 (96) 41 0-235 9,18 43 Fonte: Ambo et al., AG, 2008
Mapeamento de QTL: Resultados e limitações A estratégia de mapeamento de QTL permite identificar várias regiões do genoma que influenciam uma característica de interesse Limitação: a região do QTL é muito grande e contém vários genes Necessidade de definir com mais precisão a região do QTL 44
SNP Single Nucleotide Polymorphism
Polimorfismo: Cromossomo 5 ATAAC GCGC AAT CACACACA... CTGACTGATATGTA TATTGCGCGTTAGTGTGTGT...GACTGACTATACAT Cromossomo 5 ATAAC G T GC AAT CACACACA CACA CTGACTGATATGTA TATTGCACGTTAGTGTGTGTGTGTGACTGACTATACAT
Filogenia perfeita 1 0 0 0 0 1 0 0 1 0 1 0 1 0 0 1 1 0 0 0 1 0 0 1 1 0 0 0 1 0 1 0 0 1 0 4: 1 0 1: 1 0 5: 0 1 1 0 0 0 0 0 0 0 1 0 1 0 0 1 1 2: 0 1 3: 0 1 1 1 0 0 0 1 0 1 0 0 2 3 1 0 1 0 0 1 1 0 0 0
DNA sequencing The products of the sequencing reaction are separated on a gel mixture that can separate fragments by one base pair. Larger fragments mutation Smaller fragments Useful when you suspect a gene, but don t know the variant. This one is BRAF gene in
Discovery of SNPs in aligned DNA sequence data using PolyBayes in the Consed viewer SNP Discovery software SNP
DNA Sequence Alignment for Single Nucleotide Polymorphism (SNP) Discovery in Soybean
Variação genética
Taqman allelic discrimination genotyping (for taste receptor TASR32) There are four oligonucleotides in the reaction mix -- two PCR primers and two probes each labeled different color and each matching different SNP allele.
Taqman Genotyping - Real-time PCR hets homozygotes homozygotes
Allele Specific Extension and Ligation Polymerase Ligase Genomic DNA Allele Specific Extension & Ligation Universal PCR Sequence 1 Universal PCR Sequence 2 [T/C] A G [T/A] illumicode Address Universal PCR Sequence 3 Custom Oligo Pool All (OPA) 96-1,536 SNPs multiplexed Total oligos in reaction 288-4,608
PCR Amplification Amplification Template A illumicode #561 PCR with Common Primers Cy3 Universal Primer 1 Cy5 Universal Primer 2 Universal Primer P3
/\/\/\/ /\/\/\/ /\/\/\/ Hybridization to Sentrix Array Matrix illumicode #561 illumicode #217 illumicode #1024 A/A G/G C/T SNP #561 SNP #217 SNP #1024
Sentrix Array Matrix 1.5 mm 400 mm 10 mm
Illumina GoldenGate technology for 384-6000 SNPs at a time (medium, not whole genome) 45,000 beads 96-well plate, each with bead
Illumina Infinium assay: up to 1 million SNPs (for whole genome study) Bead array on slide
http://www.genome.gov/pages/education/d NADay/TeachingTools/MakingSNPsMake Sense.html
Estudo de associação com SNP
Associação de SNP com fenótipo