Universidade Federal de Pelotas Faculdade de Agronomia Eliseu Maciel Programa de Pós-Graduação em Agronomia CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática Professores: Luciano Maia Antonio Costa de Oliveira
Introdução Parte 2
Introdução
Competências gerais da Bioinformática Há dois tipos básicos de problemas onde atuam usuários da bioinformática. 1) TÉCNOLOGIA - problema biotecnológico -computação/estatística -montagem de trechos de DNA...seqüenciamento 2) NÃO TECNOLOGICO - natureza da biologia molecular -que informação está contida nos genomas.primeiro muitos genes cada gene tem várias formas.segundo interações entre os genes muitas interações entre muitas formas de muitos genes cross-talk A interpretação destas interações requer métodos e técnicas (algoritmos - ciência da computação) orientados por conceitos da estatística, genética, bioquímica e fisiologia
1) TÉCNOLOGIA - problema biotecnológico Bioinformática: Seqüenciamento... Manutenção e gerenciamento das informações geradas durante o seqüenciamento Qualidade das seqüências Armazenamento das seqüências Alinhamento/Montagem Etc...
2) NÃO TECNOLOGICO - natureza da biologia molecular Bioinformática: Pós seqüenciamento... Programas de seqüenciamento geram um grande volume de dados Esses dados precisam agora ser analisados Análise laboratorial é difícil e cara estudos in silico são necessários para a análise dos dados obtidos BANCOS DE DADOS GENOMA/TRANSCRIPTOMA PROTEOMA PROBLEMA --------------- PERGUNTA BIOLOGICA bioinformática EXPERIMENTO -------------------------- Testes BIOLOGIA MOLECULAR RESPOSTA Modelos BIOLÓGICOS (BIOQUIMICA/GENÉTICA)
Introdução BIOINFORMÁTICA Diferentes omicas X diferentes ferramentas
Diferentes pesquisas vs Diferentes abordagens Montagem de fragmentos Predição de genes Anotação de genomas Reconstrução de árvores filogenéticas Análise de dados de expressão gênica Previsão de estruturas de proteínas Análise de interação entre genes Estudo do sistema de transdução de sinais Kinases - Fatores de Transcrição (trans-) - promotores (cis-)
1) Aplicação: GENOMA Tratamento inicial de seqüências base-calling / trimming / assembly
Grande Escala: :: Base-caller PHRED :: Vector sequence masking Cross-Match :: Assembler PHRAP, CAP3, TIGR Assembler :: Visualizadores CONSED, AutoFinish :: Depósitos DataBase Tratamento refinado: :: VectorNTI
ASSEMBLY
2) Aplicação: GENOMA Predição de genes / anotação
PREDIÇÃO DE GENES - VISÃO GERAL ACGGTTAA...GCCTTAA 1 200.000 QUAIS GENES ESTÃO AQUI?? NÚMERO DE INTRONs NÚMERTO DE EXOs NÚMERO DE UTRs NÚMERO DE CDSs
PREDIÇÃO DE GENES - VISÃO GERAL gene
PREDIÇÃO DE GENES - VISÃO GERAL
ANOTAÇÃO DE GENOMAS - VISÃO GERAL
2) Aplicação: TRANSCRIPTOMA base-calling / trimming / assembly Predição de genes / anotação
Biblioteca EST Redundant sequence Assembly CAP3/phrap
Assembly CAP3/phrap >contig1 >contig2 >contig3 >contig4 >singlet1 >singlet2 >singlet3 >contig5 >contig6 >contig7 Uniques non-redundant sequence
CONTIG/CLUSTER de EST >contig1
non-redundant EST >singlet1 >singlet2 >singlet3 >contig1 >contig2 >contig3 >contig4 ANOTAÇÃO Annotation >contig5 >contig6 >contig7 Process Function Component GO:0017038 protein import GO:0005524 ATP binding GO:0016020 membrane Pathway estrutura Domínio/função
3) Aplicação: Genomica estrutural e comparativa
Initial sequence of the chimpanzee genome and comparison with the human genome MIT, Harvard, Cambridge- Nature 437, 69-87,Sep 2005.
Schwartz et ali, Human Mouse Alignments with BLASTZ Genome Research, Vol 13, Issue 1, 103-107, January 2003
ORTÓLOGOS / PARÁLOGOS
Do Plants Have a One-Way Ticket to Genomic Obesity? L S Waxy Ligule-less Rice Foxtail millet Sorghum Pearl millet Maize Triticeae L Shattering L S 5pt 2pt S S S L 2p t Photoperiod sensitivity L 2pt 3 L 3 10pt B B 10pt L T T S S B 1pt 3pt B 2pt L S 8pt 4pt B T S 5pt 7pt S B T I B B S B 6 T 7pt T T G B T B B 5pt 1pt T T IIIpt VII Fpt T S L 6p t V L S L T T 8pt 12 4 IIpt 7pt 2pt 1pt B S S 1 7 S L 7pt E Fpt IIIpt L B T T L S 9pt 5 6 9 IIpt SL B T T S 2pt 11 IV VIII J H S L L 8 2 L S 1pt 6p t 9pt 5pt B T 3 10 5pt 7pt VI I T B B S S L S B B 4pt 5p t A IXp t L S IXpt T D B T T T B 4pt T 3p t B Cp t B Cp t B 2pt 5pt L 1p t 5pt 4 T B 9p t B 2pt 2pt L T 5p t 6 7pt L 5p t 1p t S S 1p t L L 4 5pt L 1pt S S L 1. 2 GA-ins dwarfing
4) aplicação: Ontologia Promotores/Cis-elementos Metabolismo
5) aplicação: Cristalográfia / Proteômica Bioinformática estrutural (# de genômica estrutural)
CRISTALOGRAFIA desvendar as estruturas 3D
6) aplicação: MINERAÇÃO DE DADOS utilização de informações disponíveis data mining
USO DA BIOINFORMATICA PARA PROSPECÇÃO DE MARCADORES marcadores moleculares anônimos/randomicos -RFLP, AFLP, RAPD, SSRS -idéia é associar variações em regioes anonimas do genoma (genótipo) com as variações do fenótipo genes candidatos -idéia é associar variações alélicas em genes candidatos com variações do fenótipo -idéia tornou-se palpável a partir do desenvolvimento da Genômica
Genes candidatos! O que são? Encontrar uma rota e buscar todos os diferentes transcritos da rota num banco de dados Dormência, Viviparidade, Estresse biótico e abiótico
Genes candidatos! O que são?? PLANTA MODELO / MODELO GENÉTICO
Anotação estrutural on-line de genes
Anotação estrutural on-line de genes
>meu_gene GAATTCCGGTCGGGGTTCGCCCGGCGCAGTTGTTGAGAGGCAAGGCAAACTCAGGCGACTGAGCTAAAGA AGCCGCACTAGTATGGGGGTGACGAAGGCGGAGGCGGTTGCCGCGACGGGGAAGGTGGTGGACGACATCG AGGCGCTCGCCGATCTCAGAAAGGAGCCAGCATGGAAAAAGTTTTTGTCCCACATTGGACCAGGCTTTAT GGTCTGTTTGGCTTACCTCGATCCTGGAAATATGGAGACTGATCTACAAGCTGGTGCCAATCACAAATAT GAGCTTCTTTGGGTGATTTTGATTGGCCTGATCTTTGCACTGATTATACAATCATTATCGGCTAATCTTG GAGTGGTGACAGGGCGCCATCTTGCTGAGCTGTGCAAGACTGAATATCCAGTATGGGTGAAAACCTGCTT ATGGCTGCTAGCAGAACTAGCTGTGATTGCTTCCGATATTCCAGAAGTTATAGGTACAGGATTTGCTTTC AACCTTTTGTTCCACATACCAGTGTGGACCGGGGTTCTCATTGCTGGCTCTAGCACGCTTCTTCTTCTTG GACTGCAAAGATATGGGGTAAGGAAACTGGAGGTTGTGGTCGCGCTATTGGTGTTTGTCATGGCAGGGTG CTTCTTCGTGGAGATGAGCATAGTCAAGCCTCCGGTTAATGAGGTCCTTCAAGGATTATTCATCCCCAGG CTCAGTGGGCCCGGTGCCACAGGAGACTCCATTGCCCTTCTTGGGGCTCTTGTAATGCCGCACAATCTAT TCTTGCACTCTGCCCTGGTGCTGTCGAGGAATACACCCGCATCAGCAAAAGGAATGAAGGATGCCTGTAG GTTCTTCCTCTTTGAGAGTGGGATAGCTCTTTTCGTGGCTCTGCTTGTCAACATTGCAATCATCTCTGTC TCCGGCACTGTATGTAATGCAACCAACCTTTCACCAGAAGATGCTGTAAAATGCAGCGACCTTACATTGG Primers Marcador molecular Validação Transformação MAPEAMENTO SELEÇÃO ASSISTIDA GANHO GENÉTICO TRANSGENIA
TUDO ESTA PRONTO?! 7) Demandas especificas de cada grupo
EXEMPLO 1: Problema de saúde a resolver: Predição de classes de doenças Muitas doenças podem ser distinguidas de forma confiável por meio de técnicas tradicionais Muitas doenças não podem ser distinguidas de forma confiável por meio de técnicas tradicionais Diagnóstico de tecidos cancerosos e normais Classificação de tipos conhecidos e diferentes de cânceres Vários tumores diferentes têm a mesma aparência em exames histológicos (mas são diferentes genes!!) Diagnóstico é fundamental para o sucesso do tratamento PROBLEMA: Predição da função biológica de genes associados ao cancer
EXEMPLO 1: Problema de saúde a resolver: Microarray de cdna com 6567 genes 63 exemplos como treinamento Material da biopsia de tumores Fold cross-validation 3750 redes neurais já construídas Predição de classes de doenças Dado: um conjunto de experimentos de microarray Faça: um modelo que possa classificar de maneira precisa a existência de uma nova categoria da doença. SOLUÇÃO:????????????!!!!!!!!!!!!!!!!!!!!!!!
Onde buscar
Em resumo... genética bioquímica ESTATISTICA BIOLOGIA fisiologia Etc... BIOINFORMÁTICA Etc... COMPUTAÇÃO BIOTECNOLOGIA
???!!! lmaia.faem@ufpel.edu.br
lucianoc.maia@gmail.com