Bioinformática Histórico e conceitos básicos Raimundo Lima da S. Júnior M.Sc. Departamento de Biologia Núcleo de Pesquisas Replicon PUC-GO Silva Jr., RL
Casamento entre a ciência da computação e a biologia molecular É uma área nova - 10 anos atrás o termo nem existia Podemos dizer que foi um desdobramento da descoberta de Watson e Crick (1953) de que o DNA é estruturado como uma dupla hélice
Desenvolvimento dos conceitos de ciência Plasticidade do desenvolvimento científico Exemplos: Análise de prognóstico para cárie baseado em radiografias Estudos comportamentais através de análises complexas de dados de EEG Genômica comparativa Estrutura de proteínas
Bioinformática, quimioinformática, neuroinformática Biologia computacional Genômica, transcriptômica, proteômica, lipidômica e outras ômicas Algoritmos Análise estatística de dados biológicos Biologia digital Biologia de sistemas Data mining Text mining
Todo o tipo de estudo ou de ferramenta que se pode produzir para obter informação biológica usando sequências de biomoléculas Pouco importa... Definição pragmática Bioinformática é o que os bioinformatas fazem
Systems biology Integrative biology
Abordagem pragmática No Brasil: faz tudo! Sabe utilizar, configurar e gerenciar sistemas operacionais LINUX Sabe programar em uma ou mais linguagens de programação Sabe utilizar e montar bancos de dados em larga escala Tem um grande conhecimento em biologia molecular, estatística Escreve o artigo, responde o revisor, consegue dinheiro...
Os bancos de dados genômicos disponíveis gratuitamente na internet hoje contêm mais informação biológica do que todos os cientistas do mundo serão capazes de analisar, não importa quanto tempo se dediquem Dados gratuitos e de qualidade Muitas vezes pobremente analisados: a corrida genômica Brasil: pra quê financiar pesquisas tão caras? Não seria melhor investir na educação? Tarefa do bioinformata: ser criativo e produtivo ao mesmo tempo Não perde o tempo da produção do dado Economiza 50% do esforço científico Faça da bioinformática o seu ócio criativo
A história começa na década de 1940 com a invenção do moderno computador digital Ele se chama digital, pois os dados são armazenados com um alfabeto binário Dígitos binários 0 e 1 A operação também é digital, baseada na lógica liga/desliga Em 1928, Griffith e cols. descobrem o Princípio Transformante Em 1944, Avery e cols. descobriram que o DNA era a substância que carregava a informação genética
Gostaria de saber se podemos transformar uma cepa não virulenta de S. pneumoniae em uma forma virulenta? Eu acho que nós podemos usar a parte básica do núcleo (a proteína). Não, eu acho que devemos tentar a parte ácida do núcleo (o DNA). 1943... No laboratório de Oswald Avery, Colin MacLeod e Maclyn McCarty
Genoma Humano: - 46 cromossomos - 3,2 x 10 9 pb e ~30.000 genes
Dogma central da biologia molecular DNA Nucleus Cell membrane DNA bases mrna Chain of amino acids Gene Protein Ribosome
Nucleotídeo Nucleosídeo Pentose OH Ribose -D-Ribofuranose H 2 -desoxirribose -D-2-desoxirribofuranose
Base Nitrogenadas PURINAS Purina Adenina Guanina PIRIMIDINAS Pirimidina Citosina Uracila Timina Adenina = Timina Guanina Citosina
Sentido da Fita de DNA
Sentido da Fita de DNA Base Base Base 5 3 5 AACGTTGCTATCGT3
Antiparalelas
Base Nitrogenadas Grupo Ceto (C=O) e Amino (C-NH 2 ) PH Timina Adenina Citosina Guanina PH Relação Molar A T = 1,0 C G = 1,0 AT = CG (?) Chargaff (A+G) = (T+C)
Base Nitrogenadas
Cavidades Maior e Menor Cavidade Maior Volta Cavidade Menor 0.34 nm
Ligações Covalentes Forças de Van der Walls Interações Iônicas (Mg +2 ) Sítios Hidrofóbicos Sítios Hidrofílicos Pontes de Hidrogênio Estabilidade do DNA: Integridade e Flexibilidade
Ligações Importantes Ligações Fosfodiéster Ligação -Glicosídica
Linear x Circular Plamídeos e Vírus
A descoberta da hélice dupla, em 1953, mostrou que a informação genética também é armazenada de forma digital Mas diferente do alfabeto binário dos computadores, os dados genéticos são armazenados com um alfabeto quaternário A, C, G e T Mais tarde se descobriu que a forma dos genes operarem também é digital Até certo ponto, os genes podem ser ligados ou desligados Apenas estas observações já seria suficiente para prever, na década de 1950, que um dia informática e biologia molecular iriam juntas fazer nascer uma nova área de conhecimento
O nascimento da área, entretanto, teve de esperar muito tempo para acontecer Essa é a razão da bioinformática ser uma aparente novidade Algumas pessoas consideram que a bioinformática passou a ser reconhecida como importante pelo mundo científico por volta de 1995 Ano que o primeiro genoma de uma bactéria foi publicado Por que tão longa demora?
Do lado da biologia molecular o motivo é simples Apesar da estrutura do DNA ter sido desvendada em 1953, a informação nela contida não podia ser lida Foi como tivéssemos descoberto o alfabeto utilizado para escrever o livro da vida, mas as palavras desse livro estavam com letrinhas tão pequenas que não conseguíamos lê-las Foi preciso esperar até fins da década de 1980 para que aparecesse uma lente de aumento suficientemente boa que permitisse a leitura dessas letrinhas em grande quantidade Uma máquina automática Em 1995, uma única máquina dessas já conseguia ler milhares de letrinhas por dia
Do lado da computação foi também preciso um amadurecimento Computadores sendo capazes de armazenar cada vez mais informação, de processá-la de modo cada vez mais rápido, a um custo cada vez menor Se o sequenciamento automático do DNA tivesse amadurecido mais rapidamente, digamos com 20 anos de antecedência, não haveria computadores com poder suficiente para dar conta dos dados gerados Na década de 1970 a unidade básica de armazenamento de informação era o kilobyte -- 1000 bytes, aproximadamente 1000 letras Um computador de grande porte daquela época tinha alguns kbytes de memória Com tal memória um computador desses não seria capaz de processar nem sequer o genoma de um vírus, que pode chegar a 20 kilobases, ou 20 mil letrinhas; que dirá o genoma humano, com seus 3 bilhões de letrinhas
Então, através de uma evolução que parece mais ou menos sincronizada, desembocamos em 1995 Os computadores já estavam suficientemente poderosos para poder processar os milhões e milhões de letrinhas que passaram a vir à luz. E assim nasceu a bioinformática, com a missão de ajudar-nos a entender a história que está escrita nesse livro da vida
Até que ponto essa onda em torno da bioinformática é justificada? Afinal de contas, hoje quase toda atividade científica depende do computador o Poderíamos falar em física-informática, astronomia-informática, arqueologia-informática, etc. Será que há algo de especial na bioinformática?
Há dois tipos de problemas em que atua a bioinformática O primeiro tipo de problema é chamado de problema biotecnológico O exemplo clássico é o da montagem de DNA Uma segunda classe de problemas têm um interesse que vai além de tecnologias específicas, que transcende qualquer tecnologia, e diz respeito à natureza mesmo da biologia molecular Queremos saber que informação está contida nos genomas