Sequenciamento de genomas - Sequenciamento de genomas nada mais é que a determinação da ordem linear dos nucleotídeos ou bases nitrogenadas de um genoma. O sequenciamento de um genoma é geralmente referido como a decifração de um código. Uma sequência genômica é uma fita muito longa de letras numa linguagem misteriosa. Quando voce lê uma sentença o significado não está somente na ordem das letras. O significado está nas palavras que as letras formam, na gramática, etc. Genoma é um livro escrito sem letra maiúscula, parágrafo, espaço entre as palavras.
lgvrdlmnaqvtheababcaraposajulrvsmpuloujumpedoverthelazy Igvrdlmnsobremnlopetloflolfoslslpocachorromdnjlajueslsskej eurjtpreguicosokdmbnghrrufifksirijfllspwlkfjhsdywiwkdkjfhp lgvrdlmnaqvtheababcaraposajulrvsmpuloujumpedoverthelaz Igvrdlmnsobremnlopetloflolfoslslpocachorromdnjlajueslsskej Eurjtpreguicosokdmbnghrrufifksirijfllspwlkfjhsdywiwkdkjfhp
Qual a utilidade do sequenciamento de genomas? Sequenciamento é um passo importante no entendimento do genoma. Ajudará na descoberta mais rápida dos genes do genoma. ajudará nos estudos das outras porções do genoma para que servem?
Como o sequenciamento é feito? Existem dois métodos de Sequenciamento: Método químico: Maxan e Gilbert Método enzimático ou Dideoxy ou método de terminação de cadeia: Sanger Método enzimático: Mais popular Decifra o código de uma fita de DNA pela síntese dessa molécula in vitro.
Método enzimático: A síntese de DNA in vitro pode ser obtida com os seguintes ingredientes: Molde de DNA Primer Dinucleotídeos (dntps) DNA polimerase Para o sequenciamento adiciona-se mais: dideoxinucleotídeos ddntps: Possui na posição 3 do carbono do açúcar um H ao invés do grupo OH
Sequenciamento enzimático: manual primer
Automático +ddatp +ddttp +ddctp +ddgtp A A A T T T C C C G G G
O conjunto de fragmentos são separados pelo gel de eletroforese (passo da separação) Corantes fluorescentes permitem a separação de todos os 4 fragmentos em uma única coluna no gel. A base final na extremidade de cada fragmento é identificada. Este processo recria a seqüência original de As, Ts, Cs e Gs para cada pedaço pequeno gerado no primeiro passo. Os limites atuais da eletroforese limita a leitura de 500 700 bases sequenciadas para cada leitura.
Os sequenciadores automáticos analisam os eletroferogramas e o resultado é um cromatograma com 4 cores mostrando picos que representam cada uma das 4 bases do DNA.
Após a leitura das bases, computadores são usados para montar as pequenas sequências (blocos de 500 bases cada) em pedaços longos e contínuos que são analisados quanto aos erros, regiões de genes e outras características. A seqüência final é submetida aos bancos de dados públicos como o GenBank. Dados das Sequências do Projeto Genoma Humano são livremente acessíveis à qualquer um no mundo.
Montagem das sequências (Quebra-cabeças gigante)
Quem está sequenciando o genoma humano? USA é financiado pelo Department of Energy (DOE), o National Institutes of Health (NIH) ou ambos. Pesquisadores em universidades e laboratórios (+ de 100). Muitas companhias privadas dos USA estão conduzindo pesquisas em genoma. Pelo menos 18 outros países estão participando do HGP (França, Alemanha, Japão, China, Austrália, Inglaterra, etc.) www.ornl.gov/hgmis/research/centers.html. http://www.ornl.gov/hgmis/genetics.html
(Clone por clone) 150.000b 500bp Método rápido, difícil de montar Método lento, demorado
De quem é o genoma que está sendo sequenciado nos projetos público e privado? A seqüência do genoma humano resultante não irá representar um cópia exata do genoma de ninguém. No Projeto Genoma Humano (HGP) os pesquisadores coletaram amostras de sangue (mulheres) ou esperma (homens) de um grande número de doadores. Somente algumas amostras foram processadas como fonte de DNA e os nomes da fonte são protegidos nem os pesquisadores, nem os doadores sabem de quem é o DNA que está sendo sequenciado.
A seqüência do genoma humano gerado pela companhia privada Celera Genomics, foi baseada em amostras de DNA coletadas de 5 doadores que se identificaram como: hispânico, asiático, caucasiano e americano-africano.
O conhecimento obtido a partir de ambos esforços será aplicado à todos, porque todos os humanos compartilham do mesmo conjunto básico de genes e regiões genômicas reguladoras que controlam o desenvolvimento e a manutenção de suas estruturas e processos biológicos. Além disso um objetivo importante de se gerar a seqüência referência é identificar as pequenas regiões do DNA que variam entre os indivíduos: Estas variações podem ser responsáveis pela susceptibilidade às doenças e respostas às drogas.
Qual a diferença entre o rascunho e a seqüência final? Ao gerar a seqüência rascunho, os cientista determinaram a ordem das bases em cada pedaço do cromossomo no mínimo 4 a 5 vezes. Para gerar um seqüência de alta qualidade, sequenciamento adicional é necessário para fechar gaps, reduzir dúvidas e permitir somente um erro a cada 10.000 bases (padrão determinado). A versão final irá conter uma cobertura de cada cromossomo estimada de 8 a 9 vezes. Até o momento sequências finais foram geradas para os cromossomos humanos 20, 21 e 22.
O que acontecerá quando a seqüência estiver completa? Os conhecimentos gerados a partir da seqüência de DNA irá definir a pesquisa biológica nas próximas décadas: Número de genes, localizações exatas e funções Regulação gênica Organização da seqüência de DNA Estrutura e organização dos cromossomos Tipos de DNA não-codificante, quantidade, distribuição, conteúdo de informação e funções
Coordenação da expressão gênica, síntese de proteínas e eventos pós-tradução Interação de proteínas em máquinas moleculares complexas Função do gene predita X experimentalmente determinada Conservação evolucionária entre organismos Conservação de proteína (estrutura e função) Proteomas de um organismo (conteúdo total de proteína e função) Predição de susceptibilidade à doenças baseada na variação da seqüência de genes. Genes envolvidos em características complexas e doenças multigenes.
O que o rascunho do genoma humano já mostrou? Pelos números O genoma humano contêm 3164.7 milhões de bases químicas (A, C T e G). Um gene tem em média 3000 bases, mas os tamanhos variam. O maior gene conhecido é o da distrofina com 2.4 milhões de bases. O número total de genes está estimado entre 30.000 35.000. (previsto anteriormente de 80.000 140.000). Quase todas as bases (99.9%) são exatamente as mesmas em todas as pessoas. As funções de mais de 50% dos genes descobertos são desconhecidas.
Separando as sequências... Menos de 2% do genoma codifica proteínas. Sequências repetidas que não codificam proteínas totalizam pelo menos 50% do genoma humano. Pensava-se que sequências repetitivas não tinham função, mas elas explicam a dinâmica da estrutura dos cromossomos. As repetições reformam os genomas pelo rearranjo: criando e remodelando genes existentes.
Como está arranjado? As regiões ricas, densas de genes, são predominantemente compostas de G e C. Em contraste as regiões pobres de gene são ricas em A e T. As áreas de concentração de genes é ao acaso, com grandes áreas de DNA nãocodificante entre elas. O cromossomo 1 tem a maioria dos genes (2968) e o Y tem a menor quantidade deles (231).
Quando comparado com outros organismos: distribuição das áreas ricas em gene mais uniforme. Humanos tem em média 3X mais proteínas do que Drosophila ou vermes: 1 gene = diferentes proteínas. Humanos compartilham com vermes, moscas e plantas as mesmas famílias de proteínas, mas o número de genes é maior em humanos. O genoma humano tem 50% a mais de sequências repetidas do que os vermes (7%) e a mosca (3%).
Para mais informações: Human Genome Project Information Website http://www.ornl.gov/hgmis