PREDIÇÃO DE GENES PROMOTORES NO GENOMA HUMANO UTILIZANDO REDES NEURAIS ARTIFICIAIS

Tamanho: px
Começar a partir da página:

Download "PREDIÇÃO DE GENES PROMOTORES NO GENOMA HUMANO UTILIZANDO REDES NEURAIS ARTIFICIAIS"

Transcrição

1 I 0 ORGANIZAÇÃO SETE DE SETEMBRO DE CULTURA E ENSINO LTDA FACULDADE SETE DE SETEMBRO FASETE CURSO DE BACHARELADO EM SISTEMAS DE INFORMAÇÃO ÁLVARO EDUARDO MASCARENHAS RIBAS PREDIÇÃO DE GENES PROMOTORES NO GENOMA HUMANO UTILIZANDO REDES NEURAIS ARTIFICIAIS PAULO AFONSO BA Dezembro/2008

2 I 1 ORGANIZAÇÃO SETE DE SETEMBRO DE CULTURA E ENSINO LTDA FACULDADE SETE DE SETEMBRO FASETE CURSO DE BACHARELADO EM SISTEMAS DE INFORMAÇÃO ÁLVARO EDUARDO MASCARENHAS RIBAS PREDIÇÃO DE GENES PROMOTORES NO GENOMA HUMANO UTILIZANDO REDES NEURAIS ARTIFICIAIS Trabalho de conclusão de curso submetido à Faculdade Sete de Setembro, como parte dos requisitos necessários para obtenção do titulo de Bacharel em Sistemas de Informação. Orientador: Prof. Msc. Ryan Ribeiro de Azevedo Co- orientador: Prof. Dra. Maristela Case Costa Cunha PAULO AFONSO BA Dezembro/2008

3 2 I ORGANIZAÇÃO SETE DE SETEMBRO DE CULTURA E ENSINO LTDA FACULDADE SETE DE SETEMBRO FASETE CURSO DE BACHARELADO EM SISTEMAS DE INFORMAÇÃO Aprovada em Dezembro de 2008 pela banca examinadora formada pelos seguintes membros: Prof. Msc. Ryan Ribeiro de Azevedo, Mestre (Orientador). Prof. Dra. Marcilia Andrade Campos, Doutora Prof. Msc. Igor Medeiros Vanderlei, Mestre

4 3 I Dedicatória Dedico esse trabalho a meus pais, que me apoiaram incondicionalmente nessa minha jornada rumo ao conhecimento.

5 4 I Agradecimentos Gostaria de Agradecer a todos que ao longo da minha jornada acadêmica me ajudaram na elaboração desse trabalho, em primeiro lugar ao meu professor, amigo e orientador Msc. Ryan Azevedo, que em dois anos tem estado ao meu lado, apoiando-me em minhas pesquisas e auxiliando-me. Agradeço também aos professores Msc. Igor Vanderlei e Dr. Marcília Campos pelas dicas na pré-banca. Agradeço também a meus avós, exemplos de vida, que juntamente com meus pais moldaram as bases da minha educação e cultura, mostrando o verdadeiro sentido de família, amor e honestidade. Agradeço muito (muito mesmo!) a Ariane, minha namorada e perfeita amiga, que sempre ao meu lado mostrou-se essencial a minha vida, me proporcionando a honra de sentir algo maravilhoso e perfeito. Te amo minha pequena e obrigado por tornar a minha vida tão perfeita. Nessa jornada, encontrei alguns amigos que se tornaram irmãos, Orleno e Jean (Laus), que sempre estiveram ao meu lado, obrigado caras pela amizade e pelo apoio que me deram aqui! Acima de tudo, agradeço a meus pais e irmão, que compõem minha perfeita família que mesmo longe estão dentro de mim, acompanhando-me e apoiando-me em todas as horas. Obrigado mãe e pai pelas noites perdidas, obrigado por sempre estarem ao meu lado, por acreditarem em mim, por terem confortado minhas tristezas, por terem comemorado minhas vitorias e acima de tudo por terem me ensinado a viver! Vocês são responsáveis por tudo isso. Amo vocês e onde quer que eu possa estar, carregarei comigo os ensinamentos passados. Obrigado a meus tios, amigos e a todos que de alguma forma me ajudaram na conclusão dessa etapa.

6 5 I "Um cientista é um homem tão débil e humano como qualquer outro; no entanto, a busca científica pode enobrecê-lo, inclusive na contramão de sua vontade." (Isaac Asimov)

7 6 I Resumo Os genes promotores são extremamente importantes na síntese protéica já que são eles os responsáveis por mostrar a mrna (Ácido Ribonucléico Mensageiro ) a região de início e fim da transcrição para que se possa iniciar a tradução pelos ribossomos, dando origem a produção de proteínas.é extremamente importante o conhecimento do local onde haverá a transcrição do DNA, pois, esse local poderá dar o início da vida, a formação de uma célula ou tecido ou até mesmo a formação de doenças genéticas. Para o inicio do trabalho foi feita uma pesquisa no EPD pela palavra chave Homo sapiens sapiens já que esse seria o organismo em que seus promotores seriam estudados, a procura se deu principalmente pela comprovação de que aquelas seqüências eram realmente verdadeiras por isso foi escolhida a base de dados do EPD já que todos os dados são comprovados. Para o experimento foram separadas 181 seqüências de genes, cada uma com 145 pares de base. Todas as seqüências extraídas como promotoras eram seqüências RNA POL II (RNA Polimerase II) reconhecidas. De forma a dar um tratamento digital à base de dados, foi utilizada uma codificação chamada BIN4 para que pudessem ser lidas pelas Redes Neurais (RNA). RNA s são modelos conexionistas ou modelos de processamento paralelos distribuído. O Perceptron de Múltiplas Camadas é composto por neurônios com funções sigmoidais nas camadas ocultas. Uma das aplicações para as RNA's é na Biocomputação que pode ser definida como a aplicação de ferramentas computacionais e de técnicas de análise de dados orgânicos para resolução de problemas de cunho biológico. Esse trabalho vem analisar uma possível melhor arquitetura baseada em uma MLP com o algoritmo de Retropropagação (Backpropagation) para predição de promotores de genes do Genoma Humano. O resultado final é uma RNA que melhor conseguiu predizer os genes promotores e um comparativo com as outras arquiteturas testadas. Para o experimento foi utilizado o Software Neural Builder. Palavras-chave: Redes Neurais Artificiais Multi-camadas, Genes Promotores, Bioinformática.

8 I 7 Abstract The gene promoters are extremely important in protein synthesis because they are responsible for showing the mrna (messenger ribonucleic acid) in the region beginning and end of the transcript so that we can begin a translation by ribosomes, leading to production of proteínas.é extremely important to be aware of where the transcription of DNA, therefore, that location may give the beginning of life, the formation of a cell or tissue or even the formation of genetic diseases. To the beginning of the work was done in a search by keyword DPO Homo sapiens sapiens since this would be the body in which its supporters would be studied, the demand made mainly by evidence that those sequences were really true that was chosen by the foundation DPO's data since all data is proven. For the experiment were 181 separate sequences of genes, each with 145 pairs of base. All sequences were extracted as promoters RNA sequences POL II (RNA Polymerase II) recognized. In order to give a digital processing to the database, we used a coding called BIN4. RNA's connections are models or models of distributed parallel processing. The multi-layered Perceptron is composed of neurons with sigmoidais functions in the hidden layers. One of the applications for the RNA's is on the Biocomputação that can be defined as the application of computational tools and techniques of data analysis for troubleshooting organic seal of organic. " This work is examining a possible best architecture based on an MLP with the backpropagation algorithm (Backpropagation) for prediction of gene promoters of the human genome. The end result is an RNA better able to predict that the gene promoters and a comparison with other architectures tested. For this experiment we used the Neural Builder Software. Keywords: Artificial Neural Networks Multi-layered, Gene Promoters, Bioinformatics.

9 I 8 Lista de Figuras Figura 1.1 Dogma da Biologia Molecular Figura 1.2 Replicação do DNA...27 Figura 1.3 Demarcação de uma seqüência de DNA em relação ao sitio de início...29 Figura 1.4 Sinterização da proteína pelos ribossomos...30 Figura 1.5 Estrutura do DNA mostrando pares de bases e ligações fosfato...31 Figura 3.1 Neurônio em sinapse com a visão dos dendritos...41 Figura 3.2 Potencial de ação e repouso da célula neural...42 Figura 3.3 ADALINE, mostrando seus componentes...44 Figura 3.4 Diagrama esquemático da Rede de Hopfield...45 Figura 3.5 Representação de um neurônio artificial onde se tem as entradas, representadas por X1, x2, Xn..., os pesos sinápticos, representados por W1,W2 e Wn, a função de soma representada por, a função de transferência, representada por T e a saída do neurônio, representada por Y...47 Figura 3.6 Diversas arquiteturas de RNA s...48 Figura 3.7 Ilustração da função erro apresentando um mínimo local e um global...52 Figura 3.8: Superfície de erro com diversos mínimos locais...52 Figura 3.9: Diagrama em blocos da Aprendizagem Não Supervisionado...54 Figura 3.10: Classes Linearmente Separáveis...56 Figura 3.11: Topologia de um Perceptron com D entradas, M neurônios e m saída 57 Figura 3.12: Problema do ou exclusivo, onde nenhuma linha reta de duas dimensões pode separar os pontos (0,1) e (1,0) dos pontos (0,0) e (1,1), sendo portando o problema não linearmente separável...59 Figura 3.13: MLP com principais componentes...61 Figura 3.14: Função erro com mínimos locais...63 Figura 4.1: Rede criada com a configuração inicial, na rede acima pode-se ver as sinapses, a camada escondida e de saída, representadas pelo gráfico da

10 9 I função Sigmóide e a camada de entrada sem representação de função...70 Figura 4.2: Rede criada com a nova configuração, na rede acima pode-se ver as sinapses e as 2 camadas escondidas e a de saída, representadas pelo gráfico da função Sigmóide e a camada de entrada sem representação de função...70 Figura 4.3: Rede criada com a nova configuração, na rede acima pode-se ver as sinapses e as 3 camadas escondidas e a de saída, representadas pelo gráfico da função Sigmóide e a camada de entrada sem representação de função...71 Figura 4.4: Rede criada com a nova configuração, na rede acima pode-se ver as sinapses e as 4 camadas escondidas e a de saída, representadas pelo gráfico da função Sigmóide e a camada de entrada sem representação de função Gráfico 4.5: EMQ do conjunto de validação cruzada (azul) x EMQ do conjunto de teste para a primeira configuração da RNA Gráfico 4.6: EMQ do conjunto de validação cruzada (azul) x EMQ do conjunto de teste para a segunda configuração da RNA...75 Gráfico 4.7: EMQ da configuração 03, em que ao inicio de 561 épocas até o final não houve aprendizado, pois o erro manteve-se constante...76 Gráfico 4.8: Gráfico referente à quarta configuração da RNA. Apesar da oscilação do gráfico, pode-se notar que ao final o mesmo exibe constância no erro...77 Gráfico 4.9: Gráfico referente à quinta configuração, mostrando Constancia do EMQ, tendo valores de 0.11 para o conjunto da validação cruzada e 0.1 para o conjunto de testes. O gráfico com total Constancia indica que a rede não aprendeu nada ao longo desse treinamento...78

11 I 10 Lista de Tabelas Tabela 1.0: A tabela Verdade para o ou exclusivo...58 Tabela 2.0: Métrica usada para as matrizes de confusão das amostras, onde: VP= Verdadeiros promotores, FN= falsos Não Promotor, FP= falsos Promotores e VN= verdadeiros não promotores...73 Tabela 2.1: Matriz de confusão para a primeira configuração da RNA...73 Tabela 2.2: Matriz de confusão para a segunda configuração da RNA...74 Tabela 2.3: Matriz de confusão para a terceira configuração da RNA...75 Tabela 2.4: Matriz de confusão para a quinta configuração da RNA...76 Tabela 2.5: Matriz de confusão para a validação cruzada...78 Tabela 2.6: Métricas estatísticas e seus valores correspondentes a validação da RNA criada...80

12 11 I Lista de Siglas A: Adenina ADALINE :Adaptive Linear Neuron orlater Adaptive Linear Element AFP: Alpha -fetoprotein promoter ASCII: American Standard Code For Information Interchange C: Citosina CC: Coeficiente de Correlação DDBJ:DNA Data Bank of Japan DLLS: Bibliotecas de Ligação Dinâmica DNA: Ácido dexorribonucléico E.Coli: Escheria Coli EMBL: European Molecular Biology Laboratory EMQ: Erro médio Quadrático FN: Falso negativo FP: Falso positivo GB: Gigabytes ISREC: Swiss Institute for Experimental Cancer Research MLP: Multilayer Perceptron mrna:rna mensageiro NCBI National Center of Biotechnology Information PB: Pares de Base RNA POL II: RNA Polimerase II RNA: Ácido Ribonucléico RNA: Rede Neural Artificial rrna: Ribosomal RNA SN: Sensibilidade

13 I 12 SP: Especificidade T: Timina TI: Tecnologia de Informação trna: RNA de transferência TSS: Transcription Start Site UFRGS: Universidade Federal do Rio Grande Do Sul. UFSC: Universidade Federal de Santa Catarina VN: Verdadeiro negativo VP: Verdadeiro positivo

14 I 13 Sumário CAPÍTULO INTRODUÇÃO OBJETIVOS Objetivo Geral Objetivos Específicos JUSTIFICATIVA ORGANIZAÇÃO DOS CAPÍTULOS CAPÍTULO BIOLOGIA Procariotos e Eucariotos Genes Formação de Proteínas Replicação Transcrição Tradução Genes ou regiões Promotoras Análise de Genes Promotores por meio de ferramentas computacionais Análise de Genes Promotores por meio de ferramentas computacionais em genes humanos Base de Dados de Promotores Eucariotos (EPD) Entradas no EPD CAPÍTULO INTRODUÇÃO... 39

15 14 I 3.2 REDES NEURAIS ARTIFICIAIS Inspiração Biológica Histórico Neurônio Artificial Principais Arquiteturas PARADIGMAS DE APRENDIZAGEM Aprendizado Supervisionado Correção dos erros Aprendizado Não Supervisionado APLICABILIDADE DAS RNA S Reconhecimento de Padrões Categorização Aproximação de funções Previsão O PERCEPTRON Algoritmo de Treinamento do Perceptron O PERCEPTRON DE MÚLTIPLAS CAMADAS (MLP) A Arquitetura do MLP Número de Camadas O algoritmo Backpropagation (Regra Delta Generalizada) Funções de Ativação Taxa de Aprendizagem Número de Neurônios Treino seqüencial ou por lote (On-line ou Off - Line) CAPÍTULO PREDIÇÃO DE GENES PROMOTORES COM REDES NEURAIS ARTIFICIAIS DO TIPO MLP BACKPROPAGATION... 66

16 I METODOLOGIA ADOTADA Base de dados Base de dados usada para predição de genes promotores humanos por Redes Neurais do tipo MLP Validação Cruzada Multlayers Perceptrons para Predição de Genes Promotores Humanos RESULTADOS OBTIDOS Validação Métricas Estatísticas para Avaliação dos Resultados CAPÍTULO Conclusões e Trabalhos Futuros REFERÊNCIAS BIBLIOGRÁFICAS... 83

17 16 Capítulo Introdução O presente trabalho tem como tema, a aplicabilidade de redes neurais artificiais para predição de Genes Promotores no Genoma Humano. A Computação pode ser definida como a solução de um problema ou formalmente o calculo de uma função através de um algoritmo. Este é uma seqüência não ambígua de instruções que é executada até que determinada condição se verifique. Para Diverio (2000) o algoritmo foi formalizado em 1936 pela Máquina de Turing de Alan Turing e pelo calculo lambda de Alonzo Church, que formaram as primeiras fundações da Ciência da Computação. Estes pesquisadores foram de extrema importância para as principais áreas da informática e trouxeram grandes contribuições ao estudo contemporâneo. No seu período inicial, a computação era vista apenas como uma ciência para automação de tarefas. Mas, diante das necessidades de armazenamento de dados, os computadores também surgiram para tratamento de informação. Por este fato, Moreira (2006) afirma que a era industrial cedeu lugar à da informação, que é caracterizada pelo conjunto de tecnologias resultantes do uso simultâneo e integrado de informática e telecomunicações isso deu origem ao termo Tecnologia da Informação ou TI, que é um termo utilizado hoje para designar o estudo que tem como base a utilização de computadores para processamento de informações e resolução de problemas. Guenther (2001) coloca que os primórdios da neurocomputação datam o ano de 1943 em que Mcculloch e Pitts idealizaram a construção de uma maquina baseada no processamento do cérebro dos vertebrados usando um grande número de neurônios como o cérebro humano, a contribuição desses dois cientistas foi de grande importância à neurocomputação, principalmente ao estudo voltado as Redes Neurais Artificiais e por conseqüência a Inteligência Artificial.

18 17 No ano de 1949 o cientista Donald Hebb escreve um livro chamado organização do comportamento, propondo uma lei de aprendizagem específica para as sinapses neurais. Kohonen (1972) coloca as Redes Neurais Artificiais (RNA s) como redes massivamente paralelas e interconectadas de elementos simples e com organização hierárquica. Essa definição tende a aproximar a definição das RNA s ao conceito das Redes Neurais cerebrais, já que os neurônios naturais agem paralelamente e são interconectados, fornecendo suas informações aos neurônios conseqüentes. Um dos usos das redes neurais é a aplicação na Biocomputação, a velocidade de processamento, torna as ferramentas computadorizadas cada vez mais responsáveis pelo avanço da pesquisa biológica. Tisdall (2001) coloca a Biocomputação como uma disciplina que esta em rápido desenvolvimento e pode ser definida como: A aplicação de ferramentas computacionais e de técnicas de análise de dados orgânicos para resolução de problemas de cunho biológico, esse conceito é sempre aplicado e visto hoje com as análises de dados biológicos em laboratórios de informática, essas análises são conhecidas como análises In Silico.O termo bioinformática é relativamente novo, antes era referido como: "Biologia computacional. As células formam a matéria de todas as estruturas vivas e as informações, contidas em sua estrutura são herdadas dos mais variados compostos químicos. Todas essas informações estão dispostas no DNA que é formado pelos nucleotídeos. Os genes promotores são extremamente importantes na síntese protéica já que são eles os responsáveis por mostrar a mrna a região de início e fim da transcrição para que essa região possa ser traduzida a posteriores pelos ribossomos, dando origem a produção de proteínas.

19 Objetivos Objetivo Geral O objetivo geral desse trabalho é utilizar uma RNA MultLayer Percepton implementada com o algoritmo de aprendizagem Backpropagation para predizer Genes Promotores em Homo sapiens sapiens Objetivos Específicos Criar a matriz de confusão para cada arquitetura criada; Identificar a melhor topologia encontrada para o problema de predição de genes Promotores em Humanos com a base de dados usada; Comparar o desempenho de predição da rede com diferentes configurações; Diminuir o erro até chegar a melhor configuração; Apresentar um conjunto de dados com base no método de Validação Cruzada (cross validation). Realizar testes de Métricas estatísticas para validação do modelo utilizado

20 Justificativa Diante dos muitos classificadores baseados em inteligência computacional, escolher uma técnica que possa predizer genes promotores torna-se difícil pela carência de bases estatísticas que provem a eficiência desses métodos. Diversos autores como Hawley em Bucher (1986, 1987), Resse (2000) entre outros, tem publicado trabalhos sobre predição de promotores em Procariotos, mas, poucos trabalhos concentram-se em Eucariotos, principalmente no genoma Humano (Eucariotos e Procariotos são explicados melhor no Capítulo 2). Esse trabalho vem analisar uma possível melhor arquiteturas baseadas em uma Multlayer Percepton (MLP) implementada com o algoritmo de Retropropagação (Backpropagation) para predição de promotores em genes extraídos do genoma humano. Além dessa importância, o resultado final desse trabalho é uma RNA que conseguiu predizer os genes promotores diante dos dados colocados como entrada além de um comparativo com as outras arquiteturas testadas. 1.4 Organização dos Capítulos O trabalho é dividido em 5 capítulos onde são introduzidos temas básicos ao entendimento desse trabalho, metodologias utilizadas, resultados encontrados dentre outros. O Capítulo 2 introduz o leitor acerca dos conhecimentos necessários sobre a biologia do problema estudado. Nesse capítulo o leitor será levando ao entendimento de conceitos como: Genes, Genoma, Genes Promotores, formação de proteínas dentre outros temas.

21 20 O Capítulo 3 discute acerca das Redes Neurais Artificiais, mostrando um breve histórico acerca do estudo com RNA s. O capítulo também discute paradigmas de aprendizado, algoritmos de aprendizado, aplicabilidade dentre outros temas. O Capítulo 4 descreve a Predição de Genes Promotores com Redes Neurais Artificiais do Tipo MLP Backpropagation, objetivo desse trabalho. Nesse capítulo são discutidos os principais resultados encontrados no estudo, além da metodologia utilizada e das métricas estatísticas usadas para validação do método. Nesse capítulo estão as matrizes de confusão dos testes da RNA em cada configuração testada, além da matriz de confusão da RNA no momento da validação. O Capítulo 5 exibe as conclusões finais acerca do trabalho, exibindo os principais resultados encontrados e propondo trabalhos futuros com o método criado.

22 21 Capítulo 2 O objetivo desse capítulo é descrever resumidamente os principais termos necessários ao entendimento desse trabalho. Esse capítulo descrevera os conhecimentos básicos em Biologia que o leitor deverá possuir para entender o trabalho por completo. 2.1 Biologia Desde que Watson e Crick (1993) descobriram a dupla Hélice no DNA (Ácido Desoxirribonucléico) começaram a surgir no meio acadêmico diversas pesquisas envolvendo a Biologia Molecular, as quais facilitaram o seqüenciamento genético das mais variadas espécies. Essa corrida pelo conhecimento Molecular teve como resultado uma enorme quantidade de descobertas e publicações, bem como gerou uma quantidade gigantesca de dados que seriam a solução para muitos problemas dentro da Ciência Biológica e também seriam criadores de novos problemas. Valiate (2006) afirma que o processo de seqüenciamento de um indivíduo é somente o início, aduzindo ainda, que quando consolidada essa informação é que os problemas começam já que se iniciam a pesquisa acerca dos mecanismos envolvidos no processo de regulação do DNA. Os primeiros depósitos de informações genéticas foram o NCBI (National Center of Biotechnology Information) GENBANK, EMBL (European Molecular Biology Laboratory) na Europa e o banco de DNA no Japão (DDBJ- Data Bank of Japan). Os quais possuem informações quase idênticas devido a acordos cooperativos internacionais. Cada entrada ou registro no GENBANK pode conter identificações, descrições e informações genéticas em linhas no formato ASCII (American Standard Code for Information Interchange).

23 22 Cada registro no GENBANK é escrito em formato padrão especifico, organizado de modo que os seres humanos e os programas de computador possam extrair a informação desejada com uma facilidade razoável. (Tisdall, 2001, p.59). De acordo a Tisdall (2001), o GENBANK em 2001 possuía bases de seqüências relatadas. Nesse período os dados já atingiam 50GB. Desde 1982, o número das seqüências dobrou a cada 14 meses. A organização desses dados se da em divisões pela classificação filogenética.valiate (2006) em sua tese coloca como exemplo o genoma da bactéria Escheria coli com 5x10 6 e o genoma humano com 3X10 9. Nessa imensa quantidade de informação alguns genomas estão bem caracterizados, como o da E.coli utilizado como organismo padrão para a compreensão de outros organismos. No entanto, muito ainda se desconhece, já se percebe que de uma forma geral a vida apresenta uma tendência natural de se desviar do padrão devido as condições de vida exigidas para cada organismo, seja pelo seu hábitat ou necessidade de sobrevivência. (Valiate, 2006, p.16) Procariotos e Eucariotos Os organismos Procariotos são seres unicelulares que não possuem membrana nuclear, estando seu núcleo em contato com o citoplasma. Os representantes deste grupo são seres primitivos e pertencem ao reino Monera. Os Eucariotos possuem membrana nuclear englobando representantes dos reinos Animália, Plantae, Fungi e Protoctista, inclusive o homem (Homo sapiens sapiens) um membro desse grupo. Junqueirá (1997) compara a célula eucarionte à uma fábrica organizada em seção de montagem, pintura, embalagem e outras. O autor afirma que a separação das atividades permite que as células eucariontes atinjam um maior tamanho sem prejudicar suas funções.

24 Genes A genética ganhou um lugar proeminente na biologia moderna e tem aproximadamente 100 anos, datando a partir do reconhecimento do trabalho de Mendel. A descoberta do ácido dexorribonucléico (DNA) e a primeira estrutura da proteína tem aproximadamente 50 anos (Tisdall, 2001). Qualquer conteúdo genético em um ser vivo é armazenado em moléculas de RNA (Ácido Ribonucléico) ou DNA e cada molécula desta é chamada de cromossomo, os cromossomos encontram-se dispersos no citoplasma dos organismos Procariotos e no núcleo celular dos organismos Eucariotos. O DNA constitui o depósito fundamental da informação genética. Esta informação é copiada ou transcrita nas moléculas de RNA, cuja seqüência de nucleotídeos contém o código para as seqüências específicas de aminoácidos. O DNA e RNA são formados por um açúcar (pentose) e bases nitrogenadas (purinas e pirimidinas). As pirimidinas são: Timina(T) e Citosina (C), e as purinas são: Adenina (A) e Guanidina(G). O RNA contém Uracila em lugar da Timina. Toda a informação genética de um organismo vivo encontra armazenada em uma seqüência de quatro (4) bases. A estrutura primária de todas as proteínas deve ser codificada por um alfabeto de quatro letras ou bases (A,T,G,C).A descoberta desse código foi uma das descobertas mais extraordinárias na biologia molecular. (Robertis, 1993, p.73). Segundo Robertis (1993), embora a quantidade de bases sofra variação de espécie a espécie, em todos os casos, a quantidade de adenina é igual à quantidade de timina (A=T), assim como o número de bases de citosina e guanina também são iguais (C=G),

25 24 Como conseqüência disto, o número de purinas é igual ao numero de pirimidinas (A+G=C+T), sendo a variação nas espécies apenas de AT e GC. O DNA é formado por duas cadeias de polinucleotídios helicoidais com giro para a direita, que formam uma dupla hélice em torno de um eixo central. Essas duas cadeias são antiparalelas, ou seja, suas ligações 3,5 seguem direções opostas.apenas certos pares de bases podem acomodar dentro da estrutura.os únicos dois pares possíveis são AT e CG. Junqueira (1997) afirma que o DNA é responsável pelo armazenamento e pela transcrição da informação genética e ele é encontrado principalmente nos cromossomas e em pequenas quantidades nas mitocôndrias e nos cloroplastos. Nos cromossomas dos Eucariontes o DNA é encontrado principalmente associado a proteínas básicas como as Histonas. Alberts (1997) afirmou que a síntese de proteínas depende de varias classes de moléculas de RNA se iniciando com séries de etapas preparatórias. Sendo a primeira etapa a cópia do RNA mensageiro que deve ser feita a partir do DNA. Essa etapa é de suma importância para a formação final das proteínas. O RNA é sintetizado a partir de uma cópia de DNA por um processo conhecido como transcrição do DNA. O processo de transcrição é gerador do rnrna que carrega a informação para a síntese de proteínas, das moléculas de RNA transportador, ribossomal e de outras moléculas de RNA, que têm funções estruturais ou catalíticas. Todas essas moléculas de RNA são sintetizadas por enzimas, denominadas RNA polimerase, que fazem uma cópia de RNA a partir de uma seqüência de DNA. Em eucariotos, três tipos de moléculas de RNA polimerase sintetizam diferentes tipos de RNA,. Acredita-se que estas RNA polimerases foram evolucionalmente originadas a partir de uma única enzima, presente em bactérias, que medeiam toda a síntese bacteriana de RNA. A RNA polimerase bacteriana é uma enzima grande com múltiplas

26 25 subunidades, associada a várias subunidades protéicas adicionais que entram e saem do complexo polimerase-dna, em vários estágios da transcrição. Moléculas de RNA polimerase livres colidem aleatoriamente com o cromossomo bacteriano, deslizando ao longo dele, mas prendendose apenas fracamente à maioria do DNA. Entretanto, a polimerase se liga muito firmemente, quando em contato com uma seqüência de DNA específica denominada promotor que contém o sítio de iniciação para a síntese de RNA, sinalizando quando esta síntese deve ser iniciada. Após se ligar ao promotor, a RNA polimerase abre uma região específica na dupla-hélice para expor os nucleotídeos de um curto segmento de DNA em cada fita. Uma das duas fitas de DNA expostas atua como molde para o pareamento de bases complementares. A molécula de RNA polimerase se desloca pausadamente, ao longo do DNA, desenrolando a hélice de DNA localizada imediatamente a sua frente, expondo assim, a nova região da fita molde para o pareamento de bases complementares. Desta forma, a cadeia de RNA crescente é estendida por um nucleotídeo de cada vez na direção 5' - 3' (Alberts,1997, p.102). De acordo a Dulbecco (1997), O gene seria a porção do DNA possuidora da informação para a fabricação de proteínas, que são essenciais para a homeostase do organismo. Para o autor um exemplo clássico é comparar o DNA a um texto denso, escrito com apenas quarto letras esse texto é sempre extenso como o DNA do homem que possui 3 bilhões de bases nucleotídicas. Dentro do DNA, o gene possui a principal informação e encontrar o gene é o primeiro passo para entender a informação genética. A combinação das bases, determina toda a construção biológica do indivíduo. O mapeamento dessa seqüência pode indicar doenças futuras, aptidões, problemas mentais e etc. Genoma é o conjunto de todos os genes de um organismo, para Hood (2003) existem de a genes no genoma humano, essa quantidade expressa a complexidade desse genoma e o quão é importante estudá-lo. Como foi dito, nem todas as regiões do DNA codificam genes, sendo chamadas essas regiões de Ítron e as que codificam são chamadas de Exons, estes, irão codificar a proteína. Todas as células de um ser vivo possuem o mesmo DNA a única diferença é que cada tipo de célula produz um tipo diferente de proteína. Essa produção irá depender da localização e da função da célula ou até mesmo do ambiente intra ou extracelular. Dessa forma entende-se que os genes são os fatores determinantes para a função da célula ou do técido e sabe-se também que existem muitos genes que são desativados ou nunca foram ativados.

27 26 Para Tavares (2007): Um dos esforços da comunidade científica atual é de conceber ferramentas que possam reconhecer as regiões na seqüência do DNA onde estão às informações essenciais, os chamados genes. Os genes por sua vez vão ser transcritos em proteínas que irão atuar nas células nas mais variadas atividades. (Tavares, 2007, p. 45). Cabe a computação fornecer essas ferramentas, propondo soluções baratas e mais rápidas, diminuindo assim o gasto com recursos humanos especialistas Formação de Proteínas De acordo a Cabrejos (2001), o núcleo é o compartimento de uma célula eucarionte que contem a informação genética necessária para que ela possa se duplicar, proliferar e se diferenciar. É nesse compartimento que se desencadeia o dogma da biologia molecular (Figura 1.1) que é decidir onde ocorrem os processos de fluxo de informação genética que permite que uma célula se duplique em sua totalidade. Esses fenômenos são altamente regulamentados, exigindo uma grande variedade de proteínas para desenvolver cada um deles. Essas proteínas, em conjunto, determinam o estado metabólico e de diferenciação de uma célula em função do tempo. No núcleo celular dos eucariontes existem três enzimas conversoras RNA: A RNA polimerase I, RNA polimerase II e RNA polimerase. Figura 1.1: Dogma da Biologia Molecular Fonte: Ciência Hoje, 2007

28 Replicação Segundo Alberts (2003), antes de se dividir a célula necessita se duplicar em suas moléculas incluindo o próprio DNA. A replicação é um mecanismo que permite ao DNA dar continuidade ao seu material genético e esse mecanismo ocorre quando uma enzima (Valiate,2006) (chamada DNA Polimerase) se insere entre as duas fitas do DNA separando a ligação bioquímica entre as bases e desenrolando as moléculas, produzindo para cada fita uma nova fita, ligando as bases existentes a uma nova produzida. Ou seja, neste processo são geradas duas novas fitas clones da sucessora. Essa duplicação é chamada de semi-consevativa, pois cada nova fita do DNA tem uma fita nova e uma fita antiga vindo do sucessor. A replicação do DNA é representada na Figura 1.2. Figura 1.2: Replicação do DNA, Fonte: Silva, 1998.

29 Transcrição Na etapa de transcrição, a célula irá controlar a expressão genética ou seja, decidira quando produzir os genes. Na dupla hélice as bases se unem por intermédio das pontes de hidrogênio, que são responsáveis por manter estáveis as hélices. Com o rompimento das pontes, que pode ocorrer naturalmente ou em laboratório por aquecimento, os dois filamentos formadores da hélice são desnaturados enquanto a temperatura se mantiver alta. A desnaturação acontece primeiro nas ligações Adenina- Timina (AT), por fazerem ligação dupla, e depois na ligação citosina- guanina (CG), por fazerem ligação tripla. As RNA s Polimerase reconhecem e ligam-se às seqüências específicas do DNA. Nessa etapa elas causam a desnaturação das moléculas presentes causando a exposição da seqüência de pares de nucleotídeos a ser cópiada elas também dão sustentação a dupla fita que foi separada na região onde haverá a síntese. Na primeira etapa da transcrição, há a identificação das regiões ditas específicas no DNA (TSS- Transcription Start Site) e, após isso, um alongamento com a inserção dos ribonucleotídeos que são colocados na cadeia e para conclusão as seqüências presentes no DNA são identificadas. Com base em regiões específicas do DNA, tem início a transcrição do mrna quando uma molécula de RNA polimerase se liga a uma determinada localização especifica da molécula de DNA, estabelecendo a leitura e o direcionamento sempre na orientação 3-5. As porções de DNA próximas à região que determina se um gene contem sinais que podem ser reconhecidos pela RNA polimerase e sinalizam o início da transcrição são chamadas de regiões promotoras. O primeiro nucleotídeo transcrito, denominado sitio de início da transcrição é designado como +1 na molécula de DNA, os pares localizados a esquerda (Upstream) do sitio de início recebem sinal negativo e números crescentes, enquanto que os nucleotídeos a direita da posição +1 são marcados com números positivos crescentes. (Valiate, 2006, p.28). A Figura 1.3 exibe a demarcação de uma seqüência de DNA com as regiões Upstream e Downstream.

30 29 Figura 1.3 :Demarcação de uma seqüência de DNA em relação ao sitio de início. Fonte: Valiate, Tradução Após a formação de três RNA s, por intermédio da transcrição, já é possível a célula dar início a formação de proteínas, pois cada mrna (RNA mensageiro) que foi criado armazenará informações para criar proteínas com funções variadas. Alberts (1996) salienta que a informação gerada pela mrna sozinha não representa nada, precisando de um mecanismo tradutor do conteúdo. Depois da transcrição o RNA é chamado de transcrito primário. Valiate (2006) afirma que os transcritos primários em Procariotos sofrem pouco ou nenhum processamento após a sua síntese e, em geral, são traduzidos logo quando produzidos. O autor também salienta que nos Eucariotos, o transcrito primário precisa ser alterado para adquirir uma maior estabilidade e caracterizar a molécula de RNA que será encaminhada ao citoplasma para a tradução. As rrna (Ribosomal RNA) e trna (RNA de transferência) são geradas na transcrição e são codificadas por genes, assim como as mrna, sendo que diferem-se da segunda por não possuírem um processo de tradução a posteriores. A síntese protéica das mrna acontece sempre nos ribossomos. A síntese protéica inicia-se no começo da região codificadora e só termina no fim dessa região. As proteínas são montadas ao longo do deslocamento do ribossomo pela mrna. É possível que um mrna possua muitos ribossomos unidos à seqüência, traduzindo uma grande quantidade e gerando muitas cópias da mesma proteína. (Figura 1.4) Uma cadeia termina quando o ribossomo encontra um códon de terminação que não possui nenhum trna que se encaixe, sendo nessa etapa a liberação da cadeia polipeptídica do complexo. A nova cadeia fruto da associação dos diferentes RNAs é a seqüência de aminoácidos, os quais apresentam propriedades físicas e químicas que ocasionam o dobramento da cadeia à medida que é traduzida gerando uma

31 30 forma final enovelada que determina sua funcionalidade. (Valiate, 2006, p.31). Figura 1.4: Sinterização da proteína pelos ribossomos Genes ou regiões Promotoras As células formam a matéria de todas as estruturas vivas e as informações, contidas em sua estrutura são herdadas dos mais variados compostos químicos. Todas essas informações estão dispostas no DNA (Figura 1.5) que é formado pelos nucleotídeos. Como visto anteriormente, para que o DNA possa continuar mantendo as informações, ele precisa copiar-se, ou seja, replicar-se através das RNA Polimerase. Após a transcrição, a mrna ou RNA mensageiro sai da molécula do DNA deixando- o normal novamente.foi observado também que, após a transcrição, o Ribossomo formado pelo RNA Ribossomal ou (rrna), inicia o trabalho de tradução para que seja iniciando o processo de fabricação de proteínas.

32 31 Figura 1.5: Estrutura do DNA mostrando pares de bases e ligações fosfato. Fonte: U.S National Library of Medicine O gene promotor, é um fragmento de DNA localizado na posição 5, anterior ao gene (Upstream), contendo aproximadamente 200 pares de bases... Apesar dessa definição nem todas as seqüências Upstream dos genes funcionam como promotores. Promotores são seções específicas de seqüências de DNA reconhecidos por proteínas específicas, diferenciando de outras partes do DNA que são transcritas e Traduzidas. A posição do promotor é identificada no início da transcrição, a partir da qual o DNA serve como molde para a síntese de RNA mensageiro. Esse sítio é conhecido como sítio de início da transcrição ou TSS (do inglês Transcription Start Site),numerado como +1. A posição dos nucleotídeos anteriores a ele é localizada por inteiros negativos (região upstream), e os posteriores, por inteiros positivos (região downstream). (Monteiro, 2005, p.14). Os genes promotores são extremamente importantes na síntese protéica já que são eles os responsáveis por mostrar a mrna a região de início e fim da transcrição para que essa região possa ser traduzida a posteriores pelos ribossomos, dando origem a produção de proteínas. Os primeiros estudos sobre promotores datam a década de 70 (Valiate 2006), quando se começou a identificar regiões promotoras em Escherichia Coli uma bactéria comumente usada para estudos em Biologia molecular. Browning (2004) afirma que é muito importante

33 32 conhecer todos os componentes e funcionalidades da RNA Polimerase e estas estão ligadas sempre ao ato de reconhecer um gene promotor pois é pelo reconhecimento dessa região que se dará início ao processo da formação de proteínas. De acordo a Friedberg (2003) a função básica de um promotor é indicar a RNA Polimerase o TSS. Caso exista erro nesse processo, o organismo produzirá proteínas erradas e irá comprometer seu funcionamento. No homem, um organismo Eucarioto, para que a RNA polimerase conecte-se ao promotor, é preciso que proteínas chamadas trancriction factors (Fatores de transcrição) liguem-se aos seus sítios de ligação correspondente.valiate (2006 ) em sua tese afirma que os promotores Eucariotos podem ter diversas sub-regiões entre elas estão: TATA-Box, CAAT-Box e GC- Box que são as de maior consenso. O maior problema envolvendo as sub-regiões em Eucariotos é que há imensa variabilidade entre estas e, por conseqüência, existe uma grande variedade também em combinações. As localizações dessas regiões em relação ao TSS podem variar entre os promotores, e nem todas essas sub- regiões existem em um mesmo promotor. São desconhecidas com exatidão as regras pelas quais a RNA polimerase atua por isso se faz necessário o uso de exemplos para entendimento dessas regras. Conforme Tavares (2007), a partir dessa metodologia e apoiando-se em métodos de inteligência computacional tenta-se conhecer o funcionamento desse processo bioquímico essencial à vida. Identificar os genes presentes nas seqüências de DNA e determinar suas funções é a tarefa seguinte após o seqüenciamento do DNA de um organismo. De acordo com Mount (2001) a detecção de regiões promotoras no DNA é um dos recursos mais importantes para a detecção dos genes. Genes promotores são regiões dentro do DNA que podem ligar ou desligar a expressão genética. Sabendo a localização de um gene promotor, pode-se saber o funcionamento do gene dentro de determinados tipos de células. Identificam-se os genes em geral como produtores de proteínas, mas os promotores, especialmente são seqüências vitais no DNA para que haja o metabolismo da célula. São eles mecanismos controladores dos produtos da expressão gênica. Sendo que quase todas as células de um organismo possuem a mesma informação gênica, a variação ocorre nos mecanismos de controle da expressão genética. Entender esse mecanismo cria um entendimento posterior acerca da programação das células executoras de funções especializadas. É extremamente importante o conhecimento

34 33 do local onde haverá a transcrição do DNA, pois, esse local poderá dar o início da vida, a formação de uma célula ou tecido ou até mesmo morte destas por formação de doenças genéticas. Para Cabrejos (2001) nas últimas décadas foram feitos muitos esforços pela comunidade científica a fim de conseguir identificar os fragmentos promotores em meio a uma seqüência. De acordo a autora, qualquer desregulação no processo de transcrição irá determinar se haverá morte celular ou proliferação descontrolada das células, vez que tal efeito poderia levar o indivíduo a algum tipo de doença como um câncer. Em concordância com Cabrejos (2001), Tomizawa (2003) afirma que regulamentando a expressão de um gene suicida, os promotores podem primariamente destruir células tumorais e deixar os tecidos circundantes. O Alpha -fetoprotein promoter (AFP) é um exemplo de um gene que exógeno ativado especialmente no carcinoma hepatocelular (Câncer do fígado). Tomizawa (2003), ainda afirma que estudos recentes demonstram uma viável aplicação de promotores - tumor específico que poderiam replicar-se dentro de tumores, mas não nos tecidos normais, ou seja, não lesionando células vitais a vida. Baseado nesses estudos, a medicina juntamente com a Biologia Molecular estão usando marcadores genéticos promotores. Usados como diagnósticos e prognósticos tais estudos permitem criar terapias próprias para o paciente, ou seja, personalizadas essas terapias têm sido estudas pela farmacogenômica. Valiate (2003) afirma em sua tese que o reconhecimento de regiões promotoras é realizado de forma automática pelos mecanismos internos a célula. O autor também coloca que a identificação das regiões promotoras em Eucariotos exige bastante conhecimento da biologia dos diversos organismos e também de ferramentas computacionais eficientes Análise de Genes Promotores por meio de ferramentas computacionais O estudo de genes promotores In Silico começou com o uso de seqüências extraídas de organismos procariotos pela menor complexidade. Conforme Monteiro (2005) o primeiro a fazer análises computacionais de promotores

35 34 foi Hawley em Foram estudadas 168 regiões promotoras. Ainda de acordo ao autor acima Harley em 1987 deu continuidade ao trabalho, identificando mais 263 genes promotores na E.coli. Nakata em 1988 usou a compilação de bases Harley (1987)e construiu um banco de dados. Esse banco foi submetido a uma rede neural do tipo perceptron. Esse estudo feito por Nakata pode ser reconhecido com o estudo inicial de reconhecimento de promotores por ferramentas computacionais. (Monteiro, 2005, p. 32). Bucher (1986, 1990), através de métodos estatísticos em Eucariotos, conseguiu separar locais funcionais e constituiu matrizes de pesos para cada elemento individualmente, como por exemplo os TATA-Box e os GC-Box. Resse (2000), afirma que apesar dos esforços, as pesquisas destes autores acima citados foram marcadas por altas taxas de falsos positivos. Segundo Monteiro, 2005 O Neill and Chiafari (1989) usaram o método de região consenso em 47 promotores conhecidos de E. coli, dividindo-os em três classes de acordo com as distâncias entre os hexâmeros -35 e -10 (16, 17 ou 18 pares bases). 77% dos promotores foram corretamente identificados, mas o nível de falsopositivos foi muito alto. Mais tarde, este trabalho foi continuado por O Neill (1991) e O Neil (1992) com os seguintes resultados de predição: 78 a 100% para 16pb, 97% para 17pb e 79% para 18pb. Delemer and Zhou (1991) extenderam o trabalho de Nakata, Kanehisa, and Maizel (1988) por meio do uso de uma MLP (MultiLayer Perceptron), em vez do perceptron. Essa rede foi treinada com 80 promotores e com uma certa quantidade de seqüências aleatórias (exemplo de não-promotores). O classificador obtido foi testado com 30 seqüências de promotores e 1500 de não promotores, apresentando uma taxa de classificação correta de promotores (verdadeiropositivo) de 100%. Porem, esses valores podem ter sido afetados pela escolha dos dados porque, primeira mente, a base de dados era muito pequena, além disso, a forma que os exemplos negativos (não-promotores) foram gerados, influenciou no protocolo de busca do promotor que possuía a alta sensibilidade pela média de A(adenina)/T(timina) quando já existe, normalmente, relativa presença de A(adenina)/T(timina) no promotor (Mulligan et al. 1984; O Neill and Chiafari 1989). (Monteiro, 2005, p. 33). Em 1995 Matis computou diversas matrizes de peso para uma maior quantidade de TATA-Box, combinando diversos estudos estatísticos, ele utilizou um algoritmo Backpropagation para um sistema neural que conseguisse predizer genes

36 35 promotores. Ainda em 1995, Prestidge, desenvolveu um programa chamado localizador de promotores, baseado em um banco de dados de transcrição combinado com as matrizes de Bucher (1990).Fickett (1997) fez estudos relacionados ao reconhecimento de promotores em Eucariotos, em um destes estudos conseguiu prever propriedades estatísticas nas seqüências de DNA. Já Scherf (2000) em estudos com Eucariotos conseguiu 43% de acertos na predição de promotores. Pedersen (2001) em seu trabalho, afirma que diminuir a taxa de falsos positivos e aumentar a taxa de verdadeiros positivos é um dos principais desafios da predição de promotores por ferramentas computacionais Análise de Genes Promotores por meio de ferramentas computacionais em genes humanos. Lander, em 2001, foi extremamente importante para a biologia molecular por mostrar uma grande parte do genoma humano, praticamente iniciando a pesquisa com a biologia molecular humana. Nos anos recentes, foram propostos muitos estudos com a intenção de melhorar a predição dos promotores, mas poucos estudos foram feitos com Humanos. Um dos primeiros estudos feitos com Genes humanos in silico foi o mapeamento do genoma humano feito por Ioshikhes em Outro estudo foi feito por Davuluri, em 2001 que usou métodos computacionais para prever promotores e Exons iniciais no Genoma Humano. No mesmo ano, Hannenhali (2001) usou métodos de inteligência artificial para predição de promotores em genes humanos. Ponger (2002) identificou sítios de iniciação da transcrição do DNA em grandes genomas de mamíferos. Esse estudo foi extremamente importante para o entendimento de algumas das ferramentas usadas pela RNA polimerase para início da transcrição. Esse estudo também foi interessante sendo um marco para o estudo do Filo Mamalia. Bajic, 2002 em um projeto chinês criou o Dragon Promoter, um reconhecedor de promotores em vertebrados. Baseado nesses métodos Chen (2005) desenvolveu um novo sistema neural Híbrido, para predição de promotores em humanos, o método baseava-se em

37 36 redes neurais com aprendizado supervisionado utilizando um conjunto representativo do problema. O estudo se deu com o uso de sinais fortes e fracos para as entradas da rede sendo os fortes representados pelos promotores e os fracos representados por fragmentos não promotores. Uma descoberta importante desse estudo de foi que um exagerado número de pares de bases na rede criaria uma dificuldade no treinamento, pois seria custosa a atualização dos pesos. O autor chama esse fenômeno de Dimensionalidade maldita. Reese (2000) utilizou Redes Neurais e um conjunto de 40 genes promotores humanos conhecidos e 1000 fragmentos quaisquer do genoma extraídas do Genbank versão 86.0 e do EPD (Banco de dados de Promotores Eucariotos). Para o treinamento da rede neural, o autor usou 300 seqüências promotoras, extraídas do EPD e reconhecidas no Genbank e usou 3000 seqüências não promotoras, ele também usou seqüenciais de outros animais como Gallus (12,1%) Ratos (23,4%) e humanos (37,4%) para a composição destas seqüências criando uma base que ele chama de jogo. Para o teste da rede ele utilizou um conjunto de dados com 129 promotores humanos e 1000 seqüências não promotoras para o jogo Uma consideração importante do autor é que, segundo o mesmo, é necessária para predição de promotores humanos uma solução que possua um número pequeno de falsos positivos Base de Dados de Promotores Eucariotos (EPD) Segundo Perier (1998) o EPD (Eukaryotic Promoter Database) é uma base de dados de anotações não redundantes, compatível com a RNA Polimerase II. O EPD é um banco de dados desenvolvido e mantido por membros do Grupo de Bioinformática da ISREC (Swiss Institute for Experimental Cancer Research ), um dos membros fundadores do SIB (Instituto Suíço de Bioinformática). O EPD fornece informações sobre promotores eucariotos disponíveis no NCBI Genbank e destinase a auxiliar pesquisadores no inquérito dos sinais da transcrição nos eucariotos.

38 37 De acordo a Perier (1999) o Promotor de Dados eucarióticos é uma coleção de não-redundantes eucarióticas promotores, para os quais o sítio de inicialização tenha sido determinado experimentalmente. O acesso às seqüências promotoras é feito por ponteiros na posição do nucleotídeo. A anotação parte de uma entrada e inclui a descrição do site início de mapeamento de dados, referências cruzadas a outros bancos de dados e referências bibliográficas. O EPD está estruturado de uma forma que facilita a dinâmica de extração de regiões biologicamente significativas promotoras sendo ideal para uso de subconjuntos para análise comparativa de seqüência. O EPD pode ser acessado pelo link De acordo a Perier (1998) o EPD foi originalmente concebido como recurso para análise comparativa de seqüências desempenhando um papel fundamental no desenvolvimento de algoritmos para previsão de promotores Eucarióticos. O EPD é rigoroso com o controle de qualidade do seu banco de dados. Para ser incluído, um promotor deve cumprir uma série de condições estabelecidas no manual do utilizador. O EPD é mais confinado aos promotores reconhecidos pela RNA polimerase II. De acordo ao Manual, para uma seqüência ser inscrita na base de dados ela deve atender aos seguintes critérios: 1. Deve ser reconhecida pela RNA POL II; 2. Ativa em uma maior Eukaryota; 3. Experimentalmente definida ou homólogos e suficientemente semelhante a um promotor definido experimentalmente; 4. EMBL disponível na versão atual; 5. Distinta de outros promotores do banco de dados. Ainda de acordo o manual do usuário, o EPD contém aproximadamente 139 espécies diferentes catalogadas. No EPD o promotor que foi determinado experimentalmente é marcado com um sinal de + e os locais não promotores são marcados com -.Esse mapeamento possui, segundo o manual do usuário, uma

39 38 precisão de mais ou menos 5 pares de bases, o que é aceitável para estudos em biologia molecular.pode-se acessar a base de dados completa em um único arquivo ASCII plano, que pode ser baixado através do link: ftp.epd.isbsib.ch/pub/databases/epd. As seqüências contidas no EPD estão nos formatos FASTA e EMBL sendo o primeiro interpretado pela maioria dos programas de genética molecular e filogenia. O EPD é financiado pela Federação Suíça de Educação e Pesquisa. O EPD para Bucher (2006) destina-se a auxiliar pesquisadores experimentais, bem como analista no âmbito de inquérito de sinais em Genes. Para esse trabalho será usada Human Promoter Database disponível no EPD no link (a escolha de promotores humanos se deu pela complexidade do genoma e pelo desconhecimento das regras que são usadas pela RNA POL II para identificação do Promotor Humano) Entradas no EPD Segundo o manual do usuário, uma entrada no EPD deve possuir as seguintes características: 1. Identificação do promotor e sua descrição; 2. Ponteiros legíveis por maquina indicando a seqüência de início da transcrição e as entradas correspondentes no sítio; 3. Descrição da evidencia experimental do início da transcrição; 4. Vários tipos de classificações úteis para promotores e para extrações biológicas; 5. Informações sobre propriedades de regulamentação; 6. Referências cruzadas para outras bases de dados.

40 39 Capítulo 3 Redes Neurais Artificiais Este capítulo descreve os principais conhecimentos necessários para o entendimento das Redes Neurais Artificiais, o capítulo é iniciado com a semelhança entre as RNA s e as Redes Neurais Biológicas, após isso é visto um breve histórico sobre as pesquisas na área, passando depois para a aplicabilidade em si das RNA s. 3.1 Introdução A Computação pode ser definida como a solução de um problema ou formalmente o calculo de uma função através de um algoritmo. Este é uma seqüência não ambígua de instruções que é executada até que determinada condição se verifique. Segundo Diverio (2000) o algoritmo foi formalizado em 1936 pela Máquina de Turing de Alan Turing e pelo calculo lambda de Alonzo Church, que formaram as primeiras fundações da Ciência da Computação. No seu período inicial, a computação era vista apenas como uma ciência para automação de tarefas. Mas, diante das necessidades de armazenamento de dados, os computadores também surgiram para tratamento de informação. Por este fato, de acordo a Moreira (2006) a era industrial cedeu lugar à da informação, que é caracterizada pelo conjunto de tecnologias resultantes do uso simultâneo e integrado de informática e telecomunicações o que deu origem ao termo Tecnologia da informação ou TI. Um dos usos das redes neurais é a aplicação, a Biocomputação, segundo Tisdall (2001), a Biocomputação é uma disciplina que está em rápido desenvolvimento e pode ser definida como: A aplicação de ferramentas

41 40 computacionais e de técnicas de análise de dados orgânicos para resolução de problemas de cunho biológico. O termo bioinformática é relativamente novo e antes era referido como: "Biologia computacional (Tisdall, 2001). Um dos mais proveitosos resultados do envolvimento entre a biologia e a computação é que ambas as áreas são ricas em técnicas e novos resultados. A Biocomputação hoje tem sido usada para resolver diversos problemas dentro das ciências biológicas, são áreas de estudo e interesse dos Bioinformátas a Genética, a sistemática, a filogenia a biologia molecular e etc. 3.2 Redes neurais Artificiais Inspiração Biológica O cérebro pode ser considerado o mais eficaz processador já descoberto, composto por mais ou menos neurônios interconectados com uma média de 10 4 sinapses. Juntos conectados esses neurônios formam uma grande rede neural orgânica, onde as diferenças de concentração de íons sódio e potássio transmitem os impulsos nervosos através das sinapses. Como exemplo da grande capacidade de armazenamento e processamento de informação dessas redes pode-se citar a velocidade em que a dor pode ser sentida desde o inicio da ação. Além do cérebro, todo o corpo humano possui uma imensa rede de neurônios, sendo estes neurônios, juntamente com o cérebro, cerebelo, bulbo, tronco entre outros, os principais formadores do sistema nervoso que é o sistema responsável por todas as interações entre o corpo e ele mesmo e entre o corpo e o contexto ou ambiente em que este está inserido. Toda a comunicação do sistema nervoso é dada através de impulsos que são emitidos a cada neurônio da rede. Quando um neurônio recebe um impulso, este é processado e o neurônio encontra-se em potencial de ação que é uma descarga elétrica que percorre toda a membrana do neurônio, ao atingir um limiar qualquer, o pulso atinge o axônio chegando às ligações dos dendritos, uma característica importante do processamento neural- cerebral é que este é paralelo,

42 41 permitindo ao corpo efetuar as mais diversas atividades ao mesmo tempo. Essa descarga acontece porque há uma diferença de potencial entre os íons sódio e potássio, além de uma diferença entre a permeabilidade da membrana para esses íons. Acabado esse potencial de ação, o neurônio secreta um neurotransmissor que irá fluir na direção corpo celular- axônio passando do axônio para os dendritos de outra célula neuronal dando continuidade ao impulso. O neurônio que está recebendo o pulso pode controlar a intensidade deste. Esse controle causa uma oscilação na polaridade da membrana pós- sináptica, esses pulsos não são contínuos e quando acabam o neurônio entram em um estado chamado potencial de repouso. Os neurônios biológicos são compostos pelos dendritos (Figura 3.1), que são responsáveis por receber os pulsos transmitidos por outros neurônios, o corpo celular, que é responsável por coletar a informação que veio de outro neurônio, e o axônio que pode chegar a alcançar metros de comprimentos, a principal função do axônio é encaminhar os pulsos para os outros neurônios da rede neural biológica (Figura 3.2). Figura 3.1: Neurônio em sinapse com a visão dos dendritos. Fonte: Ciência Hoje

43 42 Figura 3.2: Potencial de ação e repouso da célula neural Fonte: UFSC Histórico Redes neurais artificiais também são chamadas de modelos conexionistas ou modelos de processamento paralelos distribuído. Luger (2004) afirma que os modelos conexionistas descrevem o surgimento da inteligência como um acontecido em sistemas simples, interativo, através de um processo de aprendizagem ou adaptação pelo qual as conexões entre os componentes são ajustadas. Nesses sistemas, o processamento é distribuído através de conjuntos ou camadas de neurônios (Luger, 2004, p.392) Segundo Guenther (2001) os primórdios da neurocomputação datam o ano de 1943 em que Mcculloch e Pitts idealizaram a construção de uma maquina baseada no processamento do cérebro dos vertebrados usando um grande número de neurônios como o cérebro humano. Mcculloch foi um neuroanatomista e psiquiatra que colocou o neurônio biológico como possuidor de entradas binárias por somas que eram ponderadas as quais produziam uma soma efetiva. Mcculloch se uniu a Pitts um matemático em 1942 Para Haykin, 2001 Em um artigo descrito na época por Mcculloch e Pitts descreviam um calculo lógico das redes neurais que unificava os estudos de neurofisiologia

44 43 e da lógica matemática. Eles assumiam que o modelo formal de um neurônio seguia a lei do tudo ou nada. Como um número suficiente dessas unidades simples em conexões sinápticas ajustadas apropriadamente e operando de forma síncrona, Mcculloch e Pitts mostraram que uma rede assim construída realizaria, a princípio, a computação de qualquer função computável. Este era um resultado significativo e com ele é geralmente aceito o nascimento das disciplinas de redes neurais e inteligência artificial. (Haykin, 2001, p.55). No ano de 1949 o cientista Donald Hebb escreve um livro chamado A organização do comportamento propondo uma lei de aprendizagem especifica para as sinapses neurais. Heeb afirmou em seu livro que a conectividade do cérebro é sempre modificada à medida que o ser vivo vai aprendendo coisas diferentes, e que são esses aprendizados que gerenciam a criação de novas redes neurais. No ano de 1956 no Darthmouth College foi criado os dois paradigmas da inteligência artificial. A inteligência artificial simbólica e a conexionista sendo que a primeira vertente procura imitar o raciocínio humano sem se preocupar com os processos e a segunda procura uma simulação da estrutura cerebral humana, procurando um sistema que aprenda e erre e procure aprender com seus erros. Em 1951 Minsky construiu o Snark, o primeiro neurocomputador, essa maquina, conseguia ajustar seus pesos de forma automática, mas, apenas serviu para estudos técnicos sem aplicações externas a academia. Ainda em 1951, Jhon Von Neumman chegou à conclusão que as RNA s, poderiam corrigir seus próprios erros, baseadas em informações já vistas. Essa pesquisa criou na academia um interesse em entender os mecanismos de aprendizagem do modelo, onde, foi aplicado à regra de Heeb que afirma que quando um estimulo de entrada influencia na produção de estímulos de saída o peso da conexão entre os neurônios deve ser incrementado. Rosenballt, em 1958, pensou em uma rede neural artificial com uma camada, a essa rede o cientista deu o nome de Mark Perceptron e introduziu o conceito de aprendizado artificial. Rosenballt desenvolveu o Perceptron para o desenvolvimento de padrões. Em 1960 na Universidade de Stanford Window desenvolveu o ADALINE (Figura 3.3) (Adaptive Linear Neuron orlater Adaptive Linear Element) que era uma rede neural de uma camada baseada no neurônio de Mcculloch. Essa rede construía-se basicamente dos pesos, de uma função de soma

45 44 no neurônio, uma função de ativação, entradas e saídas e um professor para proporcionar o aprendizado supervisionado. Figura 3.3: ADALINE, mostrando seus componentes. Fonte: Grupo de Circuitos, Departamento de senhas, Sistemas e Radiocomunicadores. Após o ano de 1960, o estudo sobre redes neurais começou a ser descartado pela academia, pois diversos cientistas começaram a publicar artigos com experimentos falsos ou precipitados sobre maquinas que imitavam totalmente o cérebro humano. Essas falsas publicações criaram um grande descrédito a pesquisa com RNA s, o que levou a uma diminuição das pesquisas até a década de 80. Na década de 1982, o físico americano Hopfield Desenvolveu uma rede recorrente que tem como característica sempre convergir a um mínimo local e nem sempre a um padrão armazenado. As unidades da rede de Hopfield são sempre binárias, ou seja, só poderão ter dois valores diferentes para seus estados. A rede pode ter valores de 1 ou -1 ou 0 ou 1. Na rede de Hopfield as saídas se ligam as entradas por um atraso no tempo esse atraso faz a rede sempre depender do seu estado anterior, criando uma recorrência. (figura: 3.4)

46 45 Figura 3.4: Diagrama esquemático da Rede de Hopfield Fonte: UFRGS Para Kohonen (1972) as Redes Neurais Artificiais (RNA s) são tidas como redes massivamente paralelas e interconectadas de elementos simples e com organização hierárquica. Já Loesh em 1996 afirmou que as RNA s são sistemas de implementação em hardware e software que imitam habilidades computacionais. Valença (2005) afirma que as redes neurais se constituem em uma técnica de inteligência artificial cuja utilização prática está se tornando cada vez mais presente no dia-a-dia. Aplicações realizadas com Redes Neurais têm apresentado desempenho satisfatório em diversas áreas de pesquisa como: Predição, reconhecimento, aproximação de função, processamento de séries temporais e etc Neurônio Artificial Pitts (1943) juntamente com Mcculloch idealizaram um protótipo de um neurônio artificial (Figura 3.5). Estes cientistas basearam suas pesquisas em outros estudos feitos com neurônios de seres vivos e procuraram através desse protótipo simular o comportamento de uma célula neural viva, esse neurônio artificial possuía uma função de entrada, uma função de soma e uma saída. Os autores, escreveram

47 46 no ano de 1943 um artigo chamado A logical Calculus of the Ideas Immament in Nervous Activity (O calculo lógico das Idéias Nervosas) onde propuseram um modelo matemático para o protótipo criado. Esse artigo descreveu que o neurônio poderia estar ativo ou não ativo, simulando a sinapse natural. Através do calculo proposital, ter-se-ia um tratamento discreto e binário ao neurônio artificial. A operação de um neurônio artificial para Pits e Mcculloch se inicia com a apresentação das entradas ao neurônio, onde cada entrada será multiplicada por um valor que irá indicar sua influência na saída do neurônio, após isso, é feita uma soma ponderada dos sinais que tendem a produzir um nível de atividade, se o nível de atividade ultrapassar um limite especificado o neurônio irá produzir uma determinada resposta de saída. As entradas desse neurônio segundo Luger (2004) podem ser excitatórias representadas pelo vetor + ou inibitórias representadas pelo vetor (-). Uma função de ativação, multiplica cada entrada do conjunto ao seu peso correspondente e soma os resultados. Se a soma for maior ou igual a zero o neurônio artificial retorna 1 senão, irá retornar -1. McCulloch e Pitts mostraram como estes neurônios poderiam ser construídos de forma a calcular qualquer função lógica, mostrando que sistemas destes neurônios fornecem um modelo computacional completo. (Luger, 2004, p. 394). Apesar de McCulloch e Pitts mostrarem que as RNA s poderiam resolver qualquer função, o interesse na computação neural apenas surgiu quando se imaginou aplicações práticas para as RNA s, essas aplicações práticas precisavam de uma regra de aprendizagem, foi quando as idéias propostas por Heeb a cerca das sinapses cerebrais foram usadas para compor algoritmos de aprendizagem para os modelos neurais. Matematicamente, o neurônio artificial, é composto por um conjunto de entradas X1, X2, X3,... Xn, uma saída chamada de Y, uma função de soma, responsável pelo calculo da entrada, uma função de ativação do neurônio que Segundo Braga (2007) A função de ativação, é responsável por gerar a saída Y do neurônio a partir dos valores dos vetores de pesos W= (W1...Wn) e de entradas X= (x1...xn). O neurônio é composto também por uma função responsável pela transferência, todas as entradas são ligadas ao neurônio por conexões sinápticas sendo essas conexões associadas a determinado peso. Esses pesos, associados às

48 47 conexões são responsáveis pelo conhecimento da RNA determinando a importância de cada entrada ao contexto, sendo que quanto maior o estímulo de uma conexão maior será a importância da entrada a produção da saída. Quando a entrada de um neurônio é calculada o valor que resulta é então comparado a um valor limiar, imposto pelo projetista, depois de alcançado um valor próximo ao limiar esse valor é emitido a próxima camada através da função de transferência. Figura 3.5: Representação de um neurônio artificial onde se tem as entradas, representadas por X1, x2, Xn..., os pesos sinápticos, representados por W1,W2 e Wn, a função de soma representada por, a função de transferência, representada por T e a saída do neurônio, representada por Y Principais Arquiteturas Uma função de ativação sozinha não é responsável pela resolução do problema proposto à rede, pois os neurônios individualmente possuem uma capacidade computacional limitada assim como os neurônios naturais. Neurônios, conectados em rede são os responsáveis pela resolução dos problemas, pois através da união da sua capacidade computacional, conseguem resolver os mais variados desafios dentro de muitos contextos. Uma arquitetura seria a forma como os neurônios estão dispostos na rede, sendo a mais simples a arquitetura Feedforward de única camada em que ocorre apenas alimentação da rede no caminho inicial ao final sem retorno, outro exemplo de arquitetura é a Feedforward de mais de uma camada, contendo camadas ocultas, sendo essa camada oculta uma potencializadora da capacidade computacional da rede, conferindo ao sistema a característica de aproximador de qualquer função continua. Segundo Braga (2007) a escolha de uma arquitetura vai depender principalmente:

49 48 A. Da complexidade do problema; B. Dimensionalidade do espaço de entrada; C. Características dinâmicas ou estáticas; D. Conhecimento a priori sobre o problema; E. Representatividade dos dados. A Figura 3.6, ilustra algumas arquiteturas de RNA s Figura 3.6: Diversas arquiteturas de RNA s. Fonte: Braga (2007)

50 Paradigmas de aprendizagem Uma das principais características das RNA s é a capacidade de apreender por através de exemplos, diferente da inteligência artificial simbólica, o aprendizado na I.A conexionista, que tem como um dos objetos de estudos os Modelos Neurais colocar o aprendizado como um ajuste entre a intensidade das conexões dos neurônios. O aprendizado em uma RNA é basicamente o processo de ajuste dos pesos da rede que segundo Braga (2007) guardam o conhecimento ao final do processo de tudo que a rede adquiriu do ambiente externo. Haykin (2001) define aprendizado como: Processo pelo qual parâmetros livres de uma rede neural são adaptados através de um processo de estimulação pelo ambiente no qual a rede está inserida. O tipo de aprendizado é determinado pela maneira pela qual a modificação dos parâmetros ocorre. (Haykin, 2001, p.75). A definição acima ainda segundo o autor implica nos seguintes exemplos: A. A rede Neural é estimulada por um ambiente ou contexto B. A rede sofre modificações nos seus parâmetros livres por intermédio da estimulação inicial. C. A Rede Neural responde de maneira nova ao ambiente, devido às modificações ocorridas na estrutura interna do sistema. O aprendizado sempre está relacionado ao melhoramento da Rede baseado em algum critério pré estabelecido, Braga (2007) cita o EMQ (Erro Médio Quadrático) como um exemplo de desempenho usado pelos algoritmos de correção de erro. Nesse caso, espera-se que o erro diminua ao longo do treinamento de uma RNA. De forma generalizada o valor do vetor de pesos W(t+1) no instante t+1 pode ser escrito pela equação: W(t+1)= W(t) + W(t) Fonte: Braga (2007)

51 50 Onde W(t) e W(t+1) são os valores dos pesos nos instantes t e T+1, e ajuste aplicado aos pesos (Braga, 2007). W(t) é o A diferença nos algoritmos está na forma em que calculam o W(t), pois há vários algoritmos de treinamento de RNA sendo para Braga (2007) agrupados em dois paradigmas principais: O Aprendizado Supervisionado e o Aprendizado Não- Supervisionado Aprendizado Supervisionado O aprendizado supervisionado é caracterizado pela presença de um professor que estimula as entradas da rede por meio de padrões e observa a saída calculada comparando com a saída correta. Como resultado os pesos são atualizados de forma a tornar a saída calculada o mais perto possível da saída real. Para cada saída gerada pela rede o professor faz uma comparação com a saída verdadeira fornecendo os valores para ajuste dos pesos. A cada saída gerada, o professor faz essa ação até que se consiga o resultado estimado. O Aprendizado supervisionado aplica-se melhor ao reconhecimento ou mapeamento de padrões, sejam estes, preditos ou apenas classificados. Basicamente, pode-se programar o aprendizado supervisionado sob duas formas que são on line e off- line, no treinamento on line, o conjunto de dados muda sempre, colocando a rede em um processo de atualização constante. Já no aprendizado off line, o conjunto de treinamento não muda e então quando atingida a solução esperada, cessa-se o treinamento. Os modos de implementação on line e off-line serão explicados mais detalhadamente Correção dos erros Braga (2007) coloca como o exemplo mais típico de aprendizado supervisionado o aprendizado por correção de erros, em que a rede, procura sempre

52 51 diminuir o erro gerado pela resposta atual em relação à saída correta. Pode-se extrair a equação abaixo para o erro E(t) no instante de tempo t (Braga, 2007): E(t) =y d (t) y(t) Onde y d (t) é a resposta desejada e y(t) é a resposta emitida pela rede no momento atual. Segundo Braga (2007) a principal equação usada pelos algoritmos de minimização de erros é a seguinte: W i (t+1) =w i (t) + ne (t)x i (t) Sendo que w i (t) refere-se ao peso de entrada i, n, referente a taxa de aprendizagem do algoritmo, e(t)é uma medida de erro e x i (t) é a entrada i do neurônio. (Braga, 2007). A equação acima informa que o ajuste dos pesos é proporcional ao produto do erro pelo valor da entrada da sinapse no instante de tempo atual. De acordo a Valença (2005) o objetivo do algoritmo de minimização de erro é encontrar uma solução que atenda aos critérios, ou seja um valor mínimo para a função erro que possa ser aceito para o problema ou contexto que se quer resolver. Entretanto, para o autor a superfície de variação do erro com relação aos pesos normalmente é de grande complexidade apresentando diversos valores mínimos para a função erro, chamados mínimos locais. A principal variável do processo de minimização do erro é a taxa de aprendizagem, que ira buscar aproximar a solução atual a um mínimo global que no caso seria o erro mínimo aceitável para o problema.o maior problema para os algoritmos de redução de erro é que diante de muitos mínimos locais encontrar o mínimo global muitas vezes se torna uma tarefa difícil, uma das soluções aplicadas para esse problema é a inserção de um termo adicional chamado momento que consegue aumentar a taxa de aprendizagem aumentando a velocidade da convergência da rede, essa variável, quando implementada faz a rede guardar todos os mínimos locais de forma a encontrar o menor erro, que seria o mínimo global. Sempre o objetivo do aprendizado por minimização do erro é a partir de um ponto qualquer da superfície do erro, mover-se ao mínimo global.

53 52 A Figura 3.7 extraída de Valença (2005) apresenta uma ilustração com um mínimo local e o mínimo global. A Figura 3.8 apresenta um gráfico com diversos mínimos locais e um global para o peso em função do erro. M í n im o lo c a l M í n im o G lo b a l Figura 3.7: Ilustração da função erro apresentando um mínimo local e um global Fonte: Valença (2005) Figura 3.8: Superfície de erro com diversos mínimos locais. Fonte: Braga (2007) Aprendizado Não Supervisionado Diferente do Aprendizado Supervisionado no Aprendizado Não Supervisionado não existe um professor acompanhando a aprendizagem. Diferente do aprendizado Supervisionado no Aprendizado Não Supervisionado a rede não

54 53 conhece as saídas do problema, apenas as entradas são apresentadas a rede e esta, ira procurar regularidades ou padrões no conjunto de dados apresentado, para que possa existir o aprendizado o conjunto deve apresentar dados com repetições, ou seja redundâncias para que a rede possa ir vendo onde estão os padrões. De acordo Haykin (2001) uma vez que a rede tenha se adequado as regularidades estatísticas dos dados de entrada, ela estará apta a formar representações internas para codificar as características da entrada e desse modo criar de forma autônoma novas classes. A Figura 3.9 extraída de Haykin (2001) ilustra o aprendizado não supervisionado através de um diagrama de blocos. Figura 3.9: Diagrama em blocos da Aprendizagem Não Supervisionado Fonte: Haykin (2001) 3.4 Aplicabilidade das RNA s Haykin (2001) afirma que a escolha de um algoritmo de aprendizagem particular é influenciada pela tarefa de aprendizagem que uma Rede Neural deve executar. Ou seja o contexto ou ambiente do problema é que ira dizer qual algoritmo o projetista de RNAs irá escolher. Haykin (2001) identifica quatro tarefas de aprendizagem em que podem ser aplicadas as RNA. São essas tarefas abaixo: Reconhecimento de Padrões Desde a Grécia antiga, sabe-se que o reconhecimento é uma característica da memória humana, todos os modelos cognitivos sempre utilizam

55 54 reconhecimento em suas operações. No reconhecimento de Padrões a Rede deve atribuir um padrão desconhecido entre varias classes conhecidas (Braga, 2007). O reconhecimento de Padrões encontra-se como um estudo dentro do Aprendizado Supervisionado, Segundo Braga (2007) na atividade de Reconhecimento de Padrões, a Rede deverá adaptar os seus pesos para mapear as relações que existem entre os padrões que são apresentados como entradas e as classes que correspondem a esses padrões, a Rede terá como base para essa ação o conjunto que foi apresentado no seu treinamento. Então o reconhecimento se dá quando a rede atribui uma classe conhecida a um padrão desconhecido por ela. Para Haykin (2001) o Reconhecimento de Padrões é feito por uma Rede de natureza estatística, sendo os padrões representados por pontos que o autor chama de Espaço de Decisão Multidimensional, esse Espaço de Decisão seria dividido em regiões sendo que a cada região seria apresentada uma classe,o treinamento seria responsável por criar as fronteiras de decisão. Essas fronteiras seriam determinadas pela variabilidade existente dentro das classes e entre as classes Categorização Braga (2007) afirma em seu livro que a tarefa de Categorização é muitas vezes confundida com a de Classificação, mas o autor diferencia a Categorização como a descoberta de categorias ou classes nos dados de entrada. Diferente da Classificação nesse caso as classes não são conhecidas pela Rede e esse é um caso de aprendizado Não Supervisionado Aproximação de funções A aproximação de função é um tipo de Aprendizado Supervisionado em que a atualização dos pesos da rede acontece de forma a criar um mapeamento para descobrir as relações que existem entre as entradas e as saídas, Braga (2007) afirma que o objetivo é mapear funções contínuas das variáveis de entrada.

56 Previsão A Previsão acontece quando a rede baseada no aprendizado de situações passadas e presentes cria uma estimativa de situações futuras 3.5 O Perceptron Mcculloch e Pitts (1943) idealizaram um neurônio artificial baseado nos neurônios naturais, que se baseava em operações booleanas para resolução dos problemas do contexto, pois, segundo Braga (2001) naquela época achava-se que uma maquina que executasse funções lógicas simples poderia ser inteligente. Foi através de Rosenblatt em 1958 que se inseriu o conceito de Aprendizado (Braga, 2001) o autor criou um modelo chamado Perceptron que era composto por uma estrutura em forma de grafo com elementos de processamento chamados neurônios e uma função ou regra de aprendizado. A característica mais importante do Perceptron foi à capacidade de aprender, essa característica que o colocou em uma situação de similaridade com o cérebro humano. O Perceptron é para Haykin (2001) a forma mais simples de uma rede neural sendo que somente pode ser usado para reconhecer padrões em dados linearmente separáveis, ou seja, padrões que possam estar em lados separados em um hiperplano. O Perceptron de forma básica consiste em um neurônio que pode ter seus pesos sinápticos ajustados e uma bias sendo essa bias responsável por aumentar ou diminuir a influência do valor das entradas sobre a saída predita. O algoritmo usado inicialmente para o ajuste dos pesos do Perceptron foi desenvolvido por Rosenballt. Haykin (2001) afirma que os vetores usados para treinar o Perceptron são retirados de duas classes que são linearmente separáveis. Então o algoritmo converge e posiciona a superfície de decisão na forma de um hiperplano entre duas classes. A prova de convergência

57 56 do algoritmo é conhecida como teorema de convergência do Perceptron. (Haykin, 2001, p.144). O Perceptron (Figura 3.11) com um único neurônio é capaz de realizar a classificação de padrões com até duas classes, mas, essas classes precisam ser por obrigação ser linearmente separáveis (Figura 3.10) para que o Perceptron funcione de forma eficaz. Figura 3.10: Classes Linearmente Separáveis Fonte: Ribas (2008) Figura 3.11: Topologia de um Perceptron com D entradas, M neurônios e m saídas. Fonte: Haykin (2001). De acordo a Braga (2001) o Perceptron causou grande euforia na comunidade científica na época, mas, essa euforia não teve muita duração pois o

58 57 modelo recebeu muitas criticas quanto a sua capacidade computacional. Essas criticas criaram um desinteresse a pesquisa em RNA até 1982 com a Rede de Hopfield e o algoritmo Backpropagation em Algoritmo de Treinamento do Perceptron Braga (2001) afirma que o algoritmo de treinamento do Perceptron irá sempre chegar em um tempo finito, a uma solução para o problema de separação de duas classes linearmente separáveis. O autor descreve o algoritmo através de passos, é importante salientar que esses passos são aplicados a todos os neurônios da RNA. O algoritmo segundo Braga (2001) pode ser descrito da seguinte forma: Inicialize n; Inicialize o vetor de pesos W com valores aleatórios; Aplique a regra de atualização dos pesos W(n+1)= W(n)+ nex(n) para todos os pares (X i, Y i d ) do conjunto de treinamento T={( X i, Y i d )} p i=1 ; Repita o passo anterior até que e=0 para todos os p elementos de T. Braga (2001) coloca que o n é uma medida da velocidade em que haverá a atualização dos pesos sendo n também chamado de taxa de aprendizagem, O valor de n é atribuído pelo usuário da RNA e segundo o teorema da convergência o perceptron irá atribuir a classe caso o conjunto seja linearmente separável. Sobre a inicialização do vetor de pesos o autor afirma que este deve ser iniciado com valores próximos a zero como por exemplo 0,5, essa recomendação é para que o neurônio não se sature e provoque dificuldades na convergência. O Perceptron sempre utiliza um aprendizado supervisionado simples, onde sempre quando tenta resolver um problema ou encontrar uma classe um professor retorna-lhe a saída correta então o algoritmo modifica o peso de modo a ajustar-se a saída correta reduzindo o erro da saída.

59 58 Um dos exemplos de problema que o Perceptron não consegue resolver é o problema do ou - exclusivo detalhado por Luger (2004) e visto abaixo na Tabela 1.0. X 1 X 2 Resultado Tabela 1.0: A tabela Verdade para o ou exclusivo Fonte: Luger (2004) Adaptado. Segundo Luger (2004) tendo-se um Perceptron com duas entradas x1 e x2, dois pesos w1 e w2 e um limiar t, para que o modelo possa aprender essa função ele precisa encontrar uma atribuição de pesos que possa satisfazer as condições de desigualdades vista na Figura 3.12 e demonstradas abaixo: W1*1 + W2*1 < t, referente a linha 1 da tabela 1; W1*1 + 0 > t, referente a linha 2 da tabela 1; 0 + W2*1 >t, referente a linha 3 da tabela 1; < t, ou t deve ser positivo, referente a linha 4 da tabela 1.

60 59 Figura 3.12: Problema do ou exclusivo, onde nenhuma linha reta de duas dimensões pode separar os pontos (0,1) e (1,0) dos pontos (0,0) e (1,1), sendo portando o problema não linearmente separável. Fonte: Luger (2004) 3.6 O Perceptron de Múltiplas Camadas (MLP) O Perceptron limitava-se por apenas resolver problemas em que suas classes de respostas pudessem ser separadas por uma linha de duas dimensões, ou seja, dados linearmente separados, mas, sabe-se que a maior características dos problemas vistos são de não linearidade e de maior complexidade, excluindo o Perceptron nestas situações. De forma a incorporar nos neurônios a não linearidade, Braga (2001) coloca que foram inseridas as funções de ativação não linear em cada unidade e foi mudada a sua estrutura topológica em camadas sucessivas ao invés de apenas uma camada. Assim de acordo a Braga (2001) as respostas das camadas mais externas da RNA correspondem à composição das respostas dos neurônios das camadas anteriores. O MLP seria então uma Rede Neural composta por neurônios com funções sigmoidais nas camadas intermediárias ou ocultas, segundo Haykin (2001) uma MLP com apenas duas camadas oculta pode aproximar qualquer função. Os perceptron de múltiplas camadas hoje tem sido usados para resolver diversos tipos de problemas difíceis sendo extremamente eficazes, para que essa eficácia pudesse acontecer, foi implementado no modelo um algoritmo chamado

61 60 Backpropagation (Retropropagação) que é baseado em uma regra de aprendizagem por correção de erro (Haykin, 2001). Haykin (2001) afirma que basicamente, a aprendizagem por retropropagação do erro consiste de dois passos na rede, que seriam: um passo Feedforward ou para frente e o passo Backforward ou Retorno. No passo Feedforward um vetor de entrada é aplicado aos neurônios da rede e seu efeito propaga-se para frente camada por camada e ao final um conjunto de saídas é gerado como resposta real da rede, nessa fase os pesos sinápticos são fixos. Já no segundo passo o Backforward os pesos sinápticos são ajustados gerenciados por um algoritmo de correção de erros, então a resposta real da rede é subtraída da resposta correspondente no conjunto de dados ou seja alvo para que então possa produzir um sinal de erro, esse sinal de erro segundo Haykin (2001) é propagado para trás através da rede, contra a direção das conexões sinápticas. Então os pesos sinápticos são ajustados para aproximar à saída da rede à saída alvo A Arquitetura do MLP. De acordo a Braga (2001) as redes com múltiplas camadas apresentam um poder computacional maior do que os Perceptrons, o autor exemplifica a classificação dos dados não linearmente separáveis como aplicações do MLP. A particularidade das MLP s de aproximar qualquer função vai depender totalmente da sua arquitetura, que corresponde ao passo mais importante no projeto com Redes Neurais. A Figura 3.13 ilustra uma MLP com seus componentes.

62 61 Figura 3.13: MLP com principais componentes Fonte: Haykin (2001) Número de Camadas Cada Camada em uma MLP recebe o processamento de sua camada anterior, passando o somatório do processamento para a camada subseqüente. De acordo a Braga (2001) ao aproximar-se da camada de saída as funções implementadas pela RNA tornam-se cada vez mais complexas e são essas funções segundo o autor, são responsáveis por definir a divisão do espaço de decisão. Braga (2001) estabelece um guia baseado em fatos para entendimento do funcionamento do processamento em uma MLP em cada camada intermediária: Primeira camada intermediaria: Cada neurônio contribui com retas para a formação da superfície do espaço de entrada; Segunda Camada intermediaria: Cada neurônio combina as retas descritas pelos da camada anterior conectados a ele, formando regiões convexas, onde o número de lados é definido pelo número de unidades conectadas a ele. Camada de saída: Cada neurônio forma regiões que são combinações das regiões convexas definidas pelos neurônios a ele conectados da camada anterior. Os neurônios definem, dessa maneira, regiões com formatos diversos. (Braga, 2001, p. 45).

Hoje estudaremos a bioquímica dos ácidos nucléicos. Acompanhe!

Hoje estudaremos a bioquímica dos ácidos nucléicos. Acompanhe! Aula: 2 Temática: Ácidos Nucléicos Hoje estudaremos a bioquímica dos ácidos nucléicos. Acompanhe! Introdução: Os ácidos nucléicos são as moléculas com a função de armazenamento e expressão da informação

Leia mais

Criado e Desenvolvido por: Todos os direitos são reservados 2015. www.tioronni.com

Criado e Desenvolvido por: Todos os direitos são reservados 2015. www.tioronni.com Criado e Desenvolvido por: Todos os direitos são reservados 2015. www.tioronni.com O NÚCLEO E A SÍNTESE PROTEÍCA O núcleo celular, descoberto em 1833 pelo pesquisador escocês Robert Brown, é uma estrutura

Leia mais

BIOLOGIA MOLECULAR. Prof. Dr. José Luis da C. Silva

BIOLOGIA MOLECULAR. Prof. Dr. José Luis da C. Silva BIOLOGIA MOLECULAR Prof. Dr. José Luis da C. Silva BIOLOGIA MOLECULAR A Biologia Molecular é o estudo da Biologia em nível molecular, com especial foco no estudo da estrutura e função do material genético

Leia mais

COMUNICAÇÃO DA INFORMAÇÃO NAS MOLÉCULAS DE DNA E RNA

COMUNICAÇÃO DA INFORMAÇÃO NAS MOLÉCULAS DE DNA E RNA COMUNICAÇÃO DA INFORMAÇÃO NAS MOLÉCULAS DE DNA E RNA Andréia Cristina Hypólito José 11075810 Fernando Caldas Oliveira 11085410 Giovana Zaninelli 11017210 Renato Fernandes Sartori 11061110 Rodrigo de Mello

Leia mais

O processo fisiológico que está representado no gráfico é

O processo fisiológico que está representado no gráfico é Questão 01) Analise o gráfico a seguir. Disponível em: . Acesso em: 22 set. 2014. O processo fisiológico que está representado no gráfico é a) o efeito do aumento

Leia mais

Os primeiros indícios de que o DNA era o material hereditário surgiram de experiências realizadas com bactérias, sendo estas indicações estendidas

Os primeiros indícios de que o DNA era o material hereditário surgiram de experiências realizadas com bactérias, sendo estas indicações estendidas GENERALIDADES Todo ser vivo consiste de células, nas quais está situado o material hereditário. O número de células de um organismo pode variar de uma a muitos milhões. Estas células podem apresentar-se

Leia mais

Princípios moleculares dos processos fisiológicos

Princípios moleculares dos processos fisiológicos 2012-04-30 UNIVERSIDADE AGOSTINHO NETO FACULDADE DE CIÊNCIAS DEI-BIOLOGIA ---------------------------------------------- Aula 5: Princípios moleculares dos processos fisiológicos (Fisiologia Vegetal, Ano

Leia mais

Ácidos nucléicos. São polímeros compostos por nucleotídeos. Açúcar - pentose. Grupo fosfato. Nucleotídeo. Base nitrogenada

Ácidos nucléicos. São polímeros compostos por nucleotídeos. Açúcar - pentose. Grupo fosfato. Nucleotídeo. Base nitrogenada ÁCIDOS NUCLÉICOS Ácidos nucléicos São polímeros compostos por nucleotídeos Açúcar - pentose Nucleotídeo Grupo fosfato Base nitrogenada Composição dos Ácidos nucléicos pentoses: numeração da pentose: pentose

Leia mais

O fluxo da informação é unidirecional

O fluxo da informação é unidirecional Curso - Psicologia Disciplina: Genética Humana e Evolução Resumo Aula 3- Transcrição e Tradução Dogma central TRANSCRIÇÃO DO DNA O fluxo da informação é unidirecional Processo pelo qual uma molécula de

Leia mais

Bioinformática Aula 01

Bioinformática Aula 01 Bioinformática Aula 01 Prof. Ricardo Martins Ramos * * Doutorando em Genética e Toxicologia Aplicada CEFET-PI/ULBRA-RS Linha de Pesquisa Bioinformática Estrutural E-mail: ricardo@cefetpi.br Visão Holística

Leia mais

Núcleo Celular. Biomedicina primeiro semestre de 2012 Profa. Luciana Fontanari Krause

Núcleo Celular. Biomedicina primeiro semestre de 2012 Profa. Luciana Fontanari Krause Núcleo Celular Biomedicina primeiro semestre de 2012 Profa. Luciana Fontanari Krause Núcleo Celular Eucarioto: núcleo delimitado por membrana nuclear (carioteca) Portador dos fatores hereditários e controlador

Leia mais

Estrutura e função dos ácidos nucléicos. Profa. Melissa de Freitas Cordeiro-Silva

Estrutura e função dos ácidos nucléicos. Profa. Melissa de Freitas Cordeiro-Silva Estrutura e função dos ácidos nucléicos Profa. Melissa de Freitas Cordeiro-Silva > Polímeros de nucleotídeos Funções: DNA (ácido desoxirribonucléico) : > Armazenar as informações necessárias para a construção

Leia mais

BANCO DE QUESTÕES - BIOLOGIA - 1ª SÉRIE - ENSINO MÉDIO ==============================================================================================

BANCO DE QUESTÕES - BIOLOGIA - 1ª SÉRIE - ENSINO MÉDIO ============================================================================================== PROFESSOR: Leonardo Mariscal BANCO DE QUESTÕES - BIOLOGIA - 1ª SÉRIE - ENSINO MÉDIO ============================================================================================== Ácidos Nucleicos 01- Os

Leia mais

BIOLOGIA MOLECULAR. Ácidos Nucléicos e Síntese de Proteínas

BIOLOGIA MOLECULAR. Ácidos Nucléicos e Síntese de Proteínas BIOLOGIA MOLECULAR Ácidos Nucléicos e Síntese de Proteínas Nucleotídeos São moléculas formadas pela união de um açúcar ou pentose, uma base nitrogenada e um grupo fosfato. Os Ácidos Nucléicos (DNA e RNA)

Leia mais

Estrutura e Função de Ácidos Nucléicos

Estrutura e Função de Ácidos Nucléicos UNIVERSIDADE DE SÃO PAULO INSTITUTO DE QUÍMICA DEPARTAMENTO DE BIOQUÍMICA QBQ0313 Estrutura e Função de Ácidos Nucléicos Flavia Carla Meotti Os Ácidos Nucléicos Função: armazenamento e transmissão da informação

Leia mais

ÁCIDOS NUCLEÍCOS RIBOSSOMO E SÍNTESE PROTEÍCA

ÁCIDOS NUCLEÍCOS RIBOSSOMO E SÍNTESE PROTEÍCA ÁCIDOS NUCLEÍCOS RIBOSSOMO E SÍNTESE PROTEÍCA ÁCIDOS NUCLÉICOS: Moléculas orgânicas complexas, formadas polimerização de nucleotídeos (DNA e RNA) pela Contêm a informação que determina a seqüência de aminoácidos

Leia mais

DNA E SÍNTESE PROTEICA

DNA E SÍNTESE PROTEICA Genética Animal DNA e síntese proteica 1 DNA E SÍNTESE PROTEICA Estrutura do DNA: -Molécula polimérica, cujos monômeros denominam-se nucleotídeos. -Constituição dos nucleotídeos: açúcar pentose (5 -desoxirribose)

Leia mais

Replicação Quais as funções do DNA?

Replicação Quais as funções do DNA? Replicação Quais as funções do DNA? Aula nº 4 22/Set/08 Prof. Ana Reis Replicação O DNA é a molécula que contém a informação para todas as actividades da célula. Uma vez que as células se dividem, é necessário

Leia mais

MEDICINA VETERINÁRIA. Disciplina: Genética Animal. Prof a.: D rd. Mariana de F. Gardingo Diniz

MEDICINA VETERINÁRIA. Disciplina: Genética Animal. Prof a.: D rd. Mariana de F. Gardingo Diniz MEDICINA VETERINÁRIA Disciplina: Genética Animal Prof a.: D rd. Mariana de F. Gardingo Diniz TRANSCRIÇÃO DNA A transcrição é o processo de formação de uma molécula de RNA a partir de uma molécula molde

Leia mais

ÁCIDOS NUCLEICOS DNA - ÁCIDO DESOXIRRIBONUCLEICO RNA - ÁCIDO RIBONUCLEICO

ÁCIDOS NUCLEICOS DNA - ÁCIDO DESOXIRRIBONUCLEICO RNA - ÁCIDO RIBONUCLEICO ÁCIDOS NUCLEICOS DNA - ÁCIDO DESOXIRRIBONUCLEICO RNA - ÁCIDO RIBONUCLEICO 1 Funções dos ácidos nucleicos Armazenar e expressar a informação genética Replicação Cópia da mensagem contida no DNA, que será

Leia mais

DO GENE À PROTEÍNA ALGUNS CONCEITOS BASICOS COMO SE ORGANIZAM OS NUCLEÓTIDOS PARA FORMAR O DNA?

DO GENE À PROTEÍNA ALGUNS CONCEITOS BASICOS COMO SE ORGANIZAM OS NUCLEÓTIDOS PARA FORMAR O DNA? DO GENE À PROTEÍNA O processo de formação das proteínas no ser humano pode ser difícil de compreender e inclui palavras e conceitos que possivelmente nos são desconhecidos. Assim, vamos tentar explicar

Leia mais

Painéis Do Organismo ao Genoma

Painéis Do Organismo ao Genoma Painéis Do Organismo ao Genoma A série de 5 painéis do organismo ao genoma tem por objetivo mostrar que os organismos vivos são formados por células que funcionam de acordo com instruções contidas no DNA,

Leia mais

Genes. Menor porção do DNA capaz de produzir um efeito que pode ser detectado no organismo. Região do DNA que pode ser transcrita em moléculas de RNA.

Genes. Menor porção do DNA capaz de produzir um efeito que pode ser detectado no organismo. Região do DNA que pode ser transcrita em moléculas de RNA. Genes Menor porção do DNA capaz de produzir um efeito que pode ser detectado no organismo. Região do DNA que pode ser transcrita em moléculas de RNA. Ácidos nucleicos Os ácidos nucléicos são macromoléculas

Leia mais

Transcrição e Tradução. Profa. Dra. Juliana Garcia de Oliveira Disciplina: Biologia Celular e Molecular Turmas: Biologia, enfermagem, nutrição e TO.

Transcrição e Tradução. Profa. Dra. Juliana Garcia de Oliveira Disciplina: Biologia Celular e Molecular Turmas: Biologia, enfermagem, nutrição e TO. Transcrição e Tradução Profa. Dra. Juliana Garcia de Oliveira Disciplina: Biologia Celular e Molecular Turmas: Biologia, enfermagem, nutrição e TO. Tópicos abordados na aula Dogma Central da Biologia Molecular;

Leia mais

Bioinformática Histórico e conceitos básicos

Bioinformática Histórico e conceitos básicos Bioinformática Histórico e conceitos básicos Raimundo Lima da S. Júnior M.Sc. Departamento de Biologia Núcleo de Pesquisas Replicon PUC-GO Silva Jr., RL Casamento entre a ciência da computação e a biologia

Leia mais

TRANSCRICAO E PROCESSAMENTO DE RNA

TRANSCRICAO E PROCESSAMENTO DE RNA TRANSCRICAO E PROCESSAMENTO DE RNA Número de genes para RNA RNA ribossômico - rrna Os rrnas correspondem a 85 % do RNA total da célula, e são encontrados nos ribossomos (local onde ocorre a síntese proteíca).

Leia mais

Bioinformática. Conceitos Fundamentais de Biologia Molecular. Paulo Henrique Ribeiro Gabriel phrg@ufu.br

Bioinformática. Conceitos Fundamentais de Biologia Molecular. Paulo Henrique Ribeiro Gabriel phrg@ufu.br Bioinformática Conceitos Fundamentais de Biologia Molecular Paulo Henrique Ribeiro Gabriel phrg@ufu.br Faculdade de Computação Universidade Federal de Uberlândia 24 de agosto de 2015 Paulo H. R. Gabriel

Leia mais

Química do material genético

Química do material genético 1 O NÚCLEO No núcleo estão os cromossomos, onde estão "armazenadas" as informações genéticas de cada espécie. Os seguintes componentes constituem o núcleo celular: Membrana Nuclear: também chamada de carioteca

Leia mais

Equipe de Biologia. Biologia

Equipe de Biologia. Biologia Aluno (a): Série: 3ª Turma: TUTORIAL 5B Ensino Médio Equipe de Biologia Data: Biologia Ácidos nucléicos Os ácidos nucléicos são moléculas gigantes (macromoléculas), formadas por unidades monoméricas menores

Leia mais

16/04/2015 ÁCIDOS NUCLEICOS DNA E RNA DNA E RNA DNA E RNA BREVE HISTÓRICO DA DESCOBERTA DO DNA BREVE HISTÓRICO DA DESCOBERTA DO DNA

16/04/2015 ÁCIDOS NUCLEICOS DNA E RNA DNA E RNA DNA E RNA BREVE HISTÓRICO DA DESCOBERTA DO DNA BREVE HISTÓRICO DA DESCOBERTA DO DNA ÁCIDOS NUCLEICOS E RNA E RNA Plano de Aula -Componentes básicos de e RNA -Características estruturais e funcionais -Tipos de RNA Profª Dra. Juliana Schmidt Medicina 2014 E RNA BREVE HISTÓRICO DA DESCOBERTA

Leia mais

Bases Moleculares da Hereditariedade

Bases Moleculares da Hereditariedade UNIVERSIDADE FEDERAL DO PIAUÍ CENTRO DE CIÊNCIAS AGRÁRIAS PROG. DE PÓS GRAD. EM GENET. E MELHORAMENTO NÚCLEO DE ESTUDOS EM GENET. E MELHORAMENTO Bases Moleculares da Hereditariedade Ministrante: João Paulo

Leia mais

ACESSO VESTIBULAR QUESTÕES DE PROCESSAMENTO DE RNA OU SPLICING 01. (MAMA 2007.1) PÁGINAS OCULTAS NO LIVRO DA VIDA

ACESSO VESTIBULAR QUESTÕES DE PROCESSAMENTO DE RNA OU SPLICING 01. (MAMA 2007.1) PÁGINAS OCULTAS NO LIVRO DA VIDA ACESSO VESTIBULAR QUESTÕES DE PROCESSAMENTO DE RNA OU SPLICING 01. (MAMA 2007.1) PÁGINAS OCULTAS NO LIVRO DA VIDA Os biólogos supunham que apenas as proteínas regulassem os genes dos seres humanos e dos

Leia mais

Redes Neurais. Profa. Flavia Cristina Bernardini

Redes Neurais. Profa. Flavia Cristina Bernardini Redes Neurais Profa. Flavia Cristina Bernardini Introdução Cérebro & Computador Modelos Cognitivos Diferentes Cérebro Computador Seqüência de Comandos Reconhecimento de Padrão Lento Rápido Rápido Lento

Leia mais

UNIVERSIDADE FEDERAL DE ALAGOAS INSTITUTO DE CIÊNCIAS BIOLÓGICAS E DA SAÚDE SETOR DE BIOLOGIA CELULAR E MOLECULAR

UNIVERSIDADE FEDERAL DE ALAGOAS INSTITUTO DE CIÊNCIAS BIOLÓGICAS E DA SAÚDE SETOR DE BIOLOGIA CELULAR E MOLECULAR UNIVERSIDADE FEDERAL DE ALAGOAS INSTITUTO DE CIÊNCIAS BIOLÓGICAS E DA SAÚDE SETOR DE BIOLOGIA CELULAR E MOLECULAR DISCIPLINA: BIOLOGIA CELULAR E MOLECULAR ESTUDO DIRIGIDO FLUXO DA INFORMAÇÃO GÊNICA págs:

Leia mais

As bactérias operárias

As bactérias operárias A U A UL LA As bactérias operárias Na Aula 47 você viu a importância da insulina no nosso corpo e, na Aula 48, aprendeu como as células de nosso organismo produzem insulina e outras proteínas. As pessoas

Leia mais

Curso: Integração Metabólica

Curso: Integração Metabólica Curso: Integração Metabólica Aula 2: Breve revisão estrutura do DNA Prof. Carlos Castilho de Barros Prof. Augusto Schneider Quando se estuda metabolismo você certamente vai se deparar com termos de genéyca!

Leia mais

- Ácido ribonucléico (ARN ou RNA): participa do processo de síntese de proteínas.

- Ácido ribonucléico (ARN ou RNA): participa do processo de síntese de proteínas. 1- TIPOS DE ÁCIDO NUCLÉICO: DNA E RNA Existem dois tipos de ácidos nucléicos: - Ácido desoxirribonucléico (ADN ou DNA): é o principal constituinte dos cromossomos, estrutura na qual encontramos os genes,

Leia mais

> ESTUDO DO RNA. (C) O ácido nucléico I é DNA e o II, RNA. (D) O ácido nucléico I é RNA e o II, DNA. (E) I é exclusivo dos seres procariontes.

> ESTUDO DO RNA. (C) O ácido nucléico I é DNA e o II, RNA. (D) O ácido nucléico I é RNA e o II, DNA. (E) I é exclusivo dos seres procariontes. Biologia > Citologia > Sintese Protéica > Alunos Prof. Zell (biologia) (C) O ácido nucléico I é DNA e o II, RNA. (D) O ácido nucléico I é RNA e o II, DNA. (E) I é exclusivo dos seres procariontes. > ESTUDO

Leia mais

Criado e Desenvolvido por: RONNIELLE CABRAL ROLIM Todos os direitos são reservados 2015. www.tioronni.com

Criado e Desenvolvido por: RONNIELLE CABRAL ROLIM Todos os direitos são reservados 2015. www.tioronni.com Criado e Desenvolvido por: RONNIELLE CABRAL ROLIM Todos os direitos são reservados 2015. www.tioronni.com ÁCIDOS NUCLEICOS ÁCIDOS NUCLÉICOS: são substâncias formadoras de genes, constituídas por um grande

Leia mais

Como a vida funciona? O processo de Transcrição. Prof. Dr. Francisco Prosdocimi

Como a vida funciona? O processo de Transcrição. Prof. Dr. Francisco Prosdocimi Como a vida funciona? O processo de Transcrição Prof. Dr. Francisco Prosdocimi Dogma central O fluxo da informação é unidirecional Refutação definitiva da herança dos caracteres adquiridos Transcrição

Leia mais

Aula 4 Estrutura do RNA

Aula 4 Estrutura do RNA Biologia Molecular Básica Módulo I Básico Aula 4 Estrutura do RNA O RNA é uma molécula intermediária na síntese de proteínas. Ela faz a intermediação entre o DNA e as proteínas. As principais diferenças

Leia mais

CÓDIGO GENÉTICO E SÍNTESE PROTEICA

CÓDIGO GENÉTICO E SÍNTESE PROTEICA CÓDIGO GENÉTICO E SÍNTESE PROTEICA Juliana Mara Stormovski de Andrade As proteínas são as moléculas mais abundantes e funcionalmente diversas nos sistema biológicos. Praticamente todos os processos vitais

Leia mais

RNA: transcrição e processamento

RNA: transcrição e processamento Universidade Federal do Piauí Centro de Ciências Agrárias Programa de Pós-graduação em Genética e Melhoramento Núcleo de Estudos em Genética e Melhoramento Bases Moleculares da Hereditariedade RNA: transcrição

Leia mais

O DNA é formado por pedaços capazes de serem convertidos em algumas características. Esses pedaços são

O DNA é formado por pedaços capazes de serem convertidos em algumas características. Esses pedaços são Atividade extra Fascículo 2 Biologia Unidade 4 Questão 1 O DNA é formado por pedaços capazes de serem convertidos em algumas características. Esses pedaços são chamados de genes. Assinale abaixo quais

Leia mais

1. (Unesp) A ilustração apresenta o resultado de um teste de paternidade obtido pelo método do DNA-Fingerprint, ou "impressão digital de DNA".

1. (Unesp) A ilustração apresenta o resultado de um teste de paternidade obtido pelo método do DNA-Fingerprint, ou impressão digital de DNA. Ácidos Nuclêicos 1. (Unesp) A ilustração apresenta o resultado de um teste de paternidade obtido pelo método do DNA-Fingerprint, ou "impressão digital de DNA". a) Segundo o resultado acima, qual dos homens,

Leia mais

NÚCLEO e DIVISÃO CELULAR

NÚCLEO e DIVISÃO CELULAR NÚCLEO e DIVISÃO CELULAR CÉLULA EUCARIONTE Cláudia Minazaki NÚCLEO Único; Normalmente: central Formato: acompanha a forma da célula Tamanho: varia com o funcionamento da célula Ciclo de vida da célula

Leia mais

O processo da Expressão Gênica

O processo da Expressão Gênica Coordenadoria de Educação e Difusão de Ciências Rua 9 de Julho, 1205 - São Carlos - São Paulo e-mail: cbme@if.sc.usp.br- Telefone: (16) 3373-9159 http://cbme.ifsc.usp.br http://cbme.usp.br O processo da

Leia mais

Organização do Material Genético nos Procariontes e Eucariontes

Organização do Material Genético nos Procariontes e Eucariontes Organização do Material Genético nos Procariontes e Eucariontes Organização do Material Genético nos Procariontes e Eucariontes Procariontes Eucariontes Localização Organização Forma Disperso no citoplasma

Leia mais

Programa de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas. Seleção de Mestrado 2012-B

Programa de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas. Seleção de Mestrado 2012-B Programa de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas Seleção de Mestrado 2012-B INSTRUÇÕES (LEIA ATENTAMENTE ANTES DE PREENCHER A PROVA): a. Identifique sua prova unicamente com

Leia mais

Dra. Kátia R. P. de Araújo Sgrillo. Sgrillo.ita@ftc.br

Dra. Kátia R. P. de Araújo Sgrillo. Sgrillo.ita@ftc.br Dra. Kátia R. P. de Araújo Sgrillo Sgrillo.ita@ftc.br São macromoléculas gigantescas, com massa molecular maior que 100 milhões. Os ácidos nucléicos foram isolados pela primeira vez a partir do núcleo

Leia mais

Aula 2 RNA Arquiteturas e Treinamento

Aula 2 RNA Arquiteturas e Treinamento 2COP229 Aula 2 RNA Arquiteturas e Treinamento 2COP229 Sumário 1- Arquiteturas de Redes Neurais Artificiais; 2- Processos de Treinamento; 2COP229 1- Arquiteturas de Redes Neurais Artificiais -Arquitetura:

Leia mais

Resposta: Interbits SuperPro Web

Resposta: Interbits SuperPro Web 1. (Fuvest 2012) Uma mutação, responsável por uma doença sanguínea, foi identificada numa família. Abaixo estão representadas sequências de bases nitrogenadas, normal e mutante; nelas estão destacados

Leia mais

MEDICINA VETERINÁRIA. Disciplina: Genética Animal. Prof a.: Drd. Mariana de F. G. Diniz

MEDICINA VETERINÁRIA. Disciplina: Genética Animal. Prof a.: Drd. Mariana de F. G. Diniz MEDICINA VETERINÁRIA Disciplina: Genética Animal Prof a.: Drd. Mariana de F. G. Diniz Gene, é a unidade fundamental da hereditariedade. Cada gene é formado por uma sequência específica de ácidos nucléicos

Leia mais

SÍNTESES NUCLEARES. O DNA éo suporte da informação genética. Parte 1 Replicação

SÍNTESES NUCLEARES. O DNA éo suporte da informação genética. Parte 1 Replicação SÍNTESES NUCLEARES O DNA éo suporte da informação genética Parte 1 Replicação Estrutura do DNA Replicação do DNA Nucleótidos A informação genética das células é armazenada sob a forma de 2 moléculas similares:

Leia mais

DNA A molécula da vida. Prof. Biel Série: 9º ano

DNA A molécula da vida. Prof. Biel Série: 9º ano DNA A molécula da vida Prof. Biel Série: 9º ano DNA FINGER-PRINTING A expressão DNA "Finger-Print" (ou Impressões Genéticas) designa uma técnica de separação de segmentos de DNA que permite a identificação

Leia mais

A natureza química do material genético Miescher nucleínas. ácidos nucleicos. ácido desoxirribonucleico ácido ribonucleico Avery MacLeod McCarty

A natureza química do material genético Miescher nucleínas. ácidos nucleicos. ácido desoxirribonucleico ácido ribonucleico Avery MacLeod McCarty UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL COLÉGIO DE APLICAÇÃO Departamento de Ciências Exatas e da Natureza Disciplina: Biologia Professora: Lauren Valentim A natureza química do material genético A natureza

Leia mais

Miguel Rocha Dep. Informática - Universidade do Minho. BIOINFORMÁTICA: passado, presente e futuro!!

Miguel Rocha Dep. Informática - Universidade do Minho. BIOINFORMÁTICA: passado, presente e futuro!! Miguel Rocha Dep. Informática - Universidade do Minho BIOINFORMÁTICA: passado, presente e futuro!! Bragança, 11 de Maio de 2006 Porquê a Bioinformática?! Novas tecnologias experimentais da Biologia Molecular

Leia mais

BASES NITROGENADAS DO RNA

BASES NITROGENADAS DO RNA BIO 1E aula 01 01.01. A determinação de como deve ser uma proteína é dada pelos genes contidos no DNA. Cada gene é formado por uma sequência de códons, que são sequências de três bases nitrogenadas que

Leia mais

Genética e Evolução: Profa. Gilcele

Genética e Evolução: Profa. Gilcele Genética e Evolução: Profa. Gilcele Genética É o estudo dos genes e de sua transmissão para as gerações futuras. É o estudo da hereditariedade, a transmissão de traços de genitores para filhos. É dividida

Leia mais

DNA: Passado, Presente e Futuro

DNA: Passado, Presente e Futuro DNA: Passado, Presente e Futuro O passado O modelo do DNA que hoje nos é tão familiar foi divulgado em abril de 1953 na revista científica Nature pelos cientistas James Watson e Francis Crick. Eles afirmaram

Leia mais

Genética Humana. Prof. João Ronaldo Tavares de Vasconcellos Neto

Genética Humana. Prof. João Ronaldo Tavares de Vasconcellos Neto Genética Humana Prof. João Ronaldo Tavares de Vasconcellos Neto JAN/2012 Princípios Básicos As proteínas são vinculo entre genótipo e fenótipo; A expressão gênica é o processo pelo qual o DNA coordena

Leia mais

TRANSCRIÇÃO DO DNA: Tipos de RNA

TRANSCRIÇÃO DO DNA: Tipos de RNA TRANSCRIÇÃO DO DNA: Síntese do mrna Gene (Unidades transcricionais) Tipos de RNA Tipos de RNA polimerase Tipos de RNA polimerase DNA dependente Transcrição em Procariotos Transcrição em Eucariotos Mecanismos

Leia mais

Como o DNA nuclear comanda todo o funcionamento da célula????

Como o DNA nuclear comanda todo o funcionamento da célula???? início Moléculas de RNA Como o DNA nuclear comanda todo o funcionamento da célula???? gene DNA espaçador fim Profa Estela Rossetto início O que faz o DNA? http://rizomas. net/ensino-debiologia/recur sospedagogicos/2

Leia mais

Replicação do DNA a Nível Molecular

Replicação do DNA a Nível Molecular Replicação do DNA a Nível Molecular Função do DNA Transferência de informação Copiada em DNA (Replicação) Traduzida em proteína Modelo de replicação do DNA proposto por Watson e Crick Replicação ou Duplicação?

Leia mais

Ácidos Nucleicos 22/12/2011. Funções do Material Genético. informação genética.

Ácidos Nucleicos 22/12/2011. Funções do Material Genético. informação genética. Ácidos Nucleicos Profa. Dra. Juliana Garcia de Oliveira Disciplina: Biologia Celular e Molecular Turmas: Ciências Biológicas, enfermagem, nutrição e TO. Funções do Material Genético Mendel, 1865: genes

Leia mais

8/18/2015. IFSC Campus Lages. Biologia Molecular. Prof. Silmar Primieri. O que é Biologia Molecular?

8/18/2015. IFSC Campus Lages. Biologia Molecular. Prof. Silmar Primieri. O que é Biologia Molecular? IFSC Campus Lages Biologia Molecular Prof. Silmar Primieri O que é Biologia Molecular? 1 Aplicabilidades da Biologia Molecular Genética do Câncer Doenças com herança complexa Preservação de espécies ameaçadas

Leia mais

A Molécula da Vida. Estrutura

A Molécula da Vida. Estrutura A Molécula da Vida Os cromossomos de células eucarióticas são formado por DNA associado a moléculas de histona, que são proteínas básicas. É na molécula de DNA que estão contidos os genes, responsáveis

Leia mais

Tradução Modificando o alfabeto molecular. Prof. Dr. Francisco Prosdocimi

Tradução Modificando o alfabeto molecular. Prof. Dr. Francisco Prosdocimi Tradução Modificando o alfabeto molecular Prof. Dr. Francisco Prosdocimi Tradução em eukarya e prokarya Eventos pós-transcricionais Processo de síntese de proteínas RNAm contém o código do gene RNAt é

Leia mais

Curso - Psicologia. Disciplina: Genética Humana e Evolução. Resumo Aula 2- Organização do Genoma

Curso - Psicologia. Disciplina: Genética Humana e Evolução. Resumo Aula 2- Organização do Genoma Curso - Psicologia Disciplina: Genética Humana e Evolução Resumo Aula 2- Organização do Genoma Estrutura dos Ácidos Nucleicos- Nucleotídeos Cinco tipos: Adenina, Guanina, Citosina, Timina e Uracila.

Leia mais

Previsão do Índice da Bolsa de Valores do Estado de São Paulo utilizandoredes Neurais Artificiais

Previsão do Índice da Bolsa de Valores do Estado de São Paulo utilizandoredes Neurais Artificiais Previsão do Índice da Bolsa de Valores do Estado de São Paulo utilizandoredes Neurais Artificiais Redes Neurais Artificiais Prof. Wilian Soares João Vitor Squillace Teixeira Ciência da Computação Universidade

Leia mais

REAÇÃO EM CADEIA DA POLIMERASE (PCR)

REAÇÃO EM CADEIA DA POLIMERASE (PCR) Área de Ciências da Saúde Curso de Medicina Módulo: Saúde do Adulto e Idoso II GENÉTICA HUMANA Professora: Dra. Juliana Schmidt REAÇÃO EM CADEIA DA POLIMERASE (PCR) A molécula de DNA é um longo polímero

Leia mais

CONTROLE DO METABOLISMO GENES

CONTROLE DO METABOLISMO GENES CONTROLE DO METABOLISMO GENES 10/06/15 1º ANO - BIOLOGIA 1 ESTRUTURA DO GENE Segmentos (pedaços) da molécula de DNA, o constituinte dos nossos cromossomos, onde estão inscritas receitas (códigos genéticos)

Leia mais

BIOLOGIA - 1 o ANO MÓDULO 08 RIBOSSOMOS E SÍNTESE PROTEICA

BIOLOGIA - 1 o ANO MÓDULO 08 RIBOSSOMOS E SÍNTESE PROTEICA BIOLOGIA - 1 o ANO MÓDULO 08 RIBOSSOMOS E SÍNTESE PROTEICA Fixação 1) (UNICAMP) Considere um fragmento de DNA com a seguinte sequência de bases: GTA GCC TAG E responda: a) Qual será a sequência

Leia mais

GABARITO BIOLOGIA REVISÃO 01 3 ANO A/B ENSINO MÉDIO

GABARITO BIOLOGIA REVISÃO 01 3 ANO A/B ENSINO MÉDIO GABARITO BIOLOGIA REVISÃO 01 3 ANO A/B ENSINO MÉDIO Resolução: 01. B 02. E 03. No alantóide da ave há uma rede de capilares sangüíneos onde ocorre a respiração. O principal excreta nitrogenado da ave é

Leia mais

GENÉTICA VII APLICAÇÕES DO CONHECIMENTO GENÉTICO

GENÉTICA VII APLICAÇÕES DO CONHECIMENTO GENÉTICO GENÉTICA VII APLICAÇÕES DO CONHECIMENTO GENÉTICO Prof. Jose Amaral/2012/2013 Metabolismo de controle O metabolismo é controlado pelos ácidos nucléicos, compostos que coordenam uma série de reações em que

Leia mais

objetivo RNA aspectos funcionais e estruturais AULA Pré-requisito

objetivo RNA aspectos funcionais e estruturais AULA Pré-requisito RNA aspectos funcionais e estruturais 5 objetivo Ao final desta aula, você terá a oportunidade de: Descrever os aspectos funcionais e estruturais do RNA. Pré-requisito Para acompanhar mais facilmente esta

Leia mais

Replicação do DNA REPLICAÇÃO DIVISÃO CELULAR E REPLICAÇÃO DNA REPLICAÇÃO. REPLICAÇÃO - Bibliografia

Replicação do DNA REPLICAÇÃO DIVISÃO CELULAR E REPLICAÇÃO DNA REPLICAÇÃO. REPLICAÇÃO - Bibliografia REPLICAÇÃO Plano de Aula -DNA e Hereditariedade -Processo de replicação REPLICAÇÃO Prof. Juliana Schmidt Curso Farmácia 2012 REPLICAÇÃO - Bibliografia DIVISÃO CELULAR E REPLICAÇÃO ALBERTS, B.; BRAY, D.;

Leia mais

IC Inteligência Computacional Redes Neurais. Redes Neurais

IC Inteligência Computacional Redes Neurais. Redes Neurais Universidade Federal do Rio de Janeiro PÓS-GRADUAÇÃO / 2008-2 IC Inteligência Computacional Redes Neurais www.labic.nce.ufrj.br Antonio G. Thomé thome@nce.ufrj.br Redes Neurais São modelos computacionais

Leia mais

Escola Secundária do Monte de Caparica Disciplina de Biologia 10 º Ano

Escola Secundária do Monte de Caparica Disciplina de Biologia 10 º Ano Escola Secundária do Monte de Caparica Disciplina de Biologia 10 º Ano Teste de avaliação Nome ----------------------------------------------------------------------- Numero -------------------------------

Leia mais

Genética Molecular. Fundamentos Aplicações científicas Biotecnologia

Genética Molecular. Fundamentos Aplicações científicas Biotecnologia Genética Molecular Fundamentos Aplicações científicas Biotecnologia Genética Molecular DNA RNA Proteínas Universo Celular Ciclo celular Ciclo Celular: Mitose Célula animal Núcleo Celular: Cromossomas Cromossoma:

Leia mais

Complemento II Noções Introdutória em Redes Neurais

Complemento II Noções Introdutória em Redes Neurais Complemento II Noções Introdutória em Redes Neurais Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

5º CONGRESSO BRASILEIRO DE PESQUISA E DESENVOLVIMENTO EM PETRÓLEO E GÁS

5º CONGRESSO BRASILEIRO DE PESQUISA E DESENVOLVIMENTO EM PETRÓLEO E GÁS 5º CONGRESSO BRASILEIRO DE PESQUISA E DESENVOLVIMENTO EM PETRÓLEO E GÁS TÍTULO DO TRABALHO: REDES NEURAIS APLICADAS EM INDÚSTRIAS PETROQUÍMICAS DE FABRICAÇÃO DE FIBRAS DE POLIÉSTER. AUTORES: Lívia Maciel

Leia mais

7.012 Conjunto de Problemas 5

7.012 Conjunto de Problemas 5 Nome Seção 7.012 Conjunto de Problemas 5 Pergunta 1 Enquanto estudava um problema de infertilidade, você tentou isolar um gene hipotético de coelho que seria responsável pela prolífica reprodução desses

Leia mais

Matéria: Biologia Assunto: Moléculas, células e tecidos - Código genético Prof. Enrico Blota

Matéria: Biologia Assunto: Moléculas, células e tecidos - Código genético Prof. Enrico Blota Matéria: Biologia Assunto: Moléculas, células e tecidos - Código genético Prof. Enrico Blota Biologia Moléculas, células e tecidos - Código Genético O núcleo é de fundamental importância para grande parte

Leia mais

A função básica do ciclo celular das células somáticas é duplicar todo o conteúdo de DNA...

A função básica do ciclo celular das células somáticas é duplicar todo o conteúdo de DNA... Atividade extra Fascículo 4 Biologia Unidade 9 Questão 1 A função básica do ciclo celular das células somáticas é duplicar todo o conteúdo de DNA. O processo de divisão celular é composto por cinco etapas:

Leia mais

Fundamentos de GENÉTICA BACTERIANA. Profa Francis Moreira Borges

Fundamentos de GENÉTICA BACTERIANA. Profa Francis Moreira Borges Fundamentos de GENÉTICA BACTERIANA Profa Francis Moreira Borges As bactérias possuem material genético, o qual é transmitido aos descendentes no momento da divisão celular. Este material genético não está

Leia mais

UNIVERSIDADE FEDERAL DE JUIZ DE FORA DEPARTAMENTO DE PARASITOLOGIA, MICROBIOLOGIA E IMUNOLOGIA

UNIVERSIDADE FEDERAL DE JUIZ DE FORA DEPARTAMENTO DE PARASITOLOGIA, MICROBIOLOGIA E IMUNOLOGIA UNIVERSIDADE FEDERAL DE JUIZ DE FORA DEPARTAMENTO DE PARASITOLOGIA, MICROBIOLOGIA E IMUNOLOGIA Genética Bacteriana Disciplina: Microbiologia Geral e Aplicada à Enfermagem Professora:Luciana Debortoli de

Leia mais

Relatório Iniciação Científica

Relatório Iniciação Científica Relatório Iniciação Científica Ambientes Para Ensaios Computacionais no Ensino de Neurocomputação e Reconhecimento de Padrões Bolsa: Programa Ensinar com Pesquisa-Pró-Reitoria de Graduação Departamento:

Leia mais

Genética Bacteriana. Prof (a) Dra. Luciana Debortoli de Carvalho

Genética Bacteriana. Prof (a) Dra. Luciana Debortoli de Carvalho Universidade Federal de Juiz de Fora Departamento de Microbiologia, Parasitologia e Imunologia Genética Bacteriana Prof (a) Dra. Luciana Debortoli de Carvalho Introdução O DNA existe como uma hélice de

Leia mais

V e t e r i n a r i a n D o c s www.veterinariandocs.com.br. Genética

V e t e r i n a r i a n D o c s www.veterinariandocs.com.br. Genética V e t e r i n a r i a n D o c s Genética Introdução Conceitos Gene: segmento de DNA que é expresso para produzir um produto funcional, o que pode ser RNA ou polipeptídeo. 3 partes: seqüência reguladora,

Leia mais

O processo da Expressão Gênica

O processo da Expressão Gênica INBEQMeDI Instituto Nacional de Biotecnologia Estrutural e Química Medicinal em Doenças Infecciosas Coordenadoria de Educação e Difusão de Ciências Telefone: (16) 3373-9159 Rua 9 de julho, 1205 - Centro

Leia mais

Evolução Biológica e Algoritmos Genéticos. Fábio Lima Custódio flc@lncc.br

Evolução Biológica e Algoritmos Genéticos. Fábio Lima Custódio flc@lncc.br Evolução Biológica e Algoritmos Genéticos Fábio Lima Custódio flc@lncc.br Sumário Conceitos gerais O que é evolução? Forças Evolutivas Mutação Deriva Gênica Fluxo gênico Seleção Natural A teoria evolutiva

Leia mais

Metabolismo de RNA: Transcrição procarioto/eucarioto

Metabolismo de RNA: Transcrição procarioto/eucarioto Metabolismo de RNA: Transcrição procarioto/eucarioto Controle do nível de proteínas DNA inibição RNA degradação inibição Proteína degradação Tipos de RNA produzidos em uma célula Abundancia dos diferentes

Leia mais

MOLECULAR. Daniel Macedo de Melo Jorge. Acontecimentos na genética e genômica. e genômica. Escala Comparativa

MOLECULAR. Daniel Macedo de Melo Jorge. Acontecimentos na genética e genômica. e genômica. Escala Comparativa SUMÁRIO ENÉI MOLEULR Daniel Macedo de Melo Jorge danielmacedo.jorge@gmail.com História da enética Molecular; Organização e estrutura dos genomas; DN e RN Dogma entral Replicação ranscrição radução enes

Leia mais

Universidade Federal de Pelotas Faculdade de Agronomia Eliseu Maciel Programa de Pós-Graduação em Agronomia CENTRO DE GENOMICA E FITOMELHORAMENTO

Universidade Federal de Pelotas Faculdade de Agronomia Eliseu Maciel Programa de Pós-Graduação em Agronomia CENTRO DE GENOMICA E FITOMELHORAMENTO Universidade Federal de Pelotas Faculdade de Agronomia Eliseu Maciel Programa de Pós-Graduação em Agronomia CENTRO DE GENOMICA E FITOMELHORAMENTO Introdução à Bioinformática Professores: Luciano Maia Antonio

Leia mais

EXAME DE BIOLOGIA Prova de Acesso - Maiores 23 Anos (21 de Abril de 2009)

EXAME DE BIOLOGIA Prova de Acesso - Maiores 23 Anos (21 de Abril de 2009) INSTITUTO POLITÉCNICO DE BEJA EXAME DE BIOLOGIA Prova de Acesso - Maiores 23 Anos (21 de Abril de 2009) Nome do Candidato Classificação Leia as seguintes informações com atenção. 1. O exame é constituído

Leia mais

Radar de Penetração no Solo e Meio- Ambiente

Radar de Penetração no Solo e Meio- Ambiente UNIVERSIDADE DE SÃO PAULO INSTITUTO DE ASTRONOMIA, GEOFÍSICA E CIÊNCIAS ATMOSFÉRICAS DEPARTAMENTO DE GEOFÍSICA Curso 3ª Idade Radar de Penetração no Solo e Meio- Ambiente Vinicius Rafael Neris dos Santos

Leia mais

ESTRUTURA DO DNA E ORGANIZAÇAO DA ATIVIDADE BIOLÓGICA

ESTRUTURA DO DNA E ORGANIZAÇAO DA ATIVIDADE BIOLÓGICA ESTRUTURA DO DNA E ORGANIZAÇAO DA CROMATINA ATIVIDADE BIOLÓGICA 1 Qual é a natureza química da molécula responsável por estocar a informação genética??? CARACTERÍSTICAS 1. Estocar a informação e transmitir

Leia mais

Anotação de Genomas. Fabiana G. S. Pinto

Anotação de Genomas. Fabiana G. S. Pinto Anotação de Genomas Fabiana G. S. Pinto Obtenção de Seqüências geradas pelo MegaBace 1000 Dados brutos (medidas analógicas) de saída do seqüênciamento Base calling BIOINFORMÁTICA * PHRED: - Transforma

Leia mais

A Estrutura da molécula de DNA. Identificação dos ácidos nucléicos e da molécula certa inaugura a genética molecular

A Estrutura da molécula de DNA. Identificação dos ácidos nucléicos e da molécula certa inaugura a genética molecular Page 1 of 5 A Estrutura da molécula de DNA Identificação dos ácidos nucléicos e da molécula certa inaugura a genética molecular Em 1869, o bioquímico suíço Friedtich Mieschner aventou pela primeira vez

Leia mais