Base Biológica e Notação Computacional



Documentos relacionados
BASES NITROGENADAS DO RNA

A natureza química do material genético Miescher nucleínas. ácidos nucleicos. ácido desoxirribonucleico ácido ribonucleico Avery MacLeod McCarty

BASES MACROMOLECULARES DA CONSTITUIÇÃO CELULAR

Hoje estudaremos a bioquímica dos ácidos nucléicos. Acompanhe!

Criado e Desenvolvido por: RONNIELLE CABRAL ROLIM Todos os direitos são reservados

Aula 7 Ácidos nucléicos

O DNA é formado por pedaços capazes de serem convertidos em algumas características. Esses pedaços são

Biologia Professor Vianna 1ª série / 1º trimestre

Núcleo Celular. Biomedicina primeiro semestre de 2012 Profa. Luciana Fontanari Krause

Bases Moleculares da Hereditariedade

SÍNTESES NUCLEARES. O DNA éo suporte da informação genética. Parte 1 Replicação

BIOFÍSICA DAS RADIAÇÕES IONIZANTES

GENÉTICA HISTÓRICO CARACTERÍSTICAS LEIS DE MENDEL PROBABILIDADE

Princípios moleculares dos processos fisiológicos

48 Como produzimos a insulina?

Áudio. GUIA DO PROFESSOR Síndrome de Down - Parte I

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Os primeiros indícios de que o DNA era o material hereditário surgiram de experiências realizadas com bactérias, sendo estas indicações estendidas

4. (Unifesp 2012) Durante a prófase I da meiose, pode ocorrer o crossing over ou permuta gênica entre os cromossomos das células reprodutivas.

COLÉGIO SHALOM Ensino Fundamental 8 Ano Prof.ª: Nize C.Pavinato - Disciplina: Ciências Aluno(a):

MEDICINA VETERINÁRIA. Disciplina: Genética Animal. Prof a.: D rd. Mariana de F. Gardingo Diniz

Equipe de Biologia. Biologia

Disciplina: Biologia Educacional. Curso: Pedagogia 2 Semestre

Património Genético. Genética - estuda a transmissão de características de uma geração para a outra

Transcrição Automática de Música

MÓDULO III AULA 2: CONTROLE DA EXPRESSÃO GÊNICA EM EUCARIOTOS

DNA A molécula da vida. Prof. Biel Série: 9º ano

1. A base biológica. 1.1 Hereditariedade (BURNS, 1983) IA369 - Gudwin & Von Zuben (1s/98) Aula 2 1. IA369 - Gudwin & Von Zuben (1s/98) Aula 2 2

Reprodução Sexuada Meiose e Fecundação

TD DE CIÊNCIAS 8ª. série PROFa. Marjory Tôrres. INTRODUÇÃO À GENÉTICA Os princípios básicos da Hereditariedade

BANCO DE QUESTÕES - BIOLOGIA - 1ª SÉRIE - ENSINO MÉDIO ==============================================================================================

MENDELISMO. Primeira Lei de Mendel ou Princípio da Segregação ou Lei da pureza dos gametas:

AGRUPAMENTO DE ESCOLAS DE CASTRO DAIRE. Ano Letivo 2012/2013 DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS PLANIFICAÇÃO ANUAL CIÊNCIAS NATURAIS

CADERNO DE EXERCÍCIOS 3D

Sistemas biológicos e a química de biomoléculas

ÁCIDOS NUCLEÍCOS RIBOSSOMO E SÍNTESE PROTEÍCA

PlanetaBio Resolução de Vestibulares FUVEST ª fase

Entendendo a herança genética (capítulo 5) Ana Paula Souto 2012

Algoritmos Genéticos

Faculdade de Tecnologia de Araçatuba. Curso Superior de Tecnologia em Bioenergia Sucroalcooleira

Atividade extra. Questão 1. Questão 2. Ciências da Natureza e suas Tecnologias Biologia

GENÉTICA DE POPULAÇÕES:

Origem da variação. Conceitos importantes. Diversidade Genética. Variação genética

Energia kj/mol kcal/mol

> ESTUDO DO RNA. (C) O ácido nucléico I é DNA e o II, RNA. (D) O ácido nucléico I é RNA e o II, DNA. (E) I é exclusivo dos seres procariontes.

Projeto-síntese de Ciências 8º ano 3º trimestre

o hemofílico. Meu filho também será?

DNA E SÍNTESE PROTEICA

Genética de Populações

SISTEMA REPRODUTOR. Sistema reprodutor feminino

Lista de Genética 2º EM Colégio São José

Qual é o objeto de estudo da Fisiologia Humana? Por que a Fisiologia Humana é ensinada em um curso de licenciatura em Educação Física?

Áudio GUIA DO PROFESSOR. Idéias evolucionistas e evolução biológica

Perspectivas da Evolução das Espécies

Entendendo a herança genética (capítulo 5) Ana Paula Souto 2012

Corresponde ao local de cada gene em específico. Em um mesmo cromossomo há vários genes, cada um com sua localização específica.

RESUMOS TEÓRICOS de QUÍMICA GERAL e EXPERIMENTAL

unidade básica da vida

NÚCLEO e DIVISÃO CELULAR

Genética Humana. Prof. João Ronaldo Tavares de Vasconcellos Neto

ACESSO VESTIBULAR QUESTÕES DE PROCESSAMENTO DE RNA OU SPLICING 01. (MAMA ) PÁGINAS OCULTAS NO LIVRO DA VIDA

Questão 1. Questão 3. Questão 2 1ª PARTE: QUESTÕES OBJETIVAS. alternativa E. alternativa B. A, B e C pertenceriam, respectivamente, a organismos

UNIVERSIDADE DO ESTADO DO PARÁ BIOLOGIA PROSEL/ PRISE 1ª ETAPA

3) As afirmativas a seguir referem-se ao processo de especiação (formação de novas espécies). Com relação a esse processo é INCORRETO afirmar que

A árvore genealógica dos seres vivos

Biologia é a ciência que estuda os seres vivos (do grego - bios =vidae - logos = estudo, ou seja o estudo da vida). Debruça-se sobre o funcionamento


Eventos independentes

3.4 O Princípio da Equipartição de Energia e a Capacidade Calorífica Molar

Resistência de Bactérias a Antibióticos Catarina Pimenta, Patrícia Rosendo Departamento de Biologia, Colégio Valsassina

Aula: 16 Temática: Estrutura dos aminoácidos e proteínas parte I. Iremos iniciar o estudo da estrutura dos aminoácidos e proteínas.

Motivação para o trabalho no contexto dos processos empresariais

Organização do Material Genético nos Procariontes e Eucariontes

Painéis Do Organismo ao Genoma

Núcleo e Divisões Celulares

COMUNICAÇÃO DA INFORMAÇÃO NAS MOLÉCULAS DE DNA E RNA

Genética Conceitos Básicos

ABORDAGEM INTERACIONISTA COGNITIVISTA: A EPISTEMOLOGIA GENÉTICA DE PIAGET

ADMINISTRAÇÃO GERAL MOTIVAÇÃO

b) Represente um segmento de mrna usando como molde a cadeia de DNA complementar à do enunciado.

CITOLOGIA CITOLOGIA. A história da Citologia TEORIA CELULAR 30/03/2016

JOGO GALÁPAGOS: A EXTINÇÃO E A IRRADIAÇÃO DE ESPÉCIES NA CONSTRUÇÃO DA DIVERSIDADE BIOLÓGICA

As bactérias operárias

Mecanismos de variabilidade genética em agentes fitopatogênicos

1 Propagação de Onda Livre ao Longo de um Guia de Ondas Estreito.

PROVA COMENTADA PELOS PROFESSORES DO CURSO POSITIVO

A Estrutura da molécula de DNA. Identificação dos ácidos nucléicos e da molécula certa inaugura a genética molecular

Metadados. 1. Introdução. 2. O que são Metadados? 3. O Valor dos Metadados

Análise e Projeto de Software

Unidade 7. Reprodução e hereditariedade

BIOLOGIA EVOLUÇÃO PROF ESTEVAM

PROVA DE BIOLOGIA 2 o BIMESTRE 2012

DO GENE À PROTEÍNA ALGUNS CONCEITOS BASICOS COMO SE ORGANIZAM OS NUCLEÓTIDOS PARA FORMAR O DNA?

TÉCNICAS DE PROGRAMAÇÃO

ALGORITMOS GENÉTICOS: UMA VISÃO EXPLANATÓRIA

cromossomos para montagem de um cariótipo? Prof. Zell (Biologia) OS CROMOSSOMOS 04. (UNI-RIO/ENCE) 01.

a) Que característica do coração dos mamíferos impede a mistura do sangue venoso e arterial?

UNIÃO EDUCACIONAL DO NORTE UNINORTE AUTOR (ES) AUTOR (ES) TÍTULO DO PROJETO

Genética I: Mendel, Mitose e Meiose

Transcrição:

Base Biológica e Notação Computacional Índice 1. Ácidos nucleicos... 2 1.1 DNA... 2 1.2 RNA... 6 1.3 Nucleotídeos... 9 2. Transcrição, tradução e replicação... 11 3. Código genético... 16 4. Gene... 17 4.1 Splicing... 19 5. Proteína... 22 5.1 Maquinaria de tradução... 23 5.2 Diferentes conformações das proteínas... 26 6. Genoma humano... 28 7. Hereditariedade (BURNS, 1983)... 29 7.1 Do Darwinismo ao Neo-Darwinismo... 32 7.2 Terminologia biológica... 33 7.3 Fenótipo x Genótipo (FOGEL, 1995)... 38 7.4 Adaptação evolutiva... 40 7.5 Reprodução assexuada e sexuada... 42 7.6 Mutação... 45 8. A notação computacional... 48 8.1 Superfície de adaptação... 49 9. Da Biologia Evolutiva para a Computação Evolutiva... 53 10. Referências... 54 Tópico 3: Base Biológica e Notação Computacional 1 1. Ácidos nucleicos Ácidos nucleicos são macromoléculas (compostos químicos de elevada massa molecular) essenciais para a vida. Receberam esta denominação por terem sido encontrados no núcleo de células eucarióticas e por possuírem grupos de fosfato relacionados ao ácido fosfórico. Além do ácido fosfórico, são compostos por açúcares e nucleotídeos. 1.1 DNA O ácido desoxirribonucleico (DNA, do inglês deoxyribonucleic acid) é um composto orgânico cujas moléculas contêm as instruções genéticas que coordenam o desenvolvimento e funcionamento de todos os seres vivos e alguns vírus. O seu principal papel é armazenar as informações necessárias para a construção das proteínas e RNAs. Tópico 3: Base Biológica e Notação Computacional 2

Os segmentos de DNA que contêm a informação genética são denominados genes. O restante da sequência de DNA tem importância estrutural ou está envolvido na regulação do uso da informação genética. O DNA é um longo polímero formado por unidades repetidas chamadas nucleotídeos, organizadas em uma dupla hélice. A cadeia de DNA tem 2,2 a 2,4 nanômetros de largura, e um nucleotídeo possui aproximadamente 0,33 nanômetros de comprimento. Embora os monômeros (nucleotídeos) que constituem o DNA sejam muito pequenos, os polímeros de DNA podem ser moléculas enormes, com milhões de nucleotídeos. Por exemplo, o maior cromossomo humano (cromossomo 1) possui 220 milhões de pares de bases nucleotídicas de comprimento. Uma molécula de DNA do ser humano possui aproximadamente dois metros de comprimento, encapsulada em um núcleo celular de 6 µm, o equivalente a acomodar uma linha de 40 km de comprimento em uma bola de tênis. Tópico 3: Base Biológica e Notação Computacional 3 Composição química do DNA Tópico 3: Base Biológica e Notação Computacional 4

Estrutura em dupla hélice do DNA Tópico 3: Base Biológica e Notação Computacional 5 1.2 RNA A composição do RNA é muito semelhante à do DNA, apresentando as seguintes diferenças: 1. O RNA é formado por uma cadeia simples de nucleotídeos, e não uma de dupla hélice como o DNA. Um filamento de RNA pode se dobrar de tal modo que parte de suas próprias bases se pareiam umas com as outras. Tal pareamento intramolecular de bases é um determinante importante da forma do RNA. Assim, formando pontes intracadeia, o RNA é capaz de assumir uma variedade muito maior de formas moleculares tridimensionais complexas do que a dupla hélice de DNA. 2. O RNA tem o açúcar ribose em seus nucleotídeos em vez da desoxirribose encontrada no DNA. Como os nomes sugerem, os dois açúcares diferem na presença ou ausência de apenas um átomo de oxigênio. Os grupos de açúcar do Tópico 3: Base Biológica e Notação Computacional 6

RNA contêm um par oxigênio-hidrogênio ligado ao carbono 2', enquanto apenas um átomo de hidrogênio é ligado ao carbono 2' nos grupos de açúcar do DNA. 3. Os nucleotídeos de RNA (chamados ribonucleotídeos) contêm as bases adenina (A), guanina (G), citosina (C) e uracila (U), sendo que esta última pirimidina está presente em lugar de timina (T). 4. O RNA, como a proteína mas não como o DNA, pode catalisar importantes reações biológicas. As moléculas de RNA que funcionam como proteínas enzimáticas são chamadas de ribozimas. Como um filamento individual de DNA, um filamento de RNA é formado de um arcabouço de açúcar-fosfato com uma base ligada covalentemente na posição 1' de cada ribose. As ligações açúcar-fosfato são feitas nas posições 5' e 3' do açúcar, como no DNA. Assim, uma cadeia de RNA terá uma ponta 5' e uma ponta 3'. Tópico 3: Base Biológica e Notação Computacional 7 Composição química do RNA Tópico 3: Base Biológica e Notação Computacional 8

1.3 Nucleotídeos Os nucleotídeos são compostos por uma base nitrogenada, uma pentose e um grupo fosfato. As bases nitrogenadas podem ser classificadas em: purinas e pirimidinas. A base está ligada ao carbono 3 da pentose e o fosfato está esterificado ao carbono 5 da mesma. As purinas são bases nitrogenadas, sendo que no DNA encontram-se adenina (A) e guanina (G). A cafeína e o ácido úrico, por exemplo, também são purinas. As pirimidinas também são bases nitrogenadas, sendo que no DNA encontram-se timina (T) e citosina (C) e no RNA, em lugar de timina, encontra-se uracila (U). Na dupla hélice do DNA, a adenina se liga com a timina através de duas pontes de hidrogênio, enquanto que a guanina se liga com a citosina através de três pontes de hidrogênio. Tópico 3: Base Biológica e Notação Computacional 9 Tópico 3: Base Biológica e Notação Computacional 10

2. Transcrição, tradução e replicação Transcrição é o processo de formação do RNA a partir da cadeia-molde de DNA. O RNA tem como função indicar a ordem correta dos aminoácidos a serem sintetizados em proteínas, através da tradução desse RNA. A transcrição ocorre no núcleo e a tradução ocorre no citoplasma. DNA transcrição RNA tradução Proteína Tópico 3: Base Biológica e Notação Computacional 11 Tópico 3: Base Biológica e Notação Computacional 12

Procarioto: RNA proteína Eucarioto: pre-mrna mrna maduro proteína Tópico 3: Base Biológica e Notação Computacional 13 O processo de transcrição é catalisado pela enzima RNA-polimerase. Os fatores de transcrição (auxiliares da RNA-polimerase) são responsáveis por romperem as ligações de hidrogênio entre as bases nitrogenadas dos dois filamentos de DNA, como um zíper. Processo de transcrição Tópico 3: Base Biológica e Notação Computacional 14

A RNA-polimerase executa várias funções sem a necessidade de outras enzimas, ao contrário da DNA-polimerase, que codifica o genoma inteiro, num processo chamado de replicação. Processo de replicação do DNA Tópico 3: Base Biológica e Notação Computacional 15 3. Código genético 4 3 códons 20 aminoácidos Tópico 3: Base Biológica e Notação Computacional 16

CÓDON PREFERENCIAL Ex: CUU (65%) CUC (15%) CUA (10%) CUG (5%) UUA (3%) UUG (2%) Leucina 4. Gene Um gene designa uma unidade de informação genética que ocupa um determinado lócus de um cromossomo. É uma sequência de DNA que geralmente possui uma região reguladora, uma codificadora e uma região de término, que codifica um RNA informacional (RNA mensageiro) ou um RNA funcional (RNA ribossomal, RNA transportador). Portanto, um gene leva à produção de uma cadeia polipeptídica e inclui regiões que antecedem e que seguem a região codificadora, bem como sequências que não são Tópico 3: Base Biológica e Notação Computacional 17 traduzidas (íntrons) que se intercalam aos segmentos codificadores individuais (éxons), que são traduzidos. Tópico 3: Base Biológica e Notação Computacional 18

4.1 Splicing Tópico 3: Base Biológica e Notação Computacional 19 Tópico 3: Base Biológica e Notação Computacional 20

Tópico 3: Base Biológica e Notação Computacional 21 5. Proteína Uma proteína é a junção de várias moléculas de aminoácidos através de ligações peptídicas. Dependendo da sequência de aminoácidos e do número de aminoácidos existentes, a proteína pode assumir formas bem complexas. A mais simples é a estrutura primária, que é apenas dada pela sequência de aminoácidos. A secundária é um pouco mais complexa, na qual as proteínas podem formar hélices ou uma espécie de zigue-zague. A terciária já inclui várias proteínas associadas. A quaternária não tem uma definição própria, sendo mais complexa. Uma proteína vai ser composta por, no mínimo, 20 aminoácidos e, em média, centenas de aminoácidos. Uma ligação peptídica é a união do grupo amino (-NH 2 ) de um aminoácido com o grupo carboxila (-COOH) de outro aminoácido, através da formação de uma amida. Tópico 3: Base Biológica e Notação Computacional 22

5.1 Maquinaria de tradução Tópico 3: Base Biológica e Notação Computacional 23 Tópico 3: Base Biológica e Notação Computacional 24

1 mrna + de 10 moléculas de proteínas Tópico 3: Base Biológica e Notação Computacional 25 5.2 Diferentes conformações das proteínas Tópico 3: Base Biológica e Notação Computacional 26

Tópico 3: Base Biológica e Notação Computacional 27 6. Genoma humano É constituído de 23 pares de cromossomos. Tomando apenas um elemento do par, o número de pares de bases nucleotídicas de todos os cromossomos chega a 3 bilhões, enquanto que o número de genes está na ordem de 23 mil, sendo apenas duas vezes maior que o número de genes de seres bem mais simples, como alguns insetos. Apenas 1,5% do genoma é utilizado para produzir proteína, enquanto o restante está associado a genes que produzem RNA não-codificante, sequências regulatórias, íntrons e DNA não-codificante. Os genes são distribuídos de maneira não-uniforme ao longo dos cromossomos. Existem equipamentos capazes de mensurar o grau de expressão gênica em certas condições experimentais. Além do genoma, também de estudam proteoma e metaboloma, do ser humano e de outros seres vivos. Tópico 3: Base Biológica e Notação Computacional 28

7. Hereditariedade (BURNS, 1983) A história da genética é fascinante principalmente pela velocidade com que se evoluiu de observações a demonstrações experimentais dos mecanismos fundamentais envolvidos. A ideia de hereditariedade data de 6 mil anos atrás. Por volta de 500 a.c. (tempo de Aristóteles), filósofos gregos, propuseram que vapores derivados de vários órgãos se uniam sob a ação vitalizadora do sêmen, interpretado como sangue altamente purificado. Esta ideia influiu sobre a cultura da humanidade por cerca de 2 mil anos. Neste período, defendia-se a ideia de que o sexo era determinado pela procedência do líquido seminal no homem: se do testículo direito sexo masculino; se do testículo esquerdo sexo feminino. A mulher era vista apenas como uma incubadeira neste processo. Tópico 3: Base Biológica e Notação Computacional 29 1672: Descoberta do óvulo pelo holandês Graaf as fêmeas de mamíferos também apresentam ovulação! 1675: Descoberta do espermatozoide pelo holandês Von Leeuwenhoeck. Homúnculo: Ovistas e Espermistas. Epigênese: Teoria atual segundo a qual a constituição dos seres se inicia a partir de célula sem estrutura e se faz mediante sucessiva formação e adição de novas partes que, previamente, não existem no ovo fecundado. 1866: Ideias efetivas acerca da hereditariedade Monge agostiniano Gregor Mendel (República Tcheca). Ele atacou o problema de modo simples e lógico, escolheu material adequado, concentrou-se em poucas características contrastantes, desenvolveu um programa de cruzamentos controlados, tratou os resultados de forma eficiente e sugeriu fatores causais (hoje chamados de genes) como os responsáveis pelos fenômenos observados. Tópico 3: Base Biológica e Notação Computacional 30

Ninguém havia chegado tão perto da compreensão real da hereditariedade (ficou faltando apenas elucidar os mecanismos celulares envolvidos), mas foram necessários mais de 30 anos para que a comunidade científica se desse conta da importância e eficácia desses resultados. Curiosidade: Um dos fatores que dificultou a assimilação dos resultados de Mendel foi justamente o intenso debate reinante nos meios científicos após a divulgação da teoria de seleção natural de Darwin. 1900: redescoberta das ideias de Mendel (após sua morte), feitas de forma independente por três pesquisadores. 1 a lei de Mendel: Cada caráter é condicionado por dois fatores. Eles separam-se na formação dos gametas, passando apenas um fator por gameta. Tópico 3: Base Biológica e Notação Computacional 31 7.1 Do Darwinismo ao Neo-Darwinismo DARWIN (1859) sugeriu que para haver evolução é necessário que exista uma população de indivíduos sujeita a: 1. Reprodução com herança; 2. Variação; e 3. Seleção Natural (competição pela sobrevivência, sob recursos limitados). Embora Darwin tenha considerado estas hipóteses como suficientes para explicar a origem das espécies, hoje elas são aceitas apenas como suficientes para explicar os processos ecológicos. Na época de Darwin (meados de 1800), entretanto, sabia-se muito pouco sobre os processos de reprodução e praticamente nada sobre genética. Além disso, não havia um bom entendimento sobre como operam os mecanismos de seleção natural. A união da genética com diversos conceitos e teorias sobre seleção natural leva ao que hoje é chamado de neo-darwinismo. Tópico 3: Base Biológica e Notação Computacional 32

Sobre a Seleção Natural O princípio da seleção natural indica que os indivíduos cujas variações se adaptam melhor ao ambiente terão maior probabilidade de sobreviver e se reproduzir. A seleção natural é probabilística, e seu alvo primário é o indivíduo, embora seu efeito resultante vai se manifestar na espécie como um todo. A espécie é o beneficiário final do processo evolutivo (MAYR, 1988). 7.2 Terminologia biológica A terminologia biológica a ser empregada representa uma analogia às entidades biológicas reais, em que as entidades computacionais corresponderão invariavelmente a estruturas bem mais simples que seus equivalentes biológicos. Tópico 3: Base Biológica e Notação Computacional 33 Célula órgão sistema organismo população comunidade ecossistema Órgão Comunidade Célula Sistema População Ecossistema Nível fisiológico Organismo Nível ecológico Figura 1: Divisão hierárquica dos sistemas biológicos (de Castro & Timmis, 2002). Célula: unidade estrutural básica dos seres vivos, que se compõe de numerosas partes, sendo as fundamentais a parede ou membrana, o citoplasma e o núcleo. A célula é a menor unidade de matéria viva que pode existir de maneira independente, e ser capaz de se reproduzir. Toda célula de um mesmo organismo contém o mesmo conjunto de um ou mais cromossomos. Nos seres humanos, cada célula somática (não-germinativa) contém 23 pares de cromossomos. Tópico 3: Base Biológica e Notação Computacional 34

Cromossomo: Estrutura nucleoproteica formada por uma cadeia de DNA, sendo a base física dos genes nucleares, os quais estão dispostos linearmente. Cada espécie apresenta um número característico de cromossomos. Quando os cromossomos são arranjados em pares (cada cromossomo proveniente de um dos pais, embora haja exceções), os respectivos organismos são chamados diploides. Organismos cujos cromossomos não se apresentam aos pares são chamados haploides. gene gene gene Figura 2: Ampliação de um organismo para enfocar o material genético. Organismo célula cromosomo gene DNA Tópico 3: Base Biológica e Notação Computacional 35 Genes: É a denominação que damos hoje ao fator mendeliano. Cada gene está localizado em uma posição (lócus) particular do cromossomo. Quando dois genes se comportam segundo a 1 a lei de Mendel, são ditos alelos, e se encontram no mesmo lócus de dois cromossomos homólogos. Para exemplificar, é possível pensar um gene como o responsável pela definição de uma característica do indivíduo, como a cor dos olhos. As diferentes colorações (azul, castanho, etc) correspondem a alelos. No entanto, também existem pontos de vista muito mais refinados (DAWKINS, 1990). Como muitos organismos apresentam células com mais de um cromossomo, o conjunto de todos os cromossomos compõe o material genético do organismo, denominado genoma. Cromosomo diagramático Lócus A B A A B A B B A B Alelos: {A, B} Gene Figura 3: Ilustração pictórica de um cromosomo salientando o lócus, os genes e os alelos. Tópico 3: Base Biológica e Notação Computacional 36

gene produto característica epistasia: interferência funcional entre genes localizados em posições diferentes. pleiotropia: quando um único gene afeta múltiplas características fenotípicas. poligenia: quando uma única característica fenotípica é determinada pela interação simultânea de muitos genes. Figura 4: Pleiotropia e poligenia. Tópico 3: Base Biológica e Notação Computacional 37 7.3 Fenótipo x Genótipo (FOGEL, 1995) 1909: introdução dos conceitos de genótipo e fenótipo. Genótipo: representa o conjunto específico de genes do genoma. Neste caso, indivíduos com o mesmo genoma são ditos terem o mesmo genótipo. Fenótipo: é a manifestação do genótipo no comportamento, fisiologia e morfologia do indivíduo, como um produto de sua interação com o ambiente. A seleção natural opera somente na expressão fenotípica do genótipo (MAYR, 1970; HARTL & CLARK, 1989). Para modelar este fenômeno, ATMAR (1992) estendeu um resultado da literatura baseado no emprego de dois espaços de estados: 1. G: espaço genotípico (representa a informação); 2. P: espaço fenotípico (representa o comportamento). que permitem a definição de quatro funções, onde I representa um conjunto de efeitos do ambiente (entrada), na forma: Tópico 3: Base Biológica e Notação Computacional 38

f 1 : I G P (epigênese); f 2 : P P (seleção); f 3 : P G (sobrevivência genotípica); f 4 : G G (variação genética). A adaptação evolutiva ocorre a partir da aplicação iterativa dessas funções. g 1 g 2 f 4 g 1 Espaço genotípico G f 1 f 3 f 2 Espaço fenotípico F p 1 p 2 Figura 5: Evolução explicada através de mapeamentos entre os espaços genotípico e fenotípico. Tópico 3: Base Biológica e Notação Computacional 39 7.4 Adaptação evolutiva Sob um processo de competição por recursos limitados e seleção natural, indivíduos mais bem adaptados têm uma maior probabilidade de sobreviver e propagar seu material genético. A adaptação (fitness) pode ser definida como a probabilidade de sobrevivência e reprodução (viabilidade), ou então como uma função do número de descendentes que o organismo produziu (fertilidade). ATMAR (1994) indicou que uma medida singular da adaptação evolutiva é dada pela habilidade de uma população antecipar seu ambiente e agir no sentido de atender aos requisitos associados às predições realizadas. Uma alternativa a esta definição de medida de adaptação é a ideia simplificada de que a adaptação pode ser medida em termos de mudanças na frequência gênica dentro da população (FISHER, 1930). Esta definição despreza os efeitos importantes de pleiotropia e poligenia, ao considerar a relação (um gene) (uma característica) para descrever o relacionamento (genótipo) (fenótipo). Tópico 3: Base Biológica e Notação Computacional 40

Sistemas naturais em evolução são fortemente pleiotrópicos e altamente poligênicos (HARTL & CLARK, 1989). Além disso, a seleção natural atua sobre uma coleção de características fenotípicas, e não sobre uma única característica isolada. Como consequência, um gene não pode ser considerado como uma unidade individual de seleção, pelo fato de não ser possível atribuir a um gene isolado um valor significativo para o seu nível de adaptação. Logo, a evolução se refere mais apropriadamente a mudanças em adaptação e diversidade, e não diretamente a mudanças na frequência gênica. Além disso, a evolução é oportunista, ou seja, características críticas serão intensamente otimizadas, enquanto características menos críticas podem sofrer uma grande variedade de tratamentos alternativos. Tópico 3: Base Biológica e Notação Computacional 41 7.5 Reprodução assexuada e sexuada Embora os detalhes da evolução biológica ainda não estejam completamente compreendidos, existem alguns aspectos fundamentados em fortes evidências experimentais: 1. A evolução é um processo que opera sobre cromossomos e não sobre organismos; 2. A seleção natural é o mecanismo que relaciona cromossomos com a eficiência da entidade que eles representam, permitindo assim que organismos mais bem adaptados ao meio ambiente tenham uma taxa maior de reprodução; 3. O processo evolutivo se dá durante o estágio reprodutivo. Dentre os fenômenos que podem ocorrer neste estágio é possível citar a mutação e a recombinação genética (crossover); 4. O processo evolutivo não possui memória direta. Tópico 3: Base Biológica e Notação Computacional 42

Reprodução assexuada: na natureza, a codificação da informação genética é realizada de modo a admitir reprodução assexuada. Neste caso, os filhos apresentam quase sempre a mesma informação genética do pai. Um número muito grande de organismos naturais se reproduz de forma assexuada, incluindo a maior parte das bactérias. M ito se R eplicação D ivisão H aplóide Figura 6: Reprodução assexuada em cromosomos haploides. Tópico 3: Base Biológica e Notação Computacional 43 Reprodução sexuada: neste caso, os filhos apresentam uma informação genética que corresponde a uma combinação da informação genética de seus pais. Na reprodução sexuada diploide, cada pai fornece uma célula haploide denominada gameta, formada por cromossomos resultantes da recombinação dos pares de cromossomos existentes nos respectivos pais. Os cromossomos presentes nos gametas fornecidos pelos pais se emparelham para gerar uma nova célula diploide. Ovo Meiose Replicação Separação dos homólogos Diplóide Zigoto diplóide Esperma Gametas haplóides Tópico 3: Base Biológica e Notação Computacional 44

Durante a reprodução sexuada, os cromossomos estão sujeitos à recombinação. Recombinação ou crossover: consiste na troca aleatória de material genético entre dois cromossomos. Figura 7: Recombinação genética (crossover) entre dois cromosomos. 7.6 Mutação Tanto na reprodução assexuada como na sexuada, o processo de cópia do material genético dos pais está sujeito a erros, denominados mutações. Uma mutação corresponde então à troca aleatória, no processo de cópia do material genético, de um nucleotídeo por outro. Tópico 3: Base Biológica e Notação Computacional 45 Nucleotídeo: unidade elementar do DNA. A B A C B A B C A B A B A C B A B C A B A B A B B A B C A B A B A B B A B C A + B Mutação pontual Deleção perdido A B A C B A B C A B A C A C B A B B A B Inversão Figura 8: Ilustração de diferentes tipos de mutação. A mutação é uma consequência inescapável da existência de sistemas que se reproduzem continuamente em um universo com diferencial de entropia positivo, sendo um mecanismo importante de implantação da diversidade entre os indivíduos. Em estágios iniciais do processo evolutivo natural, as taxas de mutação podem ter sido muito maiores. O fato de que as taxas de mutação atuais nos organismos vivos são Tópico 3: Base Biológica e Notação Computacional 46

muito baixas na maioria dos casos observados pode ser devido a estes organismos, como espécie, terem atingido um estado de estacionariedade em relação às condições ambientais atuais. Neste caso, o nível de evolução orgânica atual não deve servir de referência para nenhum tipo de implementação computacional de algoritmo evolutivo. Geralmente, a recombinação deve ter probabilidades de ocorrência maior que a mutação. Observação: Em implementação computacional, à primeira geração de indivíduos é geralmente imposto um determinado nível inicial de diversidade. Teoricamente, as taxas ótimas de mutação são inversamente proporcionais ao número de variáveis de decisão envolvidas e diretamente proporcionais à distância do ótimo. A probabilidade de ocorrência de mutação deve ser inversamente proporcional ao tamanho da população (DE JONG, 1975). Existem estratégias que incorporam a definição da taxa de mutação ao próprio genótipo. Tópico 3: Base Biológica e Notação Computacional 47 8. A notação computacional Observação: As informações contidas nesta seção podem não ser genéricas e também podem referir-se ao caso de algoritmos evolutivos específicos. Um cromossomo haploide geralmente corresponde a uma estrutura de dados (p.ex. cadeia de bits) que representa um candidato à solução (indivíduo de uma população) de um problema. Um gene corresponde a um único bit, ou então a um pequeno bloco de bits adjacentes que codificam um elemento particular da solução candidata. Por exemplo, em otimização de funções multiparamétricas, o conjunto de bits utilizado para codificar um parâmetro específico pode ser considerado um único gene. Em uma cadeia de bits, um alelo é 0 ou 1. Para alfabetos maiores, mais alelos podem ser considerados para cada posição (lócus). Tópico 3: Base Biológica e Notação Computacional 48

A grande maioria das aplicações de algoritmos evolutivos emprega codificação haploide e baseada em um único cromossomo. Neste caso, o genótipo passa a corresponder à configuração de bits do cromossomo. Cromosomo utilizando representação binária Lócus 1 0 0 0 1 1 0 0 1 0 Alelos: {0,1} Gene Figura 9: Estrutura de dados (cadeia binária) de um algoritmo evolutivo. 8.1 Superfície de adaptação Uma vez definido o processo de codificação (representação) para um dado problema, o objetivo é buscar uma solução desejada dentre todos os possíveis candidatos à solução (elementos do espaço de busca). Genótipo: Uma solução potencial de um dado problema pode ser codificada na forma de uma estrutura de dados. Fenótipo: A decodificação do genótipo leva a um ponto no espaço de busca. Tópico 3: Base Biológica e Notação Computacional 49 Espaço de busca normado: Coleção de candidatos à solução do problema + uma norma (operador que estabelece a noção de vizinhança). Nota: Os algoritmos evolutivos geralmente consideram que existe alguma correlação entre candidatos à solução que sejam vizinhos (segundo a norma estabelecida). Tomando representação haploide e baseada em um único cromossomo, e considerando genes correspondentes a um único bit, o número de possíveis candidatos à solução em função do comprimento do cromossomo é dado nas figuras a seguir: c a n d i d a t o s 1200 1000 800 600 400 200 0 0 2 4 6 8 10 comprimento c a n d i d a t o s 12 x 105 10 8 6 4 2 0 10 12 14 16 18 20 comprimento Tópico 3: Base Biológica e Notação Computacional 50

Superfície de adaptação: foi originalmente definida pelo biólogo Sewell Wright, em 1931, como a representação do nível de adaptação de todos os genótipos. Observe que aqui é realizada uma avaliação diretamente sobre o genótipo, sem considerar o fenótipo. Exemplo: Suponha que cada genótipo é uma cadeia de bits de comprimento p, e que a distância entre dois genótipos é dada pela distância de Hamming, ou seja, o número de posições cujos bits são diferentes. Também suponha que a cada genótipo pode ser atribuído um nível de adaptação. Neste caso, a superfície de adaptação vai ser um mapeamento de dimensão p+1, que associa a cada genótipo no espaço de dimensão p um nível de adaptação definido no eixo p+1. No contexto de superfícies de adaptação, a evolução é um processo responsável pela movimentação da população nesta superfície, a partir de operadores genéticos como mutação e recombinação, no sentido de conduzir os indivíduos para as regiões de máximo local. Tópico 3: Base Biológica e Notação Computacional 51 Neste caso, a seleção natural pode ser vista como um processo que conduz à maturação ou aumento da adaptação média da população. Observação: A ideia de evolução a partir do deslocamento da população ao longo de uma superfície de adaptação fixa é biologicamente irreal, porque um indivíduo da população não pode receber um valor de adaptação independente dos demais. O nível médio de adaptação de um indivíduo em um ambiente não-estacionário varia em função da dinâmica do ambiente e das interações deste indivíduo e de outros com o ambiente e entre si. Tópico 3: Base Biológica e Notação Computacional 52

9. Da Biologia Evolutiva para a Computação Evolutiva Biologia (Genética) Cromossomo Gene Lócus Alelo Crossover Mutação Fitness Seleção Genótipo Fenótipo Algoritmos Evolutivos Estrutura de dados Um ou mais atributos ocupando uma determinada posição da estrutura de dados Posição ocupada por um gene em uma estrutura de dados Diferentes valores (dados) que um gene pode assumir Troca de porções entre duas ou mais estruturas de dados Variação aleatória em uma estrutura de dados individual Valor que quantifica a qualidade relativa ou absoluta (nível de adaptação) de um indivíduo; retorno da função de avaliação Processo que permite a sobrevivência e reprodução dos indivíduos mais aptos em detrimento dos menos aptos Estrutura de dados que representa uma solução candidata de um determinado problema Decodificação de um ou mais cromossomos que leva a um ponto do espaço de busca Tópico 3: Base Biológica e Notação Computacional 53 10. Referências ATMAR, W. On the Rules and Nature of Simulated Evolutionary Programming. Proc. of the First Ann. Conf. On Evolutionary Programming, pp. 17-26, 1992. ATMAR, W. Notes on the Simulation of Evolution. IEEE Trans. on Neural Networks, 5(1): 130-148, 1994. BURNS, G.W. The Science of Genetics - An Introduction of heredity. 1983. DARWIN, C. The Origin of Species, John Murray, 1859 (Penguin Classics, 1985). DAWKINS, R. The Selfish Gene, Oxford University Press, 1990. DE CASTRO, L. N. & TIMMIS, J. I.. Artificial Immune Systems: A New Computational Intelligence Approach, Springer Verlag, 2002 C DE JONG, K.A. An analysis of the behavior of a class of genetic adaptive systems. Ph.D. Thesis, The University of Michigan, 1975. FISHER, R.A. The Genetical Theory of Natural Selection. Clarendon Press, 1930. FOGEL, D.B. Evolutionary Computation: Toward a New Philosophy of Machine Intelligence, IEEE Press, 1995. HARTL, D.L., CLARK, A.G. Principles of Popultion Genetics. Sinauer, 1989. MAYR, E. Populations, Species, and Evolution. Belknap Press, 1970. MAYR, E. Toward a New Philosophy of Biology: Observations of an Evolutionist. Belknap Press, 1988. MITCHELL, M. An Introduction to Genetic Algorithms. MIT Press, 1996. Nota: Parte das figuras deste texto foram confeccionadas pelo Prof. Leandro Nunes de Castro Silva quando ministrou a disciplina de IA707 na Unicamp em 2002. Tópico 3: Base Biológica e Notação Computacional 54