Ministério da Educação Universidade Tecnológica Federal do Paraná Pró-Reitoria de Pesquisa e Pós-Graduação. Relatório Final de Atividades

Documentos relacionados
Integração de dados biológicos para identificação de redes gênicas (GRNs) vinculado ao projeto Bioinformática e Reconhecimento de Padrões

A BIOINFORMÁTICA APLICADA NO MELHORAMENTO DE PLANTAS

Departamento de Genética Nilce M. Martinez Rossi

ORGANIZAÇÃO DO GENOMA HUMANO. Departamento de Genética. Nilce M. Martinez Rossi

P E R N AMBUCO UMA FERRAMENTA WEB PARA INFERÊNCIA DE HAPLÓTIPOS PROPOSTA DE TRABALHO DE GRADUAÇÃO

Ácidos nucleicos (DNA e RNA) e os genes

ANÁLISE DE TANDEM REPEATS CODIFICANTES EM GENOMAS BACTERIANOS

Anotação de genomas II

Banco de Dados Biológicos

Busca em banco de dados

Genética Molecular. Tema 1: Genética Molecular. Prof. Leandro Parussolo

MIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin

ÁCIDOS NUCLÉICOS 15/6/2010. Universidade Federal de Mato Grosso Disciplina de Bioquímica. - Desoxirribose, presente no DNA; - Ribose, presente no RNA.

Busca em banco de dados

DNA, Cromossomos e Replicação. Capítulos 5 e 6 (pág ) - Fundamentos da Biologia Celular - Alberts- 2ª edição

Número de genes versus número de proteínas em eucariotos

TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO DE GRADUAÇÃO

Biologia. Código Genético. Professor Enrico Blota.

Essas fitas de DNA, localizadas no núcleo das células, se esticadas medem cerca de 2 metros de comprimento.

1 Elab.: Prof. : Gilmar

Aparência. Lauri Watts Tradução: Lisiane Sztoltz

Bases de Dados. Freqüentemente usadas em. Bioinformática

EDITAL Nº 03/ PPg-BIOINFO-UFRN/2016

Integração com o Ambiente Virtual de Aprendizagem Moodle

Identificação de Padrões em Proteínas Utilizando a Ferramenta de Bioinformática CD- Search

BANCO DE DADOS BIOLÓGICOS Aula 11

Núcleo celular. Responsável pela transmissão da hereditariedade e centro de comando das atividades celulares. Carioteca

METODOLOGIA DE PROJETO ORIENTADO PARA A MANUFATURA INTEGRADA A UM SISTEMA DE PROJETO ASSISTIDO POR COMPUTADOR

Introdução a Biologia Molecular: DNA Nutrição

IMPORTÂNCIA DA GENÉTICA PARA ÁREA DA SAÚDE: Diagnóstico clínico: alteração no número ou estrutura dos cromossomos (síndrome de Down)

Máquinas de Turing para construção: Foram encontrados dois modelos que se destacaram em nossas pesquisas.

Software Para Geração de Consultas e Relatórios

Bioinformática e Genética Animal. Pâmela A. Alexandre Doutoranda

BIOLOGIA. Moléculas, células e tecidos. Transcrição e tradução Parte 1. Professor: Alex Santos

1 de 7 19/12/ :16

a) Baseando-se nos resultados acima, qual é a sequência mais provável desses 4 genes no cromossomo, a partir do gene A? b) Justifique sua resposta.

Curso: Integração Metabólica

IBM1029 Introdução à Bioinformática. O Início da Bioinformática 27/03/2017. Aula 2. O Início. Bioionformática: definição

Integração de dados na biologia sistêmica: um estudo de caso em Arabidopsis Thaliana

Sumário. Parte I: O DNA Contém A Informação Biológica

Programação Estruturada Aula - Introdução a Linguagem de Programação

Computação na Biologia Molecular e Bionanotecnologia: Computação Biológica

Detecção e Correção Automáticas de Olhos Vermelhos

DocuWare Forms Product Info. Gerenciamento eficiente de formulários. Benefícios/Vantagens

Transcrição é a primeira etapa da expressão do gene. Envolve a cópia da sequência de DNA de um gene para produzir uma molécula de RNA

- Sequenciamento de genomas nada mais é que a determinação da ordem linear dos nucleotídeos ou bases nitrogenadas de um genoma.

Equipe de Biologia. Biologia DIVISÃO CELULAR

O CMS JOOMLA! UM GUIA PARA INICIANTES

ÁCIDOS NUCLEICOS. Existem dois tipos de ácidos nucleicos: - Ácido desoxirribonucleico (DNA) - Ácido ribonucleico (RNA)

Programa Analítico de Disciplina BQI460 Bioinformática

Manual do Usuário do Integrador de Notícias de Governo

GERENCIAMENTO DE DADOS Exercícios

Bioinformática para o Citrus EST Project (CitEST)

Análise de dados provenientes de técnicas moleculares

Utilização do Fiery WebSpooler

Turma de terça-feira 14 hs. Total: 31 alunos

Programação de Computadores I Introdução PROFESSORA CINTIA CAETANO

MODELAGEM E ANÁLISE DE REDES DE REGULAÇÃO GÊNICA UTILIZANDO REDES BAYESIANAS. Marcos Vinícius Ferretti Walter José Horning Junior

Prof. Dr. Rodrigo Matheus Pereira. Faculdade de Ciências Biológicas e Ambentais FCBA-UFGD

Sociedade, Tecnologia e Ciência. DR1 - O Elemento, Graça Mendonça. Núcleo Gerador 7 DNA

GOIÂNIA, / / PROFESSOR: Fred. Antes de iniciar a lista de exercícios leia atentamente as seguintes orientações:

Universidade Federal de Mato Grosso do Sul Estruturas de Dados e Programação. Processamento de Cadeias

Desenvolvimento Web. Introdução Geral. Prof. Vicente Paulo de Camargo

Clique para editar o estilo do título mestre

Tutorial sobre o uso da ferramenta de autoria A Ferramenta de Autoria - Célula

Introdução a Computação em Nuvem

Introdução à Bioquímica Celular

Introdução à Informática

Cap. 6 Como as células lêem o genoma: do DNA à proteína

Introdução ao Reconhecimento de Padrões e aplicações em problemas de Bioinformática

I-Preproc: uma ferramenta para pré-processamento e indexação incremental de documentos

Disciplina de Biologia Celular. Profª Larissa dos Santos

DESVENDANDO O GENOMA HUMANO

Resumo - Coleta e Tratamento

Curso online de. Formação em Front-End. Plano de Estudo

Licenciatura em Biologia. Biologia Celular 2º Período

A atuação profissional do graduado em Biotecnologia.

UNIVERSIDADE ESTADUAL DO PARANÁ UNESPAR PRÓ-REITORIA DE ENSINO DE GRADUAÇÃO PROGRAMA INSTITUCIONAL DE BOLSA DE INICIAÇÃO À DOCÊNCIA - PIBID

VISUALIZAÇÃO DE DADOS MÉDICOS

Biologia Celular e Molecular:

Histórico da Genética:

2 Contexto Biológico Genômica

LISTA DE RECUPERAÇÃO I ÁCIDOS NUCLEICOS

Realidade Aumentada aplicada ao ensino da simetria molecular

Implementação de algoritmos para consultas de segmentos em janelas

SINACOR GUIA CONCILIADOR

Manual do Aplicativo de Configuração

LA VOUIVRE JOGO DA GLÓRIA

Marcadores Moleculares

Disciplina: Biologia

Estudos das ômicas: Genômica; Transcriptomica; Metagenômica. Aula 7

Bioinformática aplicada ao estudo e análise de Genes e Genomas Aula Teórico e Prá/ca

4 Análise de Dados. 4.1.Procedimentos

A Estrutura do DNA e o sistema de Dupla Hélice.

Ajax na Construção de uma Aplicação Web para Monitoramento de Ambientes. Marcus Vinícius Silva Gois Orientador: Paulo César Rodacki Gomes

Nesta disciplina aprenderemos. HTML CSS JavaScript Jquery PHP

INTRODUÇÃO. Prof. Msc. Luis Filipe Alves Pereira 2015

Assinale abaixo quais os processos que resultam na expressão das características individuais:

BIOLOGIA. Moléculas, células e tecidos. Núcleo interfásico e código genético. Professor: Alex Santos

Transcrição:

Ministério da Educação Universidade Tecnológica Federal do Paraná Pró-Reitoria de Pesquisa e Pós-Graduação Relatório Final de Atividades Integração de dados biológicos e redes gênicas: Um estudo de caso em Arabidopsis Thaliana vinculado ao projeto Integração de dados na biologia sistêmica: caracterização de fenômenos biológicos a partir de informações estruturais e funcionais Gabriel Rubino Bolsista Fundação Araucária Engenharia de Computação Data de ingresso no programa: 08/2012 Prof. Dr. Fabrício Martins Lopes Área do Conhecimento: 1.03.03.00-6 Metodologia e Técnicas da Computação CAMPUS CORNÉLIO PROCÓPIO, 2013

GABRIEL RUBINO FABRÍCIO MARTINS LOPES INTEGRAÇÃO DE DADOS BIOLÓGICOS E REDES GÊNICAS: UM ESTUDO DE CASO EM ARABIDOPSIS THALIANA Relatório Pesquisa do Programa de Iniciação Científica da Universidade Tecnológica Federal do Paraná com o orientador Prof. Dr. Fabrício Martins Lopes e aluno bolsista pela fundação Araucária Gabriel Rubino. CORNÉLIO PROCÓPIO, 2013

SUMÁRIO INTRODUÇÃO 4 METODOLOGIA 6 RESULTADOS E DISCUSSÕES 10 CONCLUSÕES 13 REFERÊNCIAS 14

INTRODUÇÃO A atual era genômica produz uma enorme quantidade de dados descritivos sobre os genes esses dados estão distribuídos em diversos bancos de dados como: KEGG, Kyoto Encyclopedia of Genes and Genomes[12], TAIR, The Arabidopsis Information Resourc[2], NCBI, National center for biotechnology information[6], os quais são públicos na internet. A maioria deles apresenta informações específicas ou parciais sobre as entidades biológicas, como por exemplo: via metabólica, organismo, módulo e localização. Assim surge a necessidade de integrar e interpretar esses dados disponíveis, visto que cada banco tem um tipo de informação diferente, assim se esses dados conhecidos sobre os genes forem centralizados, tornam o estudo do organismo mais eficiente. Um modo de organizar as informações de maneira visual é através de grafos ou redes de genes. O objetivos dessa rede é mostrar como os genes estão conectados de acordo com informações similares que podem ser coletadas em banco de dados. Nesse contexto este trabalho apresenta, um método de captura dos dados de genes de forma online de diversos bancos biológicos e após sua captura integra esses dados de forma padronizada, de modo a gerar uma rede de genes, que pode ser configurada em relação aos bancos pesquisados ou tipo de informação biológica. Este trabalho trata da integração de dados biológicos, para identificação dos relacionamentos entres os genes, com auxílio de processamento computacional (bioinformática), por isso é necessário o conhecimento de alguns conceitos das duas áreas, biologia e computação. Na biologia o DNA (ADN, em português: ácido desoxirribonucleico; ou DNA, do inglês: deoxyribonucleic acid) é um composto orgânico cujas moléculas contêm as instruções genéticas que coordenam o desenvolvimento e funcionamento de todos os seres vivos e alguns vírus. O DNA é responsável pela criação do RNA e de proteínas e é primordial para a divisão celular. O DNA é subdividido em porções menores chamados cromossomos. A estrutura da molécula de DNA foi descoberta conjuntamente pelo norte-americano James Watson e pelo britânico Francis Crick em 7 de Março de 1953, o que lhes valeu o Prêmio Nobel de Fisiologia/Medicina em 1962, juntamente com Maurice Wilkins[8]. Outra estrutura é o RNA (ARN, em português: ácido ribonucleico; ou RNA, do inglês: ribonucleic acid), responsável pela síntese de proteínas da célula e algumas outras funções. O RNA é um polímero de nucleotídeos, geralmente em cadeia simples, que pode, por vezes, ser dobrado. As moléculas formadas por RNA possuem dimensões muito inferiores às formadas por DNA. Para melhor organizar o estudo do DNA é usado o conceito de cromossomo onde uma longa sequência de DNA recebe nomes específicos. Nos eucariontes, os cromossomos encontramse no núcleo celular, agregado a proteínas estruturais chamada histona, já nos procariontes não existem histonas nem núcleo. O ser humano possui 23 pares de cromossomos sendo uma metade vinda da mãe e a outra do pai do indivíduo. Os cromossomos são subdivididos em genes que pela genética são considerados a unidade fundamental da hereditariedade, pois correspondem a um código distinto para produzir uma determinada proteína ou controlar uma característica, por exemplo, a cor dos olhos, altura, cor da pele. Para localizar os genes no cromossomo usa-se o locus que é o endereço de determinado gene. As informações dos genes podem ser encontradas em bancos de dados online, onde pesquisadores colocam suas descobertas para o público, mostrando onde o gene atua, qual proteína ele ajuda a produzir, em qual função está presente, localização celular, processo metabólico, via metabólica e localização no cromossomo. Os bancos de dados são apresentados de maneira online podendo ser acessados por um

navegador (em inglês browser) que é um programa de computador que interpreta principalmente instruções em HTML podendo ter auxílio de arquivos CSS [13](Cascading Style Sheets em inglês; ou em português folhas de estilo em cascata). O programa proposto nesse projeto utiliza algoritmos para interpretar os códigos HTML provenientes dos bancos de dados online, desse modo a busca é online e automática. Um algoritmo é uma sequência finita de instruções bem definidas para executar uma determinada tarefa, por exemplo uma receita culinária é um algoritmo. Os algoritmos podem repetir um conjunto de passos e também tomar decisões lógicas, os computadores foram feitos para executarem algoritmos mas os algoritmos frequentemente são processados por máquinas mecânicas ou pessoas. O conceito de um algoritmo foi formalizado em 1936 pela Máquina de Turing de Alan Turing[14] e pelo cálculo lambda de Alonzo Church[4], que formaram as primeiras fundações da ciência da computação. O problema da Maior Subsequência Comum (Longest Common Subsequence - LCS)[4] é um exemplo de algoritmo onde se deseja encontrar uma subsequência comum de comprimento máximo de duas sequências, ou seja duas sequências de caracteres são comparadas entre si com o objetivo de encontrar qual a porcentagem de igualdade entre as duas. Esse algoritmo foi usado nesse projeto para fazer a comparação de informações vindas do banco visto que um dado que representa a mesma coisa pode ser escrita de maneira muito semelhante. Conjuntos de algoritmos podem ser criados para facilitar a criação de um programa resolvendo determinados problemas ou tarefas, esses conjuntos são denominados bibliotecas (do inglês library). Um exemplo de biblioteca é a jsoup[3]que é usada para interpretação de códigos HTML, outro exemplo é a Prefuse[9], conjunto de ferramentas para a visualização de dados em vários formatos, sendo um deles grafos. Então com esses conceitos a cima descritos, é possível desenvolver esse trabalho desde a captura dos dados nos bancos com auxílio da biblioteca Jsoup[3], depois é feito seu processamento usando vários algoritmos sendo um deles o LCS [10] e por fim a visualização da rede através da biblioteca Prefuse [9].

Figura 1. Ilustração da dinâmica do programa METODOLOGIA Várias etapas são necessárias para a captura dos dados nos bancos até a visualização da rede, a primeira é a busca da informação desejada a partir de uma palavra chave. Depois de capturada a informação, visto que os bancos de dados não possuem um padrão para expor seus dados, é preciso padronizá-la, então é feito um processamento dos dados brutos. Após a padronização dos dados é possível começar a interpretá-los, e assim gerar uma rede dos genes, a Figura 2 representa o fluxo da informação do programa.

Figura 2. Fluxo da informação Para a busca nos bancos de dados o programa pode ter como entrada uma lista de locus de genes ou gene IDs que são usado como base para as buscas nos determinados bancos. Para a captura dos dados foi utilizada a biblioteca Jsoup[3], que interpreta os códigos HTML dos bancos de dados que contém todas as informações dos gene. Para cada banco é criado um algoritmo de interpretação do código HTML e as informações disponíveis são armazenadas. Para ocorrer a integração dos dados é feito um preprocessamento dos dados capturados sendo o primeiro deles a separação da informação caso um campo do HTML contenha mais de um dado específico, para isso foi usado o StringTokenizer[7] que separa palavra por palavra da informação vinda do banco. Depois de separadas, as palavras precisam ser verificadas de modo que não existam informações redundantes, levanto em conta também, possíveis erros de digitação dos autores, foi usado o algoritmo LCS[10] para essa tarefa, pois ele compara as palavras e retorna a porcentagem de igualdade entre elas, assim quando se compara todas as palavras pode se usar uma

porcentagem de corte (definida pelo usuário) para definir quais palavras são iguais, que devem ser excluídas, e diferentes, que são mantidas nas informações recuperadas. O LCS [10] também é parte fundamental para a criação da rede, pois para montar a rede é gerada uma tabela onde todas as informações de todos os genes são listadas, de modo a não haver nenhuma redundância. Após a geração dessa tabela cada informação recebe um índice único e esse índice é associada a cada informação dos genes, desse modo quando existem índices iguais entre dois genes uma ligação é feita. Após a tabela da rede estar pronta, ela é processada pela biblioteca Prefuse[9] que gera a rede de maneira visual, a Figura 3 ilustra esse processo.

1. Figura 3. Ilustração dos índices Nesse caso o gene 1 estará conectado com o gene 2, pois ambos possuem o índice

RESULTADOS E DISCUSSÕES Como resultado do projeto foi criado o programa Visual Ontogrator [11] que está representado na Figura 4. Figura 4. Tela Visual Ontogrator O programa é dividido em duas áreas principais, Visual Network e Gene Info. A parte Visual Network é responsável por mostrar a rede de genes, nessa área é possível gerenciar a posição dos genes e dos grupos de genes. A área Gene Info mostra todas as informações capturadas do gene solicitado. Para gerar a rede é preciso configurar o filtro LCS[10] para cada informação capturada, essa configuração pode ser feita na janela Set Filters além do filtro é preciso indicar quais informações irão fazer parte da rede, para isso é necessário acessar a janela Select Itens, para cada item selecionado é gerada uma cor a qual será a representação na visualização da rede. Para a demonstração do programa foi usada uma lista contendo cinco genes sendo eles com os respectivos locus: AT1G05055, AT5G41370, AT2G36530, AT4G34200, AT5G54770. O programa foi configurado para pesquisar em três base de dados sendo elas, NCBI, TAIR e KEGG e com o algoritmo LCS julgando igualdades com 100% de similaridade. A seguir segue a tabela com alguns dos dados integrados e já preprocessados.

Tabela 1. Informações capturadas e preprocessadas Lista de Locus Via metabólica Organismo Modulo Localização AT1G05055 ath03420 ath03022 Arabidopsis thaliana ath_m00290 chromosome: 1 AT5G41370 ath03420 ath03022 Arabidopsis thaliana ath_m00290 chromosome: 5 ath03018 AT2G36530 ath01230 ath_m00003 ath01200 Arabidopsis thaliana ath_m00002 ath01110 ath_m00001 ath01100 chromosome: 2 ath00010 ath01230 AT4G34200 ath01200 ath01100 Arabidopsis thaliana ath_m00020 chromosome: 4 ath00260 AT5G54770 - Arabidopsis thaliana - chromosome: 5 Para interpretar os dados de maneira mais eficaz o programa gerou as redes desses genes com base em uma ou mais informações biológicas. Seguem algumas redes divididas por informações biológicas. Rede da via metabólica: Figura 5. Rede da via metabólica Todos os genes dentro da área em vermelho da Figura 5 contém informação sobre a via metabólica, e todos os genes conectados possuem uma ou mais informações iguais, segundo o algoritmo LCS com nota de corte com 100% de igualdade.

Rede do Organismo: Figura 6. Rede do organismo Todos os genes dentro da área em vermelho da Figura 6 contém informação sobre o organismo, e todos os genes conectados possuem uma ou mais informações iguais, segundo o algoritmo LCS com nota de corte com 100% de igualdade. Nesse caso como todos os genes são do mesmo organismo todos os genes estão conectados entre si. Rede do Módulo: Figura 7. Rede do módulo Todos os genes dentro da área em vermelho da Figura 7 contém informação sobre o módulo, e todos os genes conectados possuem uma ou mais informações iguais, segundo o algoritmo LCS com nota de corte com 100% de igualdade.

Rede da Localização: Figura 8. Rede da localização Todos os genes dentro da área em vermelho da Figura 8 contém informação sobre a localização, e todos os genes conectados possuem uma ou mais informações iguais, segundo o algoritmo LCS com nota de corte com 100% de igualdade. Rede da Localização e via metabólica: Figura 9. Rede da localização e da via metabólica Todos os genes dentro da área em vermelho da Figura 9 contém informação sobre a localização (visto que a parte em vermelho também está em baixo da região em alaranjado) e na área em alaranjado os genes possuem informações sobre a via metabólica. Desse modo é simples verificar quais genes possuem quais tipos de informação e qual é a interação que possuem. CONCLUSÕES O programa mostrou ser eficaz na captura dos dados e por ser automático elimina a necessidade de buscas manuais nos bancos públicos, tornando a captura dos dados mais rápida e os dados recuperados estão sempre atualizados de acordo com o banco original, atentando que conexões mais rápidas podem acelerar o processo. A padronização dos dados dos diferentes bancos funcionou bem e também é feita automaticamente e assim o programa conseguiu comparar as informações e julgar sua igualdade conectando genes. Além disso todas as informações capturadas podem ser salvas em tabelas, facilitando a integração com outros sistemas. As redes possuem áreas coloridas usadas para identificar que tipo de informação biológica

cada comunidade de genes tem, isso facilitou a interpretação comparado com a análise em tabelas. Uma das principais características desse projeto é a captura de dados online, portanto a criação de um sistema web seria de grande valia devido ao fato da conexão com a internet ser algo crucial para seu funcionamento. Os dados gerados podem ser utilizados para melhorar a precisão de outros sistemas então uma possibilidade de trabalho futuro é a integração dessa ferramenta ao projeto DimReduction[5], e a utilização das informações biológicas indexadas como auxílio na inferência das redes passariam a serem inferidas a partir dos perfis de expressão e das informações biológicas conhecidas[1]. Como resultado deste trabalho foi desenvolvido o software VisualOntogrator, o qual está livremente disponível no site https://code.google.com/p/visual-ontogrator/[11]. REFERÊNCIAS [1] F.F. da Rocha Vicente, F.M. Lopes, and R.F. Hashimoto. Improvement of gns inference through biological data integration. In Genomic Signal Processing and Statistics (GEN- SIPS), 2011 IEEE International Workshop on, pages 70 73, dec. 2011. [2] Carnegie Institution for Science Department of Plant Biology. Tair: The arabidopsis information resource. Disponível em: <http://www.arabidopsis.org/>. Acesso em: 6 abr. 2012, 15:36:24. [3] Jsoup. Java html parser. Disponível em: jsoup.org/? Acesso em: 25 out. 2013. [4] Achim Jung. A short introduction to the lambda calculus. Disponível em: http://www.cs.bham.ac.uk/ axj/pub/papers/lambda-calculus.pdf. Acesso em: 5 out. 2012. [5] Fabricio Lopes, David Martins, and Roberto Cesar. Feature selection environment for genomic applications. BMC Bioinformatics, 9(1):451, 2008. [6] U.S. National Library of Medicine National Center for Biotechnology Information. Ncbi: National center for biotechnology information. Disponível em: http://www.ncbi.nlm.nih.gov/. Acesso em: 7 abr. 2012. [7] Oracle. String tokenizer. Disponível em: http://docs.oracle.com. Acesso em: 9 abr. 2012, 19:31:22. [8] Nobel Prize ORG. Nobel prize. Disponível em: http://www.nobelprize.org/nobel_prizes/medicine/laureates/1962/crick-bio.html. Acesso em: 3 set. 2012, 12:31:22. [9] Prefuse.org. Prefuse. Disponível em: http://prefuse.org/. Acesso em: 4 out. 2012, 13:31:22. [10] Thomas H. Cormen Ű Charles E. Leiserson Ű Ronald L. Rivest. Algoritmos: Teoria e Prática. Elsevier. [11] Gabriel RUBINO. Visual ontogrator. Disponível em: https://code.google.com/p/visualontogrator/. Acesso em: 14 set. 2012. [12] Kyoto University and the University of Tokyo. Kegg: Kyoto encyclopedia of genes and genomes. Disponível em: http://www.genome.jp/kegg/. Acesso em: 6 set. 2012. [13] W3C. Cascading style sheets software. Disponível em: http://www.genome.jp/kegg/. Acesso em: 25 out 2103.

[14] Kevin WAYNE. Turing machines. Disponível em: http://introcs.cs.princeton.edu/java/74turing/. Acesso em: 9 abr. 2012. Gabriel Rubino Fabrício Martins Lopes