Análise da Associação entre MicroRNAs e Doenças Utilizando Aprendizado de Máquina



Documentos relacionados
MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

Orientação a Objetos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

Especificação do 3º Trabalho

Localização dos inquéritos de rua para Arroios e Gulbenkian

Premiação por Produtividade

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Preparando sua empresa para o forecasting:

MANUAL DE UTILIZAÇÃO SISTEMA DE CADASTRO INTRANET

Tabela de Símbolos. Análise Semântica A Tabela de Símbolos. Principais Operações. Estrutura da Tabela de Símbolos. Declarações 11/6/2008

O DNA é formado por pedaços capazes de serem convertidos em algumas características. Esses pedaços são

Microsoft Access XP Módulo Um

ADM041 / EPR806 Sistemas de Informação

Capítulo 11. Conceitos de Orientação a Objetos. Rui Rossi dos Santos Programação de Computadores em Java Editora NovaTerra

Aula 09 - Atualização de uma tabela dinâmica. Aula 09 - Atualização de uma tabela dinâmica. Sumário. Atualizando a tabela dinâmica

Entendendo como funciona o NAT


Análise de Dados do Financeiro

A Grande Importância da Mineração de Dados nas Organizações

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD

GARANTIA DA QUALIDADE DE SOFTWARE

TOTVS BA Guia de Customização Linha Logix

Projeto Genoma e Proteoma

4 Segmentação Algoritmo proposto

PAPERPET. Caio Mayrink Maio/2011

AULA 1 Iniciando o uso do TerraView

7.Conclusão e Trabalhos Futuros

Manual do usuário. v1.0

MANUAL DO UTILIZADOR

Como gerar arquivos para Sphinx Operador

Resposta Imune contra o Câncer

Uso de Scanalyzer com embriões de Danio rerio

A função básica do ciclo celular das células somáticas é duplicar todo o conteúdo de DNA...

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

Manual do Atendente. Treinamento OTRS Help Desk

Versão Melhorias Melhorias Versão 6.0.1

> ESTUDO DO RNA. (C) O ácido nucléico I é DNA e o II, RNA. (D) O ácido nucléico I é RNA e o II, DNA. (E) I é exclusivo dos seres procariontes.

Instruções gerais para o preenchimento do formulário

Fluxo de trabalho do Capture Pro Software: Indexação de OCR e separação de documentos de código de correção

O método de Monte Carlo: algumas aplicações na Escola Básica

Tutorial Módulo Frequência

MEDICINA VETERINÁRIA. Disciplina: Genética Animal. Prof a.: D rd. Mariana de F. Gardingo Diniz

FACULDADE DE ENGENHARIA DE COMPUTAÇÃO. PROJETO FINAL I e II PLANO DE TRABALHO <NOME DO TRABALHO> <Nome do Aluno> <Nome do Orientador>

STUDY ABOUT INFLUENCE ON ACADEMIC PERFORMANCE OF STUDENTS USERS OF SOCIAL NETWORKS

Resenha. Fernanda Gabriela Gadelha ROMERO 1

MÓDULO III AULA 2: CONTROLE DA EXPRESSÃO GÊNICA EM EUCARIOTOS

Síntese das discussões do fórum Livro-APF: Julho/2010

EDUCAÇÃO NÃO-FORMAL PARA ALUNOS DO ENSINO MÉDIO: MODELO DIDÁTICO PARA COMPREENSÃO DO TESTE DE VÍNCULO GENÉTICO

BIOTECNOLOGIA E ENGENHARIA GENÉTICA. Profa. Maria Paula

Introdução a Java. Hélder Nunes

Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler

Pesquisa com Professores de Escolas e com Alunos da Graduação em Matemática

Manual Operacional SIGA

Está apto a utilizar o sistema, o usuário que tenha conhecimentos básicos de informática e navegação na internet.

Bem-vindo ao tópico sobre administração de listas de preços.

Receber intimações: poderão receber intimações em processos eletrônicos nos quais estejam vinculados.

Implantação do Padrão TISS

Manual do sistema SMARsa Web

Este trabalho tem como objetivo praticar o uso de tipos abstratos de dados e estruturas do tipo Lista.

COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS

Novell. Novell Teaming 1.0. novdocx (pt-br) 6 April 2007 EXPLORAR O PORTLET BEM-VINDO DESCUBRA SEU CAMINHO USANDO O NOVELL TEAMING NAVIGATOR

4 Implementação e Resultados Experimentais

Fontes de Informação Bibliométricas para a gestão de revistas Científicas

PROGRAMANDO EM C# ORIENTADO A OBJETOS

SERVICE DESK MANAGER SDM. Manual do Sistema - DPOI

Orientação a Objetos

5 Exemplo de aplicação

UTILIZANDO O SOFTWARE WEKA

4 Avaliação Econômica

Feature-Driven Development

Alimentos de Soja - Uma Fonte de Proteína de Alta Qualidade

ÍNDICE 1 INTRODUÇÃO ACESSO ABERTURA DE PROTOCOLO CONSULTA DE PROTOCOLO PROTOCOLO PENDENTE CONFIRMAÇÃO DE RECEBIMENTO.

BH PARK Software de Estacionamento

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

GESTOR ONLINE Gestor Online Principais Recursos:

Sistemas de Gestão Ambiental O QUE MUDOU COM A NOVA ISO 14001:2004

Manual UNICURITIBA VIRTUAL para Professores

PROCEDIMENTOS DE AUDITORIA INTERNA

PLATAFORMA INFORMÁTICA DE REQUISIÇÃO DE POLICIAMENTO DE ESPETÁCULOS DESPORTIVOS (PIRPED)

Serviço Público Federal Universidade Federal do Pará - UFPA Centro de Tecnologia da Informação e Comunicação - CTIC S I E

Manual SAGe Versão 1.2 (a partir da versão )

Clip-art Retrieval using Sketches PTDC/EIA-EIA/108077/2008

1 DEFERIDO 1 INDEFERIDO São Luís, 29 de fevereiro de 2008

ORIENTAÇÕES PARA PREENCHER

Um Estudo Sobre a Chance de Repetição de Sorteios na Mega-Sena

Tarefa Orientada 12 Junção Externa, Auto-Junção e União

42º Congresso Bras. de Medicina Veterinária e 1º Congresso Sul-Brasileiro da ANCLIVEPA - 31/10 a 02/11 de Curitiba - PR

Estudo da Perfusão e Ventilação Pulmonar em Imagens de Tomografia de Impedância Elétrica através de Modelagem Fuzzy

Relatório Gerencial. Coordenação de Tecnologia da Informação e Comunicação FUNDEPAG 17/01/2013

Guia Site Empresarial

Guia rápido para buscas de literatura científica na Internet. Raphael Augusto Teixeira de Aguiar

Nome do Processo: Entrada de Pedidos com múltiplos endereços de entrega com NF-e Diferente

Semelhança e Congruência de Triângulos

Cadernos do CNLF, Vol. XVI, Nº 04, t. 3, pág. 2451

EXEMPLO DE COMO FAZER UMA MALA DIRETA

Prof. Raul Sidnei Wazlawick UFSC-CTC-INE. Fonte: Análise e Projeto de Sistemas de Informação Orientados a Objetos, 2ª Edição, Elsevier, 2010.

Transcrição:

Análise da Associação entre MicroRNAs e Doenças Utilizando Aprendizado de Máquina Mariana Y. Sasazaki 1, André C. P. L. F. de Carvalho 2 e Joaquim C. Felipe 1 1 Departamento de Computação e Matemática, FFCLRP, Universidade de São Paulo (USP), Ribeirão Preto, Brasil 2 Departamento de Ciências da Computação, ICMC, Universidade de São Paulo (USP), São Carlos, Brasil Resumo: MicroRNAs (mirnas) constituem uma classe de pequenos RNAs não-codantes, com aproximadamente 20 a 25 nucleotídeos. São moléculas conservadas ao longo da evolução, capazes de regular a expressão gênica por meio da degradação ou repressão da tradução de moléculas-alvo de RNA mensageiro. A expressão dos mirnas se apresenta desregulada em diversos processos patológicos, incluindo o câncer. Para melhor compreender a funcionalidade desta classe de RNAs e a sua influência em diversas doenças humanas, neste artigo foi feito um estudo sobre a correlação entre a expressão de mirnas e a associação mirna-doenças utilizando técnicas de agrupamento de dados. Para isso foram utilizados dados do HMDD (Human MicroRNA Disease DataBase) juntamente com dados de expressão de 224 mirnas em diferentes tecidos humanos. Os resultados experimentais obtidos sugerem que mirnas bastante expressos em tecidos específicos são, geralmente, relacionados a doenças que atingem estes mesmos tecidos. Palavras-chave: MicroRNAs, Agrupamento, Aprendizado de Máquina, WEKA. Abstract: MicroRNAs (mirnas) constitute a class of small non-coding RNAs with approximately 20-25 nucleotides. These are conserved molecules capable of regulating gene expression through cleavage or translation inhibition of target mrna. The expression of mirnas appears unregulated in several pathological processes, including cancer. In order to better understand the functionality of this class of RNAs and their influence in human diseases, this article presents a study about the correlation between mirnas expression and mirna associated diseases using clustering techniques. For such, we used the HMDD database (Human MicroRNA Disease Database) and the expression data from 224 mirnas in different human tissues. The experimental results suggest that mirnas very expressed in specific tissues are generally related to diseases affecting these same tissues. Keywords: MicroRNA, Clustering, Machine Learning, WEKA. Introdução MicroRNAs (mirnas) constituem uma classe de pequenos RNAs não-codantes, com aproximadamente 20 a 25 nucleotídeos de comprimento, encontrados em diversos organismos, como animais, plantas, vírus, etc. São moléculas conservadas ao longo da evolução, que atuam como silenciadores pós-transcricionais, sendo por isso capazes de regular a expressão gênica através da degradação ou repressão da tradução de moléculas-alvo de RNA mensageiro 1,2. Há evidências crescentes que revelaram que os mirnas desempenham papel crítico em muitos processos biológicos importantes, tais como: crescimento celular, diferenciação dos tecidos, proliferação celular, desenvolvimento embrionário e apoptose. A mutação, a desregulação e a disfunção da biogênese dos mirnas podem resultar em várias doenças, dentre as quais, o câncer 3. Dependendo do tipo celular e da forma em que é expresso, um mesmo mirna pode exibir atividade oncogênica ou supressora tumoral. Os mirnas oncogênicos encontram-se superexpressos em tumores malignos e atuam estimulando a proliferação celular e inibindo a ação de genes supressores tumorais e genes que controlam a apoptose. Por outro lado, alguns mirnas apresentam expressão reduzida em tumores 1

malignos, sendo considerados supressores tumorais. Estes mirnas atuam contra o desenvolvimento de neoplasias por meio da inibição de oncogenes 4,5,6. Embora as atuais associações mirnas-doenças ainda estejam longe de serem completas, com o intuito de auxiliar no estudo das mesmas e oferecer uma plataforma para dissecar os padrões dos mirnas na doenças, Lu e seus colaboradores 7,8 realizaram uma análise em larga escala dessas associações entre os mirnas e as doenças humanas, as quais foram manualmente coletadas a partir de consultas a publicações científicas. Eles construíram um banco de dados de doenças humanas relacionadas a mirnas (em inglês, Human MicroRNA Disease Database - HMDD), que contém nomes dos mirnas, nomes das doenças, evidências de disfunções e número de identificação PubMed das referências bibliográficas. Os perfis de expressão de mirnas também oferecem pistas valiosas sobre suas propriedades, tais como especificidade de tecido e expressão diferencial em células cancerosas e células normais. Uma forma de analisar esses perfis de expressão dos mirnas em tecidos humanos é a Reação em Cadeia da Polimerase (em inglês, Polymerase Chain Reaction PCR), uma técnica robusta e amplamente utilizada para investigar a expressão gênica. Assim, em um estudo realizado por Hsu e seus colaboradores 9, foi detectado o nível de expressão de 224 mirnas humanos em 18 principais tecidos normais de humanos usando quantitative real-time PCR (qpcr) para determinar a especificidade de tecidos dos mirnas humanos. Neste trabalho, com o intuito de oferecer uma melhor compreensão da funcionalidade dos mirnas e ajudar a elucidar os padrões de expressão e das associações mirnas-doenças, foi investigada a correlação entre o perfil de expressão dos mirnas e as associações dos mesmos com as diversas doenças humanas utilizando Aprendizado de Máquina (AM) por meio de algoritmos de agrupamento de dados (clustering). Materiais e Métodos Para a realização deste trabalho, foram utilizados os dados de expressão de mirnas obtidos por Hsu e seus colaboradores 9 e o banco de dados HMDD 7,8 citados na seção anterior. Os dados foram processados utilizando a ferramenta WEKA (Waikato Environment for Knowledge Analysis) 10, uma ferramenta de Mineração de Dados escrita em linguagem JAVA que contém uma coleção de algoritmos de AM. A fim de investigar a correlação entre os perfis de expressão dos mirnas e as doenças às quais os mesmos são associados de forma mais específica, ambos os dados foram filtrados. Nos dados de expressão de mirnas, foram removidos aqueles valores pertencentes aos tecidos que não possuem nenhum registro de alguma doença específica para o mesmo tecido no HMDD. Por exemplo, nos registros do HMDD não há doenças relacionadas aos tecidos adiposo, da placenta e do timo. Portanto, eles foram removidos dos dados originais. Assim, dos 18 diferentes tecidos nos quais foram analisados a expressão dos mirnas, restaram apenas 12: bexiga, cérebro, coração, fígado, intestino, músculos, ovários, próstata, pulmão, rim, testículos e tireoide. Analogamente, no HMDD foram consideradas apenas as doenças que afetam especificamente e/ou diretamente um dos os 12 tecidos que restaram. Assim, doenças que não especificam o tipo de tecido afetado, como neoplasia, foram desconsideradas, enquanto que aquelas que especificam o tecido afetado foram consideradas, como neoplasia pulmonar. Além disso, doenças que afetam tecidos diferentes dos 12 remanescentes, como neoplasia uterina e neoplasia de mama, também foram eliminadas. Após a aplicação desses filtros, os valores de expressão dos 224 mirnas nos 12 diferentes tecidos foram normalizados e foi gerado um arquivo no formato ARFF, utilizado pela ferramenta WEKA, no qual cada atributo correspondia aos valores de expressão dos mirnas em determinado tecido humano. Este arquivo foi então utilizado como dado de entrada para 2

os experimentos utilizando a ferramenta WEKA. Dessa forma, os 224 mirnas presentes nos dados de expressão de mirnas foram agrupados pelo algoritmo Simple K Means. Utilizando como parâmetro a função de distância Euclidiana, o algoritmo foi executado várias vezes, variando o valor de k (número de clusters) de 2 até 10, resultando em 9 diferentes conjuntos de clusters (conjunto K1 com k=1, conjunto K2 com k=2, e assim sucessivamente). Cada cluster de cada um destes conjuntos obtidos foi analisado verificando se havia uma estabilidade em relação aos mirnas pertencentes ao mesmo. Também foram realizados testes alterando o valor padrão do parâmetro semente (seed), que não mostrou diferenças relevantes nos resultados. Posteriormente, cada cluster de cada um dos 9 conjuntos de clusters gerados foi novamente analisado, avaliando-se seus membros e correlacionando-os com suas doenças associadas presentes no HMDD. Para isso, foi criado um script em linguagem Java que fizesse essa correlação de forma automática, tendo como dado de entrada o novo arquivo ARFF gerado pelo WEKA, semelhante ao arquivo original, porém com mais um atributo representando o id do cluster ao qual cada instância (mirna) pertence. Este script busca no banco de dados HMDD já filtrado todas as doenças associadas a cada mirna de um determinado cluster. Essas listas de doenças são então comparadas para verificar a existência de algum padrão entre os mirnas de um mesmo cluster. Uma análise mais detalhada dessa correlação será mostrada na próxima seção. Resultados Como descrito na seção anterior, 9 conjuntos de clusters foram gerados (k variando de 2 a 10). A Tabela 1 apresenta o resultado parcial desses agrupamentos para alguns mirnas. Os números mostrados no corpo da tabela representam o rótulo do cluster (cluster 0, 1, 2,...) no qual cada mirna foi alocado para os diferentes valores de k. Posteriormente, os membros dos clusteres gerados pela última variação do algoritmo, k=10, foram analisados por meio do script citado na seção anterior, a fim de correlacioná-los com suas doenças associadas presentes no HMDD. Aqui serão detalhados somente quatro dos dez clusters gerados, pois dois clusters são formados por apenas um mirna, outros três por apenas dois ou três mirnas e um cluster contém os mirnas restantes. Esses quatro últimos clusters citados demonstraram baixo nível de padronização dos mirnas membros em relação as doenças relacionadas. A Tabela2 apresenta a análise realizada sobre os quatro clusters (cluster0, cluster1, cluster2, cluster3), com a porcentagem dos membros de cada cluster que estão associados a doenças que afetam especificamente os tecidos em que esses mirnas se encontram mais expressos. Quantificando esses resultados, temos, por exemplo, que todos os membros do cluster0 (100%) estão relacionados com doenças especificas do pulmão, 86% dos membros já possuem relatado na litetaruta associação com doenças no ovário e 71% com doenças que afetam o rim. 3

Tabela 1: Parte dos clusters gerados pelo WEKA com o algoritmo Simple K Means variando o número de clusters (k) entre 2 e 10 Simple K Means variando K de 2 até 10 ID mirna K2 K3 K4 K5 K6 K7 K8 K9 K10 0 hsa-let-7a 0 0 0 0 0 0 0 0 0 1 hsa-let-7b 0 0 0 0 0 0 0 0 0 2 hsa-let-7c 0 0 0 0 0 0 0 0 0 27 hsa-mir-26a 0 0 0 0 0 0 0 0 0 38 hsa-mir-30b 0 0 0 0 0 0 0 0 0 39 hsa-mir-30c 0 0 0 0 0 0 0 0 0 64 hsa-mir-125b 0 0 0 0 0 0 0 0 0 14 hsa-mir-16 0 1 1 1 1 1 1 1 1 84 hsa-mir-145 0 1 1 1 1 1 1 1 1 3 hsa-let-7d 1 1 1 1 1 1 1 1 1 20 hsa-mir-19b 1 1 1 1 1 1 1 1 1 28 hsa-mir-26b 1 1 1 2 2 2 2 2 2 48 hsa-mir-92 1 1 1 1 1 1 1 1 1 63 hsa-mir-125a 1 1 1 2 2 2 2 2 2 65 hsa-mir-126 1 1 1 2 2 2 2 2 2 83 hsa-mir-143 1 1 1 1 1 1 1 1 1 90 hsa-mir-150 1 1 1 1 1 1 1 1 1 234 hsa-mir-638 1 1 1 1 1 1 1 1 1................................. Tabela 2. Análise dos quatro clusters. Os campos preenchidos com - representam os tecidos humanos que não tiveram alta expressão dos mirnas pertencentes aos respectivos clusters. Cluster Órgão Cluster0 Cluster1 Cluster2 Cluster3 Coração - - 77% - Intestino - 88% - - Músculo - 75% 62% - Ovário 86% 75% - 72% Pulmão 100% 88% - 72% Rim 71% - - - Discussão Após a geração dos 9 diferentes conjuntos de clusters, a análise de cada cluster individual mostrou que, mesmo com a variação da sua quantidade sendo alterada, permitindo a criação de novos clusters, a maioria dos mirnas se mantiveram em um mesmo cluster. Por exemplo, os mirnas hsa-let-7a, hsa-let-7b, hsa-let-7c, hsa-mir-26a, hsa-mir-30b e hsa-mir-125b foram membros de um mesmo cluster (cluster0) desde a segunda (K2) até a última variação 4

(K9) do algoritmo, como mostra a Tabela 1, em vermelho. Notou-se também que, grupos com uma maior quantidade de membros foram sendo repartidos em grupos menores a cada variação, como o grupo representado pela cor azul (cluster1) na Tabela 1, que na primeira variação (K2) continha 215 mirnas, na segunda (K3) e terceira (K4) continha 11 mirnas mostrados, enquanto que a partir da quarta execução (K5 a K9) continha somente 8 mirnas, já que os mirnas hsa-mir-26b, hsa-mir-125a e hsa-mir-126 passaram a pertencer a um novo cluster (cluster2). Analisando a Tabela 2, é possível perceber que cada cluster era representado por mirnas que apresentavam maior nível de expressão em determinado grupo de tecidos humanos. Por exemplo, no cluster0, representado pela cor vermelha na Tabela 1, todos seus membros relataram alto nível de expressão em tecidos de ovário, pulmão e rim, enquanto que no cluster1, seus mirnas apresentaram elevada expressão em tecidos de intestino, músculo, ovário e pulmão. Por meio da correlação desses resultados do cluster0 com as associações doenças-mirnas já relatadas em literaturas no HMDD, foi possível observar que esses mirnas também estão relacionados com doenças que afetam especificamente e/ou diretamente ovário, pulmão e rim. Entretanto, há algumas exceções, como, por exemplo: membros do cluster0, também revelaram considerável nível de expressão em tecidos de próstata. Porém ou nenhuma ou muito poucas associações destes mirnas com doenças que afetam este mesmo órgão foram encontradas no HMDD. Conclusão Estudos mostram que o potencial da expressão de mirnas para informar o diagnóstico de câncer ainda não foi sistematicamente explorado 11. Este trabalho procura avançar nesse tema, com o objetivo de melhor compreender a funcionalidade desta classe de RNAs não-codantes e sua associação com as doenças humanas. Para isso, foi feito um estudo sobre a correlação entre a expressão de mirnas e a associação mirna-doenças utilizando técnicas de agrupamento de dados. Foram utilizados dados do HMDD (Human MicroRNA Disease DataBase) juntamente com dados de expressão de 224 mirnas em diferentes tecidos humanos. Após filtrados, estes dados foram processados e agrupados pelo algoritmo Simple K Means, por meio da ferramenta WEKA. Os resultados obtidos por meio da investigação da correlação entre a expressão dos mirnas em diferentes tecidos humanos e a associação mirnas-doenças indicam que mirnas bastante expressos em tecido específicos são geralmente relacionados a doenças que atingem estes mesmos tecidos, o que corrobora com resultados de estudos e pesquisas já realizados 7,12,13,14. Já nos casos em que não foram encontradas doenças tecido-específicas associadas aos mirnas que revelaram alto nível de expressão a esse mesmo tecido, não podemos afirmar que não existe similaridade nenhuma entre esses membros. Isso se deve ao fato de que apesar dos mirnas altamente expressos em tecidos específicos terem um grande potencial para serem relacionados com doença tecido-específicas, a maioria dos mirnas tecido-específicos ainda não foram relatados/descobertos como relacionados a estas doenças na literatura 7. Uma alternativa para abranger melhor esses casos seria investigar, como trabalhos futuros, novamente a correlação entre a expressão de mirnas e as doenças com as quais estão associados, entretanto, com novas relações mirnas-doenças que foram coletadas em publicações mais recentes, posteriores à última atualização do banco de dados HMDD. Outra possibilidade seria investigar essa correlação com dados de expressão de mirnas em tecidos cancerosos. Dessa vez, com o auxílio de um especialista da área de Biologia/Medicina para analisar e avaliar os resultados obtidos. 5

Referências [1] Ambros, V. (2004). The functions of animal micrornas. Nature 431, 350 355 [2] Filipowicz,W., Bhattacharyya, S. N., and Sonenberg, N. (2008). Mechanisms of posttranscriptional regulation by micrornas: are the answers in sight? Nat. Rev. Genet. 9, 102 114. [3]Esquela-Kerscher A, Slack FJ (2006). Oncomirs - micrornas with a role in cancer. Nat Rev Cancer 6: 259 269. [4] Cowland JB, Hother C, Grønbæk K. MicroRNAs and cancer. APMIS, 2007; 115: 1090-1106 [5] Gartel AL, Kandel ES. mirnas: Little known mediators of oncogenesis. Semin Cancer Biol, 2008; 18: 103-110. [6] Zhang B, Pan X, Cobb GP, Anderson TA. MicroRNAs as oncogenes and tumor suppressors. Dev Biol, 2007; 302: 1-12. [7] Lu M, Zhang Q, Deng M, Miao J, Guo Y, et al. (2008) An Analysis of Human MicroRNA and Disease Associations. PLoS ONE 3(10): e3420. doi:10.1371/journal.pone.0003420 [8] http://202.38.126.151/hmdd/mirna/md/. Último acesso em 21/jun/2012. [9] Hsu SD, Chu CH, Tsou AP, Chen SJ, Chen HC, Hsu PW, Wong YH, Chen YH, Chen GH, Huang HD (2008) 'mirnamap 2.0: genomic maps of micrornas in metazoan genomes.' Nucleic Acids Res. 2008 [10] http://www.cs.waikato.ac.nz/ml/weka/. Último acesso em 21/jun/2012. [11] Lu,J., Getz,G., Miska,E.A., Alvarez-Saavedra,E., Lamb,J., Peck,D., Sweet-Cordero,A., Ebert,B.L., Mark,R.H. et al. (2005) MicroRNA expression profiles classify human cancers. Nature, 435, 834 838. [12] Goh KI, Cusick ME, Valle D, Childs B, Vidal M, et al. (2007) The human disease network. Proc Natl Acad Sci U S A 104: 8685 8690. [13] Care A, Catalucci D, Felicetti F, Bonci D, Addario A, et al. (2007) MicroRNA- 133 controls cardiac hypertrophy. Nat Med 13: 613 618. [14] Yang B, Lin H, Xiao J, Lu Y, Luo X, et al. (2007) The muscle-specific microrna mir- 1 regulates cardiac arrhythmogenic potential by targeting GJA1 and KCNJ2. Nat Med 13: 486 491. Contato Mariana Yuri Sasazaki E-mail: ma.sasazaki@gmail.com Departamento de Computação e Matemática (DCM) Universidade de São Paulo Av. Bandeirantes, 3900 Monte Alegre Ribeirão Preto SP CEP: 14040-900 Fone (16) 3602-3525 6