Data Mining e Análise de Proteínas de Venenos Wanessa Cabral 1,Thais Johnson Pereira 1, Geisa Adriana Rodrigues 1, Silvana Giuliatti 1, Milton Faria Junior 1, Clóvis Quintale Junior 1 1 Universidade de Ribeirão Preto BIOINFORMÁTICA, Brasil Resumo - O veneno é a maior arma de defesa dos animais, com a função de paralisar ou de matar instantaneamente a presa para sua alimentação. Nas ultimas décadas, pesquisadores começaram a estudar mais detalhadamente a química dos venenos, sua composição, reações no corpo humano e semelhanças das estruturas protéicas de veneno com estruturas protéicas humanas. Estes estudos têm demonstrado que várias proteínas podem ser usadas na produção de fármacos. Algumas experiências têm comprovado que venenos de alguns animais peçonhentos podem salvar vidas, contradizendo o conceito de veneno conhecido até então. Atualmente, estes venenos são utilizados no combate contra o câncer, problemas cardíacos, circulatório, entre outros. Portanto, o estudo do genoma de venenos através da bioinformática é de grande importância na biotecnologia. O objetivo deste projeto é a criação de banco de dados de proteína de venenos de vários organismos e o desenvolvimento de um sistema de análise que permita identificar domínios nas seqüências FASTAs. Atualmente, aproximadamente um total de 3704 seqüências, composto por venenos de escorpião, rã, cobras, encontra-se em nosso banco. O grupo de domínios já foi finalizado, e a analise de filogenia já apresenta resultados. Palavras Chaves: genoma, banco de dados, venenos Abstract The venom is the most important defence weapon, paralysing or even instantly killing for food. In the lasts decades, researches have been studying the chemistry, composition, it s effects and the similarity between venom and human s protein structures. These searches are showing that many proteins can be used on pharmacological industry. Some experiments proved that many venomous animals venom, such as snake, frog, and others could save lives, contradicting venom s concept known up to now. Nowadays, these venomous have been used on combat of cancer, heart and circulation diseases, and others medical problems. Therefore, through the discoveries of venom s protein, the Genome will facilitate the combat of many diseases. Thus, the study of genome using Bioinformatic is a very important instrument for biotechnology. The main goal of this work is to develop a Data Base witch containing organism s venom s protein, and develop a system witch analyse FASTAs sequences domain. At the moment, approximately 3704 sequences, containing scorpion, frog, snake s venom, are in our DataBase. The domains group is already finished and the phylogenic analyses have shown final results. Key words: genome, database, venon Introdução Os venenos de animais são fonte de grande importância de proteínas utilizadas para fins medicinais. Um dos principais fatores para a utilização de venenos na medicina foi a semelhança estrutural de enzimas destes animais com as de mamíferos. O veneno de cobra é rico em phospholipase, phosphodiesterase, phosphomonoesterase, L-amino ácido oxidase, acetylcholinesterase, entre outras proteínas. Essa combinação de proteínas no veneno pode ser mortal, mas algumas dessas proteínas isoladas e purificadas, como a desintegrins e a metalloproteinase, têm importantes aplicações no tratamento contra o câncer, cardiovascular e desordens cerebrais. A variedade de funções das proteínas encontradas no veneno de cobra é o maior motivo pelo qual estes estudos estão sendo realizados, embora estes foram bastante restritos no que tange a variedade de espécies, pois muitas delas são de difícil captura, ou ainda porque estão em extinção. O melhor seria a criação em cativeiros para maior disponibilização de fontes de venenos para pesquisa [1],[2],[3],[4],[5],[6].
O veneno de escorpião contém aproximadamente de 50 à 100 toxinas polipeptídicas. Este veneno é composto por diversas neurotoxinas, histimines, seratonins, enzimas, inibidores de enzimas, entre outros compostos não identificados, onde cada espécie possui sua combinação original. Por causa da importância médica de algumas espécies, a proteína neurotoxina recebeu maior ênfase nas pesquisas [7],[8],[9],[10],[11],[12],[13],[14], [15],[16],[17]. O veneno da aranha é uma fonte surpreendente de substâncias biologicamente ativas que possuem funções fisiológicas em insetos e mamíferos. O veneno é composto por neurotoxinas, pequenos peptídeos como GsMtx-4, entre outros compostos. A proteína mais utilizada para isolação e purificação para efeitos de pesquisas é a neurotoxina. Comum a vários venenos de vários animais [18],[19],[20],[21],[22],[23], [24]. O veneno de lagarto possui um número de peptídeos altamente bioativos incluindo o exedin dos peptídeos 3 e 4. Este peptídeo isolado tem importante aplicação no tratamento de diabetes, substituindo a insulina. Apesar de os venenos de lagarto não possuírem grande diversidade de aplicação, este é de grande importância nos tratamentos médicos [25],[26]. O veneno do sapo é rico em peptídeos, onde um destes são muito similares às moléculas do corpo humano responsáveis pela estimulação ou inibição do crescimento de tumores cancerígenos. Mas a aplicação de maior enfoque dos pesquisadores é de anti-bactericida, onde o diferencial é que dificilmente as bactérias se tornarão imunes à isso. Isto fez com que o veneno de sapo se tornasse um assunto de grande interesse para todos [27],[28], [29],[30],[31],[32]. O veneno da abelha é uma composição complexa de enzimas das proteínas e dos aminoácidos. Contém proteínas do tipo apamine, melittin, phospholipase, hyaluronidase, entre outros. Há décadas são realizados terapias com o veneno da abelha, onde tem funções do tipo antiinflamatório, anti-bactericida. É utilizado no tratamento de doenças como artrite, reumatismo, esclerose múltipla e infecções crônicas do nervo [33],[34], [35],[36],[37],[38],[39]. O veneno de peixe, embora não muito conhecido, tem despertado grande interesse em pesquisadores. Foi observada influência cardiovascular das proteínas encontradas no veneno de alguns peixes, embora não haja resultados sobre o assunto, já há interesse em pesquisas [40]. Devido ao grande potencial encontrado no uso de venenos na área médica e farmacologia, esse trabalho tem como objetivo desenvolver um banco de dados com proteínas de venenos de várias espécies e desenvolver métodos para análise dessas seqüências protéicas. Metodologia Todas as seqüências foram obtidas através de bancos de dados disponíveis na internet, como NCBI, HARVARD, entre outros. Compondo, também, o banco de dados, encontram-se 556 seqüências de Bothrops Jararacussu, obtidas em nosso laboratório de Biotecnologia. No momento, 3704 seqüências de proteínas estão disponíveis em nosso banco de dados. O banco de dados foi desenvolvido utilizando-se o sistema operacional LINUX, servidor de bancos MySQL. Atualmente, dispomos de um servidor Altos 22000, com 5GB de RAM e 4 CPUs 700MHz Xeon, garantindo, assim, uma boa performance na comparação de seqüências. A tabela 1 apresenta o número de seqüências obtidas para cada espécie, disponíveis no banco de dados. Tabela 1 - A tabela apresenta o número de seqüências para cada espécie encontrada. N.º. SEQUÊNCIA DE ESPÉCIES PROTEÍNAS DE VENENOS Escorpião 333 Vespa 140 Formiga 69 Abelha 60 Zangão 1 Lagarto 1904 Cobra 878 Aranha 225 Peixe 21 Moluscos 178 Sapo 10 Arraia 51 Bothrops Jararacussu 556 Mosquito 1 Após a obtenção desse conjunto de seqüências e de sua classificação por tipo de proteína, deu-se início ao procedimento de classificação de domínios. Cada grupo de proteínas foi analisado através do programa computacional Clustalx. Nesse processo, cada grupo de proteína é alinhado em sua melhor posição (fig1a). As bases de proteína que não fizeram parte do alinhamento foram excluídas, apresentando como resultado apenas a parte homóloga entre as seqüências (fig1b), a qual será denominada de domínio. Assim, após ter sido analisado todos os grupos de proteínas, o banco de
dados foi alimentado com todos os domínios. Até o momento, encontram-se no banco 610 domínios cadastrados. (A) desenvolvido utilizando a linguagem Perl e C, e sistema operacional LINUX. Utilizando-se das seqüências encontradas com e-value igual a zero, a filogenia foi realizada através do uso do programa computacional PHILIP. A filogenia entre espécies foram realizadas para o mesmo tipo de proteína. As figuras 2 e 3 apresentam os resultados obtidos quando a filogenia foi realizada para as espécies vespa e zangão. (B) Figura 2 A figura apresenta as seqüências sendo analisadas pelo programa PHILIP para realização da filogenia. Figura 1 - A figura apresenta um grupo de proteínas sendo analisado através do Clustal. As partes que não são utilizadas na análise são descartadas Paralelamente à classificação dos domínios, deu-se início ao processo de filogenia. Para tal procedimento, foi utilizado o programa computacional BLAST, o qual faz uma comparação entre cada seqüência contida do banco com as demais, ou seja, todas com todas. O programa BLAST faz uma comparação entre as seqüências, classificando-a através do e-value. Quanto mais próximo de zero, maior a porcentagem de homologia. Por exemplo, um valor de e-value igual a zero obtido quando uma seqüência é comparada, significa que 100% de homologia foi obtido. Depois de realizada essa etapa, utilizou-se um sistema computacional desenvolvido em nosso departamento, o qual separa as seqüências em faixas de valores de e-value. Esse programa foi
Figura 3 A figura apresenta as distâncias encontradas para essa espécies. Através do estudo da filogenia foi possível determinar as mudanças genéticas que as proteínas sofreram de espécie para espécie, apresentando também a distância entre as proteínas das espécies. Conclusões O banco de dados desenvolvido nesse projeto será de grande utilidade na realização de estudos, como por exemplo, no estudo de fármacos. O sistema desenvolvido tem clusterizado as seqüências com precisão, justificando uma vez mais a importâncias da bioinformática na análise de dados genômicos. Apenas um resultado de filogenia foi apresentado nesse trabalho, mas essa análise tem sido realizada para as todas seqüências do banco. Em breve, estará sendo disponibilizado um site para usuários de grupos de interesse. Agradecimentos: Os autores gostariam de agradecer ao CNPq, FAPESP e UNAERP pela realização desse projeto. Referências [1] Howard Hughes Medical Institute [www.hhmi.org/news/heintz2.html] [2] Phillips,K.D. Study of Rattle Snake Venom may lead to anti-cancer drug [agnews.tamu.edu/dailynews/stories/bich/venom.ht m] [3]Kordia Laboratory Supplies snake Venom Enzymes[www.kordia.nl/pentapharm/snavenenz/sna venenz.html] [4]AZERBAIJAN international, Droplets of life or Death [www.azer.com/aiweb/categories/magazine/ 32_folder/32_articles/32_vipers.html] [5] BBC News [news.bbc.co.uk/hi/english/health/ newsid_272000/272378.stm] [6] Elsier Science [www.elsevier.com/locate/toxicon] [7] Frequently Asked Questions [wrbu.si.edu/www/stockwell/faq/faq.html] [8]Think Quest libraries [library.thinkquest.org/c007974/3_2sco.htm] Maio [9]UCI-Medical Center/Medical Group [www.ucihealth.com/news/releases/ scorpion_venom_drug.htm [10]Desert USA-Scorpions [www.desertusa.com/oct96/du_scorpion.html] [11]Shomon,M.J. Effective New Autoimmune Disease Drugs to use Scorpion Venom [thyroid.about.com/library/weekly/aa071800a.htm] [12]UCI News Room [www.today.uci.edu/releases/00releases/099ap00. html] [13]Characterization of Bioachive Scorpion Venom Protein Toxins [www.ecu.edu/si/protein_abstract.html] [14]Dr. Harold Sontheimer s research using scorpion venom in cancer treatment research for brain tumors was fratured nationally in this report from the CBS this morning [www.circ.uab.edu/cpages/cbssont.htm] [15]UC Irvine scorpion venom research may lead to new drugs that treat immune disords, aid transplants [www.sciencedaily.com/releases/2000/07/00070606 0353.htm] [16]Ask a scientist spider and scorpion venom [newton.dep.anl.gov/askasci/bio99/bio99879.htm] [17]Elsevier Science-Toxicon Na interdisciplinary journal on the toxins derived from animal, plants and microorganism [www.elsevier.com/locate/toxicon] [18]UK Science Exchange [www.sciencecity.org.uk/cgi-bin/ showstory.cgi?version=n&number=n56.htm] Maio [19]Engineering and Phusical Sciences research Council [www.epsrc.ac.uk/documents/info_pub/ research_highlights/spidven.htm] [20]Cornell University [www.news.cornell.edu/chronicle/ 99/3.25.99/spider_venom.html] [21]Biology [biology.about.com/library/bldyknow012301.htm] [22]Heart Center on line for Patients [www.heartcenteronline.com/myheartdr/home/ research-detail.cfm?reutersid=883] [23]Glausiusz, J. Elixir of Spider Spit [www.discover.com/sept_00/breakelixir.html] Maio [24]Albergavenny, R.D. Spider Venom may prevent atrial fibrillation [www.drshiva.com/spider.htm] Maio [25]Glucagon-Exendir [www.glucagon.com/exendin.htm] [26]Venom:striking beauties [www.magicpropagandamill.com/news/ features/venom/venom.html]
[27]Frog venom could prove vital in war against desease-unisci [unisci.com/stories/20013/0920011.htm] [28]ACA s Frogs Org [ www.frogs.org/news/ article.asp?categoryid=1&inforesourceid=801] [29]Philipkoski, K Proteins stored in a comparq space [www.wired.com/news/infostructure/0,1377,47020,00.html] [30]News Reporter, Giant Leap for bioresearch at UU [www.highereducationireland.com/newsdesk/frogs2. html] [31]UU spearheart giant leap forward in medicine_ University of ULSTER [www.ulst.ac.uk/news/releases/2001/375.html] Maio [32] Globl trends, Volume XIX nº 9 [www.stii.dost.gov.ph/sntpost/ NovPostWeb/Sept2k1/pg13.htm] [33] Glenn Rothfeld M.D., Bee venom therapy [www2.shore.net/~spectrum/apitherapy.html] Maio [34] The bee venom therapy home page [www.direct.ca/beevenom/] [35] Apitronic services [www.beevenom.com/] Maio [36] Bee venom therapy journal [www.gilbertsville.com/bee] [37]Dancing bee acres [www.dancingbeeacres.com/beevenom. html] Maio [38]Woolston, C_Bee venom therapy (bee stings) [www.ahealthyme.com/topic/beevenom] [39]Internet health library [www.internethealthlibrary.com/therapies/ beevenom-therapy.htm] [40]www.aqualink.com/marine/z-poison.html Contato - Profª. Dr.ª. Silvana Giuliatti, profª./pesquisadora da Universidade de Ribeirão Preto Bioinformática Av. Costábile Romano, 2201, Ribeirão Preto, São Paulo, CEP 14096-380, tel:(16)603-6728, sgiuliatti@hotmail.com