Unvere Feerl e Pernuco Cá Mequ Brl Khour Moelo Econo e Mrov pr Clfcção e Proeín Recfe Dezero e 22
Cá Mequ Brl Khour renção: Profª Dr K Slv Gurãe Moelo Econo e Mrov pr Clfcção e Proeín Derção preen o Cenro e Inforác Unvere Feerl e Pernuco, coo requo prcl pr oenção o gru e Mere e Cênc Copução Recfe 3 e o e 24
Agreceno A Deu, uor e oor e o nfeção e v nee plne, por er-e conceo relzr ee rlho Ao eu quero epoo Wler Júnor, que e u ocõe ru ão e e e eo, e o eo epo cnhou cogo, n preprção ee rlho Ao eu flho, Dv e Dnel, que co copreenão orcer por, eo n hor e u ue À nh orenor, Prof Dr K Slv Gurãe, pel u ecção, poo e ze, que polr concluão ee rlho co êxo A eonro Spuc, que e uou n pleenção ferren, e o e luno grução e Cênc Copução UESB, por eu neree e eíulo À g Corn, pelo crnho e poo n hor fíce Ao coleg o curo, pelo copnhero e ze, epeclene Mí, noo pono e poo e Recfe
v Reuo A Bolog Moleculr preen-e coo u áre Bolog ne férl e plcçõe e écnc copucon A eruur olécul e áco nucléco e proeín, copo e prícul lnh o longo e u ce, pere-lhe ere r copuconlene coo eqüênc e íolo e u lfeo fno euo lre exene enre eqüênc n e proeín que eepenh e função poe ur rçr cnho evoluconáro coun e ecorr eelhnç enre ferene orgno, que poe levr à copreenão e fíl ner, conruno pr efnção e ecno ger que rege for e v n Terr Moelo Econo e Mrov HMM, ê-e preeno coo u excelene écnc pr coprção e eqüênc e proeín, upor por u fore funenção eác Ee proceo e oelge é eo n crceríc eíc o oeo e euo, o qul é vo coo u proceo leóro prerzo, cuo prâero poe er eerno e u ner e efn e prec o proeo e u HMM, há rê prole funen ere reolvo: Avlção prole e u eqüênc e oervçõe, o o HMM; 2 Deernção elhor eqüênc e eo provável; 3 Aue o prâero o oelo, e coro co eqüênc oerv ee rlho é preen u rqueur e HMM pr oelge e fíl e proeín, que é pleen co u écnc e prenzge e áqun qul pere que o prâero o oelo, coo penle por reoçõe, nerçõe e uuçõe, e preno urne conrução o oelo, e nroução e conheceno prévo Pr plcr écnc, fo eenvolv u ferren pr conrução e u HMM cpz e clfcr eqüênc e proeín For relzo expereno co rê fíl e proeín, er, glon, proenoqune e GTPe Pr c fíl, u HMM fo reno uno u conuno e eqüênc quel fíl reulo o expereno or que écnc HMM é cpz e explorr nforçõe eíc con e u grne qune e eqüênc e proeín e u e fíl HMM conruío ão cpze e ngur co u lo gru e precão eqüênc ero e eqüênc não ero fíl oel
v Arc The Moleculr Bology n re of he Bology que ferle n pplcon of copuonl echnque The rucure of he nuclec c n proen olecule, copoe of prcle lgne long chn, llow o e el wh copuonlly equence of yol of fne lphe The uy of he exen lre ong fferen proen equence h crry ou he e funcon cn help egn coon evoluonry wy n o cover lre ong fferen orgn, h cn le o he unernng of whole fle, conrung o he efnon of generl echn h govern he for of lfe n he Erh Hen Mrov Moel HMM, hve preene heelve n excellen echnque for he copron of proen equence, uppore y rong hecl founon Th oelng proce e on he cl chrcerc of he uec, whch een preerze rno proce, whoe preer cn e eerne n well efne n ccure wy In he proec of HMM, here re hree funenl prole h u e olve: Evluon of he proly of equence of oervon, gven n HMM; 2 Deernon of he e equence of e he o prole; 3 Auen of he preer of he oel, n greeen wh he oerve equence In h wor, n HMM rchecure preene for oelng of proen fle The rchecure pleene wh chne lernng echnque, whch llow he preer of he oel, uch penle for reovl, neron n uuon, o e lerne urng he conrucon of he oel, whou he nroucon of prevou nowlege To pply he echnque, ool w evelope for conrucon of HMM cple of clfyng proen equence Experen were ccoplhe wh hree fle of proen, nely glon, proenne n GTPe For ech fly, n HMM w rne ung e of equence elongng o h fly The reul of he experen how h he HMM echnque cple of explorng he c nforon conne n gre oun of proen equence elongng o he e fly The HMM' ul re cple of nguhng equence eer of no eer of he oele fle wh hgh egree of precon
v Suáro AGRADECIMETS v RESUM v ABSTRACT v ÍDICE DE FIGURAS v AS SEQÜÊCIAS DE DA E PRTEÍAS UM PUC DE BIGIA MECUAR A Eruur o DA 2 Croooo e Gene 2 3 Replcção o DA 3 4 Trncrção e RA 4 5 Trução e Proeín 5 6 Eruur Proeín 7 7 Hoolog 8 2 TÉCICAS CMPUTACIAIS APICADAS À AÁISE DE SEQÜÊCIAS DE ÁCIDS UCÉICS E DE PRTEÍAS 2 2 AIHAMET DE SEQÜÊCIAS 2 2 Técnc pr Alnheno e Seqüênc23 22 Ecolh e prâero 3 23 Dânc e Eção 34 24 Alnheno Múlplo 35 22 IDETIFICAÇÃ DE GEES 4 3 APREDIZAGEM DE MÁQUIA 45 3 TEREMA DE BAYES 45 3 Axo Cox Jyne 46 32 Suuno gru e confnç por prole 46 32 DERIVAÇÃ DE MDES CM IFERÊCIA BAYESIAA 47 32 Prole pror 48 322 Prole o o e relção o oelo 49
v 323 Ev e prâero 5 4 MDES ESCDIDS DE MARKV 52 4 PRCESSS DISCRETS DE MARKV 53 42 DEFIIÇÃ DE UM HMM 56 43 S PRBEMAS FUDAMETAIS PARA HMMS 58 43 Prole - Avlção 58 432 Prole 2 Seqüênc e eo ó 62 433 Prole 3 Ev e prâero 64 434 Seqüênc e ervçõe Múlpl 67 5 APICAÇÃ DE MDES DE MARKV ESCDIDS A SEQÜÊCIAS DE PRTEÍAS 69 5 ARQUITETURA D HMM 7 52 CSTRUID UM HMM A PARTIR DE UM AIHAMET DE SEQÜÊCIAS 74 53 S AGRITMS 76 53 Algoro forwr-cwr 76 532 Algoro Bu-Welch Equçõe e reev 84 6 EXPERIMETS CM FAMÍIAS DE PRTEÍAS 88 6 EXPERIMETS CM GBIAS 89 6 reneno o oelo 89 62 Tee e clfcção relzo 9 62 EXPERIMETS CM PRTEIQUIASES 94 62 reneno o oelo 94 622 Tee e clfcção relzo 95 63 EXPERIMETS CM GTPASES 97 63 reneno o oelo 97 632 Tee e clfcção relzo 98 7 CCUSÕES E TRABAHS FUTURS
v Ínce e Fgur Fgur A eruur o DA é ecr coo u upl hélce Fgur 2 A áqun nurl e replcção o DA 3 Fgur 3 Gene eucroo e procroo 4 Fgur 4 cógo genéco Unverl 5 Fgur 5 A rncrção e DA e RA ocorre no núcleo célul 7 Fgur 6 níve e eruur proeín 8 Fgur 2 Alnheno e 5 eqüênc 22 Fgur 2 2 Alnheno e 2 eqüênc 24 Fgur 2 3 Du pole e lnheno óo 24 Fgur 2 4 Mrz pr lnheno eqüênc TGA e TGGA 26 Fgur 2 5 Du opçõe e lnheno óo pr eqüênc TGGA e TGA 27 Fgur 2 6 Monge e Frgeno e DA 28 Fgur 2 7 Alnheno Seglol 29 Fgur 2 8 Doíno e eqüênc e proeín 3 Fgur 2 9 A eqüênc AACGAK é rnfor n eqüênc ATCGGA 34 Fgur 2 Proceo e Alnheno Progrevo 36 Fgur 2 Bloco loco conene; loco não conene 37 Fgur 22 U oelo eíco perfl lurvo pr fíl glon 39 Fgur 2 3 Eruur e u gene ípco e procroo no nível o DA 4 Fgur 24 3 quro e leur poíve nu eqüênc e DA 4 Fgur 2 5 Coneno regão e níco rncrção E Col 42 Fgur 2 6 Eruur e u gene ípco e eucroo no nível o DA 43 Fgur 2 7 Junçõe exon-nron e u gene eucroo ípco 44 Fgur 4 U HMM co 5 eo 53 Fgur 4 2 Moelo cr-ou-coro co u oe 54 Fgur 4 3 Moelo cr-ou-coro co u oe 55 Fgur 4 4 Moelo lurvo o cálculo vráve forwr 6 Fgur 5 Moelo plfco pr u fíl e proeín 7 Fgur 5 2 U HMM co cone e nho 3 72
x Fgur 5 3 Cuo e nerçõe nu HMM 74 Fgur 5 4 Pre e u lnheno úlplo e ee eqüênc e glon 75 Fgur 6 Gráfco e perão Ecore x Copreno pr o HMM 44 glon 9 Fgur 6 2 Gráfco e perão o ecore veru copreno e eqüênc pr glon e não-glon, exrío e [39] 92 Fgur 6 3 Gráfco e perão Ecore x Copreno pr o HMM e copreno 93 proenoqune 96 Fgur 6 4 Gráfco e perão Ecore x Copreno pr o HMM e copreno 2 GTPe 99
Cpíulo A eqüênc e DA e proeín A Bolog Moleculr preen-e, ulene, coo u áre Bolog ne férl pr plcção e écnc copucon A eruur olécul e áco nucléco e proeín, copo e prícul lnh o longo e u ce, pere-lhe ere r copuconlene coo eqüênc e íolo e u lfeo fno ee cpíulo ão preen noçõe ác e Bolog Moleculr, coo eruur olécul e DA e proeín, ecno e replcção o DA e nezção e proeín E egu, preen-e lgu écnc copucon que ê o ulz no reno o prole Bolog Moleculr, epecfcene, coprção e eqüênc e enfcção e gene U pouco e Bolog Moleculr Dee quno o hoe coeçou culvr lvour ou crr n, e-e que c eene culv pou o o neceáro pr o eenvolveno e u orgno Té ee uo ceo e oervv que crceríc e u gerção er p pr próx, não e co o conec Apen e 86, Gregory Menel hpoezou que rço fenoípco ão o reulo nerção enre prícul cre, qu hoe ão conhec coo gene [] o níco o éculo XX, uo cen á chv que o croooo er reponáve pel hereree Decoru-e que o croooo ão copoo e DA e proeín, eno que o DA é u olécul lner conuí e pen 4 uune ác,
enquno que proeín é copo e 2 uune ác e pou u for renonl coplex, preenno vár or Pelo fo o DA er e eno coplexo o que proeín, preceu o cen époc que u eruur ão ple não poer er reponável por crregr o nforção genéc e u orgno, e oo que ele ruír e função à proeín E 952, Alfre Herhey e Mrh Che [] orr que o DA é que e fo crreg nforção genéc, e e 953, Je Won e Frnc Crc [2] pulcr u rgo ecreveno eruur o DA A eernção e eruur é freqüeneene referenc coo u rco pr olog oleculr oern A Eruur o DA DA é u grne olécul copo e pen 4 po e uune, ch e nucleoíeo eoxrronucleoíeo C nucleoíeo é conuío e u çúcr eoxrroe, u fofo e u quro e: Aenn, Con, Gunn ou Tn, uulene eno por A, C, G e T, repecvene E e ve-e e u cegor, e ore Aenn e Gunn, ão purn, enquno que enore Con e Tn, ão prn A eoxrroe for o que e ch e equeleo olécul e DA A eruur ác o DA é ecr coo u upl hélce, one c hélce ou f é u políero e nucleoíeo e gr e orno o eo exo E c f o nucleoíeo eão orgnzo e oo forr u ce Fgur equeleo penoe-fofo 3 3 5 e pone e hgrogêno 5 Fgur A eruur o DA é ecr coo u upl hélce Be copleenre e con: Aenn-Tn e Gunn-Con
2 A u hélce ão n un rvé e pone e hrogêno que lg e e f o pre, e oo que u e e u f fc lo lo co u e our f, forno u pr pre e e ão foro oeeceno epre o egune créro: u purn erá epre lg u prn e, n rerene, gunn for pr co con e enn for pr co n A e gunn co con e enn co n ão por o ch copleenre Io gnfc que e eqüênc e e e u f é, eqüênc our f é uocene eern, po u é copleenr à our U ce é conruí reconlene, evo à eruur érc o çúcre que conue o equeleo olécul nucleoíeo ão uno rvé e lgçõe fofo covlene que lg o crono 5 e u grupo eoxrroe o crono 3 o grupo cene, forno u ce C nucleoíeo é coneco à ce n reção o crono 5 o crono 3; por o z-e que f o DA v e 5 lê-e 5 lnh 3 3 lnh A reção u f é nver, u our Fgur Pr c orgno, olécul e DA pou qune ferene e e, que por u vez ão po e oo no A eqüênc e que o nucleoíeo eão orgnzo n f é que eern qu nforçõe genéc que célul crreg C nucleoíeo é repreeno por u ler no lfeo e 4 ler A, C, G, T que é uo pr ecrever engen genéc cofc e for lner U vez que o lfeo e queão é copoo e 4 ler, ão poíve 4 n ferene ce e copreno n copreno ol o DA huno é eo e 3 x 9 nucleoíeo, e oo que é poível u núero e 9 3 4 ce ferene poíve 2 Croooo e Gene orgno vvo ão vo e o grne grupo: procroo e eucroo procroo ão orgno co u únc célul, que não e núcleo, enquno que o eucroo ão orgno coplexo, cu célul ão copo e u núcleo e o líquo celulr, cho copl o núcleo célul eucro exe eleeno conuío e eruur conígu cho croooo, no qu o DA é rzeno U gene é u pre epecífc eqüênc e nucleoíeo o longo e u croooo que gerlene crreg nforção neceár pr conrução e u proeín o ere huno, gene conue pen 5 % o DA; o ouro 95 9% conuee e eqüênc não gênc, uulene enon un DA ão e conhece n qul
3 função o não gênco, expereno envolveno u upreão eonrr ere v E-e que o hoe pou enre 3 e 5 gene A expreão o gene é o proceo ológco pelo qul eqüênc e DA ger u eqüênc e proeín e oo o gene nu eqüênc e DA ão expreo 3 Replcção o DA A ecoer eruur olécul o DA, copo e u f copleenre, peru é ecorr coo e á o proceo e cóp e rnferênc nforçõe genéc e u célul pr u prole U vez que c f e u olécul é copleenr à our, poeo conclur que crreg e nforção genéc Conerno que A e A ão f que copõe u eern olécul e DA, f A poe ervr e ole pr conrur-e u cóp e A e for que A poe ervr e ole pr conrur u cóp e A E é exene e ner que ocorre no orgno vvo; f A e epr f A e prr e c u é fe u cóp e u copleenr, o fnl o que e-e u cóp olécul orgnl De for, nforção genéc exene no DA poe er replc e DA Fgur 2 Fgur 2 A áqun nurl e replcção o DA A áqun e replcção nurl rlh co u rge e eno e erro e c 9 nucleoíeo cono conlene, porno, el coee u erro, conno ou não lgun nucleoíeo, ou colocno u A one ever colocr G, ou u T no lugr e u C
4 Ee erro ão cho e uçõe e poe er coneqüênc ou eno grve, epener e one ele ocorre U ução poe plcr n uênc e u proeín vl pr célul, oconno u ore, o que coneqüeneene nerroperá replcção o erro ur veze, ução poe não fer função proeín Muo rrene ução prouzrá u gene elhoro, co u função nov, e oo que o orgno co e ução erão vngen ore o ouro, e o gene uo poerá vr uur o gene orgnl n populção rvé e eleção nurl Quno u e err é ncorpor à nov f, ze que ocorreu u uução A ção e u e ou e é ch nerção, e rer e u ou e é ch reoção 4 Trncrção e RA DA é relvene nere qucene A nforçõe que ele crreg ão expre nreene rvé e our olécul: RA epecífco e proeín E úl é que efne propree quíc e u célul RA é u ouro po e áco nucléco Áco Ronucléco que poe er enconro no no núcleo quno no copl célul ferene o DA, que ó exe no núcleo RA é u políero que fere qucene e o peco o DA: o equeleo o RA é copoo e roe, o nvé e eoxrroe; e coo no DA e 2 o RA pou e Aenn, Con, Gunn, é preene no DA, e Urcl eno por U, e uução à Tn T; no RA e Urcl pre co Aenn Fgur 3 Gene eucroo e procroo o eucroo rncrção coeç no núcleo célul Apó o plcng, o RA gr pr o copl o procroo, o gene é conínuo RA reé o nforção genéc o DA, é copoo e u f únc, que é conruí prr e u f o DA u coo ole A nforção exene no DA é p pr o RA nu proceo cho rncrção, proovo pel enz RA
5 polere E orgno eucroo rncrção e á e u ep Fgur 3 Próxo à or o gene, exe u regão prão ch e Prooor, que nc à RA polere one coeçr rncrção, o é, nc loclzção o níco o gene Prerene o DA é negrlene rncro e RA, n no núcleo célul E nov olécul é copo e frgeno lerno cho exon regõe cofcor e nron regõe não cofcor Depo o gene rncrção pár e lgu úz e enn ão con no fnl olécul e RA pr rcr o eu f A rncrção ocorre no eno 5-3 f e RA cho eno owre, que correpone o eno 3-5 f ole cho eno upre E egu, ocorre o plcng o RA, e que eqüênc não cofcor e gene nron ão reov, prouzno u olécul uo cur, ch e RA engero RA, que no copl célul ervrá e ole pr conrução e u proeín A epener o eco one rncrção ocorre, poe hver u vrção o prão plcng Alernve Splcng, o que conru pr vere proeín no orgno U C A G U C A G Phe Ser Tyr Cy U Phe Ser Tyr Cy C eu Ser STP STP A eu Ser STP Trp G eu Pro H Arg U eu Pro H Arg C eu Pro Gln Arg A eu Pro Gln Arg G Ile Thr An Ser U Ile Thr An Ser C Ile Thr y Arg A MeSTART Thr y Arg G Vl Al Ap Gly U Vl Al Ap Gly C Vl Al Glu Gly A Vl Al Glu Gly G Fgur 4 cógo genéco Unverl coon AUG, lé e er ruzo no noáco Meonn, nc o níco rução op coon UAA, UAG e UGA nc f rução 5 Trução e Proeín E nlog o fo e que DA e RA ão ce e nucleoíeo, u proeín é u ce copo e u ouro po e uune: noáco A proeín ão reponáve pel or reçõe quíc execu n célul e porno, eenc pr o u
6 funçõe Poe-e vr proeín e o grupo no: eruur, que ão quel que ão ulz pr confecconr eco, e enz, que ê ção clor Apó rncrção o DA e RA, ee erá ruzo e proeín confore o cógo genéco A eqüênc e nucleoíeo e u eqüênc e DA é que efne eqüênc o noáco n proeín que erá prouz A eqüênc o RA é l e oo que c grupo e rê nucleoíeo, cho coon, é ruzo e u noáco cógo genéco unverl é o peeno lógco que epecfc e que nforção genéc eqüênc o DA plcrá A Fgur 4 or o cógo genéco que é válo pr or o orgno vvo, e ele pln, cér ou huno Coo c coon é foro por 3 o 4 nucleoíeo poíve co pole e repeção, exe 4 3 64 coon poíve Enreno, e gerl, pen 2 noáco no ão enconro e proeín;, or o noáco é cofc por e u coon, o é, o cógo genéco é egenero Algun coon epec, cho op coon, ão uo pr nlzr o érno o proceo e rução coon AUG, é cho r coon, lé e er ruzo no noáco Meonn, repreen o níco rução cógo genéco poe er vo coo u função e 64 coon poíve pr 2 noáco op Exe regõe o DA que ão rncr e RA poré não ão ruz, o é, não cofc proeín E regõe ão ch UTR unrnle regon E orgno procroo, u gene e ó u regão cofcne, conígu, que fc enre regõe 3 UTR e 5 UTR o eucroo, o RA é copoo e regõe cofcne, que ão u pr conrução e proeín, epr por regõe não cofcne 3 UTR e 5 UTR rooo ão conruore celulre que cople o proceo e nezção proeín, ulzno pequen olécul e RA ch RA RA rnporor, que erve e pore enre o RA e o noáco RA né, e u lo, u ncoon u eqüênc e rê e e RA e, e ouro lo, o noáco correponene no cógo genéco RA crreg o noáco pr o rooo que e ove o longo o RA, e oo que ce e proeín v e longno e u noáco por vez, correponene o coon ucevo no RA Fgur 5, u vão e u célul nu proceo e conrução proeín ee rncrção, no núcleo, é rução, no copl
7 Fgur 5 A rncrção e DA e RA ocorre no núcleo célul RA ove-e pr o copl e o rooo ove-e o longo ee enquno que olécul e RA funcon coo pore enre o ncoon e o noáco correponene, eeneno ce proeín 6 Eruur Proeín Coo fo o c, u proeín é u ce e noáco Dfereneene o áco nucléco, e ce, e gerl, or-e e u conforção epecífc, eern pel eqüênc e noáco Exe, no enno, lgun prõe eruur que e repee e pre croolécul e proeín evo pone e hrogêno que e for enre eu noáco Do prõe ão prculrene coun e ão conheco coo -hélce e folh--pregue ou pleene folh- U vez que u -hélce ol e eo quoo não é norlene eável, u -hélce ênc poe grr gulene, u e orno our, forno u eruur eável, ch cole-col A ceín u une o noáco ceín exene nu ce norlene e une forno pone ulfíc Fgur 6, ão oro o rê egune níve eruur proeín A - hélce e folh--pregue conue eruur ecunár e u proeín Cer conçõe e -hélce e folh- un for une copc ch e oíno proeín oíno prece er une prr qu proeín ão conruí, eno que proeín enore poe coner pen u oíno A eruur ercár é
8 conforção renonl olécul e poe er enen coo u conção ou u epcoeno e eruur ecunár enro e u ou oíno, ncluno pone e heerogêneo e lgçõe frc, forno u uune proéc onôero Fnlene, eruur quernár poe er v coo u nível lo e oreno, correponeno à unão e uune íero Vle relr que ne o proeín poue eruur quernár -hélce folh--pregue oíno eruur ecunár uune proéc onôero eruur ercár olécul e proeín íero eruur quernár Fgur 6 níve e eruur proeín A eruur prár correpone pleene à eqüênc e noáco e pone ulfíc A eruur e u proeín é prcene efn pel eqüênc prár e noáco, que por u vez é efn pel eqüênc e DA A our rê eruur enon ão, norlene, quel co ín energ lvre A eruur 3D e u proeín eern u funconle, porno, é nerene poer eernr e eruur f e prezer u função n célul 7 Hoolog A eruur quíc e oo o ere vvo é e e nucleoíeo, noáco, çúcre e áco grxo; lé o, oo o ere vvo nez eu conune quíco e ner, rzen u nforçõe genéc no DA e expre rvé e RA e proeín Algu eqüênc e nucleoíeo e gene epecífco ou lgu eqüênc e noáco, preen grne lre E lre enre proeín que eepenh e função e orgno eelhne, e coo no gene que cofc, nlz pr hpóee e que o
9 orgno e queão poue u e orge evoluconár Coprr eqüênc e noáco e proeín poe levr porne concluõe ore orge o orgno one el e enconr Seqüênc eelhne poe er coner hoólog, e ão orgn e u ncerl cou, ou nálog, e e ncer ferene A eqüênc hoólog poe n er clfc coo prálog, e perence u eo orgno, ou coo orólog, e ão e orgno no Poe-e explorr e eelhnç pr rçr cnho evoluconáro coun e prr í ecorr lre enre ferene orgno A o eneneno e u gene ou proeín poe levr à copreenão e fíl ner e hoólogo, conruno pr efnção e ecno ger que rege for e v n Terr É porne nor que proeín hoólog poe preenr eqüênc relvene ferene, u for eruur renonl ene er eelhne Du regõe e eqüênc que e preen uo lre, ão conerv A funconle e u proeín é eern pel u eruur renonl copoção eqüênc e noáco, for e or A, é porne eur eo e prezer eruur proeín, co o oevo e copreener o eu ppel no orgno Algu enz preen, e u eruur renonl, cer ol pr coor o regene E ol, ch ío vo gerlene ão e conerv enre orgno e epéce ferene Gerlene, regõe co u lo gru e conervção, eepenh u ppel funenl n ve proeín e ão ch ovo of
2 Cpíulo 2 Técnc Copucon Aplc à Anále e Seqüênc e Áco ucléco e e Proeín ero geno fo eprego pel prer vez pelo oânco leão Hn Wnler [3], logo pó Prer Guerr Munl geno e u orgno é o conuno e oo o eu gene U o prncp oevo o proeo e eqüenceno genôco é o euo eruur, função e evolução o gene Pr o, loróro e eqüenceno rlh n eernção eqüênc e oo o gene o orgno euo A prr e eqüênc, núero po e nále poe er relzo no eno e exrr nforçõe gnfcne ore ee gene e coneqüeneene, o orgno e queão e eo e ouro orgno que po er co ele relcono E 994, e rgo pulco por Mrc Wln e Keh Wll [3] preceu pel prer vez o ero proeo, que z repeo à expreão e o proeín e u conuno e croooo, o é, o euo e u proeo refere-e o euo proeín prouz por u o geno E u eo orgno ulcelulr ee conuno e proeín vr co o po e célul e é co o epo U vez que u olécul e u áco nucléco ou proeín poe er v coo u eqüênc e crcere rng, o é, u uceão fn e íolo perencene u cero
2 conuno Σ o lfeo, u écnc copucon ê o ulz pr u nále o úlo no, plcção e écnc e o ruí u áre e euo que e ec à plcção e ferren copucon o prole olog, er, Bolog Copuconl ee conexo, écnc copucon ê o preen pr coprção e eqüênc, onge e frgeno e eqüênc, ou eqüenceno, conrução e árvore flogenéc, preção eruur 3D e olécul, enre ouro o ecorrer ee cpíulo erão v lgu écnc ulz pr nále e eqüênc e áco nucléco e proeín, epecfcene pr coprção e eqüênc e enfcção e gene 2 Alnheno e eqüênc U orge que e e revelo efcene n nále e eqüênc e DA ou e proeín é nále coprv e eqüênc Seguno Dure e Ae [4], genôc coprv é funenl no euo o gene, po, Relene, evolução o orgno vvo poe er coner coo u expereno e lrg ecl, conínuo, e uçõe e gene Por e rê lhõe e no, o geno ê ofro uçõe uuçõe, nerçõe, reoçõe, reconçõe Muçõe e reoção ão, gerlene, rpene eln por eleção nurl, enquno que uçõe que não ê efeo flogenéco uçõe neur poe, por ervção genéc leór, ornr-e fxo n populção Glolene, vngen o uçõe ão uo rr e quno reíuo ão poreene conervo urne evolução gerlene correpone regõe que ão frcene conrng por eleção A, eur prõe e uçõe rvé e nále e eqüênc hoólog é úl não ó pr eur relçõe evoluconár enre eqüênc, é pr enfcr o conrngeno eruur e funcon e eqüênc DA, RA, ou proeín De fo, coprção e eqüênc é operção ác no euo e eqüênc e eá preene no euo e vero prole olog copuconl, enre o qu co: Coprção e reulo e eqüenceno oo por ferene loróro; 2 Ienfcção e ío e funconle rvé enfcção e regõe lene conerv; 3 Deonrção e hoolog enre eqüênc; 4 Conrução e árvore flogenéc prr qu poe-e nferr eveno e ução e reconrur o relconeno evoluconáro enre eqüênc, perno enfcção e eveno e uplcção e gene pr ngur orólogo e prálogo;
22 5 Buc e lre gnfcne, n que frc, e e e o exene, pr enfcr ero relvene ne e u e fíl e proeín clfcção e proeín; 6 Preção eruur ecunár e proeín, poeno ncluve oelr hoolog e eruur conhec; 7 Preção e função, u vez que eruur renonl proeín é freqüeneene uo conerv que eruur prár e que norlene eruur 3D lre plc e funçõe lre A, e u gene é eerno hoólogo e ouro cu função á é conhec, poe er poível nferr função o novo gene Inuvene, poe-e zer que u lnheno e eqüênc cone e coprá-l colocno c eqüênc e u lnh u e xo our, e oo que c colun e copo por reíuo nucleoíeo ou noáco que erve e u ncerl cou Pr conegur ee lnheno é neceáro nrouzr gp epço enro eqüênc, forçno que o eqüênc fque co o eo copreno, e r uuçõe A nroução e u gp nu eqüênc poe repreenr u reoção ne eqüênc ou u nerção n e eqüênc lnh São pero gp no níco e no fnl eqüênc é A Fgur 2 or u exeplo e lnheno e 5 eqüênc gp nrouzo n colun 4 eqüênc 2 e 4 poe repreenr u reoção ne eqüênc ou u nerção o reíuo K n eqüênc, 3 e 5 Poe-e nferr ee lnheno é que n colun 6 eqüênc 3 o reíuo fo uuío por W 2 3 4 5 6 7 8 9 2 G G A K M M W H A C C 2 C G A M M D H H C 3 Y A K M W W D A C 4 Y I M M D H A C 5 G Y A K F M W C A G C Fgur 2 Alnheno e 5 eqüênc U lnheno e eqüênc e proeín correpone o oelo hpoéco uçõe que ocorrer urne evolução vene, exe uo lnheno no, poíve, pr u eo conuno e eqüênc; no enno, eernr qul o elhor lnheno, o é, quele que elhor rer o cenáro evoluconáro, não é rvl lgoro conheco que relz lnheno
23 e u eqüênc ão eo e progrção nâc e poue epo e execução e ore qurác [5] Quno o núero e eqüênc ere lnh crece uo, generlzçõe o proceeno ulzo pr u eqüênc reun e epo e execução nváve Por ee ovo, lgu ferren ulene ulz pr conrur lnheno e vár eqüênc ão e e lgoro heuríco que, porno, não poe grnr elhor olução 2 Técnc pr Alnheno e Seqüênc Ane e e orr écnc pr lnheno e eqüênc proprene, erão preen lgu efnçõe confore Seul e Men [5] U eqüênc ou ce, é u uceão fn e íolo perencene u lfeo Σ núero e crcere e u eqüênc é enoo por A eqüênc vz pou zero crcere Exeplo: pr o lfeo Σ {A, C, G, T}, TTGCTA e ACTGCAAT ão eqüênc 6 e 8 2 D u eqüênc, u ueqüênc, e, é u eqüênc que poe er o e co reoção e lgun crcere Exeplo: GTGC é u ueqüênc e AGCTAGC, enquno que GTGA não é 3 U recho e crcere conecuvo e é u uce e Exeplo: GCT é u uce e AGCTAGC, enquno que GCTG não é 4 A concenção e u eqüênc e é eqüênc o pel upoção o crcere e o crcere e Se u w, z-e que é u prefxo e u, w é u for e u e que é u ufxo e u 5 U oeqüênc é u eqüênc one Σ {A, C, G, T} DA, Σ {A, C, G, U} RA ou Σ {A, C, D, E, F, G, H, I, K,, M,, P, Q, R, S, T, V, W, Y} Proeín Alnheno Glol Algoro Báco Se u eqüênc e proeín PKMAAGWT e 2 PKMAGST Poe-e lnhr e eqüênc egune ner:
24 P K M A A G W T P K M A G S T Fgur 2 2 Alnheno e 2 eqüênc Ao lnhr-e eqüênc percee-e que únc ferenç enre el ão: pou u A que 2 e 2 7ª poção eqüênc é ocup por crcere ferene W e e S e 2 D e for que no exeplo Fgur 2, u gp eve que er nrouzo e 2 e oo que eqüênc fce co o eo copreno A é que poe-e efnr u lnheno glol enre u eqüênc coo eno nerção e gp e eerno loc eqüênc ncluve no níco ou no fnl el e oo que el fque co o eo copreno, não eno pero que pou gp n e poção, o é, que u gp e u eqüênc e lnho co u gp n our A nroução e gp e eqüênc poe er v coo coneqüênc e eveno ucon urne evolução A prole e ocorrênc e ferene eveno ucon eve er lev e con n copução e lnheno, qu e: uução, nerção e reoção Poe-e er qule e u lnheno runo-e u ponução c colun ee, confore, por exeplo, o egune créro: e colun ver u e gu ch, receerá pono; e colun ver u e ferene ch, erá penlz co pono; e colun ver u e e u gp, erá penlz co 2 pono A lre enre eqüênc erá pel ponução ol o co o o pono e c colun o lnheno U lnheno óo erá quele que pour ponução áx e, porno, é poível hver e u lnheno óo o exeplo Fgur 2 2, o lnheno preeno é óo e exe our pole: P K M A A G W T P K M A A G W T P K M A G S T P K M A G S T ponução: -2 - -2 - pon ol: 3 3 Fgur 2 3 Du pole e lnheno óo
Há que e oervr que expreão lnheno óo que eá eno u qu, refere-e o eno eáco, o é, quele que pou ponução áx o enno, ee poe não er o elhor lnheno no eno ológco, o é, poe não er o lnheno que elhor repreen o cenáro evoluconáro A noção e ânc enre u eqüênc, confore erá vo ne, é erv o conceo e uçõe e rução e peo pr e uçõe U lgoro pr eernr u lnheno óo e u eqüênc, 2,, e, 2,, n, co e n, e-e e olhr pr úl colun e c u eqüênc e vlr rê pole: lnhr úl e e co úl e e : 2-2 n- n lnhr úl e e co u gp n úl poção e ; 2-2 n lnhr u gp n úl poção e co úl e e ; 2 2 n- n U vez que o lnheno óo é quele que ruz u or lre enre eqüênc, o prole reuz-e enão lnhr, recurvene, e rene e eqüênc, ucno or lre poível Se ; lre enre e Te-e: Ecolher o or enre o rê vlore:, 2,, ;, 2,, n, 2,, ;, 2,, n,,, ;,,, 2 2 n ± p g g Ee proceeno ger u núero exponencl e ch recurv Conernoe que c ch ger our rê e que e u el o núero e e envolv nu pen e u, hverá, poenclene, 3 n ch Seul e Men [5] or elhene coo o prole o lnheno e u eqüênc poe er reolvo rvé e progrção nâc Coo exeplo, Fgur 2 4 or u rz enonl A[, n] u pr coprr eqüênc TGGA e TGA, conerno o peo pr che, uuçõe e gp ulzo c lgoro áco pr preencheno rz conoe epo e epço Οn 25
26 T G A -2-4 -6 T -2 - -3 G -4-2 G -6-3 A -8-5 -2 Fgur 2 4 Mrz pr lnheno eqüênc TGA e TGGA ; Se [] o prefxo e e nho e [] o prefxo e e nho, enão c célul, rz coné o reulo coprção e [] e [] Inclene, ão preench prer lnh e prer colun rz, o que correpone, repecvene, lnhr o prefxo vzo e co c prefxo e ª lnh e lnhr o prefxo vzo e co c prefxo e ª colun E nclzção correpone o co e recurão C u e célul é clcul egune ner:, Fgur 2 4,, - g áx -, - p -, g one: g é o peo e u gp e p é o peo o lnheno co o exeplo p e, p e, e g 2 célul, n é enconro o vlor lre enre eqüênc cople Pr e oer o lnheno óo, ão coloc e ponero ncno o lugr e one veo o vlor áxo ulzo e c célul e lgu uçõe é poível ngr o áxo por e u cnho Te-e, porno, e u lnheno óo Seguno-e prr célul, n, n reção nc pel e é lcnçr,, e-e egune pole: e e co orge e, é horzonl, correpone o lnheno e u gp e co ;
27 2 e e co orge e, é vercl, correpone o lnheno e co u gp e ; 3 e e co orge e, é ncln, correpone o lnheno e co U o lnheno óo enconro n Fgur 2 4, eá nco pel e e verelho, o ouro pel e e zul, o qu ão oro n Fgur 2 5, coo Alnheno Óo e Alnheno Óo 2, repecvene: Alnheno Óo Alnheno Óo 2 : T G G A : T G G A : T G A : T G A ponução: -2 ponução: -2 pon ol: pon ol: Fgur 2 5 Du opçõe e lnheno óo pr eqüênc TGGA e TGA U lgoro pr oer o lnheno prr rz A, é é oro por Seul e Men [5] e conoe epo Οl, one l é o copreno o lnheno reorno Al o uore c lgoro efcene que, pr eern ecolh e peo, conegue reuzr o epo pr Οn 2 /log n [6] Apreen é lgu ofcçõe no lgoro áco pr preencheno rz e oo que coplexe e epço nu conervelene, pno er proporconl à o o nho eqüênc e enr, eor o po cur o ueno o epo pr é o oro o orgnl Exenõe o Algoro Báco E lgu uçõe re, poe er neceáro r reno ferenco gp n exree, e coo penlzr erur e u gp o que u exenão E our, poe-e eer lnhr pen u uce e co u ce É poível enconrr lnheno coo ee, fzeno-e lgu lerçõe no lgoro áco coo egue Alnheno Seglol U co ípco é o o prole onge e frgeno e eqüênc e DA proceo e eqüenceno e lrg ecl eqüenceno e long olécul e DA envolve úlpl replcção olécul er eqüenc, o é, ão frc vár cóp olécul, e poeror quer e o e e peço e nho leóro oevo é gp n exree ão quele que prece epre ne o prero ou epo o úlo crcere e u eqüênc e recee, v e regr, reno epecl n nále e oeqüênc
que o fnl e ep o proceo po er enconro frgeno coo oro n Fgur 2 6: 28 DA orgnl: Frgeno: 2 3 4 5 6 7 8 Fgur 2 6 Monge e Frgeno e DA frgeno eve exr e qune e nho ufcene pr corr o eqüênc orgnl e u exree à our e pour orepoçõe enre o frgeno e copreno ufcene pr evr que concênc leór provoque u onge equvoc A onge erá fe ucno-e cr exree e frgeno e oo forr eruur ch cong C novo frgeno é copro o cong exene e uc e eelhnç, n env e nexá-lo lgu ele, o que rá ofcr fíl e cong Se não for eec eelhnç enre o frgeno e qulquer cong, u novo cong é cro Co ção e u novo frgeno, u cong exene poe er eeno e eo o cong poe er funo e u U lnheno coo o ecro c, e que o gp e exree não ão penlzo é cho lnheno eglol São poíve o co e lnheno eglol enre u eqüênc e, : CAS A: ão gnor: Reoçõe no níco e e Inerçõe no fnl e, ou CAS B: ão gnor: Reoçõe no níco e e Inerçõe no fnl e ; Pr relzr u lnheno econerno gp n exree eqüênc, exe 4 pole:
Pr econerr gp no fnl e, econer-e o correponene ufxo e, o é, procee-e o lnheno ucno enconrr elhor ponução enre e u prefxo e ; e elhor ponução erá enconr enre o vlore úl lnh rz lnheno óo erá oo eguno e, prno e célul é célul, 2 Pr econerr gp no fnl e, o proceeno é nálogo o neror, ó que or ponução erá enconr n úl colun rz Conr o o proceeno c correpone não corr por gp no fnl e qulquer u eqüênc e, conerno que nunc ocorre gp n e colun e eqüênc ulneene, é ufcene ecolher o or vlor enre o célul úl lnh e úl colun 3 Pr econerr gp no níco e, o lgoro erá o eo co u ofcção pen n nclzção rz, que erá oo o vlore prer lnh gu 4 Pr econerr gp no níco e, o lgoro erá o eo, gor o vlore prer colun é que erão gu É poível conr ee quro proceeno, po nenhu nerfere no ouro Se, por exeplo, o frgeno eqüênc e 6 Fgur 2 6, repecvene: ATTCGGAGTCATGTAC e CATGACTATGACCCTG oevo erá lnhr e eqüênc, e penlzr, conuo, reoçõe no níco e 6 ne nerçõe no eu fnl e CAS A, coo or Fgur 2 7 A T T C G G A G T C A T G T A C C A T G A C T A T G A C C C T G Fgur 2 7 Alnheno Seglol 29 Serão lnho, porno, u ufxo e co u prefxo e 6 A rz e coprção everá er nclz co o célul prer colun gu zero e o fnl everá er procuro o or vlor n úl lnh rz A, pr lnhr u prefxo e co u ufxo e CAS A, eve-e nclzr prer lnh co zero e procurr pelo or vlor n úl colun rz Pr lnhr u prefxo e co u ufxo e CAS B, eve-e nclzr prer colun co zero e procurr pelo or vlor n úl lnh rz
3 Alnheno loc Eor u eqüênc não e uo lre, poe coner regõe que preene l lre, e oo que e e neree ecorr regõe Ee é o co quno e ee enfcr proeín e u e fíl, cu eqüênc cople poe não preenr grne lre, poré pour regõe lene conerv, qu poe er enfc rvé e u lnheno locl E regõe poe repreenr ío vo, ovo, eruur co funçõe equvlene, ec S H R D V V V D Q G WV T G G K G I Y T D P Q I H S V D Q K V F T T F G K R G I F Y S R G R F V C D Q G V G K T M T D P A I H T D P Y R F S S Q T G A E G F M S K Q M I V V D I Q G V D D Y T D P Q I H T P D G K G F G G G K A G I K S H E I V D I Q G V D F Y T D P Q I H T K S G E G F G E G G E T G F H K S H Q I I D I Q G V G D H Y T D P Q I H T Y D G V G F G I G G Q K G F E K S G H Q I V V D I Q G V G D Y T D P Q I H T E K G T D F G D G G V R G M A T R G E V D Q G V G E T D P Q I H T E V K Q S R G M V F G P A G E D A I R Fgur 2 8 Doíno e eqüênc e proeín U lnheno locl enre u eqüênc e é u lnheno e u for e co u for e ee co, ouro lnheno, lé o óo, é poe er e neree, ee que pou ponução próx ó U lgoro pr eernr ee lnheno é é u exenão o áco, co egune relv: c célul, rz A[, n] gurrá ponução o lnheno óo enre u ufxo e e u ufxo e 2 prer lnh e prer colun ão nclz co zero 3 coo hverá epre, no íno, o lnheno o ufxo vzo e [] e [], que á u ponução zero, nunc hverá u célul co vlor negvo Por o, o cálculo célul erá feo por:,, - g áx -, - p -, g 4 o vlor o lnheno óo erá o pelo or vlor rz ner 5 pr e oer o lnheno óo, o proceeno erá: egur e, prr o or vlor rz, é enconrr u célul cuo vlor e zero 6 pr enconrr ouro on lnheno loc, poe-e ecolher our célul co vlore propro próxo o áxo e proceer coo no e neror
3 22 Ecolh e prâero Pr levr e con o rê po e eveno ucon que ão conero e lnheno, exe ferene pole co relção o peo que erão plco c po e operção uução, nerção ou reoção Ee peo nfluenc foreene o lnheno enconro e pr u eernção lev-e e con prole e ocorrênc e c eveno uconl po, elene, ee vlore ever refler o fenôeno ológco que o lnheno en oelr E eqüênc e DA, u eque que e o ulzo pr ponur lnheno é: 2 g < < M, one M pr o ceno e e gu, pr ceno e e egu e g, pr gp Suuçõe o co e eqüênc e DA, prole e uução vr e coro co e Por exeplo, uuçõe enre purn ou enre prn rnçõe ão freqüene o que enre purn e prn e vce-e-ver rnverõe Por o é cou por peo ore pr rnverõe o que pr rnçõe o co e eqüênc e proeín, prole e uução e u noáco por ouro epene cene o efeo fenoípco uução e eruur o cógo genéco A uuçõe envolveno noáco que pou crceríc oquíc eelhne não fe uo eruur proeín e coneqüeneene ocorre co freqüênc urne evolução erv-e que pr ânc evoluconár pequen, prole e uução reflee, prncplene, n eruur o cógo genéco Pr ânc evoluconár ore, prole epene, eenclene, e lre oquíc enre noáco A prole e uução é vr e coro co loclzção o noáco n proeín or Por o, lgu rze e uução co prâero epecífco pr c ene -hélce ou -folh ê o eenvolv Váro éoo ê o propoo pr conrur rze que refl prole e uução Algu rze ple coo rz unár: M e co conráro,
32 ou coo rz cógo genéco, one M é gul o núero íno e uuçõe e e neceár pr converer u coon e noáco e u coon, não epreg fenôeno ológco o co e eqüênc e proeín, rze coo fíl PAM e BSUM, erv oervção epírc e eqüênc ncer e eu ecenene u Mrze e Suução PAM A eoolog une PAM Pon Accepe Muon, coo prer rz fíl, for eenvolv por Mrgre Dyhoff e colorore [7, 8] Ele oervr 572 uçõe ce e 7 uperfíl e eqüênc e proeín proxene relcon e concluír que uuçõe não ocorrer leorene Algu uuçõe e noáco ceáve ocorrer pronene que our, provvelene porque el não ê grne efeo ore função proeín Io gnfc que eqüênc e u e fíl não eve, necerene, er o eo noáco, noáco copráve A une PAM ão ulz pr er ânc evoluconár enre u eqüênc e noáco Du eqüênc e 2 verge e u une PAM e u ére e uuçõe ce, o é, que for ncorpor e rep pr o ecenene, rnfor e 2 co u é e u eveno e ução ponul por noáco Io não quer zer que ferenç enre o noáco eqüênc é e % porque u poção poe ofrer e u ução C rz é eenh pr coprr u eqüênc cu ânc evoluconár, refle no núero e une PAM, é nc no própro noe rz Ex: PAM 8, PAM 2, PAM 25 Quno or o ínce, or ânc evoluconár U célul, e u rz PAM repreen prole log prole e que u noáco e uuío pelo noáco e u eqüênc que ão une PAM vergene ore prole pono por Shr [9], co relção à noção e une PAM ão: prero, u veze não e conhece eqüênc ncer que e quer eur;, cer upoçõe eve er u coo verer, crreno e erro no lnheno Seguno, pen uuçõe ão coner, nerçõe e reoçõe ão gnor, e oo que não e poe eelecer relção ex enre eqüênc Mrze e Suução BSUM U ouro conuno e el e uução fo eenvolvo eo e lnheno e pequen uce loco conervo que c e lgu nível efno e
33 lre [9] Coo rze BSUM ncorpor uo o, ão, preuvelene, prec Quno à noenclur ulz, pr rze BSUM, quno or eu núero, enor ânc evoluconár Algu coprçõe enre perfornce rze BSUM e PAM ão or por Shr [9], e coo env e e eelecer u correponênc enre u eern PAM co u BSUM l, coo e r e rze e nurez ferene e coprçõe não ão necerene corre Verfc-e enreno que rze BSUM 62 ão lene recoen pr lnheno e eqüênc e uc e nco e o Funçõe e Penlzção por Gp Quno não e fz nção enre erur ou exenão e gp, penlzção e gp poe er expre por u função lner coo: w, one w é penle cor por u ére e gp conecuvo e g é o vlor oluo penle oc u gp Enreno, conerno que crção e u gp ponul, e coo u gp co exenão or o que, e ev u eveno uconl, o po que gp ponu ão cro prr e eveno ucon, crção e gp conecuvo ou u gp co exenão é provável o que crção e gp olo Por ee ovo, exe u enênc e penlzr erur e u gp o que exenão e u gp á ero Pr levr e con e ferenç e prole, u funçõe ferene ão ulz pr exprer o peo e gp Poe-e, por exeplo, ulzr u função u-v: w w, o é, w 2 n w w 2 w n U função couene ulz é função lner: w, one é o copreno o gp, é penle pr erur o gp e é penle pr exenão o gp Enreno, ê-e oro que e função ue prole pr longo gp U oelo relíco coner função: w log eelen e Wunch [] propuer u lgoro pr clculr o vlor o lnheno óo que upor qulquer função w e penlzção e gp que é, e u eênc, eelhne
34 o lgoro áco vo nerorene A coplexe o lgoro propoo, enreno, é cúc Algoro quráco no enno, for eenvolvo, pr lgun po epecífco e função e penlzção Algun ee ão oro por Seul e Men [5] 23 Dânc e Eção Alnheno e eqüênc poe er vlo o o pono e v e ânc e eção, o nvé e lre A noção e ânc enre eqüênc e crcere ore u lfeo Σ fo nrouz n éc e 95 U o éoo ulzo efne ânc enre u eqüênc e coo eno o enor núero poível e cer operçõe ác neceár pr rnforr e A operçõe ác norlene ulz ão quel á v: uução e u crcer por ouro nu poção qulquer eqüênc; reoção e u crcer nu poção qulquer eqüênc; nerção e u crcer nu poção qulquer eqüênc; Por exeplo, pr rnforr eqüênc AACGAK e ATCGGA ão neceár, pelo eno, egune operçõe: reover K 2 nerr u G 3 uur A por T A A C G A K A A C G A A T C G G A A T C G G A A A C G A A A C G G A A T C G G A A T C G G A A A C G G A A T C G G A A T C G G A A T C G G A Fgur 2 9 A eqüênc AACGAK é rnfor n eqüênc ATCGGA A ânc enre el é 3 Pr rnforr AACGAK e ATCGGA ão neceár, no íno, 3 operçõe, enão z-e que ânc e eção, ou pleene ânc enre eqüênc é 3 U vez que c operção correpone u ução ocorr urne evolução, groerene, e eçõe erve pr er ânc evoluconár enre u eqüênc A coo poe er ruío peo ferenco pr gp, gule e egule no cálculo lre enre eqüênc, o eo poe er feo no cálculo ânc e eção Seul e Men [5] or que o eo lgoro ulzo pr cálculo e lre poe er ulzo pr cálculo e ânc nále e eqüênc,
ucr por eqüênc lre, no no eno glol quno locl, poe ruzr-e e ucr por eqüênc e pequen ânc e eção 35 24 Alnheno Múlplo U lnheno úlplo é u lnheno e e u eqüênc e, coo no lnheno e u eqüênc, gp ão nero n eqüênc e oo que el fque co o eo nho E egu, eqüênc ão lnh forno o ceno o crcere que ocup e colun e ou gp ão ão per colun copo excluvene por gp coneno e u lnheno é u eqüênc copo o crcere coun e c colun o lnheno Exe ver for e e er vergênc e u conuno e eqüênc lnh ânc enre eqüênc U el ânc o coneno, é conerr ânc ol enre eqüênc coo eno o o núero e crcere eqüênc e c colun que fere o crcere o coneno ur o e pre, é o ânc enre oo o pre e eqüênc, o é, ponução e c colun erá por: < p,, one p é u função e ponução coo v nerorene, pr lnheno e u eqüênc U our lernv, u por J Kececoglu [], é rvé e u função que o coo rgueno oo o eleeno e u colun e reorn u ponução Méoo Heuríco pr Alnheno Múlplo éoo pr clculr lre ou ânc e lnheno óo, no eno eáco, coo á fo vo, poue coplexe qurác, o que nvlz, n or veze, u ulzção, epeclene quno há u eqüênc e grne copreno envolv ee co, éoo heuríco ê o ulzo que, e por u lo não grne o elhor reulo, por ouro fornece reulo rzoáve e n ão fcíve U éoo heuríco que e o ulzo pr lnhr úlpl eqüênc heuríc r cone e lnhr, nclene, u eqüênc próx e ucevene r ecolheno enre our eqüênc, que e prox e u á ecolh e gregno- o lnheno Ee éoo requer, pr eqüênc, Ο 2 coprçõe e pre e eqüênc e Ο ncluõe e u nov eqüênc no lnheno
uro éoo heuríco, eelhne ee, é o lnheno glol progrevo, ecro por Dure e Ae [4] e rê po ver Fgur 2 : Copur o ecore o lnheno ou ânc enre oo o pre e eqüênc; 2 Conrur u árvore gu que refl lre enre eqüênc, uno ânc o lnheno e pre; 3 Alnhr eqüênc eguno árvore gu Correponeno c nó n árvore, o lgoro lnh u eqüênc ou lnheno que eão oco co eu o nó vznho proceo é repeo prr árvore eqüênc e ernno n rz 36 Po : Copur lnheno e pre e o eqüênc pr clculr rz e ânc S S2 S3 S4 S5 ATCTCGAGA ATCCGAGA ATGTCGACGA ATGTCGACAGA ATTCAACGA S S2 S3 2 3 S4 27 36 9 S5 3 33 2 27 S S2 S3 S4 S5 Po 2: Conrur árvore árvore gu rz e ânc Po 3: Alnheno progrevo: lnhr eguno árvore gu S S2 S3 S4 S5 Po 3 lnhr S co S2 S A T C T C G A G A S2 A T C C G A G A Po 32 lnhr S3 co S4 S3 A T G T C G A C G A S4 A T G T C G A C A G A Po 33 lnhr S,S2 co S3,S4 S A T C T C G A G A S2 A T C C G A G A S3 A T G T C G A C G A S4 A T G T C G A C A G A Po 34 lnhr S,S2,S3,S4 co S5 S A T C T C G A G A S2 A T C C G A G A S3 A T G T C G A C G A S4 A T G T C G A C A G A S5 A T T C A A C G A Fgur 2 Proceo e Alnheno Progrevo
37 Pelo eno o prole poe ocorrer co e orge U ele é que, coo o éoo exge que u árvore gu e conruí prr e ânc enre pre e eqüênc, e poe hver eqüênc hoólog que nclu uo egeno não orepoo, árvore conruí erá fl, po ânc clcul enre egeno erá grne uro prole é o conheco coo u vez u gp, epre u gp, o é, gp que ão nrouzo e lnheno nerore não poe er ofco e po poerore Alnheno glol eo e loco Algu veze eqüênc ere copr coprlh loco epro por regõe não conerv Quno o ocorre, u orge equ pr nále eqüênc cone n uc por ee loco conervo Bloco ão lnheno e frgeno e eqüênc que poe er exo copoo e egeno ênco ou não exo e poe er unfore exene e o eqüênc ou não unfore prác, loco não unfore ão coun conuno e loco elecono poe er conene, o é, o loco ocorre uno e u lnheno glol úlplo Depo que o loco á eão lnho, u orge clác poe er ulz pr lnhr regõe enre loco ver Fgur 2 BC UIFRME E Ã EXAT BC Ã UIFRME E EXAT G T A C A T T G C T C G A A T G C A T G C C A T T G G A G T C A T G A C G C C A C T G T A C G A A T G T A T C A T T G G T A T A G C A C T C A G T A G A T G G C T C G T A T G C A T G C C T A T G C A G T C A T G A C G C C A C T A T G C G A A T G T A T C A T T A T G C T A G C A C T C A Fgur 2 Bloco loco conene; loco não conene Váro progr ê o progrevene propoo pr lnheno e loco úlplo prero ulzv u lgoro e orenção, epo urgr ouro eo e árvore e ufxo, ulzo pr copur loco exo Poerorene urgu o progr ASSEMBE que nl árvore e oo o pre e e pr enconrr loco
38 unfore não necerene exo U or vnço ruz-e no progr DIAIG, que pere loco que não e necerene unfore Algoro quráco for propoo pr enconrr loco conene, reuzno o prole u uc e cnho óo e u grfo, e n lgoro u-quráco ê o propoo pr ee eo co, no enno, o prole e enconrr loco não conene é nrável Alnheno eo e Movo Algu eqüênc poue óulo hoólogo que poe ocorrer e ferene poçõe relv n eqüênc e n er repe nu e eqüênc Pr e u eqüênc ee prole é fícl e é neceár ulzção e heuríc U orge cone e, pr c plvr w, e copreno, ucr n vznhnç e w, o u cero pono e core, plvr que confr u o ecore co w ecore e w erá o e oo ee ecore reulo copução erá o pel plvr e copreno e or ecore or prole co e orge é o requereno e epço proporconl 2, pr proeín ur orge con coprçõe e pre pr copur lnheno loc úlplo Progr e lnheno locl recene ão eo e éoo eíco que u heuríc pr reolver prole e ozção uro éoo heuríco pr lnheno úlplo poe er enconro e Shr Perf Do u lnheno S e copreno l, u perfl é u rz l Σ {}, cu colun ão veore e prole enono freqüênc e c íolo n colun correponene o lnheno A prr e eqüênc e u e fíl, poe er conruío u perfl fíl e prr ee perfl, é poível vlr e u eqüênc perence ou não àquel fíl E vlção é enível quno é fe por u perfl o que e for fe prr coprção co eqüênc eprene Ao nvé e olhr pr eqüênc, o foco vol-e pr o fíl e eqüênc Se eqüênc S e o perfl P, o e copreno l lnheno enre S e P l poe er vlo por w p,, one w, p é prole o crcer perencer à colun Deve er prevo é u vlor pr w, vene e vlção poe er fe por progrção nâc
Apen íulo e lurção, Fgur 22 or u exeplo e perfl conruío prr e recho e 5 eqüênc fíl glon: Trecho e 5 eqüênc e glon: Poção: 2 3 4 5 HBB_AMI W K R R Y HBB_XEB W T Q R Y HBB_MUSE W T Q R F HBB_EPPA W T K R Y HBB_CYGMA W T Q R H Perfl Anoáco: 2 3 4 5 F,2 H,2 K,2,2 Q,6 R,2, T,8 V W, Y,6 39 Fgur 22 U oelo eíco perfl lurvo pr fíl glon, conruío prr eqüênc Moelo Econo e Mrov prác, u perfl eíco eve levr e conerção lgun fore coo, por exeplo, o fo e que eqüênc, gerlene, preen copreno ferene, o que requer rução e pono pr nerçõe e reoçõe Alé o, peo ferenco eve er o à e, epener u poção n eqüênc Ee refneno, eor e neceáro pr crção e on perf, nrouze uo prâero lvre que ó poe er clculo rvé e env-erro U Moelo Econo e Mrov HMM o nglê: Hen Mrov Moel pr u fíl e eqüênc é u oelo eíco o coneno eruur prár e fíl É u po e perfl nâco, que pou u opolog elor o que o perfl oro nerorene U HMM poe er vo coo u áqun e eo fn cuo eo poe er o íolo o lfeo e queão áco nucléco ou noáco prâero e u HMM ão eo prr e u conuno e eqüênc e reneno, rvé e u orge eác, e envolve: o núero e eo, prole e eão o íolo e c eo ou e não eão e qulquer íolo, prole e rnção enre eo
4 HMM for nrouzo enre o no 6 e 7 e n éc e 8 for plco e e e reconheceno e fl [2] Aulene, o uo e HMM e-e nenfco n nále coprv e eqüênc ológc e erá o foco ee rlho, pelo que erá oro co elhe poerorene 22 Ienfcção e Gene Co o creceno o núero e proeo genôco ve creceno é o neree por éoo uozo e enfcção e gene e regõe receneene eqüenc É e grne porânc pr olog oleculr, u eqüênc e DA, loclzr o gene, e coo enfcr eu eleeno funcon rele, ver orgen ê o eenvolv que propõe enfcção e gene prr enfcção e u une funcon Gene e Procroo E orgno procroo, or pre e u eqüênc e DA é cofcne e proeín; c gene é u eqüênc conínu e e, e recho e não-gênco A Fgur 2 3 or eruur e u gene ípco e u orgno procroo Algu e pó regão prooor egue-e o nl e níco rncrção o nglê: rncrpon r e Ane e epo o gene exe regõe que não erão ruz e proeín 5 UTR unrnle regon e 3 UTR 5 UTR 3 UTR Prooor Iníco rncrção Sr coon Gene Sop coon Fgur 2 3 Eruur e u gene ípco e procroo no nível o DA ep e rução, c coon, erá ruzo e u noáco rooo percorre o RA no eno ownre e quno enconr o r coon AUG coeç gerr u eqüênc e noáco e coro co eqüênc o RA, eguno o cógo
4 genéco unverl Fgur 4 proceo pár quno u op coon UAA, UAG ou UGA é enconro oo coo eqüênc e RA é l pr cofcr proeín vr epener e qul e o prero nucleoíeo lo, o que coneqüeneene, eernrá qul erá o prero coon lo A eqüênc ACGAGUCGCCAAACUAUUCGU, por exeplo, poe er l e rê for ferene Fgur 24 C u rê for poíve repreen u quro e leur De for, loclzção o níco o gene não é exene eern ACG AGU CGC CAA ACU AUU CGU Thr Ser Arg Gln Thr Arg Ser 2 3 AC GAG UCG CCA AAC UAU UCG U Glu Ser Pro An Tyr Ser A CGA GUC GCC AAA CUA UUC GU Arg Vl Al y eu Phe Fgur 24 3 quro e leur poíve nu eqüênc e DA RF e RF U quro e leur ero RF open reng fre é u eqüênc e coon e op coon Se-e que c regão cofcne e pen u op coon U RF on cong open reng fre é u pequen RF gerlene co eno e coon U ner e enfcr regõe cofcne é olhr pr grne exenõe e RF, ou n, ucr n eqüênc e DA, conerno o rê quro poíve e leur, u op coon e volr n eqüênc é enconrr u r coon E orge, enreno, é flh pr eecr gene uo pequeno, lé o que exe uo RF o que gene ur orgen ão ulz pr enfcr regõe cofcne e procroo que envolve freqüênc o coon ou o noáco no qu ee ão ruzo nu eqüênc e DA Por exeplo, e-e que o noáco eucn, Alnn e Trpofn ocorre n proeín u x e 6,9:6,5:, Se-e é que o nucleoíeo A ou T ocorre co u freqüênc or o que 9% n ercer poção o coon epener epéce
42 E éoo que envolve e freqüênc, o coon poe er conero nepeneneene, enre, coo é poe hver u epenênc enre o coon e eu neceore Ce e Mrov Pr crnr regõe cofcne e não cofcne, poe-e ulzr u oelo e ce e Mrov one c nucleoíeo é u eo e ão copu prole eqüênc ere e recho cofcne ou não, prr prole e c nucleoíeo egur ouro nucleoíeo enro e for e u regão cofcne ur orge ulz, uno-e que e conhece o RF e u eqüênc, é ruzr e RF e eqüênc e coon e ulzr u ce e Mrov co 64 eo A prole e rnção e eo erão prole e c coon egur qulquer ouro coon e u regão cofcne Ao fnl, poe-e copur prole e que u RF e cofcne E o o co, ce poe er e prer ore ou uperor Regõe Prooor A regõe prooor e eqüênc e DA funcon coo pono e âncor pr RA-polere, ncno não ó o locl e níco rncrção coo é x e rncrção E regõe, n que cur, ocorre co lo gru e conervção n or o orgno Coo exeplo, Shr [9] preen u coneno regão próx o locl e níco rncrção E Col: nnnttgacnnnnnnnnnnnnnnnnnntataatnnnnnnnnn Iníco rncrção Fgur 2 5 Coneno regão e níco rncrção E Col TTGAC ocorre 35 e ne o pono e níco rncrção, e TATAAT é conheco coo TATA-ox ou Prnow ox, 2 e ne e Algun éoo ê o ulzo pr enfcção e regõe prooor, eo n freqüênc e e c poção e regõe prooor conhec U rz poconl ple e peo poe er conruí co o vlore e f,, one f, é freqüênc e n poção e ufxo e regõe prooor conhec, uno-e que poçõe ão nepenene Co e rz, poe-e clculr prole e u eqüênc er u regão prooor
43 Gene e Eucroo A eruur e o ecno e expreão e gene e eucroo é coplex o que e procroo A Fgur 2 6 lur eruur e u gene ípco e orgno eucroo Alé o fo e que eqüênc e DA, n regão o gene, pou exon e nron lerno, logo pó regão 3 UTR preen u eqüênc e vár Aenn, ch e poly-a le enre c exon-nron é cho plce-e e é nlzo por pequen eqüênc epecífc e 2p pre e e A exree 5 e u nron, que correpone à exree 3 e u exon, é ch onnor-e e exree 3 e u nron, ou 5 e u exon, é ch ccepor-e Too ee n, onnor-e, ccepor-e, poly-a, e, prooor, 5 UTR, 3 UTR ão funen pr enfcção e gene e eucroo Accepor Se Donnor Se Exon Inerno Prooor 5 UTR Exon ncl Exon Ternl 3 UTR Iníco Trncrção Sr coon Splce Se Sop coon Poly-A Inron Fgur 2 6 Eruur e u gene ípco e eucroo no nível o DA Splce-e A reoção o nron e coneqüene unão o exon e u ce, ch plcng o nglê unção, é execu por enz que reconhece regõe e unção exon-nron, qu, e gerl, preen lo gru e conervção [9] Denro o nron freqüeneene prece u pono e âncor, cho rnch pon Enre o rnch pon e o ccepor e prece é co freqüênc u regão rc e prn, o que uxl enfcção e gene e eucroo U vez que uo gene ê lernve plcng, e lgu vrçõe e u eo gene lgun exon não ão ulzo e 5% o gene
44 AGGUAAGUCTGACCAGG freqüênc: 62 77 6 74 84 5 [63 9] 78 55 onnor e rnch pon rc e prn ccepor e Fgur 2 7 Junçõe exon-nron e u gene eucroo ípco A lre co o coneno e regõe e unção cheg ngr % Moelo e Mrov Econo Exe ver orgen ulz pr enfcção e gene, e e ce e Mrov U ne cou, por exeplo, é e no oelo e Mrov e 5ª ore, que coner u nel e 6 e conecuv n eqüênc e DA Du el e prole ão ulz, u pr regõe cofcne e our pr regõe não cofcne Pr c 6-upl el ão prole e ocorrer ex e, 5 e nerore A, u eqüênc, é clcul u prole, pr c u el, o é, prole eqüênc er u regão cofcne ou não Ee oelo não lev e conerção nforçõe repeo o quro e leur, e por o é cho hoogêneo U oelo que coner o rê poíve quro e leur é cho não hoogêneo