INGEPRO Iovação, Gestão e Produção Jaero de 010, vol. 0, o. 01 www.gepro.com.br Cálculo de méda a posteror através de métodos de tegração umérca e smulação mote carlo: estudo comparatvo Helto Adre Lopes Barbosa (UFMG) helto@ufmg.br Ferado Luz Perera Olvera (UFMG) feradoest@g.com.br Thago Rezede Satos (UFMG) thagorezedeh@yahoo.com.br Gabrel Vcus Araújo Foseca (UFMG) pyqu@yahoo.com.br João Vtor Das Motero (UFMG) poctos@gmal.com Resumo: Neste trabalho são apresetados métodos de aproxmação umérca e smulação Mote Carlo, usados em Estatístca Bayesaa, além de se dscutr quas, etre os algortmos apresetados, são os mas efcetes, precsos e rápdos computacoalmete. O foco prcpal do estudo é a méda a posteror, cujos resultados calculados aaltcamete, são comparados com aproxmações e smulações obtdas para város parâmetros. De forma geral, os métodos de quadraturas são rápdos e efcetes, assm como a smulação Mote Carlo. Algumas ressalvas sobre estes algortmos foram percebdas e são apresetadas o estudo. Palavras-chaves: Itegração umérca; Smulação mote carlo; Estatístca bayesaa. 1. INTRODUÇÃO Em dversas stuações, desevolvdas em pratcamete todas as áreas do cohecmeto, ter defda, ou suposta como cohecda, a dstrbução de probabldade de um cojuto de dados é de grade mportâca. A partr de tal cohecmeto, calculam-se probabldades de ocorrêca de evetos, cofabldade, estatístcas de teresse e város assutos relatvos aos dados ou strumetos modelados. Exstem casos em que é ecessára a atualzação dos modelos defdos a pror e, esse ovo ajuste, se dá pela ecessdade de promover uma modelagem correta dos dados, ou ada devdo a modfcações ocorrdas durate o processo e que se fazem sgfcatvas em todos os cálculos do modelo. Nessas stuações, mutas vezes precsamos calcular uma tegral, tratável aaltcamete, ou ecesstamos estmar uma quatdade amostral de uma ova dstrbução, ada ão cohecda, ou mesmo estmar parâmetros descohecdos. Para facltar estas tarefas, métodos umércos, específcos e aproprados a cada stuação, podem ser aplcados. Neste trabalho, apresetaremos algumas aproxmações umércas e descreveremos suas aplcações em Estatístca Bayesaa, área que quase sempre ecessta de cálculos tesos em suas aálses. Dscutremos quas destes métodos são mas efcazes, precsos e rápdos o cálculo da méda a posteror. Usaremos as aproxmações város tamahos de amostra, além de dferetes valores de probabldade de sucesso θ. Os resultados obtdos pelos algortmos de aproxmação serão comparados com os valores aalítcos exatos, calculados da dstrbução a posteror. Todos os programas foram escrtos e mplemetados o freeware R (Developmet Core Team, 005) e ecotram-se dspoíves o Aexo ao fal deste texto. Este artgo ecotra-se orgazado da segute forma: No próxmo capítulo descrevemos rapdamete algus cocetos elemetares de Estatístca Bayesaa e, em seguda, o capítulo 3, apresetaremos os métodos umércos e as smulações utlzadas o estudo. O capítulo 4, mostra os resultados computacoas obtdos através da mplemetação 60
INGEPRO Iovação, Gestão e Produção Jaero de 010, vol. 0, o. 01 www.gepro.com.br dos algortmos descrtos o capítulo 3. Falmete, o capítulo 5, apresetamos as prcpas coclusões do estudo, ecerrado, o Aexo, com os códgos dos programas.. Estatístca Bayesaa.1 Itrodução Os compoetes báscos da Estatístca Bayesaa são: formação a pror, sumarzada através da dstrbução a pror; a formação trazda pela amostra de dados, que é resumda utlzado a fução de verossmlhaça; a dstrbução a posteror, que é uma atualzação da dstrbução a pror pelos dados, e, em algus casos, o cálculo da dstrbução de futuras observações. De maera smples, o problema pode ser colocado da segute forma: Seja ( 1,,..., k ) uma quatdade, descohecda e aleatóra, com possíves valores em um cojuto θ e admta que se deseje ferr sobre. A formação cal H, que vara de pessoa a pessoa, sobre θ é resumda probablstcamete em termos de uma fução de desdade: ( H ), (1) que é uma descrção a respeto da certeza pessoal em relação a θ, com base em toda formação dspoível sobre o parâmetro. Esta dstrbução (1) é deomada dstrbução a pror de θ. Com o propósto de atualzar esta formação sobre θ, uma amostra de valores de um vetor aleatóro X ( X 1, X,..., X ) relacoado a θ, será observado. Ates de observarmos a amostra, descreveremos a certeza sobre x, dado θ, através da fução: p ( x H, ), x X, () Note que a depedêca de θ é fudametal. A formação em X ( X 1, X,..., X ) é resumda pela Fução de Verossmlhaça (Mgo & Gamerma, 1999) com respeto a θ, fução esta que assoca a cada θ o valor p ( x H, ). Para um valor fxado de θ, a Fução de Verossmlhaça forece a probabldade de ser observado x quado θ é o verdadero estado de atureza. Depos de atrbuídas as fuções de probabldade em (1) e (), é de teresse ecotrar uma maera de atualzar a opão cal, com respeto a θ, utlzado a formação cotda a amostra. A técca utlzada para realzar tal operação é o teorema de Bayes, sto é, a dstrbução a posteror de θ é dada por: p( x ) p( x ) ( ) p ( x), (3) p( x) p( x) Se utlzarmos a otação ( x) em lugar de p( x) para efatzar o fato de que ( x) é uma atualzação de ( ), de (3) temos: Note que: p( x ) p( x ) ( ) ( x ), (4) p( x) p( x) p ( x) p( x ) ( ) d (5) Etão (5) correspode a desdade margal de x, que é deomada dstrbução predtva e é o deomador de (4). Para uma explcação mas detalhada ver Zuazola et al. (1996). 61
INGEPRO Iovação, Gestão e Produção Jaero de 010, vol. 0, o. 01 www.gepro.com.br. Estmação Potual A dstrbução a posteror é toda a formação dspoível sobre após observarmos os dados. Apesar dsto, mutas vezes precsamos resum-la em um úco úmero. Este úmero é o estmador de Bayes. Seja, a perda esperada, ode é o valor real e são possíves estmatvas de. O estmador de Bayes para é o valor tora míma a perda esperada (6), a posteror, sto é: L, x mm L, x ˆ B mm E d (6) Cosderado L,, temos: E x E x x E x E x x E x E E (7) Assm, para ecotrarmos o estmador de Bayes com L,, temos que mmzar (7) com relação a, e para sso, devemos fazer d E x como mostrado em (8). 0 d d E x 0 E x 0 (8) d A cofrmação de que o estmador escolhdo para é realmete um poto de mímo é realzada através de (9), ou seja: d E x 0 (9) E x d Cofrmado (9) que o estmador escolhdo para é realmete um poto de mímo, etão ˆ B E x será o estmador de Bayes, ou seja, quado a perda quadrátca for utlzada, sto é, L,, a méda da dstrbução a posteror de será o estmador de Bayes. Devemos ressaltar que dferetes fuções de perda geram dsttos estmadores de Bayes e, frsamos ada, que a escolha da fução de perda é completamete subjetva. Quado a fução de perda escolhda for a 0 1 (lea-se zero um), a moda a posteror é o estmador de Bayes. Porém, ser for trabalhada a perda absoluta, o estmador de Bayes será a medaa a posteror (MIGON & GAMERMAN, 1999)..3 Aálse Cojugada Seja x : verossmlhaça ode é o espaço paramétrco assocado à ). Seja H h a f uma famíla de dstrbuções amostras (fuções : a A uma famíla de dstrbução de probabldade, ode A é um cojuto de hper-parâmetros. Dzemos que e H são famílas cojugadas aturas se: 1. f x é proporcoal a um membro de H ;. H é fechado em relação a produtos, sto é: 6
h X Exemplo f x f h x Sejam X X1, X,, X varáves aleatóras que, dado, são codcoalmete depedetes e detcamete dstrbuídas c... d. com dstrbução Posso. Etão a fução de verossmlhaça será: f X x 1 e e 1 x! 1 x! A caddata à famíla cojugada atural da famíla Posso é a famíla de dstrbução Gama,, com, 0, ou seja, por (4), (5) e (10) temos: x 1 e 1 e x 1 1 1 x! e e X x x 1 1 1 e x e d 1 1 e d 0 0 x! 1 ; 1 X ~ Gama x 3. Métodos Numércos 3.1 Quadraturas x (10) Supoha que desejamos calcular uma tegral defda (Ato, 000), I o tervalo ( a, b). Bascamete, os métodos de quadratura usuas cosstem em: 1. Escolher potos,,,..., o tervalo 1 ( a, b).. Determar pesos w s, tas que, I w f ( 1 ). b a f ( ) d, Desta forma, cosegue-se calcular o valor aproxmado da tegral em estudo. Vejamos, a segur, algus métodos de quadraturas. 3.1.1 Método Newto-Cotes O método de Newto-Cotes (Flho, 000) é também deomado como aproxmação pelo poto médo, já que em cada subtervalo de ampltude h, o valor da fução é tomado o poto médo do subtervalo. Aproxmações pelo extremo esquerdo e dreto dos subtervalos ão são mutos utlzadas. Um esquema desta abordagem pode ser apresetado como: 1. Dvda o tervalo ( a, b) em partes guas;. Avale a fução f ( ) 3. A tegral I, é aproxmada por (11): Iˆ NC h f a 1 ( h) h, para o poto médo de cada tervalo; b a h (11) INGEPRO Iovação, Gestão e Produção Jaero de 010, vol. 0, o. 01 www.gepro.com.br 1 1 x 1 x 63
INGEPRO Iovação, Gestão e Produção Jaero de 010, vol. 0, o. 01 www.gepro.com.br 3.1. Regra Trapezodal As aproxmações pelos extremos esquerdos e dreto são raramete usadas em aplcações, porém, se é tomada a méda etre elas, obtemos um resultado chamado de Aproxmação Trapezodal ou Regra do Trapézo (Flho, 000), a qual é usada comumete. O ome aproxmação trapezodal pode ser explcado cosderado-se o resultado o qual f (x) é maor ou gual a zero em [a,b], de tal forma que, b f ( x), represeta a área abaxo de f (x) e a acma de [a,b]. Geometrcamete, a aproxmação trapezodal resulta em se aproxmar esta área pela soma das áreas dos trapézos. Neste caso, a tegral I é aproxmada por (1): Iˆ T f ( a) h ( 1) f ( b) f a h 1 3.1.3 Regra de Smpso, para h b a (1) Para melhorar as aproxmações pelos potos médo e trapezodal, substtuem-se os cotoros superores leares por cotoros superores curvos, escolhdos para se ajustarem mas estrtamete à forma da curva y f (x). Esta é a déa subjacete da Regra de Smpso (Flho, 000), a qual usa curvas parabólcas da forma y ax bx c y. A Regra de Smpso é obtda dvddo-se o tervalo [a,b] por um úmero par de subtervalos, de gual comprmeto h, aproxmado a área abaxo de y f (x) em pares sucessvos de subtervalos. A soma destas aproxmações serve, etão, como uma estmatva de b f ( x). A aproxmação da tegral I por este método é dada por (13): a Iˆ S h f ( a) 4 3 4 1 f a h / / 1 1 4. Métodos de Smulação Mote Carlo para b a h. 4 3 f a h f ( b) Para lustrar os Métodos de Smulação Mote Carlo (Gamerma, 1997), seja f ( ) ( ), uma fução da qual queremos obter amostras de h( ) sem resolver a tegral. h f ( ) d Supoha que uma amostra é faclmete gerada de uma fução g ( ), chamada de fução de referêca e de quem desejamos obter uma amostra de h( ) - a fução h( ) deve ser postva e padrozável. Se tvermos a stuação ateror, podemos gerar uma amostra de h (), sabedo apeas a forma fucoal de f ( ) e tedo uma amostra de g ( ). As téccas possíves para tal geração amostral são os Métodos da Rejeção e SIR (Samplg Importace Resamplg ou Bootstrap Bayesao). 4.1 Método da Rejeção Supoha que exsta m tal que, (13) f ( ) m, g( ) O objetvo é ecotrar g ( ), da qual sabemos gerar amostras e, tal que, g ( ) m seja f (). Para sso, cosdere o algortmo a segur: (14) 64
INGEPRO Iovação, Gestão e Produção Jaero de 010, vol. 0, o. 01 www.gepro.com.br 1. Gere ~ g( ) para 1,,..., T ;. Gere u ~ uforme (0,1 ) ; 3. Se f ( ) u mg( ) 4. Volte ao passo 1., se aceta, ode m é tal que f ( ) m; g( ) A amostra obtda é uma de amostra de h( ), 1,..., k, k T. A dstrbução g( ) deve ser fácl de ser obtda e coter caudas pesadas, além da amostra gerada ser grade o sufcete para varrer bem todo o espaço paramétrco. 4. Método SIR (Samplg Importace Resamplg) Se m (14) o procedmeto ateror ão está dspoível, uma possbldade é usar o SIR. Veja o algortmo a segur: 1. Escolher uma fução de referêca;. Gerar uma amostra,,..., de 1 g ( ); 3. Para cada 1,,..., calcule: f ( ) w g( ) e q w w 1 4. Selecoar uma amostra * * * 1,,..., de T g( ) da amostra orgal 1,,..., de g (),assumdo p( ) q ; 5. Gere u ~ uforme (0,1 ) e observe se: u ( 0, q1), escolha 1. u ( q1, q1 q ), escolha. u ( q1 q, q1 q3 q3 ), escolha 3. As mesmas lmtações observadas pelo Método da Rejeção são váldas para o SIR. 5. Resultados Expermetas Com o objetvo de avalar todos os métodos e apresetar coclusões sobre quas são os melhores para cada stuação, mostraremos, a segur, algus resultados ecotrados através da aplcação dos algortmos apresetados aterormete. Geramos os dados de uma dstrbução Bomal, com parâmetros e ( X ~ b( ; )). Assummos uma dstrbução a pror para sedo uma dstrbução Beta (1; 1), cuja dstrbução a posteror, por cojugação, é uma Beta, com parâmetros x e x, com méda gual x. Foram utlzados város tamahos amostras, ou seja, =10 e =100. Quato ao úmero de terações, temos 10, 100 e 1.000 para os métodos de quadraturas; 1.000, 10.000 e 100.000 para o método da Rejeção e 1.000 e.000 para o SIR, bem como valores dferetes de probabldades de sucesso, sto é, θ =0.01; 0.50 e 0.99. 5.1 Resultados de Quadraturas 65
INGEPRO Iovação, Gestão e Produção Jaero de 010, vol. 0, o. 01 www.gepro.com.br Nesta seção, para valores de θ=0.01, θ=0.5, θ=0.99, =10, =100 e sedo o úmero de terações guas a 10, 100 e 1000, apresetamos os resultados obtdos as Tabelas 1, e 3. Para um maor poder de comparação, foram calculados valores exatos das médas a posteror para dversos θ e. Nas Tabelas 1, e 3, otamos que a partr da mlésma teração, a aproxmação da méda a posteror coverge para o valor exato. Porém, observamos ada que o tempo gasto é maor quado temos mas terações e que, com somete dez terações, ão observamos um bom valor para a méda, depedete do valor de θ ou de. Saletamos também que o aumeto de só acarretará a perda da formação da dstrbução a pror, pos quado é muto grade, a méda de X (amostra) é mas formatva que a méda dos s (a pror). Os tempos de smulação são bem pequeos, sedo pouco mportates se comparados us com os outros. TABELA 1 Resultados Newto-Cotes θ Iterações Méda a posteror Méda Exata Tempo(seg.) 10 0.01 10 0.08756 0.08333 0.00 100 0.08337 0.00 1000 0.08333 0.60 0.50 10 0.50001 0.50000 0.00 100 0.50000 0.00 1000 0.50000 0.05 0.99 10 0.86755 0.91667 0.00 100 0.91616 0.00 1000 0.91666 0.04 100 0.01 10 0.09046 0.049019 0.00 100 0.0490 0.0 1000 0.0490 0.05 0.50 10 0.46505 0.46078 0.00 100 0.46078 0.00 1000 0.46078 0.04 0.99 10 1.33989 0.96078 0.00 100 0.95987 0.00 1000 0.96078 0.04 TABELA Resultados Trapezodal θ Iterações Méda a posteror Méda Exata Tempo(seg.) 10 0.01 10 0.08756 0.08333 0.00 100 0.08338 0.00 1000 0.08333 0.05 0.50 10 0.50001 0.50000 0.00 100 0.50000 0.00 1000 0.50000 0.05 0.99 10 1.41755 0.91667 0.00 100 0.97116 0.0 1000 0.916 0.03 100 0.01 10 0.09046 0.0490 0.00 100 0.0490 0.00 1000 0.0490 0.05 0.50 10 0.46505 0.46078 0.00 100 0.46078 0.00 1000 0.46078 0.05 0.99 10 1.33989 0.96078 0.00 100 0.95987 0.00 1000 0.96078 0.05 TABELA 3 Resultados Smpso θ Iterações Méda a posteror Méda Exata Tempo(seg.) 10 0.01 10 0.08333 0.08333 0.00 100 0.08174 0.0 1000 0.0833 0.05 0.50 10 0.49883 0.50000 0.00 100 0.50000 0.01 1000 0.50000 0.04 0.99 10 1.0748 0.91667 0.00 100 0.9345 0.00 66
INGEPRO Iovação, Gestão e Produção Jaero de 010, vol. 0, o. 01 www.gepro.com.br 1000 0.91849 0.05 100 0.01 10 0.0053 0.0490 0.00 100 0.04856 0.01 1000 0.04901 0.04 0.50 10 0.5473 0.46078 0.00 100 0.46078 0.00 1000 0.46078 0.04 0.99 10 0.89371 0.96078 0.00 100 0.96509 0.00 1000 0.96078 0.05 5.. Resultados dos Métodos de Smulação Mote Carlo 5..1 Resultados do Método da Rejeção Nesta seção, utlzamos o Método da Rejeção para obter uma dstrbução empírca a posteror de θ. Os resultados são apresetados as Fguras 1, e 3. Na Fgura 1, é gerada uma amostra aleatóra de uma dstrbução Bomal com os parâmetros =10, =100 e θ=0.01. Note que quado aumetamos o tamaho da amostra de 10 para 100, a amostra da dstrbução a posteror de θ se aproxma mas do valor real de θ=0.01. Observe também que a dstrbução empírca de θ (hstograma) é bem smlar à dstrbução a posteror exata (tracejado). Para valores do úmero de terações acma ou guas a 10.000, os gráfcos são bem parecdos. Na Fgura, com =10, =100 e θ=0.50, como observado a Fgura 1, quado aumetamos o tamaho da amostra, a dstrbução empírca a posteror gerada pelo método da Rejeção se cocetra mas em toro do valor de θ assumdo. A dstrbução empírca a posteror de θ é bem smlar à dstrbução exata em todos os casos mostrados a Fgura. Na Fgura 3, com θ=0.99, a dstrbução a posteror é bem assmétrca, cocetrada em toro do valor de θ, assumdo prcpalmete quado utlzamos um tamaho de amostra =100. A dstrbução empírca é bem parecda com a dstrbução exata, como fo vsto também as fguras aterores, atestado que o Método da Rejeção é plausível. Na Tabela 4, são apresetadas as estatístcas descrtvas da dstrbução empírca a posteror de obtda através do Método da Rejeção. Para =10, a teração que melhor estmou a méda a posteror fo a com 10.000, para qualquer θ, cuja varâca fo a meor em relação às outras terações. Cosderado =100, os valores das médas e varâcas fcaram muto próxmos um dos outros, mas devemos lembrar que quato maor a quatdade de terações maores são os tempos de smulação. Destaca-se a medaa, que forece resultados smlares aos resultados da méda. Vale ressaltar também, que a varâca dmu ao passo que o tamaho da amostra aumeta, sto é, a dstrbução empírca a posteror de θ se tora mas precsa. Observe ada que, para =10, a varâca está a tercera casa decmal geralmete, equato que para =100, a varâca está a quarta casa decmal. Em geral, a porcetagem de rejeção do método de Rejeção é grade, sedo ecessáro um úmero alto de terações para obter um úmero de amostras satsfatóro. 7
INGEPRO Iovação, Gestão e Produção Jaero de 010, vol. 0, o. 01 www.gepro.com.br Tamaho da amostra gerada da Bomal (, 0.01) Número de terações 1.000 10.000 100.000 Dstrbução a posteror empírca de a posteror exata Dstrbução a posteror empírca de a posteror exata Dstrbução a posteror empírca de a posteror exata 10 0 4 6 8 10 1 0 4 6 8 10 1 0 4 6 8 10 1 Dstrbução a posteror empírca de Dstrbução a posteror empírca de Dstrbução a posteror empírca de 100 0 5 30 a posteror exata 0 5 30 a posteror exata 0 5 30 a posteror exata FIGURA 1 - Método da Rejeção para bomal (,0.01). Tamaho da amostra gerada da Bomal (, 0.5) Número de terações 1.000 10.000 100.000 Dstrbução a posteror empírca de Dstrbução a posteror empírca de Dstrbução a posteror empírca de 10 0 1 3 4 5 a posteror exata 0 1 3 4 5 a posteror exata 0 1 3 4 5 a posteror exata Dstrbução a posteror empírca de Dstrbução a posteror empírca de Dstrbução a posteror empírca de 100 0 4 6 8 10 a posteror exata 0 4 6 8 10 a posteror exata 0 4 6 8 10 a posteror exata FIGURA - Método da Rejeção para bomal (,0.50). Tamaho da amostra gerada da Bomal (, 0.99) Número de terações 1.000 10.000 100.000 Dstrbução a posteror empírca de Dstrbução a posteror empírca de Dstrbução a posteror empírca de 10 a posteror exata a posteror exata a posteror exata Dstrbução a posteror empírca de Dstrbução a posteror empírca de Dstrbução a posteror empírca de 100 0 5 a posteror exata 0 5 a posteror exata 0 5 a posteror exata FIGURA 3 - Método da Rejeção para bomal (,0.99). 68
INGEPRO Iovação, Gestão e Produção Jaero de 010, vol. 0, o. 01 www.gepro.com.br TABELA 4 Estatístcas do método da rejeção Méda Estatístcas Descrtvas Iterações θ a posteror Exata Medaa Méda Varâca 10 1.000 0.01 0.08 0.0679 0.0949 0.0070 0.5 0.5 0.5079 0.5009 0.0189 0.99 0.9 0.966 0.9133 0.0059 10.000 0.01 0.08 0.063 0.0831 0.0056 0.5 0,5 0.5043 0.509 0.0190 0.99 0.9 0.9404 0.9175 0.0058 100.000 0.01 0.08 0.066 0,0845 0.0059 0.5 0.5 0.5001 0.4993 0.0193 0.99 0,9 0.9399 0.9399 0.0058 100 1.000 0.01 0,05 0.0471 0.0490 0.0004 0.5 0.46 0.4664 0.4609 0.007 0.99 0.96 0.9670 0.9614 0.0004 10.000 0.01 0,05 0.0503 0.054 0.0005 0.5 0,46 0.4631 0.4613 0.003 0.99 0,96 0.9636 0.9604 0.0004 100.000 0.01 0,05 0.0454 0.0485 0.0004 0.5 0.46 0.4611 0.4614 0.004 0.99 0.96 0.9640 0.9610 0.0004 5.. Resultados do Método SIR A segur, apresetamos os resultados do método SIR para obteção da dstrbução empírca a posteror de θ, porém, como o Método SIR gasta mas tempo, escolhemos um úmero de terações de 1.000 e.000. As Fguras 4, 5 e 6 mostram que o método se aproxma bem da dstrbução a posteror (tracejado) para qualquer e θ, mas com algumas dfereças, sedo o Método da Rejeção mas satsfatóro. Na Tabela 5, temos que, com.000 terações, as varâcas são meores, porém, os tempos de smulações são bem maores do que com 1.000 terações. Em relação à méda a posteror, tato para 1.000 quato para.000 terações, os valores estão bem próxmos, sedo melhor com.000. Vale ressaltar que o úmero de terações cosderadas do algortmo do Método SIR é bem meor se comparado com os outros métodos, pelo fato deste método ser mas demorado. 69
INGEPRO Iovação, Gestão e Produção Jaero de 010, vol. 0, o. 01 www.gepro.com.br Tamaho da amostra gerada da Bomal (, 0.01) Número de terações 1.000.000 Dstrbução a posteror empírca de Dstrbução a posteror empírca de 10 a posteror exata a posteror exata Dstrbução a posteror empírca de Dstrbução a posteror empírca de 100 0 5 a posteror exata 0 5 a posteror exata FIGURA 4 - Método SIR para bomal (,0.01). Tamaho da amostra gerada da Bomal (, 0.5) Número de terações 1.000.000 Dstrbução a posteror empírca de Dstrbução a posteror empírca de 10 0 1 3 4 5 a posteror exata 0 1 3 4 5 a posteror exata Dstrbução a posteror empírca de Dstrbução a posteror empírca de 100 0 4 6 8 10 a posteror exata a posteror exata FIGURA 5 - Método SIR para bomal (,0.50). Tamaho da amostra gerada da Bomal (, 0.99) Número de terações 1.000.000 Dstrbução a posteror empírca de Dstrbução a posteror empírca de 10 a posteror exata a posteror exata Dstrbução a posteror empírca de Dstrbução a posteror empírca de 100 0 5 30 35 a posteror exata 0 5 30 35 a posteror exata FIGURA 6 - Método SIR para bomal (,0.99). 70
INGEPRO Iovação, Gestão e Produção Jaero de 010, vol. 0, o. 01 www.gepro.com.br TABELA 5 Estatístca do método SIR Estatístcas Descrtvas Iterações θ Méda a posteror Exata Medaa Méda Varâca 10 1.000 0.01 0.08 0.0544 0.0876 0.0065 0.5 0,5 0.55 0.581 0.094 0.99 0.9 0.9134 0.889 0.0086.000 0.01 0,08 0.0643 0.0785 0.0058 0.5 0.5 0.50 0.5008 0.049 0.99 0.9 0.9463 0.916 0.0061 100 1.000 0.01 0,05 0.0494 0.0487 0.0007 0.5 0.46 0.460 0.4575 0.003 0.99 0.96 0.9589 0.9595 0.0003.000 0.01 0.05 0.0494 0.0499 0.0004 0.5 0.46 0.4579 0.4578 0.003 0.99 0.96 0.968 0.968 0.0005 6. Cosderações Fas Neste artgo, descrevemos de forma resumda, Estatístca Bayesaa, algortmos de aproxmação umérca e smulação Mote Carlo, além de compararmos dferetes métodos em relação à obteção da méda a posteror. As mplemetações de todos os programas foram satsfatóras. Todos os três tpos de quadraturas (Newto-Cotes, Trapezodal e Smpso) foram muto rápdas e efcetes, com um úmero de terações razoável e ão havedo grades dfereças etre elas. Saletamos que a dfculdade a mplemetação das quadraturas cresce à medda que o úmero de parâmetros aumeta, prcpalmete, para um úmero superor a 10. O Método da Rejeção e o SIR produzram bos resultados, porém destacamos que este segudo é o método mas leto, motvo pelo qual, optamos por um úmero de gerações bem meor para ele. Ressaltamos ada que o método SIR é de grade vala quado m (14) ão está dspoível mpossbltado o uso do Método da Rejeção. A lustração de algus métodos, aqu abordados, deve ser apeas uma fote trodutóra de pesqusa, cuja mportâca cresce à medda que, também aumeta a relevâca do trabalho a ser desevolvdo. REFERÊNCIAS ANTON, H. Cálculo um ovo horzote, Bookma, Porto Alegre: Bookma, 000. FILHO, F. F. C. Algortmos Numércos. São Paulo: LTC, 000. GAMERMAN, D. Markov Cha Mote Carlo: Stochastc Smulato for Bayesa Iferece. Lodo: Chapma ad Hall, 1997. MIGON, H. S.; GAMERMAN, D. Statstcal Iferece: a tegrated approach. Ro de Jaero: Arold, 1999. R DEVELOPMENT CORE TEAM. R: a laguage ad evromet for statstcal computg, R Foudato for Statstcal Computg, Vea, Austra, 005. 71
INGEPRO Iovação, Gestão e Produção Jaero de 010, vol. 0, o. 01 www.gepro.com.br ZUAZOLA, I. P. L.; DA SILVA, A. J.; VALLE, R. B. A. Bayesa ferece errors varables models uder ellptcal dstrbuto, 1º SINAPE. Aas, 378 378, 1996. Aexo Neste aexo, são apresetados os programas escrtos a lguagem do freeware R, os quas foram usados para gerar todos os expermetos do artgo. 1. Método de Newto-Cotes betalha <- legth(amostra) - amostra <- rbom(100,1,0.01) sum(amostra) + beta ewtocotes <- fucto (lf, lsup, t, alfa, beta, amostra) #atualzação dos parâmetros da dstrbução a posteror alfalha <- alfa + sum(amostra) betalha <- legth(amostra) - sum(amostra) + beta h <- (lsup-lf) / t soma <- 0 <- 1 whle (<=t) soma <- soma + (lf+(* - 1)/*h)*(dbeta(lf+(* - 1)/*h, alfalha, betalha)) <- +1 soma <- h*soma soma mytme <- system.tme(myoutput <- ewtocotes(0,1,1000, 1, 1, amostra)). Método Trapezodal amostra <- rbom(100,1,0.01) trapezodal <- fucto (lf, lsup, t, alfa, beta, amostra) #atualzação dos parâmetros da dstrbução a posteror alfalha <- alfa + sum(amostra) h <- (lsup-lf)/t fa <- lf*dbeta(lf, alfalha, betalha)/ soma <- 0 <- 1 whle (<=t) soma <- soma + (lf+(*- 1)*h/)*dbeta(lf+(*-1)*h/, alfalha, betalha) <- +1 fb <- lsup*dbeta(lsup, alfalha, betalha)/ soma <- h*(fa + soma+ fb) soma mytme <- system.tme(myoutput <- trapezodal(0,1,1000, 1, 1, amostra)) 3. Regra de Smpso amostra <- rbom(100,1,0.01) smpso <- fucto (lf, lsup, t, alfa, beta, amostra) #atualzação dos parâmetros da dstrbução a posteror alfalha <- alfa + sum(amostra) 7
INGEPRO Iovação, Gestão e Produção Jaero de 010, vol. 0, o. 01 www.gepro.com.br betalha <- legth(amostra) - sum(amostra) + beta h<-(lsup-lf)/t fa <- lf*dbeta(lf, alfalha, betalha) soma1<- 0 <-1 whle (<=(t/)) soma1 <- soma1 + (lf + (4* + 1)*h/)*dbeta(lf + (4* + 1)*h/, alfalha, betalha) <-+1 soma1 <- 4*soma1 soma<- 0 <-1 whle (<=(t/)) soma <- soma + (lf + (4* + 3)*h/)*dbeta(lf + (4* + 3)*h/, alfalha, betalha) <-+1 soma <- *soma fb <- lsup*dbeta(lsup, alfalha, betalha) tegral <- (h/3)*(fa + soma1 + soma + fb) tegral mytme <- system.tme(myoutput <- smpso(0,1,1000, 1, 1, amostra)) 4. Método da Rejeção amostra <- rbom(100,1,0.01) mrejecao <- fucto (tam, alfa, beta, amostra) #atualzação dos parâmetros da dstrbução a posteror alfalha <- alfa + sum(amostra) betalha <- legth(amostra) - sum(amostra) + beta mv <- mea(amostra) <-1 j<-1 <-vector("umerc") whle(<=tam) caddato <- ruf(1,0,1) razao <- dbeta(caddato, alfalha, betalha)/dbeta(mv, alfalha, betalha) u <- ruf(1,0,1) f (u <= razao) [j] <- caddato j<-j+1 <-+1 mytme <- system.tme(myoutput <- mrejecao(100000, 1, 1, amostra)) 5. Método SIR amostra <- rbom(100,1,0.01) sr <- fucto (ger, alfa, beta, amostra) q <- vector("umerc") w <- vector("umerc") <-vector("umerc") cestrela <- vector("umerc") estrela <- vector("umerc") 73
INGEPRO Iovação, Gestão e Produção Jaero de 010, vol. 0, o. 01 www.gepro.com.br #atualzação dos parâmetros da dstrbução a posteror alfalha <- alfa + sum(amostra) betalha <- legth(amostra) - sum(amostra) + beta T <- ger/0 caddatos <- rbeta(ger,alfa,beta) w <-dbeta(caddatos, alfalha, betalha) somaw<-sum(w) <-1 tamw<-legth(w) whle (<=tamw) q[]<- w[]/somaw <-+1 for ( 1:T) cestrela <- sample(caddatos, ger, replace = TRUE, q) for (j 1:ger) estrela[] <- sample(cestrela, 1, replace=false, q) estrela mytme <- system.tme(myoutput <- sr(000, 1, 1, amostra)) 74