Tabela A4.2. MIR obtido com simulação 1. Para 2 S 4, estimar os parâmetros associados a uma mistura de s componentes e avaliar rs = ms+

Tabela A4.2. MIR obtido com imulação. Para 2 S 4, etimar o parâmetro aociado a uma mitura de compoete e avaliar r = m+ m r ecotra-e defiido o Apêdice 2); 2. para S=2, gerar 99 amotra paramétrica boottrap de dimeão a partir do modelo com S compoete e com parâmetro ˆ θ e calcular o valor de r para cada um. 3. e r é uperior a 94 do valore obtido por boottrappig, aumetar S de e repetir o pao 2 e 3 o valor máximo de S é 4); cao cotrário, aumir que o úmero de compoete mitura é e parar. Fote: Polymei e Titterigto 998), pág. 296 Atravé de um deig experimetal, Polymei e Titterigto 998) cocluem que o eu método apreeta um melhor deempeho relativamete ao método bae de Widham e Cutler 992) e que é equivalete, em termo de taxa de uceo, à abordagem baeada o boottrappig do tete do rácio de máxima veroimilhaça LRTS), quado a compoete etão bem eparada. Para amotra de pequea dimeão o método LRTS é preferido, e quado a dimeão da amotra aumeta o doi método ão equivalete. OUTRAS ABORDAGES O método Poterior Predictive Check propoto por Rubi 984) é uma abordagem baeada a imulação para a elecção de modelo Lo, 2005). A ideia bae é a de aferir e o modelo propoto pode reproduzir a caracterítica do dado obervado. O parâmetro decohecido ão etimado atravé da amotragem de Gibb, Gibb amplig, quado a hipótee ula é uma mitura de ditribuiçõe ormai. A variâcia é extraída a partir de uma ditribuição Gamma ivera e a média é igual à média amotral. Wag et al. 2004) apreetam uma verão modificada do algoritmo EM, a que deigam por plit ad merge EM SSMEM), que alteradamete epara e ue compoete, etimado de forma imultâea ão ó o parâmetro da ditribuição mitura como também o úmero de compoete. 352

O pao da etimação do procedimeto MIREV eleccioa o úmero de compoete que permite maximizar a fução MIR. Apear da implicidade aociada ao cálculo de S, Widham e Cutler 992) advertem para o perigo de e umariar a qualidade do ajutameto atravé de uma úica medida. Dete modo, acrecetam o pao da validação, com o propóito de medir a cofiaça com que o úmero de compoete é eleccioado o pao da etimação. O idicador de cofiaça propoto é a probabilidade do procedimeto MIREV aumir o eu máximo o úmero de compoete forecida pelo pao da etimação ˆp ). Quado o valor de ˆp é elevado, exite cofiaça de que foi efectuada uma correcta ecolha de S. Por outro lado, um valor baixo para ˆp ugere que ou a compoete etão pouco eparada ou o úmero de compoete foi eleccioado icorrectamete. Eta probabilidade é etimada por boottrappig. Claro que aociado ao pao de validação exite mai uma vez o perigo de umariar muita iformação um úico úmero. Se mai iformação é deejada, pode er examiada a ditribuição boottrap do úmero de compoete. Eta ditribuição pode ugerir valore alterativo para o úmero de compoete idetificada o pao da etimação. MIR: OVOS DESEVOLVIMETOS Polymei e Titterigto 998) propueram uma modificação ao trabalho de Widham e Cutler 992) para a determiação do úmero de compoete exitete uma mitura. A modificação do método é motivada pelo facto da matriz F e torar igular quado e ajutam muita compoete e, coequetemete, Dete modo, propõem a detecção do meor valor de S para o qual m e aproximar de zero. m é próximo de zero, e a elecção de S-. Para deevolver eta abordagem, que ão poui uma teoria ubjacete, o autore adoptam procedimeto baeado o método de Mote Carlo, decrito a Tabela A4.2. 35

B ˆ * * * b θb θb) A.4.5) b E f x f x B b= = = Koih e Kitagawa 996) propueram uma técica de redução da variâcia a imulação de amotra boottrap com o objectivo de dimiuir o úmero de amotra eceária. MIR: ESTIMAÇÃO E VALIDAÇÃO Widham e Cutler 992) propõem aida o procedimeto MIREV - Miimum Iformatio Ratio Etimatio ad Validatio, cocebido para a determiação do úmero de compoete com bae o critério MIR Tabela A4..). Tabela A4.. Procedimeto MIREV Etimação i) Ecolher S e S 2, com 2 S S2. ii) Para cada S, S S S 2, obter o valor para o critério MIR aumido que a mitura poui S compoete. iii) Etimar o úmero de compoete como edo MIR é maximizado. Ŝ, o valor de S para o qual o Validação i) Para b=,..., B, obter uma amotra boottrap - boottrap ample - do dado origiai e calcular S ˆb, tal como o pao de etimação. ii) Etimar a probabilidade do máximo de pˆ úmero de veze em que S ˆ de cofiaça em Ŝ. b MIR ocorrer em S = Sˆ, deotar por = S ˆ /B), e uar ete valor como uma medida Fote: Adaptado a partir de Widham e Cutler 992) pág. 88 350

covecioal é a de que cada obervação pode er uada mai do que uma vez. Smyth 2000) refere que a ecolha de γ = 0,5 e apreeta como robuta uma grade variedade de problema e o valore de B etre 20 e 50 ão adequado em muita aplicaçõe. Smyth 2000) compara o critério CVIC com o critério BIC e o boottrap LRTS em aplicaçõe de amotra já etudada e coclui que eta trê metodologia apreetam deempeho emelhate a elecção da compoete um modelo de ditribuiçõe mitura ormai. EIC EFRO - CRITÉRIO DE IFORMAÇÃO DE EFRO Ihiguro et al. 997) propõem a obteção do valor para o critério de iformação de Akaike atravé de boottrappig, a que deiga por Critério de Iformação de Efro EIC), Efro boottrapped) Iformatio Criteria. Trata-e de outra exteão ao critério de Akaike, em que o termo de pealização em A.4.2) é etimado com bae o boottrap de Efro 979). ˆ ) EIC = 2log L+ 2b E A.4.2) Dete modo, b E ˆ ) é aproximado atravé do método de Mote Carlo com bae e B amotra obtida por bootrappig. ˆ * * * = θ θ ) A.4.3) b E E f X f X = = Em que ˆ* θ deota a etimativa de MV formada com bae a amotra boottrap. É poível aproximar ete evieameto boottrap com bae em B amotra boottrap idepedete: Seja iid... * * ˆ b b ) X,..., X E b=,..., B A.4.4) * ˆb θ a etimativa de máxima veroimilhaça formada com bae a amotra b b,..., B) =. Tal coduz a: 349

APÊDICE 4. ABORDAGES BASEADAS A SIMULAÇÃO o Apêdice 4 decrevem-e a eguite abordage baeada a imulação, tai como o critério CVIC Smyth, 2000), EIC Efro Ihiguro et al., 997), MIREV Widham e Cutler, 992), Poterior Predictive Check Rubi, 984) e SMEM Wag et al., 2004). CVIC VALIDAÇÃO CRUZADA A correcção do evieameto da fução de veroimilhaça pode er realizada uado a validação cruzada, como em Smyth 2000). Ete autor propô um critério de iformação baeado a validação cruzada Cro-Validatio-Baed Iformatio Criterio CVIC). Ete critério ecolhe o úmero de compoete S com bae o valor do logaritmo da fução de veroimilhaça obtida por validação cruzada, cro-validated log likelihood, = x ˆ θ) log f ;, A.4.) em que ˆ θ deota a etimativa de máxima veroimilhaça de θ formada a partir da amotra obervada,,..., x x, apó er elimiada a obervação,..., ) =. Segudo Smith 2000: 65), the ue of cro-validatio i thi role ca be viewed a a alterative method to evaluatig the fitted model o a tet ample of the ame ize a the origial oe the traiig ample) o which θ i baed. Ete tipo de abordagem é muito exigete computacioalmete, dado que apea uma obervação é elimiada de cada vez. Dete modo, têm ido propota alguma modificaçõe ao procedimeto bae. Uma dea modificaçõe coite em dividir a amotra em v cojuto dijuto v > ), cada um de dimeão v ) e elimiar v obervaçõe de cada vez. Eta modificação é deigada por v-fold cro validatio. Outra alterativa, cohecida como validação cruzada de Mote Carlo, Mote Carlo cro-validatio, gera B partiçõe idepedete do cojuto de dado uma amotra de tete de dimeão γ e uma amotra de validação de dimeão γ ), 0 < γ <, para a etimação de θ. A grade difereça etre ete método e a abordagem 348