Avalação da qualdade do ajuste 1
Alguma termologa: Modelo ulo: é o modelo mas smples que pode ser defdo, cotedo um úco parâmetro ( µ) comum a todos os dados; Modelo saturado: é o modelo mas complexo a ser defdo, em que se cosdera um parâmetro específco para cada observação a amostra ( µ 1, µ,..., µ ). O modelo saturado tem tatos parâmetros quato observações, ajustado perfetamete os dados. Modelo correte: qualquer modelo com p < parâmetros, stuado etre os modelos ulo e saturado (modelo vestgado).
Questão etre os modelos possíves defdos etre o modelo ulo (mas smples) e o modelo saturado (mas complexo), qual escolher? Nota Embora o modelo saturado (com parâmetros) seja vável, por ão resumr os dados, ele é usável como base de avalação (e comparação) para modelos termedáros (com p< parâmetros). 3
Fução desvo (devace fucto) No cotexto de MLG, sejam y,..., 1, y y varáves aleatóras produzdas por uma mesma dstrbução pertecete a famíla expoecal de dspersão f ( y; θ,φ), com g( µ ) = η, sedo ( ) fução de lgação e η = x β = β0 + β1x1 +... + β pxp 1 a parte sstemátca do modelo. g a Coforme vsto aterormete a log-verossmlhaça do modelo fca dada por: ( θ ) ( ) = θ y b lµ ; y + c( y; φ), (1) = 1 φ 1 lembrado que b ( θ ) = µ, µ g ( η ) = e η = x β = β0 + β1x1 +... + β pxp 1. 4
A fução desvo proporcoa uma medda de dfereça etre os modelos saturado e correte, baseado-se a dfereça dos máxmos das log-verossmlhaças avaladas sob cada modelo (deotadas por l ( y;y) e l ( µ;y ˆ ), respectvamete), sedo defda por: ( µ ˆ ) ( y;µ ˆ ) y; = = ; φ { l( y; y) l( µ ˆ y) }. Chamamos ( y; µ ˆ ) desvo escaloado e ( y; µ ˆ ) de desvo. Repare que se = 1 φ temos ( y; µ ˆ ) = ( y;µ ˆ ). É mportate observar que um valor pequeo para o desvo dca que o modelo correte (com p < parâmetros) proporcoa um ajuste quase tão bom quato o modelo saturado (com parâmetros), forecedo dcatvo de bom ajuste para o modelo proposto. Vamos usar a fução desvo para avalar a qualdade do ajuste de MLGs e como base de comparação de dferetes MLGs ajustados. 5
eotado por ˆ θ = θ ( ˆ ) e θ θ ( ~ ) de θ, µ ~ =, respectvamete, as estmatvas de máxma verossmlhaça µ = 1,,...,, para os modelos termedáro (com p< parâmetros) e saturado (com parâmetros), com base a log-verossmlhaça apresetada em (1), ( y; µ ˆ ) fca dado por: ( ) = { ~ ~ y ; µ ˆ y ( θ ˆ θ ) + ( b( ˆ θ ) b( θ )} = 1. (Exercíco!) Pode-se ada escrever: ( ;µ ˆ ) = d = 1 y, sedo d, = 1,,..., chamado compoete do desvo, correspodete à dfereça das duas logverossmlhaças assocada à ésma observação. 6
O quadro segute apreseta a fução desvo para algumas dstrbuções: strbução esvo = ˆ 1 Normal ( ) y µ Posso ( y log( y ˆ µ ) ( y µ )) = ˆ 1 Bomal { y log( y ˆ µ ) + ( y ) log[ ( y ) ( µ )]} = ˆ 1 Gama ( log( ˆ µ y ) + ( y ˆ µ ) ˆ µ ) = 1 = 1 Normal Iversa ( y ˆ µ ) ( ˆ µ y ) As demostrações dos desvos para esses cco modelos fcam como exercícos. 7
Teste da qualdade do ajuste baseado a fução desvo Sob certas codções*, ( y; µ ˆ ) tem dstrbução asstótca χ com p graus de lberdade, servdo tal dstrbução como base para avalação e teste do ajuste comparado o valor calculado de ( y; µ ˆ ) com o quatl 1 α da dstrbução χ p. * Cosultar seção 1.4.1 do lvro do professor Glberto de Paula. Uma regra mas formal para avalação do ajuste cosste em verfcar se o valor calculado de ( y; µ ˆ ) ão é muto maor que a méda da dstrbução χ p, que é p. No R: o O desvo referete ao modelo ajustado pode ser verfcado o summary, sedo apresetado como Resdual devace acompahado dos respectvos graus de lberdade; o Adcoalmete, o R solta como Null devace o desvo correspodete ao modelo ulo, acompahado dos respectvos graus de lberdade. 8
Outras meddas de qualdade do ajuste Estatístca Χ geeralzada de Pearso: Χ = ( y ˆ µ ) V ( ˆ µ ) = 1, ode V ( µˆ ) é a fução de varâca estmada. Também para esta estatístca é usual comparar o valor calculado com os quats da dstrbução χ com p graus de lberdade. o Para a dstrbução Normal, Χ correspode à soma de quadrado de resíduos; o Para as dstrbuções bomal e Posso, Pearso. Χ correspode à estatístca do teste qu-quadrado de o No R: Χ pode ser obtdo por sum(resduals(ajuste,type= pearso )**). 9
Pseudo R : Sejam 0 e, 1 respectvamete, os desvos para o modelo ulo (com um úco parâmetro, costate para todas as observações) e para algum modelo termedáro sob estudo. efe-se o pseudo R como: R 0 1 1 = =, 0 0 1 represetado a proporção do desvo do modelo ulo explcada pelo modelo termedáro. o No R: Χ pode ser obtdo por (ajuste$ull.devace-ajuste$devace)/ajuste$ull.devace. 10
Crtéro de Iformação de Akake (AIC): O AIC é uma medda de qualdade de ajuste baseada a (log)-verossmlhaça e pealzada pelo úmero de parâmetros o modelo. Por sua costrução, é amplamete utlzado o processo de seleção de modelos, a busca por um modelo parcmooso (bem ajustado aos dados, mas com poucos parâmetros). O AIC para um partcular modelo é defdo como: l( ˆ; ) p AIC = µ y +, sedo p o úmero de parâmetros o modelo. Assm, quato meor o valor do AIC, melhor o modelo. o Uma regra geral é que se a dfereça etre os AICs de dos modelos é maor que, etão o modelo com meor AIC é fortemete preferível. o No R: o AIC pode ser extraído usado AIC() ou dretamete do summary. 11