APERFEIÇOAMENTO DE TESTES NOS MODELOS SÉRIES DE POTÊNCIA NÃO-LINEARES GENERALIZADOS MARIA DO CARMO SOARES DE LIMA

Documentos relacionados
O problema da superdispersão na análise de dados de contagens

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

Teste de Razão de Verossimilhanças Bootstrap e Técnicas de Diagnóstico em Modelos em Séries de Potências Não-Lineares Generalizados

O problema da superdispersão na análise de dados de contagens

4 Critérios para Avaliação dos Cenários

MODELOS DE REGRESSÃO PARAMÉTRICOS

3 A técnica de computação intensiva Bootstrap

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

Regressão Múltipla. Parte I: Modelo Geral e Estimação

REGRESSÃO NÃO LINEAR 27/06/2017

Associação entre duas variáveis quantitativas

Capítulo 1. Exercício 5. Capítulo 2 Exercício

VEROSSIMILHANÇA PERFILADA NOS MODELOS NÃO LINEARES SIMÉTRICOS HETEROSCEDÁSTICOS. Mariana Correia de Araújo

Prof. Lorí Viali, Dr.

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Análise de Regressão Linear Múltipla VII

1. CORRELAÇÃO E REGRESSÃO LINEAR

2 Incerteza de medição

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

Testes não-paramétricos

Notas Processos estocásticos. Nestor Caticha 23 de abril de 2012

5 Métodos de cálculo do limite de retenção em função da ruína e do capital inicial

Prof. Lorí Viali, Dr.

PRESSUPOSTOS DO MODELO DE REGRESSÃO

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

Estatística II Antonio Roque Aula 18. Regressão Linear

Capítulo 2. APROXIMAÇÕES NUMÉRICAS 1D EM MALHAS UNIFORMES

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

Teoria Elementar da Probabilidade

AULA EXTRA Análise de Regressão Logística

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

DELINEAMENTOS EXPERIMENTAIS

Dados ajustáveis a uma linha recta

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

Análise de influência

5 Formulação para Problemas de Potencial

Interpolação Segmentada

2 Análise de Campos Modais em Guias de Onda Arbitrários

Análise de Regressão Linear Múltipla IV

5 Implementação Procedimento de segmentação

Prof. Lorí Viali, Dr.

ALGORITMOS PARA DADOS AUMENTADOS

2 Aproximação por curvas impĺıcitas e partição da unidade

3 Método Numérico. 3.1 Discretização da Equação Diferencial

7 - Distribuição de Freqüências

Estatística I Licenciatura MAEG 2006/07

AEP FISCAL ESTATÍSTICA

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Universidade de São Paulo Escola Superior de Agricultura Luiz de Queiroz Departamento de Ciências Exatas

3 Algoritmos propostos

4 Discretização e Linearização

CORRELAÇÃO E REGRESSÃO

Gráficos de Controle para Processos Autocorrelacionados

Análise de Variância. Comparação de duas ou mais médias

Reconhecimento Estatístico de Padrões

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

CURSO A DISTÂNCIA DE GEOESTATÍSTICA

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

Flambagem. Cálculo da carga crítica via MDF

Cálculo Numérico BCC760 Interpolação Polinomial

8 - Medidas Descritivas

Covariância na Propagação de Erros

Análise Exploratória de Dados

Modelagem da proporção de produtos defeituosos usando Modelo de Quase-verossimilhança

O íon lantanídeo no acoplamento Russell-Saunders e a classificação de seus estados segundo os subgrupos do grupo GL(4

3 Elementos de modelagem para o problema de controle de potência

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 1

Universidade Federal de São Carlos Centro de Ciências Exatas e de Tecnologia Departamento de Estatística UMA FAMÍLIA DE MODELOS DE REGRESSÃO

0.5 setgray0 0.5 setgray1. Mecânica dos Fluidos Computacional. Aula 7. Leandro Franco de Souza. Leandro Franco de Souza p.

EXERCÍCIO: VIA EXPRESSA CONTROLADA

Introdução a Combinatória- Aplicações, parte II

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 4

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

Classificação de Padrões

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

4 ANÁLISE DE CONFIABILIDADE COM ANÁLISE LIMITE

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares

O MMD se baseia no sistema no sistema linearizado das equações de fluxo de potência, ou seja: Δ (4.1)

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira

AULA 4. Segundo Quartil ( Q observações são menores que ele e 50% são maiores.

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 3

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Redução dos Dados. Júlio Osório. Medidas Características da Distribuição. Tendência Central (Localização) Variação (Dispersão) Forma

Nome: Nº: Estatística para Economia e Gestão Licenciaturas em Economia e Gestão. 2.º Semestre de 2008/2009

MAP Cálculo Numérico e Aplicações

UMA VALIDAÇÃO MATEMÁTICA PARA UM ALGORITMO QUE SIMULA MISTURAS DE DISTRIBUIÇÕES

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 2

TESTE DO QUI-QUADRADO - Ajustamento

R X. X(s) Y Y(s) Variáveis aleatórias discretas bidimensionais

Métodos Experimentais em Ciências Mecânicas

Transcrição:

APERFEIÇOAMENTO DE TESTES NOS MODELOS SÉRIES DE POTÊNCIA NÃO-LINEARES GENERALIZADOS MARIA DO CARMO SOARES DE LIMA Orentadora: Prof a Dr a Audrey Helen Marz de Aquno Cysneros Área de Concentração: Estatístca Matemátca Dssertação submetda como requermento parcal para obtenção do grau de Mestre em Estatístca pela Unversdade Federal de Pernambuco Recfe, feverero de 2012

Catalogação na fonte Bblotecára Jane Souto Maor, CRB4-571 Lma, Mara do Carmo Soares de Aperfeçoamento de testes nos modelos séres de potênca não-lneares generalzados / Mara do Carmo Soares de Lma - Recfe: O Autor, 2012. v, 57 folhas: tab. Orentador: Audrey Helen Marz de Aquno Cysneros. Dssertação (mestrado) - Unversdade Federal de Pernambuco. CCEN, Estatístca, 2012. Inclu bblografa e apêndce. 1. Estatístca Matemátca. 2. Teora assntótca. I. Cysneros, Audrey Helen Marz de Aquno (orentador). II. Título. 519.9 CDD (23. ed.) MEI2012 027

Dedco esse trabalho àqueles que estveram comgo nessa longa camnhada, feta de das cheos de sucesso e também de fracassos. À mnha mãe Edlúca, meu rmão Douglas, mnha avó Iracema, meu companhero Flávo e ao meu anjnho Letíca. Amo vocês! Construí amgos, enfrente derrotas, venc obstáculos, bat na porta da vda e dsse-lhe: Não tenho medo de vvê-la. (Augusto Cury)

Agradecmentos Prmeramente a Deus, que me guou por esse longo camnho até mas uma conqusta. Espero que ele esteja presente em mutas outras que vrão. Ao longo desses anos de estudo, meu foco sempre fo a área de Matemátca e, por algum motvo que só Ele deve saber, acabe conhecendo essa área maravlhosa que é a Estatístca, em que posso aplcar meus conhecmentos matemátcos e obter novos, antes temdos por mm, por assm dzer. À mnha orentadora Audrey Helen Marz de Aquno Cysneros, pelos conselhos e orentações fornecdas ao longo do trabalho. Foram mutas horas de trabalho árduo que me tomaram o sono e me leveram a mutos questonamentos. Apesar dos problemas ao longo desse ano, consegu com apoo da professora elevar meus níves de conhecmento e também ter afeção. Por sso, muto obrgada pelos momentos nesquecíves de alegras, rsos, choro e também desespero, que me fzeram crescer como pessoa. À mnha famíla, em especal à mnha mãe Edlúca, meu rmão Douglas e mnha vó Iracema, pelo apoo e credbldade que depostaram em mm. Agradeço do fundo do coração pela educação que mnha mãe me proporconou, sempre com muta garra, como a mulher guerrera que ela é. Devo tudo o que sou hoje a essa pessoa admrável que me amou desde o momento que soube que eu estava dentro dela, sem nem mesmo me conhecer. Obrgada também ao meu rmão, que sempre esteve comgo, mesmo que em pensamento, sempre torcendo pela mnha vtóra. Quanto à mnha avó, dgo que ela é mnha segunda mãe, apoando-me em tudo que faço. Assm, agradeço a todos da mnha famíla pelo apoo e credbldade no meu trabalho. Ao meu companhero, Flávo, que me deu sempre muto apoo e ncentvo nas dfíces e ntermnáves horas no computador. Além de companhero, posso dzer que fo como um pa que nunca tve. Portanto, obrgada pelos sermões e abraços quando precse. Talvez não tenha sdo tão precsa como devera, mas agora o faço: assm como se que você me admra, eu também o admro demas como companhero, pa e pessoa. A todos os professores e funconáros do Departamento de Estatístca da UFPE pelo apoo

e confança em mm, em especal à Valéra, que sempre me auxlou em tudo. Agora entendo porque me dsseram a segunte frase quando entre em Estatístca: Qualquer problema, procure Valéra. À professora Crstna por ter me mostrado como essa área de estudo pode ser tão encantadora e a todos os outros professores que fzeram parte dessa hstóra, nclusve aos professores do Departamento de Matemátca (mnha orgem). Aos estudantes de Estatístca que tve o prazer de conhecer, prncpalmente à Prscla que me ajudou em város programas durante a realzação dessa dssertação. Ao CNPq pelo apoo fnancero oferecdo. v

Resumo Essa dssertação tem dos objetvos. O prmero consste na obtenção de um fator de correção tpo-bartlett para a estatístca escore nos modelos em sére de potênca não-lneares generalzados. O segundo é comparar o desempenho dos testes baseados nas seguntes estatístcas, a saber: escore e suas versões corrgdas, razão de verossmlhanças e suas versões corrgdas e a gradente, no que tange ao tamanho e ao poder. Fnalmente apresentamos uma aplcação a dados reas. Palavras-chave: Correção tpo-bartlett, modelos em sére de potênca não-lneares generalzados, estatístca escore, estatístca da razão de verossmlhanças, estatístca gradente. Abstract Ths dssertaton has two purposes. The frst nvolves obtanng a correcton factor for the Bartlett-type statstcal scorng models n power seres nonlnear generalzed. The second s to compare the performance of the test score and ther corrected versons tests wth the gradent of the lkelhood rato and ts corrected versons wth respect to the sze and power. Fnally we present an applcaton to real data. Keywords: Bartlett-type correcton, models n power seres nonlnear generalzed, test score, lkelhood rato test, gradent test.

Índce Págna Lsta de Tabelas................................... v 1 Introdução 1 2 Modelos em séres de potênca não-lneares generalzados (MSPNLGs) 3 2.1 Introdução..................................... 3 2.2 Defnção e propredades............................. 4 2.3 Estmação dos parâmetros de regressão..................... 5 2.3.1 Testes baseados nas estatístcas da razão de verossmlhanças, escore e gradente em MSPNLGs........................ 6 3 Correção de Bartlett e tpo-bartlett 11 3.1 Introdução..................................... 11 3.2 Correção de Bartlett e tpo-bartlett nos MSPNLGs.............. 13 3.2.1 Obtenção dos A s............................. 20 4 Resultados numércos 22 4.1 Aplcação..................................... 33 4.2 Comentáros.................................... 36 5 Conclusões 38 v

Apêndce 40 A Cálculo dos Momentos 40 A.1 Dervadas do logartmo da função de verossmlhança............. 42 A.2 Cálculo de cumulantes.............................. 44 A.2.1 Dervadas dos cumulantes........................ 44 A.2.2 Cálculo dos A s.............................. 45 B Conjuntos de dados 53 Referêncas bblográfcas 54

Lsta de Tabelas Págna 2.1 Funções f, g, a e o suporte de algumas dstrbuções da famíla (2.1)..... 9 2.2 Funções t e q para algumas dstrbuções da famíla (2.1)............ 10 4.1 Tamanho dos testes - Modelo não-lnear Consul - p=4 e dferentes valores de n - (H 0 : β 7 = 0).................................. 25 4.2 Tamanho dos testes - Modelo não-lnear GPO - p=4 e dferentes valores de n - (H 0 : β 7 = 0)................................... 26 4.3 Poder dos testes - Modelo não-lnear Consul com n = 30, p = 4, α= 5%... 27 4.4 Tamanho dos testes - Modelo não-lnear BNG - p=7 e dferentes valores de n - (H 0 : β 5 = β 6 = 0)................................ 30 4.5 Tamanho dos testes - Modelo não-lnear Consul - p=7 e dferentes valores de n - (H 0 : β 5 = β 6 = 0)............................... 31 4.6 Poder dos testes em modelos não lneares com n = 30, p = 7, α = 5% e consderando o modelo BNG........................... 32 4.7 Valor das estatístcas do teste e p-valor - dados reas.............. 35 B.1 Número de espéces de pexe em um lago (y) e o logartmo da área do lago, em km 2, (x).................................... 53 v

Capítulo 1 Introdução Dados na forma de contagens ocorrem nas mas dferentes áreas do conhecmento. Os modelos de Posson e bnomal negatvo são amplamente utlzados para analsar dados desse tpo, sendo comum encontrar stuações em que a varânca da varável resposta é maor do que ou menor do que a méda, sendo essas denomnadas de sobredspersão e subdspersão, respectvamente. Estes fenômenos são bem conhecdos na lteratura estatístca e podem ser provocados por uma ou mas de uma causa. Exstem estudos sobre o efeto da sobredspersão quanto à nferênca realzada a partr de um modelo de Posson e modelos alternatvos foram propostos com o objetvo de acomodar a sobredspersão. Cordero et al. (2009) propuseram uma nova classe de modelos em séres de potêncas para representar a varável resposta, adotando como componente sstemátco uma função de lgação não-lnear entre a méda da varável resposta e a estrutura não-lnear do modelo. Esta classe de modelos é descrta pela sgla MSPNLGs (modelos em séres de potênca não-lneares generalzados). Desta forma, engloba-se város modelos dscretos mportantes em uma únca estrutura concetual. Esta famíla de dstrbuções dscretas tem uma estrutura bastante flexível para a modelagem de dados dscretos. Além dsso, esta classe de modelos engloba modelos tradconas tas como os modelos log-lneares, bnomal e bnomal negatvo. Slva (2010) dervou expressões em formas matrcas para o fator de correção de Bartlett à estatístca da razão de verossmlhanças nos modelos MSPNLG, supondo o parâmetro de dspersão conhecdo. Além dsso, obteve a correção do vés de segunda ordem, va Cox & Snell (1968), dos estmadores de máxma verossmlhança dos parâmetros nessa classe de 1

modelos. Dando contnudade aos trabalhos recentemente desenvolvdos a respeto do tema, a prncpal contrbução dessa dssertação é a obtenção de um fator de correção tpo-bartlett para a estatístca escore no modelo em questão. Essa correção vsa melhorar a qualdade de aproxmação da estatístca escore pela dstrbução qu-quadrado, dada por um polnômo na própra estatístca escore. Desta forma, obtemos uma estatístca escore modfcada tendo dstrbução qu-quadrado até ordem O(n 1 ), sob a hpótese nula. Outra contrbução dada nesse trabalho, fo avalar numercamente o desempenho dos testes baseados nas estatístcas, a saber: razão de verossmlhanças e escore, bem como nas versões corrgdas va Bartlett e tpo-bartlett, respectvamente e a gradente. No Capítulo 2, procuramos revsar os prncpas resultados teórcos relaconados com os MSPNLGs. Em partcular, mostramos como fcam os testes baseados nas estatístcas da razão de verossmlhanças, escore e gradente nessa classe de modelos. No Capítulo 3, revsamos a obtenção do fator de correção de Bartlett para a estatístca da razão de verossmlhanças e apresentamos a obtenção do fator de correção tpo-bartlett para a estatístca escore nos MSPNLGs. As fórmulas das correções são dadas em notação matrcal e podem ser mplementadas em sstema de computação algébrca. Vale salentar aqu que o Capítulo 3 será desenvolvdo de manera não-relaconada com os outros. No Capítulo 4, apresentamos resultados de smulação para avalar o efeto da correção para testes em MSPNLGs. Além dsso, resultados numércos sobre o comportamento em amostras fntas de dferentes testes nos MSPNLGs são apresentados em relação ao tamanho e poder. Por fm, uma aplcação a dados reas é apresentada e consderações são fetas no fnal do capítulo. Todos os procedmentos nferencas dervados dos resultados teórcos obtdos na dssertação são avalados e comparados através de smulações Monte Carlo as quas foram desenvolvdas a partr de programas construídos usando a lnguagem de programação matrcal Ox (Doornk, 2006). As maxmzações não-lneares necessáras para o cálculo das estmatvas de máxma verossmlhança foram fetas utlzando o algortmo quas-newton BFGS (Nocedal e Wrght, 1999, capítulo 8), dsponíves em funções pré-defndas da lnguagem Ox. 2

Capítulo 2 Modelos em séres de potênca não-lneares generalzados (MSPNLGs) 2.1 Introdução Cordero et al. (2009) propuseram uma nova classe de modelos em séres de potêncas nãolneares generalzados (MSPNLGs) que são defndos por um conjunto de varáves aleatóras ndependentes pertencentes à famíla de dstrbuções em séres de potênca e admtem que uma função monótona da méda da varável resposta seja defnda por um predtor não-lnear envolvendo regressores e parâmetros desconhecdos. Nesta classe de modelos, abordamos a stuação em que o parâmetro de dspersão é conhecdo. Neste capítulo, apresentamos a defnção dos modelos em séres de potênca não-lneares generalzados e algumas propredades. Além dsso, apresentamos aspectos nferencas tas como, a estmação dos parâmetros de regressão e mostramos como fcam os testes baseados nas estatístcas da razão de verossmlhanças, escore e gradente. 3

2.2 Defnção e propredades Consderemos n varáves aleatóras dscretas ndependentes Y 1,..., Y n tas que Y pertence à uma famíla de dstrbuções com parâmetros de méda µ > 0 e parâmetro de dspersão φ > 0 (que assummos ser conhecdo), cada uma com função de probabldade na forma π(y; µ, φ) = a(y, φ)g(µ, φ) y, y A ɛ, (2.1) f(µ, φ) em que o suporte de Y é um subconjunto A ɛ dos nteros {ɛ, ɛ + 1,...}, ɛ 0 e não depende de parâmetros desconhecdos. As funções a(y, φ),g(µ, φ) e f(µ, φ) são postvas, sendo as duas últmas funções analítcas dos parâmetros µ e φ, fntas e duas vezes dferencáves, em que f(µ, φ) é tal que f(µ, φ) = y A ɛ a(y, φ)g(µ, φ) y. Desde que seja satsfeta a suposção de que o parâmetro φ 0, que assummos ser conhecdo, a varável aleatóra Y tem uma dstrbução de probabldade completamente determnada por sua função de varânca. Para a famíla de dstrbução dada em (2.1), valem as seguntes relações: E(Y ) = µ = f g fg e V ar(y ) = V (µ, φ) = g g, (2.2) em que f = f(µ, φ), g = g(µ, φ) e o símbolo ( ) sgnfca que a dferencação é realzada em relação a µ. Note que a função de varânca, dada na segunda equação em (2.2) depende apenas da função g(µ, φ) e de sua prmera dervada. Observe também que há uma relação entre a méda de Y e o componente sstemátco, feta através de uma função de lgação da forma h(µ ) = η = η(x ; β), = 1,..., n. (2.3) Em (2.3), h( ) representa uma função de lgação conhecda e duas vezes dferencável tal que β = (β 1,..., β p ) T, (p < n), é um vetor de parâmetros desconhecdos a serem estmados, x = (x 1,..., x k ) T são os valores de k varáves explcatvas e η( ; ) é uma função possvelmente não-lnear no segundo argumento, contínua e dferencável com respeto 4

aos componentes de β. Além dsso, X = X(β) = η/ β T é a matrz de dervadas, com η = (η 1,..., η n ) T, tal que o posto é p para todo β, com elementos que são geralmente funções do vetor de parâmetros β desconhecdos. A famíla (2.1) contém dversas dstrbuções conhecdas, tas como: Posson, Bnomal, Bnomal Negatva, Posson Generalzada, Bnomal Negatva Generalzada, Borel, Consul, Borel-Tanner, Geeta-m e Haght. Algumas característcas de tas dstrbuções podem ser encontradas na Tabela 2.1. O logartmo da função de verossmlhança dos parâmetros do modelo, consderando um MSPNLG defndo por (2.1) e (2.3), dado o vetor de observações (y 1,..., y n ) T, pode ser expresso na forma: l(β; y) = n log{a(y, φ)} + =1 n [ y log{g(µ, φ)} log{f(µ, φ)} ]. (2.4) =1 Assummos que l(β; y) seja regular com respeto às dervadas em relação aos componentes de β até quarta ordem. Detalhes sobre as condções de regulardade podem ser encontradas em Cox & Hnkley (1974, Capítulo 9). 2.3 Estmação dos parâmetros de regressão A função escore para o vetor de parâmetros β é expressa por: em que r = 1,..., p. U r = l(β; y) β r = n =1 [ g y f ] 1 x g f h r. Matrcalmente, a função escore fca dada da segunte forma: U β = l(β; y) β = X T (T y Q), em que T =dag{t } ( = 1,..., n) é uma matrz dagonal n n com elementos defndos por t = g e Q = (q g h 1,..., q n ) é um vetor n 1 com o -ésmo elemento dado por q = f. f h As funções t e q para algumas dstrbuções podem ser encontradas na Tabela 2.2. 5

A matrz de nformação para β é expressa por: { } K β = E 2 l(β; y) = X T W X, (2.5) β β T em que W =dag{w } ( = 1,..., n) é uma matrz dagonal n n de pesos defndos por: ( w = q f g t f g Quanto à nferênca baseada no método de razão de verossmlhanças sobre o parâmetro β, esta pode ser realzada maxmzando numercamente o logartmo da função de verossmlhança do modelo. Alternatvamente, poderíamos utlzar o processo teratvo de Newton- Raphson com o ntuto de obter a estmatva de β. O processo teratvo escorng de Fsher é defndo como. ) 1. h β (k+1) = β (k) + K 1 (β (k) )U(β (k) ), k = 0, 1,... Vale ressaltar que t e q podem ser reescrtos como t = (V h ) 1 e q = µ (V h ) 1. Assm, a matrz T fca dada por (V L) 1 e o vetor Q por (V L) 1 µ, em que µ = (µ 1,..., µ n ) é um vetor n 1. Esse processo teratvo pode ser reescrto como um processo de mínmos quadrados reponderados, mas detalhes ver Slva (2010). 2.3.1 Testes baseados nas estatístcas da razão de verossmlhanças, escore e gradente em MSPNLGs Consderemos o vetor Y = (Y 1,..., Y n ) T representando n observações ndependentes cujo logartmo da função de verossmlhança l(β; y), dado por (2.4), depende do parâmetro desconhecdo β = (β 1,..., β p ) T. Assuma que o vetor de parâmetros β pode ser decomposto como β = (β T 1, βt 2 )T, sendo β 1 = (β 1,..., β q ) T o vetor de parâmetros de nteresse e β 2 = (β q+1,..., β p ) T o vetor de parâmetros de perturbação. Da mesma forma, consderemos a decomposção da matrz modelo X = (X 1, X 2 ) e da função escore U(β) = (U 1 (β) T, U 2 (β) T ) T. Sejam os estmadores de máxma verossmlhança ˆβ = ( ˆβ T 1, ˆβ T 2 )T e β = (β (0) 1 T, β T 2 )T os estmadores de máxma 6

verossmlhança rrestrto e restrto de β, respectvamente. A decomposção de β nduz às seguntes partções da matrz de nformação de Fsher, dada na sua forma matrcal em (2.5), e sua nversa: K(β) = K 11 K 12 K 21 K 22 e K(β) 1 = K11 K 12 K 21 K 22 sendo K 11 = X T 1 W X 1, K 22 = X T 2 W X 2, K 12 = K T 21 = X T 1 W X 2, K 11 = (R T W R) 1, K 22 = (X T 2 W X 2 ) 1 + C(R T W R) 1 C T (covarânca assntótca de ˆβ 2 ) e K 12 = K 21 = (R T W R) 1 C T, em que R = X 1 X 2 C e C = (X T 2 W X 2 ) 1 X T 2 W X 1 é uma matrz n q, sendo suas colunas vetores dos coefcentes de regressão lnear das colunas de X 1 sobre X 2, tal que o peso é W. Em mutas stuações, há nteresse em testar hpótese sobre uma parte do vetor de parâmetros β, dgamos H 0 : β 1 = β (0) 1 contra H 1 : β 1 β (0) 1, em que β (0) 1 é um vetor especfcado de dmensão q (q p). A estatístca da razão de verossmlhanças para o teste de H 0 é defnda como LR = 2[l( ˆβ 1 ; ˆβ 2 ) l(β (0) 1 ; β 2 )], (2.6) em que o estmador de máxma verossmlhança rrestrto de β é ˆβ = ( ˆβ T 1, ˆβ T 2 ) e β = (β (0) 1 T, β T 2 )T é o estmador de máxma verossmlhança restrto sob a hpótese nula, sendo β 2 o estmador de máxma verossmlhança restrto de β 2 sob a hpótese nula. A estatístca da razão de verossmlhanças tem, sob a hpótese nula, dstrbução assntótca χ 2 q, em que q é o número de restrções mpostas sob H 0. Rejetamos a hpótese nula, ao nível de sgnfcânca α, se LR > χ 2 (α;q), em que χ2 (α;q) é o percentl (1 α) da dstrbução χ2 q. A estatístca escore (Rao, 1948) para testar H 0 contra H 1 é dada por: S R = U( β) T K( β) 1 U( β), em que U(β) é a função escore, K(β) é a matrz de nformação de Fsher e β = (β (0) 1, β 2 ) T sendo β 2 é o estmador de máxma verossmlhança restrto de β 2 e β (0) 1 um vetor especfcado de dmensão q. A estatístca escore tem, sob a hpótese nula, dstrbução assntótca χ 2 q. Rejetamos a hpótese nula, ao nível de sgnfcânca α, se S R > χ 2 (α;q). A estatístca gradente (Terrel, 2002) para testar H 0 contra H 1 é defnda como: S T = U 1 ( β) T ( β 1 β (0) 1 ), (2.7) 7,

em que ˆβ é o estmador de máxma verossmlhança rrestrto de β. Vale salentar que a estatístca gradente defnda em (2.7) é uma espéce de combnação das estatístcas escore e Wald modfcada (ver Hayakawa e Pur, 1985). A estatístca Wald modfcada, denotada aqu por W 1, para testar a hpótese nula composta H 0 :β 1 = β (0) 1 contra a hpótese alternatva blateral H 1 :β 1 β (0) 1 é defnda como: W 1 = ( β 1 β (0) 1 ) T K 11 ( β) 1 ( β 1 β (0) 1 ) em que K 11 é a matrz de covarânca assntótca de ˆβ 1 obtda de K(β) 1. Em problemas regulares, sabe-se que as estatístcas da razão de verossmlhanças, escore e Wald tem assntotcamente e, sob a hpótese nula, dstrbução χ 2 q. Terrel (2002) mostra que a estatístca gradente tem a mesma dstrbução assntótca que as estatístcas escore e Wald. Portanto, a estatístca gradente tem, sob a hpótese nula, dstrbução assntótca χ 2 q. Rejetamos a hpótese nula, ao nível de sgnfcânca α, se S T > χ 2 (α;q). Note que nesta dssertação, não daremos ênfase ao estudo da estatístca Wald. Lemonte (2009) comparou o poder local do teste gradente com o poder local dos testes baseados nas estatístcas da razão de verossmlhanças, Wald e escore no modelo Brnbaum-Saunders. Sabe-se que o cálculo da estatístca da razão de verossmlhanças requer estmação dos parâmetros sob ambas as hpóteses (nula e alternatva), enquanto que o cálculo da estatístca escore envolve a estmação dos parâmetros apenas sob a hpótese nula. Nos casos em que a estmação sob a hpótese alternatva é complcada, a estatístca escore pode apresentar uma vantagem computaconal em relação a estatístca da razão de verossmlhanças. Uma vantagem computaconal da estatístca gradente em relação às demas estatístcas é quando o cálculo da matrz de nformação de Fsher for muto complcado. 8

Tabela 2.1: Funções f, g, a e o suporte de algumas dstrbuções da famíla (2.1). Dstrbução f(µ, φ) g(µ, φ) a(y, φ) Suporte (Aɛ) 1. Posson e µ 1 µ {0, 1, 2,...} y! ( ) m ( 2. Bnomal 1 + µ µ m ) {0, 1, 2,..., m} m µ m µ y 3. Bnomal ( negatva 1 µ µ+φ ) φ µ µ+φ Γ(φ+y) {0, 1, 2,...} y!γ(φ) 4. Posson generalzada 5. Borel 1 1 µ 6. Consul 7. Bnomal negatva generalzada 8. Borel Tanner 9. Delta bnomal 10. Geeta 11. Geeta-m 12. Hagth e µ(1+µφ) 1 µe µφ(1+µφ) 1 1+µφ ( 1 1 µ ) e (1+φy) y 1 {0, 1, 2,...} y! 1+1/µ yy 2 {1, 2,...} (y 1)! µ 1 ) φ φ (1 µ 1 )(φ 1 + µ 1 ) φ 1 Γ(φy+1) µ(φ 1)+1 φ 1+ν/µ φ 1+ν/µ ( ( ν 1 φ+ν/µ φ+ν/µ φ+ν/µ ( 1 m µ { µ m µ(φ 1)+m µ 1 φµ 1 ( µ m φµ m µ 1 2 µ 1 ) m ( 1 m µ ) } m 1 (1 m φ φ µ µ 1 φµ 1 ) m µ m φµ m e { (φ 1)µ φµ 1 { (φ 1)µ φµ m y!γ(φy y+2) {1, 2,...} ) φ 1 νγ(φy+ν+1) {0, 1, 2,...} (φy+ν)y!γ(φy y+ν+1) 1+m/µ myy m 1 (y m)! ) ( ) φ 1 {m, m + 1,...} φ 1 + m mγ(φy+1) µ y(y m)!γ(φy y+m+1) {m, m + 1,...} } φ 1 Γ(φy 1) } φ 1 mγ(φy m) y!γ(φy y) {1, 2,...} y(y m)!γ(φy y) {m, m + 1,...} µ (µ 1) (2y 2)! {1, 2,...} (2µ 1) 2 y!(y 1)! 9

Tabela 2.2: Funções t e q para algumas dstrbuções da famíla (2.1). Dstrbuton t q 1 1 1. Posson µh h m m 2. bnomal µ(m µ)h (m µ)h 3. generalzed Posson 1 1 µ(1+φµ) 2 h (1+φµ) 2 h 4. Consul φ } µ(µ 1){ µ(φ 1)+1 h φ } (µ 1){ µ(φ 1)+1 h 5. generalzed negatve bnomal 6. delta bnomal ν 2 µ(ν+µφ){ ν+µ(φ 1) } h m 2 φ } µ{ µ(φ 1)+m (µ m)h ν 2 (ν+µφ){ ν+µ(φ 1) } h { m 2 φ } µ(φ 1)+m (µ m)h 10

Capítulo 3 Correção de Bartlett e tpo-bartlett 3.1 Introdução Sabe-se que, em problemas regulares, as estatístcas da razão de verossmlhanças e escore são assntotcamente equvalentes, uma vez que possuem a mesma dstrbução de referênca qu-quadrado (χ 2 ), sob H 0. Tendo em vsta a dfculdade em se determnar as dstrbuções exatas das estatístcas razão de verossmlhanças (LR) e escore (S R ), os testes realzados têm sdo construídos baseados em resultados assntótcos. Entretanto, em amostras de tamanho pequeno ou até mesmo moderado, a aproxmação dessas estatístcas pela dstrbução χ 2 pode não ser acetável. Assm, precsava-se de uma solução que vesse a melhorar a qualdade das aproxmações das dstrbuções das estatístcas razão de verossmlhanças e escore pela dstrbução χ 2 de referênca. Bartlett (1937) propôs a modfcação da estatístca de razão de verossmlhanças, tendo como objetvo gerar uma estatístca modfcada, com o prmero momento equvalente ao da dstrbução χ 2 de referênca. Bartlett (1937) mostrou que, sob a hpótese nula e em problemas regulares, a méda da estatístca da razão de verossmlhanças pode ser expandda de tal forma que seu cálculo envolve uma constante d de ordem O(n 1 ) em que n o tamanho da amostra. Dessa forma a méda da estatístca corrgda, LR = LR/(1 + d), em que LR é dada em (2.6), se torna mas próxma da méda da dstrbução χ 2 q, quando comparada a estatístca usual. Na fórmula de LR, o fator 1/(1 + d) é conhecdo como fator de correção 11

de Bartlett. Hayakawa (1977) dervou uma expansão assntótca para a dstrbução de razão de verossmlhanças sob a hpótese nula, mostrando que, se a hpótese nula for smples, a estatístca da razão de verossmlhanças modfcada tem dstrbução χ 2 até ordem O(n 1 ). Cordero (1982) obteve fatores de correção para a estatístca da razão de verossmlhanças em modelos multnomas, mostrando que as taxas de rejeção dos testes baseados na estatístca corrgda estão mas próxmas dos seus respectvos níves nomnas que as taxas de rejeção do teste baseado na estatístca não corrgda. Cordero (1983 e 1987) obteve o fator de correção de Bartlett para estatístca de razão de verossmlhanças nos MLGs consderando o fator de escala conhecdo e desconhecdo, respectvamente, e mostrou que a correção representou um consderável aperfeçoamento. Outras referêncas sobre trabalhos que tratam de correção de Bartlett em outros modelos podem ser encontradas em Crbar-Neto e Cordero (1997) e Cordero (1999). Ferrar e Urbe - Opazo (2001) obtveram um fator de correção de Bartlett na classe dos modelos de regressão lneares smétrcos. Cysneros e Ferrar (2006) obtveram refnamentos de um teste de heteroscedastcdade baseado em verossmlhança perflada nos modelos não-lneares da famíla exponencal. Cordero e Ferrar (1991) mostraram que uma estatístca escore aperfeçoada segundo dstrbução χ 2 até ordem O(n 1 ), sob a hpótese nula, pode ser sempre encontrada e envolve um polnômo de segundo grau na própra estatístca escore. As quantdades a, b e c possuem fórmulas fechadas e envolvem funções de cumulantes conjuntos de dervadas do logartmo da função de verossmlhança e o número de restrções mpostas sob a hpótese nula. As fórmulas de tas quantdades serão mostradas anda nesse capítulo. Cordero et al. (1998) apresentaram uma fórmula para a estatístca escore aperfeçoada, sendo essa uma transformação monótona da estatístca escore. Anda nesse capítulo, falaremos com mas detalhes sobre o fator de correção tpo-bartlett. Braga (2007) apresentou fatores de correção tpo-bartlett em modelos de regressão nãolneares smétrcos vsando melhorar a estatístca escore. Brto (2009) obteve a expressão do fator de correção Bartlett para a estatístca de razão de verossmlhanças nos modelos não-lneares smétrcos heteroscedástcos com parâmetro de escala desconhecdo. Lemonte (2009) obteve um fator de correção de Bartlett para a 12

estatístca da razão de verossmlhanças no modelo de regressão Brnbaum Saunders. Slva (2010) obteve um fator de correção de Bartlett à estatístca da razão de verossmlhanças na classe de modelos em séres de potênca não-lneares generalzados. Nascmento (2010) desenvolveu um fator de correção tpo-bartlett para a estatístca escore nos modelos não-lneares smétrcos heteroscedástcos, usando quasquer funções de lgação para a méda e para o parâmetro de dspersão. Urbe - Opazo (1997) obteve fatores de correção de Bartlett e tpo-bartlett para as estatístcas da razão de verossmlhanças e escore nos modelos lneares smétrcos homoscedástcos, respectvamente. Cavalcant (2009) desenvolveu fatores de correção tpo-bartlett para o teste escore em modelos não-lneares da famíla exponencal consderando covaráves para modelar o parâmetro de dspersão. Lemonte e Ferrar (2009) obtveram um fator de correção tpo-bartlett para a estatístca escore no modelo de regressão Brnbaum Saunders. Vale ressaltar que não é possível garantr que, para varáves aleatóras dscretas, a estatístca da razão de verossmlhança corrgda pelo fator de correção de Bartlett rá produzr um melhoramento na aproxmação assntótca da dstrbução da estatístca do teste pela dstrbução qu-quadrado. Frydenberg e Jensen (1989) mostraram que, em stuações partculares, a correção de Bartlett nem sempre é vável, sto é, nem sempre melhora a aproxmação assntótca da dstrbução da estatístca do teste pela dstrbução qu-quadrado. No entanto, Cordero (1982) e Cysneros (1997) mostraram, va smulação, que os testes baseados nas estatístcas da razão de verossmlhanças e escore corrgdas apresentam taxas de rejeção mas próxmas dos seus respectvos níves nomnas, especalmente nos modelos dscretos, evdencando que as correções foram efcazes. 3.2 Correção de Bartlett e tpo-bartlett nos MSPNLGs Consdere Y 1,..., Y n varáves aleatóras dscretas ndependentes, com função de probabldade dada por: π(y; µ, φ) = a(y, φ)g(µ, φ) y, y A ɛ, (3.1) f(µ, φ) 13

em que o suporte de Y é um subconjunto A ɛ dos nteros {ɛ, ɛ + 1,...}, ɛ 0, não dependendo de parâmetros desconhecdos; a(y, φ) é uma função postva; as funções analítcas f = f(µ, φ) e g = g(µ, φ) são postvas, fntas e duas vezes dferencáves; φ > 0 (que assummos ser conhecdo) e µ > 0 são chamados de parâmetros de dspersão e de méda, respectvamente. Para a famíla de dstrbuções dada em (3.1), as seguntes relações são váldas: E(Y ) = µ = f g fg e V ar(y ) = V (µ, φ) = g g, em que o índce sobrescrto ( ) ndca a prmera dferencação em relação a µ. Os modelos em séres de potênca não-lneares generalzados são defndos pela função de probabldade e pelo componente sstemátco h(µ ) = η = η(x ; β), = 1,..., n em que h( ) é uma função de lgação conhecda e duplamente dferencável, β = (β 1,..., β p ) T é um vetor de p (p < n) parâmetros desconhecdos a serem estmados, x = (x 1,..., x k ) T representa os valores de k varáves explcatvas e η( ; ) é uma função possvelmente nãolnear no segundo argumento, contínua e dferencável com respeto aos componentes de β de tal forma que a matrz de dervadas X = X(β) = η/ β T, com η = (η 1,..., η n ) T, tem posto p para todo β. A matrz X tem elementos que são, geralmente, funções do vetor de parâmetros β desconhecdos. Sejam x a -ésma lnha da matrz X e X uma matrz de dmensão p p cujo elemento (r,s) é x rs = 2 η / β r β s, = 1,..., n. Dado o vetor de observações (y 1,..., y n ) T, o logartmo da função de verossmlhança do vetor de parâmetros β, dos MSPNLGs pode ser expresso na forma n n l(β; y) = log{a(y, φ)} + [y log{g(µ, φ)} log{f(µ, φ)}]. =1 =1 Assummos que l(β) seja regular com respeto às dervadas em relação aos componentes de β até quarta ordem. Nosso nteresse aqu é testar a hpótese nula H 0 : β 1 = β (0) 1 contra a hpótese alternatva H 1 : β 1 β (0) 1, em que β = (β T 1, βt 2 )T, sendo β 1 = (β 1,..., β q ) T um vetor de parâmetros de nteresse, q dmensonal, β 2 = (β q+1,..., β p ) T um vetor de parâmetros de perturbação, p q dmensonal e β (0) 1 é um vetor de constantes conhecdas. 14

Seja U(β) = l(β)/ β = (U 1 (β) T, U 2 (β) T ) T a função escore total de β. Consdere o estmador de máxma verossmlhança rrestrto de β, ˆβ = ( ˆβ T 1, ˆβ T 2 )T e β = (β (0) 1 T, β T 2 )T o estmador de máxma verossmlhança restrto sob a hpótese nula. A matrz de nformação de Fsher e a sua nversa são decompostas como a segur: K(β) = K 11 K 12 K 21 K 22 e K(β) 1 = K11 K 12 K 21 K 22 respectvamente, sendo K 11 = X T 1 W X 1, K 22 = X T 2 W X 2, K 12 = K T 21 = X T 1 W X 2, K 11 = (R T W R) 1, K 22 = (X T 2 W X 2 ) 1 + C(R T W R) 1 C T (covarânca assntótca de ˆβ 2 ) e K 12 = K 21 = (R T W R) 1 C T, em que R = X 1 X 2 C e C = (X T 2 W X 2 ) 1 X T 2 W X 1 é uma matrz n q, sendo suas colunas vetores dos coefcentes de regressão lnear das colunas de X 1 sobre X 2, tal que o peso é W. Defnmos os escalares t, q, w j, w j e w 1, respectvamente, por:, t = g{1} g h {1}, q = f {1}, f h {1} w j = ( f {1} g f g {1} t {j} q {j} ) 1 h {1} w j = ϕ j (j 1)q V t {j} h {2} q {j+1} w 1 = 2ϕ 2 q V t {3} +q {1} ( h {3} ) 2 + t ) 4 3(h, {j} h {2} + j q e ) j+1 ) j+2 {1} (q {2} V + 2q {1} V {1} + q {1} V {2} {2} ) 2 ) 5 ), {2} ϕ 1 ) h ) 2 ) 2 q {3} ) 3 + 3q {2} h {2} ) 4 com ϕ j = q{1} V t {j} + q V {1} t {j} + q V t {j+1}, ) j para j = 1, 2, 3 e = 1,..., n, em que o índce sobrescrto {j} ndca a j-ésma dervada em relação a µ. Vale salentar que as quantdades acma envolvem dervadas que dependem das 15

formas específcas das funções f, g, h e V nas dversas dstrbuções pertencentes à famíla de sére de potênca. Além dsso, as matrzes dagonas Q 1, Q 2, Q 3 e Q 4 são necessáras ao cálculo do fator de correção de Bartlett, e as matrzes Q 5, Q 6, Q 7, Q 8 e Q 9 são usadas para o cálculo do fator de correção tpo-bartlett, todas de dmensão n n. Além dsso, vale ressaltar dos aspectos: as matrzes foram denotadas dessa forma por smplcdade, uma vez que essa é a notação utlzada por Slva (2010) para algumas matrzes que surgem nos cálculos dos cumulantes; e que essas matrzes nada têm a ver com o vetor Q defndo na Seção (2.3). Os elementos de tas matrzes são defndos, respectvamente, por: como: q 1 = w 2 w 1h {2} ), 2 ( q 2 = 1 6 ( q 3 = 1 4 w 2 w 1h {2} ) 2 w 2 w 1h {2} ) 2 ) ) q 4 = 1 4 w 3 3 w 2 h {2} 4 ) + 3 2 4 q 5 = w 1h {1} + q {1}, µ ) 2 q w 1, w 1 w 1 h {3} ) 3 5 4 w 1 (h {2} ) 2 q 6 =, µ h {1} q 7 = w 3 3w 2h {2} ) w {2} 1h 2 ) + 3w {2} 1(h ) 2, 3 ) 4 q 8 = w 2 w 1h {2} ) w {3} 1h 2 ) + 2w {2} 1(h ) 2 e 3 ) 4 q 9 = V w1 2 + 2V w 1 q (1) + V (q {1} ) 2 µ µ 2 h{1} µ 2 (h{1} ). 2 {2} ) 4 + w 1h ) 2 w 2 + w 1, A estatístca da razão de verossmlhanças para o teste de H 0 contra H 1 pode ser reescrta [{ LR = 2 l( ˆβ 1, ˆβ } { 2 ) l(β 1, β 2 ) l(β (0) 1, β }] 2 ) l(β 1, β 2 ). 16

Dessa forma, uma aproxmação da estatístca da razão de verossmlhanças pela dstrbução χ 2 pode ser melhorada trocando LR pela estatístca modfcada LR ou, equvalentemente, LR 1, dadas por: LR = LR 1 + d e LR 1 = LR(1 d) respectvamente, em que os fatores de correção de Bartlett, 1/(1 + d) e (1 d), são determnados por d = ɛ p ɛ p q. q Slva (2010) obteve o fator de correção de Bartlett para a estatístca da razão de verossmlhanças nos MSPNLGs, cuja expressão de ɛ p fo decomposta da segunte forma: em que ɛ p = ɛ (L) p + ɛ (NL) p. (3.2) ɛ (L) p = ι Z d Q 4 Z d ι + ι Q 1 Z (3) Q 2 ι + ι W1 Z (3) W1 ι + ι Q 1 Z d ZZ d Q 3 ι + ι W1 Z d ZZ d W1 ι, é a parte lnear do modelo e ( ɛ (NL) p = ι W 1 1 ) 2 Q 1 DZ d ι + ι ( W 1 Q 1 )C d ι 1 4 ι W 1 (2B D 2 )ι + 1 ( 4 ι DW 1 Z [W 1 D + 4Z d W 1 1 )] 2 Q 1 ι + tr {[ ( W1 Q 1 ) C 1 2 W 1B ] } W 1 Z, é a parte assocada à não-lneardade na componente sstemátca do modelo, sendo Z, B, C e D, matrzes de dmensão n n cujos elementos são, respectvamente, dados por: z j = x K 1 β x j, b j = tr(k 1 β X K 1 β X j ), c j = x K 1 β X j K 1 β x e d 1 = tr(k 1 β X ). Além dsso, Z d, B d e C d representam matrzes dagonas formadas pelos correspondentes elementos das dagonas das matrzes Z, B e C, respectvamente e denotamos Z (3) = Z (2) Z, Z (2) = Z Z, em que é o produto de Hadamard (Rao, 1973, p. 30), ou seja, o elemeto (, j) de Z (3) é z 3 j. Observe que aqu a notação Z (3) não ndca a tercera dervada com relação a µ de Z. Consdere as matrzes X2 = 2 η / β 2 β 2, = 1,..., n, e K(β 2 ) = X 2 W X 2. De forma análoga à defnção feta em (3.2), podemos obter a fórmula de ɛ p q com X, X e K(β) substtuídos por X 2, X 2 e K(β 2 ), respectvamente. 17

A estatístca escore (Rao, 1948) para testar H 0 contra H 1 é dada por: S R = U( β) T K( β) 1 U( β). Cordero e Ferrar (1991) mostraram que é sempre possível obter uma estatístca escore modfcada possundo dstrbução χ 2 até ordem O(n 1 ). Tal estatístca é dada por: S R = S R { 1 ( c + bsr + as 2 R )} (3.3) em que o fator entre chaves é chamado fator de correção tpo-bartlett e envolve as quantdades a, b e c que são termos de ordem O(n 1 ) e dados por: a = A 3 12q (q + 2) (q + 4), b = A 2 2A 3 12q (q + 2), c = A 1 A 2 + A 3 12q sendo q o número de restrções mpostas sob a hpótese nula e A 1, A 2 e A 3 funções de cumulantes conjuntos de dervadas do logartmo da função de verossmlhança e expressas por: A 1 = 3 (κ jk + 2κ,jk )(κ rst + 2κ r,st )a j a st m kr 6 (κ jk + 2κ,jk )κ r,s,t a j a kr m st + 6 (κ,jk κ,j,k )(κ rst + 2κ rs,t )a js a kt m r 6 (κ,j,k,r + κ,j,kr )a kr m j = A 11 + A 12 + A 13 + A 14, A 2 = 3 κ,j,k κ r,s,t a kr m j m st + 6 (κ jk + 2κ,jk )κ r,s,t a j m kr m st 6 κ,j,k κ r,s,t a kt m r m js + 3 κ,j,k,r m j m kr = A 21 + A 22 + A 23 + A 24, 18

A 3 = 3 κ,j,k κ r,s,t m j m kr m st + 2 κ,j,k κ r,s,t m r m js m kt = A 31 + A 32, em que a j e m j são os elementos (, j), respectvamente, das matrzes: A = 0 0 0 K 1 22 e M = K(β) 1 A. Aqu, K 1 22 é a matrz de covarânca assntótca de β 2 e denota o somatóro sobre todos os componentes de β, sto é, sobre os p-parâmetros. Além dsso, vale salentar que os A s são de ordem O(n 1 ) e avalados sob H 0. Vale salentar que, caso os A s envolvam parâmetros desconhecdos, eles poderão ser substtuídos por seus respectvos estmadores de máxma verossmlhança sob H 0, não afetando a ordem de aproxmação da correção. A fórmula da estatístca escore modfcada SR, dada em (3.3), está fortemente relaconada com os quants modfcados de S R, que foram obtdos por Harrs (1985). Além dsso, ele mostrou que P(S R z α ) =P(χ 2 q x α ) = 1 α, quando desprezados os termos de ordem nferor a n 1. Nessa equação: z α = x α {1 + b (x α, A 1, A 2, A 3, q)}. Assm, desprezando termos de ordem nferor a n 1, temos que P(S R x α)=p(s R z α ) =P(χ 2 q x α ) = 1 α, sob a hpótese nula. Desta forma, um teste escore aperfeçoado pode ser conduzdo das seguntes maneras: obtém-se a estatístca escore aperfeçoada e utlza-se a dstrbução χ 2 q como referênca, ou obtém-se a estatístca escore usual e utlzam-se os quants modfcados z α como referênca. A estatístca modfcada S R pode ser função não-monótona de S R. Como solução a esse problema, Kakzawa (1996) propôs uma transformação monótona dada por S R1 = S R +P (S R) em que P (S R ) é dada da segunte forma: { c 2 S R + 2bcSR 2 + P (S R ) = 1 4 (2ac + 43 b2 ) S 3 R + 3abS 4 R + 9 5 S5 R Além dsso, Cordero, Ferrar e Cysneros (1998) obtveram uma estatístca escore modfcada, S R2 assntotcamente equvalente a S R com a propredade de ser monótona em S R. 19 }.

Tal estatístca é dada por: ( ( π 3a exp b 2 ){φ 6aSR ( )} 3a c 2 + ) φ 3a b 2 3a b, se a>0, SR2 1 = 2b exp( c) {1 exp( 2bS R)}, se a = 0 e b 0, sendo a sempre não negatvo. 3.2.1 Obtenção dos A s A obtenção dos A s é feta da segunte manera: basta nserr os cumulantes (κ s) de dervadas do logartmo da função de verossmlhança nas equações de Harrs (1985). Desta forma, pode-se obter expressões matrcas smples para A 1, A 2 e A 3. Os detalhes algébrcos não são nserdos aqu uma vez que consttuem cálculos enfadonhos; no entanto, os cálculos seguem de forma smlar aos encontrados em Cordero et al. (1993). Detalhes sobre a obtenção dos A s encontram-se no Apêndce A. A segur, são apresentadas as expressões obtdas para o modelo em questão que, em notação matrcal, fcam dadas por: A 11 = 6ι T (2 W 1 Q 1 )Z 2d (Z Z 2 )Z 2d W1 ι + 3ι T (Q 1 2 W 1 )Z 2d (Z Z 2 )Z 2d Q 1 ι + 3ι T W 1 E 2 (Z Z 2 )E 2 W 1 ι + 3ι T (2 W 1 Q 1 )Z 2d (Z Z 2 )E 2 W 1 ι + 3ι T W 1 E 2 Z 2d (Z Z 2 )(2 W 1 Q 1 )ι A 12 = 6ι T ( Q 1 + 2 W 1 )Z 2d (Z Z 2 ) d Z 2 (2Q 1 3 W 1 )ι 6ι T W 1 C 2 (Z Z 2 ) d (2Q 1 3 W 1 )ι, A 13 = 6ι T ( 3Q 1 + 4 W 1 )Z 2 (Z Z 2 )Z 2 ( Q 1 + 2 W 1 )ι + 6ι T ( 3Q 1 + 4 W 1 )C 2 (Z Z 2 )W 1 ι + 30ι T W 1 C 2 (Z Z 2 )( Q 1 + 2 W 1 )ι + 30ι T W 1 J 2 (Z Z 2 )W 1 ι, A 14 = 6ι T ( 2Q 9 6Q 8 + 2Q 7 + 5W 1 )Z 2d (Z Z 2 ) d ι + 6ι T (7 W 1 6Q 1 4Q 5 )(Z Z 2 ) d E 2 ι, 20

A 21 = 3ι T (2Q 1 3 W 1 )(Z Z 2 ) d Z 2 (Z Z 2 ) d (2Q 1 3 W 1 )ι A 22 = 6ι T ( Q 1 + 2 W 1 )(Z Z 2 ) d Z 2d (Z Z 2 )(2Q 1 3 W 1 )ι + 6ι T W 1 E 2 (Z Z 2 )(Z Z 2 ) d (2Q 1 3 W 1 )ι A 23 = 6ι T (2Q 1 3 W 1 )(Z Z 2 )Z 2 (Z Z 2 )(2Q 1 3 W 1 )ι A 24 = 3ι T (8Q 8 3Q 7 + 3Q 9 6 W 1 )(Z Z 2 ) d (Z Z 2 ) d ι, A 31 = 6ι T Q 1 (Z Z 2 ) d (Z Z 2 )(Z Z 2 ) d (2Q 1 3W 1 )ι + 9ι T W 1 (Z Z 2 ) d (Z Z 2 )(Z Z 2 ) d (3W 1 2Q 1 )ι, A 32 = 4ι T Q 1 (Z Z 2 )(Z Z 2 )(Z Z 2 )(2Q 1 3 W 1 )ι 6ι T W1 (Z Z 2 )(Z Z 2 )(Z Z 2 )(2Q 1 3 W 1 )ι, em que Z = X(X T W X) 1 X T, Z 2 = X 2 (X T 2 W X 2 ) 1 X T 2, Z d e Z 2d contém os elementos da dagonal da matrz Z e Z 2, respectvamente. Além dsso, as matrzes C 2, E 2 e J 2 possuem elementos dados, respectvamente, por c 2 = x l a j x ljk a kr x mr, e 2 = x lj a j e j 2 = x ljk a js x mst a kt. 21

Capítulo 4 Resultados numércos Nesse capítulo apresentaremos alguns resultados de smulações Monte Carlo para avalar a efcáca da correção tpo-bartlett nos MSPNLGs. Para tanto, comparamos o desempenho dos testes baseados nas seguntes estatístcas, a saber: razão de verossmlhanças usual (LR), suas versões corrgdas (LR e LR1), escore (S R ), suas versões corrgdas (SR, S R 1 e SR 2 ) e gradente (S T ). O estudo de smulação fo baseado nas seguntes dstrbuções: Bnomal Negatva Generalzada (BNG), Posson Generalzada (GPO) e Consul. No caso da dstrbução BNG, os parâmetros foram fxados em φ = 1 e ν = 3. Para o caso das dstrbuções GPO e Consul fxou-se os parâmetros em φ = 0, 2 e φ = 1, 0, respectvamente. As smulações realzadas são baseadas no segunte predtor: η = k β j x j + exp(β 7 x 7 ), = 1,..., n e k = 0,..., 6. j=1 Duas hpóteses serão consderadas neste estudo de smulação: () H 0 : β 7 = 0 contra H 0 : β 7 0 e () H 0 : β 5 = β 6 = 0 contra H 0 : β 5 = β 6 0. A varável resposta fo gerada assumndo que todos os parâmetros de perturbação são guas a 0.05, para cada caso. As covaradas x 1,..., x 7 foram geradas como amostras aleatóras das dstrbuções U(0, 1), F (2, 5), Cauchy, N(0, 2), LN(0, 1), χ 2 3, Exp(1) e Beta(2, 3). O número de réplcas Monte Carlo fo fxado em 10.000 e foram consderados os seguntes níves nomnas α = 1%, 3%, 5% 22

e 10%. As smulações foram realzadas usando a lnguagem de programação matrcal Ox (Doornk, 2006). Para cada tamanho amostral e cada nível consderado estmamos va smulação P (LR χ 2 (α;q) ),P (LR χ 2 (α;q) ),P (LR 1 χ 2 (α;q) ), P (S R χ 2 (α;q) ), P (S R χ2 (α;q) ), P (S R 1 χ 2 (α;q) ), P (S R 2 χ 2 (α;q) ) e P (S T χ 2 (α;q) ), em que χ2 (α;q) é o percentl (1 α) da dstrbução χ2 q. Todas as entradas das Tabelas apresentadas são porcentagens. Nas Tabelas 4.1 e 4.2, fxamos o número de parâmetros de parâmetros em p = 4 e varamos o tamanho amostral em n = 30; 40; 50 e 100, para as dstrbuções Consul e GPO, respectvamente. Consderamos ncalmente a hpótese dada em (). Observamos, nas duas tabelas, que o teste da razão de verossmlhanças, em geral, apresentou taxas de rejeção mas próxmas dos níves nomnas correspondentes que os testes baseados nas estatístcas da razão de verossmlhanças corrgdas que, por sua vez são conservatvos, pos apresentaram taxas de rejeção menores que os níves nomnas consderados. Por exemplo, para n = 30, p = 4 e α = 5% as taxas de rejeção dos testes baseados nas estatístcas LR, LR e LR 1 são, respectvamente, 4.9%, 4.5% e 4.4% para o modelo Consul e 4.9%, 4.8% e 4.8%, para o modelo GPO. No entanto, observamos que os testes baseados nas estatístcas escore, suas versões corrgdas e gradente (S R SR, S R 1, SR 2 e S T, respectvamente) são bastante lberas apresentando taxas de rejeção acma dos níves nomnas correspondentes. Novamente, quando n = 30, p = 4 e α = 5% as taxas de rejeção destes testes são, respectvamente, 8.3%, 7.7%, 8.3%, 8.4% e 8.2% para o modelo Consul e 7.5%, 7.1%, 7.3%, 7.4% e 7.3% para o modelo GPO. Observa-se anda que o fator de correção tpo-bartlett tende a corrgr a tendênca lberal do teste orgnal. Entre as versões corrgdas da estatístca escore, o teste baseado na estatístca SR fo o que apresentou melhor desempenho. Vale salentar aqu que os testes baseados nas estatístcas S R e S T apresentaram pores desempenhos em ambos os cenáros. À medda em que o tamanho amostral va aumentando, as taxas de rejeção de todos os testes se aproxmam dos seus respectvos níves nomnas, como era de se esperar. Os resultados encontrados na Tabela 4.3 foram obtdos levando em consderação a hpótese alternatva H 1 : β 7 0 para n = 30, p = 4, α = 5% e dversos valores de β 7 = β (0), tal que 0, 05 β (0) 0, 30 e consderando o modelo Consul. Observe que estas smulações de poder correspondem ao cenáro abordado na Tabela 4.1 para n = 30. Além dsso, as smulações do poder foram fetas usando valores crítcos estmados e não valores tabula- 23

dos. Adotamos este procedmento porque a maora dos testes são ant-conservatvos. Dessa forma, as smulações foram ajustadas para que todos os testes tenham o mesmo tamanho. Analsando a Tabela 4.3, podemos observar que entre os testes baseados nas estatístcas usuas, o teste escore tem melhor desempenho do que o teste da razão de verossmlhanças. Entre os testes baseados nas versões corrgdas, o teste baseado na estatístca SR 1 fo o que apresentou melhor desempenho segudo pelos testes baseados nas estatístcas SR 2, SR, LR e LR1. Vale salentar aqu que o teste baseado na estatístca gradente apresentou por desempenho. 24

Tabela 4.1: Tamanho dos testes - Modelo não-lnear Consul - p=4 e dferentes valores de n - (H0 : β7 = 0). Modelo Consul n α(%) LR LR LR 1 SR S R S R1 S R2 ST 30 5 4.9 4.5 4.4 8.3 7.7 8.3 8.4 8.2 10 9.8 9.1 9.0 13.2 11.0 11.6 11.8 13.2 40 5 4.7 4.4 4.4 7.6 7.2 7.5 7.6 7.5 10 9.5 9.0 8.9 12.6 10.9 11.2 11.3 12.6 50 5 4.8 4.4 4.4 7.2 6.9 7.1 7.1 6.9 10 9.2 8.7 8.7 11.9 10.7 10.9 10.9 11.8 100 5 4.9 4.7 4.7 6.1 5.9 5.9 5.9 6.1 10 9.7 9.6 9.6 11.2 10.4 10.4 10.5 11.3 25

Tabela 4.2: Tamanho dos testes - Modelo não-lnear GPO - p=4 e dferentes valores de n - (H0 : β7 = 0). Modelo GPO n α(%) LR LR LR 1 SR S R S R1 S R2 ST 30 5 4.9 4.8 4.8 7.5 7.1 7.3 7.4 7.3 10 9.7 9.5 9.5 12.3 10.9 11.2 11.2 12.3 40 5 4.7 4.6 4.6 7.0 6.7 6.9 6.9 6.9 10 9.4 9.4 9.4 11.5 10.6 10.6 10.7 11.5 50 5 4.6 4.6 4.6 6.5 6.3 6.4 6.4 6.2 10 9.2 9.2 9.2 11.3 10.4 10.4 10.5 11.2 100 5 5.0 4.9 4.9 5.8 5.7 5.7 5.7 5.9 10 9.9 9.9 9.9 10.9 10.5 10.5 10.5 10.9 26

Tabela 4.3: Poder dos testes - Modelo não-lnear Consul com n = 30, p = 4, α= 5%. Modelo Consul β (0) LR LR LR 1 SR S R S R1 S R2 ST 0,05 7.7 7.1 7.9 32.6 32.2 34.5 32.0 15.0 0,10 16.4 15.4 16.2 47.5 46.8 49.2 46.6 21.6 0,15 31.7 30.2 30.7 64.2 62.7 65.7 62.4 28.7 0,20 52.2 49.8 50.1 78.7 75.6 79.6 76.2 35.6 0,25 71.7 68.9 68.8 89.5 85.4 90.0 86.4 41.7 0,30 86.9 83.6 82.9 95.5 89.9 95.6 91.6 46.9 27

Nas Tabelas 4.4 e 4.5, fxamos o número de parâmetros em p = 7 e varamos o tamanho amostral em n = 30, 40, 50 e 100, para as dstrbuções BNG e Consul, respectvamente. Consderamos agora a hpótese dada em (). Na Tabela 4.4, os resultados ndcam que no modelo BNG, o teste da razão de verossmlhanças usual é lberal enquanto que os testes baseados nas versões corrgdas da estatístca da razão de verossmlhanças apresentaram taxas de rejeção mas próxmas dos níves nomnas. A correção tpo-bartlett tende a atenuar a tendênca lberal do teste escore, de modo que os testes baseados nas versões corrgdas da estatístca escore apresentam menor dstorção de tamanho do que o teste baseado em S R. Por exemplo, quando n = 30 e α = 10%, temos que as taxas de rejeção dos testes baseados nas estatístcas LR, LR, LR1, S R, SR, S R 1, SR 2 são, respectvamente, 11.1%, 10.3%, 10.2%, 11.9%, 10.0%, 10.1%, 9.1% e 11.4%. Na Tabela 4.5, notamos que no modelo Consul, os testes baseados nas estatístcas usuas, apresentaram taxas superores aos níves nomnas correspondentes para tamanho amostral pequeno ou mesmo moderado. No entanto, os testes baseados nas versões corrgdas da estatístca da razão de verossmlhanças apresentaram melhores desempenhos quando comparados às versões corrgdas da estatístca escore. Vale salentar aqu que os testes baseados nas versões corrgdas da estatístca escore corrgem a tendênca lberal do teste escore usual apresentando, em geral, taxas de rejeção lgeramente superores aos níves nomnas. À medda que o tamanho amostral cresce, todos os testes apresentam taxas de rejeção próxmas aos respectvos níves nomnas consderados. Além dsso, o teste baseado na estatístca gradente (S T ), apresentou o por desempenho em relação às versões corrgdas dos testes baseados nas estatístcas da razão de verossmlhanças e escore. Os resultados encontrados na Tabela 4.6 foram obtdos para o modelo BNG, levando em consderação a hpótese alternatva H 0 : β 5 = β 6 = 0 para n = 30, p = 7, α = 5% e dversos valores de β 5 = β 6 = β, tal que 0.10 β 0, 80. Observe que estas smulações de poder correspondem ao cenáro abordado na Tabela 4.4 para n = 30. Além dsso, as smulações do poder foram fetas usando valores crítcos estmados e não valores tabulados. Adotamos este procedmento porque a maora dos testes são ant-conservatvos. Dessa forma, as smulações foram ajustadas para que todos os testes tenham o mesmo tamanho. Analsando a Tabela 4.6, podemos observar que entre os testes baseados nas estatístcas da razão de verossmlhanças, escore e gradente, o teste da razão de verossmlhanças teve 28

um melhor desempenho do que os testes gradente e escore. Entre os testes baseados nas versões corrgdas, o teste baseado na estatístca LR 1 fo o que apresentou melhor desempenho segudo pelos testes baseados nas estatístcas LR, S R 2, S R 1, S R. 29

Tabela 4.4: Tamanho dos testes - Modelo não-lnear BNG - p=7 e dferentes valores de n - (H0 : β5 = β6 = 0). Modelo BNG n α(%) LR LR LR 1 SR S R S R1 S R2 ST 30 5 5.5 5.1 5.1 6.4 5.7 5.7 5.1 5.9 10 11.1 10.3 10.2 11.9 10.0 10.1 9.1 11.4 40 5 5.7 5.3 5.2 6.4 5.7 5.8 5.2 5.8 10 11.1 10.7 10.7 11.6 10.4 10.4 9.4 11.4 50 5 5.5 5.2 5.2 6.0 5.4 5.5 5.0 5.7 10 10.7 10.2 10.2 11.1 10.0 10.1 9.1 10.9 100 5 5.2 5.0 5.0 5.4 5.1 5.1 4.8 5.3 10 10.3 10.0 10.0 10.7 9.9 9.9 9.5 10.3 30

Tabela 4.5: Tamanho dos testes - Modelo não-lnear Consul - p=7 e dferentes valores de n - (H0 : β5 = β6 = 0). Modelo Consul n α(%) LR LR LR 1 SR S R S R1 S R2 ST 30 5 6.4 5.3 5.2 7.4 5.9 6.2 5.5 6.8 10 12.2 10.3 10.1 12.5 9.0 9.4 8.5 12.5 40 5 6.0 5.1 5.0 6.9 5.7 6.0 5.2 6.2 10 11.8 10.4 10.3 12.2 9.3 9.6 8.5 12.0 50 5 5.5 4.8 4.8 6.4 5.5 5.6 5.0 5.6 10 11.1 10.0 10.0 11.6 9.4 9.5 8.4 11.1 100 5 5.2 4.9 4.9 5.7 5.1 5.1 4.6 5.3 10 10.4 9.8 9.7 11.1 9.3 9.4 8.6 10.4 31

Tabela 4.6: Poder dos testes em modelos não lneares com n = 30, p = 7, α = 5% e consderando o modelo BNG. Modelo BNG β (0) LR LR LR 1 SR S R S R1 S R2 ST 0,10 8.9 8.2 8.2 7.6 7.0 7.1 6.9 8.4 0,20 22.4 21.4 21.4 18.5 17.8 17.9 18.0 20.7 0,30 45.3 43.7 43.7 36.2 35.5 35.6 35.8 42.6 0,40 70.3 69.0 69.0 55.4 54.1 54.2 54.4 67.8 0,50 87.9 87.1 87.1 72.8 72.0 71.2 71.3 86.9 0,60 98.8 98.7 98.7 90.1 91.3 91.4 91.3 98.8 0,70 99.1 99.0 99.0 93.7 92.4 92.5 92.5 99.1 0,80 99.8 99.8 99.8 97.8 97.0 97.2 97.2 99.8 32

4.1 Aplcação Essa seção tem por objetvo lustrar a metodologa apresentada anterormente através do conjunto de dados reas (Tabela B.1). Tal tabela se refere ao número de espéces de pexes em um lago (varável resposta) e o logartmo da área do lado, dada em Km 2,(x). Tas dados foram analsados prmeramente por Barbour e Brown (1974) e, mutos anos depos, por Rgby et al. (2008) e por Cordero et al. (2009). O trabalho de Barbour e Brown (1974) fo um dos prmeros que tomou lagos como lhas, consderando um contexto bogeográfco. Eles examnaram uma dversdade de pexes em lagos amercanos e estudaram trabalhos como os de Sepkosk& Rex (1974), que consderava a dspersão de mexlhões; Lassen (1975); Aho (1978), que consderava gastrópodes e Browne (1981), que consderava zooplâncton. Dante de város trabalhos na área, algumas conclusões foram tomadas, como a do fato de que lagos maores e mas profundos podem abrgar um potencal número de espéces, já que apresentam uma área de nterações maor. Cordero et al. (2009), dscutram a flexbldade do uso dos MSPNLGs com o objetvo de ajustar os dados. Dentre os modelos analsados, o mas adequado para ajustar o número de espéces de pexes, segundo o crtéro de Informação de Akake (AIC), fo o modelo Delta Bnomal (DB), que forneceu AIC gual a 612.1, menor AIC dentre os modelos analsados. Tal resultado concde com o encontrado por Cordero et al. (2009) e Slva (2010). O predtor utlzado é dado por: η = β 0 + β 1 log(x ) + β 2 {log(x )} 2, = 1,..., 70, em que η = log(µ m) e m representa o valor mínmo do suporte da dstrbução assocada ao modelo. Aqu, testaremos a hpótese H 0 : β 2 = 0 contra H 1 : β 2 0, sto é, queremos averguar qual o modelo mas adequado para os dados em questão. Segundo a mesma lnha de racocíno de Cordero et al. (2009) e a de Slva (2010), tomamos os mesmos modelos por eles analsados: Posson, Bnomal Negatva (BN), Posson Generalzada (GPO), Bnomal Negatva Generalzada (BNG) e Delta Bnomal (DB). Na Tabela 4.8, apresentamos os resultados dos testes LR, LR, LR1, S R, SR, S T, SR 1 e SR 2. O comportamento das três prmeras estatístcas fo analsado por Slva (2010), que concluu que ao nível nomnal de 10% e consderando os modelos Posson e BNG, todos os testes rejetam a 33