REFINAMENTOS DE TESTES NA CLASSE DOS MODELOS NÃO-LINEARES SIMÉTRICOS HETEROSCEDÁSTICOS. Mariana Correia de Araújo

Documentos relacionados
UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE CIÊNCIAS EXATAS E DA NATUREZA PÓS-GRADUAÇÃO EM ESTATÍSTICA

Universidade Federal de Pernambuco Centro de Ciências Exatas e da Natureza Departamento de Estatística

APERFEIÇOAMENTO DE TESTES DE HIPÓTESES PARA MODELOS NÃO-LINEARES SIMÉTRICOS KATYA SILENE PORTO RODRIGUES BRAGA

Detecção de Clusters Espaciais Em Modelos de Regressão Poisson Duplo com Inflação de Zeros

CORREÇÃO TIPO-BARTLETT À ESTATÍSTICA

Análise matricial de estruturas não-lineares usando o Método de Newton.

HELOISA DE MELO RODRIGUES

Tema Tendências em Matemática Aplicada e Computacional, 15, N. 1 (2014), 59-71

SEM0 M Aul u a l a 14 Sistema de Múltiplos Corpos Sistema Pro r f. D r. r Ma M r a c r elo l Becker SEM - EESC - USP

4 DEFINIÇÃO DA GEOMETRIA, MALHA E PARÂMETROS DA SIMULAÇÃO

UNIVERSIDADE FEDERAL DE SANTA CATARINA

ANÁLISE COMPLEXA E EQUAÇÕES DIFERENCIAIS TESTE 2A - 15 DE JUNHO DE DAS 11H. Apresente e justifique todos os cálculos. dy dt = y t t ; y(1) = 1.

ESTUDO DA EQUAÇÃO DE DEFASAGEM

Sist. Lin. I. Sistemas Lineares Introdução Definições Geometria Resolução Equivalência Eliminação de Gauss Após Escalonamento. Sist. Lin.

Breve resolução do e-fólio B

5 Estimação de Parâmetros utilizando o Algoritmo SAGE

Técnicas computacionais em probabilidade e estatística II

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Comparação entre intervalos de confiança calculados com métodos bootstrap e intervalos assintóticos

Análise de Dados Longitudinais Aula

3. Experimentos a um único fator: Análise de Variância (ANOVA) 3.7 Comparações entre médias de tratamento

ANÁLISE MATEMÁTICA IV FICHA SUPLEMENTAR 5 EQUAÇÕES DIFERENCIAIS PARCIAIS E TRANSFORMADA DE LAPLACE

ESTATÍSTICA COMPUTACIONAL

INTRODUÇÃO À ROBÓTICA MÓVEL

Uma lagrangeana para a corda vibrante

Especialização em Engenharia de Processos e de Sistemas de Produção

Operando com potências

Um dos conceitos mais utilizados em Matemática

AULA 05 Teste de Hipótese

Operando com potências

Exercícios de Programação e Computação para Arquitectura. António Menezes Leitão

ENTECA 2003 IV ENCONTRO TECNOLÓGICO DA ENGENHARIA CIVIL E ARQUITETURA

Estimação e Testes de Hipóteses

Disciplina de Modelos Lineares Professora Ariane Ferreira

PE-MEEC 1S 09/ Capítulo 7 - Estimação por intervalos. 7.2 Intervalos de. confiança para. média de uma. normal 7.

Triângulos especiais

9 Proposta de dimensionamento de elementos de concreto armado à flexão simples em situação de incêndio

As equações de campo da gravitação De A. Einstein.

Inferência para duas populações

1 Probabilidade - Modelos Probabilísticos

AULA 7 - Inferência em MQO: ICs e Testes de

4.1 Conceitos Básicos em Reamostragem

Teoria da Estimação. Fabricio Goecking Avelar. junho Universidade Federal de Alfenas - Instituto de Ciências Exatas

Estimadores de MáximaVerossimilhança Corrigidosem Modelos de Regressão Não-Lineares Heteroscedásticos p. 1/35

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

e rápido para estimar a potência. do rotor (i.e. seleccionar a sua área) para um

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Informática para Ciências e Engenharias (B) 2015/16. Teórica 5

ESTATÍSTICA COMPUTACIONAL

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra

Análise univariada e Multivariada no mapeamento genético da pressão arterial

Modelo de regressão estável aplicado a econometria

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

5.1. Simulações para o Campo Magnético Gerado por um Ímã Permanente.

AULA 04 Teste de hipótese

MODELOS DE REGRESSÃO PARA DADOS CONTÍNUOS ASSIMÉTRICOS

INSTITUTO SUPERIOR TÉCNICO UNIVERSIDADE TÉCNICA DE LISBOA. Guia do ensaio de laboratório para as disciplinas:

Aula 2 Uma breve revisão sobre modelos lineares

CONHECIMENTOS ESPECÍFICOS

Cap. 4 - Estimação por Intervalo

Um Método para o Cálculo da Inversa de Matrizes Simétricas e Positivas Definidas em Bloco

Informática para Ciências e Engenharias (B) 2015/16. Teórica 11

Podemos utilizar o cálculo do determinante para nos auxiliar a encontrar a inversa de uma matriz, como veremos à seguir.

CE085 - Estatística Inferencial. derivadas. Prof. Wagner Hugo Bonat. 5 de setembro de Curso de Bacharelado em Estatatística

Mais sobre Modelos Continuos

ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

EQUAÇÕES DIFERENCIAIS: MÉTODOS DE SÉRIES II

Detecção de Infração em faixa de pedestres sem semáforos utilizando visão computacional e redes neurais

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação

O EFEITO DA PRESENÇA DE CENSURAS ALEATÓRIAS NOS INTERVALOS DE CONFIANÇA PARA OS PARÂMETROS DO MODELO LOG-LOGÍSTICO DUPLO

AULA 07 Inferência a Partir de Duas Amostras

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

SNPTEE SEMINÁRIO NACIONAL DE PRODUÇÃO E TRANSMISSÃO DE ENERGIA ELÉTRICA

Metodologia de Cálculo do Fator de Forma para Geometrias Tridimensionais Considerando os Efeitos de Obstrução

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

10. CARGAS ACIDENTAIS E MÓVEIS; LINHAS DE INFLUÊNCIA

UM ALGORITMO VNS MULTIOBJETIVO PARA O PROBLEMA DE SEQUENCIAMENTO COM ALOCAÇÃO DE TRABALHADORES

Análise de Regressão Linear Simples e

Dimensionamento de amostras para regressão logística

MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS

Testes de Hipótese para uma única Amostra - parte II

UM MODELO NÃO-LINEAR PARA ANÁLISE DA INTERAÇÃO SOLO-ESTRUTURA DE DUTOS SUBTERRÂNEOS POR MEIO DE ELEMENTOS DE PÓRTICO

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9

Modelo para o Campo Magnético de uma Agulha Retilínea

Análise Multivariada Aplicada à Contabilidade

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Estatísticas Inferenciais Distribuições Amostrais. Estatística

Universidade Federal de Lavras

Distribuições por Amostragem

Análise de Regressão EST036

Método dos Deslocamentos

3 Modelo Matemático Definições Iniciais. Denote-se, em geral, o desvio-padrão do processo por σ = γσ 0, sendo σ 0 o

CONHECIMENTOS ESPECÍFICOS

Transcrição:

REFINAMENTOS DE TESTES NA CLASSE DOS MODELOS NÃO-LINEARES SIMÉTRICOS HETEROSCEDÁSTICOS Mariana Correia de Araújo Orientadora: Prof a Dr a Lourdes Cora Contreras Montenegro Co-orientadora: Prof a Dr a Audrey Heen Mariz de Aquino Cysneiros Tese submetida como requerimento parcia para obtenção do grau de Doutor em Estatística pea Universidade Federa de Minas Gerais Beo Horizonte, outubro de 2015

Para Gerado (in memoriam) e Rosinha, peo dom da vida e todo amor. ii

Agradecimentos Agradeço a Deus, por segurar minhas mãos nas horas difíceis, não me deixar fraquejar e me fazer perseverar quando tudo parecia estar indo de encontro ao meu objetivo. A minha mãe, por todo amor e carinho dedicado. Peas tantas igações diárias enquanto morávamos onge, pea aegria a cada retorno de férias e por tudo que fez e faz por mim. Ao meu pai (in memoriam), por toda a educação, ensinamentos, amor e carinho. O céu está em festa, tenho certeza. Às professoras Lourdes Montenegro e Audrey Cysneiros, minhas orientadoras, pea dedicação ao trabaho e confiança em mim depositada. Sou imensamente grata por todos os seus ensinamentos e incentivos. A Amanda, Laís, Larissa, Manoo, Marcondes, Natáia, Romison, Sauo e Tamyris, que mesmo distantes, se fizeram presentes em Beo Horizonte. Contar com o apoio de vocês foi fundamenta. A Fernando e Wiiam, pea amizade, por cada conversa, estudo e momentos de azer que nos acompanha desde o mestrado. Sei que posso contar com vocês para as mais diversas coisas e sou muito grata por isto. A academia me deu dois beos presentes em forma de amigo. A Fabrícia, Fádua, Isabea, Nívea, Sivana e Taita, pea convivência diária, companhia e ensinamentos. Foi muito enriquecedor tudo que passamos, trocas que evarei pea vida inteira. Obrigada peo carinho e paciência nos dias difíceis. A Pauo e Wecsey, companheiros do doutorado, peas discussões construtivas, horas de estudo dispensadas e momentos de descontração. Aos professores do Programa de Pós-Graduação em Estatística da UFMG, peo vaioso conhecimento repassado. Aos funcinários do Departamento de Estatística da UFMG, em especia, Jéssica, kate, Maísa, Rogéria e Rose, pea atenção dispensada. Aos membros da banca, peas vaiosas contribuições para o enriquecimento do trabaho. À CAPES, peo apoio financeiro. iii

Você é do tamanho do seu sonho. Autor desconhecido iv

Resumo Nesta tese abordamos o aperfeiçoamento de testes de hipóteses na casse dos modeos não-ineares simétricos heteroscedásticos. Iniciamente, aprimoramos os testes de heteroscedasticidade baseados nas estatísticas da razão de verossimihanças e razão de verossimihanças perfiadas modificadas. A versão modificada da verossimihança perfiada considerada neste trabaho é a proposta por Cox e Reid (1987). Em seguida, obtemos um fator de correção tipo-bartett para o teste de heteroscedasticidade baseado na estatística gradiente. A estatística gradiente foi proposta por Terre (2002) e tem recebido crescente atenção na iteratura, uma vez que aém de ter estrutura simpes de cacuar e impementar, é assintoticamente equivaente às estatísticas da razão de verossimihanças, Wad e escore. Ainda, reaizamos um estudo de poder oca dos testes da razão de verossimihanças, Wad, escore e gradiente a fim de avaiar (ocamente) o poder dos quatro testes. Para cada abordagem reaizada, foi desenvovido um estudo de simuação de Monte Caro a fim de avaiar o desempenho dos testes sob investigação. Paavras chave: Correção de Bartett; Correção tipo-bartett; Estatística gradiente; Modeos não-ineares simétricos heteroscedásticos; Poder oca; Testes de hipóteses; Verossimihança perfiada; Verossimihança perfiada modificada. v

Abstract In this thesis, we dea with improvement for hypotheses tests in heteroscedastic symmetric noninear modes. First, we derive Bartett adjustments for ikeihood ratio statistics and modified profie ikeihood ratio statistics in order to improve ikeihood ratio and modified profie ikeihood ratio tests, respectivey. Next, we cacuate a type-bartett adjustment to improve the gradient test, a new hypotheses test proposed by Terre (2002) which is asymptoticay equivaent to ikeihood ratio, Wad and score tests. We aso treat about the oca power of ikeihood ratio, Wad, score and gradient tests in heteroscedastic symmetric noninear modes. For each approach, we deveop a Monte Caro simuation study in order to evauate the performance of the tests in finite-size sampes. Keywords: Bartett correction; Heteroscedastic symmetric noninear regression modes; Hypotheses tests; Loca power; Modified profie ikeihood; Profie ikeihood; Type- Bartett correction. vi

Sumário 1 Introdução 1 2 Refinamento dos testes da razão de verossimihanças e razão de verossimihanças perfiadas modificadas 6 2.1 Introdução.................................... 6 2.2 Especificação do modeo............................ 8 2.3 Correções de Bartett.............................. 12 2.3.1 Correção de Bartett para a estatística LR.............. 13 2.3.2 Correção de Bartett para a estatística LR m............. 15 2.3.3 Correção de Bartett bootstrap para a estatística LR........ 16 2.4 Resutados numéricos.............................. 17 2.5 Concusões.................................... 25 3 Refinamento dos testes escore e gradiente 27 3.1 Introdução.................................... 27 3.2 Aspectos inferenciais.............................. 28 3.3 Correção tipo-bartett............................. 30 3.3.1 Correção tipo-bartett para a estatística S r.............. 31 3.3.2 Correção tipo-bartett para a estatística S g.............. 33 3.4 Resutados numéricos.............................. 36 3.5 Apicação.................................... 47 3.6 Concusões.................................... 48 vii

4 Poder oca dos testes da razão de verossimihanças, Wad, escore e gradiente 49 4.1 Introdução.................................... 49 4.2 Poder oca................................... 50 4.3 Comparação entre as funções de poder.................... 54 4.4 Resutados numéricos.............................. 56 4.5 Concusões.................................... 62 5 Considerações finais 63 A Aspectos inferenciais do modeos não-ineares simétricos heteroscedásticos 65 B Cácuo do fator de correção tipo-bartett para a estatística LR 68 C Cácuo do fator de correção c m para a estatísica LR m 75 D Derivadas do ogaritmo da função de verossimihança de θ = (β, δ) 78 E Cácuo dos termos A g 1, A g 2 e A g 3 do fator de correção tipo-bartett para a estatística S g 84 F Poder oca: obtenção dos b i s e ξ e comparação de funções de poder 86 G Coehos europeus na Austráia 90 viii

Lista de Figuras 2.1 Discrepância reativa de quantis para o modeo t 5 com n = 35, p = 3, k = 3 22 2.2 Discrepância reativa de quantis para o modeo t 5 com n = 35, p = 5, k = 3 22 2.3 Discrepância reativa de quantis para o modeo exponencia potência com κ = 0, 3, considerando n = 35, p = 3, k = 3................. 23 2.4 Discrepância reativa de quantis para o modeo exponencia potência com κ = 0, 3, considerando n = 35, p = 5, k = 3................. 23 3.1 Discrepância reativa de quantis para o modeo t 5 com n = 30, p = 3, k = 3 44 3.2 Discrepância reativa de quantis para o modeo t 5 com n = 30, p = 5, k = 3 44 3.3 Discrepância reativa de quantis para o modeo exponencia potência com κ = 0.3, considerando n = 30, p = 3, k = 3................. 45 3.4 Discrepância reativa de quantis para o modeo exponencia potência com κ = 0.3, considerando n = 30, p = 5, k = 3................. 45 4.1 Curva de poder dos quatro testes para o modeo t 5 com n = 35, p = 3, k = 4 61 4.2 Curva de poder dos quatro testes para o modeo exponencia potência com κ = 0, 3, n = 35, p = 3, k = 4......................... 61 ix

Lista de Tabeas 2.1 Expressões para g(z 2 ), g (z 2 ) e s para agumas distribuições simétricas...... 10 g(z 2 ) 2.2 Tamanho dos testes para o Modeo t 5 com p = 3, 5, k = 3 e diversos vaores para n. 20 2.3 Tamanho dos testes para o Modeo exponencia potência com κ = 0, 3, p = 3, 5, k = 3 e diversos vaores para n.......................... 21 2.4 Tamanho dos testes para o Modeo t 5 e exponencia potência com κ = 0, 3, considerando n = 35, k = 3 e diversos vaores para p............... 24 2.5 Tamanho dos testes para o Modeo t 5 e exponencia potência com κ = 0, 3, considerando n = 35, p = 3 e diversos vaores para k............... 25 3.1 Tamanho dos testes para o Modeo t 5 com n = 35, p = 3, 5, k = 3 e diversos vaores para n................................... 39 3.2 Tamanho dos testes para o Modeo exponencia potencia com κ = 0.3, p = 3, 5, k = 3 e n...................................... 40 3.3 Tamanho dos testes para o Modeo t 5 e exponencia potência com κ = 0.3, considerando n = 35, k = 3 e diversos vaores para p............... 41 3.4 Tamanho dos testes para o Modeo t 5 e exponencia potência com κ = 0.3, considerando n = 35, p = 3 e diversos vaores para k............... 42 3.5 Poder dos testes para o Modeo t 5 e exponencia potência com κ = 0.3, considerando n = 30, p = 3, 5, k = 3 e α = 10%..................... 46 4.1 Tamanho dos testes para o Modeo t 5 e exponencia potência com κ = 0, 3, considerando n = 30, k = 3 e diversos vaores para p............... 57 x

4.2 Tamanho dos testes para o Modeo t 5 e exponencia potência com κ = 0, 3, considerando n = 30, p = 3 e diversos vaores para k............... 58 4.3 Tamanho dos testes para o Modeo t 5 com p = 3, k = 4 e diversos vaores para n. 59 4.4 Tamanho dos testes para o Modeo exponencia potência com κ = 0, 3, p = 3, k = 4 e diversos vaores para n.......................... 60 G.1 Peso das entes dos ohos de coehos europeus (y), em miigramas, e a idade (x), em dias, numa amostra contendo 71 observações. (Wei, 1998, Exempo 6.8).. 90 xi

CAPÍTULO 1 Introdução Embora muito atrativa, a suposição de normaidade para os erros de modeos de regressão com resposta contínua nem sempre é adequada. A presença de observações extremas no conjunto de dados, por exempo, interfere nas estimativas dos parâmetros dos modeos normais, isto é, tais estimativas são sensíveis a observações aberrantes. Aternativas robustas ao modeo norma têm sido ampamente estudadas na iteratura, entre eas, modeos cujos erros seguem distribuições pertencentes à famíia simétrica, uma vez que esta casse de distribuições contempa, também, distribuições com caudas mais pesadas que a da norma, e assim, acomodando mehor as observações extremas, reduzindo a infuência exercida por tais observações sob as estimativas dos parâmetros do modeo. Aém da distribuição norma, pertencem à famíia de distribuições simétricas as distribuições Cauchy, t Student, t Student generaizada, ogísticas I e II, ogística generaizada, exponencia potência, Kotz, Kotz generaizada, entre outras. Detahes sobre as distribuições simétricas podem ser obtidos em Fang et a. (1990) e Fang e Anderson (1990). Podemos encontrar apicações desta famíia de distribuições nas mais diversas áreas do conhecimento, tais como engenharia, bioogia, medicina, ciências sociais, economia, entre outras. Diversos artigos têm sido desenvovidos com apicações da distribuição simétrica, por exempo, Lang et a. (1989) introduziram o modeo de regressão t Student como aternativa robusta ao modeo norma, Cordeiro et a. (1998) obtiveram uma correção de viés para os estimadores do modeo não-inear com erros t Student, sendo estes resutados 1

estendidos por Cordeiro et a. (2000) para a casse dos modeos não-ineares simétricos, Cysneiros et a. (2007) introduziram os modeos ineares simétricos heteroscedásticos e desenvoveram métodos de infuência oca e Cysneiros et a. (2010b) aperfeiçoaram o teste escore para esta casse de modeos, Cysneiros et a. (2010) fizeram correção de viés para os estimadores do modeo não-inear simétrico heteroscedástico. Aém da distribuição, é extremamente importante verificar se a suposição de variância constante (homoscedasticidade) dos erros é satisfeita, dado que a vioação desse pressuposto atera competamente a estratégia da modeagem. Os testes de heteroscedasticidade comumente utiizados na iteratura baseiam-se em resutados assintóticos, sendo os mais empregados os testes da razão de verossimihanças, escore e Wad, cujas estatísticas de teste são equivaentes até primeira ordem 1 e têm distribuição assintótica nua χ 2 k com erro de ordem n 1, sendo k o número de restrições impostas pea hipótese nua e n o tamanho da amostra. Recentemente, Terre (2002) propôs um novo teste assintótico cuja estatística de teste é chamada estatística gradiente. Esta estatística apresenta uma estrutura simpes, a qua não depende da matriz de informação observada, nem da esperada. Aém disso, a estatística gradiente é de fáci impementação e sob hipótese nua tem distribuição assintótica χ 2 k a menos de termos de ordem n 1. Em contrapartida, ao contrário das estatísticas da razão de verossimihanças e escore, a estatística gradiente não é invariante sob reparametrizações não-ineares (Terre, 2002). Diversos trabahos na iteratura têm abordado a estatística gradiente como tema, dentre ees, Lemonte (2011), Lemonte (2012), Lemonte e Ferrari (2012), Lemonte e Ferrari (2012b), Vargas et a. (2013), Lemonte (2014) e Vargas et a. (2014). Por se basearem em resutados assintóticos, a aproximação da distribuição das estatísticas dos testes da razão de verossimihanças, escore, Wad e gradiente pea distribuição qui-quadrado de referência pode não ser satisfatória, conduzindo a testes com taxas de rejeição distorcidas quando o tamanho da amostra é pequeno ou até mesmo moderado. Uma estratégia para mehorar a aproximação da distribuição das estatísticas de teste pea distribuição qui-quadrado é modificar tais estatísticas através um fator de correção. Para a estatística da razão de verossimihanças, Bartett (1937) propôs um fator de correção a ser mutipicado por ta estatística de modo que a sua versão corrigida apresenta distribuição nua χ 2 k com erro de ordem n 2. Para a estatística escore, Cordeiro e Ferrari (1991) 1 Sejam {a n } n 1 e {b n } n 1 sequências de números reais, dizemos que a n é de ordem menor que b n, denotando por a n = o(b n ), se im n a n /b n = 0. Dizemos que a n é de ordem, no máximo, igua a b n, denotando por a n = O(b n ), se a razão a n /b n for imitada para todo n suficientemente grande, isto é, se existirem K R + e n 0 (K) ta que a n /b n K, n n 0 (K). 2

propuseram um fator de correção tipo-bartett cujo cácuo envove a própria estatística escore, derivando assim uma estatística corrigida cuja distribuição nua é χ 2 k sob erro de aproximação de ordem n 2. Maiores detahes sobre correções de Bartett e tipo-bartett podem ser encontradas em Cordeiro e Cribari-Neto (2014). Para a estatística gradiente, Vargas et a. (2014) derivaram um fator de correção tipo-bartett, fornecendo uma estatística corrigida cuja distribuição assintótica nua é χ 2 k sob erro de aproximação de ordem n 2. Quando o modeo em investigação envove parâmetros de perturbação, a inferência do estudo pode ser baseada através da verossimihança perfiada. A inferência fundamentada em verossimihança perfiada trata os parâmetros de perturbação como conhecidos, isto é, na prática, estamos substituindo tais parâmetros por suas respectivas estimativas de máxima verossimihança. Este procedimento pode introduzir viés na função escore e na informação, veja Ferrari et a. (2005), aém disso, o aumento do número de parâmetros de perturbação impica numa menor quaidade das aproximações assintóticas. Para superar tais probemas, agumas modificações para a função de verossimihança perfiada foram propostas na iteratura, entre eas, as propostas por Barndorff-Niesen (1983; 1994), Cox e Reid (1987), McCuagh e Tibishirani (1990) e Stern (1997), que estão descritas com detahes em Severini (2000, Capítuo 9) e Pace e Savan (1997, Capítuo 11). Devido às boas propriedades que se obtém com a ortogonaidade goba dos parâmetros do modeo, dentre eas a independência assintótica dos estimadores de máxima verossimihança dos parâmetros de interesse e perturbação e o menor custo computaciona na determinação numérica das estimativas de máxima verossimihança destes parâmetros, veja Siva (2005), neste trabaho consideraremos a versão proposta por Cox e Reid (1987). Assim como o teste da razão de verossimihanças usua, o teste baseado na verossimihança perfiada modificada tem sua estatística de teste com distribuição nua assintótica χ 2 k a menos de termos de ordem n 1, sendo esta aproximação insatisfatória quando o tamanho da amostra é pequeno. Visando mehorar a aproximação da distribuição da estatística da razão de verossimihanças perfiadas modificadas pea distribuição χ 2 de referência, DiCiccio e Stern (1994) propuseram um fator de correção de Bartett para esta estatística, derivando uma estatística corrigida cuja distribuição nua é χ 2 k com erro de aproximação de ordem n 2. Considerando os quatro testes assintóticos equivaentes existentes na iteratura, a saber, testes da razão de verossimihanças, Wad, escore e gradiente, um questionamento pertinente é apontar o teste que seja mais adequado para um determinado estudo em de- 3

senvovimento. Da iteratura sabe-se que, até primeira ordem, os quatro testes têm poder igua sob aternativas de Pitman e até ordem n 1/2, o mesmo tamanho, o que impica que a escoha pode ser baseada em um critério que seja determinado através da comparação (oca) dos seus poderes até ordem n 1/2. Para isto, Hayakawa (1975) desenvoveu expansões assintóticas sob uma sequência de hipóteses aternativas contíguas que convergem para hipótese nua à taxa de n 1/2, para as distribuições das estatísticas da razão de verossimihanças e Wad. Harris e Peers (1980) obtiveram resutado anáogo para a estatística escore e recentemente Lemonte e Ferrari (2012) para a estatística gradiente. Assim, o objetivo do estudo do poder até ordem n 1/2 é estabeecer condições através das quais podemos comparar ocamente os poderes dos quatro testes assintóticos em estudo a partir das distribuições não nuas sob hipóteses aternativas de Pitman de suas respectivas estatísticas de teste (até ta ordem). Diversos trabahos têm contempado os modeos simétricos, refinamentos de testes de hipóteses e estudo de poder oca. Ferrari et a. (2004) cacuaram um fator de correção de Bartett para a estatística da razão de verossimihanças perfiadas modificadas para o modeo norma inear estudado por Simonoff e Tsai (1994). Considerando a casse dos modeos não-ineares simétricos, Cordeiro (2004) obteve um teste da razão de verossimihanças corrigido e Cysneiros et a. (2010b) um teste escore corrigido. Lemonte (2012) reaizou um estudo de poder oca dos testes da razão de verossimihanças, Wad, escore e gradiente na casse dos modeos ineares simétricos. Nesta direção, esta tese tem três objetivos principais. O primeiro é obter fatores de correção de Bartett para aprimorar os testes da razão de verossimihanças e razão de verossimihanças perfiadas modificadas para a casse dos modeo não-ineares simétricos heteroscedásticos (MNLSH), sendo o segundo teste baseado na verossimihança perfiada modificada proposta por Cox e Reid (1987), generaizando os resutados obtidos por Ferrari et a. (2004) e Cordeiro (2004). O segundo objetivo é derivar um fator de correção tipo- Bartett para a estatística gradiente na casse dos MNLSH considerando a metodoogia proposta por Vargas et a. (2013). O terceiro objetivo da tese é estender os resutados obtidos por Lemonte (2012) para os modeos não-ineares simétricos heteroscedásticos, isto é, reaizar um estudo de poder oca dos testes da razão de verossimihanças, Wad, escore e gradiente na casse dos MNLSH. Esta tese é dividida em cinco capítuos e sete apêndices. No Capítuo 2, fazemos uma breve introdução ao modeo em estudo e apresentamos aguns aspectos inferenciais do mesmo. Ainda, obtemos fatores de correção de Bartett para as estatísticas da razão 4

de verossimihanças e razão de verossimihanças perfiadas modificadas. Um estudo de simuação de Monte Caro é reaizado para avaiar o desempenho dos testes corrigidos e não corrigidos em amostras finitas. A efeito de comparação, também são considerados testes cujas respectivas estatísticas de teste são obtidas utiizando a técnica de reamostragem bootstrap (Efron, 1979), a saber, teste da razão de verossimihanças bootstrap e razão de verossimihanças Bartett bootstrap (Rocke, 1989). No Capítuo 3, derivamos um fator de correção tipo-bartett para a estatística gradiente para o teste de heteroscedasticidade na casse dos MNLSH. Um estudo de simuação de Monte Caro para avaiar o comportamento em amostras finitas do teste gradiente corrigido e não corrigido e diferentes testes disponíveis na iteratura é reaizado. As avaiações consideraram tamanho e poder dos testes sob diversos cenários. Ainda, apicamos a metodoia estudada a um conjunto de dados reais. No Capítuo 4, reaizamos um estudo de poder oca dos testes da razão de verossimihanças, Wad, escore e gradiente na casse dos MNLSH. Para isto, derivamos expansões assintóticas para a distribuição das estatísticas dos quatro testes supracitados sob hipóteses aternativas de Pitman e comparamos anaiticamente os seus poderes até ordem n 1/2. Ainda, apresentamos um estudo de simuação de Monte Caro para avaiar o desempenho dos testes em amostras de tamanho pequeno e moderado. No Capítuo 5, fazemos agumas considerações finais gerais dos resutados obtidos na tese. Nos apêndices são apresentados detahes técnicos. É váido observar que esta tese foi escrita de maneira que os Capítuos 2, 3 e 4 possam ser idos individuamente e em quaquer ordem, assim, agumas notações e resutados básicos são apresentados mais de uma vez. 5

CAPÍTULO 2 Refinamento dos testes da razão de verossimihanças e razão de verossimihanças perfiadas modificadas 2.1 Introdução Quando o tamanho da amostra é pequeno ou moderado, sabemos da iteratura que o teste da razão de verossimihanças pode apresentar taxas de rejeição distorcidas, isto é, muito diferentes do esperado. Ta fato se deve à aproximação da distribuição de sua estatística de teste pea distribuição qui-quadrado de referência, que pode não ser satisfatória, uma vez que este teste é baseado em resutados assintóticos. Dessa maneira, se faz necessário o desenvovimento de procedimentos inferenciais mais acurados, isto é, que nos garanta uma inferência mais precisa. A fim de mehorar a aproximação da distribuição da estatística da razão de verossimihanças pea distribuição χ 2 de referência, Bartett (1937) propôs um fator de correção a ser incorporado a ta estatística de modo a obter um teste aprimorado, proporcionando uma inferência mais confiáve quando o tamanho da amostra é pequeno. Ao reaizar inferência em modeos com parâmetros de perturbação, podemos basear nossas investigações em verossimihança perfiada, que é uma função que só depende do parâmetro de interesse, sendo os parâmetros de perturbação substituídos por estimativas consistentes. O teste da razão de verossimihanças baseado em verossimihança perfiada tem sua estatística de teste equivaente à estatística da razão de verossimihanças usua, com distribuição assintótica nua χ 2. No mais, um ponto que devemos evar em consi- 6

deração é a quantidade de parâmetros de perturbação, uma vez que a verossimihança perfiada pode fornecer estimadores de máxima verossimihança inconsistentes e ineficientes para probemas que envovem um grande número destes parâmetros. Para minimizar o efeito do número de parâmetros de perturbação, Cox e Reid (1987) propuseram uma versão modificada para a verossimihança perfiada, a qua exige ortogonaidade entre os parâmetros de interesse e perturbação. Como mencionado anteriormente, a estatística da razão de verossimihanças perfiadas modificadas é assintoticamente equivaente à estatística da razão de verossimihanças usua, isto é, tem distribuição assintótica nua χ 2, podendo não ser bem aproximada pea distribuição qui-quadrado de referência quando o tamanho da amostra é pequeno e/ou moderado. Com o objetivo de mehorar a aproximação da distribuição da estatística deste teste pea distribuição χ 2 de referência, DiCiccio e Stern (1994) propuseram um fator de correção de Bartett derivando o teste da razão de verossimihanças perfiadas modificadas corrigido, o qua confere uma inferência mais precisa quando o tamanho da amostra não é suficientemente grande. A metodoogia das correções de Bartett tem recebido bastante atenção na iteratura e diversos trabahos abordando esta temática têm sido propostos. Na casse dos modeos simétricos, Ferrari e Uribe-Opazo (2001) obtiveram um fator de correção de Bartett para a estatística da razão de verossimihanças para modeos ineares, sendo estes resutados estendidos para os modeos não-ineares por Cordeiro (2004). Ferrari et a. (2004) obtiveram um fator de correção de Bartett para a estatística da razão de verossimihanças perfiadas modificadas para o modeo norma inear heteroscedástico. Uma aternativa numérica à correção de Bartett anaítica para a estatística da razão de verossimihanças é a correção de Bartett bootstrap, proposta por Rocke (1989). Ta fator de correção é obtido a partir da técnica de reamostragem bootstrap (Efron, 1979), sendo uma aternativa bastante atrativa, principamente para casos em que é difíci cacuar a correção de Bartett anaítica. Nesta direção, nosso objetivo é obter fatores de correção de Bartett para as estatísticas da razão de verossimihanças e razão de verossimihanças perfiadas modificadas na casse dos modeos não-ineares simétricos heteroscedásticos, generaizando os resutados obtidos por Cordeiro (2004) e Ferrari et a. (2004). No que segue, iremos definir o modeo não-inear simétrico heteroscedástico (MNLSH) e apresentaremos aspectos inferenciais do mesmo. Na Seção 2.3, abordaremos as correções de Bartett anaíticas e numérica e apresentaremos expressões, em notação matricia, para os fatores de correção de Bartett 7

para as estatísticas da razão de verossimihanças e razão de verossimihanças perfiadas modificadas para o teste de heteroscedasticidade na casse dos MNLSH. Para avaiar o desempenho dos testes em estudo considerando amostras de tamanho pequeno e moderado, na Seção 2.4 iremos reaizar um estudo de simuação de Monte Caro sob diversos cenários. Ainda para o estudo de simuação, consideraremos, para efeito de comparação, os testes da razão de verossimihanças bootstrap e razão de verossimihanças Bartett bootstrap. Concusões acerca dos resutados obtidos são apresentadas na Seção 2.5. 2.2 Especificação do modeo Suponha y 1,..., y n variáveis aeatórias contínuas independentes. Dizemos que y, = 1,..., n, segue distribuição simétrica com µ R e φ > 0 parâmetros de ocação e dispersão, respectivamente, se sua função de densidade é escrita como π(y ; µ, φ ) = 1 φ g(u ), y R, = 1,..., n, (2.1) para aguma função g( ), usuamente denominada geradora de densidade, ta que g(u ) > 0, para u > 0 e g(u )du = 1, com u = (y µ ) 2 /φ. Denotamos a variáve u 1/2 0 aeatória simétrica por y S(µ, φ, g), para = 1,..., n. Aém da norma, a casse de distribuições simétricas contempa as distribuições norma contaminada, t Student, t Student generaizada, Kotz, Kotz generaizada, ogística tipos I e II, ogística generaizada, exponencia potência, entre outras. Para determinar o modeo não-inear simétrico heteroscedástico, duas estruturas de regressão foram introduzidas à casse de distribuições simétricas (2.1). Assumimos para a resposta média µ = (µ 1,..., µ n ) a seguinte estrutura: µ = f(x ; β), = 1,..., n, (2.2) em que f( ; ) é uma função não-inear, contínua e dupamente diferenciáve com respeito aos componentes de β = (β 0, β 1,..., β p 1 ), que é um vetor de parâmetros desconhecidos a serem estimados (p < n), e x = (x 1,..., x m ) é o vetor de m variáveis expicativas associadas à ésima observação. Ainda, é assumido uma componente sistemática para o vetor de parâmetros de dispersão φ = (φ 1,..., φ n ) dado por φ = σ 2 m(τ ), = 1,..., n, (2.3) 8

com m(τ ) > 0, sendo τ = w δ, w = (w 1,..., w k ) um vetor de variáveis expicativas que pode ter componentes comuns com x, δ = (δ 1,..., δ k ) um vetor de parâmetros desconhecidos a serem estimados e σ 2 (0, ) uma constante desconhecida. Para efeito de simpificação, no que segue, denotaremos m(τ ) = m. Assim sendo, o modeo não-inear simétrico heteroscedástico é dado por y = µ + φ ɛ ; = 1,..., n, (2.4) em que ɛ S(0, 1, g), sendo µ e φ como definidos em (2.2) e (2.3), respectivamente. A contribuição deste capítuo está centrada em testar a hipótese nua H 0 : δ = δ 0, em que δ 0 é um vetor de dimensão k 1 de constantes especificadas ta que m(w δ 0 ) = 1 para todo = 1,..., n, contra H 1 : δ δ 0. Dessa forma, o número de parâmetros de interesse é k e o número de parâmetros de perturbação é p + 1. O ogaritmo da função de verossimihança do vetor de parâmetros θ = (δ, β, σ 2 ), dado o vetor de observações y = (y 1,..., y n ), do modeo definido em (2.4) é expresso por (θ; y) = n 2 og σ2 1 og m + t(z ), 2 com t(z ) = og g(z 2), sendo z = u = (y µ ) φ, = 1,..., n. A função escore tota de θ = (δ, β, σ 2 ) tem a forma U(θ) = (U δ, U β, U σ 2) e seus componentes (ver Apêndice A) são expressos, em notação matricia, por U δ = 1 2 Ψ (Mι SMu), U β = XSΦ(y µ) e U σ 2 = n σ 2 + 1 2σ 2 (y µ) SΦ(y µ), em que X = µ/ β, S = diag{s 1,..., s n }, com s = 2g (z 2) e g (z 2 g(z 2) ) = g(z2 ), Φ = z 2 diag{1/φ 1,..., 1/φ n }, Ψ é uma matriz n k com a ésima inha dada por m / δ, M = diag{1/m 1,..., 1/m n }, u = (u 1,..., u n ) e ι é um vetor n 1 de uns. Agumas das distribuições simétricas são istadas na Tabea 2.1, em que também incuímos expressões para g(z 2 ) e s. A matriz de informação de Fisher para o modeo resutante (ver Apêndice A) é expressa da forma ( 2 ) I = E θ θ = ( 1 δ(0,1,0,0,2) 4 ( 1 δ(0,1,0,0,2) 4 ) Ψ M (2) Ψ 0 ( 1 δ(0,1,0,0,2) 4 ) Ψ Φι 0 ) δ X (0,1,0,0,0) Φ X 0 ι ΦΨ 0 (1 δ (0,1,0,0,2) ) n 4σ 4 9,

sendo M (2) = M M, em que denota o produto Hadamard, isto é, produto eemento a eemento (Rao, 1973, pág. 30), δ (a,b,c,d,e) = E{t(z ) (1)a t(z ) (2)b t(z ) (3)c t(z ) (4)d z e } para a, b, c, d, e {1, 2, 3, 4} e t(z ) (k) = k t(z ), para k = 1, 2, 3, 4 e = 1,..., n. Os vaores z k dos δ s correspondentes a agumas distribuições simétricas podem ser encontrados em Uribe-Opazo et a. (2008) Tabea 2.1: Expressões para g(z 2 ), g (z 2 ) g(z 2 ) e s para agumas distribuições simétricas. Distribuições g(z 2 ) g (z 2 ) g(z 2 ) s 1. Norma exp{ 1 2 z2 } 2π 1 2 1 2. Cauchy 1 π (1 + z2 ) 1 1 1+z 2 2 1+z 2 3. t-student ν ν 2 [ν+z 2 ] ν+1 2 ν+1 B(1/2,ν/2) 2(ν+z 2 ) exp{ z 2 } 4. Logística tipo I c, 1 exp{ z2 } (1+exp{ z 2 }) 2 1+exp{ z 2 } 5. Logística tipo II c 1, 484300029 exp{ z} 1 (exp{ z } 1) (1+exp{ z}) 2 2 ( z exp{ z }+1) 6. Exponencia potência c(k) exp { 1 2 z2/(1+k)}, z2 ( k/(1+k)) c(k) 1 = Γ(1 + 1+k 2 )21+(1+k)/2 2(1+k) ν+1 (ν+z 2 ) 2(1 exp{ z 2 }) 1+exp{ z 2 } (exp{ z } 1) ( z exp{ z }+1) z 2 ( k/(1+k)) (1+k) Na presença de parâmetros de perturbação, podemos reaizar inferências com base na função de verossimihança perfiada, sendo tais parâmetros são substituidos por suas respectivas estimativas de máxima verossimihança para vaores fixos dos parâmetros de interesse, resutando em uma função de verossimihança que depende apenas dos parâmetros de interesse. O ogaritmo da função de verossimihança perfiada do modeo resutante é dado por p (δ) = p (δ; y) = (δ, ˆβ δ, ˆσ δ 2 ; y), (2.5) sendo ˆβ δ e ˆσ 2 δ os estimadores de máxima verossimihança de β e σ2 dado δ, respectivamente. Supondo váidas as condições gerais de reguaridade, ˆβ δ e ˆσ δ 2 são, respectivamente, souções das equações U β = 0 e U σ 2 = 0, as quais não podem ser obtidas em forma fechada. Dado isto, os estimadores de máxima verossimihança de β e σ 2 restritos a δ são obtidos computacionamente a partir de técnicas iterativas de maximização restrita. Maiores detahes destas técnicas podem ser obtidas em Noceda e Wright (1999, Capítuo 18). 10

A obtenção do estimador de máxima verossimihança de δ pode ser feita maximizando o ogaritmo da função de verossimihança dado em (2.5) sujeita às restrições U β = 0 e U σ 2 = 0. Para testar a hipótese nua de interesse, isto é, H 0 : δ = δ 0, contra a hipótese aternativa H 1 : δ δ 0, sendo δ 0 um vetor k 1 de constantes especificadas, a estatística da razão de verossimihanças (LR) é dada por LR = 2{ p (ˆδ) p (δ 0 )}, sendo ˆδ o estimador de máxima verossimihança de δ. Assintoticamente e sob a hipótese nua, LR tem distribuição χ 2 k, sendo k o número de restrições impostas por H 0, sob erro de ordem n 1. Ao substituir os parâmetros de perturbação por suas respectivas estimativas de máxima verossimihança estamos, de certo modo, os tratando como conhecidos. Por esta razão, a função de verossimihança perfiada pode apresentar viés na função escore e na informação (Ferrari et a., 2005). Ainda, este procedimento pode fornecer estimadores de máxima verossimihança inconsistentes e ineficientes para probemas com um número grande de parâmetros de perturbação. Cox e Reid (1987) propuseram uma versão modificada da função de verossimihança perfiada com o intuito de atenuar o efeito do número de parâmetros de perturbação, entretanto, esta versão requer ortogonaidade entre os parâmetros de interesse e os de perturbação, o que em nosso caso de estudo impica que δ deve ser ortogona aos demais parâmetros. Como podemos observar na matriz de informação de Fisher, (δ, σ 2 ) é ortogona a β e para satisfazer ta restrição é preciso que a transformação (δ, β, σ 2 ) (δ, β, γ) nos conduza à ortogonaidade entre δ e γ, ou seja, é necessário e suficiente que E( / δ a γ) = 0, a = 1,..., k. Seguindo a metodoogia de Cox e Reid (1987, Eq. 4), temos que a transformação desejada é obtida a partir do sistema de equações diferenciais n 2σ 4 σ 2 δ a = 1 2σ 2 m δ a 1 m que tem como soução (Simonoff e Tsai, 1994) σ 2 γ = ( n m ). 1/n Considerando o modeo reparametrizado, o ogaritmo da função de verossimihança perfiada modificada (Cox e Reid, 1987) é dado por CR(δ) = p(δ; y) 1 2 og{det[j (δ; ˆβ δ, ˆγ δ )]}, 11

em que p(δ; y) = (δ, ˆβ δ, ˆγ δ ; y), n com ˆγ δ = ˆσ δ 2 ( m ) 1/n, é o ogaritmo da função de verossimihança perfiada para δ, sendo (θ ; y) = n 2 og γ + t(z ) o ogaritmo da função de verossimihança para o vetor de parâmetros θ = (β, δ, γ) e j (δ; β, γ) é o boco da matriz de informação observada para os parâmetros de perturbação (β, γ) avaiada em (δ, ˆβ δ, ˆγ δ ), expresso por ( j j (δ; ˆβ, ˆγ) = ββ 0 0 jγγ ), em que j ββ é uma matriz quadrada de ordem p cujas entradas são dadas por e j ββ = 2 (θ ; y) β j β j γγ = 2 (θ ; y) γ 2 = 1 γ = n 2γ 2 3 4γ 2 t(z ) (2) q (j, ) + 1 γ 1/2 t(z ) (1) z 1 4γ 2 t(z ) (1) q 1/2 (j) t(z ) (2) z 2 é um escaar, com q = ( n s=1 ms)1/n m, (j, ) = ( µ / β j )( µ / β ) e (j) = 2 µ / β j β. A estatística da razão de verossimihanças perfiadas modificadas (LR m ) para o teste de H 0 contra H 1 é dada por LR m = 2{ CR (ˆδ) CR (δ 0 )}, (2.6) sendo ˆδ o estimador de máxima verossimihança de δ. Sob H 0, a estatística LR m tem distribuição assintótica χ 2 k, com erro de aproximação de ordem n 1. 2.3 Correções de Bartett Quando a distribuição nua exata da estatística de teste é desconhecida ou difíci de ser obtida, é comum na iteratura o uso de testes assintóticos. Os testes de razão de verossimihanças usua e verossimihanças perfiadas modificadas são baseados em grandes amostras e suas respectivas estatísticas de teste, LR e LR m, têm distribuição assintótica 12

nua χ 2 k, sendo k o número de restrições impostas por H 0, sob um erro de aproximação de ordem n 1. No entanto, quando o tamanho da amostra não é suficientemente grande, a aproximação da distribuição das estatísticas LR e LR m pea distribuição χ 2 pode não ser satisfatória, conduzindo a taxas de rejeição bastante distorcidas e podendo resutar numa tomada de decisão equivocada. Uma maneira de mehorar a aproximação das distribuições das estatísticas LR e LR m pea distribuição χ 2 é introduzir fatores de correção de Bartett (Bartett, 1937; DiCiccio e Stern, 1994) à essas estatísticas de modo que o erro de aproximação das distribuições das estatísticas corrigidas pea distribuição χ 2 de referência seja menor que o erro de aproximação para as respectivas versões não corrigidas. Os fatores de correção de Bartett não dependem de um modeo paramétrico particuar, sendo bastante gerais, o que impica que suas expressões devem ser obtidas para cada probema de interesse. Uma outra aternativa para atenuar a distorção das taxas de rejeição do teste da razão de verossimihanças quando idamos com amostras pequenas é apicar a técnica bootstrap (Efron, 1979). O teste da razão de verossimihanças bootstrap segue a metodoogia descrita por Efron e Tibshirani (1993), que baseada na estatística LR possibiita encontrar a distribuição empírica da mesma, a partir da amostra observada y = (y 1,..., y n ). Ainda, podemos considerar o teste da razão de verossimihanças Bartett bootstrap proposto por Rocke (1989) como aternativa numérica do teste da razão de verossimihanças corrigido via correção de Bartett. 2.3.1 Correção de Bartett para a estatística LR Sabe-se que para grandes amostras e sob hipótese nua, a estatística LR tem distribuição qui-quadrado com erro de aproximação de ordem n 1. Bartett (1937) propôs mutipicar a estatística LR por um fator de correção (1+c/k) 1 derivando uma estatística corrigida LR expressa por LR = LR 1 + c/k, em que c é uma constante de ordem n 1 que pode ser estimada sob H 0 e escrita em função de momentos das derivadas do ogaritmo da função de verossimihança (Lawey, 1956). Em particuar, P (LR x) = P (χ 2 k x) + O(n 2 ) sob H 0. Maiores detahes sobre correção de Bartett podem ser encontrados em Cordeiro e Cribari-Neto (2014). Para o teste de H 0 : δ = δ 0 H 1 : δ δ 0 na casse dos MNLSH considerando heteroscedasticidade com efeitos mutipicativos, isto é, m = exp(ω δ), temos que a 13

constante c do fator de correção de Bartett para a estatística LR é dada por sendo c = ɛ k (δ) + ɛ p,k (β, δ) + ɛ p,k (δ, γ) + ɛ p,k (β, δ, γ), (2.7) ɛ k (δ) = M 4 4 tr(h2 d ) + M 2 3 6 ι H (3) ι + M 2 3 4 ι HH d Hι, ɛ p,k (β, δ) = M 7 4δ (0,1,0,0,0) ι QH d Z βd ι M 8 4δ (0,1,0,0,0) ιh d Z βd ι + δ (0,0,1,0,1) 2δ (0,1,0,0,0) ιqh d Z βd ι + ι QH d Z βd ι + + M 7 M 8 ι QH d Z βd ι ιh d Z βd ι 4δ (0,1,0,0,0) 4δ (0,1,0,0,0) ( M10 2 2(δ (0,1,0,0,0) ) + M ) 10 ι QZ 2 β H Z β Qι δ (0,1,0,0,0) M 2 10 4(δ (0,1,0,0,0) ) 2 ι QZ βd HZ βd Qι M 3M 10 2δ (0,1,0,0,0) ι QZ βd HH d ι, ɛ p,k (δ, γ) = M 9M 11 2 M 1 2 M 11 [tr(h d )] 2 + 4 tr(h d ) + M 2 M 11 tr(h d ) M 1 2 M 11 ι H (2) ι ( 2 M1 M 6 + M 1(M 6 4M 5 ) 4 4 ɛ p,k (β, δ, γ) = M 1M 10 M 11 4δ (0,1,0,0,0) [ (ι W Z βd ι) (ι H d ι) + ι QH d Z βd ι ], ) M 2 11tr(H d ) e em que Q = diag(q 1,..., q n ), com q = exp{ (ω ω) δ} e ω = ( ω 1,..., ω k ), W = τ / δ, H = {h s } = (W W )[(W W ) V (W W )] 1 (W W ), com (W W ) = (w 1 w,..., w n w) e V matriz diagona de ordem n com entradas v = (1 δ (0,1,0,0,2) )/4,, s = 1,..., n, H (2) = (h 2 s ), H(3) = (h 3 s ), Z β = X( X Q X) 1 X, ι vetor n 1 de uns, os subscritos d indicam que apenas os eementos da diagona principa das matrizes foram considerados. Ainda, os escaares M 1 a M 11 expressos por M 1 = 1 8 {δ (0,0,1,0,3) + 3δ (0,1,0,0,2) + δ (1,0,0,0,1) }, M 2 = M 1, M 3 = M 1, M 4 = 1 16 {δ (0,0,0,1,4) + 6δ (0,0,1,0,3) + 7δ (0,1,0,0,2) + δ (1,0,0,0,1) }, M 5 = n 2 {2 + 3δ (1,0,0,0,1) + δ (0,1,0,0,2) }, M 6 = n 8 {8 + 15δ (1,0,0,0,1) + 9δ (0,1,0,0,2) + δ (0,0,1,0,3) }, 14

M 7 = 1 4 {δ (0,0,0,1,2) + 3δ (0,0,1,0,1) }, M 8 = 1 2 {δ (0,0,1,0,1) + 2δ (0,1,0,0,0) }, M 9 = 1 16 {δ (0,0,0,1,4) + 8δ (0,0,1,0,3) + 13δ (0,1,0,0,2) + 3δ (1,0,0,0,1) }, M 10 = M 8 e M 11 = 4 n{2 + δ (0,1,0,0,2) + 3δ (1,0,0,0,1) }. Podemos observar que a constante c do fator de correção envove apenas operações simpes de matrizes e podem ser facimente impementados em pacotes de computação simbóica e inguagens de programação que permite execução de operações simpes de ágebra inear, tais como, Ox e R. Detahes sobre a obtenção da constante c são apresentados no Apêndice B. 2.3.2 Correção de Bartett para a estatística LR m A estatística LR m, assim como a estatística da razão de verossimihanças usua, tem distribuição nua assintótica χ 2 k sob erro de aproximação de ordem n 1. DiCiccio e Stern (1994) propuseram uma correção de Bartett para esta estatística, reduzindo o erro de aproximação para ordem n 2. A estatística corrigida é dada por LR m = LR m 1 + c m /k, sendo c m uma constante de ordem n 1 ta que, sob H 0, E(LR m) = k+o(n 3/2 ). A equação gera para c m é definida em DiCiccio e Stern (1994, Eq. 25). Baseado nessa expressão, Ferrari et a. (2004, Eq. 5) obtiveram uma equação para o cácuo de c m que pode ser empregada em quaquer casse de modeos que usa a partição do vetor de parâmetros ta como feita neste capítuo. No Apêndice C, obtemos com detahes c m para o teste de H 0 que, considerando heteroscedasticidade com efeitos mutipicativos, na casse dos MNLSH, é escrito em notação matricia como c m = 1 4 M 4tr(H 2 d ) 1 4 M 2 1 M 11 [tr(h d )] 2 + 1 4 M 2 1 ι H d HH d ι + 1 6 M 2 1 ι H (3) ι M 1 M 11 tr(h d ) M 1 M 5 M 2 11tr(H d ) 1 2 M 2 1 M 11 ι H (2) ι. (2.8) A constante c m envove apenas operações simpes de matrizes, ta como a constante c do fator de correção da estatística LR. Ainda, o fator de correção c m depende apenas da matriz de covariáveis W, do número de parâmetros desconhecidos em φ e do número 15

de observações, assim, não dependendo de parâmetros desconhecidos ou do número de parâmetros de perturbação. Aém disso, pode-se observar que a não inearidade do modeo não exerce infuência sobre o fator de correção c m para a estatística da razão de verossimihanças perfiadas modificadas para o teste de heteroscedasticidade. 2.3.3 Correção de Bartett bootstrap para a estatística LR Como aternativa aos testes assintóticos, pode-se reaizar inferências baseadas em testes com vaores críticos (p vaor) obtidos através da técnica bootstrap (Efron, 1979). O teste da razão de verossimihanças bootstrap apresenta inferência confiáve e não envove cácuos compexos, no mais, é computacionamente custoso. Considerando a técnica bootstrap (Efron, 1979), Rocke (1989) propôs uma forma numérica aternativa ao cácuo do fator de correção de Bartett para a estatística LR, derivando uma estatística da razão de verossimihanças bootstrap (LRboot ) que é obtida como segue. Iniciamente geramos B amostras bootstrap (y1,..., yb ) a partir do modeo assumido considerando H 0 verdadeira e substituindo os parâmetros por suas respectivas estimativas restritas cacuadas usando a amostra origina (y 1,..., y n ). Depois cacuamos o vaor da estatística da razão de verossimihanças para cada pseudo-amostra bootstrap. Denotamos por LR b boot, sendo b = 1,..., B, a b ésima amostra bootstrap. A estatística da razão de verossimihanças Bartett bootstrap é cacuada por LR boot = LR LR boot sendo k o número de restrições impostas por H 0 e LR boot = 1 B B b=1 LRb boot. Sob H 0, a estatística LR boot segue uma distribuição χ2 k, aproximadamente. É vaido saientar que a estatística da razão de verossimihanças bootstrap (LR boot ) não segue distribuição χ 2, sendo o teste baseado nesta estatística reaizado como descrito a seguir: Para o níve de significância fixado (α), cacue o percenti 1 α da distribuição empírica de LR boot, que é estimado peo vaor ˆq (1 α) ta que k, #{LR boot ˆq (1 α) } B = 1 α, com # denotando a cardinaidade do conjunto. Rejeite a hipótese nua se LR > ˆq 1 α. De forma aternativa, a regra de decisão pode ser escrita com base no p vaor 16

bootstrap dado por p = #{LRb boot LR}. B Assim, rejeitamos H 0 para p menor que o níve de significância considerado. Trabahos recentes na iteratura reaizam inferência baseada nos testes da razão de verossimihanças bootstrap e Bartett bootstrap (Bayer e Cribari-Neto, 2013; Cribari-Neto e Queiroz, 2014). Uma vantagem de utiizar a correção de Bartett bootstrap ao invés da técnica bootstrap usua é devido à sua eficiência computaciona. Para obter o vaor crítico do teste utiizando a correção de Bartett bootstrap é necessário um número de amostras bootstrap menor do que as necessárias quando é utiizada a técnica bootstrap usua, o que impica que a correção de Bartett bootstrap é computacionamente mais eficiente do que a técnica bootstrap usua, ver Rocke (1989). 2.4 Resutados numéricos Reaizamos estudos de simuação de Monte Caro a fim de comparar os desempenhos dos testes da razão de verossimihanças usua e as demais versões apresentadas neste capítuo. A saber, consideramos os testes baseados nas seguintes estatísticas: razão de verossimihanças (LR), sua versão corrigida via Bartett (LR ), razão de verossimihanças perfiadas modificadas (LR m ), sua versão corrigida via Bartett (LR m), razão de verossimihanças bootstrap (LR boot ) e razão de verossimihanças Bartett bootstrap (LRboot ). Avaiamos os desempenhos dos testes segundo a proximidade das probabiidades de rejeição da hipótese nua quando esta é verdadeira (probabiidade do erro tipo I) aos respectivos níveis nominais dos testes para cenários com um número fixo de parâmetros de interesse e de perturbação, variando o tamanho amostra e estudamos separadamente o efeito do número de parâmetros de perturbação e de interesse. Ainda, apresentamos gráficos de discrepância de quantis para aguns dos cenários simuados. Baseamos o estudo da simuação no modeo de regressão p 1 y = β 0 + exp{β 1 x 1 } + β s x s + ɛ, = 1,..., n, s=2 sendo ɛ variáveis aeatórias independentes em que ɛ S(0, σ 2 exp{ω δ}, g). As hipóteses testadas foram H 0 : δ = 0, sendo δ um vetor k dimensiona, assim indicando que o 17

modeo é homoscedástico contra a hipótese aternativa H 1 : δ i 0 para peo menos um i, i = 1,..., k. Para o estudo de simuação foram consideradas as distribuições simétricas t Student com 5 graus de iberdade (ν) e exponencia potência com parâmetro de forma κ = 0, 3. Lucas (1997) e Viegas et a. (2013) abordam aspectos de robustez do modeo t Student para quando fixamos os graus de iberdade e apontam que ta modeo acomoda mehor observações aberrantes quando os graus de iberdade são fixados, por esta razão nestre trabaho consideramos ν fixo. A escoha dos graus de iberdade e do parâmetro de forma das respectivas distribuições tiveram base nos coeficientes de curtose apresentados peas distribuições para os vaores dos graus de iberdade e parâmetro de forma adotados. Como nosso interesse é trabahar com distribuições simétricas com caudas mais pesadas que as da norma (coeficiente de curtose igua a 3), escohemos ν = 5 para a t Student e κ = 0, 3 para a exponencia potência pois para estes respectivos vaores dos graus de iberdade e parâmetros de forma tais distribuições apresentam curtose iguais a 9 e 3, 67, respectivamente, isto é, maiores que a curtose da distribuição norma. Para os parâmetros de regressão assumimos β 0 =... = β p 1 = 1, σ 2 = 1, δ 1 = 0, 1; δ 2 = 0, 3; δ 3 = 0, 5 e δ 4 = δ 5 = 1, 0. As covariáveis x 1,..., x p 1 e w 1,..., w k foram mantidas fixas e geradas como amostras aeatórias da distribuição U(0, 1). O número de répicas de Monte Caro e bootstrap foi fixado em 10.000 e 500, respectivamente, e os níveis nominais considerados foram α = 1%, 5% e 10%. As simuações foram reaizadas usando a inguagem de programação matricia Ox (Doornik, 2006) e os gráficos de discrepância de quantis foram feitos usando o software estatístico R. Considerando cada tamanho amostra e níve nomina estipuado, cacuamos as taxas de rejeição para cada teste, isto é, estimamos via simuação de Monte Caro P(LR χ 2 (α;k) ), P(LR χ 2 (α;k) ), P(LR m χ 2 (α;k) ), P(LR m χ 2 (α;k) ), P(LR boot χ 2 (α;k)), com χ 2 (α;k) sendo o percenti (1 α) da distribuição χ2 k. Para o teste bootstrap, a taxa de rejeição foi obtida a partir do cácuo da probabiidade P(LR ˆq (1 α) ), em que ˆq (1 α) é o percenti (1 α) estimado da distribuição empírica de LR boot. Nas Tabeas apresentadas todas as entradas são porcentagens. As Tabeas 2.2 e 2.3 apresentam as taxas de rejeição nuas dos diferentes testes para os modeos t 5, exponencia potência, respectivamente, para p = 3, 5 e k = 3 quando o tamanho da amostra aumenta. Como podemos observar nestas Tabeas, o teste da razão de verossimihanças é consideravemente ibera, como exempo, na Tabea 2.2 para p = 3, α = 5% e considerando todos os tamanhos amostrais (n = 30, 40, 50, 100), as taxas 18

de rejeição do teste LR são iguais a 13, 6%, 11, 9%, 10, 7% e 9, 5%, respectivamente. A versão corrigida para o teste da razão verossimihanças atenua a distorção do teste usua, embora ainda apresente taxas de rejeição maiores que os níveis nominais considerados, a exempo, considerando o mesmo cenário anterio, as taxas de rejeição do teste LR para os quatro tamanhos amostrais são 7, 0%, 6, 6%, 5, 9% e 5, 4%, respectivamente. De forma gera, para ambos os testes, conforme o tamanho da amostra aumenta, as distorções dos testes diminuem. Os resutados de simuação para o modeo t 5 apresentados na Tabea 2.2 indicam que os testes corrigidos LRm e LRboot apresentam os mehores desempenhos, sendo o teste LRm o de mehor desempenho, seguido do teste LRboot. Por exempo, para p = 3 e α = 5%, as taxas de rejeição nuas do teste LRm para os quatro tamanhos amostrais são 5%, 4, 9%, 5%, 5, 3% e as taxas correspondentes para o teste LRboot são 5, 3%, 5, 4%, 5%, 4, 4%. De forma gera, o bom desempenho do teste LRm pode ser observado em todos os cenários. Na Tabea 2.3 são apresentados os resutados para o modeo exponencia potência, em que podemos observar que os testes corrigidos LRm e LRboot apresentam mehores desempenhos outra vez, sendo o teste LRboot o de mehor performance, seguido do teste LRm. Por exempo, para p = 5 e α = 10%, as taxas de rejeição nuas do teste LRboot para os quatro tamanhos amostrais foram 10%, 9, 9%, 10%, 9, 9%, enquanto que para o teste LR m foram 7, 2%, 9, 1%, 9, 9%, 10, 6%. Na Tabea 2.4 avaiamos o efeito do número de parâmetros de perturbação no desempenho dos testes, fixando o tamanho amostra (n = 35), o número de parâmetros de interesse (k = 3) e variando o número de parâmetros de perturbação (p = 2, 3, 4, 5) para os modeos t 5 e exponencia potência. Para ambos os modeos, os testes usuais e suas versões corrigidas são bastante distorcidos e conforme o número de parâmetros de perturbação aumenta, a distorção dos testes LR e LR aumenta também. Em contrapartida, o aumento do número de parâmetros de perturbação foi indiferente para os demais testes, tendo os testes corrigidos LRm e LRboot desempenhos mehores, destacando-se, de forma gera, o teste LRboot. Por exempo, para o modeo t 5 considerando p = 4 e α = 5%, temos as taxas de rejeição nuas dos testes iguais a 15, 8% (LR), 8, 8% (LR ), 4, 5% (LR m ), 4, 7% (LR m), 5, 1% (LR boot ) e 5, 0% (LRboot ). Considerando o mesmo cenário, temos para o modeo exponencia potência as seguintes taxas de rejeição nuas: 14, 7% (LR), 8, 8% (LR ), 3, 4% (LR m ), 4.1% (LR m), 5, 3% (LR boot ) e 5, 1% (LR boot ). O efeito do aumento do número de parâmetros de interesse no desempenho dos testes é avaiado na Tabea G.1. Para isto, fixamos o tamanho amostra (n = 35) e o 19