Influência Local Gilberto A. Paula

Documentos relacionados
COMBINAÇÃO DE TÉCNICAS PARA CONSTRUÇÃO DE UM MODELO DE CREDIT SCORING, USANDO ANÁLISE DISCRIMINANTE

Modelo Linear Generalizado Exponencial Potência

Modelo de regressão log-weibull-exponenciada para dados com censura intervalar

Modelos de regressão beta inflacionados

Exemplos Modelos Binomiais de Dose-Resposta

Modelos de regressão para dados correlacionados. Cibele Russo

Tratamento Estatístico de Dados em Física Experimental

Exemplo Ausências Escolares

Comparação entre intervalos de confiança calculados com métodos bootstrap e intervalos assintóticos

Exemplos Modelos de Quase-Verossimilhança

Métodos de Diagnóstico para Modelos Lineares Mistos p.1/58

Modelos Lineares Generalizados

Inuência Local em Modelos de Regressão

Técnicas computacionais em probabilidade e estatística II

Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados

Exemplo Regressão Binomial Dados Emparelhados

Aula 2 Uma breve revisão sobre modelos lineares

Equações não lineares

ESTATÍSTICA COMPUTACIONAL

ESTATÍSTICA COMPUTACIONAL

Exemplo Multicolinearidade

Ralph S. Silva

Introdução ao modelo de Regressão Linear

Matriz de Variância e Covariância e o Teorema de Gauss-Markov

Tratamento de dados em Física

Exemplos Equações de Estimação Generalizadas

Álgebra Linear I - Aula Bases Ortonormais e Matrizes Ortogonais

Matriz de Variância e Covariância e o Teorema de Gauss-Markov

Inferência e diagnóstico em modelos assimétricos. Clécio da Silva Ferreira

1 de janeiro de UFRPE e UFPE. Curso de Teoria Assintótica. Gauss Cordeiro. Roteiro. Expansões de Laplace

Teoria Local das Curvas

Exemplo Falhas em Tecidos

Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios:

FAMÍLIA EXPONENCIAL DE DISTRIBUIÇÕES

ESTATÍSTICA COMPUTACIONAL

TESTES DE HIPÓTESES Notas de aula. Prof.: Idemauro Antonio Rodrigues de Lara

MAE Modelos Lineares Generalizados 2 o semestre 2017

Universidade Federal de Pernambuco Departamento de Estatística Inferência Estatística (PGE 951) Método de Máxima Verossimilhança (M.M.V.

Modelo de regressão estável aplicado a econometria

Técnicas Multivariadas em Saúde

Teorema da Triangularização de Schur e Diagonalização de Matrizes Normais

2. No instante t = 0, o estado físico de uma partícula livre em uma dimensão é descrito pela seguinte função de onda:

Álgebra Linear I - Aula 22

Multicolinariedade e Autocorrelação

Álgebra Linear I - Aula Forma diagonal de uma matriz diagonalizável

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

Estudo dirigido de Análise Multivariada

Markov Switching Models. Profa. Airlane Alencar. Depto de Estatística - IME-USP. lane. Ref: Kim e Nelson (1999) e Hamilton (1990)

Exemplo 1: Variáveis padronizadas Z t = ( Z 1 (1), Z 2 (1), Z 1 (2), Z 2 Z 1 (1) Z (1) = Z (2) = Z 2. Matriz de correlações:

Ralph S. Silva

Análise de Regressão Linear Simples e

Planos e hiperplanos reais e complexos. Contents. 4 Um problema sobre comportamento das retas complexas. 6

Modelos de Regressão Múltipla - Parte VIII

Ralph S. Silva

Exemplo Chamadas Telefônicas

Modelos Lineares Mistos

Uma estatística é uma característica da amostra. Ou seja, se

ANÁLISE DE SÉRIES TEMPORAIS

Computação, Universidade de São Paulo - USP, Caixa Postal 668, CEP: , São Carlos, SP, Brasil.

Hiperplano e n-esfera: Posições Relativas

Esse material foi extraído de Barbetta (2007 cap 13)

Resistência dos Materiais

Diagnóstico de influência local no modelo de calibração ultraestrutural com réplicas. Bruno Pinheiro de Andrade

Modelos de regressão para dados correlacionados. Cibele Russo

Exemplos Regressão Dados de Contagem

Regressão de Poisson e parentes próximos

Transformações e Ponderação para corrigir violações do modelo

Exemplo Ataques Epilépticos

Análise Complexa e Equações Diferenciais 2 o Semestre 2013/14 Cursos: LEAN, MeMec

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

MAT2458 ÁLGEBRA LINEAR PARA ENGENHARIA II 2 a Prova - 2 o semestre de T ( p(x) ) = p(x + 1) p(x), (a) 8, (b) 5, (c) 0, (d) 3, (e) 4.

Inferência para CS Tópico 10 - Princípios de Estimação Pontual

Distribuições Amostrais e Estimação Pontual de Parâmetros

Uma breve história da Geometria Diferencial (até meados do s

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação

FUNDAMENTOS DE SISTEMAS LINEARES PARTE 1

2 Propriedades geométricas de curvas parametrizadas no R 4

4. Experimentos em Blocos aleatorizados, quadrados latinos e experimentos relacionados

Exemplo Placas Dentárias

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

Produto Interno - Mauri C. Nascimento - Depto. de Matemática - FC UNESP Bauru

AGA Análise de Dados em Astronomia I 7. Modelagem dos Dados com Máxima Verossimilhança: Modelos Lineares

NORMAS COMPLEMENTARES AO EDITAL Nº 33/2017. Concurso para Professor Efetivo da área de Estatística

Inferência Bayesiana Exata para Processos de Cox Level-Set

Universidade Federal do Rio Grande do Sul Escola de Engenharia Departamento de Engenharia Elétrica ENG04037 Sistemas de Controle Digitais

Modelagem Computacional. Parte 7 2

CE085 - Estatística Inferencial. derivadas. Prof. Wagner Hugo Bonat. 5 de setembro de Curso de Bacharelado em Estatatística

Programa da Disciplina

Modelo de Regressão Log Weibull com fração de cura para dados grupados

MODELOS DE REGRESSÃO PARA DADOS CONTÍNUOS ASSIMÉTRICOS

Campos hamiltonianos e primeiro grupo de cohomologia de De Rham.

Amostra Aleatória. Tiago Viana Flor de Santana

3 a. Lista de Exercícios

1 Matrizes Ortogonais

GABRIEL BUJOKAS

Revisão III: Dinâmica Estrutural Linear: Superposição Modal

Modelos de regressão para dados correlacionados. Cibele Russo

Exemplo Espinhel de Fundo

Transcrição:

Influência Local p. 1/18 Influência Local Gilberto A. Paula Instituto de Matemática e Estatística Universidade de São Paulo e-mail:giapaula@ime.usp.br

Influência Local p. 2/18 Preliminares O método de influência local proposto por Cook (1986) consiste em avaliar, através de uma medida apropriada de influência, a robustez das estimativas fornecidas pelo modelo mediante pequenas perturbações aplicadas no modelo ou nos dados. Diferentes gráficos de influência podem ser desenvolvidos. A metodolgia não exige deleção de observações e permite avaliar a influência conjunta de todos os pontos. Mais de 300 artigos foram publicados no assunto nos últimos 20 anos.

Influência Local p. 3/18 Seja L(θ) o logaritmo da função de verossimilhança definida conforme Cox e Hinkley (1974, Cap. 9), em que θ IR r é um vetor que contém os parâmetros do modelo. Seja L(θ ω) o logaritmo da função de verossimilhança perturbada, em que ω = (ω 1,...,ω s ) T é o vetor de perturbações, ω Ω IR s. Existe ω 0 (vetor de não perturbação) tal que L(θ ω 0 ) = L(θ).

Influência Local p. 4/18 Alguns Tipos de Perturbação As formas mais comuns de perburbação são: perturbação de casos: L(θ ω) = n i=1 ω il i (θ), 0 ω i 1; perturbação na resposta (alavancagem): y iω = y i + σ yi ω i, ω i IR; perturbação em x i (contínua): x iω = x i + σ xi ω i, ω i IR; perturbação na matriz de variância-covariância: Σ iω = ω 1 i Σ i, ω i IR {0}.

Influência Local p. 5/18 Medida de Influência A medida de influência mais utilizada para avaliar o efeito das perturbações nas estimativas fornecidas pelo modelo é o afastamento da verossimilhança definido por LD(ω) = 2{L(ˆθ) L(ˆθ ω )}, em que LD(ω) 0 e ˆθ e ˆθ ω são as estimativas de máxima verossimilhança dos modelos não perturbado L(θ) e perturbado L(θ ω), respectivamente. Note que LD(ω 0 ) = 0.

Influência Local p. 6/18 Definição A idéia de influência local é estudar o comportamento da função LD(ω) numa vizinhança de ω 0. Para tanto, considera-se a superfície geométrica (s + 1)-dimensional formada pelos valores do vetor α(ω) = [ ω LD(ω) ], quando ω varia em Ω. Essa superfície é denominada gráfico de influência.

Influência Local p. 7/18 O estudo de influência local consiste em analisar como a superfície α(ω) desvia-se de seu plano tangente em ω 0 (T 0 ). Essa análise pode ser feita estudando-se as curvaturas das seções normais da superfície α(ω) em ω 0 - que são intersecções de α(ω) com planos contendo o vetor normal com seu plano tangente em ω 0. As curvaturas dessas seções são denominadas curvaturas normais.

Figura 1. Curvatura normal a para uma superfície α(ω) e direção unitária h. Influência Local p. 8/18 a Figura extraída de Verbeke e Molenberghs (2000, p. 155)

Influência Local p. 9/18 Curvatura Normal A intersecção entre a seção normal e o plano tangente T 0 é denominada linha projetada. Essa linha pode ser obtida através do gráfico de LD(ω 0 + ah) contra a IR. A curvatura normal da linha projetada, denotada por C h, é definida como sendo a curvatura de (a, LD{ω(a)}) em a = 0, em que ω(a) = ω 0 + ah. Denomina-se C h curvatura normal da superfície α(ω) em ω 0 e na direção unitária h. Segue da Geometria Diferencial (vide, por exemplo Kreyszig, 1991, p.35) que C h = LD{ω(a)} a=0 = 2 LD{ω(a)}/ a 2 a=0.

Influência Local p. 10/18 Curvatura Normal Após manipulações algébricas Cook mostra que a curvatura normal na direção unitária h fica dada por C h (θ) = 2 h T T L 1 ˆθˆθ h, em que Lˆθˆθ é a matriz observada de Fisher e é uma matriz r s com elementos avaliada em ˆθ e ω 0. ji = 2 L(θ ω) θ j ω i,

Influência Local p. 11/18 Interesse particular está na direção (ou nas direções) que produz(em) maior influência local. Mostra-se que a direção de maior curvatura normal, denotada por h max, é o autovetor normalizado correspondente ao maior autovalor C hmax da matriz A = T L 1 ˆθˆθ. Por exemplo, examinando-se o vetor h max pode-se identificar as observações mais influentes sob o esquema de perturbação adotado.

Influência Local p. 12/18 Gráficos de Diagnóstico Gráficos mais usuais de diagnóstico de influência local: gráfico de índices de h maxi ; gráficos de índices de C i = C h i n j=1 C h j em que h i é um vetor unitário na direção da i-ésima observação que é formado por zeros com o valor 1 na i-ésima posição. Outras formas de padronização de C h (θ) são propostas por Poon e Poon (1999).

Influência Local p. 13/18 Vamos supor que o interesse está num subvetor θ 1 de θ = (θ T 1,θ T 2 ) T. Nesse caso a curvatura normal na direção h fica dada por C h (θ 1 ) = 2 h T T ( L 1 ˆθˆθ B 1) h, sendo B 1 = ( 0 0 0 L 1 ˆθ 2ˆθ2 com Lˆθ2ˆθ2 denotando a informação de Fisher observada para θ 2. O gráfico do maior autovetor de T ( L 1 ˆθˆθ B 1) contra a ordem das observações pode revelar os pontos com maior influência local em ˆθ 1. ),

Influência Local p. 14/18 Modelos Lineares Generalizados Vamos supor um modelo linear generalizado com ligação canônica, φ conhecido e ponderação de casos, em que L(β ω) = n i=1 ω i L i (β), em que 0 ω i 1. Então obtemos o seguinte: Lˆβ ˆβ = φ(x T ˆVX) e = φx T diag{ˆr P1,..., ˆr Pn }.

Influência Local p. 15/18 A curvatura normal na direção unitária h fica então dada por C h (θ) = 2 h T Ah, em que A = diag{ˆr P1,..., ˆr Pn }Ĥdiag{ˆr P 1,..., ˆr Pn }, com H = V 1/2 X(X T VX) 1 X T V 1/2 e r Pi = φ(y i µ i )/ V i. Uma possibilidade é encontrar o autovetor correspondente ao maior autovalor da matrix A, denotado por h max e contruir o gráfico de h max contra as observações.

Influência Local p. 16/18 Outra possibilidade é construir o gráfico da curvatura normal na direção unitária da i-ésima observação, ou seja, h i = (0,...,0, 1, 0,..., 0), em que h i é um vetor de zeros com um na iésima posição. Assim teremos C i = 2 h T i Ah i = 2ˆr 2 P i ĥ ii.

Influência Local p. 17/18 Referências Cook, R. D. (1986). Assessment of local influence (with discussion). Journal of the Royal Statistical Society B 48, 133-169. Cox, D.R. e Hinkley, D.V. (1974). Theoretical Statistics. Chapman and Hall: London. Kreyszig, E. (1991). Differential Geometry. Dover: New York.

Influência Local p. 18/18 Poon, W. e Poon, Y.S. (1999). Conformal normal curvature and assessment of local influence. Journal of the Royal Statistical Society B 61, 51-61. Verbeke, G. e Molenberghs, G. (2000). Linear Mixed Models for Longitudinal Data. Springer: New York.