INTERVALOS DE CONFIANÇA BOOTSTRAP PARA MODELOS DE REGRESSÃO COM ERROS DE MEDIDA



Documentos relacionados
PROCEDIMENTOS DE CÁLCULO DE INCERTEZA DE MEDIÇÃO EM MEDIÇÕES DIRETAS E INDIRETAS

Econometria: 4 - Regressão Múltipla em Notação Matricial

UERJ CTC IME Departamento de Informática e Ciência da Computação 2 Cálculo Numérico Professora Mariluci Ferreira Portes

IND 1115 Inferência Estatística Aula 9

CAPÍTULO 9 - Regressão linear e correlação

MAE116 Noções de Estatística

Capítulo 1: Erros em cálculo numérico

Estudo das relações entre peso e altura de estudantes de estatística através da análise de regressão simples.

FINANCIAMENTOS UTILIZANDO O EXCEL

Estudo do intervalo de confiança da regressão inversa utilizando o software R

Análise de Regressão

INTRODUÇÃO ÀS PROBABILIDADES E ESTATÍSTICA

Distribuições Amostrais. Estatística. 8 - Distribuições Amostrais UNESP FEG DPD

Econometria: 3 - Regressão Múltipla

Hipóteses do Modelo de Regressão Linear Clássico

4- Método de Diferenças Finitas Aplicado às Equações Diferenciais Parciais.

Teoria da Amostragem

Estatística Notas de Aulas ESTATÍSTICA. Notas de Aulas. Professor Inácio Andruski Guimarães, DSc. Professor Inácio Andruski Guimarães, DSc.

Conceitos básicos de metrologia. Prof. Dr. Evandro Leonardo Silva Teixeira Faculdade UnB Gama

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Regressao Simples. Parte II: Anova, Estimação Intervalar e Predição

MAE0229 Introdução à Probabilidade e Estatística II

Matemática. Resolução das atividades complementares. M18 Noções de Estatística

Distribuições de Probabilidades

2. INTRODUÇÃO AOS MÉTODOS FACTORIAIS

Covariância e Correlação Linear


Cap. 5. Testes de Hipóteses

Perguntas Freqüentes - Bandeiras

Macroeconometria Aula 3 Revisão de estatística e teste de hipótese

ANÁLISE DE ERROS. Todas as medidas das grandezas físicas deverão estar sempre acompanhadas da sua dimensão (unidades)! ERROS

A REGRESSÃO LINEAR EM EVENTOS HIDROLÓGICOS EXTREMOS: enchentes

REGRESSÃO LINEAR 05/10/2016 REPRESENTAÇAO MATRICIAL. Y i = X 1i + 2 X 2i k X ni + i Y = X + INTRODUÇÃO SIMPLES MÚLTIPLA

Estimação pontual, estimação intervalar e tamanho de amostras

Requisitos metrológicos de instrumentos de pesagem de funcionamento não automático

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Estimação Pontual

Introdução à Análise de Dados nas medidas de grandezas físicas

Técnicas Não Paramétricas

Algoritmos de Interseções de Curvas de Bézier com Uma Aplicação à Localização de Raízes de Equações

CAPÍTULO 2 - Estatística Descritiva

Notas de aula da disciplina Probabilidade e Estatística

Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

Professor Mauricio Lutz REGRESSÃO LINEAR SIMPLES. Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das formulas: ö ; ø.

Faculdade de Economia, Administração e Contabilidade de Ribeirão Preto

Nas Instituições de Ensino Superior(IES), há uma relação direta entre a qualidade do ensino e a taxa de inadimplência. A taxa de inadimplência das

MÉTODO COMPUTACIONAL AUTOMÁTICO TICO PARA PRÉ-PROCESSAMENTO PROCESSAMENTO DE IMAGENS RADIOGRÁFICAS. M. Z. Nascimento, A. F. Frère e L. A.

e represente as no plano Argand-Gauss.

Análise do Retorno da Educação na Região Norte em 2007: Um Estudo à Luz da Regressão Quantílica.

Tabela 1 Números de acidentes /mês no Cruzamento X em CG/07. N de acidentes / mês fi f

Em muitas situações duas ou mais variáveis estão relacionadas e surge então a necessidade de determinar a natureza deste relacionamento.

Probabilidades e Estatística LEGM, LEIC-A, LEIC-T, MA, MEMec

MA12 - Unidade 4 Somatórios e Binômio de Newton Semana de 11/04 a 17/04

Capítulo 5: Ajuste de curvas pelo método dos mínimos quadrados

Probabilidades e Estatística LEAN, LEGI, LEGM, LMAC, MEAer, MEAmbi, MEC

Monitoramento ou Inventário Florestal Contínuo

O mercado de renda fixa e a estrutura da taxa de juro

Regressão Simples. Parte III: Coeficiente de determinação, regressão na origem e método de máxima verossimilhança

Matemática Financeira

AMOSTRAGEM EM DOIS ESTÁGIOS COM UNIDADES PRIMÁRIAS DE TAMANHOS DIFERENTES SUBSAMPLING TO TWO PROBATION WITH PRIMARY UNITS OF UNEQUAL SIZES

Atividades Práticas Supervisionadas (APS)

Revisão de Estatística X = X n

DISTRIBUIÇÃO HIPERGEOMÉTRICA

Em atendimento à solicitação de V.Sa., apresentamos, na seqüência, os resultados do estudo referenciado.

Ana Clara P. Campos 1 Denise Nunes Viola 1 Moacyr Cunha Filho 2 Guilherme Vilar 2 Vanessa Van Der Linden 3

Modelos de regressão linear: abordagem clássica

5.1 Seleção dos melhores regressores univariados (modelo de Índice de Difusão univariado)

Parte 3 - Regressão linear simples

O delineamento amostral determina os processos de seleção e de inferência do valor da amostra para o valor populacional.

Capítulo 6 - Centro de Gravidade de Superfícies Planas

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Inferência Estatística e Aplicações I. Edson Zangiacomi Martinez Departamento de Medicina Social FMRP/USP

ESTATÍSTICA Exame Final 1ª Época 3 de Junho de 2002 às 14 horas Duração : 3 horas

3 Precificação de resseguro

CONHECIMENTOS ESPECÍFICOS

PARTE Apresente as equações que descrevem o comportamento do preço de venda dos imóveis.

Noções Básicas de Medidas e Algarismos Significativos

Cálculo de média a posteriori através de métodos de integração numérica e simulação monte carlo: estudo comparativo

ESTATÍSTICA Aula 7. Prof. Dr. Marco Antonio Leonel Caetano

1 SISTEMA FRANCÊS DE AMORTIZAÇÃO

Probabilidades e Estatística LEE, LEIC-A, LEIC-T, LEMat, LERC, MEBiol, MEBiom, MEEC, MEFT, MEMec, MEQ

s: damasceno.info www. damasceno.info damasceno.

DISSERTAÇÃO DE MESTRADO

Unidade II ESTATÍSTICA

7 Análise de covariância (ANCOVA)

Relatório 2ª Atividade Formativa UC ECS

Modelo de Regressão Simples

ANÁLISE DE REGRESSÃO E CORRELAÇÃO

7. Resolução Numérica de Equações Diferenciais Ordinárias

SUMÁRIO GOVERNO DO ESTADO DO CEARÁ. Cid Ferreira Gomes Governador. 1. Introdução Domingos Gomes de Aguiar Filho Vice Governador

Estatística. 2 - Estatística Descritiva

Estatística - exestatmeddisper.doc 25/02/09

APOSTILA DA DISCIPLINA INFERÊNCIA ESTATÍSTICA I

a) 1,8 e 4,6. b) 2,0 e 2,2. c) 1,8 e 5,2. d) 2,0 e 4,6. e) 2,0 e 1,9.

ANÁLISE DE CORRELAÇÃO: ABORDAGEM TEÓRICA E DE CONSTRUÇÃO DOS COEFICIENTES COM APLICAÇÕES

13 ESTIMAÇÃO DE PARÂMETROS E DISTRIBUIÇÃO AMOSTRAL

Metodologia de cálculo das incertezas associadas às medições na calibração de monitores de radiação para medidas de H*(10).

Aula 9. Aula de hoje. Aula passada. Self-normalized Importance Sampling Gerando amostras complicadas Variância amostral Simulação

A Medição e o Erro de Medição

AVALIAÇÃO DOS PROGRAMAS DE PÓS-GRADUAÇÃO EM ENGENHARIA DA UFRJ EMPREGANDO UMA VARIANTE DESENVOLVIDA DO MÉTODO UTA

Transcrição:

INTERVALOS DE CONFIANÇA BOOTSTRAP PARA MODELOS DE REGRESSÃO COM ERROS DE MEDIDA Wellgto José da CUNHA Erco Atôo COLOSIMO RESUMO: As meddas realzadas o da-a-da estão sjetas a erros Esses erros podem acotecer devdo a letra feta os strmetos, o regstro dos valores, a precsão dos strmetos, etc Nas stações em qe se deseja verfcar a assocação etre ma varável resposta e varáves eplcatvas através de m modelo de regressão, os estmadores podem ser vcados se estas últmas estverem sjetas a erros de medção Algs estmadores foram propostos para redzr o víco essas stações Etre os estmadores propostos, os qe os teressa são os chamados estmadores plg- Etretato, apesar desses estmadores mmzarem o víco e terem ma epressão smples, ão este ma epressão a lteratra para a varâca asstótca destes Isso pelo fato de serem ecessáras das etapas o processo de estmação dos parâmetros, gerado grade compledade a estrtra do modelo Desse modo se faz ecessára a tlzação de métodos comptacoas de reamostragem capazes de determar tervalos de cofaça Nos modelos em qe ão se pode estmar tervalos de cofaça pelos métodos sas, tlzaremos o método de reamostragem bootstrap para costrí-los Etre os tervalos bootstrap, serão tlzados este artgo os tervalos percetl, BCa e bootstrap-t Nas smlações de Mote Carlo cosderadas este trabalho, o bootstrap se mostro efcete a estmação de tervalos de cofaça, destacado-se o tervalo percetl pela sa maor smplcdade com galdade de performace em relação aos demas PALAVRAS-CHAVE: Erro de medda; bootstrap; tervalos de cofaça; modelos de regressão Itrodção Geralmete as meddas realzadas com tlzação o ão de aparelhos estão sjetas a erros de medção Ao agravar-se esses erros de medda, a aálse estatístca prodzrá resltados dferetes dos desejados o com m gra de qaldade feror ao preteddo Recohecedo a estêca do erro a medção e cosderado todas as certezas sgfcatvas atrbíves ao eqpameto de medção, aos procedmetos pessoas e ao Departameto de Cêcas da Comptação, Uversdade Federal de Mas Geras - UFMG, CEP: 370-00, Belo Horzote, Mas Geras, Brasl Departameto de Estatístca, Uversdade Federal de Mas Geras - UFMG, CEP: 370-00, Belo Horzote, Mas Geras, Brasl E-mal: ercoc@estfmgbr Rev Mat Estat, São Palo, v,, p5-4, 003 5

ambete, a orma ISO 00- assocada à Sére ISO 9000 apreseta reqstos de garata da qaldade das medções Para qe possamos tomar ações qe mmzem os efetos desses possíves erros, é ecessáro etedê-los melhor Esses erros podem ocorrer devdo a váras crcstâcas, cjas possíves casas são as segtes: métodos e téccas de coleta de dados, como etrevsta, observação o qestoáro Icldo erros de resposta por desoestdade, por cofsão, por gorâca, por falta de cdado, todos gerados por falta de treameto adeqado o pelo método sado para obter a resposta Iclímos também, essa possível casa, erros de coleta dos dados por falha os eqpametos, qe podem ser devdos a desgastes dos compoetes, falta de calbração o a codções ambetas, qe geram varabldade em strmetos de letra É mto comm também a cofsão a letra da resposta, em algs casos até letra errada da varável o aparelho com a dade de medda adeqada para a stação; processameto adeqado, como tlzação de técca de aálse e processameto de dados de poca cofaça o ão aproprados para o problema estdado; armazeameto com poca cofabldade, falhas a etrada dos dados para o processameto, o perda de formações; otros problemas qe podem ocorrer após a coleta de dados A aálse estatístca tlzado modelos de regressão evolve a estmação de parâmetros de teresse Os métodos clásscos de estmação spõem m processo de medção sem erro o com erro desprezível, sposção esta mtas vezes dfícl de ser obtda e de elevado csto Esqematcamete, podemos descrever o processo de estmação de parâmetros com o sem erro de medda pelas Fgras (a) e (b) Na asêca de erro de medda samos ma fção de estmação sal, qe pode ser de mímos qadrados o máma verossmlhaça, e obtemos ma estmatva do parâmetro de teresse (Fgra (a)) Na preseça de erro de medção, o valor verdadero ão é observado, pos o valor observado está cotamado com m erro devdo ao processo de medção qe é salmete adtvo (Fgra (b)), e qe prodz m víco a estmatva (Fller, 987) O estmador de regressão descohecdo esse processo de estmação, qe descosdera a estêca de erro, será chamado de sal ( ˆβ N ) e tede a zero com o ameto do erro O prejízo casado por ma medção certa pode levar a dagóstcos corretos Assm, se faz ecessára a tlzação de métodos estatístcos, para qe os efetos desse erro de medda, o processo qe sege a essa etapa, sejam mmzados São dos os modelos estatístcos para corporar o erro de medda: o modelo fcoal, qe cosdera como sedo fo e o estrtral, qe cosdera como sedo ma varável aleatóra Neste artgo cosderemos o modelo estrtral com sedo ma varável aleatóra ormal, N(0, σ ) Bscado mmzar esse efeto do erro de medda, algs estmadores foram propostos a lteratra, detre os qas podemos ctar os estmadores desevolvdos por Carroll e Stefask (990), James e Ste (James e Ste, 96; Whttemore, 989), Stefask (985), Fller (Fller,987; Lyles e Kpper, 999) e Whttemore e Keller (988) Classfcamos os estmadores para modelos de regressão com erro os regressores em dos tpos: estmadores plg- e de ateação do víco Os estmadores plg- estmam o valor verdadero através dos valores observados e, de posse desses valores ajstados, 6 Rev Mat Estat, São Palo, v,, p5-4, 003

tlzam a fção de estmação sal, o modelo estdado, para estmar o parâmetro de teresse (Fgra (a)) Já os estmadores qe fazem ma ateação do víco do estmador clássco, corrgem esse víco a partr do estmador sal A correção é feta através de ma fção de ajste desse parâmetro, como mostrado a Fgra (b) (a) (b) FIGURA - Processos de estmação em modelos: (a) sem erro de medção; (b) com erro de medção (a) Tpos de correção (b) FIGURA - Esqema da correção, em m modelo de regressão, tlzado m estmador: (a) plg- e (b) ateação do víco Os estmadores plg- são mas smples e depedem do modelo de regressão tlzado, motvo pelo qal se toram etremamete teressates Etretato, os deparamos Rev Mat Estat, São Palo, v,, p5-4, 003 7

com a dfcldade de obter as sas varâcas asstótcas, ecessáras à costrção de tervalos de cofaça Essa dfcldade se deve ao fato do processo de estmação ser realzado em das etapas, ma para a fção de estmação de e otra para estmação dos parâmetros do modelo, o algo semelhate, qado estvermos trabalhado com ateação do víco Devdo a essa dfcldade, tlzaremos este trabalho a técca de reamostragem bootstrap (Efro e Tbshra, 993) para a costrção de tervalos de cofaça Estmadores para o modelo de regressão com erro os regressores Etre os estmadores propostos a lteratra, avalaremos os estmadores plg- de James-Ste (Whttemore, 989) e Carrol e Stefask (990)), e os estmadores de ateação de Fller (987) e Stefask (985) Estmadores plg- O estmador de James-Ste O estmador de Ste fo proposto por Whttemore (989) para sbsttr o valor observado z, e em segda estmar os parâmetros do modelo de regressão da forma sal como se este estmador fosse o valor ão observado A estmatva qe sbsttrá a covarável observada z é e ( z) = Bˆ z + ( Bˆ) z,,,, = em qe Bˆ ( 3) = σ, S Sˆ ˆ = ( z k z) e σ é a varâca do erro de medda,, k = (Fgra ) A varâca σ pode ser estmada como apresetado em Gmeez; Bolfare e Colosmo (999), qado temos repetdas meddas da varável medda com erro Dessa forma, ˆ ˆ σ z ( z ) k =, sedo qe ˆ = ˆ σ ˆ z σ z e σ é estmado por σ z ˆ σ = k j= ( z j z ) k( k ) () () 8 Rev Mat Estat, São Palo, v,, p5-4, 003

com =,, e j =,, k, sabedo-se qe é o tamaho da amostra, k é o úmero de k repetções de meddas da varável e z = z j k j= O estmador de Carroll-Stefask Neste caso estmamos a varável ão observada por sa esperaça codcoal, dado o valor observado z; sto é, com E ˆ( z ) = Bˆ' z + ( Bˆ' ) z ( ) Bˆ' = σ e ˆ Sˆ ( z z) = S Se σ ão for cohecdo, estmamos (3) σ como descrto pela Epressão () O estmador proposto por Carroll e Stefask (990) dfere do apresetado por Whttemore (989) apeas pela costate -3 qe é sbsttída por - o merador de ˆB ' Estmadores de ateação do víco O estmador de Fller No coteto de regressão lear smples, o estmador proposto por Fller (987) é baseado a determação do víco prodzdo pelo erro a medção dos dados O víco descrto por Fller (987) determa o fator k σ +σ =, σ qe é o ateador de Fller Assm, para obter m estmador de meor víco basta qe se mltplqe o estmador sal pelo ateador de Fller, o seja ˆ β ˆ F = β N k Caso k seja cohecdo, o parâmetro estmado por Fller é mto smples de ser obtdo Um dos problemas para se obter k é devdo ao fato de qe σ ão é salmete cohecdo Mas podemos resolver este problema sado σ z qe é estmado pelos dados da medção (4) Rev Mat Estat, São Palo, v,, p5-4, 003 9

Observemos qe k σ + σ = σ z z σ σ + σ = σ σ z z σ = σ σ (5) O estmador de Stefask Stefask (985) propôs m estmador qe é tlzado tato em modelos leares qato em modelos ão-leares, os casos estrtral e fcoal de erro de medda Cosdere m modelo em qe a sa resposta tem fção de desdade dada por f β ( y, z) e y é a varável resposta O parâmetro β pode ser estmado pelo método de mímos qadrados os modelos leares, o os casos ão leares pela solção da eqação em qe ψ é o compoete da fção escore ψ ( y, z, β ) = 0, (6) ( l( f ( y, z ))) ψ ( y, z, β ) = β β O estmador proposto por Stefask (985), chamado de atrbído ao erro de medda é defdo por ˆ β S = ˆ ψ ( y, z, ˆ) β β N + σ ˆ β βˆ S ) ψ ( y, z, ˆ β z, qe atea o víco em qe σ é a varâca do erro de medda, qe se ão for cohecdo é estmado como descrto pela Epressão (), e ψ é dado pela eqação (6) Uma jstfcatva para a epressão (7) pode ser ecotrada em Stefask (985) 3 Bootstrap Descreveremos sctamete o método de reamostragem chamado de bootstrap, trodzdo por Efro (979), e sado para estmar a dstrbção das estatístcas de teresse, qe mtas vezes são etremamete dfíces de serem obtdas pelos métodos tradcoas (eatos e asstótcos) O bootstrap pode ser paramétrco o ão-paramétrco O bootstrap ão-paramétrco cosdera qe a fção de dstrbção F, dos dados, é descohecda e estmada através da dstrbção empírca Fˆ Já o bootstrap paramétrco cosdera qe a fção de dstrbção F pode ser estmada por Fˆ par a partr de m modelo paramétrco cohecdo para os dados, (7) 30 Rev Mat Estat, São Palo, v,, p5-4, 003

Spohamos qe seja observada ma amostra aleatóra, w w de ma w,, dstrbção F estmada pela dstrbção Fˆ, qe pode ser paramétrca o ão Assm, w = ( w, w,, w ) represeta o vetor dos dados, para os qas se calcla o estmador ˆ β = s( Fˆ ) de m parâmetro de teresse β = s(f) Cosderaremos qe Fˆ é a dstrbção empírca de w Etão ma amostra bootstrap w = ( w, w,, w ) é costrída escolhedo-se aleatoramete, com reposção, elemetos da amostra w = ( w, w,, w ) Por eemplo, com = 6, poderíamos pesar em w = ( w5, w3, w6, w, w4, w ) A replcação bootstrap do parâmetro de teresse para essa amostra bootstrap é deotada por ˆβ Se forem geradas B amostras bootstrap B w, w,, w, a replcação bootstrap do parâmetro de teresse para a b-ésma amostra é dada por ˆ b β ( b ) = s( w o seja, é o valor de βˆ para a amostra bootstrap ), b w (8) 3 Estmatva do erro-padrão A epressão para o estmador bootstrap do erro-padrão (Efro e Tbshra, 993) é dada por em qe ˆ σ boot = B ˆ β ( b) ˆ β B b= ( ) B ˆ ˆ β ( b) β ( ) =, ˆ β ( b) é descrta em (8) e B é o úmero de replcações B b= bootstrap, o seja, o estmador bootstrap do erro-padrão amostral é o desvo-padrão de sas replcações 3 Itervalos de Cofaça Bootstrap Através do so do bootstrap podemos obter tervalos apromados de 00(-α)% de cofaça para o parâmetro de teresse β Descreveremos, as seções 3, 3 e 33, dferetes métodos para a costrção de tervalos de cofaça bootstrap chamados de bootstrap-t, percets bootstrap e BCa, (9) Rev Mat Estat, São Palo, v,, p5-4, 003 3

3 Itervalo bootstrap-t O tervalo de 00(-α)% de cofaça bootstrap-t é dado por, ( ˆ β ˆ ( α ) α ˆ, σ ˆ β ˆ ( ) T T ˆ σ ) em qe foram geradas B amostras bootstrap w, w,, w B Para cada ma delas calclamos ˆ ˆ β ( b) β T ( b) =, com b =,,, B, ˆ σ ( b) em qe ˆ β ( b) é o valor de βˆ para a amostra bootstrap w b dado em (8) e ˆ σ ( b) é o erro-padrão bootstrap do estmador ˆ β ( b) com base a amostra w b, coforme a Epressão (9) O α -ésmo percetl de T é estmado pelo valor ˆ ( α) T tal qe # α { T Tˆ ( )} α 3 Itervalo de cofaça baseado os percets bootstrap B Um cojto de dados bootstrap w é gerado de acordo com w De posse desse cojto de dados são calcladas replcações bootstrap ˆ β = s( w ) Cosderado qe Ĝ é a estmatva da fção descohecda da dstrbção acmlada de ˆβ O tervalo percetl de 00(-α)% de cofaça é defdo pelos percets α e -α de Ĝ : ˆ ˆ ˆ [, ] [ ( ), ˆ β%, f β%,sp = G α G ( α)] ) Já qe pela defção ˆ ˆ ( α G ( α ) = β é o (00-α)-ésmo percetl da dstrbção bootstrap de ˆβ, podemos escrever tervalos percets como [ ˆ β %,f ˆ β %,sp ] = = [ ˆ( ) ˆ ( α ), ] α β β As epressões (0) e () referem-se à stação deal do bootstrap a qal o úmero de replcações é fto Fˆ (0) () 3 Rev Mat Estat, São Palo, v,, p5-4, 003

Na prátca devemos sar m úmero fto B de replcações Para o processo, geramos B B cojtos de dados bootstrap w, w,, w e calclamos as replcações bootstrap ˆ (b) β ( b ) = s( w ), b =,,, B ( ) Seja ˆ α β B o 00α -ésmo percetl empírco dos valores ˆ β ( b), o seja, o valor ( B α )-ésmo a lsta ordeada das B replcações de ˆβ Assm, se B = 000 e α = 0, 05, ˆ ( α ) β B é o 00-ésmo valor ordeado das 000 replcações Se ( B α ) ão é m tero, tlza-se o maor tero meor o gal a ( B + ) α Como a dstrbção bootstrap de ˆβ é apromada, melhores resltados serão obtdos para amostras de tamaho grade, e qato maor for B, melhores serão os tervalos estmados Assm, o tervalo percetl apromado de 00 ( α )% de cofaça é [ ˆ β %,f, ˆ β %,sp ] [ ˆ ( ) ˆ ( α ), ] α β β = B B Estem das versões melhoradas do método percetl chamadas de BC a e ABC O método BC a é a abrevação-padrão de "bas-corrected ad acelerated" e o ABC é a abrevação padrão de "appromate bootstrap cofdece tervals" Neste artgo ão costrremos tervalos pelo método ABC Maores formações sobre esse método podem ser ecotradas em Efro e Tbshra (993, p88) 33 Itervalos percets BC a O tervalo BC a de cobertra desejada 00 ( α )% é dado por sedo, α Φ zˆ [ ˆ β, ˆ β ] = [ ˆ β %,f zˆ 0 + Z + aˆ %,sp α ( zˆ + Z ) 0 = 0 α, ˆ β ( α ) ( α ) α Φ zˆ em qe Φ é a fção de dstrbção da ormal padrão e ormal padrão Para calclarmos â e ẑ 0 tlzamos as epressões: ] ( α ) zˆ 0 + Z + aˆ zˆ + Z = 0 ( α ), ( ) e 0 () α Z é o α -ésmo percetl da Rev Mat Estat, São Palo, v,, p5-4, 003 33

{ ˆ β ( b) ˆ β} # < zˆ = Φ 0 e B aˆ = 6 ( ˆ ˆ β( ) β( ) ) ( ˆ ˆ β( ) β( ) ) 3 3 /, (3) em qe ˆ β ( ) = s( w ( ) ), com w () sedo a amostra orgal com o -ésmo valor, w, removdo e cosderado ˆ β = ˆ ( ) β( ) Maores detalhes sobre o cálclo de (3) podem ser ecotrados em Efro e Tbshra (993, p84-6) 34 Número de replcações bootstrap Efro e Tbshra (993, Capítlo 9), Kedall e Start (977, Capítlo 0) e Efro (987, Seções 6 e 9) dsctem os úmeros de replcações bootstrap ecessáras para ma boa estmatva do erro-padrão e do tervalo de cofaça Efro e Tbshra (993) afrmam qe para obtermos ma boa estmatva do erro-padrão através do bootstrap são ecessáras etre 5 e 00 replcações e qe para ma boa estmatva dos lmtes de cofaça seram ecessáras mas de 500 replcações Utlzaremos este trabalho 000 replcações para a costrção de tervalos de cofaça e 30 para o erro-padrão 4 Smlações de Mote Carlo Foram realzadas smlações para os modelos de regressão lear smples e epoecal com amostras de tamaho e varâca do erro de medda σ As smlações foram repetdas 500 vezes para dferetes valores de e σ Nas stações de regressão lear smples, em qe temos ma resposta cotía y, tlzamos o modelo clássco com ma varável regressora =,,, em qe s modelo e varâca y = β + β + e, 0 ' são valores da varável regressora, β 0 e β os parâmetros do e ' s são varáves aleatóras depedetes com dstrbção ormal, méda zero e σ e Nesses problemas samos o método dos mímos qadrados para estmar β e cosderamos β 0 =0 No modelo epoecal, a fção de desdade de Y dado é defda por (4) 34 Rev Mat Estat, São Palo, v,, p5-4, 003

f λ y ( y ) = λ e y > 0 em qe é m vetor de varáves eplcatvas e λ = E( Y ) Váras formas de fções são possíves para λ, etretato cosderamos qe, Assm, temos qe λ = e β f ( y, β ) = e qe tem como fção de verossmlhaça e log-verossmlhaça L ( β ) = Dervado (5), ecotramos a fção e β β e β e e e β β y y, l( β ) = β e y (5) β l' ( β ) = ( e y ), (6) e, portato, o estmador de máma verossmlhaça de β é dado pela solção da eqação l ' ( β ) = 0, formada a partr de (6) Como essa eqação ão é lear, βˆ é obtdo pelo método de Newto-Rapso Deve-se destacar qe essas smlações cosderamos qe o valor σ é cohecdo e portato ão será estmado Geramos dferetes amostras aleatóras de tamaho gal a 5, 50 e 00 Essas amostras foram tomadas como valores verdaderos Logo após, geramos as respostas y para esses valores em cada modelo: epoecal e lear smples Depos, geramos m erro qe fo adcoado à varável verdadera, determado os valores cotamados z O erro para a cotamação fo gerado por ma amostra aleatóra da dstrbção N(0, σ ) com σ assmdo os valores 0,; 0,5; 0,5 e A varável cotamada fo tlzada para gerar os estmadores dos parâmetros de teresse descrtos a Seção e respectvos tervalos de 95% de cofaça descrtos a Seção 3 Objetvamos, com sso, comparar e verfcar o comportameto dos tervalos de 95% de cofaça para os parâmetros de teresse Assm, calclamos o comprmeto médo dos tervalos costrídos em 500 repetções, a porcetagem de vezes em qe o valor verdadero pertece aos tervalos, a porcetagem de vezes em qe o valor verdadero estava acma do, Rev Mat Estat, São Palo, v,, p5-4, 003 35

lmte speror desses tervalos, e a porcetagem de vezes em qe o valor verdadero estava abao do lmte feror destes Para os tervalos costrídos pelo bootstrap foram realzadas 000 replcações com 30 replcações para a estmação do erro bootstrap qe são ecessáras apeas para calclar o tervalo de cofaça bootstrap-t 4 O modelo de Regressão Lear Foram costrídos os tervalos eato (sem erro de medda); o tervalo sal, qe descosdera a estêca de erro de medda; o tervalo proposto por Fller (987); e os tervalos bootstrap percetl, BC a e bootstrap-t Através de comparações poderemos avalar os tervalos Os tervalos eato e sal para β foram obtdos através da segte epressão (Seber, 977, p08) sedo qe, 36 S ˆ β S ˆ yy y ± t α, ( ) S β t α é o ( α) (7) -ésmo percetl com - gras de lberdade da dstrbção t, e cosderado S = ) ( ; Sy = ( y y)( ); e S yy = ( y y) O tervalo eato sa valores verdaderos para a varável e o sal valores cotamados com erro O tervalo de Fller fo determado pela epressão dada em Lyles e Kpper (999) e Fller (987), ˆ β α ( ) [ y ( ) F ± Z kˆ y ˆ β ( z N ( z z) z)] em qe k é dado pela epressão (5), z é o valor cotamado com erro e βˆ F é dado pela epressão (4) Os resltados dessa smlação são apresetados a Tabela Nessa tabela chamaremos de f ao úmero percetal de vezes em qe o valor verdadero para o parâmetro estmado fo meor do qe o etremo feror do tervalo de cofaça ecotrado De modo semelhate, chamaremos de sp ao úmero percetal de vezes em qe o valor verdadero fo maor do qe o etremo speror do tervalo de cofaça e certo ao úmero percetal de vezes em qe o valor verdadero pertece a esse tervalo Observamos, a partr da Tabela, qe à medda qe ametamos o erro de medda a cobertra omal dos tervalos é redzda Essa perda de efcêca é mmzada com o, (8) Rev Mat Estat, São Palo, v,, p5-4, 003

Tabela - Probabldade de cobertra e comprmetos médos dos tervalos de 95% de cofaça para o parâmetro β o modelo Yt = β t + et, t =,,3,, tlzado os estmadores Usal, Fller, James Ste (Ste), Stefask (Stef) e Carroll-Stefask (CSt) =5 =50 N=00 σ Itervalo f certo sp comp f certo sp comp f certo sp comp 0 05 05 0 Eato 0,08 0,95 0,00 0,859 0,06 0,944 0,030 0,576 0,036 0,98 0,036 0,40 Usal 0,04 0,96 0,060 0,859 0,00 0,886 0,04 0,573 0,00 0,84 0,56 0,399 Fller 0,044 0,934 0,0 0,909 0,03 0,93 0,036 0,69 0,03 0,936 0,03 0,435 Perc 0,056 0,94 0,030 0,90 0,034 0,90 0,046 0,64 0,034 0,94 0,04 0,43 Boot-t 0,036 0,930 0,034,05 0,030 0,934 0,036 0,677 0,08 0,944 0,08 0,463 BCa 0,05 0,90 0,038 0,905 0,038 0,94 0,048 0,65 0,03 0,94 0,044 0,43 Perc 0058 096 006 099 0040 09 0038 06 003 094 0044 0433 Boot-t 0038 0939 00 056 003 0930 0038 0678 006 0944 0030 046 BCa 0050 096 0034 098 0038 098 0044 06 006 096 0048 0434 Perc 0058 094 008 09 0036 094 0040 067 0034 098 0038 0433 Boot-t 0038 0938 004 06 003 093 0036 0680 003 094 006 0464 BCa 0054 090 006 094 0040 096 0044 068 003 096 004 0433 Ste Stef CSt Usal 0,000 0,85 0,48 0,848 0,00 0,70 0,88 0,565 0,000 0,44 0,558 0,39 Fller 0,066 0,906 0,08,054 0,038 0,96 0,036 0,70 0,06 0,93 0,04 0,489 Perc 0,060 0,906 0,034,030 0,038 0,94 0,048 0,688 0,06 0,90 0,054 0,48 Boot-t 0,040 0,90 0,040,06 0,03 0,9 0,046 0,76 0,0 0,936 0,04 0,56 BCa 0,058 0,90 0,040,03 0,040 0,908 0,05 0,69 0,04 0,9 0,054 0,483 Perc 0054 096 0030 066 008 098 0054 0693 006 096 0068 0477 Boot-t 0038 096 0046 84 00 0930 0048 0746 008 094 0058 0505 BCa 004 098 0040 056 00 090 0058 069 006 0908 0076 0477 Perc 0068 0904 008 059 0040 09 0038 0696 0030 09 0048 0485 Boot-t 004 094 0034 39 0034 090 0046 0770 004 0938 0038 059 BCa 0068 0898 0034 060 004 090 0038 0699 008 09 0050 0486 Ste Stef CSt Usal 0,000 0,630 0,370 0,89 0,000 0,38 0,68 0,544 0,000 0,07 0,98 0,377 Fller 0,064 0,89 0,044,7 0,054 0,904 0,04 0,839 0,04 0,908 0,050 0,57 Perc 0,06 0,886 0,05,88 0,048 0,90 0,050 0,80 0,040 0,890 0,070 0,559 Boot-t 0,04 0,90 0,048,5 0,040 0,9 0,048 0,894 0,034 0,906 0,060 0,596 BCa 0,058 0,88 0,060,87 0,048 0,89 0,060 0,8 0,040 0,89 0,068 0,560 Perc 0030 09 0048 00 008 0904 0078 076 0008 083 060 058 Boot-t 008 096 0066 3 00 0900 0088 08 0006 083 06 0543 BCa 006 094 0060 8 00 0900 0088 0759 0004 088 078 057 Perc 0078 0878 0044 63 006 0894 0044 083 0044 0896 0060 0566 Boot-t 0058 0900 004 607 004 098 0040 097 004 0898 0060 0603 BCa 0086 0864 0050 893 0056 0896 0048 0833 004 0896 006 566 Ste Stef CSt Usal 0,000 0,48 0,75 0,754 0,000 0,040 0,960 0,50 0,000 0,00 0,998 0,346 Fller 0,078 0,85 0,070,549 0,078 0,854 0,068,3 0,078 0,840 0,08 0,753 Perc 0,06 0,844 0,094,740 0,07 0,84 0,086,8 0,058 0,848 0,094 0,75 Boot-t 0,048 0,878 0,074 3,36 0,054 0,868 0,078,88 0,064 0,844 0,09 0,760 BCa 0,064 0,834 0,0,75 0,070 0,840 0,090,85 0,064 0,838 0,098 0,77 Perc 00 087 06 9 0006 077 0 0806 000 0548 0450 0539 Boot-t 000 0864 034 38 000 0774 04 0844 000 0540 0458 056 BCa 000 0834 056 69 0004 0760 036 0800 000 0506 049 0538 Perc 0088 0836 0076 643 008 0850 0068 63 0086 0830 0084 0746 Boot-t 0066 0874 0060 654 006 0880 0058 368 007 084 0086 079 BCa 0088 088 0084 338 0080 0846 0074 68 008 0834 0084 0748 Ste Stef CSt Rev Mat Estat, São Palo, v,, p5-4, 003 37

ameto do tamaho da amostra, eceto para os tervalos Usal e Stefask, cjo ameto da amostra parece redzr a efcêca Esse fato pode ser eplcado pela dmção da varâca desses estmadores, com o ameto da amostra, promovedo ma redção o comprmeto do tervalo de cofaça para esses estmadores Assm, esses tervalos fcaram mas sesíves a peqeas pertrbações Percebemos, também, qe o tervalo bootstrap-t é geralmete o de maor comprmeto e o Usal o de meor A cobertra de todos os tervalos de cofaça fca abao da omal com o ameto do erro de medda E sso cota ocorredo mesmo com o ameto do tamaho da amostra O tervalo de cofaça dervado do estmador de Stefask tem ma cobertra loge da omal qado o erro de medda cresce mto Como era esperado, a cobertra do tervalo de cofaça baseado o estmador Usal é mto rm, mesmo qado σ ão é mto grade Uma partclardade observada é a de qe o comprmeto do tervalo de cofaça bootstrap-t é salmete maor do qe o do boostrap percetl e do BCa 4 O modelo de Regressão Epoecal O estmador de Fller e o tervalo Fller foram desevolvdos para o modelo lear, etretato o avalamos também o modelo epoecal Os tervalos eato e sal foram obtdos através da formação de qe ˆ β ~ N( β,i 0 ) (Lawless, 98, p85), sto é, ( ) ˆ ˆ α ± β β Z e, (9) em qe Z (α) é o α -ésmo percetl da dstrbção ormal Os resltados da smlação para este caso são apresetados a Tabela Nessa tabela os valores f, sp e certo têm o mesmo sgfcado qe a Tabela, o seja, chamaremos de f ao úmero percetal de vezes em qe o valor verdadero para o parâmetro estmado fo meor do qe o etremo feror do tervalo de cofaça ecotrado De modo semelhate, chamaremos de sp ao úmero percetal de vezes em qe o valor verdadero fo maor do qe o etremo speror do tervalo de cofaça e Certo ao úmero percetal de vezes em qe o valor verdadero pertece a esse tervalo As coclsões são semelhates às do caso lear, eceto para os tervalos baseados o estmador Fller O tervalo de cofaça baseado o estmador de Fller é stável e prodz resltados acma dos valores omas com, coseqüetemete, m comprmeto mto grade Coclsões Nos modelos de regressão em qe a medção sofre algm tpo de erro, os métodos tradcoas de estmação, qe descosderam a estêca desse erro, prodzem estmadores vcados Qato maor for o erro de medção, mas prómo de zero será o valor estmado, o seja, o estmador tede a zero qado o erro de medção ameta Este víco prodzdo pela gedade de cosderar qe as medções estão lvres de erro os leva à costrção de 38 Rev Mat Estat, São Palo, v,, p5-4, 003

Tabela - Probabldade de cobertra e comprmetos médos dos tervalos de 95% de cofaça para o parâmetro β o modelo de regressão epoecal, com méda z e β, tlzado os estmadores Usal, Fller, James Ste (Ste), Stefask (Stef) e Carroll-Stefask (CSt) =5 =50 =00 σ Itervalo f certo sp comp f certo sp comp f certo sp comp Eato 00 0944 0034 0850 000 095 008 0579 0036 0940 004 0403 Usal 006 0904 0080 0805 000 0860 038 0543 000 0830 068 0375 Fller 0000 0990 000 866 0000 0998 000 073 0000 000 0000 558 Per 004 090 0048 937 00 0934 0044 0640 008 093 0040 0448 Boot-t 0036 09 004 099 006 0954 0030 075 006 096 0048 0493 BCa 0040 090 0040 0940 00 0930 0048 064 008 0930 004 0449 0 Perc 0048 094 0038 006 004 0936 0040 0663 008 0936 0036 0456 Boot-t 0040 094 0036 38 008 0950 003 0735 008 098 0054 0496 BCa 0038 09 0040 006 00 0938 0040 066 006 098 0046 0457 Perc 0044 090 0046 0945 004 0934 004 0643 0030 0930 0040 0449 Boot-t 0040 090 0040 09 000 0950 0030 078 0030 09 0048 0494 BCa 004 090 0038 0948 00 0934 0044 0644 008 0930 004 0450 Ste Stef CSt 05 05 0 Ste Stef CSt Ste Stef CSt Ste Stef CSt Usal 000 0770 00 0746 0000 068 038 0499 0000 0400 0600 0343 Fller 0000 0990 000 3079 0000 0997 000 95 0000 000 0000 637 Perc 004 0898 0060 070 00 0934 0044 0733 0034 090 0046 055 Boot-t 0036 09 004 96 004 0936 0040 0845 0040 0906 0054 0576 BCa 0040 0904 0056 076 006 098 0056 0736 0038 0904 0058 057 Perc 0044 094 004 008 093 0050 077 004 098 0048 057 Boot-t 0036 090 0044 365 00 095 0036 0857 008 094 0068 0577 BCa 004 094 0044 09 00 098 0060 0770 004 090 0066 057 Perc 0046 0900 0054 097 008 0930 004 074 0034 09 0044 058 Boot-t 0040 094 0036 330 004 0938 0038 0855 0040 090 0050 0580 BCa 0048 0906 0046 04 0030 094 0056 0744 0038 090 005 050 Usal 0004 0460 0536 0673 0000 08 078 0446 0000 005 0948 0304 Fller 0000 0986 004 3854 0000 0998 000 43 0000 0996 0004 768 Perc 0040 089 0068 9 006 09 005 0870 0036 0888 0076 063 Boot-t 0036 09 005 634 006 090 0054 06 0040 0890 0070 0699 BCa 0044 0888 0068 30 0030 0898 007 0878 0044 0876 0080 068 Perc 0034 090 0064 45 000 098 006 0888 00 0888 000 060 Boot-t 0030 096 0054 64 0006 09 007 099 000 0860 030 0664 BCa 0034 0906 0060 45 000 0898 009 0885 004 0848 038 060 Perc 0050 0898 005 365 0030 09 0048 089 0044 0890 0066 069 Boot-t 0046 0908 0046 736 0034 090 0046 050 0048 0894 0058 0706 BCa 0056 0884 0060 375 0038 0898 0064 0899 0046 0880 0074 064 Usal 000 046 085 057 0000 000 0980 0376 0000 0000 000 054 Fller 0000 0970 0030 6396 0000 099 0008 3008 0000 0990 000 04 Perc 0040 0858 00 746 0038 0874 0088 35 0054 0858 0088 078 Boot-t 0044 0858 0098 303 0046 0874 0080 376 0040 0876 0084 0909 BCa 0056 0834 00 768 0048 085 000 47 0060 0846 0094 0789 Perc 000 0876 004 63 000 0840 058 098 0000 07 078 0659 Boot-t 008 088 000 889 000 08 076 098 000 0694 0304 0735 BCa 00 0870 008 647 0000 080 098 098 000 067 036 0658 Perc 0044 0864 009 958 0046 088 007 04 0060 0864 0076 0798 Boot-t 005 0870 0078 586 0050 0876 0074 458 0056 0864 0080 0930 BCa 0058 0854 0088 98 0060 0846 0094 6 0068 0854 0078 0807 Rev Mat Estat, São Palo, v,, p5-4, 003 39

tervalos de cofaça com meor gra de cofabldade com cetro deslocado a dreção do zero Etre os tervalos bootstrap o qe se destaco em ossas smlações, tato o modelo lear qato o modelo epoecal, fo o tervalo percetl, qe além de ser mas smples e egr meos tempo comptacoal, mostro-se tão efcete qato os demas, sedo o qe geralmete apreseto meor comprmeto O estmador Ste e o Carroll-Stefask prodzram, de modo geral, tervalos de cofaça de melhor performace e o estmador Usal, os tervalos de por performace perate a estêca de erro de medda De modo geral, os tervalos de cofaça bootstrap baseados o estmador de Stefask e o baseado o estmador Usal têm ma cobertra feror à omal e à dos demas tervalos costrídos; o comportameto dos tervalos Ste e C Stefask são bastate smlares; o comportameto dos três tervalos bootstrap são bastates smlares com relação à cobertra, mas o bootstrap-t tem m comprmeto sstematcamete maor; os tervalos parecem ser smétrcos o com ma save assmetra, ecetado os tervalos bootstrap para os estmadores de Stefask e Usal em qe a assmetra é bastate acetada À medda qe σ ameta os tervalos Stefask e Usal acetam sa assmetra No modelo epoecal, o tervalo de cofaça para o estmador de Fller ão é aproprado, pos o se comprmeto é mto grade, com cobertra próma de 00%, como era esperado, ma vez qe fo costrído para atear o erro de medção em modelos leares e ormas CUNHA, W J da; COLOSIMO, E A Bootstrap cofdece tervals regresso models wth measremet error Rev Mat Estat, São Palo, v,, p5-4, 003 ABSTRACT: Rote measres are sbjected to errors These errors ca occr de to strmet precso, wrog vales regstered, strmet readgs etc It s well kow that the estmators of a regresso model ca get based ths stato Some estmators have bee proposed to redce the bas Plg- estmators are specal case of them These plg- estmators are very attractve bt there s ot a epresso avalable for ther asymptotc varace Ths happes becase of the two steps procedres of these estmators, whch geerate a sophstcated model strctre Therefore, resample methods are ecessary to determe cofdece tervals for the plg- estmators Bootstrap methods, are sed ths paper to make ths task I partclar, percetle, BCa e bootstrap-t methods are sed to bld cofdece tervals The reslts obtaed from Mote Carlo smlatos dcate that the resample cofdece tervals preset ce featres I partclar, percetle cofdece tervals have same featres of the other two bt t s less comptatoal tesve KEYWORDS: Measremet error; bootstrap; cofdece tervals; regresso models Referêcas CARROLL, RJ; STEFANSKI, LA Appromate qas-lkelhood estmato model wth srrogate predctors J Am Stat Assoc, v85, p65-63, 990 EFRON, B Bootstrap methods: aother look at the jackkfe A Stat, v7, p-6, 979 40 Rev Mat Estat, São Palo, v,, p5-4, 003

Better bootstrap cofdece tervals (Wth dscsso) J Am Stat Assoc, v8, p7-00, 987 EFRON, B; TIBSHIRANI, RJ A trodcto to the bootstrap Lodo: Chapma & Hall, 993 436p FULLER, WA Measremet error models New York: Joh Wley, 987 440p GIMENEZ, P; BOLFARINE, H; COLOSIMO, EA Estmato webll regresso model wth measremet error Comm Stat, Theory Methods, v8, p495-50, 999 JAMES, W; STEIN, C Estmato wth qadratc loss I: BERKELEY SYMPOSIUM ON MATHEMATICS, STATISTICS AND PROBABILITY, 4, 96, Berkeley Proceedgs Berkeley: Uversty of Calfora Press, 96 v, p36-80 KENDALL, M G; STUART, A The advaced theory of statstcs 4ed Lodo: Grff, 977 v, 483p LAWLESS, JF Statstcal models ad methods for lfetme data New York: Joh Wley, 98 580p LYLES, R H; KUPPER, L A ote o cofdece terval estmato measremet error adjstmet Am Stat, v53, 3, p47-53, 999 SEBER, GAF Lear regresso aalyss New York: Joh Wley, 977 465p STEFANSKI, L A The effect of measremet error o parameter estmato Bometrka, v7, p583-9, 985 WHITTEMORE, AS; KELLER, JB Appromatos for error--varables regresso J Am Stat Assoc, v83, p057-66, 988 WHITTEMORE, A S Errors--varables regresso sg Ste estmates Am Stat, v43, 4, p6-8, 989 Recebdo em 0800 Aprovado após revsão em 00 Rev Mat Estat, São Palo, v,, p5-4, 003 4