Avaliação da qualidade do ajuste

Documentos relacionados
REGRESSÃO LINEAR 05/10/2016 REPRESENTAÇAO MATRICIAL. Y i = X 1i + 2 X 2i k X ni + i Y = X + INTRODUÇÃO SIMPLES MÚLTIPLA

3 Experimento com Mistura com Respostas Não-Normais

MEDIDAS DE TENDÊNCIA CENTRAL I

Modelo de Regressão Simples

Regressao Simples. Parte II: Anova, Estimação Intervalar e Predição

A análise de variância de uma classificação (One-Way ANOVA) verifica se as médias de k amostras independentes (tratamentos) diferem entre si.

Estatística - exestatmeddisper.doc 25/02/09

Parte 3 - Regressão linear simples

NOTAS DE AULA DA DISCIPLINA CE076. ], T 2 = conhecido como T 2 de Hotelling

Em muitas situações duas ou mais variáveis estão relacionadas e surge então a necessidade de determinar a natureza deste relacionamento.

MEDIDAS DE DISPERSÃO:

Capítulo 5: Ajuste de curvas pelo método dos mínimos quadrados

DISTRIBUIÇÃO HIPERGEOMÉTRICA

Faculdade de Tecnologia de Catanduva CURSO SUPERIOR DE TECNOLOGIA EM AUTOMAÇÃO INDUSTRIAL

3 Modelos Lineares Generalizados

Regressão Simples. Parte III: Coeficiente de determinação, regressão na origem e método de máxima verossimilhança

ANÁLISE DE ERROS. Todas as medidas das grandezas físicas deverão estar sempre acompanhadas da sua dimensão (unidades)! ERROS

MAE0229 Introdução à Probabilidade e Estatística II

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Estimação Pontual

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou. experimental.

Distribuições Amostrais. Estatística. 8 - Distribuições Amostrais UNESP FEG DPD

NOTA: ESCREVA AS RESPOSTAS COMO FRAÇÕES OU COM 4 CASAS DECIMAIS NOTA 2: O FORMULÁRIO ESTÁ NO FINAL DA PROVA

Econometria: 4 - Regressão Múltipla em Notação Matricial

Revisão de Estatística X = X n

ESTATÍSTICA APLICADA À ZOOTECNIA

Estudo do intervalo de confiança da regressão inversa utilizando o software R

ANÁLISE DE REGRESSÃO E CORRELAÇÃO

Distribuições de Probabilidades

7 Análise de covariância (ANCOVA)

CAPÍTULO 3 MEDIDAS DE TENDÊNCIA CENTRAL E VARIABILIDADE PPGEP Medidas de Tendência Central Média Aritmética para Dados Agrupados

Noções Básicas de Medidas e Algarismos Significativos

Análise de influência

Modelos Lineares Generalizados: uma aplicação à tarifação automóvel

3. TESTES DE QUALIDADE DE AJUSTAMENTO

Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

O problema da superdispersão na análise de dados de contagens

NOTAS DE AULA DA DISCIPLINA CE076 = 2. ], T 2 = conhecido como T 2 de Hotelling

MÓDULO 8 REVISÃO REVISÃO MÓDULO 1

50 Logo, Número de erros de impressão

O problema da superdispersão na análise de dados de contagens

RACIOCÍNIO LÓGICO / ESTATÍSTICA LISTA 2 RESUMO TEÓRICO

4 Técnicas de Seleção de Características Independentes do Modelo para os Sistemas Neuro-Fuzzy Hierárquicos

Regressão Múltipla. Parte I: Modelo Geral e Estimação

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Estatística Descritiva. Medidas estatísticas: Localização, Dispersão

ESTATÍSTICA Exame Final 1ª Época 3 de Junho de 2002 às 14 horas Duração : 3 horas

Nas Instituições de Ensino Superior(IES), há uma relação direta entre a qualidade do ensino e a taxa de inadimplência. A taxa de inadimplência das

Professor Mauricio Lutz REGRESSÃO LINEAR SIMPLES. Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das formulas: ö ; ø.

? Isso é, d i= ( x i. . Percebeu que

Média. Mediana. Ponto Médio. Moda. Itabira MEDIDAS DE CENTRO. Prof. Msc. Emerson José de Paiva 1 BAC011 - ESTATÍSTICA. BAC Estatística

Econometria: 3 - Regressão Múltipla

Tópicos Extras 2ª parte. Análise de Correlação e Regressão

Prof. Janete Pereira Amador 1

Inferência Estatística e Aplicações I. Edson Zangiacomi Martinez Departamento de Medicina Social FMRP/USP

Interpolação. Exemplo de Interpolação Linear. Exemplo de Interpolação Polinomial de grau superior a 1.

Cap. 5. Testes de Hipóteses

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

CAPÍTULO 5. Ajuste de curvas pelo Método dos Mínimos Quadrados

n. A densidade de corrente associada a esta espécie iônica é J n. O modelo está ilustrado na figura abaixo.

Gráficos de Controle para Processos Autocorrelacionados

MEDIDAS DE POSIÇÃO: X = soma dos valores observados. Onde: i 72 X = 12

4 Critérios para Avaliação dos Cenários

(1) no domínio : 0 x < 1, : constante não negativa. Sujeita às condições de contorno: (2-a) (2-b) CC2: 0

Probabilidades e Estatística LEE, LEIC-A, LEIC-T, LEMat, LERC, MEBiol, MEBiom, MEEC, MEFT, MEMec, MEQ

x n = n ESTATÍSTICA STICA DESCRITIVA Conjunto de dados: Organização; Amostra ou Resumo; Apresentação. População

HIDROLOGIA E RECURSOS HÍDRICOS. Análise estatística aplicada à hidrologia

Controle Estatístico de Qualidade. Capítulo 6 (montgomery)

6.1 - PROCEDIMENTO DE AVALIAÇÃO DE INCERTEZA EM MEDIÇÕES DIRETAS

Estatística. 2 - Estatística Descritiva

Tabela 1 Números de acidentes /mês no Cruzamento X em CG/07. N de acidentes / mês fi f

Uso de covariáveis em modelos biométricos para estimação de altura total em árvores de Eucalyptus dunnii

Estudo das relações entre peso e altura de estudantes de estatística através da análise de regressão simples.

Estimação pontual, estimação intervalar e tamanho de amostras

Regressão e Correlação

REGESD Prolic Matemática e Realidade- Profª Suzi Samá Pinto e Profº Alessandro da Silva Saadi

ESTATÍSTICA MÓDULO 3 MEDIDAS DE TENDÊNCIA CENTRAL

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

ANÁLISE DE REGRESSÃO E CORRELAÇÃO

Análise de Regressão

( ) ( IV ) n ( ) Escolha a alternativa correta: A. III, II, I, IV. B. II, III, I, IV. C. IV, III, I, II. D. IV, II, I, III. E. Nenhuma das anteriores.

II. Propriedades Termodinâmicas de Soluções

Aula 9. Aula de hoje. Aula passada. Self-normalized Importance Sampling Gerando amostras complicadas Variância amostral Simulação

Construção e Análise de Gráficos

( ) ( ) Es'mador de Máxima-Verossimilhança. ,θ i. L( Θ; X) = f ( X;Θ) = f (x i

Métodos Avançados em Epidemiologia

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental.

Números Complexos. 2. (IME) Seja z um número complexo de módulo unitário que satisfaz a condição z 2n 1, onde n é um número inteiro positivo.

n. A densidade de corrente associada a esta espécie iônica é J n. O modelo está ilustrado na figura abaixo.

9 Medidas Descritivas

Macroeconometria Aula 3 Revisão de estatística e teste de hipótese

Apêndice 1-Tratamento de dados

Teoria Elementar da Probabilidade. a) Cada experiência poderá ser repetida indefinidamente sob condições essencialmente inalteradas.

Centro de Ciências Agrárias e Ambientais da UFBA Departamento de Engenharia Agrícola

5 Critérios para Análise dos Resultados

MAE 5776 ANÁLISE MULTIVARIADA. Júlia M Pavan Soler

MEDIDAS DE DISPERSÃO 9. MEDIDAS DE DISPERSÃO

Difusão entre Dois Compartimentos

Caracterização de Partículas. Prof. Gerônimo

CAP. V AJUSTE DE CURVAS PELO MÉTODO DOS MÍNIMOS QUADRADOS

CAP. V AJUSTE DE CURVAS PELO MÉTODO DOS MÍNIMOS QUADRADOS

Transcrição:

Avalação da qualdade do ajuste 1

Alguma termologa: Modelo ulo: é o modelo mas smples que pode ser defdo, cotedo um úco parâmetro ( µ) comum a todos os dados; Modelo saturado: é o modelo mas complexo a ser defdo, em que se cosdera um parâmetro específco para cada observação a amostra ( µ 1, µ,..., µ ). O modelo saturado tem tatos parâmetros quato observações, ajustado perfetamete os dados. Modelo correte: qualquer modelo com p < parâmetros, stuado etre os modelos ulo e saturado (modelo vestgado).

Questão etre os modelos possíves defdos etre o modelo ulo (mas smples) e o modelo saturado (mas complexo), qual escolher? Nota Embora o modelo saturado (com parâmetros) seja vável, por ão resumr os dados, ele é usável como base de avalação (e comparação) para modelos termedáros (com p< parâmetros). 3

Fução desvo (devace fucto) No cotexto de MLG, sejam y,..., 1, y y varáves aleatóras produzdas por uma mesma dstrbução pertecete a famíla expoecal de dspersão f ( y; θ,φ), com g( µ ) = η, sedo ( ) fução de lgação e η = x β = β0 + β1x1 +... + β pxp 1 a parte sstemátca do modelo. g a Coforme vsto aterormete a log-verossmlhaça do modelo fca dada por: ( θ ) ( ) = θ y b lµ ; y + c( y; φ), (1) = 1 φ 1 lembrado que b ( θ ) = µ, µ g ( η ) = e η = x β = β0 + β1x1 +... + β pxp 1. 4

A fução desvo proporcoa uma medda de dfereça etre os modelos saturado e correte, baseado-se a dfereça dos máxmos das log-verossmlhaças avaladas sob cada modelo (deotadas por l ( y;y) e l ( µ;y ˆ ), respectvamete), sedo defda por: ( µ ˆ ) ( y;µ ˆ ) y; = = ; φ { l( y; y) l( µ ˆ y) }. Chamamos ( y; µ ˆ ) desvo escaloado e ( y; µ ˆ ) de desvo. Repare que se = 1 φ temos ( y; µ ˆ ) = ( y;µ ˆ ). É mportate observar que um valor pequeo para o desvo dca que o modelo correte (com p < parâmetros) proporcoa um ajuste quase tão bom quato o modelo saturado (com parâmetros), forecedo dcatvo de bom ajuste para o modelo proposto. Vamos usar a fução desvo para avalar a qualdade do ajuste de MLGs e como base de comparação de dferetes MLGs ajustados. 5

eotado por ˆ θ = θ ( ˆ ) e θ θ ( ~ ) de θ, µ ~ =, respectvamete, as estmatvas de máxma verossmlhaça µ = 1,,...,, para os modelos termedáro (com p< parâmetros) e saturado (com parâmetros), com base a log-verossmlhaça apresetada em (1), ( y; µ ˆ ) fca dado por: ( ) = { ~ ~ y ; µ ˆ y ( θ ˆ θ ) + ( b( ˆ θ ) b( θ )} = 1. (Exercíco!) Pode-se ada escrever: ( ;µ ˆ ) = d = 1 y, sedo d, = 1,,..., chamado compoete do desvo, correspodete à dfereça das duas logverossmlhaças assocada à ésma observação. 6

O quadro segute apreseta a fução desvo para algumas dstrbuções: strbução esvo = ˆ 1 Normal ( ) y µ Posso ( y log( y ˆ µ ) ( y µ )) = ˆ 1 Bomal { y log( y ˆ µ ) + ( y ) log[ ( y ) ( µ )]} = ˆ 1 Gama ( log( ˆ µ y ) + ( y ˆ µ ) ˆ µ ) = 1 = 1 Normal Iversa ( y ˆ µ ) ( ˆ µ y ) As demostrações dos desvos para esses cco modelos fcam como exercícos. 7

Teste da qualdade do ajuste baseado a fução desvo Sob certas codções*, ( y; µ ˆ ) tem dstrbução asstótca χ com p graus de lberdade, servdo tal dstrbução como base para avalação e teste do ajuste comparado o valor calculado de ( y; µ ˆ ) com o quatl 1 α da dstrbução χ p. * Cosultar seção 1.4.1 do lvro do professor Glberto de Paula. Uma regra mas formal para avalação do ajuste cosste em verfcar se o valor calculado de ( y; µ ˆ ) ão é muto maor que a méda da dstrbução χ p, que é p. No R: o O desvo referete ao modelo ajustado pode ser verfcado o summary, sedo apresetado como Resdual devace acompahado dos respectvos graus de lberdade; o Adcoalmete, o R solta como Null devace o desvo correspodete ao modelo ulo, acompahado dos respectvos graus de lberdade. 8

Outras meddas de qualdade do ajuste Estatístca Χ geeralzada de Pearso: Χ = ( y ˆ µ ) V ( ˆ µ ) = 1, ode V ( µˆ ) é a fução de varâca estmada. Também para esta estatístca é usual comparar o valor calculado com os quats da dstrbução χ com p graus de lberdade. o Para a dstrbução Normal, Χ correspode à soma de quadrado de resíduos; o Para as dstrbuções bomal e Posso, Pearso. Χ correspode à estatístca do teste qu-quadrado de o No R: Χ pode ser obtdo por sum(resduals(ajuste,type= pearso )**). 9

Pseudo R : Sejam 0 e, 1 respectvamete, os desvos para o modelo ulo (com um úco parâmetro, costate para todas as observações) e para algum modelo termedáro sob estudo. efe-se o pseudo R como: R 0 1 1 = =, 0 0 1 represetado a proporção do desvo do modelo ulo explcada pelo modelo termedáro. o No R: Χ pode ser obtdo por (ajuste$ull.devace-ajuste$devace)/ajuste$ull.devace. 10

Crtéro de Iformação de Akake (AIC): O AIC é uma medda de qualdade de ajuste baseada a (log)-verossmlhaça e pealzada pelo úmero de parâmetros o modelo. Por sua costrução, é amplamete utlzado o processo de seleção de modelos, a busca por um modelo parcmooso (bem ajustado aos dados, mas com poucos parâmetros). O AIC para um partcular modelo é defdo como: l( ˆ; ) p AIC = µ y +, sedo p o úmero de parâmetros o modelo. Assm, quato meor o valor do AIC, melhor o modelo. o Uma regra geral é que se a dfereça etre os AICs de dos modelos é maor que, etão o modelo com meor AIC é fortemete preferível. o No R: o AIC pode ser extraído usado AIC() ou dretamete do summary. 11