PRESSUPOSTOS DO MODELO DE REGRESSÃO

Documentos relacionados
Métodos Avançados em Epidemiologia

Capítulo 1. Exercício 5. Capítulo 2 Exercício

1. CORRELAÇÃO E REGRESSÃO LINEAR

ESTATÍSTICA APLICADA II ANO LECTIVO 2011/2012. Exame Final 26 de Julho de 2012

Prof. Lorí Viali, Dr.

Regressão Múltipla. Parte I: Modelo Geral e Estimação

REGRESSÃO E CORRELAÇÃO

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr.

Análise de Regressão Linear Múltipla IV

1ª PROVA DE ESTATÍSTICA EXPERIMENTAL

Testes não-paramétricos

Gabarito da Lista de Exercícios de Econometria I

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

Análise de Regressão

Análise de Regressão Linear Múltipla VII

a média populacional do i-ésimo tratamento; o efeito do i-ésimo tratamento na variável dependente Y e mede o afastamento da média µ

4 Critérios para Avaliação dos Cenários

A redução na pressão sangüínea (mm Hg) em um período de quatro semanas observadas em cães experimentais está tabulada abaixo:

INSTITUTO POLITÉCNICO DE VISEU ESCOLA SUPERIOR DE TECNOLOGIA E GESTÃO

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

Associação entre duas variáveis quantitativas

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

A redução na pressão sangüínea (mm Hg) em um período de quatro semanas observadas em cães experimentais está tabulada abaixo:

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

Regressão Linear Simples. Frases. Roteiro

Cap. 11 Correlação e Regressão

REGRESSÃO NÃO LINEAR 27/06/2017

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Tabela 1. Porcentagem de crianças imunizadas contra DPT e taxa de mortalidade de menores de 5 anos para 20 países, 1992.

Covariância na Propagação de Erros

DELINEAMENTOS EXPERIMENTAIS

Gráficos de Controle para Processos Autocorrelacionados

Regressão Linear Múltipla. Frases. Roteiro

MODELOS DE REGRESSÃO PARAMÉTRICOS

Regressao Simples. Parte II: Anova, Estimação Intervalar e Predição

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

Escola Superior de Tecnologia de Viseu. Fundamentos de Estatística 2006/2007 Ficha nº 7

Como Construir Modelos Empíricos

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

(c) 0,5; 9,5; -10,5; -0,5; 12,3; 2,3; etc. Ocorre desvio alto para o indivíduo 19 (-19,5) X (idade da casa)

AULA EXTRA Análise de Regressão Logística

Estatística II Antonio Roque Aula 18. Regressão Linear

Contabilometria. Aula 8 Regressão Linear Simples

NOTAS DE AULA DA DISCIPLINA CE DENSIDADE NORMAL MULTIVARIADA E SUAS PROPRIEDADES

Nome: Nº: Estatística para Economia e Gestão Licenciaturas em Economia e Gestão. 2.º Semestre de 2008/2009

ECONOMETRIA I Prova n.º 1

TESTE DO QUI-QUADRADO - Ajustamento

Estatística I Licenciatura MAEG 2006/07

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA

UNIVERSIDADE NOVA DE LISBOA Faculdade de Economia Análise de Dados e Probabilidade 2º Semestre 2008/2009 Exame Final 1ª Época. Grupo I (4 Valores)

3 A técnica de computação intensiva Bootstrap

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental.

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Em muitas situações duas ou mais variáveis estão relacionadas e surge então a necessidade de determinar a natureza deste relacionamento.

Estatística. 8 Teste de Aderência. UNESP FEG DPD Prof. Edgard

Regressão Linear Simples by Estevam Martins

Análise de Variância. Comparação de duas ou mais médias

REGRESSÃO LINEAR 05/10/2016 REPRESENTAÇAO MATRICIAL. Y i = X 1i + 2 X 2i k X ni + i Y = X + INTRODUÇÃO SIMPLES MÚLTIPLA

CORRELAÇÃO E REGRESSÃO

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens

ALTERNATIVA AO USO DA REGRESSÃO LINEAR SIMPLES PARA GRANDES BASES DE DADOS

Prof. Cláudio Serra, Esp. 1. Produção de Leite x índice Pluviométrico y = 0.8x R 2 =

Métodos Experimentais em Ciências Mecânicas

NOTAS DE AULA DA DISCIPLINA CE076

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

Y em função de X, onde Y é a variável explicada por X. Y - variável explicada ou dependente de X X - variável explicativa ou independente

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

Prof. Lorí Viali, Dr.

Dados ajustáveis a uma linha recta

CAPÍTULO 9 REGRESSÃO LINEAR PPGEP REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES UFRGS. Regressão Linear Simples

R X. X(s) Y Y(s) Variáveis aleatórias discretas bidimensionais

Tópicos Extras 2ª parte. Análise de Correlação e Regressão

Tipo tratamento idade Tipo tratamento sexo

ANÁLISE DE REGRESSÃO E CORRELAÇÃO

Correlação. Frases. Roteiro. 1. Coeficiente de Correlação 2. Interpretação de r 3. Análise de Correlação 4. Aplicação Computacional 5.

(B) Considere X = antes e Y = depois e realize um teste t para dados pareados e um teste da ANOVA de um DBC com 5 blocos. Compare os resultados.

ESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11. EXERCÍCIOS PRÁTICOS - CADERNO 4 Regressão Linear

Ajuste de Curvas Regressão. Computação 2º Semestre 2016/2017

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011

Avaliação do Modelo. Avaliação de Modelos. Métricas para avaliação de desempenho. Métricas para avaliação de desempenho 31/05/2017

Econometria II. Painel (1ª Diferenças, Efeitos Fixos e escolha entre estimadores de painel)

Algarismos Significativos Propagação de Erros ou Desvios

Teoria Elementar da Probabilidade

Modelo de Regressão Simples

Sistemas de equações lineares

Cap. 5. Testes de Hipóteses

Programa de Certificação de Medidas de um laboratório

Análise Exploratória de Dados

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Exercícios de CPM e PERT Enunciados

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira

Transcrição:

PREUPOTO DO MODELO DE REGREÃO A aplcação do modelo de regressão lnear múltpla (bem como da smples) pressupõe a verfcação de alguns pressupostos que condensamos segudamente.. Os erros E são varáves aleatóras de méda zero;. Os erros E são varáves aleatóras de varânca constante (σ ) hpótese de homocedastcdade; 3. As varáves aleatóras E, E,, E n são ndependentes; 4. As varáves explcatvas X, X,, X k são não correlaconadas hpótese de ausênca de multcolneardade entre as varáves explcatvas; Para conduzr os testes de hpóteses que abordaremos segudamente, necesstamos anda do segunte pressuposto: 5. Os erros E seguem uma dstrbução normal: E ~ N(, σ ).

PROPRIEDADE DO ETIMADORE DO MÍNIMO QUADRADO O método dos mínmos quadrados fornece estmatvas pontuas b, b,...,b k para,,..., k Os estmadores que fornecem estas estmatvas são ( ) Y X X X T T k ˆ ˆ ˆ ˆ M

Verfcadas as hpóteses do modelo (referdas anterormente) pode-se mostrar que os estmadores ˆ ˆ,..., ˆ, k são tas que: E ˆ,...,k; ( ) Var ˆ σ c ( ) onde c é o elemento dagonal da lnha + da matrz ( ) X T X. Na regressão smples estas varâncas podem ser dadas por: Var ( ˆ ) σ e Var( ˆ ) n n x n x n x σ n x nx Cada ˆ tem dstrbução normal: ˆ ~ N(, σ c ) 3

Como, em geral, σ é desconhecdo estmamos Var( ˆ ) por ˆ que se obtém substtundo nas formulas anterores σ pelo seu estmador, E n k Então, ˆ c E n k c 4

TETE DE IPÓTEE TETE OBRE O COEFICIENTE DE REGREÃO Ocasonalmente, poderá ser de suspetar que uma varável explcatva partcular X não é muto útl, sto é, que a sua nfluênca sobre a varável dependente não é sgnfcatva. Para saber se é este o caso, testamos a hpótese nula de que o coefcente para esta varável é nulo: : : abemos que ˆ ~ N(, ˆ σ c),.e. ~ N(,) c σ. 5

ˆ Temos então ~ N(,). σ c Como σ é desconhecdo, substtuímos σ pelo seu estmador ANÁLIE DE REGREÃO E vndo, n k ˆ c ~ t nk. ˆ A estatístca do teste, se é verdadera ( : ), é: ~ t nk c e for rejetada então temos evdênca de que, sto é, a varável explcatva X é útl na predção do valor da varável dependente. e não for rejetada então a varável explcatva X é geralmente retrada da equação de regressão pos não nfluênca sgnfcatvamente a varável resposta Y. 6

7 Mas geralmente, podemos testar a hpótese nula de que o coefcente seja gual a um determnado valor : : : A estatístca do teste, se é verdadera, é: ~ ˆ k n t c. Poderam também ser conduzdos testes unlateras em vez de testes blateras: : : > : : <.

Exemplo ANÁLIE DE REGREÃO Recordemos o exemplo em que se pretende estudar a relação entre o volume de vendas (Y) efectuadas durante um dado período de tempo por um vendedor, os seus anos de experênca (X ) e o seu score num teste de ntelgênca (X ). Com os dados: Vendedor Vendas (Y) Anos de experênca (X ) core no teste de ntelgênca (X ) 9 6 3 6 5 3 4 3 4 3 5 3 4 6 5 3 3 7 8 6 3 8 9 7 4 4 8

9 Obtém-se:, 4 7 8 5 3 3 4 6 9, 4 3 6 3 3 4 3 5 3 6 y X ( ) X X T 64 8 4 8 6 56 4 56 776 944 e ( ) X X T ( ) y X T.338983.745763.67.

Testes para o Exemplo ANÁLIE DE REGREÃO - Vamos testar a hpótese nula do coefcente de regressão assocado a X ser zero. póteses: : : ˆ ˆ ob, T ~ t n k,.e ~ t7. c c Já calculámos anterormente o valor do E (E 7.4835). Então, tem-se: E 7.4835. 69. n k

.69. 3393. 6 c.3393. 666 ˆ. 944 ANÁLIE DE REGREÃO Como o teste é blateral, para o cálculo dos pontos crítcos procura-se t α / tal que α P ( T t α / ). 5 t α /. 365. RC ]-, -.365] [.365, + [.745765 T obs. 86 RC, logo rejetamos..666 Ao nível de sgnfcânca de.5, há pos evdênca para conclur que a varável anos de experênca é útl na predção do volume de vendas, ou seja, a varável X contrbu para a explcação do volume de vendas de um vendedor.

- Vamos verfcar se se pode rejetar a hpótese nula do coefcente ser nulo. póteses: : : ˆ ob, T ~ t7 c 3 ˆ Tem-se: 776 c.3393. 9374 ˆ. 944 RC ]-, -.365] [.365, + [..67 T obs. 8 RC, logo não rejetamos, ao nível de sgnfcânca.9374 de.5.

TETE F PARA TETAR A IGNIFICÂNCIA DA REGREÃO Este teste serve para testar a hpótese nula, : a regressão não é sgnfcatva, que é equvalente às seguntes: : a equação de regressão não explca a varação na varável resposta; : não exste relação lnear entre a varável dependente e o conjunto de varáves ndependentes utlzadas. Matematcamente: :... k : pelo menos um 3

Pode-se mostrar que se for verdadera se tem, R k F ~ F n k E R k ( n k ) k sendo esta a estatístca do teste. Note que, R k n k R n k F E ( n k ) k E k n k R. k R R E T T Rejetamos para valores grandes da estatístca do teste F. 4

F n k k R R À parte da constante n k, a estatístca F é a razão entre a varação explcada e a não k explcada em Y. É natural que dgamos que a regressão é sgnfcatva só quando a proporção da varação explcada é grande. Isto ocorre só quando a razão F é grande. Por esta razão devemos sempre rejetar para valores de F muto grandes. e não for rejetada, então é o mesmo que dzer que o conjunto de varáves explcatvas contrbuem pouco para a explcação da varação da varável dependente. 5

Na regressão smples para testar a sgnfcânca da regressão consderamos as hpóteses, : : e portanto a estatístca teste a usar deve ser, R k R k ˆ F ou ~ tn ~ F n E ( n k ) ˆ ob 6

Os resultados descrtos podem ser convenentemente resumdos na tabela da ANOVA segunte: Fonte de oma dos Quadrados Graus de Quadrados Razão F varação Lberdade Médos Devdo à Regressão n R ( y y) ) k R k F R k Devdo aos resíduos Total n E ( ) n T ( y y) ) n-k- y y n- E n k 7

Exemplo ANÁLIE DE REGREÃO Para o exemplo em estudo, vamos testar a hpótese nula da regressão não ser sgnfcatva. póteses: : : pelo menos um ob, R F ~ F 7 8

Tem-se: 7 f α α ( F ). 5 P f 4. 74 α ANÁLIE DE REGREÃO RC [4.74, + [. R F obs k n k R 7.84697 9. 37 RC, logo rejetamos. k R.533 Ao nível de sgnfcânca de.5, rejetamos a hpótese da regressão não ser sgnfcatva. Então há evdênca para afrmar que exste um relaconamento lnear entre o conjunto de varáves explcatvas e o volume de vendas. 9

Para o Exemplo, temos a segunte Tabela ANOVA: Fonte de oma dos Graus de Quadrados Médos Razão F varação Quadrados Lberdade Devdo à Regressão R4.4695 R 4.4695 F 9..7 37 k Devdo aos resíduos E7.4835 7 n E k 7.4835 7.69 Total T48.9 9