Análise de Regressão Linear Simples III

Documentos relacionados
Regressão linear múltipla. Prof. Tatiele Lacerda

Capítulo 5. Inferência no Modelo de Regressão Simples: Estimação de Intervalos, Teste de Hipóteses e Previsão

Capítulo 4 Inferência Estatística

Como rodar a regressão no gretl. Usando o Console para calcular elasticidade. Elasticidade. Usando o Console para calcular predição

Para mais de duas variáveis independentes, em função de uma variável dependente.

Modelos de Probabilidade e Inferência Estatística

Análise de Regressão Linear Múltipla III

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

Regressão Linear Múltipla

Correlação e Regressão linear simples

Plano da Apresentação. Correlação e Regressão linear simples. Correlação linear. Associação entre hábitos leitura e escolaridade.

Planejamento e Análise Estatística de Experimentos Fatoriais em blocos completos

Análise de Regressão Linear Múltipla. Wooldridge, 2011 Capítulo 3 tradução da 4ª ed.

IV Regressão e correlação IV.4. (cont.) Significância Estatística e Regressão Múltipla

AULA 04 Estimativas e Tamanhos Amostrais

AULA 12 Inferência a Partir de Duas Amostras

AULAS 06, 07, 08 E 09 Análise de Regressão Múltipla: Estimação e Inferência

Análise de Regressão. Notas de Aula

Teste de Hipótese e Intervalo de Confiança. Parte 2

Exemplo de heterocedasticidade. Heterocedasticidade. Gráficos residuais. Gráficos residuais. Gráficos residuais. Gráficos residuais

IND 1115 Inferência Estatística Aula 8

Análise estatística. Aula de Bioestatística. 17/9/2008 (2.ª Parte) Paulo Nogueira

Aula 12 Teste de hipótese sobre proporções amostras grandes

AULA 32 Problemas Adicionais de Especificação e de Dados

Estimação. Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança

Testes de variância e Análise de Variância (ANOVA)

Método dos mínimos quadrados Wikipédia, a enciclopédia livre

Probabilidade III. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período

BIOESTATÍSTICA. Parte 1 - Estatística descritiva e análise exploratória dos dados

Aula 8 Intervalos de confiança para proporções amostras grandes

Análise Multivariada Aplicada à Contabilidade

SEEC UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE UERN FACULDADE DE CIÊNCIAS EXATAS E NATURAIS FANAT DEPARTAMENTO DE CIÊNCIAS BIOLÓGICAS DECB

Intervalos Estatísticos para Uma Única Amostra

Teorema do Limite Central e Intervalo de Confiança

CAPÍTULO 8. de Variância - ANOVA ANOVA. Análise

ANOVA. (Analysis of Variance) Prof. Dr. Guanis de Barros Vilela Junior

AULAS 19, 20, 21 E 22 Análise de Regressão Múltipla com Informações Qualitativas

REGRESSÃO. Análise de Correlação

Aula Prática: Regressão Linear Simples

MOQ-14 Projeto e Análise de Experimentos

Consideremos os seguintes exemplos de hipóteses cuja veracidade interessa avaliar:

Medidas de Localização

MAE116 - Noções de Estatística

PLANO DE ENSINO CONTEÚDO PROGRAMÁTICO. Unidade 1: MEDIDAS E GRANDEZAS Introdução Padrões usados para avaliar grandezas físicas

Probabilidade e Estatística - EST0003 Intervalos Estatísticos para uma única Amostra

ME613 - Análise de Regressão

Métodos Quantitativos Aplicados

Unidade 5.2. Teste de hipóteses. Hipótese estatística. (uma população) Formulando as hipóteses. Teste de Hipóteses X Intervalo de Confiança

é 4. Portanto, o desvio padrão é 2. Neste caso 100% dos valores da população estão a um desvio padrão da média.

Curso de Análise Estatística Comparação entre variáveis contínuas: correlação e regressão Linear

Estatística II Aula 4. Prof.: Patricia Maria Bortolon, D. Sc.

Processos Estocásticos

cuja distribuição é t de Student com n 1 graus de liberdade.

Técnicas estatísticas para análise de dados e de resultados de modelos de simulação

Coeficiente de Assimetria e Curtose. Rinaldo Artes. Padronização., tem as seguintes propriedades: Momentos

Aula 8. Teste Binomial a uma proporção p

ESCOLA SUPERIOR DE TECNOLOGIA DE SETÚBAL DEPARTAMENTO DE MATEMÁTICA PROBABILIDADES E ESTATÍSTICA Teste Final 2009/2010. Curso: 12/06/2010.

Probabilidade e Estatística, 2009/2

Probabilidade e Estatística, 2011/2

25 a 30 de novembro de 2013

AULA 11 Experimentos Multinomiais e Tabelas de Contingência

O MODELO CLÁSSICO DE REGRESSÃO LINEAR (MCRL), O TEOREMA DE GAUSS- MARKOV E A VIOLAÇÃO DOS PRESSUPOSTOS.

Linha Técnica Sessão IV Variáveis Instrumentais

Medidas de dispersão e assimetria

Lista VII - Técnicas de Projeção e Previsão

Modelos de Probabilidade e Inferência Estatística

Análise de Regressão Linear Múltipla IX

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Exemplo Turbinas de Avião

Análise de Regressão Múltipla com informação qualitativa: variáveis binárias (dummy)

Aula 11 Teste de hipótese sobre a média de uma população normal - σ 2 conhecida

CONHECIMENTOS ESPECÍFICOS

Testes de Hipóteses

Teste de hipóteses para médias e proporções amostrais

Introdução. Ou seja, de certo modo esperamos que haja uma certa

3 Modelos de Simulação

Aula 12: Correlação e Regressão

AMOSTRAGEM: DIMENSIONAMENTO DE AMOSTRAS. SELEÇÃO DOS ELEMENTOS DE UMA AMOSTRA. ESTIMATIVA DA CARACTERÍSTICA TOTAL DA POPULAÇÃO INVESTIGADA

Testes Qui-Quadrado - Teste de Aderência

Variáveis Frequências Gráficos Medidas de Posição Medidas de Dispersão Medidas Complementares Inferência

Universidade Federal do Amazonas Instituto de Ciências Exatas Departamento de Estatística

Avaliação e Desempenho Aula 1 - Simulação

Testes Não Paramétricos

Retorno e risco de carteiras de investimento. Copyright Pereira, F. I

Métodos de Previsão em Negócios Soluções das Atividades

Então, a distribuição de converge para a distribuição normal com média nμ e variância nσ 2

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

I-046 ESTUDO DA ASSOCIAÇÃO ENTRE O PIB PER CAPITA E A QUANTIDADE DE RESPIDUOS SÓLIDOS DOMICILIARES COLETADOS EM MANAUS AM: UMA ANÁLISE TRIMESTRAL

MEDIDAS DE DISPERSÃO. o grau de variabilidade, ou dispersão, dos valores em torno da média.

Aula 1 Variáveis aleatórias contínuas

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

Conteúdo. 1 Introdução. Histograma do Quinto Sorteio da Nota Fiscal Paraná 065/16. Quinto Sorteio Eletrônico da Nota Fiscal Paraná

Conteúdo. 1 Introdução. Histograma do 1o Sorteio da Nota Fiscal Paraná 152/15. 1º Sorteio Eletrônico da Nota Fiscal Paraná

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Contabilometria. Análise Discriminante

Este apêndice deriva vários resultados da estimação do modelo de regressão linear múltipla usando

Tópico 9. Teste t-student

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 3

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

Estatística. Slide 0. Ana M. Abreu /07

Transcrição:

Análise de Regressão Linear Simples III Aula 03 Gujarati e Porter Capítulos 4 e 5 Wooldridge Seção.5

Suposições, Propriedades e Teste t

Suposições e Propriedades RLS.1 O modelo de regressão é linear nos parâmetros No modelo populacional, a variável resposta y está relacionada ao regressor x e ao erro como y = 0 + 1 x 1 + em que 0 parâmetro de intercepto populacional (constante); 1 parâmetro de inclinação populacional (constante); erro aleatório não observável.

Suposições e Propriedades RLS. Amostragem Aleatória Temos uma amostra aleatória de n observações (x i, y i ), i = 1,,..., n, proveniente do modelo populacional descrito em RLS.1. RLS.3 Variação amostral no regressor Os resultados amostrais em x, ou seja, {x i, i = 1,,..., n} não são todos de mesmo valor.

Suposições e Propriedades RLS.4 Média Condicional Zero O termo de erro aleatório,, tem valor esperado igual a zero, dado qualquer valor do regressor. Ou seja, E( x) = 0. Teorema 1. Sob as suposições RLS.1 a RLS.4, condicional aos valores amostrais do regressor, os estimadores de MQO dos parâmetros do modelo de regressão linear simples são não-viesados, ou seja, E( β ˆ ) j β j, j = 0, 1. (Exercício:PROVE!)

Observação SUPOSIÇÃO FUNDAMENTAL: E(x) = 0 Ou seja, todos os fatores contidos em devem ser não correlacionados com o regressor. Além disso, deve ter sido usada a forma funcional correta. 6

Observação (cont.) SUPOSIÇÃO FUNDAMENTAL: (cont) Como pode falhar? Omissão de regressor relevante, correlacionado com x; Forma funcional especificada incorretamente; Erro de medida em x; Simultaneidade entre y e x; 7

Suposições e Propriedades RLS.5 Homocedasticidade O termo de erro aleatório tem a mesma variância dado qualquer valor do regressor. Ou seja, Var( x) =. Observação De RLS.4 e RLS.5 temos que E( x) =, o que significa que também é a expectativa incondicional de. Dessa forma, Var() = (variância do erro). 8

9 Teorema. Sob as suposições RLS.1 a RLS.5, condicionadas aos valores amostrais da variável explicativa, prova-se que e Variância dos Estimadores de MQO. ) ˆ ( 1 1 x n i i SST x x Var, 1 ) ˆ ( 1 0 n i x i x x n σ Var

Covariância entre os Estimadores de MQO Exercício Mostre que a covariância entre os estimadores para os parâmetros 0 e 1 é dada por ˆ, ˆ ˆ Var Cov x 0 1 1

Melhores estimadores lineares não-viesados (BLUE) Sob as suposições RLS.1 a RLS.5, os estimadores de MQO para os parâmetros 0 e 1 são os melhores dentre todos os estimadores da classe dos lineares não-viesados. Isto quer dizer que além de serem não-viesados, tais estimadores apresentam a menor variância dentre os demais estimadores não-viesados, gerando estimadores com menor erro quadrático médio dentre os lineares. Vide demonstração em Gujarati e Porter (011, p. 115)

Distribuição amostral de βˆ j RLS.6 Normalidade O erro populacional é independente do regressor x e é normalmente distribuído, com média zero e variância. Ou seja, ~ N(0; ) 1

Distribuição amostral de βˆ j Teorema 3 Sob as suposições RLS.1 a RLS.6, condicionado aos valores amostrais do regressor, βˆ j ~ N β j, Var βˆ j Observação Tais estimadores são normalmente distribuídos, pois, são combinações lineares dos y s, que são independentes e normalmente distribuídos. 13

Distribuição amostral de Do teorema anterior vem que, βˆ j βˆ j Var β βˆ j j ~ N 0,1 Do slide 9, vimos que as expressões das variâncias dos estimadores dos parâmetros envolvem, que é um parâmetro desconhecido. Dessa forma, deveremos procurar um estimador para tal parâmetro. Ainda, um estudo da distribuição de probabilidades da nova v.a. gerada deverá ser feito.

Estimação de MSR (Quadrado Médio devido aos Resíduos) ˆ MSR SSR n- em que SSR n i1 n yi-yˆ i yi βˆ o βˆ 1 xi i1 SSR perde graus de liberdade, pelas restrições impostas pelas condições de primeira ordem de MQO.

Estimação de Teorema 4. Sob as suposições RLS.1 a RLS.5 ˆ E( σ ) E(MSR) σ Observação ˆ MSR : é chamado de erro padrão da regressão. 16

Erro Padrão dos Estimadores de MQO Substituindo MSR (que é um estimador não viesado para ) nas expressões provenientes do Teorema, teremos que ˆ 1 x Var( ) σˆ, 0 n SST x e Var( ˆ ) 1 ˆ SST x. em que SST x n xi x i1 17

Erro Padrão dos Estimadores de MQO À raiz quadrada das duas quantidades anteriores damos o nome de erro-padrão associado ao estimador de mínimos quadrados do i-ésimo parâmetro do modelo de regressão. A notação comumente utilizada é a seguinte: 1 x ˆ ˆ σˆ e 0 n SST x ˆ ˆ 1 ˆ SST x. 18

Distribuição amostral de βˆ j Teorema 5. Sob as suposições RLS.1 a RLS.6, βˆ j ˆ β βˆ j j ~ t n- Vale ressaltar que a v.a. anteriormente obtida não pode ser considerada como uma estatística de teste, uma vez que depende do parâmetro j. 19

INFERÊNCIA

Teste de Hipóteses Para testar as hipóteses H 0 : j = b (em particular b = 0) H A : j b (H A : j < b ou H A : j > b), utilizaremos o fato que, sob H 0 e sob o Teorema 5, βˆ j ˆ βˆ j b ~ t (n ) 1

Intervalo de Confiança para j Também, do Teorema 5, não é difícil provar que: IC β βˆ t / j j n- ; ˆ ˆ j (I.C. para j com coeficiente = 1- de confiança)

Retornando ao Exemplo do RH a) Os formuladores do exame acreditam que a nota média seja uma variável relevante para explicar o desempenho. Assim sendo, conduza um teste de hipóteses que seja capaz de verificar a veracidade da afirmação feita pelos formuladores do exame. Para tanto, adote = 5%. b) A partir da construção de um intervalo de confiança para o parâmetro intercepto, o que podemos afirmar sobre a significância estatística do mesmo? Adote = 5%.

Resultados - Excel Estatística de regressão R múltiplo 0,761 R-Quadrado 0,5808 R-quadrado ajustado 0,571 Erro padrão 6,333 Observações 50 n R Coeficiente de correlação linear de Pearson ANOVA gl SQ MQ F F de significação Regressão 1 667,85 667,85 66,51 1,884E-10 Resíduo 48 195,7 40,11 Total 49 4593,1 Coeficientes Erro padrão Stat t valor-p Inferior 95,0% Superior 95,0% Interseção 68,51 3,75 18,5 3,10574E-3 60,96 76,06 Variável X 1 1,81 0, 8,16 1,884E-10 1,36,6 ˆ ˆ 0 1 Modelo Estimado: desempenho 68,511, 81nota

Leitura Complementar

Retornando ao Exemplo do RH A partir de um teste de hipóteses adequado, verifique se o modelo de regressão proposto é significante. Adote um nível de significância de 5% ( = 0,05). 6

Tabela de Análise de Variâncias (ANOVA) y ˆ ˆ 0 1 x SST n y i - y i1 ŷ y SSR n y i - ŷ i i1 SSE n ŷ i - y i1 SST: soma de quadrados total SSR: soma de quadrados devido aos resíduos SSE: soma de quadrados devido à explicação (modelo de regressão)

Tabela de Análise de Variâncias (ANOVA) SSR, SSE e SST são v.a. e, sob certas condições, é possível provar que: 1. SSR σ ~ χ (n) ;. Se β 1 0, SSE σ ~ χ (1) ; 3. SSR e SSE são independentes.

Tabela de Análise de Variâncias (ANOVA) Consequências: (a) E SSR σ SSR n - MSR n E E σ σ Logo, MSR é um estimador não-viesado de ; (b) E SSE σ β 1 (x i x) Se 1 = 0, então SSE / 1 = MSE é um estimador nãoviesado de ; σ 9

Tabela de Análise de Variâncias (ANOVA) Consequências (cont.): (c) Se 0, 1 E(SST) E(SSR) E(SSE) (n - )σ σ (n -1)σ σ Logo, SST/(n-1) é estimador não-viesado de ; 30

Tabela de Análise de Variâncias (ANOVA) Consequências (cont.): (d) Se 1 F obs 0, SSE/σ 1 SSR/σ (n ) MSE MSR ~ F [1,n-] 31

Tabela de Análise de Variâncias (ANOVA) Os resultados descritos em (d) podem ser colocados numa tabela conhecida como ANOVA (Análise de Variâncias) em que Regressão 1 SSE MSE MSE/MSR Resíduo n- SSR MSR Total n - 1 SST ˆ MSR SSR n - MSE SSE 1

Teste F Devido ao item (d), para testarmos H o : 1 = 0 vs H A : 1 0 rejeitamos H o a um nível de significância se ( ) F F obs [1; n-] 33

Retornando ao Exemplo do RH A partir de um teste de hipóteses adequado, verifique se o modelo de regressão proposto é significante. Adote um nível de significância de 5% ( = 0,05). 34

Resultados - Excel Modelo Estimado: desempenho 68,511, 81nota Estatística de regressão R múltiplo 0,761 R-Quadrado 0,5808 R-quadrado ajustado 0,571 Erro padrão 6,333 Observações 50 F obs Valor-p ANOVA gl SQ MQ F F de significação Regressão 1 667,85 667,85 66,51 1,884E-10 Resíduo 48 195,7 40,11 Total 49 4593,1 Coeficientes Erro padrão Stat t valor-p Inferior 95,0% Superior 95,0% Interseção 68,51 3,75 18,5 3,10574E-3 60,96 76,06 Variável X 1 1,81 0, 8,16 1,884E-10 1,36,6

i. Se não rejeitarmos a hipótese nula de que 1 = 0, estaremos admitindo que E(Y X=x) = 0, cuja representação gráfica é dada por: y Observações Finais 0 neste caso, o modelo de regressão estimado será dado por yˆ y x 36

Observações Finais De (i), temos que a não rejeição de H 0 fará com que adotemos o modelo ŷ y Por outro lado, a rejeição de H 0 fará com que adotemos o modelo yˆ ˆ ˆ x 1 0 37

Observações Finais ii. É importante salientar que a rejeição de H 0 não garante a adequabilidade do modelo. Por outro lado, a rejeição de H 0 pode ser interpretada como um indicativo de superioridade do modelo modelo yˆ y. yˆ ˆ ˆ x 1 0 yˆ ˆ ˆ x 1 0 em relação ao iii. Para verificarmos se o modelo adotado é adequado devemos fazer uma análise de resíduos. Desta forma, a adoção definitiva do modelo ainda a análises posteriores. yˆ ˆ ˆ x 1 0 deve estar sujeita 38