Análise de Regressão Múltipla com informação qualitativa: variáveis binárias (dummy)

Documentos relacionados
Análise de Regressão Múltipla com informação qualitativa: variáveis binárias (dummy)

Regressão múltipla: problemas adicionais. Unidades de medida. Unidades de medida. Unidades de medida salário em dólares (*1000) Unidades de medida

Regressão múltipla: Unidades de medida. Unidades de medida. Unidades de medida salário em dólares (*1000) Unidades de medida

AULA 09 Análise de regressão múltipla com informações qualitativas

AULAS 28 E 29 Análise de Regressão Múltipla com Informações Qualitativas

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

Quiz Econometria I versão 1

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

Variáveis Dummy. y = b 0 + b 1 x 1 + b 2 x b k x k + u. Econometria II - Prof. Ricardo Freguglia

Análise Multivariada Aplicada à Contabilidade

Métodos Quantitativos para Avaliação de Políticas Públicas

Econometria. Econometria ( ) O modelo de regressão linear múltipla. O modelo de regressão linear múltipla. Aula 2-26/8/2010

EPGE / FGV MFEE - ECONOMETRIA Monitoria 03-09/05/2008 (GABARITO)

Econometria. Econometria MQO MQO. Resíduos. Resíduos MQO. 1. Exemplo da técnica MQO. 2. Hipóteses do Modelo de RLM. 3.

AULAS 14 E 15 Modelo de regressão simples

RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO

AULA 11 Heteroscedasticidade

AULA 07 Regressão. Ernesto F. L. Amaral. 05 de outubro de 2013

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

Análise de Regressão Linear Múltipla IX

AULAS 25 E 26 Heteroscedasticidade

Objetivos. Ao final desse grupo de slides os alunos deverão ser capazes de:

(ii) Acrescente lucros ao modelo da parte (i). Por que essa variável não pode ser

Análise de Regressão Múltipla: Mínimos Quadrados Ordinários

Aula 2 Tópicos em Econometria I. Porque estudar econometria? Causalidade! Modelo de RLM Hipóteses

AULAS 21 E 22 Análise de Regressão Múltipla: Estimação

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra

AULA 19 E 20 Análise de Regressão Múltipla: Problemas Adicionais

AULAS 14 E 15 Modelo de regressão simples

UNIVERSIDADE FEDERAL DE MINAS GERAIS FACULDADE DE FILOSOFIA E CIÊNCIAS HUMANAS DEPARTAMENTO DE CIÊNCIA POLÍTICA CURSO DE GESTÃO PÚBLICA

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

Instituto Superior de Economia e Gestão Universidade de Lisboa Econometria Época Normal 08/06/2017 Duração 2 horas

Disciplina de Modelos Lineares Professora Ariane Ferreira

Prova de Estatística

Gabarito Trabalho 1. onde 1 refere-se ao salário quando a variável branco = 1. Teremos, então:

Econometria. Regressão Linear Simples Lista de Exercícios

Econometria - Lista 5

Introdução ao modelo de Regressão Linear

Econometria VIOLAÇÃO DE HIPOTESES & EXTENSÕES DO MODELO DE REGRESSÃO ECONOMETRIA -MESTRADO 1

Análise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013

PARTE 1 ANÁLISE DE REGRESSÃO COM DADOS DE CORTE TRANSVERSAL CAPÍTULO 2 O MODELO DE REGRESSÃO SIMPLES

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

Instituto Superior de Economia e Gestão Universidade Técnica de Lisboa Econometria Época de Recurso 2/Julho/2013 Duração 2 horas

AULA 26 Análise de Regressão Múltipla: Problemas Adicionais

Econometria I Lista 4: Inferência

UNIVERSIDADE FEDERAL DE MINAS GERAIS FACULDADE DE FILOSOFIA E CIÊNCIAS HUMANAS DEPARTAMENTO DE CIÊNCIA POLÍTICA CURSO DE GESTÃO PÚBLICA

ANÁLISE DE REGRESSÃO

Análise da Regressão. Prof. Dr. Alberto Franke (48)

Gabarito - Lista 5 - Questões de Revisão

LISTA DE EXERCÍCIOS I. Faça os seguintes exercícios do Apêndice D do livro do Wooldridge:

AULAS 17 E 18 Análise de regressão múltipla: estimação

EAE0325 Econometria II. Professora: Fabiana Fontes Rocha. Gabarito Primeira Lista Teórica de Exercícios

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

Hipóteses do modelo linear clássico (CLM) Análise da Regressão múltipla: Inferência. Hipóteses do CLM (cont.) O teste t. Distribuição normal amostral

Retorno em escolaridade no Paraná

Capítulo 3. O Modelo de Regressão Linear Simples: Especificação e Estimação

Econometria Lista 1 Regressão Linear Simples

AULA 03 Análise de regressão múltipla: estimação

Nome: Turma: Processo

Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Estatística II - Licenciatura em Gestão Época de Recurso - Parte prática (14 valores) 24/01/2011.

Modelo de Variáveis discretas. Regressão com uma variável dependente Binária. Variáveis dependentes Binárias. Modelo de Probabilidade Linear

Nota de Aula: Uma Primeira Forma para se Desenvolver o Teste de F para Hipóteses sobre Combinações Linear dos Coeficientes da Regressão

Teste F-parcial 1 / 16

Teste F-parcial 1 / 16

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

(Esta questão vale dois pontos. Pode utilizar o gráfico para apoiar suas explicações)

Contabilometria. Aula 9 Regressão Linear Inferências e Grau de Ajustamento

AULA 07 Análise de Regressão Múltipla: Problemas Adicionais

Prova de Estatística

Análise de Regressão Linear Múltipla. Wooldridge, 2011 Capítulo 3 tradução da 4ª ed.

Modelos de Regressão Linear Simples - parte II

AULA 17 - Variáveis binárias

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

UNIVERSIDADE FEDERAL DE MINAS GERAIS FACULDADE DE FILOSOFIA E CIÊNCIAS HUMANAS DEPARTAMENTO DE CIÊNCIA POLÍTICA CURSO DE GESTÃO PÚBLICA

Gabarito e resolução da prova de seleção PPGE FURG Estatística

II. O mesmo investigador efetuou um conjunto de testes sobre a informação do Prazo Médio de Pagamentos cujos resultados são apresentados no Anexo I.

Nome: Turma: Processo

i j i i Y X X X i j i i i

CONHECIMENTOS ESPECÍFICOS

Econometria - Lista 6

UNIVERSIDADE FEDERAL DE MINAS GERAIS FACULDADE DE FILOSOFIA E CIÊNCIAS HUMANAS DEPARTAMENTO DE CIÊNCIA POLÍTICA CURSO DE GESTÃO PÚBLICA

AULAS 24 E 25 Análise de regressão múltipla: problemas adicionais

i j i i Y X X X i j 1 i 2 i i

Modelos de Regressão Linear Simples - parte III

Aula 2 Uma breve revisão sobre modelos lineares

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

CONHECIMENTOS ESPECÍFICOS

AULAS 20 E 21 Análise de regressão múltipla: problemas adicionais

AULAS 17 E 18 Análise de regressão múltipla: inferência

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

Mais Informações sobre Itens do Relatório

Estimação de Variáveis Instrumentais e Mínimos Quadrados de Dois Estágios. Wooldridge, Cápítulo 15

Gabarito da 1 a Lista de Exercícios de Econometria II

Modelo Linear Geral V

AULA 05 Análise de regressão múltipla: inferência

Transcrição:

Análise de Regressão Múltipla com informação qualitativa: variáveis binárias (dummy) 1

Como descrever informações qualitativas? Fatores qualitativos podem ser incorporados a modelos de regressão. Neste caso, classificamos os dados conforme algumas características qualitativas. Exemplos: ser homem ou ser mulher; ser branco ou negro; morar no Rio ou em Niterói... etc. Estas variáveis qualitativas podem ser regressores ou variáveis dependentes. Existem formas de incorporá-las ao modelo econométrico. 2

Variáveis binárias ou dummy Nestes casos, as informações relevantes podem ser captadas pela definição de uma variável binária (variável zero-um) Definição de uma dummy: identificar o evento que assumirá o valor um e o evento que assumirá o valor zero. É sempre bom denominar a variável pelo evento que é igual a um: Ser homem é igual a 1 chamar a variável de homem 3

Variáveis binárias ou dummy Como fica o banco de dados? 4

Exemplo: com uma variável binária Somente dois fatores afetam os salários: gênero e escolaridade Qual a diferença entre o salário hora do homem e da mulher, dado o mesmo nível educacional? 5

6

Exemplo 2: Se educação, experiência e permanência foram características relevantes para a produtividade, a hipótese nula para não existência de diferença entre homens e mulheres seria: H o : δ = 0 0 A alternativa seria que existe discriminação contra mulheres: H o : δ0 < 0 7

Banco de dados: wage1.gdt Rode o modelo acima Quanto a mulher ganha, em média, a menos que o homem? 8

Modelo 1: MQO, usando as observações 1-526 Variável dependente: wage Coeficiente Erro Padrão razão-t p-valor const -1,56794 0,724551-2,1640 0,03092 ** female -1,81085 0,264825-6,8379 <0,00001 *** educ 0,571505 0,0493373 11,5836 <0,00001 *** exper 0,0253959 0,0115694 2,1951 0,02860 ** tenure 0,141005 0,0211617 6,6632 <0,00001 *** Média var. dependente 5,896103 D.P. var. dependente 3,693086 Soma resíd. quadrados 4557,308 E.P. da regressão 2,957572 R-quadrado 0,363541 R-quadrado ajustado 0,358655 F(4, 521) 74,39801 P-valor(F) 7,30e-50 9

Banco de dados: wage1.gdt Rode o mesmo modelo acima, mas excluindo todos controles com exceção da dummy feminino. Qual o salário hora médio dos homens? O que é o intercepto? Teste de comparação das médias 10

Modelo 2: MQO, usando as observações 1-526 Variável dependente: wage Coeficiente Erro Padrão razão-t p-valor const 7,09949 0,210008 33,8058 <0,00001 *** female -2,51183 0,303409-8,2787 <0,00001 *** Média var. dependente 5,896103 D.P. var. dependente 3,693086 Soma resíd. quadrados 6332,194 E.P. da regressão 3,476254 R-quadrado 0,115667 R-quadrado ajustado 0,113979 F(1, 524) 68,53668 P-valor(F) 1,04e-15 11

Banco de dados: GPA1.gdt Efeitos de se possuir computadores na avaliação de cursos superiores PC = 1 se o aluno tem computador em casa. hsgpa: nota no final do ensino médio ACT: nota do exame vestibular Qual o efeito sobre a nota média final prevista no curso superior? O que acontece com o efeito se retirar hsgpa e ACT? Interprete o significado do coeficiente de PC. 12

Modelo 1: MQO, usando as observações 1-141 Variável dependente: colgpa Coeficiente Erro Padrão razão-t p-valor const 1,26352 0,333126 3,7929 0,00022 *** PC 0,157309 0,0572875 2,7460 0,00684 *** hsgpa 0,447242 0,0936475 4,7758 <0,00001 *** ACT 0,00865901 0,0105342 0,8220 0,41251 Média var. dependente 3,056738 D.P. var. dependente 0,372310 Soma resíd. quadrados 15,14868 E.P. da regressão 0,332527 R-quadrado 0,219386 R-quadrado ajustado 0,202292 F(3, 137) 12,83426 P-valor(F) 1,93e-07 13

Modelo 2: MQO, usando as observações 1-141 Variável dependente: colgpa Coeficiente Erro Padrão razão-t p-valor const 2,98941 0,0395018 75,6779 <0,00001 *** PC 0,169517 0,0626804 2,7045 0,00770 *** Média var. dependente 3,056738 D.P. var. dependente 0,372310 Soma resíd. quadrados 18,43601 E.P. da regressão 0,364188 R-quadrado 0,049989 R-quadrado ajustado 0,043154 F(1, 139) 7,314107 P-valor(F) 0,007697 14

Avaliação de políticas Qual efeito de um programa econômico ou social sobre os indivíduos, empresas, etc... Dois grupos de estudo: Grupo de controle: não participa do programa Grupo de tratamento: participa do programa Escolha dos grupos de controle e tratamento não é aleatória. 15

Avaliação de políticas Definição do grupo de controle e tratamento: Grupo de Tratamento: pessoas (do público- alvo) que serão atendidas pelo projeto. Grupo de Controle: pessoas com características similares, mas que não serão atendidas pelo projeto. 16

Banco de dados. JTRAIN.GDT Efeitos da concessão de subsídios sobre as horas de treinamento Dados de 1988 indústrias de Michigan hrsemp: horas de treinamento por empregado no nível da empresa. Subs = 1 se a indústria recebeu subsídio 17

Variável dependente na forma log Regressão dos preços dos imóveis Banco de dados Hprice1.gdt Dummy colonial: igual a 1 se o imóvel tiver estilo colonial. Qual a sua interpretação? 18

Reestimar o exemplo 2 Use log(salário hora) Inclua termos quadráticos para experiência e tempo de permanência. Quanto as mulheres ganham a menos que os homens? Qual a diferença percentual exata entre homens e mulheres? 19

20

Reestimar o exemplo 2 0,297) exp( / 0,297) exp( )) / exp(log( 0,297 ) / log( 0,297 ) log( ) log( = = = = salarioh salariom salarioh salariom salarioh salariom salarioh salariom 21 0,257 1 0,297) exp( 1 0,297) exp( / = = = = salarioh salarioh salariom salarioh salariom salarioh salarioh salariom salarioh salariom

Dummies para múltiplas categorias Suponha que seus dados sejam sobre pessoas que trabalham nos setores primário, secundário e terciário da economia. Para compará-los, inclua 2 variáveis dummies: : prim = 1 se a pessoa trabalha no setor primário e = 0 caso contrário; e sec = 1 se ela trabalha no setor secundário e = 0 caso contrário. 22

Dummies para múltiplas categorias Suponha que seus dados sejam sobre pessoas que trabalham nos setores primário, secundário e terciário da economia. Para compará-los, inclua 2 variáveis dummies: : prim = 1 se a pessoa trabalha no setor primário e = 0 caso contrário; e sec = 1 se ela trabalha no setor secundário e = 0 caso contrário. 23

Categorias múltiplas (cont.) Qualquer variável expressa em categorias pode ser transformada em uma variável dummy. Como o caso base é representado pelo intercepto, se há n categorias, devem haver n 1 dummies. Se há muitas categorias, pode-se agrupar algumas delas. 24

Exemplo: Equação do log salário hora Modelo que considere as diferenças salariais entre quatro grupos: Homens casados (marrmale) Homens solteiros (grupo base) Mulheres casadas (marrfem) Mulheres solteiras (singfem) O prêmio por ser casado não é o mesmo para homens e mulheres!!! 25

Exemplo: Equação do log salário hora Lembre do grupo base!!!! As estimativas das três variáveis medem a diferença proporcional nos salários relativamente aos homens solteiros. 26

Exemplo: Equação do log salário hora Os homens casados ganham cerca de 21,3% mais que os homens solteiros. Uma mulher casada deve ganhar 19,8% a menos que um homem solteiro. Diferença proporcional estimada entre as mulheres solteiras e as casadas é (-0,110-(-0,198)) = 0,088. Mulheres solteiras ganham 8,8% a mais que as mulheres casadas. 27

Interação entre dummies Interagir dummies é como subdividir o grupo. Exemplo: ter dummies para homens assim como para prim e sec. Adicione homem*prim e homem*sec, para um total de 5 dummies e 6 categorias. O caso base é: mulher no terciário. prim é para mulheres no setor primário e sec é para mulheres no setor secundário. As interações refletem homens no primário e homens no secundário. 28

Mais sobre dummies de interação Formalmente, o modelo é y = β 0 + δ 1 homem + δ 2 prim + δ 3 sec + δ 4 homem*prim + δ 5 homem*sec + β 1 x + u. Então, por exemplo: Se homem = 0, prim = 0 e sec = 0: y = β 0 + β 1 x + u Se homem = 0, prim = 1 e sec = 0: y = β 0 + δ 2 prim + β 1 x + u Se homem = 1, prim = 0 e sec = 1: y = β 0 + δ 1 homem + δ 3 prim + δ 5 homem*sec + β 1 x + u 29

Exemplo: Outra forma de encontramos diferencias de salário entre homens casados, homens solteiros, mulheres casadas e mulheres solteiras. 30

Outras interações com dummies Podemos também interagir uma dummy, d, com uma variável contínua, x: y = β 0 + δ 1 d + β 1 x + δ 2 d*x + u. Se d = 0, então y = β 0 + β 1 x + u. Se d = 1, então y = (β 0 + δ 1 ) + (β 1 + δ 2 ) x + u. Temos uma mudança na inclinação. 31

Exemplo de δ 0 > 0 e δ 1 < 0 y y = β 0 +β 1 x d = 0 d = 1 y = (β 0 + δ 0 ) + (β 1 + δ 1 ) x x 32

Exemplo: Queremos verificar se o retorno da educação é o mesmo para homens e mulheres: δ o mede a diferença nos interceptos entre homens e mulheres δ 1 mede a diferença no retorno da educação entre homens e mulheres. interação 33

34

O retorno estimado da educação dos homens é 8,2%. Para as mulheres, o retorno é 0,082-0,0056 = 0,0764 (7,6%). Esta diferença de retorno é pouco significativa. Logo, não podemos rejeitar a hipótese nula de que o retorno para homens e mulheres é igual. 35

Teste para diferenças entre grupos Testar se uma função de regressão é diferente para um grupo em relação a outro pode ser pensado simplesmente como um teste para a significância conjunta da dummy e suas interações com todas as outras variáveis x. A hipótese nula é que os modelos não são diferentes para os grupos. Então, estimam-se os modelos com e sem todas as interações e calcula-se a estatística F. Mas quando há muitas interações, há um procedimento mais fácil. 36

Teste para diferenças entre grupos Suponha que temos dois grupos e queremos testar se interceptos e inclinações são diferentes para estes dois grupos: y = β g, 0 + β g,1. x1 + β g,2. x2 + β g,3. x3 +... + β g, k. xk + u Temos k+1 restrições. 37

O teste de Chow É possível calcular a estatística F sem estimarmos o modelo irrestrito completo. Estima-se o SQR do modelo irrestrito, estimando o modelo para cada grupo: obtenha a SQR 1 ; depois, faça o mesmo para o outro grupo e obtenha a SQR 2: Estima-se o modelo restrito considerando todos os grupos juntos e obtenha a SQR. Então: F = [ SQR ( SQR + SQR )] [ n 2( k + 1) ] SQR 1 + 1 SQR 2 2 k + 1 38

O teste de Chow (cont.) O teste de Chow é apenas um teste F usual de exclusão de variáveis, se você observar que SQR ir = SQR 1 + SQR 2. Observe que há k + 1 restrições (cada uma das inclinações e o intercepto). Observe que o modelo irrestrito estimaria dois diferentes interceptos e duas inclinações diferentes, logo temos n 2k 2 graus de liberdade no denominador. 39

Modelo de Probabilidade Linear Regressão múltipla para explicar um evento qualitativo. y é 0 ou 1. 40