LES0773 Estatística Aplicada III

Documentos relacionados
AULA 9 - MQO em regressão múltipla: Propriedades Estatísticas (Valor Esperado)

Métodos Quantitativos para Avaliação de Políticas Públicas

RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO

LES0773 Estatística Aplicada III

Aula 2 Tópicos em Econometria I. Porque estudar econometria? Causalidade! Modelo de RLM Hipóteses

AULAS 21 E 22 Análise de Regressão Múltipla: Estimação

AULAS 28 E 29 Análise de Regressão Múltipla com Informações Qualitativas

Análise Multivariada Aplicada à Contabilidade

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

AULA 1 - Modelos determinísticos vs Probabiĺısticos

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

Análise de Regressão Múltipla: Mínimos Quadrados Ordinários

Modelos de Regressão Linear Simples - parte I

CE071 - Análise de Regressão Linear

AULA 09 Análise de regressão múltipla com informações qualitativas

Regressão múltipla: Unidades de medida. Unidades de medida. Unidades de medida salário em dólares (*1000) Unidades de medida

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

AULA 4 - MQO Simples: Propriedades algébricas e Estatísticas

AULAS 17 E 18 Análise de regressão múltipla: estimação

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

UNIVERSIDADE FEDERAL DE MINAS GERAIS FACULDADE DE FILOSOFIA E CIÊNCIAS HUMANAS DEPARTAMENTO DE CIÊNCIA POLÍTICA CURSO DE GESTÃO PÚBLICA

AULA 03 Análise de regressão múltipla: estimação

Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados

Modelos de Regressão Múltipla - Parte IV

AULAS 14 E 15 Modelo de regressão simples

AULA 17 - Variáveis binárias

Regressão múltipla: problemas adicionais. Unidades de medida. Unidades de medida. Unidades de medida salário em dólares (*1000) Unidades de medida

Modelos de Regressão Linear Simples parte I

Variáveis Dummy. y = b 0 + b 1 x 1 + b 2 x b k x k + u. Econometria II - Prof. Ricardo Freguglia

Análise de Dados Longitudinais Aula

Econometria I Lista 4: Inferência

AULA 8 - MQO em regressão múltipla:

PARTE 1 ANÁLISE DE REGRESSÃO COM DADOS DE CORTE TRANSVERSAL CAPÍTULO 2 O MODELO DE REGRESSÃO SIMPLES

Instituto Superior de Economia e Gestão Universidade Técnica de Lisboa Econometria Época de Recurso 2/Julho/2013 Duração 2 horas

Aula inaugural do curso Análise de Regressão

Esse material foi extraído de Barbetta (2007 cap 13)

AULAS 14 E 15 Modelo de regressão simples

Nota de Aula: Uma Primeira Forma para se Desenvolver o Teste de F para Hipóteses sobre Combinações Linear dos Coeficientes da Regressão

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

Contabilometria. Aula 9 Regressão Linear Inferências e Grau de Ajustamento

Paulo Jorge Silveira Ferreira. Princípios de Econometria

AULA 11 Heteroscedasticidade

AULA 26 Análise de Regressão Múltipla: Problemas Adicionais

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

Nome: Número: Espaço reservado para classificações

Econometria - Lista 5

Princípios em Planejamento e Análise de Dados Ecológicos. Regressão linear. Camila de Toledo Castanho

EAE0325 Econometria II. Professora: Fabiana Fontes Rocha. Gabarito Primeira Lista Teórica de Exercícios

Estatística e Modelos Probabilísticos - COE241

Introdução ao modelo de Regressão Linear

AULA 19 E 20 Análise de Regressão Múltipla: Problemas Adicionais

REGRESSÃO E CORRELAÇÃO

Econometria. Econometria: Paradigma. Porque usar econometria? Porque usar econometria?

Análise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013

AULA 07 Análise de Regressão Múltipla: Problemas Adicionais

Análise de Regressão - parte I

Econometria. Econometria ( ) O modelo de regressão linear múltipla. O modelo de regressão linear múltipla. Aula 2-26/8/2010

AULA 2 - Regressão: Fundamentos Conceituais

CONHECIMENTOS ESPECÍFICOS

ECONOMETRIA. Prof. Danilo Monte-Mor

Instituto Superior de Economia e Gestão Universidade de Lisboa Econometria Época Normal 08/06/2017 Duração 2 horas

AULA 07 Regressão. Ernesto F. L. Amaral. 05 de outubro de 2013

Estatística. Correlação e Regressão

Homocedasticidade? Exemplo: consumo vs peso de automóveis

AULAS 20 E 21 Modelo de regressão simples

Carga Horária: 80 horas (correspondem a aulas e atividades extra-classe)

Econometria em Finanças e Atuária

Gabarito Trabalho 1. onde 1 refere-se ao salário quando a variável branco = 1. Teremos, então:

Prova de Estatística

Quiz Econometria I versão 1

IND 1115 Inferência Estatística Aula 6

Econometria - Lista 6

Regressão Linear Simples

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

Análise de Regressão Múltipla com informação qualitativa: variáveis binárias (dummy)

Estatística Aplicada

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra

AULAS 25 E 26 Heteroscedasticidade

Regressão linear múltipla. Regressão linear múltipla

Exercícios Selecionados de Econometria para Concursos Públicos

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Nome: Turma: Processo

Delineamento e Análise Experimental Aula 4

Licenciaturas em Economia e em Finanças Econometria ER 26/06/2015 Duração 2 horas

Análise estatística multivariada

Econometria. Regressão Linear Simples Lista de Exercícios

Econometria Lista 1 Regressão Linear Simples

Aplicação da análise de regressão na contabilidade do custo de produção do milho

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Análise de Dados Longitudinais Modelos de Regressão - Perspecitva Histórica

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt

AULA 07 Inferência a Partir de Duas Amostras

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

Comparando equações de regressão em dados de saúde

Determinantes macroeconômicos da taxa Selic: um estudo econométrico no período de 1994 a 2014.

Transcrição:

LES0773 Estatística Aplicada III Prof. Luciano Rodrigues Aula 4 Departamento de Economia, Administração e Sociologia Escola Superior de Agricultura Luiz de Queiroz-ESAQ Universidade de São Paulo-USP lurodrig2209@gmail.com Material de apoio aos alunos do curso de Administração de Empresas. Proibida a reprodução sem autorização prévia do autor Última atualização: 18/03/2017. Prof. Luciano Rodrigues LES0773 Estatística Aplicada III

Conteúdo 2 / 30

Para responder o exercício, utilizar a base de dados disponível no Stoa. Uma rede de loja de departamento está avaliando a possibilidade de ampliação de uma de suas unidades. Para uma análise adequada, o diretor de planejamento precisa comparar o valor que será pago por m 2 de aluguel com a estimativa de aumento do lucro associado à ampliação da área da loja. Pergunta a ser respondida: O valor que será pago pelo aluguel é superior ao aumento esperado no lucro? Valor do aluguel = R$ 530/m 2 3 / 30

Para responder o questionamento do diretor, um analista reuniu informações das 31 lojas da rede e estimou o seguinte modelo de regressão: lucro = β 0 + β 1 area + ɛ (1) a) A partir dessa estrutura, estimar os parâmetros do modelo no R. Baseado nas ténicas apresentadas nas aulas anteriores, você se posicionaria a favor ou contrário ao aumento da área da loja? 4 / 30

Ao apresentar a análise, o Diretor verificou que boa parte das maiores lojas da rede estavam localizadas em shoppings. Nesse sentido, questionou o desempenho superior não estaria associado à localização de cada unidade e não ao tamanho da sua área. b) Como o analista poderia incorporar essa informação na análise? c) A partir dessa nova informação, a indicação sobre a ampliação da loja seria alterada? 5 / 30

Por fim, analista foi questionado se a conclusão obtida não estaria equivocada. Isso porque usualmente as lojas maiores da rede estavam localizadas em regiões de maior renda, dessa forma, o aumento nas vendas e, consequentemente, nos lucros estaria associado à renda dos clientes e não a maior área das lojas. Para avaliar o questionamento, o analista estruturou um novo modelo dado por: lucro = β 0 + β 1 area + β 2 shopping + β 3 renda + ɛ (2) d) A partir dessa estrutura, qual seria o seu posicionamento sobre o problema? 6 / 30

Em geral, é bastante fácil incorporar muitas formas de não linearidades na análise de regressão ao definir apropriadamente as variáveis dependentes e independentes. Observe-se que aqui estamos falando apenas sobre a não linearidade nas variáveis do modelo, o que não guarda nenhuma relação com a não linearidade nos parâmetros. 7 / 30

Não linearidade na regressão O quadro abaixo sumariza quatro combinações de formas funcionais construídas a partir da variável original ou de seu logaritmo natural. 8 / 30

Não linearidade na regressão Para exemplificar, vamos utilizar o exercício sobre gastos fora do domicílio. 9 / 30

Variáveis binárias Uma variável binária (também chamada variável dummy) é aquela que só tem dois valores distintos, geralmente zero ou um. 10 / 30

Utilidade de variáveis binárias As variáveis binárias permitem incluir variáveis qualitativas (também chamadas variáveis categóricas) em um modelo de regressão, tais como, sexo e cor. Outros exemplos de variáveis qualitativas comumente importantes na modelagem econométrica são: classe social, setor de atividade econômica, região, nível de escolaridade e estações do ano. 11 / 30

Utilidade de variáveis binárias As variáveis binárias nos permitem especificar modelos em que alguns ou todos os parâmetros do modelo de regressão, inclusive o intercepto, variam para algumas observações da amostra. Isso permite controlar e testar efeitos importantes nas análises econômicas. Podemos incluir no modelo quantas variáveis binárias de intercepto quisermos e/ou quantas variáveis binárias de interação (também chamada de variáveis binárias de inclinação) forem necessárias para uma especificação robusta. 12 / 30

Nota importante Tenha sempre em mente que o modelo usual de regressão não permite que a variável dependente, y, seja binária. Há, porém, métodos especiais para analisar variáveis depedentes binárias. Em cursos mais avançados comumente são vistos os modelos logit e probit. 13 / 30

Definindo uma variável binária Ao definir uma variável binária, devemos decidir ao qual evento é atribuído o valor um e ao qual é atribuído o valor zero. Por exemplo, em um estudo para prever o nível de vendas em diferentes lojas de uma determinada rede, podemos definir a variável shopping para ser uma variável binária assumindo valor um para as lojas localizadas em shoppings e valor zero para as unidades com instalações em outros locais. 14 / 30

Definindo uma variável binária No exemplo apresentado, podemos utilizar o seguinte modelo para realizar previsões sobre as vendas anuais das diferentes lojas: vendas = β 0 + δ 0 shopping + β 1 renda + u, (3) com u N(0, σ 2 ). Para avaliar os resultados obtidos, vamos estimar o referido modelo utilizando os dados do arquivo vendas.csv disponível no Stoa. 15 / 30

No modelo (3), apenas dois fatores afetam as vendas: a renda dos clientes e a localização da loja. Logo, uma vez que shopping = 1 se a loja está localizada em um shopping center e shopping = 0 se ela está instalada em outro local, o parâmetro δ 0 tem a seguinte interpretação: δ 0 é a diferença de vendas entre as lojas localizadas dentro e fora dos shoppings. Portanto, o coeficiente se δ 0 < o diferencial de aluguel dentro e fora dos shoppings, então, não valeria a pena instalar a loja dentro de um shopping. 16 / 30

Assumindo a hipótese crucial do MLC de média condicional zero, E(u shopping, renda), podemos escrever δ 0 = E(vendas shopping = 1, renda) E(salario shopping = 0, renda). (4) 17 / 30

O ponto aqui é que o nível de vendas é igual em ambas as esperanças condicionais; a única diferença, δ 0, é devida somente a localização da loja. Essa situação pode ser representado graficamente como uma mudança de intercepto na reta de regressão. 18 / 30

As retas de regressão de MQO para lojas dentro e fora dos shoppings são paralelas porque estamos assumindo que a diferença nas vendas não depende da renda. Observe que, em (3), o intercepto para lojas fora de shoppings é β 0, e o intercepto para as revendas em shopping é β 0 + δ 0. 19 / 30

Obviamente, após estimar o modelo (3) desejaremos testar se, de fato, há diferença nas vendas entre as lojas localizadas dentro e fora do shopping. Aplica-se o teste t usual para testar hipótese nula contra a hipótese alternativa H 0 : δ 0 = 0 (5) H 1 : δ 0 0. (6) 20 / 30

Variáveis qualitativas com mais de duas categorias Observe que no exemplo anterior há penas dois grupos distintos para a variável controlada. Logo, precisamos apenas dois interceptos diferentes. Isso significa que, além de β 0, precisamos usar apenas uma variável binária; o uso de duas variáveis binárias causaria colinearidade perfeita no modelo. 21 / 30

Variáveis qualitativas com mais de duas categorias Vamos admitir que uma variável nominal tenha m categorias. Logo, precisamos de apenas m 1 variáveis binárias para distinguir as m categorias. Por exemplo, consideremos a definição de 2 binárias denotadas por d δ (δ = 1, 2) para distinguir 3 municípios distintos, adotando o município 1 como base. Região d 1 d 2 Município 1 0 0 Município 2 1 0 Município 3 0 1 22 / 30

Variáveis qualitativas com mais de duas categorias Consideremos o modelo populacional vendas = β 0 + β 1 renda + β 2 area l oja + δ 1 d 1 + δ 2 d 2 + u. (7) com u N(0, σ 2 ). 23 / 30

Variáveis qualitativas com mais de duas categorias A partir do modelo (7) temos que = β 0 + β 1 x 1 quando for Município 1 = (β 0 + δ 1 ) + β 1 x 1 quando Município 2 E(y) = (β 0 + δ 2 ) + β 1 x 1 quando Município 3 (8) (9) 24 / 30

Variáveis binárias de interação ou inclinação Para exemplificar, vamos utilizar o arquivo vendas-dummies.csv no Stoa. 25 / 30

Variáveis binárias de interação ou inclinação Vamos adimitir que estamos analisando a relação entre duas variáveis (y e x) e temos duas situações distintas (dois períodos, duas regiões, sexo ou duas categorias quaisquer). Deixaremos d ser uma variável binária para distinguir as duas situações, em que d = 0 para as observações da situação 1 e d = 1 para as observações da situação 2. 26 / 30

Variáveis binárias de interação ou inclinação Admitindo que tanto o intercepto como a inclinação da relação entre x e y (por exemplo, respectivamente, consumo.etanol e preço.hidratado/gasolina) sejam diferentes nas duas situações com características distintas, um modelo apropriado para controlar e/ou testar essa mudança estrutural é consumo.hidratado = α+β paridade.preço+δ 1 d+δ 2 d paridade. (10) com u N(0, σ 2 ). 27 / 30

Variáveis binárias de interação ou inclinação Na situação 1, com d = 0, a relação entre x e y é E(consumo) = α + β paridade.preço, (11) e na situação 2, com d = 1, a relação fica E(consumo) = (α + δ 1 ) + (β + δ 2 ) paridade.preço. (12) 28 / 30

Variáveis binárias de interação ou inclinação Para exemplificar, vamos utilizar o arquivo etanol-dummy-inclinacao.csv no Stoa. 29 / 30

Leitura indicada 1. Hoffmann, R. Análise de Regressão: Uma Introdução à Econometria, 4 a Edição. Hucitec, 2006 (Capítulo 5). 2. Hair et al. Análise Multivariada de Dados, 6 a Edição. Bookman, 2009 (Capítulo 4). 30 / 30