AULAS 25 E 26 VARIÁVEIS INSTRUMENTAIS

Documentos relacionados
Variáveis Instrumentais

AULAS 01, 02 E 03 CAUSALIDADE

AULA 17 MÉTODO DE DIFERENÇA EM DIFERENÇAS

AULAS 04, 05 E 06 AVALIAÇÃO UTILIZANDO EXPERIMENTOS

Econometria para Avaliação de Políticas Públicas

AULAS 21 E 22 Análise de Regressão Múltipla: Estimação

AULAS 20 E 21 ESCORE DE PROPENSÃO DE PAREAMENTO

Análise de Causalidade e o Problema da Avaliação de Impacto

Técnicas econométricas para avaliação de impacto O uso de algoritmos de emparelhamento baseados em escore de propensão propensity score matching

AULAS 17 E 18 Análise de regressão múltipla: estimação

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

Avaliação experimental

O uso de algoritmos de emparelhamento - matching

AULA 29 Aplicação do método de diferença em diferenças

AULAS 14 E 15 Modelo de regressão simples

Variáveis Instumentais. Raphael Corbi. Universidade de São Paulo. Agosto 2017

Validação Externa e Expansão do Programa

Linha Técnica Sessão VI Métodos de Homogeneização

AULA 9 - MQO em regressão múltipla: Propriedades Estatísticas (Valor Esperado)

AULAS 14 E 15 Modelo de regressão simples

Endogeneidade, Variáveis Instrumentais e Modelos de Equações Estruturais

AULA 03 Análise de regressão múltipla: estimação

Objetivos. Ao final desse grupo de slides os alunos deverão ser capazes de:

Linha Técnica Sessão I: Inferência Causal

Outras Técnicas que Utilizam o Escore de Propensão

Econometria para Avaliação de Políticas Públicas

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

MÉTODOS QUANTITATIVOS APLICADOS À AVALIAÇÃO DE POLÍTICAS PÚBLICAS USANDO STATA. Prof. Leonardo Sangali Barone

Aula 2 Tópicos em Econometria I. Porque estudar econometria? Causalidade! Modelo de RLM Hipóteses

Econometria para Avaliação de Políticas Públicas

variável dependente natureza dicotômica ou binária independentes, tanto podem ser categóricas ou não estimar a probabilidade associada à ocorrência

Estimação de Efeito Causal

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.

Estimação de Variáveis Instrumentais e Mínimos Quadrados de Dois Estágios. Wooldridge, Cápítulo 15

Análise de Dados Longitudinais Aula

Paulo Jorge Silveira Ferreira. Princípios de Econometria

Metodologias causais para estudos observacionais

Correlação e Regressão

25 de junho de 2015 EFEITO MÉDIO DO TRATAMENTO (ATE): MÉTODOS PARA ESTIMAÇÃO E APLICAÇÕES EM ANÁLISE DE CAUSALIDADE. Gabriel Leite Mariante

Análise de Regressão Linear Múltipla III

AULA 13 Análise de Regressão Múltipla: MQO Assimptótico

AULAS 28 E 29 Análise de Regressão Múltipla com Informações Qualitativas

Variáveis Instrumentais

Introdução ao modelo de Regressão Linear

Monitoria Econometria II REC o Semestre 2015 Monitor(a):Victória Mazás Martinez 1 a Lista de exercícios

RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO

AULA 8 - MQO em regressão múltipla:

Técnicas econométricas para avaliação de impacto O uso de métodos de regressão e introdução aos métodos de diferençasdas-diferenças

Análise Multivariada Aplicada à Contabilidade

AULA 09 Análise de regressão múltipla com informações qualitativas

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

PARTE 1 ANÁLISE DE REGRESSÃO COM DADOS DE CORTE TRANSVERSAL CAPÍTULO 2 O MODELO DE REGRESSÃO SIMPLES

Econometria. Regressão Linear Simples Lista de Exercícios

Técnicas computacionais em probabilidade e estatística II

Quiz Econometria I versão 1

Aula 2 Uma breve revisão sobre modelos lineares

Análise Multivariada Aplicada à Contabilidade

Centro Internacional de Pobreza (PNUD/IPEA) Fabio Veras Soares. Estimação do Impacto de Múltiplos Tratamentos e do. Escore de Propensão Generalizado

Distribuição de Probabilidade de Poisson

AULA 11 Heteroscedasticidade

AULA 07 Regressão. Ernesto F. L. Amaral. 05 de outubro de 2013

Gabarito Trabalho 1. onde 1 refere-se ao salário quando a variável branco = 1. Teremos, então:

Econometria. Econometria MQO MQO. Resíduos. Resíduos MQO. 1. Exemplo da técnica MQO. 2. Hipóteses do Modelo de RLM. 3.

EAE0325 Econometria II. Professora: Fabiana Fontes Rocha. Gabarito Primeira Lista Teórica de Exercícios

AULA 17 - Variáveis binárias

Gabarito - Lista 5 - Questões de Revisão

Correlação e Regressão Linear

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

Capítulo 3. O Modelo de Regressão Linear Simples: Especificação e Estimação

7 Testes de Robustez. 7.1 Efeito sobre os alunos não beneficiados

diferença não aleatória na distribuição dos fatores de risco entre os dois grupos

4 Modelos de Regressão Dinâmica

Um estudo sobre retorno em escolaridade no Brasil

CONHECIMENTOS ESPECÍFICOS

Econometria na prática. Organizadoras Cláudia Malbouisson Gisele F. Tiryaki

Ralph S. Silva

Estatística e Modelos Probabilísticos - COE241

Regressão com Descontinuidade - RDD

Monitoria Econometria II REC o Semestre 2015 Monitor(a):Victória Mazás Martinez 3 a Lista de exercícios - Dados em painel

Análise de Regressão Múltipla: Mínimos Quadrados Ordinários

3. METODOLOGIA Modelo geral para avaliação de impacto

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

Análise de Regressão Prof. MSc. Danilo Scorzoni Ré FMU Estatística Aplicada

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

Métodos Quantitativos para Avaliação de Políticas Públicas

O PROBLEMA DAS VARIÁVEIS OMITIDAS E VARIÁVEIS REVERSAS EM PESQUISAS

Avaliação de impacto de políticas públicas

Econometria Lista 1 Regressão Linear Simples

Modelos de Regressão Linear Simples - parte I

Modelos de Regressão Linear Simples - Análise de Resíduos

Análise de Regressão Linear Simples e

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão.

Transformações e Ponderação para corrigir violações do modelo

Modelos de Regressão Linear Simples - Análise de Resíduos

Análise de Regressão - parte I

AULA 01 Principais Conceitos em Econometria

Modelos de Regressão Linear Simples parte I

CONHECIMENTOS ESPECÍFICOS

Transcrição:

1 AULAS 25 E 26 VARIÁVEIS INSTRUMENTAIS Ernesto F. L. Amaral 11 e 13 de junho de 2013 Técnicas Avançadas de Avaliação de Políticas Públicas (DCP 098) Fonte: Curso Técnicas Econométricas para Avaliação de Impacto do International Policy Centre for Inclusive Growth (IPC-IG) da United Nations Development Programme (UNDP) (http://www.ipc-undp.org/evaluation).

CORRELAÇÃO NÃO IMPLICA CAUSALIDADE 2 No mundo real, por trás de uma correlação entre Y e X, podemos ter a seguinte situação: X, Y, W e Z são variáveis observáveis e u e v representam características nãoobserváveis. A omissão da variável W pode não ser um problema, pois ela representa uma das formas na qual X causa Y e isso pode não ser de interesse do pesquisador.

VARIÁVEIS OMITIDAS 3 Se existe um Z que causa Y e este Z não está incluído no modelo, Z causa u. Se Z também causa X, u estará correlacionado com X. Intuitivamente, Z impõe um nível para X e outro para Y. A conseqüência é uma associação entre X e Y que não é necessariamente derivada de uma causalidade entre X e Y. A direção do viés depende se os efeitos de Z sobre X e Y são positivos ou negativos.

CAUSALIDADE REVERSA 4 Como no caso de variáveis omitidas, a causalidade reversa resulta em correlação de X com termo de erro (u). Relembremos as soluções para variáveis omitidas: 1) Coletar informações adicionais: Causalidade reversa não pode ser solucionada com coleta adicional de dados no decorrer do tempo. 2) Manipular variáveis independentes (X): Possível de ser aplicado para causalidade reversa. 3) Modelar correlação entre termos de erro: Causalidade reversa não pode ser solucionada com esta modelagem, porque viés ocorre mesmo se termos de erro não estão correlacionados entre as equações.

VARIÁVEL INSTRUMENTAL (INSTRUMENTAL VARIABLE IV) Manipular as variáveis independentes (X) de forma que seus efeitos sobre a variável dependente (Y) não estejam sendo influenciados por outras variáveis não observadas. Método de manipular X ao identificar um instrumento (I) que seja correlacionado com X, mas que não tenha efeito direto sobre Y, além das mudanças induzidas em X. 5 Pressuposto é que I afeta X, mas não está correlacionado com u, o que é difícil de verificar.

DIFÍCIL IMPLEMENTAÇÃO DE INSTRUMENTO 6 É difícil identificar variáveis que afetam X, mas que não afetam Y. Há um fator determinando a variável de tratamento (D) que também determina Y ou é determinado por Y: Y = β 0 + β k X k + αd + v E(v) = 0 Cov(X k, v) = 0 Cov(D, v) 0 Basicamente, o método de variável instrumental busca eliminar do modelo essa correlação. Esse método é bastante empregado em casos de omissão de variáveis e erros de medida. Utiliza-se um instrumento (variável instrumental): I.

EXEMPLO DE PROBLEMA DE ENDOGENEIDADE (SALÁRIO E EDUCAÇÃO) Maior escolaridade aumenta rendimentos salariais. 7 O problema é que a habilidade determina o salário, assim como pessoas mais habilidosas procuram mais educação. Incluir ocupação na equação salarial? Pode haver correlação espúria entre ocupação e salário.

PRESSUPOSTOS 8 Nas estimativas dos escores de propensão de pareamento, tínhamos alguns pressupostos importantes (SUTVA; e independência da média condicional). Na definição de variável instrumental, I satisfaz dois pressupostos (restrição de exclusão; e correlação de I e D é diferente de zero). Temos que lidar com estes pressupostos: SUTVA. Restrição de exclusão. Monotonicidade. Correlação de I e D é diferente de zero.

SUTVA 9 Rubin (1986) aponta que uma condição necessária para identificação de um contrafactual é a Suposição de Valor Estável da Unidade de Tratamento (Stable-Unit- Treatment-Value Assumption, SUTVA). O fato de uma unidade receber o tratamento não afeta o resultado potencial de uma unidade que não o recebeu. Quando exposto a um tratamento (D), pressuposto é que o resultado Y de um indivíduo será o mesmo, não importando o mecanismo de seleção e o tratamento das outras unidades: Y(0) D SUTVA pode ser violado quando existem outras versões não representadas de tratamento ou quando há interação entre os indivíduos. SUTVA: suposição de não-confundimento/ignorabilidade.

NEGLIGENCIANDO FATORES NÃO-OBSERVÁVEIS 10 Negligenciar fatores não-observados significa supor que os mesmos não possuem efeito sobre a diferença nos possíveis resultados para um mesmo indivíduo. Isto também pode ser chamado de seleção sobre variáveis observáveis. Uma condição necessária para a identificação de causalidade em um modelo de seleção sobre variáveis observáveis (X) é uma versão condicional da SUTVA, onde: Y(0) D X Isso implica uma independência condicional de Y(0) e o tratamento.

INDEPENDÊNCIA DA MÉDIA CONDICIONAL 11 Há ainda a suposição de independência da média condicional. O valor de Y é semelhante entre o grupo de tratamento (D=1) e o grupo de controle (D=0), controlando pelos valores de X: E[Y(0) D=1, X] = E[Y(0) D=0, X ] = E[Y(0) X ] Além disso, é necessário que para cada valor de X, existe tanto um caso tratado pela política (D=1) quanto um caso não-tratado (D=0): 0 < Pr(D=1 X) < 1

MAIS PRESSUPOSTOS 12 O pressuposto de SUTVA leva a outros pressupostos também necessários, os quais são mais difíceis de satisfazer (Holland, 1986): Estabilidade temporal e transitoriedade causal. Homogeneidade das unidades investigadas. Independência do tratamento. Efeito constante.

RESTRIÇÃO DE EXCLUSÃO 13 I é a variável de designação do tratamento, aleatoriamente distribuída na população (é a intenção do tratamento). Os efeitos médios de D (variável de tratamento) sobre Y (variável de interesse) são os mesmos para os dois tipos de indivíduos determinados por I (variável instrumental). Pressuposto não testável diretamente, uma vez que está baseado em um contrafactual.

RESTRIÇÃO DE EXCLUSÃO D (variável de tratamento) & I (variável instrumental). I = 1 para o indivíduo elegível. I = 0 para o indivíduo não elegível. Se todos os elegíveis recebem o tratamento, I = D. No entanto, esse é o caso ideal. Na realidade, temos quatro tipos de indivíduos: 14 Não elegível Elegível I=1; D=0 I=1; D=1 I=0; D=0 Never-taker Complier I=0; D=1 Defier Always-taker Compliers: indivíduos que mudam de comportamento influenciados pelo instrumento.

MONOTONICIDADE 15 Há uma monotonicidade do efeito de I sobre D para todos indivíduos. Essa é uma restrição não verificável, mas bastante plausível. Alternativamente, poderia ser assumido efeito de tratamento constante para todos os indivíduos. Ou seja, há a restrição da possibilidade de heterogeneidade.

CORRELAÇÃO DE I E D É DIFERENTE DE ZERO 16 Há suposição de que corr(i,d) 0. Basicamente, essa suposição diz que I apresenta um efeito sobre D. Dessa forma, I também afeta Y, mas apenas indiretamente, via D. Isto é, pode-se definir um efeito médio causal de I sobre D: E[D(I=1) D(I=0)]

VIOLAÇÃO DE PRESSUPOSTOS 17 SUTVA: se a variável de interesse de um indivíduo é afetada pela condição de tratamento das demais pessoas ou por algum outro tratamento que ocorre ao mesmo tempo, não podemos identificar o contrafactual (Rubin, 1986). Restrição de exclusão: quanto maior a correlação entre I e D, isto é, quanto mais forte o instrumento, menos sensível é o estimador à violação da restrição de exclusão. Porém, quanto maior o efeito de I sobre Y, maior o viés do efeito do tratamento.

VIOLAÇÃO DE PRESSUPOSTOS 18 Monotonicidade: mesmo se a proporção de defiers for baixa (indivíduos que mudam de comportamento influenciados pelo instrumento de forma negativa), o viés pode ser alto, caso o instrumento seja fraco. Se o efeito médio do tratamento para compliers e defiers é o mesmo, então a violação da monotonicidade não produz viés. corr(i,d) = 0: não há identificação do efeito do tratamento, uma vez que I não representa um instrumento.

VIÉS E PROCURA DE SOLUÇÃO 19 Na estimação do efeito de políticas públicas, o viés pode aparecer em dois casos: Variável omitida que determina D e Y (seleção sobre observáveis). Fatores não observáveis que determinam D e Y (seleção sobre não observáveis). No segundo caso, há abandono do pressuposto de independência da média condicional. Em outras palavras, P(D=1 Y,X) P(D=1 X) = p(x). Para contornar o problema, a ideia é retirar de u o componente correlacionado com v. É possível aplicar variável instrumental, Heckman, diferenças em diferenças, modelos estruturais...

EQUAÇÕES SIMULTÂNEAS 20 É possível realizar estimação simultânea do modelo de auto-seleção amostral (X) e da equação da variável dependente principal (Y), utilizando estimador de máxima verossimilhança (maximum likelihood estimator). Este tipo de modelagem é chamado de informação completa de máxima verossimilhança (full information maximum likelihood FIML). A variável X pode ser dicotômica ou contínua. Esse modelo utiliza o pressuposto de distribuição conjunta dos termos de erro (v, u).

MODELOS MULTIVARIADOS 21 Utilização de modelos multivariados com variáveis instrumentais (I) e outras variáveis independentes (R) para explicar X, com erro aleatório (v): Valores preditos de X: X = Rγ + Iα + v X predito = Rγ* + Iα* O erro aleatório (v) não aparece acima porque há o pressuposto que tenha média zero [E(v)=0]. O valor predito de X não tem o problema de correlação entre os erros aleatórios (v, u) das equações de X e Y. O valor predito de X é usado para estimar o efeito causal (β) em Y, em procedimento chamado de dois estágios de mínimos quadrados (two-stage least squares 2SLS).

LIDANDO COM CAUSALIDADE REVERSA 22 Por não ser causada pela omissão de variáveis, um modelo de efeitos fixos não corrige este tipo de viés. Precisamos manipular as variáveis independentes, com experimento ou variáveis instrumentais. Quando os termos de erro (v, u) não são correlacionados, um parâmetro β consistente é estimado por meio de modelos com duas equações (2SLS). Quando os termos de erro (v, u) são correlacionados, é preciso estimar um modelo de três estágios de mínimos quadrados (three-stage least squares 3SLS): Os dois primeiros estágios corrigem o viés em β. O terceiro estágio corrige os erros padrão dos coeficientes, ao considerar a correlação entre os termos de erro (v, u).

LATE 23 Há um Efeito de Tratamento Médio Local (Local Average Treatment Effect, LATE): E[Y 1 Y 0 D(1) D(0) = 1] = E[Y(1,D(1)) Y(0,D(0))] / E[D(1) D(0)] LATE representa o impacto sobre os compliers, não sendo, em geral, representativo do efeito sobre todos os tratados. LATE = ATE = ATT se o efeito de tratamento é homogêneo. Importante: não podemos identificar o grupo dos compliers, ou seja, os indivíduos que mudam de comportamento influenciados pelo instrumento.

ATE 24 ATE: supondo ausência de heterogeneidade do impacto, os mínimos quadrados ordinários em dois estágios (MQ2E) produzem resultados consistentes e eficientes. No entanto, há controvérsia sobre a melhor maneira de estimar o primeiro estágio. É possível estimar duas regressões lineares. Também é possível estimar uma regressão de estimação de probabilidade (logística ou probit) e depois uma regressão linear: P(D=1 X, I) Y = β 0 + β k X k + αd + u

EFEITO DE TRATAMENTO MARGINAL 25 O efeito de tratamento marginal (marginal treatment effect, MTE) pode ser estimado de diferentes formas. LATE (efeito de tratamento médio local) é igual ao valor esperado do MTE, para o intervalo de I, em que a taxa de participação é diferente. ATE (impacto médio do tratamento sobre a população como um todo) é igual ao valor esperado de MTE, incluindo todos os indivíduos. ATT (impacto médio do tratamento sobre o grupo de tratamento) é igual ao valor esperado de MTE, excluindo os indivíduos que não participam do tratamento.

ESTIMAÇÃO DE LATE, ATE E ATT 26 LATE: Y = δ + αd + u, usando I como instrumento. ATE incluindo interações, além dos instrumentos na primeira equação. As médias das variáveis (X-barra) consideram os valores de todos indivíduos da amostra (tratamento e controle): P(D=1 X,I) Y = β 0 + β k X k + αd + D(X X-barra)δ + u ATT incluindo interações, além dos instrumentos na primeira equação. As médias das variáveis (X-barra) consideram somente os valores do grupo de tratamento.

ALEATORIZAÇÃO E VARIÁVEL INSTRUMENTAL 27 Tanto a aleatorização da eligibilidade ao tratamento, quanto a aleatorização da participação dentre os elegíveis garante que as mesmas não sejam correlacionadas com fatores pessoais ou sociais. Portanto, tratados e controles não apresentam diferenças, na média, nas características não observáveis. ATE = ATT quando: Não há heterogeneidade. Há heterogeneidade, mas há aleatorização da participação.

ESCORE DE PROPENSÃO E VARIÁVEL INSTRUMENTAL 28 Método do escore de propensão (propensity score) pode ser considerado um caso especial do método de variável instrumental (Ichimura e Taber, 2001) com estes pressupostos: Independência condicional [resultado de Y de um indivíduo será o mesmo, não importando o tratamento (D) e outras variáveis observáveis (X)]: Y 1,Y 0 D X Suporte comum: 0 < p(x) <1 Podemos assumir que a variável de tratamento (D) é uma restrição de exclusão em E[Y i X]. Na presença de um instrumento (I), pode-se assumir que o tratamento é um caso especial quando todos os indivíduos são compliers (I = D).

ESTIMAÇÃO COMO ESCORE DE PROPENSÃO 29 Regressão com tratamento (D) como variável dependente e estima-se valor predito (p1). Regressão com valor predito (p1) como variável dependente e estima-se novo valor predito (p1a). Regressão com valor predito (p1) ao quadrado como variável dependente e estima-se novo valor predito (p1b). Regressão com variável de interesse (Y) como variável dependente, usando os valores preditos (p1, p1a, p1b) como independentes.

CONSIDERAÇÕES 30 Utilização de variável instrumental é um método promissor teoricamente, mas pode frustrar na prática. Há problema de eficiência em pequenas amostras (relacionado à estimação do erro padrão), o qual deve ser corrigido. Há sensibilidade do LATE ao instrumento.