Avaliação experimental

Documentos relacionados
AULAS 04, 05 E 06 AVALIAÇÃO UTILIZANDO EXPERIMENTOS

Validação Externa e Expansão do Programa

Variáveis Instrumentais

RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO

Econometria para Avaliação de Políticas Públicas

AULAS 25 E 26 VARIÁVEIS INSTRUMENTAIS

Centro Internacional de Pobreza (PNUD/IPEA) Fabio Veras Soares. Estimação do Impacto de Múltiplos Tratamentos e do. Escore de Propensão Generalizado

AULAS 21 E 22 Análise de Regressão Múltipla: Estimação

Técnicas econométricas para avaliação de impacto O uso de métodos de regressão e introdução aos métodos de diferençasdas-diferenças

Análise de Dados Longitudinais Aula

Aula 2 Uma breve revisão sobre modelos lineares

Outras Técnicas que Utilizam o Escore de Propensão

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

Análise Multivariada Aplicada à Contabilidade

AULAS 20 E 21 ESCORE DE PROPENSÃO DE PAREAMENTO

Endogeneidade, Variáveis Instrumentais e Modelos de Equações Estruturais

AULAS 17 E 18 Análise de regressão múltipla: estimação

Métodos Quantitativos para Avaliação de Políticas Públicas

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

RESOLUÇÃO Nº 01/2016

Resultados possíveis do nosso estudo

AULA 11 Heteroscedasticidade

AULA 9 - MQO em regressão múltipla: Propriedades Estatísticas (Valor Esperado)

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

O uso de algoritmos de emparelhamento - matching

Quiz Econometria I versão 1

Correlação e Regressão

Estatística e Modelos Probabilísticos - COE241

Ralph S. Silva

Aula 3 - Revisão de Probabilidade e Estatística: Esclarecimento de Dúvidas

AULA 03 Análise de regressão múltipla: estimação

AULA 03 Estimativas e tamanhos amostrais

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

Econometria - Lista 6

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão.

Inferência estatística

Técnicas econométricas para avaliação de impacto O uso de algoritmos de emparelhamento baseados em escore de propensão propensity score matching

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Delineamento e Análise Experimental Aula 3

PESQUISA CAUSAL: Experimentação

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

4 Modelos de Regressão Dinâmica

Monitoria Econometria II REC o Semestre 2015 Monitor(a):Victória Mazás Martinez 3 a Lista de exercícios - Dados em painel

Modelo de Regressão Múltipla

Avaliação de Desempenho de Sistemas Discretos

Aula 2 Tópicos em Econometria I. Porque estudar econometria? Causalidade! Modelo de RLM Hipóteses

Estimação de Efeito Causal

Análise Multivariada Aplicada à Contabilidade

AULA 13 Análise de Regressão Múltipla: MQO Assimptótico

A Importância do Desenho Amostral. Donald Pianto Departamento de Estatística UnB

Prova de Estatística

Planejamento e pesquisa

Arianna Legovini Head, Development Impact Evaluation Initiative (DIME) World Bank. O Uso de Avaliações Aleatoria para Melhorar Políticas e Programas

Modelos de Regressão Linear Simples - parte I

Estatística e Modelos Probabilísticos - COE241

CURSO AVANÇADO EM AVALIAÇÃO QUANTITATIVA [112 horas]

Estimação e Testes de Hipóteses

Econometria para Avaliação de Políticas Públicas

ALEATORIZAÇÃO FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E CONTABILIDADE DE RIBEIRÃO PRETO UNIVERSIDADE DE SÃO PAULO

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Métodos Quantitativos Aplicados

AULA 07 Inferência a Partir de Duas Amostras

AULA 8 - MQO em regressão múltipla:

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

David Evans, Banco Mundial Baseado em slides de Esther Duflo (J-PAL) e Jed Friedman (Banco Mundial) Tamanho da amostra para avaliações de impacto

PESQUISA EM MERCADO DE CAPITAIS. Prof. Patricia Maria Bortolon, D. Sc.

Coeficiente de determinação R 2 no modelo de regressão linear normal

CONHECIMENTOS ESPECÍFICOS

Por que aleatorizar? Cecilia Machado FGV-EPGE Abdul Latif Jameel Poverty Action Lab.

Arianna Legovini Head, Development Impact Evaluation Initiative (DIME) World Bank. O Uso de Avaliações Aleatoria para Melhorar Políticas e Programas

DELINEAMENTO EXPERIMENTAL [1]

Exercícios Selecionados de Econometria para Concursos Públicos

Planejamento de Experimentos Introdução - Teste t

AULAS 14 E 15 Modelo de regressão simples

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

Modelos de Regressão Linear Simples - parte II

Testes de Hipóteses Paramétricos

LES0773 Estatística Aplicada III

Razão para rejeitar H 0

Testes de Hipóteses Paramétricos

AULAS 25 E 26 Heteroscedasticidade

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Modelos de Regressão Linear Simples - parte III

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Análise de Regressão Múltipla: Mínimos Quadrados Ordinários

MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL

Modelos de Regressão Linear Simples parte I

ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa

Inferência Estatística:

Gabarito - Lista 5 - Questões de Revisão

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS

CORRELAÇÃO. Flávia F. Feitosa

Transcrição:

Técnicas Econométricas para Avaliação de Impacto Avaliação experimental Fabio Veras Soares Centro Internacional de Pobreza (IPEA/PNUD) Brasília, 16 de abril de 2008.

Introdução: como aleatorização resolve o problema do viés de seleção. Como vimos na aula 1, o problema fundamental da avaliação de impacto é que a unidade de observação (indivíduo, família, firma, pais) não é observada simultaneamente em dois estados. Sinteticamente pode-se definir a variável de interesse, Y, como: Y dy d Y = 1 + (1 ) 0, onde d=1 indica que o indivíduo foi tratado e d=0 que não foi tratado. Neste caso, o impacto (ganho) em participar do programa é dado por: = Y Y 1 0

A variável Y pode ser definida como uma função de variáveis observáveis e de um componente não observável: Y = g ( X ) + U 1 1 1 Y = g ( X ) + U 0 0 0 Onde EU ( 1) = EU ( 0) = 0 Neste caso, o efeito médio do tratamento sobre os tratados (ATT) pode ser escrito como: EY ( 1 Y0 X, d= 1) = E( X, d= 1) = g ( X) g ( X) + E( U U X, d = 1) 1 0 1 0 e o efeito médio do tratamento (ATE):

EY ( 1 Y0 X) = E( X) = g ( X ) g ( X) + E( U U X) 1 0 1 0 O ganho (impacto) médio do programa poderia ser estimado como: E( ) = E( Y d = 1) E( Y d = 0) 1 0 Adicionando e subtraindo, o valor esperado de um indivíduo tratado caso ele não tivesse recebido o tratamento, E ( Y0 d = 1) : E( ) = E( Y Y d = 1) E( Y d = 0) + E( Y d = 1) 1 0 0 0 Onde o primeiro termo é o impacto do programa e o segundo termo é o viés de seleção.

Como E ( Y0 d = 1) não é observável, o objetivo essencial do trabalho empírico em avaliação de impacto é identificar situações em que se possa assumir que o viés de seleção não existe ou encontrar maneiras de corrigi-lo. A aleatorização de indivíduos em grupos de tratamento e comparação é um dos casos onde o viés de seleção PODE ser inteiramente removido. Motivo: Como o tratamento foi aleatoriamente distribuído entre os dois grupos, indivíduos tratados e não-tratados, em média, diferem apenas quanto a este status. Não tivesse o grupo de tratamento sido tratado ambos os grupos teriam em média o mesmo resultado: E( Y d = 0) E( Y d = 1) = 0 0 0

Hipóteses: Não há viés de aleatorização: a aleatorização não afeta o que seria o valor médio da variável de interesse na ausência do tratamento; e, O fato de uma unidade receber o tratamento não afeta o resultado potencial de uma unidade que não recebeu o tratamento (SUTVA): E( ) = E( Y1 d = 1) E( Y0 d = 0) = E( Y1 Y0 d = 1) = E( Y Y ) 1 0 Exclui a possibilidade efeitos de equilíbrio geral e externalidades. Isto implica que caso o experimento seja implementado de maneira adequada: ATT=ATE.

Aleatorização como variável instrumental IV tenta resolver o problema de endogeneidade de uma variável explicativa. A aleatorização (R) pode ser vista como uma variável instrumental no sentido em que ela determina a participação no programa, mas não é correlacionada com o resultado de interesse. Isto é particularmente importante quando os indivíduos decidem participar ou não em um programa baseados em suas expectativas de ganho que podem ser uma função tanto de variáveis observáveis (X) como de variáveis não observáveis (U).

Nestas circunstâncias, ATT somente será igual a ATE se assumirmos que: a) Não há heterogeneidade do impacto: modelo de efeito comum: U1 U0 = 0 E( X) = E( d = 1, X). O impacto é o mesmo para pessoas com as mesmas características X. O componente não observável não afeta o ganho. U U b) Há heterogeneidade, 1 0, mas a aleatorização é administrada somente para aqueles que participariam do programa (d=1). ATE=ATT.

c) Mas quando há heterogeneidade, em geral: ATT ATE U1 U0 E( X) E( d = 1, X) Heckman (1992) ressalta que as condições de identificação do impacto do programa quando se usa aleatorização não exigem que X seja independente ou ortogonal a U. Deste modo, os outros parâmetros estimados por um modelo experimental podem não ser identificados e, portanto, não fornecem informações sobre parâmetros estruturais que poderiam ser de interesse. O parâmetro do tratamento é identificado porque X é ortogonal a D por construção.

EY ( 1 Y0 X) = E( X) = g ( X ) g ( X) + E( U U X) 1 0 1 0

Desenhando uma Avaliação com Aleatorização Desenhando avaliações: a) Parceiros: governos e ONGs b) Pilotos: oportunidade de informar a expansão do programa c) Objetivos: Testar o pacote, testar mecanismos e testar teoria Métodos de Aleatorização: a) Super-inscrição; b) Aleatorização da entrada no programa; c) Aleatorização dentro do grupo; d) Aleatorização com incentivo para participação;

Tamanho da amostra, desenho e poder dos experimentos. a) Princípios básicos: - A amostra precisa ter um tamanho suficiente que permita identificar um impacto de tamanho x. - O poder do teste é a probabilidade de rejeitar a hipótese nula quando ela é, de fato, falsa. - O tamanho mínimo do efeito detectável (MDE) para um poder do teste κ, nível de significância α, tamanho da amostra N é dado por: 2 1 σ MDE = ( t1 κ + tα ) * P(1 P) N

Esta equação implicitamente define o tamanho da amostra e explicita o dilema entre o poder e o tamanho do teste. A função MDE é minimizada com P=0.5, mas se a coleta de dados por barata, a proporção ótima é ter um grupo de comparação maior. (Maior probabilidade de atrito) b) Erros grupados: Quando se aleatoriza grupos ao invés de indivíduos, é importante observar que o erro pode não ser independente entre indivíduos dentro do mesmo grupo:

MDE ( t t ) 1 ρ P(1 P) J n 1 κ + α ρ = Onde ρ é a correlação intra-cluster e J corresponde ao número de clusters. A precisão das estimativas aumenta mais com um aumento do número de clusters (J) do que com um aumento no número de observações (n) nos clusters existentes. c) Alocação imperfeita (imperfect compliance) 2 1 σ 1 MDE = ( t1 κ + tα ) * * P(1 P) N c s Onde c é a proporção de alocados no tratamento que realmente recebem o tratamento e s a proporção de alocados no grupo de comparação que recebem o tratamento. σ

d) Variáveis de Controle - Controlar por variáveis que influenciam a variável de interesse não afeta o valor esperado do estimador β, mas pode reduzir sua variância, e, portanto, o tamanho da amostra. - Estas variáveis, no entanto, devem ser capturadas no baseline, pois se elas forem influenciadas pelo tratamento, elas podem capturar parte do efeito do mesmo na variável de interesse. - Controlando por variáveis que afetam pouco a variável de interesse pode aumentar a variância ao diminuir o número de graus de liberdade.

e) Estratificação - A aleatorização é usada para garantir que para certas dimensões observáveis (X), os grupos de controle e tratamento tenham médias (esperanças) semelhantes. - Estratificação é utilizada para garantir que isso se verifique na prática. - A precisão será melhorada na medida em que os blocos forem formados por variáveis que afetam a variável de interesse.

- Além de reduzir a variância este procedimento é útil para analisar a heterogeneidade do impacto para diferentes grupos. f) Cálculo do poder do teste na prática - É necessário ter uma idéia da média e da variância da variável de interesse na ausência do experimento, depois de controlar por possíveis co-váriaveis e/ou estratificação. - No caso de desenho grupado é preciso ter uma idéia da correlação da variável de interesse para membros do mesmo grupo.

- Decidir o tamanho do teste e o tamanho do efeito mínimo detectável. - Decidir o poder do teste. Existe um freeware chamado Optimal design para calcular o tamanho da amostra. O manual desde software também é um bom guia para o estudo de experimentos.

Implementando a aleatorização Nível de Aleatorização: Em alguns casos é obvio se o nível de aleatorização deve ser o indivíduo ou algum grupo (escola, cidade, indústrias), mas em outros casos não é tão óbvio assim. Critérios para decisão. a) Quanto maior o número de grupos, maior o tamanho da amostra para o MDE. b) Efeito transbordamento (ou externalidade) pode enviesar a estimação dos efeitos do tratamento.

c) Impactos nos indivíduos não selecionados (ressentimento) e custos fixos. Desenhos fatoriais (cross-cutting design) - Usados para testar varias intervenções e combinações destas em relação a um grupo de comparação e entre grupos de tratamento. - Usados para testar interações de diferentes componentes de um programa. - Pode ser usado para testar duas hipóteses ao invés de uma, sem um grande aumento de custos.

Levantamento de Dados - Linha de base: a) reduz os requisitos do tamanho da amostra, por gerar variáveis de controle correlacionadas com a variável de interesse; b) interação entre valores iniciais e o impacto do programa; c) checar se a aleatorização foi bem feita; d) testar e refinar os procedimentos de coleta de dados. - Uso de dados administrativos: a) pode reduzir atrito;

b) metodologia de coleta quando se combina pesquisa de campo e dados administrativos; c) instrumento pode ser afetado pelo programa Quando a aleatorização não é perfeita... Ameaças à validade interna da avaliação: a) Probabilidade de seleção depende de variáveis observáveis: calcular médias ponderadas ou controlar por todos os X s na regressão (incluindo interações); b) Alocação imperfeita: Estimativa da intenção do tratamento: ITT = E ( Y Z = 1) E( Y Z = 0) 1 0

Wald (LATE) Estimator: E( Y1 Z = 1) E( Y0 Z = 0) β w = E[ D Z = 1] E[ D Z = 0] Hipóteses: - independência: Y e D são independentes de Z - monotonicidade: o instrumento faz cada observação mais (ou menos) provável de participar no programa. Independência não se sustenta caso exista externalidade: Z afeta Y. Existência de externalidade positiva infla o estimador Wald. Modelo de efeito comum: LATE=ATT=ATE

Modelo com heterogeneidade, mas instrumento não é correlacionado com o ganho do programa: LATE=ATT Modelo com heterogeneidade e instrumento correlacionado com o ganho (auto-seleção): LATE. c) Externalidades (SUTVA é violado) - Físicas, mudanças de preços, efeito aprendizagem e imitação. - Externalidades globais tornam a identificação do impacto do programa muito difícil. - Externalidades locais (restritas a um grupo), permitem a identificação do impacto total do programa. - experimentos podem ser desenhados para captar externalidades entre grupos.

d) Atrito na amostra - identificar se é um problema: atrito aleatório apenas diminui o poder estatístico do experimento. - aplicar técnicas de correção: paramétricas ou não paramétricas. Inferência a) Dados grupados: Mínimos Quadrados Generalizados b) Resultados Múltiplos: ajusta os p-valores; estimar modelos SUR e calcular o Efeito tratamento padronizado.

c) Subgrupos: definir ex-ante e estratificar; ex-post tomar cuidado com tamanho da amostra e data mining. d) Covariáveis: apenas as que de fato afetam a variável de interesse. Validade Externa e Generalização de Experimentos - validade interna é necessária, mas não suficiente para a validade externa; - incapacidade de captar efeitos de equilíbrio geral;

- Hawthorne effect: mudança de comportamento entre os tratados outperform - John Henry effect: mudança de comportamento no grupo de comparação sabotagem ou competição. Ambos são efeitos de curto prazo. Dados de mais longo prazo podem testar o impacto destes vieses. - Pilotos como gold plating - Replicação para acumular conhecimento (viés de publicação dificulta esta prática).

- Modelos teóricos ajudam a fazer predição fora da amostra.

Debate: Métodos experimentais versus quase-experimentais: a) quase-experimentos conseguem replicar os resultados de experimentos? - Discussão sobre os NSW, JTPA e Progresa. b) Experimentos não estimam alguns estimadores de efeitos que podem ser relevantes e não dão tanta importância a modelos estruturais. c) Combinação de experimentos com métodos quaseexperimentais