Linha Técnica Sessão VI Métodos de Homogeneização

Documentos relacionados
1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

AULAS 20 E 21 ESCORE DE PROPENSÃO DE PAREAMENTO

Técnicas econométricas para avaliação de impacto O uso de algoritmos de emparelhamento baseados em escore de propensão propensity score matching

Variáveis Instrumentais

AULAS 25 E 26 VARIÁVEIS INSTRUMENTAIS

Linha Técnica Sessão I: Inferência Causal

Linha Técnica Sessão II: Ensaios Aleatórios

Econometria para Avaliação de Políticas Públicas

Centro Internacional de Pobreza (PNUD/IPEA) Fabio Veras Soares. Estimação do Impacto de Múltiplos Tratamentos e do. Escore de Propensão Generalizado

MÉTODOS QUANTITATIVOS APLICADOS À AVALIAÇÃO DE POLÍTICAS PÚBLICAS USANDO STATA. Prof. Leonardo Sangali Barone

O uso de algoritmos de emparelhamento - matching

O IMPACTO DO ENSINO MÉDIO TÉCNICO SOBRE A RENDA: UMA COMPARAÇÃO ENTRE BRASIL E MINAS GERAIS

Estimação de Efeito Causal

Distribuições Amostrais e Estimação Pontual de Parâmetros

Gabarito - Lista 5 - Questões de Revisão

ANÁLISE CUSTO/BENEFÍCIO DO PROGRAMA PRONATEC DO GOVERNO FEDERAL

3. METODOLOGIA Modelo geral para avaliação de impacto

Introdução à Bioestatística Turma Nutrição

Outras Técnicas que Utilizam o Escore de Propensão

Walmir dos Reis Miranda Filho UFJF. Com Marcel de Toledo Vieira (UFJF) e Cristiano Ferraz (UFPE) 17 de outubro de 2017

25 de junho de 2015 EFEITO MÉDIO DO TRATAMENTO (ATE): MÉTODOS PARA ESTIMAÇÃO E APLICAÇÕES EM ANÁLISE DE CAUSALIDADE. Gabriel Leite Mariante

Inferência Estatística:

AULA 7 - Inferência em MQO: ICs e Testes de

Disciplina de Modelos Lineares Professora Ariane Ferreira

Econometria para Avaliação de Políticas Públicas

1 Objetivos do Curso. 2 Conteúdo

Distribuições Amostrais e Estimação Pontual de Parâmetros

Capítulo 2. Distribuições de Probabilidade Estimativas de parâmetros e tempos-atéfalha. Flávio Fogliatto

EFEITOS DO PROGRAMA PACTO PELO DESENVOLVIMENTO SOCIAL DA PARAÍBA SOBRE INDICADORES EDUCACIONAIS E DE SAÚDE

Minera c ao de Dados Aula 6: Finaliza c ao de Regress ao e Classifica c ao Rafael Izbicki 1 / 33

7 Referências bibliográficas

Estatística e Modelos Probabilísticos - COE241

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL FACULDADE DE CIÊNCIAS ECONÔMICAS PROGRAMA DE PÓS-GRADUAÇÃO EM ECONOMIA LUIZ FELIPE DE VASCONCELLOS SILVEIRA

6- Probabilidade e amostras: A distribuição das médias amostrais

Distribuições Amostrais e Estimação Pontual de Parâmetros

DIME Impact Evaluation Workshop. Innovations for Agriculture June 2014, Kigali, Rwanda

IMPACTOS DO PROGRAMA BOLSA FAMILIA NO MERCADO DE TRABALHO E NA RENDA DOS TRABALHADORES RURAIS

Econometria para Avaliação de Políticas Públicas

AULA 07 Inferência a Partir de Duas Amostras

Técnicas Econométricas para Avaliação de Impacto Programa do Curso

Programa Bolsa Família: impacto das transferências sobre os gastos com alimentos em famílias rurais

EAE0325 Econometria II. Professora: Fabiana Fontes Rocha. Gabarito Primeira Lista Teórica de Exercícios

PROGRAMA DE PÓS-GRADUAÇÃO EM POLÍTICAS PÚBLICAS, ESTRATÉGIA E DESENVOLVIMENTO. Ementa

AULAS 04, 05 E 06 AVALIAÇÃO UTILIZANDO EXPERIMENTOS

Divisão e Conquista. Norton T. Roman. Apostila baseada nos trabalhos de Cid de Souza, Cândida da Silva e Delano M. Beder

IMPACTOS DO PROGRAMA BOLSA FAMÍLIA SOBRE OS GASTOS COM ALIMENTOS DE FAMÍLIAS RURAIS

Técnicas econométricas para avaliação de impacto O uso de métodos de regressão e introdução aos métodos de diferençasdas-diferenças

Econometria em Finanças e Atuária

ESTATÍSTICA COMPUTACIONAL

Efeitos do programa de qualificação profissional Bolsa Futuro na empregabilidade e salários dos trabalhadores

Metodologias causais para estudos observacionais

Inferência Estatistica

Métodos Não Paramétricos

AVALIAÇÃO ECONÔMICA DO FUNDO CONSTITUCIONAL DE FINANCIAMENTO DO NORDESTE (FNE)*

Impacto do Programa Bolsa Família sobre a Frequência Escolar: o caso da agricultura familiar no Nordeste do Brasil 1

Estimação: (A) Propriedades e Distribuições Amostrais

diferença não aleatória na distribuição dos fatores de risco entre os dois grupos

Modelagem e Análise de Sistemas - COS767

5 Avaliação dos estimadores propostos

Como aleatorizar? Claudio Ferraz PUC-Rio e JPAL Abdul Latif Jameel Poverty Action Lab.

AULA 9 - MQO em regressão múltipla: Propriedades Estatísticas (Valor Esperado)

AULAS 21 E 22 Análise de Regressão Múltipla: Estimação

PARTE 1 ANÁLISE DE REGRESSÃO COM DADOS DE CORTE TRANSVERSAL CAPÍTULO 2 O MODELO DE REGRESSÃO SIMPLES

DIME Impact Evaluation Workshop. Innovations for Agriculture June 2014, Kigali, Rwanda

AULA 11 Heteroscedasticidade

AULA 1 - Modelos determinísticos vs Probabiĺısticos

AULAS 28 E 29 Análise de Regressão Múltipla com Informações Qualitativas

Estimador: combinação dos elementos da amostra, construída com a finalidade de representar, ou estimar, um parâmetro de interesse na população.

O Impacto do Programa Bolsa Família nas Despesas com Saúde das Famílias - Uma Análise para Minas Gerais

Aula 9 Intervalo de confiança para a média da N(μ; σ 2 ), σ 2 desconhecida

Distribuições Amostrais e Estimação Pontual de Parâmetros

Busca Binária. Aula 05. Busca em um vetor ordenado. Análise do Busca Binária. Equações com Recorrência

Estatística e Modelos Probabilísticos - COE241

2 o Teste de Aprendizagem Automática

REGRAS ELEITORAIS, COMPETIÇÃO POLÍTICA E POLÍTICA FISCAL: EVIDÊNCIA DOS MUNICÍPIOS BRASILEIROS

Técnicas computacionais em probabilidade e estatística II

PROGRAMAS DE TRANSFERÊNCIA DE RENDA E MIGRAÇÃO INTERNA: EVIDÊNCIAS DO PROGRAMA BOLSA FAMÍLIA

Noções de Simulação. Ciências Contábeis - FEA - Noturno. 2 o Semestre MAE0219 (IME-USP) Noções de Simulação 2 o Semestre / 23

Análise de Dados Longitudinais Aula

Bioestatística INFERÊNCIA ESTATÍSTICA. Silvia Shimakura

AVALIAÇÃO DO IMPACTO DE UM PROGRAMA DE APOIO À PROCURA DE EMPREGO*

Métodos. Inferência. Estatística. Descritiva. Teste de. Estimação

Métodos Não-Experimentais. Caio Piza - DIME 22/06/2015 ieconnect Impact Evaluation Workshop Rio de Janeiro, Brazil June 22-25, 2015

Por que aleatorizar? Cecilia Machado FGV-EPGE Abdul Latif Jameel Poverty Action Lab.

SME0801- Probabilidade II Distribuições conjuntas. Primeiras definições e propriedades

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

Matemática Aplicada à Economia I Lista 3 Cálculo a Várias Variáveis. 1) Use o método das fatias para esboçar os gráficos das seguintes funções:

Amostragem e distribuições por amostragem

Estatística (MAD231) Turma: IGA. Período: 2016/2

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

Uso de diagramas causais na abordagem da situação de confusão

NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional

Aprendizado por Instâncias Janelas de Parzen & Knn

A Metodologia de Box & Jenkins

Ref: H.Gould e J. Tobochnik. Para integrais em uma dimensão as regras do trapezóide e de Simpson são

ESTATÍSTICA COMPUTACIONAL

Transcrição:

Impact Evaluation Linha Técnica Sessão VI Métodos de Homogeneização Human Development Network Spanish Impact Evaluation Fund www.worldbank.org/sief Quando podemos usar homogeneização? E se a designação do tratamento for feita não de forma aleatória, mas com base em observáveis? É aqui que entram os métodos de homogeneização! Eles permitem que você construa grupos de controle quando a designação ao tratamento é feita com base em variáveis observáveis. Cuidado: a homogeneização AINDA não permite que se controle pelo viés de seleção que ocorre quando a designação ao tratamento é feita com base em não-observáveis. Intuição: o grupo de controle precisa ser o mais semelhante possível ao grupo de tratamento em termos das observáveis antes do início do tratamento O método supõe que não há diferenças não-observáveis remanescentes entre os grupos de tratamento e controle 2 1

Pergunta-chave... Qual é o efeito do tratamento sobre os tratados quando a designação ao tratamento é baseada em variáveis observáveis? 3 Não-confundimento e seleção em observáveis Seja X a matriz em que cada linha é um vetor de variáveis observáveis pré-tratamento para o indivíduo i Definição não-confundimento: A designação ao tratamento é não-confundida dadas as variáveis pré-tratamento X se Y 1, Y 0 D X Notar: não-confundimento é equivalente a dizer que: Dentro de cada célula definida por X: tratamento é aleatório A seleção para o tratamento depende apenas das observáveis X 4 2

Efeito Médio de Tratamento nos Tratados supondo não-confundimento dado X Intuição: Estimar o efeito de tratamento dentro de cada célula definida por X Tirar a média ao longo das diferentes células Matemática: ver o Anexo 1 nas folhas entregues 5 Estratégia para estimar o Efeito Médio de Tratamento nos Tratados seleção em observáveis Não-confundimento sugere a seguinte estratégia para estimar o efeito de tratamento médio δ Estratificar os dados em células definidas por cada valor específico de X Dentro de cada célula (i.e. condicionando em X) calcular a diferença entre os resultados médios dos grupos de tratamento e controle Tirar a média dessas diferenças com respeito à distribuição de X na população de unidades tratadas Essa estratégia é factível? 6 3

Nossa estratégia é factível? o problema da dimensionalidade Isso pode não ser factível quando A amostra é pequena O conjunto de covariadas é grande Muitas das covariadas assumem diversos valores ou são contínuas A isso chamamos problema de dimensionalidade 7 O problema de dimensionalidade Exemplos: Quantas células temos com 2 variáveis binárias em X? E com 3 variáveis binárias em X? E com K variáveis binárias em X? E se tivermos 2 variáveis que podem assumir 7 valores cada? À medida que o número de células aumenta, teremos falta de suporte comum Células contendo apenas observações tratadas Células contendo apenas controles 8 4

Uma alternativa para resolver o problema de dimensionalidade Rosenbaum e Rubin (1983) propõem uma estratégia de estimação equivalente e factível, baseada no conceito de Escore de Propensão O escore de propensão permite converter a estrutura multidimensional da homogeneização em uma estrutura unidimensional Assim, reduz o problema de dimensionalidade 9 Homogeneização baseada no escore de propensão Definição escore de propensão: O escore de propensão é a probabilidade condicional de receber tratamento, dadas as variáveis de pré-tratamento: p(x) =Pr{D = 1 X} = E X {D X} Lema 1: Se p(x) é o escore de propensão, então D X p(x) Dado o escore de propensão, as variáveis de pré-tratamento estão balanceadas entre beneficiários e não-beneficiários. Lema 2: Y 1, Y 0 D X => Y 1, Y 0 D p(x) Suponha que a designação ao tratamento é não-confundida dadas as variáveis de pré-tratamento X. Então, a designação ao tratamento é não-confundida dado o escore de propensão p(x). 10 5

A abordagem de escore de propensão resolve o problema de dimensionalidade? Sim! A propriedade de balanceamento do escore de propensão (Lema 1) garante que: Observações com o mesmo escore de propensão têm a mesma distribuição de covariadas observáveis, independente da sua condição de tratamento. Para um dado escore de propensão: a designação ao tratamento é aleatória e, portanto, unidades de tratamento e controle são, em média, idênticas em termos de observáveis. 11 Implementação da estratégia de estimação Isso sugere a seguinte estratégia para estimação do efeito de tratamento médio δ Etapa 1: Estimar o escore de propensão Ex. com uma função logit, ver Anexo 3 Essa etapa é necessária, pois o verdadeiro escore de propensão é desconhecido e, portanto, devemos estimar o escore de propensão Etapa 2: Estimar o efeito de tratamento médio dado o escore de propensão 12 6

Quando a homogeneização por escore de propensão é adequada? Ideia por trás da homogeneização por escore de propensão: a estimação de efeitos de tratamento requer um pareamento cuidadoso de tratados e controles. Se os tratados e controles são muito diferentes em termos de observáveis, esse pareamento não é suficientemente próximo nem confiável, se não impossível. A comparação dos escores de propensão estimados para tratados e controles serve como uma ferramenta de diagnóstico bastante útil para avaliar a semelhança entre tratados e controles e, portanto, a confiabilidade da estratégia de estimação. 13 Então queremos que os escores de propensão sejam iguais para tratados e controles O escopo de variação de escores de propensão deveria ser igual para tratados e controles Contar quantos controles têm um escore de propensão abaixo do mínimo ou acima do máximo do escore de propensão dos tratados E vice versa A frequência do escore de propensão é a mesma para tratados e controles Desenhar histogramas dos escores de propensão estimados para tratados e controles Os grupos correspondem aos blocos construídos para a estimação dos escores de propensão 14 7

Density.2.4.6 0 Um exemplo de problemas de suporte comum Figura A1: Escores de Propensão para EiC Fase 1 e Escolas Não-EiC 0 1-5 -4-3 -2-1 0 1 2 3 4 5-5 -4-3 -2-1 0 1 2 3 4 5 Linear prediction Graphs by treated Fonte: Machin, McNally, Meghir, EXCELÊNCIA EM CIDADAES (EiC) : AVALIAÇÃO DE UMA POLÍTICA DE EDUCAÇÃO EM ÁREAS CARENTES 15 Implementação da estratégia de estimação Lembre-se que discutimos uma estratégia para a estimação do efeito de tratamento médio nos tratados, chamado δ Etapa 1: Estimar o escore de propensão (ver Anexo 3) Etapa 2: Estimar o efeito de tratamento médio dado o escore de propensão parear tratados e controles com exatamente o mesmo escore de propensão (estimado) calcular o efeito de tratamento para cada valor do escore de propensão (estimado) tirar a média desses efeitos condicionais 16 8

Etapa 2: Estimar o efeito de tratamento médio dado o escore de propensão Isso é inviável na prática, porque é raro encontrar duas unidades com exatamente o mesmo escore de propensão. O mais próximo que conseguimos chegar de uma homogeneização exata é parear cada unidade tratada com o controle mais próximo em termos de escore de propensão. Mais próximo pode ser definido de várias formas. Cada uma dessas formas corresponde a um jeito diferente de fazer a homogeneização Estratificação via escore Homogeneização com vizinho mais próximo via escore Homogeneização de raio via escore Homogeneização de Kernel via escore Ponderação baseada no escore 17 Referências Dehejia, R.H. and S. Wahba (1999), Causal Effects in Nonexperimental Studies: Reevaluating the Evaluation of Training Programs, Journal of the American Statistical Association, 94, 448, 1053-1062. Dehejia, R.H. and S. Wahba (1996), Causal Effects in Nonexperimental Studies: Reevaluating the Evaluation of Training Programs, Harvard University, Mimeo. Hahn, Jinyong (1998), ON the role of the propensity score in efficient semiparamentric estimation of average treatment effects, Econometrica, 66,2,315-331. Heckman, James J. H. Ichimura, and P. Todd (1998), Matching as an econometric evaluation estimator, Review of Economic Studies, 65, 261-294. Hirano, K., G.W. Imbens and G. Ridder (2000), Efficient Estimation of Average Treatment Effects using the Estimated Propensity Score, mimeo. Rosenbaum, P.R. and D.B. Rubin (1983), The Central Role of the Propensity Score in Observational Studies for Causal Effects, Biometrika 70, 1, 41 55. Vinha, K. (2006) A primer on Propensity Score Matching Estimators Documento CEDE 2006-13, Universidad de los Andes 18 9

Anexo 1: Efeitos Médios de Tratamento nos Tratados supondo não-confundimento dado X Se estamos supostos a supor não-confundimento: E i {Y 0 (u i ) D i = 0, X} = E i {Y 0 (u i ) D i = 1, X} = E i {Y 0 (u i ) X} E i {Y 1 (u i ) D i = 0, X} = E i {Y 1 (u i ) D i = 1, X} = E i {Y 1 (u i ) X} Usando essas expressões, podemos calcular para cada célula definida por X: X = efeito médio de tratamento nos tratados na célula definida por X = E i { i D i = 1, X} = E i {Y 1 (u i ) Y 0 (u i ) D i = 1, X} = E i {Y 1 (u i ) D i = 1, X} E i {Y 0 (u i ) D i = 1, X} pode-se medir análogo amostral NÃO se pode medir análogo amostral = E i {Y 1 (u i ) D i = 1, X} E i {Y 0 (u i ) D i = 0, X} pode-se medir análogo amostral 19 Anexo 1: Efeitos Médios de Tratamento nos Tratados supondo não-confundimento dado X Agora, qual é a relação entre efeito médio de tratamento nos tratados... e... X efeito médio de tratamento nos tratados na célula definida por X = efeito de tratamento médio nos tratados = E i { i D i = 1} pela Lei das Expectativ as Iteradas = E i {E X [ i D i = 1, X] } = E X {E i [ i D i = 1, X] } = E X { X } = E X {efeito médio de tratamento nos tratados na célula definida por X} 20 10

Anexo 2: Efeitos médios de tratamento e o escore de propensão Então, vamos parear tratamentos e controles baseado no escore de propensão p(x) em vez de X: E i {Y 0 (u i ) D i = 0, p(x i )} = E i {Y 0 (u i ) D i = 1, p(x i )} = E i {Y 0 (u i ) p(x i )} E i {Y 1 (u i ) D i = 0, p(x i )} = E i {Y 1 (u i ) D i = 1, p(x i )} = E i {Y 1 (u i ) p(x i )} Usando essas expressões, podemos calcular para cada célula definida por p(x): p(x) = efeito médio de tratamento nos tratados na célula definida por p(x) = E i { i D i = 1, p(x)} = E i {Y 1 (u i ) Y 0 (u i ) D i = 1, p(x)} = E i {Y 1 (u i ) D i = 1, p(x)} E i {Y 0 (u i ) D i = 1, p(x)} pode-se medir análogo amostral NÃO se pode medir análogo amostral = E i {Y 1 (u i ) D i = 1, p(x)} E i {Y 0 (u i ) D i = 0, p(x)} pode-se medir análogo amostral 21 Anexo 2: Efeitos médios de tratamento e o escore de propensão Agora, qual é a relação entre efeito médio de tratamento nos tratados... e... p(x) efeito médio de tratamento nos tratados na célula definida por p(x) = efeito de tratamento médio nos tratados = E i { i D i = 1} pela Lei das Expectativ as Iteradas = E i {E p(x) [ i D i = 1, p(x)] } = E p(x) {E i [ i D i = 1, p(x)] } = E p(x) { p(x) } = E p(x) {efeito médio de tratamento nos tratados na célula definida por p(x)} 22 11

Anexo 3: Estimação do escore de propensão Qualquer modelo de probabilidade padrão pode ser usado para estimar o escore de propensão, ex. modelo logit: h( X i ) e Pr{ Di X i} (16) h( X i ) 1 e onde h(x i ) é uma função de covariadas com termos lineares e de ordem maior 23 Estimação do escore de propensão Quais termos de ordem maior devo incluir em h(x i )? Isso é determinado unicamente pela necessidade de obter uma estimativa do escore de propensão que satisfaça a propriedade de balanceamento A especificação de h(x i ) É mais parcimoniosa do que o conjunto completo de interações entre observáveis X Embora não parcimoniosa demais: ela ainda deve satisfazer a propriedade de balanceamento Notar: a estimação do escore de propensão não requer uma interpretação comportamental 24 12

Um algoritmo para estimar o escore de propensão 1. Começar com um logit ou probit parcimonioso para estimar o escore. 2. Ordenar os dados de acordo com o escore de propensão estimado (do mais baixo ao mais alto). 3. Estratificar todas as observações em blocos, tal que os escores de propensão estimados para os tratados e controles em cada bloco não sejam estatisticamente diferentes: a. começar com cinco blocos de igual escopo de escore {0-0.2,..., 0.8-1} b. testar se as médias dos escores para casos e controles são estatisticamente diferentes em cada bloco c. caso afirmativo, aumentar o número de blocos e testar novamente d. caso negativo, prosseguir para o próximo passo 25 Um algoritmo para estimar o escore de propensão (continuação) 4. Testar se a propriedade de balanceamento vale em todos os blocos para todas as covariadas: a) para cada covariada, testar se as médias (e possivelmente momentos de ordens maiores) para casos e controles são estatisticamente diferentes em todos os blocos; b) se uma covariada não estiver balanceada em um bloco, dividir o bloco e testar novamente dentro de cada bloco menor; c) se uma covariada não estiver balanceada em todos os blocos, modificar a estimação logit do escore de propensão adicionando mais interações e termos de ordem maior e testar novamente. Note que o resultado de interesse original não faz parte desse procedimento em momento algum Use o programa pscore.ado no STATA 26 Baixá-lo em http://www.iue.it/personal/ichino/welcome.html 13