Econometria de Avaliação de Políticas Públicas Dados microeconômicos Prof. Cristine Xavier, Flavia Chein e Mônica Viegas CEDEPLAR/UFMG 2/2009 CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 1 / 17
Introdução Objetivo: Descrever os tipos de dados para pesquisas microeconomicas Existem dois tipos de estruturas de dados para pesquisas microeconomicas Dados observacionais: dados advindos de surveys ou censitários Dados experimentais As limitações inerentes aos dados observacionais advém: forma como o dado é coletado (estrutura amostral) design amostral (amostragem simples versus uma amostragem estrati cada) escopo do amostra (pesquisa longitudinal ou tranversal ) CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 2 / 17
Dados Observacionais Fontes de dados observacionais: surveys de domicílios, rmas e dados administrativos do governo O termo observacional: pesquisas de dados que são coletados por amostragem relevante da população sem controlar as características da população amostrada Amostragem aleatória simples: a probabilidade da unidade i ser amostrada de uma população de tamanho N é igual a 1/N Amostragem estrati cada (partição com as seguintes categorias) strata (sub-grupos da pop nao superpostos que exaurem a pop) CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 3 / 17
Dados Observacionais Fontes de dados observacionais: surveys de domicílios, rmas e dados administrativos do governo O termo observacional: pesquisas de dados que são coletados por amostragem relevante da população sem controlar as características da população amostrada Amostragem aleatória simples: a probabilidade da unidade i ser amostrada de uma população de tamanho N é igual a 1/N Amostragem estrati cada (partição com as seguintes categorias) strata (sub-grupos da pop nao superpostos que exaurem a pop) Unidade primária amostral (PSU): sub-conjuntos nao supoerpostos do strato CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 3 / 17
Dados Observacionais Fontes de dados observacionais: surveys de domicílios, rmas e dados administrativos do governo O termo observacional: pesquisas de dados que são coletados por amostragem relevante da população sem controlar as características da população amostrada Amostragem aleatória simples: a probabilidade da unidade i ser amostrada de uma população de tamanho N é igual a 1/N Amostragem estrati cada (partição com as seguintes categorias) strata (sub-grupos da pop nao superpostos que exaurem a pop) Unidade primária amostral (PSU): sub-conjuntos nao supoerpostos do strato Unidades secundárias amostrais (SSU): sub-unidades do PSU CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 3 / 17
Dados Observacionais Fontes de dados observacionais: surveys de domicílios, rmas e dados administrativos do governo O termo observacional: pesquisas de dados que são coletados por amostragem relevante da população sem controlar as características da população amostrada Amostragem aleatória simples: a probabilidade da unidade i ser amostrada de uma população de tamanho N é igual a 1/N Amostragem estrati cada (partição com as seguintes categorias) strata (sub-grupos da pop nao superpostos que exaurem a pop) Unidade primária amostral (PSU): sub-conjuntos nao supoerpostos do strato Unidades secundárias amostrais (SSU): sub-unidades do PSU Unidade amostral (USU): unidade nal escolhida para entrevista CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 3 / 17
Dados Observacionais Em geral, todos os estratos são pesquisados Exemplo: estados de um país Nem todas as PSUs e suas sub-divisoes são pesquisadas Em uma amostragem dois estágios, as PSU sao escolhidas aleatoriamente USU sao escolhidas aleatoriamente nas PSUs sorteadas Nestes métodos de amostragem: domicílios diferentes tem diferentes probabilidades de serem sorteados Esta amostra é não representativa da população Surveys disponibilizam os pesos amostrais: inverso da probabilidade de ser amostrado Utilizando-se os pesos amostrais se pode obter estimadores não viesados para as características da população CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 4 / 17
Dados Observacionais Algumas pesquisas podem também apresentar clusters (grupamentos) Exemplo: amostragem de muitos domicílios em uma mesma vizinhança Observações que pertencem ao mesmo cluster tendem a ser dependentes ou correlacionadas porque dependem das mesmas características observáveis ou não observáveis que podem afetar todas as observações em um strato. Inferência estatítica ignorando a correlação destas observações gera estimativas incorretas da variância que são menores do que aquela que utiliza a fórmula correta. A amostragem em dois estágios ou multi estágios podem tornar as estimativas dos desvios-padroes mais complexa. CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 5 / 17
Amostragem Viesada Se uma amostra é aleatória entao a distibuição de probabilidade dos dados é a mesma distribuição da população. Quando a amostra não é aleatória: amostragem viesada Na amostragem viesada (biased sampling) a distribuição de probabilidade dos dados é diferente da distribuição da população A distribuição dos dados depende da natureza do desvio em relação à amostragem aleatória. Este tipo de amostragem ocorre porque muitas vezes é mais custo efetivo ou mais conveniente realizar uma amostragem de um subgrupo da população. CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 6 / 17
Amostragem Viesada Amostragem exógena: a amostra é segmentada segundo um conjunto de variáveis exógenas à variável resposta. Exemplo: estudo sobre hospitalizações, a amostra foi segmentada entre pacientes crônicos e não crônicos. Amostragem baseada em resposta: ocorre quando a probabilidade de um indivíduo ser incluído na amostra depende das respostas ou escolhas feitas por esse indivíduo. Nesse caso o processo de amostragem depende das regras de nidas em termos da variável endógena. Exemplo: estudo sobre os determinantes do transporte público, apena os usuários do transporte público são incluídos. CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 7 / 17
Tipos de Dados Observacionais Dados em Cross Section: São obtidos observando um vetor de características w, para a amostra S t para algum t. Se a população é estacionária, então inferências sobre θ t (vetor de parâmetros) utilizando S t pode ser válidas para t 6= t. Se existir dependência signi cativa entre o passado e o comportamento corrente, entao os dados longitudinais são requeridos para se fazer inferência sobre a relação de interesse. Dados em Cross-Sections Repetitidas: são obtidas através de amostras independentes S t. Nesse caso o desenho amostral não tenta reter as mesmas unidades na amostra, de forma que a informação sobre a dependência dinâmica no comportamento é perdida. Se a população é estacionária, entao amostras repetidas de dados em cross-section sao obtidas em um processo amostral semelhante à amostragem com reposição para uma população constante. Painel ou dados longitudinais: seleciona uma amostra S e colecta observações para uma sequencia de períodos de tempo. CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 8 / 17
Dados de Experimentos Sociais Dados experimentais e dados observacionais são distintos porque um ambiente experimental pode ser monitorado e controlado No experimento é possível alterar a variável de interesse, mantendo as demais covariadas em níveis controlados. Ao contrário em dados observacionais os dados são gerados em um ambiente não controlado, deixando aberta a possibilidade de fatores confundentes os quais tornam mais difícil a identi cação da relação causal de interesse Exemplo: Ao estudar a relação entre escolaridade e rendimento Estudo observacional: anos de escolaridade tem que ser compreendido como decorrente de um processo de decisão individual Estudo experimental: anos de escolaridade são dados. CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 9 / 17
De nition Experimentos sociais: experimentos com pequenos grupos de participantes voluntários que mimetizam o comportamento dos agentes econômicos. A característica central da metodologia experimental envolve a comparação entre os resultados de um grupo randômicamente selecionado, o qual é sujeito a um tratamento com aqueles do grupo controle. Em um bom experimento cuidado considerável é tomado para encontrar os grupos tratamento e controle de modo a evitar os potenciais vieses nas variáveis de resultado. Um experimento social envolve uma variação exógena no ambiente econômico o qual é particionado em um subconjunto que recebe o tratamento e outro que serve como grupo controle. Em estudos observacionais as mudanças nos fatores exógenos e endógenos podem ser confundidas. Um experimento bem desenhado objetiva isolar o papel das variáveis de tratamento CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 10 / 17
Caracteristicas dos Experimentos Sociais Experimentos sociais são motivaods por questões políticas (identi car como os sujeitos reagem a determinado tipo de política) A idéia de um experimento social é listar um grupo de participantes, alguns dos quais, são aleatoriamente assignalados para ogrupo de tratamento e o restante para o grupo de controle. Experimentos sociais são raros fora dos EUA Experimentos podem produzir dados longitudinais ou cross-section CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 11 / 17
Vantagens dos Experimentos Sociais Remover qualquer correlação entre as características observadas e não observadas dos participantes do programa. A contribuiçao do tratamento à variavel de resultado pode ser estimada sem nenhum viés de confusão A presença de correlaçao entre variáveis de confusão e presença do tratamento complica a inferência causal em estudos observacionais Mesmo que dados observacionais estejam disponíveis, o uso de dados experimentais tem grande apelo por oferecer a possibilidade de exogeneizar uma variável de política e a randomizaçao do tratamento pode levar a uma grande simpli cação da análise estatística. Conclusões baseadas em dados observacionais podem não ser generalizáveis devido ao problema de viés de seleção. CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 12 / 17
Limitações dos Experimentos Sociais Custosos Algumas vezes os experimentos não são tão limpos assim (depende da variável de tratamento) Experimentos com amostras estrati cadas podem ser complicados (se a estrati cação for endõgena) Problema de seleção amostral que ocorre pela participação ser voluntária. Por razões éticas, existem experimentos que nao podem ser realizados. Diferente dos experimentos clínicos, os indivíduos sabem se são tratamento ou controle. Atrição amostral: causada por indivíduos que saem do experimento Hawthorne e ect: indivíduos podem adaptar o comportamento quando participam do experimento. Nesse caso os resultados do tratamento não podem ser atribuídos somente ao tratamento. viés de randomização (Heckman & Smith) Viés de substituição : ocorre quando os controles recebem alguma forma de tratamento que substitui o experimental. CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 13 / 17
Limitações dos Experimentos Sociais Análises de experimentos são de natureza de equilíbrio parcial ( a hipótese de coeteris paribus não é mantida quando toda a população é envolvida) A questão fundamental é se podemos extrapolar os resultados de um experimento para uma população inteira. Se o experimento é conduzido como um programa piloto de pequena escala, mas a intenção é predizer o impacto de políticas que são mais amplamente aplicadas, a limitação é que o programa piloto nao pode incorporar os efeitos mais amplos do programa. Um tratamento mais amplamente aplicado pode alterar o ambiente economico su cientemente para invalidar as predições de um arcabouço de equilíbrio parcial. CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 14 / 17
Experimentos Naturais Um experimento natural ocorre quanto um subconjunto da população está sujeito a uma variação exógena em uma variável. Duas formas de trabalhar o experimento natural: Considere o modelo de regressão simples: y = b 1 + b 2 x + u Suponha uma variação exógena que altera x. A intervenção exógena cria uma oportunidade para avaliar o seu impacto comparando o comportamento do grupo impactado antes e depois da intervenção, ou com o grupo não impactado após a intervenção. (choques climáticos, legislação não antecipada, eventos naturais - nascimentos de gêmeos...) Nesse caso x pode ser tratado com o exógeno. CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 15 / 17
Variáveis Instrumentais Experimento natural: gerar uma variável instrumental. Suponha que z é uma variável correlacionada com x e nao correlacionada com u. Entao uma estimador de variável instrumental de β 2 expresso em termos de covariadas é: bβ 2 = cov (z, y) cov (z, x) CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 16 / 17
Referencias Bibliográ cas: Cameron & Trivedi, 2005. Cap 3. CEDEPLAR/UFMG (Institute) Avaliação de Politicas Públicas 2/2009 17 / 17