Econometria na prática. Organizadoras Cláudia Malbouisson Gisele F. Tiryaki

Documentos relacionados
1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE CIÊNCIAS CONTÁBEIS PROGRAMA DE PÓS GRADUAÇÃO EM CIÊNCIAS CONTÁBEIS - PPGCC FICHA DE DISCIPLINA

Paulo Jorge Silveira Ferreira. Princípios de Econometria

Carga Horária: 80 horas (correspondem a aulas e atividades extra-classe)

MESTRADO PROFISSIONAL EM ECONOMIA. Área Econometria MESTRADO PROFISSIONAL EM FINANÇAS OU ECONOMIA 1. vire aqui

Prova de Estatística

Análise de dados para negócios. Cesaltina Pires

AULA 1 - Modelos determinísticos vs Probabiĺısticos

FICHA DE DISCIPLINA/PROGRAMA

FICHA DE COMPONENTE CURRICULAR

Plano de Estudos. Fundamentos de Economia Economia 6 Semestral 156 ECN11909M

EAE Econometria 1

Análise de Regressão Linear Múltipla III

AULAS 25 E 26 VARIÁVEIS INSTRUMENTAIS

MÉTODOS QUANTITATIVOS APLICADOS À AVALIAÇÃO DE POLÍTICAS PÚBLICAS USANDO STATA. Prof. Leonardo Sangali Barone

Ver programa detalhado em anexo. CENTRO DE CIÊNCIAS SOCIAIS DEPARTAMENTO DE ECONOMIA

Aula 2 Tópicos em Econometria I. Porque estudar econometria? Causalidade! Modelo de RLM Hipóteses

CONHECIMENTOS ESPECÍFICOS

Variáveis Instrumentais

MESTRADO PROFISSIONAL EM ECONOMIA. Ênfase em Macroeconomia Financeira. vire aqui

Plano Estudos. ECN7093 Investimentos Internacionais Economia 7.5 Semestral 193

RESOLUÇÃO Nº 01/2016

Econometria Semestre

AULA 01 Principais Conceitos em Econometria

Técnicas econométricas para avaliação de impacto O uso de algoritmos de emparelhamento baseados em escore de propensão propensity score matching

AULAS 21 E 22 Análise de Regressão Múltipla: Estimação

A Metodologia de Box & Jenkins

MESTRADO EM PROSPECÇÃO E ANÁLISE DE DADOS

2 Modelos Não Lineares

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9

RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO

Prova de Estatística

Aula 2 Uma breve revisão sobre modelos lineares

Métodos Quantitativos Aplicados

AULAS 14 E 15 Modelo de regressão simples

AULA 17 - Variáveis binárias

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 12

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

Métodos Quantitativos para Avaliação de Políticas Públicas

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Análise e Previsão de Séries Temporais Aula 1: Introdução às séries temporais. Eraylson Galdino

Métodos Estatísticos Básicos

Edicão Numero 187 de 27/09/2007 Empresa Brasileira de Pesquisa Agropecuária Ministério da Agricultura, Pecuária e Abastecimento

Análise de Séries Temporais. Modelos estacionários Processos puramente aleatórios, AR(p), MA(q) ARIMA(p,q)

Econometria. Econometria: Paradigma. Porque usar econometria? Porque usar econometria?

AULA 13 Análise de Regressão Múltipla: MQO Assimptótico

Análise Multivariada Aplicada à Contabilidade

Introdução à Econometria

Aula 2. ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos

MODELOS ECONOMÉTRICOS PARA DADOS DE ALTA- FREQUENCIA: TEORIA E APLICAÇÕES

Técnicas econométricas para avaliação de impacto O uso de métodos de regressão e introdução aos métodos de diferençasdas-diferenças

EAE0325 Econometria II. Professora: Fabiana Fontes Rocha. Gabarito Primeira Lista Teórica de Exercícios

Gabarito - Lista 5 - Questões de Revisão

PARTE 1 ANÁLISE DE REGRESSÃO COM DADOS DE CORTE TRANSVERSAL CAPÍTULO 2 O MODELO DE REGRESSÃO SIMPLES

Econometria em Finanças e Atuária

5 Metodologia e Resultados 5.1. Metodologia

Sumário Capítulo 1 A Natureza da Econometria e dos Dados Econômicos PARTE 1 ANálISE DE REGRESSãO COM DADOS DE CORTE TRANSVERSAl

AULA 11 Heteroscedasticidade

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

CONHECIMENTOS ESPECÍFICOS

Unidade I ESTATÍSTICA. Prof. Fernando Rodrigues

CURSO AVANÇADO EM AVALIAÇÃO QUANTITATIVA [112 horas]

MODELOS DE REGRESSÃO E DECOMPOSIÇÃO PARA DESCREVER O CONSUMO RESIDENCIAL DE ENERGIA ELÉTRICA NO BRASIL ENTRE 1985 E 2013

Unidade VII Amostragem

AULAS 25 E 26 Heteroscedasticidade

LES0773 Estatística Aplicada III

Análise de Dados Longitudinais Aula

Variáveis Instrumentais

MESTRADO PROFISSIONAL EM ECONOMIA

CE Estatística I


AULAS 14 E 15 Modelo de regressão simples

CONHECIMENTOS ESPECÍFICOS

5 Avaliação dos estimadores propostos

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

1 Introdução aos Métodos Estatísticos para Geografia 1

Metodologia de Box-Jenkins. Metodologia de Box-Jenkins. Metodologia de Box-Jenkins

Nome: Número: Espaço reservado para classificações

Econometria - Lista 5

CONHECIMENTOS ESPECÍFICOS

6EMA Lucas Santana da Cunha 17 e 19 de abril de Universidade Estadual de Londrina

3 Metodologia. resenha de VAN DIJK et al. (2002). 12 Para uma exposição extensiva do uso do modelo STR aplicado a séries macroeconômicas, ver a

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão.

Instituto de Estudos Sociais e Políticos - IESP-UERJ Lego II - análise de dados quantitativos

2 Modelos em Espaço de Estado Lineares: Formulação Geral

5 Modelos de previsão

6EMA Lucas Santana da Cunha 19 de abril de Universidade Estadual de Londrina

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

III AMOSTRAGEM E INTERVALO DE CONFIANÇA Conceito de Amostragem AMOSTRA ALEATÓRIA

Aula inaugural do curso Análise de Regressão

Econometria. Econometria ( ) O modelo de regressão linear múltipla. O modelo de regressão linear múltipla. Aula 2-26/8/2010

ESTATÍSTICA ECONÔMICA A 6EMA

Econometria IV Modelos Lineares de Séries Temporais. Fernando Chague

CONHECIMENTOS ESPECÍFICOS

PROGRAMA DE DISCIPLINA

RESPOSTAS - PROVA ESTATÍSTICA AGENTE PF 2018

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2

Transcrição:

Econometria na prática Organizadoras Cláudia Malbouisson Gisele F. Tiryaki Rio de Janeiro, 2017

Sumário Prefácio...vii Capítulo 1: Fundamentos da Análise Empírica... 1 Tipos de Variáveis e Estrutura dos Dados...5 Estatísticas Descritivas...11 Relações entre as Variáveis...21 Transformação de Variáveis...28 Referências...34 Capítulo 2: Modelo de Regressão Linear Clássico...37 Estimadores de Mínimos Quadrados Ordinários...38 Aplicando o MQO...49 Por que os Estimadores de MQO São Tão Conhecidos?...53 Hipóteses do Modelo de Regressão Linear...55 O que Pode Causar a Violação das Hipóteses?...57 Problemas com os Regressores: Testes de Especificação e Endogeneidade...59 Teste F...60 Teste RESET... 64 Testes para Problemas com os Regressores: Multicolinearidade...69 Diagnóstico de Multicolinearidade: Matriz de Correlação...70 Teste Fator de Inflação da Variância...71 Problemas com o Erro: Heterocedasticidade...73 Teste Breusch-Pagan...75 Teste de White...79 Estatísticas de Influência...86 Referências...89 iii

Econometria na Prática Capítulo 3: Multicolinearidade e Construção de Índices...91 Análise de Componentes Principais...92 Análise de Fatores... 100 Apêndice 3.A. Análise de Componentes Principais com Variáveis Categóricas...117 Referências...119 Capítulo 4: Análise de Séries Temporais... 123 Análise Univariada...124 Processo Autorregressivo, Passeio Aleatório, Estacionariedade, Integração e Raiz Unitária...124 Diferença Estacionária versus Tendência Estacionária...131 Testes de Raiz Unitária: Testes de Dickey-Fuller (DF)...133 Mais de uma Defasagem... 138 Critérios de Informação... 140 Outros Testes de Raiz Unitária... 143 Um Arcabouço para os Testes... 148 Um Exemplo...151 Análise multivariada VAR... 157 Identificação...159 Estabilidade...161 Função de Resposta a Impulso... 164 Decomposição da Variância do Erro de Previsão... 166 Mais Variáveis... 167 Mais Defasagens... 168 Causalidade de Granger... 169 Análise multivariada VECM...170 Mais de um Vetor Cointegrante...174 Defasagens... 177 Testes de Cointegração de Johansen...178 Termos Determinísticos...179 Regressão Espúria... 183 Outro Teste de Cointegração... 184 Mais Restrições... 185 Outras decomposições... 186 Um Arcabouço para a Análise Multivariada... 189 Um Exemplo...191 Um Balanço... 197 Referências... 198 iv

Sumário Capítulo 5: Variáveis Dependentes Discretas e Limitadas... 203 Modelo de Probabilidade Linear... 205 Modelos de Resposta Binária...206 Modelo Logit... 207 Modelo Probit... 208 Modelo de Regressão de Poisson...215 O Processo de Poisson...216 Modelo de Variável Latente... 220 Modelo Tobit... 221 Modelos de Escolha Discreta Ordenadas... 225 modelos logit condicional e multinomial... 232 Apêndice 5.A. Método de Estimação por Máxima Verossimilhança (Mv)...241 Referências... 242 Capítulo 6: Causalidade e Estratégias de Identificação... 243 Aleatorização... 249 O Problema da Avaliação... 249 Experimento Aleatorizado... 252 Métodos de Aleatorização... 256 Possíveis Problemas com o Experimento Aleatorizado... 257 Pareamento por Escore de Propensão... 259 Uma Aplicação do Método PSM... 267 Método de Diferença em Diferenças...284 Uma Aplicação do Método DD...290 Estimador de Variáveis Instrumentais... 295 Método dos Mínimos Quadrados em Dois Estágios...300 Método Generalizado dos Momentos... 305 Referências...308 Capítulo 7: Análise de Dados em Painel...313 Modelos de Efeitos Fixos e de Efeitos Aleatórios...316 Modelo de Efeitos Fixos...319 Modelo de Efeitos Aleatórios... 324 Erros de Especificação... 331 Poolability... 331 Autocorrelação dos Resíduos... 333 Dependência em Cross-section... 338 Endogeneidade... 343 v

Econometria na Prática Modelos Dinâmicos de Dados em Painel...344 Estimador de Anderson e Hsiao (1982)...346 Estimador de Arellano e Bond (1991)... 349 Estimadores de Arellano e Bover (1995) e Blundell e Bond (1998)... 354 Apêndice 7.A. Dados em Painel Desbalanceados... 361 Apêndice 7.B. Séries Temporais em Cross-Section (Tscs)... 363 Referências... 373 Capítulo 8: Análise de Fronteira Estocástica de Produção... 379 Aspectos Teóricos...384 Modelo Empírico para Análise da Produção... 392 Fonte dos Dados... 393 Estimativa da Função Fronteira de Produção... 393 Procedimentos de Estimativa por Meio do Programa Stata 13... 394 Procedimentos de Estimativa por Meio do Programa Frontier 4.1...400 Apêndice 8.A. Dados Atualizados da Tese da Conceição (2004)...405 Apêndice 8.B. Índice de Eficiência Técnica dos Produtores Rurais...408 Apêndice 8.C. Saída dos resultados da análise de fronteira de produção pelo programa Frontier 4.1....412 Referências...416 Capítulo 9: Análise Envoltória dos Dados...419 Aspectos Teóricos e Exemplificação... 422 Análise Empírica Utilizando o Programa EMS... 435 Análise Empírica Utilizando o Programa Stata 13... 438 Apêndice 9.A. Dados Atualizados da Tese de Conceição (2004)... 442 Apêndice 9.B. Saída dos Resultados da Análise Envoltória de Dados pelo Programa Stata 13...445 Referências... 450 Apêndice A Tabelas Estatísticas... 453 Biografia dos Autores...465 Índice... 467 vi

PREFÁCIO Alunos de graduação e pós-graduação frequentemente enfrentam dificuldades na condução de análises empíricas com uso da econometria, fruto da lacuna existente entre os tradicionais livros de econometria e a aplicação prática desses ensinamentos com o manuseio de algum programa estatístico/econométrico. Particularmente para aqueles que não são da área de economia e estatística, os livros-textos são áridos e direcionam pouco conteúdo para a descrição mais detalhada dos passos concretos envolvidos em uma análise econométrica e na interpretação dos resultados. O principal objetivo deste livro é facilitar o uso do instrumental econométrico por economistas, contadores, administradores, e quaisquer outros estudantes e profissionais, que busquem uma análise correta e com rigor empírico. A análise teórica é feita de maneira simples e de fácil compreensão, restringindo, sempre que possível, o uso de fórmulas, provas e análise matricial comum em livros-textos de econometria. A finalidade do livro é ser um guia prático para as análises econométricas aplicadas às situações reais, detalhando o passo a passo envolvido na aplicação das principais estratégias utilizadas em trabalhos empíricos. O livro está dividido em nove capítulos. O capítulo introdutório apresenta a ideia central que está por trás da análise econométrica: estimar uma relação causal de interesse. Neste capítulo, serão apresentados os elementos básicos da análise empírica e as decisões iniciais que precisam ser tomadas, com base na fundamentação teórica construída e na análise preliminar dos dados a serem utilizados. O foco deste capítulo inicial é orientar quanto à avaliação das características das variáveis estudadas e à definição da relação entre elas. vii

Econometria na Prática Os demais capítulos do livro dedicam-se a expor os métodos econométricos mais comumente utilizados na pesquisa empírica. O Capítulo 2 apresenta o modelo de mínimos quadrados ordinários, que é a metodologia básica e utilizada de referência para a apresentação dos modelos seguintes. A popularidade deste método deve-se, em grande parte, à sua fácil aplicação, compreensão e ao baixo custo computacional. Contudo, em virtude da natureza e da disponibilidade dos dados, muitas vezes os estimadores de mínimos quadrados ordinários podem não ter as propriedades desejadas. Neste capítulo, são apresentados testes e possíveis correções para problemas que levam a estimadores enviesados e ineficientes. O Capítulo 3 dedica-se à análise da multicolinearidade e da construção de índices. Um dos problemas associados ao modelo simples de mínimos quadrados ordinários refere-se a situações em que o pesquisador dispõe de um número elevado de variáveis independentes que são correlacionadas. Nesses casos, pode ser interessante que o pesquisador construa índices que representem conjuntamente essas variáveis. Neste capítulo, duas dessas metodologias serão apresentadas: a análise de componentes principais e a análise de fatores. No Capítulo 4, o pesquisador conhecerá as estratégias utilizadas para minimizar uma outra dificuldade com o modelo de mínimos quadrados ordinários: a presença de autocorrelação de resíduos. Este problema é comum em séries temporais, ou seja, quando se utiliza de dados de variáveis de uma mesma unidade individual (e.g. indivíduo, empresa, município, estado ou país) ao longo do tempo. A análise de séries temporais tem por principal objetivo identificar e descrever formalmente padrões observados nos dados, integrando variáveis para investigar fenômenos e fazer previsões. Os modelos discutidos no Capítulo 4 são comumente utilizados em finanças, marketing, economia, demografia, dentre outras áreas de pesquisa. Dada a complexidade do tema, este capítulo apresenta uma discussão mais densa em relação aos demais capítulos do livro, embora o uso de exemplos discutidos detalhadamente facilite a compreensão do leitor. O Capítulo 5 apresenta algumas metodologias a serem adotadas em um caso especial de análise econométrica: quando a variável dependente é representada por números discretos e restritos a um determinado conjunto de valores. Este problema geralmente surge na análise de escolhas individuais, tais como as preferências de consumidores entre marcas viii

Prefácio alternativas de produtos, decisões eleitorais, escolhas comportamentais em sociedade e preferências sobre políticas governamentais alternativas. Os modelos de escolha discreta permitem modelar probabilidades e elaborar diagnósticos sobre a ocorrência de eventos a partir da utilização de determinadas distribuições de probabilidade. O Capítulo 6 apresenta um dos temas mais relevantes em econometria: causalidade e estratégias de identificação. A preocupação das metodologias apresentadas neste capítulo é com a definição de modelos e variáveis que permitam a correta especificação da relação de causalidade que o pesquisador deseja estabelecer ou confirmar. A dificuldade decorre da existência de efeitos não observáveis, que implicam na necessidade de controle da seleção amostral (grupo de tratamento), para garantir que os resultados obtidos possam ser generalizados para a população. Os métodos discutidos neste capítulo se propõem, na ausência de aleatoriedade dos dados amostrais, a identificar fontes de variação observáveis, utilizando estratégias que se aproximam de experimentos naturais. No Capítulo 7, o foco é o estudo de modelos com dados em painel, ou seja, quando se observam os valores de diferentes unidades individuais ao longo do tempo. Neste capítulo, é apresentada uma série de modelos alternativos para se lidar com tal estrutura de dados, trabalhando questões associadas à relação de causalidade e à dimensão temporal dos dados. Já os dois últimos capítulos dedicam-se ao estudo de metodologias utilizadas para análise de eficiência e de fronteira. Recentemente, vários agentes econômicos têm se preocupado com a forma como os recursos são alocados e esta obra não poderia se omitir em apresentar conteúdos introdutórios para análise da eficiência. Essas ferramentas têm aplicabilidade em vários campos da economia e de outras ciências sociais, e são utilizadas quando existe uma diferença entre o produto potencial e o real. O Capítulo 8 utiliza a análise econométrica na estimativa da eficiência produtiva, popularmente conhecida como análise de fronteira estocástica, enquanto, no Capítulo 9, a técnica utilizada para a análise da eficiência é a da programação matemática, cuja abordagem é feita pela análise envoltória dos dados. Ao longo do texto, serão apresentados casos práticos de aplicação das metodologias. Não foi utilizado um único software econométrico, até porque os softwares mais completos nem sempre são os mais simples de utilizar. Procurou-se adotar o software que é mais apropriado ou de mais ix

Econometria na Prática fácil utilização em cada metodologia, embora as orientações dos procedimentos descritas detalhadamente ao longo do texto permitam que o leitor replique os testes no software de sua conveniência. Os leitores podem obter os dados utilizados nos testes econométricos no site da editora. Que este livro contribua para desmistificar o uso da econometria, simplificando a compreensão de conceitos e de regras essenciais para o rigor científico da análise econométrica. Boa leitura! x

1 Fundamentos da Análise Empírica Gisele Ferreira Tiryaki Projetos empíricos em ciências sociais e em outros ramos da ciência têm por objetivo, em última instância, identificar como mudanças em uma variável impactam outra variável. Por exemplo, o pesquisador pode estar interessado em avaliar o efeito causal do gênero do indivíduo sobre o nível salarial, das inovações tecnológicas sobre o crescimento econômico, do background familiar dos indivíduos e seu desempenho escolar, do salário sobre a produtividade do trabalhador. É muito comum, ainda, pesquisadores dedicarem-se a analisar os impactos gerados por iniciativas em políticas públicas e por mudanças na legislação. Busca-se, portanto, estudar uma relação causal de interesse. Para Angrist e Pischke (2008), a identificação da relação causal possibilita fazer previsões sobre as consequências de modificações no status quo ou em políticas públicas, permitindo verificar qual seria o cenário caso tal mudança não tivesse acontecido (cenário contrafactual). Os métodos econométricos, por sua vez, permitem a avaliação da relação causal entre duas variáveis, levando em consideração outras informações que são importantes para o estudo em questão. Existem situações, contudo, em que os dados disponíveis não permitem estabelecer o cenário contrafactual. Nesses casos, resta ao pesquisador estar atento para identificar essas situações e ser criativo em propor soluções. Uma ilustração apresentada por Angrist e Pischke (2008) mostra, de maneira interessante, essa dificuldade. O que aconteceria se um pesquisador procurasse inferir os benefícios para o aprendizado infantil de iniciar a vida escolar mais tardiamente, aos sete anos? Em outras pala- 1

Econometria na Prática vras, o que aconteceria se o pesquisador quisesse testar a hipótese de que a maturidade ajuda no processo de aprendizado? Poderia, por exemplo, comparar o desempenho em termos de notas dos alunos na segunda série do ensino fundamental, criando uma variável que permitisse identificar os alunos que foram matriculados na escola aos sete anos (na primeira série), isolando-os dos alunos que entraram na escola mais novos. O problema surge porque aqueles alunos que começaram mais cedo na escola têm mais experiência, e seria difícil para o pesquisador, se não impossível, isolar o efeito da idade sobre o aprendizado do efeito experiência proporcionado pela entrada antecipada na escola. Qual seria a solução? Como o efeito experiência tende a ser minimizado à medida que as pessoas tornam-se adultas, é possível verificar se adultos que começaram na escola mais cedo apresentam diferencial de desempenho, em termos de média de nota ao longo da vida escolar ou do nível salarial. Outra dificuldade enfrentada pelos pesquisadores Amostragem populacional é diz respeito ao viés de seleção. Esse viés ocorre o processo de selecionar um quando a população não é corretamente representada pela amostra que está sendo utilizada na conjunto de sujeitos que é representativo da população. A amostragem é necessária análise. Os dois principais métodos de seleção sempre que for impossível amostral são: (i) não probabilístico, quando cada trabalhar com todos os participantes de uma população. ser selecionado e, portanto, o pesquisador não membro da população não tem chances iguais de está interessado nos parâmetros da população (e.g., estudos de caso, pesquisas qualitativas, desenvolvimento de hipóteses); ou (ii) probabilístico, quando cada indivíduo da população tem chances iguais de ser selecionado 1. A amostragem probabilística garante que o processo de seleção seja aleatório, sem viés. Em circunstâncias ideais, portanto, o pesquisador procura trabalhar com amostras aleatórias ou randômicas. No entanto, viés de seleção é comum acontecer, e o pesquisador=domizados) para aproximar os dados reais (randomizados). Assuma, por exemplo, que o pesquisador gostaria de verificar se cursar pós-graduação é um fator determinante para o salário do indivíduo. Normalmente, as pessoas que participam de cursos de pós-graduação são aquelas com diferencial de desempenho, já que foram aprovadas em pro- 1 Ver Kothari (2004) para detalhes quanto às estratégias de amostragem. 2 Gisele Ferreira Tiryaki

Fundamentos da Análise Empírica cessos seletivos. Em função de sua habilidade, esses indivíduos, provavelmente, teriam o potencial de receber maiores salários que a média, mesmo que decidissem por seguir diretamente para o mercado de trabalho. Neste contexto, para conduzir o experimento ideal, seria necessário comparar o salário de um indivíduo se ele cursasse a pós-graduação e o salário desse mesmo indivíduo se ele optasse por não fazer pós-graduação. A medida ideal do efeito causal da pós-graduação seria, portanto, a diferença salarial em potencial que um indivíduo teria se ele optasse pela pós-graduação. Essa medida, embora impossível de se obter, poderia ser representada pela seguinte expressão: 1.1. ] [ E w1, i / Di = 1 E w0, i / Di = 1 onde E representa o valor esperado de uma variável, w 1,i = salário do indivíduo i quando A Lei dos Grandes Números na este frequenta a pós-graduação, w 0,i = salário do indivíduo i se ele não tivesse cursado Teoria da Probabilidade garante que a média aritmética dos valores converge para o valor esperado, à medida que o número a pós-graduação, e D i é uma variável binária, que assume o valor de zero quando o indivíduo não frequenta a pós-graduação e o valor Ou seja, o valor esperado de uma de repetições tende ao infinito. unitário quando o indivíduo escolhe fazer a variável aleatória é o valor médio pós-graduação. Ou seja, essa medida hipotética compararia o salário esperado do indiví- das repetições do experimento. duo, dado que ele cursou a pós-graduação, com o salário esperado se ele não tivesse cursado 2. Portanto, a expressão acima pode ainda ser simplificada e reescrita da seguinte forma: 1.2. E w 1, i w 0, i / D i = 1 Essa expressão mostra, portanto, o ganho salarial para o indivíduo i, dado que ele optou pela pós-graduação. A dificuldade com essa medida ideal é que ela não pode ser obtida via condução de experimentos. Somente é possível observar a diferença média nos salários entre os indivíduos da amostra que cursaram a pós-graduação e os que não cursaram. Essa diferença observada, por sua vez, pode ser representada pela expressão: 2 A variável D i é igual a 1 nas duas situações, porque, de fato, esse indivíduo cursou a pós-graduação. Gisele Ferreira Tiryaki 3

Econometria na Prática 1.3. ] [ E wi / Di = 1 E wi / Di = 0 onde o primeiro termo representa o salário médio dos indivíduos que cursaram pós-graduação e o segundo termo representa o salário médio daqueles que não fizeram essa opção. A diferença entre a medida observada e a medida ideal é o viés de seleção: 1.4. ] [ ] [ ] [ ] [ E wi / Di = 1 E wi / Di = 0 E w1, i w0, i / Di = 1 = E w1, i / Di = 1 E w1, i / Di = 0 O viés de seleção captura o fato de que pessoas que buscam pós-graduação têm, em média, desempenho acadêmico diferenciado e potencial para salários maiores, mesmo se não optassem pela pós-graduação. É fundamental que os trabalhos empíricos busquem eliminar o viés de seleção, pois experimentos com vieses geram resultados e conclusões Variáveis aleatórias X 1, X 2,... e X K são independentes e identicamente distribuídas (i.i.d.) quando todas as variáveis X i possuem a mesma distribuição de probabilidade e são mutuamente independentes. equivocadas. Angrist e Pischke (2008), no entanto, mostram que a escolha aleatória dos indivíduos para compor a amostra elimina este viés. A condição de amostragem aleatória requer a definição da população de interesse, do modelo para a população e a seleção de uma amostra composta por observações independentes e identicamente distribuídas. A identificação da relação causal e a definição da estratégia de identificação constituem, portanto, elementos fundamentais na condução de trabalhos empíricos. Dessa forma, o processo de desenvolvimento de uma pesquisa empírica é estruturado com o propósito de definir claramente tais elementos, identificar o método apropriado de inferência estatística e analisar os resultados obtidos. Esse processo requer a condução de uma série de procedimentos relacionados, que muitas vezes se sobrepõem e que não precisam ser sequenciados. A Figura 1.1 sistematiza as etapas envolvidas no desenvolvimento de uma pesquisa empírica. 4 Gisele Ferreira Tiryaki