Análise Multivariada Aplicada à Contabilidade

Documentos relacionados
AULAS 14 E 15 Modelo de regressão simples

Exercícios Selecionados de Econometria para Concursos Públicos

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

A Metodologia de Box & Jenkins

4 Modelos de Regressão Dinâmica

Modelos de Regressão Linear Simples - Análise de Resíduos

M l u t l i t c i oli l n i e n arid i a d de

AULAS 25 E 26 Heteroscedasticidade

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

AULA 13 Análise de Regressão Múltipla: MQO Assimptótico

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) EXPERIMENTOS COM DOIS FATORES E O PLANEJAMENTO FATORIAL

étodos uméricos AJUSTE DE FUNÇÕES Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

ANOVA FACTORIAL EXEMPLO 1. ANOVA TWO-WAY COM O SPSS. a capacidade de reconhecimento do odor materno

Inferência para várias populações normais análise de variância (ANOVA)

INTRODUÇÃO. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ... ANÁLISE DE VARIÂNCIA. Departamento de Matemática ESTV.

Testes de hipóteses Paramétricos

AULA 07 Inferência a Partir de Duas Amostras

Homocedasticidade? Exemplo: consumo vs peso de automóveis

Econometria II. Equações simultâneas

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS EM ENGENHARIA

Correlação Serial e Heterocedasticidade em Regressões de Séries Temporais. Wooldridge, Cap. 12

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

4 Modelos Lineares Generalizados

Técnicas econométricas para avaliação de impacto O uso de métodos de regressão e introdução aos métodos de diferençasdas-diferenças

4. O algoritmo LMS e variantes

AULAS 28 E 29 Análise de Regressão Múltipla com Informações Qualitativas

Testes de Hipóteses Paramétricos

A Importância do Desenho Amostral. Donald Pianto Departamento de Estatística UnB

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

AULA 11 Heteroscedasticidade

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016.

AULA 01 Principais Conceitos em Econometria

Gabarito da 1 a Lista de Exercícios de Econometria II

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

Predição da Taxa de Desemprego Brasileira utilizando com Modelo de Regressão com Erros Autocorrelacionados

Econometria Semestre

Aula 2. ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos

Estatística - Análise de Regressão Linear Simples. Professor José Alberto - (11) sosestatistica.com.br

Mais de 12 mil séries de tempo relativas às economias brasileira e mundial, selecionadas por sua relevância e que podem ser acessadas de forma

Lista de exercícios 2 Sistemas de equações lineares II

Planejamento de Experimentos. 13. Experimentos com fatores aleatórios

O efeito interacção em modelos de equações estruturais

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Distribuição t de Student

9 Previsão da taxa de câmbio no Brasil

Análise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Procedimento Complementar para Validação de Métodos Analíticos e Bioanalíticos usando Análise de Regressão Linear

Intervalos de Confiança

Modelos de Regressão Múltipla - Parte VIII

Carga Horária: 80 horas (correspondem a aulas e atividades extra-classe)

IND 1115 Inferência Estatística Aula 6

Estatística e Probabilidade

VERSÃO RESPOSTAS PROVA DE MÉTODOS QUANTITATIVOS

Distribuição de Probabilidade de Poisson

DELINEAMENTO EM BLOCOS AO ACASO

Metodologias causais para estudos observacionais

FATORES EXPLICATIVOS DO SALDO DA BALANÇA COMERCIAL DO BRASIL 1990 A 1997

Simulação de Sistemas. Adaptado de material de Júlio Pereira Machado (AULA 17)

2 O Equity Risk Premium

Prof. Dr. Engenharia Ambiental, UNESP

Introdução à Inferência Estatística

MODELOS DE REGRESSÃO E DECOMPOSIÇÃO PARA DESCREVER O CONSUMO RESIDENCIAL DE ENERGIA ELÉTRICA NO BRASIL ENTRE 1985 E 2013

Escrita correta de resultados em notação

AMOSTRAGEM. É a parte da Teoria Estatística que define os procedimentos para os planejamentos amostrais e as técnicas de estimação utilizadas.

MEDIDAS DE DISPERSÃO. Os dados a seguir referem-se ao índice pluviométrico de três cidades no Estado de São Paulo, em 3 diferentes ocasiões

Intervalos de conança

Tratamento de dados e representação das incertezas em resultados experimentais

Química Analítica V 2S Prof. Rafael Sousa. Notas de aula:

Aula 7 Intervalos de confiança

a) 19% b) 20% c) Aproximadamente 13% d) 14% e) Qualquer número menor que 20%

14. Distribuição de Probabilidade para Variáveis Aleatórias Contínuas

Lista de exercícios 7 Independência Linear.

INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 EXAME: DATA 24 / 02 / NOME DO ALUNO:

Modelos de regressão para dados correlacionados. Cibele Russo

TÉCNICAS DE AMOSTRAGEM

Posicionamento com GNSS em Cenários de Multi-Constelação

Disciplina de Modelos Lineares

Seja (X,Y) uma v.a. bidimensional contínua ou discreta. Define-se valor esperado condicionado de X para um dado Y igual a y da seguinte forma:

Anexo 1 Análise de correspondências simples

Análise de Dados e Simulação

Inferência Estatística: Conceitos Básicos II

Um ambiente super amigável de trabalho com recursos poderosos de análise e acesso a uma ampla base de dados da economias brasileira e internacional.

Testes de Aderência, Homogeneidade e Independência

Métodos de Ensino. Práticas de ensino de algoritmos (Hazzan, Cap. 7) Péricles Miranda

Matriz de Variância e Covariância e o Teorema de Gauss-Markov

FAMÍLIA EXPONENCIAL DE DISTRIBUIÇÕES

RESUMO. sísmica empilhada. SEMBLANCE

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

Distribuição Amostral e Estimação Pontual de Parâmetros

Soluções da Colectânea de Exercícios

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 02 / Processos Aleatórios

Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações

Modelos ARCH e GARCH Aula 8. Morettin e Toloi, 2006, Capítulo 1 e 14 Morettin, 2011, Capítulo 1 e 5 Bueno, 2011, Capítulo 8

(ii) Acrescente lucros ao modelo da parte (i). Por que essa variável não pode ser

Módulo IV Medidas de Variabilidade ESTATÍSTICA

Técnicas econométricas para avaliação de impacto O uso de algoritmos de emparelhamento baseados em escore de propensão propensity score matching

Estatística II Aula 2. Prof.: Patricia Maria Bortolon, D. Sc.

Transcrição:

Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1

Agenda Aula 8/15 Regressão com Dados em Painel Tipos de Painel POLS Efeitos Fixos Efeitos Aleatórios Testes para escolha do modelo 2

Dados em Painel Dados coletados de diferentes elementos coletados ao longo do tempo Seção Transversal + Série Histórica Panel Data ou Dados Longitudinais 3

Dados em Painel CS Empilhada T Var 1 Var 2... Var m Obs 1 1 Obs 2 1...... Obs n 1 Obs 1 2 Obs 2 2...... Obs n 2...... Obs 1 Obs 2...... Obs n t t t 4

Dados em Painel ST Empilhada T Var 1 Var 2... Var m Obs 1 1 Obs 1 2...... Obs 1 Obs 2 1 Obs 2 2...... Obs 2...... Obs n 1 Obs n 2...... Obs n t t t 5

Painel: Dados Combinados Painel Balanceado: número de observações igual para todas as unidades de análise Painel Desbalanceado: existem dados faltantes por observação ao longo do tempo Não existe diferença prática entre os dois tipos de painel Cuidado com a origem dos dados faltantes, pois pode gerar viés para a análise Como a quantidade de dados no painel desbalanceado é menor, a eficiência do estimador diminui 6

Painel: Dados Combinados Painel Curto: painel com T < N Número de períodos no tempo é menor que número de observações na amostra Painel Longo: painel com T > N Número de períodos no tempo é maior que número de observações na amostra Não existe diferença prática entre os dois tipos de painel 7

Dados em Painel y it = α + βx it + u it Onde, y it é a variável dependente α é o intercepto β é um vetor de k 1 dos parâmetros a serem estimados nas variáveis explicativas x it é o vetor de 1 k das observações das variáveis explicativas t = 1,..., T i = 1,..., N 8

Vantagem dos Dados em Painel Primeiro, e talvez mais importante, podemos abordar uma gama mais ampla de questões e resolver problemas mais complexos, com dados em painel, do que seria possível com a série temporal pura ou dados transversais puros sozinhos 9

Vantagem dos Dados em Painel Em segundo lugar, muitas vezes é interessante examinar como as variáveis, ou as relações entre elas, muda dinamicamente (com o tempo) Para fazer isso usando dados de séries temporais puro, muitas vezes requerem um longo prazo de dados simplesmente para obter um número suficiente de observações para ser capaz de realizar quaisquer testes de hipóteses significativas. Mas, combinando dados de séries de secção transversal e de tempo, pode-se aumentar o número de graus de liberdade, e, portanto, a potência do teste, através do emprego de informação sobre o comportamento dinâmico de um grande número de entidades ao mesmo tempo. A variação adicional introduzida pela combinação dos dados desta forma também pode ajudar a mitigar os problemas de multicolinearidade que podem surgir se séries temporais são modelados individualmente 10

Vantagem dos Dados em Painel Em terceiro lugar, pela estruturação do modelo de forma adequada, pode-se remover o impacto de certas formas de viés nas variáveis omitidas no resultado de regressão 11

Dados em Painel POLS A maneira mais simples para lidar com tais dados seria estimar uma regressão agrupada (pooled), o que implicaria a estimativa de uma única equação em todos os dados em conjunto, de modo que o conjunto de dados para y é empilhado em cima de uma única coluna que contém todo o tempo em corte transversal e observações da série, e da mesma forma todas as observações sobre cada variável explicativa seriam empilhados em colunas individuais na matriz x. Então essa equação poderia ser estimado na forma usual usando MQO Conhecido como POLS Pooled Ordinary Least Square 12

Dados em Painel POLS É a técnica de painel mais simples e ingênua Desconsidera as dimensões de tempo e espaço Empilha-se as observações e obtém-se a regressão O principal problema é camuflar a Heterogeneidade que possa existir entre as variáveis. Os coeficientes estimados na equação, podem ser tendenciosos e inconsistentes (isso é tratado em Durbin-Watson) Simplesmente empilhamos todas as observações e estimamos uma regressão grande, desprezando a natureza de corte transversal e de séries temporais de nossos dados (Gujarati, 2011, p. 589) 13

Dados em Painel Efeitos Fixos Combina-se todas as observações, deixando que cada unidade de corte transversal tenha sua própria variável dummy (intercepto) Embora o intercepto possa diferir entre os indivíduos, o intercepto de cada indivíduo não varia com o tempo (Gujarati, 2011, p. 590/592) 14

Dados em Painel Efeitos Fixos Decomposição do termo de erro u it = μ i + v it μ i é um efeito específico individual e v it uma perturbação residual que varia ao longo do tempo e entidades y it = α + βx it + μ i + v it μ i carrega toda a informação fixa ao longo do tempo que afeta y it, por exemplo setor da empresa 15

Dados em Painel Efeitos Fixos Esse modelo poderia ser estimado utilizando uma abordagem com variáveis dummy, que seriam chamados de variável dummy de mínimos quadrados (LSDV) y it = βx it + μ 1 D1 i + μ 2 D2 i + + μ N DN i + v it Onde cada Di (exemplo D1) representa o valor 1 para aquela observação e zero para todas as demais O intercepto (α) dada a multicolinearidade entre a variável dummy e o intercepto 16

Dados em Painel Efeitos Fixos 17

Dados em Painel Efeitos Fixos Problemas: Se introduzirmos variáveis dummies demais, teremos um problema de falta de graus de liberdade Se introduzirmos variáveis dummies demais, existe a possibilidade de multicolinearidade MQVD pode não ser capaz de identificar o impacto das variáveis que não mudam ao longo do tempo Deve-se pensar cuidadosamente no termo de erro 18

Dados em Painel Efeitos Fixos Combinamos todas as observações, mas para cada empresa expressamos cada variável como um desvio de seu valor médio e, então, estimamos uma regressão de MQO contra esses valores corrigidos para a média (Gujarati, 2011, p. 590) 19

Dados em Painel Efeitos Fixos Como o modelo precisaria estimar N + k parâmetros, ele pode passar por uma transformação intragrupo y it y i = β x it x i + u it u i Deixando os dados centrados na média, sendo reescrito como y it = β x it + u it Com NT N k graus de liberdade 20

Dados em Painel Efeitos Fixos 21

Dados em Painel Efeitos Fixos de Tempo É possível ter um modelo de efeitos fixos de tempo, em vez de um modelo de efeitos fixos-entidade Com efeitos fixos de tempo, os interceptos seriam autorizados a variar ao longo do tempo, assumindo como sendo as mesmas entidades em cada ponto no tempo y it = α + βx it + λ t + v it λ t é um intercepto variável no tempo que captura todas as variáveis que afetam y it e que variam ao longo do tempo, mas são constantes transversalmente 22

Dados em Painel Efeitos Fixos de Tempo Da mesma forma pode ser descrito como y it = βx it + λ 1 D1 t + λ 2 D2 t + + λ T DT t + v it E passar por uma transformação intragrupo y it y i = β x it x i + u it u i Deixando os dados centrados na média, sendo reescrito como y it = β x it + u it 23

Dados em Painel Efeitos Fixos de Tempo Finalmente podemos juntar os dois modelos y it = βx it + μ 1 D1 i + μ 2 D2 i + + μ N DN i + λ 1 D1 t + λ 2 D2 t + + λ T DT t + v it Entretanto número de parâmetros a serem estimados passa a ser k + N + T e a transformação intragrupo neste modelo de duas vias seria mais complexa 24

Dados em Painel Efeitos Aleatórios Uma alternativa ao modelo de efeitos fixos descrito é o modelo de efeitos aleatórios, que também é conhecido como o modelo de erro de componentes. Tal como acontece com efeitos fixos, a abordagem de efeitos aleatórios propõe diferentes termos de intercepto para cada entidade e, novamente, esses interceptos são constantes ao longo do tempo, com as relações entre as variáveis explicativas e explicada assumindo ser a mesmo tanto de forma transversal como temporalmente 25

Dados em Painel Efeitos Aleatórios No entanto, a diferença é que, sob o modelo de efeitos aleatórios, os interceptos de cada unidade de corte transversal são assumidos como surgindo a partir de uma intersecção comum α (que é o mesmo para todas as unidades de corte transversal e ao longo do tempo), além de uma variável aleatória ε i que varia na seção transversal, mas é constante ao longo do tempo ε i mede o desvio aleatório de termo intercepto de cada entidade do intercepto global α 26

Dados em Painel Efeitos Aleatórios Podemos escrever o modelo de efeitos aleatórios como y it = α + βx it + ω it ω it = ε i + v it Onde, x it é um vetor 1 k das variáveis explicativas, mas ao contrário do modelo de efeitos fixos, não há variáveis do tipo dummy para capturar a heterogeneidade (variação) na dimensão transversal, isso ocorre via o termo ε i 27

Dados em Painel Efeitos Aleatórios Note-se que esta estrutura requer os pressupostos de que o novo termo de erro transversal ε i, tem média zero, seja independente do termo de erro de observação individual ( v it ), tenha constante variância σ 2 ε e seja independente das variáveis explicativas (x it ) O método MQO não é consistente para estimativa dos parâmetros, então utiliza-se o GLS 28

Dados em Painel Efeitos Aleatórios A transformação envolvida neste procedimento é para subtrair uma média ponderada de y it ao longo do tempo (isto é, apenas parte da média, em vez de toda a média como foi o caso para a estimativa de efeitos fixos) Uma quase subtração y it = y it θ y i e x it = x it θ x i Onde y i e x i são as médias ao longo do tempo de y it e x it respectivamente 29

Dados em Painel Efeitos Aleatórios θ é uma função da variância da observação do termo de erro, σ 2 v, e da variância do termo de erro específico da entidade,σ2 ε Onde y i e x i são as médias ao longo do tempo de y it e x it respectivamente θ = 1 Tσ 2 2 ε + σ v Essa transformação será precisa o quanto for necessário para garantir que não existem correlações cruzadas nos termos de erro, mas, felizmente, ele pode ser automaticamente implementada por pacotes de software σ v 30

Dados em Painel Efeitos Aleatórios Assim como para o modelo de efeitos fixos, com os efeitos aleatórios também não é conceitualmente mais difícil permitir a variação de tempo do que é para permitir a variação transversal. No caso de variação no tempo, um erro específico do termo de período de tempo é incluído y it = α + βx it + ω it ω it = ε t + v it Semelhante ao caso anterior, variando tanto na transversal quanto no tempo 31

Efeito Fixo ou Aleatório? Costuma-se dizer que o modelo de efeitos aleatórios é mais apropriado quando as entidades da amostra pode ser considerada como tendo sido selecionada aleatoriamente da população, mas um modelo de efeito fixo é mais plausível quando as entidades incluídas na amostra constituem efetivamente toda a população 32

Efeito Fixo ou Aleatório? Tecnicamente, a transformação envolvida no procedimento GLS sob a abordagem de efeitos aleatórios não irá remover as variáveis explicativas que não variam ao longo do tempo, e, portanto, o seu impacto em y it podem ser enumerados Além disso, uma vez que há menos parâmetros a serem estimados com o modelo de efeitos aleatórios (sem dummies ou transformação intragrupo para executar) e, portanto, graus de liberdade são guardados, o modelo de efeitos aleatórios deve produzir estimativa mais eficiente do que a abordagem de efeitos fixos 33

Efeito Fixo ou Aleatório? No entanto, a abordagem de efeitos aleatórios tem uma grande desvantagem que decorre do fato de que é válida somente quando o componente do termo de erro ω it é não correlacionado com todas as variáveis explicativas Esta suposição é mais rigorosa do que o correspondente no caso de efeitos fixos, porque com efeitos aleatórios que, portanto, exigem tanto ε t como v it para ser independente de todos os x it Isso também pode ser visto como uma questão de saber se todas as variáveis não observadas omitidas (que foram autorizados pela tendo diferentes intercepto para cada entidade) não estão correlacionados com as variáveis explicativas incluídas. Se eles não são correlacionadas, uma abordagem de efeitos aleatórios pode ser utilizado, caso contrário, o modelo de efeitos fixos é preferível 34

Escolha entre os Modelos Adaptação do Teste de Chow Teste para escolher entre efeito fixo e pols H 0 : Utilizar pols Teste Breusch-Pagan Teste para escolher entre efeito aleatório e pols H 0 : Utilizar pols Teste de Hausman Para escolher entre efeito fixo e efeito aleatório H 0 : Utilizar efeito aleatório 35

Sequência de Procedimentos Dados em Painel Obter o modelo POLS Obter o modelo EF Utilizar adaptação do teste de Chow para escolher entre POLS e EF Obter o modelo EA Utilizar teste de Breusch-Pagan para escolher entre POLS e EA Utilizar teste de Hausman para escolher entre EF e EA 36

Sequência de Procedimentos Dados em Painel Em caso de empate? Os resultados sugerem que não existem diferenças significativas entre os modelos, portanto, qualquer um deles pode explicar adequadamente os resultados No final das contas, como escolher: Análise entre amostra e população O que se deseja analisar, efeitos dentro das empresas (efeitos fixos) ou indiscriminados? A argumentação teórica pode ser mais convincente que os resultados práticos dos testes 37

Obrigado pela Atenção!!! Até a próxima aula mbotelho@usp.br www.marcelobotelho.com 38