Diagnóstico do Modelo e Tratamento. Frases. Roteiro

Tamanho: px
Começar a partir da página:

Download "Diagnóstico do Modelo e Tratamento. Frases. Roteiro"

Transcrição

1 Diagnóstico do Modelo e Tratamento Frases Por serem mais precisos que as palavras, os números são particularmente adequados para transmitir conclusões científicas Pagano e Gauvre, 4 Roteiro. Suposições do Modelo. Análise de Resíduos 3. Aplicação 4. Tratamento de Outliers 5. Transformações Estabilizadoras de Variância 6. Omissão de Variáveis 7. Referências

2 Suposições do Modelo i = + βx i Y β + ε i os termos de erro (e, e,..., e n ) são variáveis aleatórias independentes; E{e i } = ; Var{e i } = s ; e e i ~ N, y E{Y}=β +β x x Verificação da Adequação do Modelo () O modelo é adequado? A relação entre a resposta e o regressor é linear, pelo menos aproximadamente? Os erros têm distribuição normal? Os erros são independentes (nãocorrelacionados)? Verificação da Adequação do Modelo () Os erros têm variância constante (homocedasticidade)? Existem valores discrepantes (outliers)? Foram omitidas variáveis importantes do modelo?

3 Verificação da Adequação do Modelo (3) Considerar a validade das hipóteses no exame da adequação do modelo As violações às hipóteses podem levar a: modelos instáveis estimação imprecisa Análise de Resíduos Análise dos Resíduos Um diagnóstico das suposições do modelo Valor ajustado ˆ = β + β yi x i y i e i y ˆ i = β + β x i ŷ i Resíduo eˆ = y yˆ i i i x i

4 Gráficos Utilizados no Diagnóstico Resíduos versus variáveis preditoras; Resíduos versus valores ajustados; Resíduos versus tempo (ou outro tipo de seqüência). Gráfico de normalidade dos resíduos. Histograma dos resíduos Gráficos Complementares Gráfico dos resíduos absolutos ou quadráticos versus variáveis explicativas. Gráfico dos resíduos versus variáveis preditoras omitidas do modelo. Box-plot dos resíduos. Verificação de Normalidade Muitos procedimentos estatístico adotam a hipótese de normalidade dos dados Assim, é freqüente a necessidade de verificação de normalidade dos dados No Minitab, uma das maneiras de verificar a adequação do modelo (normal e outros) é através do Probability Plot

5 Verificação de Normalidade Para verificação de normalidade, há três testes disponíveis: Ryan-Joiner Kolmogorov-Smirnov, Anderson-Darling (é default do Minitab) Para acessá-los Stat > Basic Statistics > Normality Teste Variável a ser verificada Normalidade de Amostra N Probability Plot of N - Anderson Darling Normal Probability Plot of N Ryan-Jones Normal Mean 86,87 StDev 4,35 N 9 AD,49 P-Value, Mean 86,87 StDev 4,35 N 9 RJ,995 P-Value >, Percent Percent N N 9 95 Probability Plot of N - Kolmogorov-Smirnov Percent Normal Mean 86,87 StDev 4,35 N 9 KS,83 P-Value >,5 Há evidências de normalidade através de todas as estatísticas de teste N 9 95

6 Normalidade dos Resíduos A normalidade é uma hipótese importante para as inferências envolvendo o modelo de regressão linear (teste de hipóteses, intervalo de confiança, etc.) A falta de normalidade pode ser uma indicação de heterocedasticidade ou falta de ajuste do modelo Resíduos vs Valores Ajustados e e ŷ i ŷ i Não há defeitos óbvios no modelo A variância é crescente de y. função Resíduos vs Valores Ajustados ê ê ŷ i ŷ i Ocorre freqüentemente quando y é uma proporção entre e. Modelo não linear. Pode indicar necessidade de outros regressores.

7 Resíduos vs. Regressor e ŷ i Exibem os mesmos padrões anteriores. No caso de regressão linear simples é necessários plotar apenas um dos gráficos (ou com valor ajustado ou com regressor). Não Linearidade A verificação de adequação da função de regressão aos dados Uma verificação empírica pode ser efetuada através do gráfico dos resíduos vs. valores ajustados (ou vs. explicativas). Resíduos vs. preditoras com padrão sistemático: positivos para valores baixo; negativos para valores médios positivos para valores altos. Nos casos em que houver um comportamento sistemático, devem-se incluir termos adicionais ou alternativos.

8 Heterocedasticidade Em geral, sua presença é verificada pelo gráfico dos resíduos vs variáveis explicativas (ou valores ajustados). Heterocedasticidade tende a produzir um gráfico com forma de funil. Heterocedasticidade Situações em que pode ocorrer: Lucro vs. Tamanho da empresa: empresas maiores tendem a ter maior dispersão nos seus lucros. Consumo de um Bem vs. Renda: pessoas ricas podem escolher melhor a proporção da renda consumida em determinado bem. Autocorrelação Serial Os resíduos estão correlacionados e o valor de um resíduo passa a influenciar os resultados dos valores ajustados da resposta. A idéia da autocorrelação serial é que os resíduos contém mais informação sobre a variável dependente do que aquilo que foi filtrado pelas variáveis explicativas. Em termos técnicos, o resíduo ainda pode ser sistematizado.

9 Fontes de autocorrelação serial: Omissão de variável relevante; Má especificação da forma funcional Em geral, autocorrelação é encontrada em séries de tempo. Resíduos vs. Seqüência ê i tempo ê i Necessário para dados obtidos em seqüência (tempo, etc) Se os resíduos são independentes, distribuem-se aleatoriamente em torno de zero Pode indicar omissão de variável Análise dos Resíduos y e x Gráfico dos dados: (x i, y i ) x Gráfico dos resíduos: (x i, e i ) As suposições do modelo parecem satisfeitas?

10 Padronização dos Resíduos Útil para detectar valores extremos (discrepantes) Resíduos padronizados: d ˆ = i eˆ i σˆ Resíduos potencialmente outliers: dˆ i > 3 Resíduo Studentizado Melhora a escala do resíduo, utilizando o desvio-padrão exato. Var ( x i x) ( eˆ ) = σ + i n Pontos próximos ao valor médio de x terão pior ajuste de mínimos quadrados (maior variância) Permitem a detecção de violações em pontos remotos (mais prováveis) S xx Outliers São valores extremos (atípicos), ou seja, são observações que não são bem ajustadas pelo modelo. Podem ser identificados a partir de um gráfico dos resíduos vs a variável preditora (ou valores ajustados). O uso de resíduos padronizados (ou studentizados) são úteis para identificar resíduos que estão muito afastados de zero, (em escala de desvios-padrão)

11 Outliers podem influenciar fortemente o ajuste de mínimos quadrados; Não devem ser desprezados, admitindo-se seu descarte se representam um erro de registro, erro de medida, falha de equipamento ou algum problema similar. Gráfico de resíduos padronizados, sem outliers. Aplicação

12 Um Modelo Econômico Objetivo: Estudar a relação entre renda familiar e despesas com alimentação. Experimento: Amostra aleatória de residências, com renda familiar semanal maior que $48 Característica de interesse: Despesa semanal da residência com alimentação Quanto foi gasto com alimentação na semana passada? Modelo Proposto Y i = ß + ß x i + e i Variáveis: Resposta (Y i ) : Despesa com alimentação Explicativa(x i ): Renda Familiar Semanal Erro (e i ): Todos os fatores que afetam Y, exceto renda Dados: alimentacao 3 Despesa com Alimentação 5 Alimentação Renda Semanal MTB > correlation c c3 Correlations: Alimentação; Renda Semanal Pearson correlation of Alimentação and Renda Semanal =,546 P-Value =, Há indícios de associação linear entre renda e despesas com alimentação

13 Ajuste de Mínimos Quadrados Stat > Regression > Regression Saída Minitab Regression Analysis: Alimentação versus Renda Semanal The regression equation is Alimentação = 4,8 +,8 Renda Semanal Predictor Coef SE Coef T P Constant 4,77,4,84,73 Renda Semanal,89,354 4,, S = 37,854 R-Sq = 3,7% R-Sq(adj) = 9,9% Analysis of Variance Source DF SS MS F P Regression 5 5 7,65, Residual Error Total Unusual Observations Renda Obs Semanal Alimentação Fit SE Fit Residual St Resid 73,9 4,7 -,65 -,6 58 5,5 X , 47,67 7,7 79,44,4R ,43 87,8 4,8-7,75 -,6RX ,3 88,89 5,7 8,4,3RX R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large influence. Reta de Regressão Stat > Regression > Fitted Line Plot

14 3 Alimentação = 4,77 +,83 Renda Semanal 5 Alimentação 5 S 37,854 R-Sq 3,7% R-Sq(adj) 9,9% Renda Semanal Análise dos Resíduos Residual Plots for Alimentação Percent Normal Probability Plot of the Residuals Residuals Versus the Fitted Values 5 Fitted Value Histogram of the Residuals Residuals Versus the Order of the Data Frequency, 7,5 5,,5, Observation Order Teste de Normalidade Obtenção dos resíduos: Stat > Regression > Regression

15 Teste de Normalidade Stat > Basic Statistics > Normality Teste Resíduos Armazenados Teste de Normalidade dos Resíduos Probability Plot of SRES Normal Percent Mean -,6 StDev,3 N 4 AD,496 P-Value, SRES 3 Não há evidências para se rejeitar a normalidade dos resíduos Conclusões Não há evidências para se rejeitar a hipótese de normalidade dos resíduos; Os resíduos aparentam estar correlacionados O gráfico de resíduos vs. valores ajustados apresentam padrão indicador de heterocedasticidade ou omissão de variável relevante.

16 Conclusões Neste caso, provavelmente a renda não é suficiente para explicar o consumo (R é baixo) Sugere-se o uso de mais variáveis explicativas para verificar se é possível o ajuste de modelo mais adequado. Conseqüências das Violações das Hipóteses Heteroscedasticidade: Sua presença tende a não viesar as estimativas dos parâmetros. As variâncias estimadas não serão as corretas. Logo, as inferências sobre os parâmetros estarão má especificadas. Conseqüências das Violações das Hipóteses Autocorrelação serial: As variâncias estimadas não serão as corretas, Há possibilidade de viés nas estimativas se o problema for devido à omissão de variáveis relevantes no modelo.

17 Tratamento de Outliers Outliers Pontos situados fora do padrão global das demais observações; Esses pontos discrepantes podem trazer problemas sérios no ajuste do modelo e na estimação dos parâmetros. Outliers e Observações Influentes Uma observação é influente se sua remoção modifica substancialmente o resultado Os ouliers na direção de y têm grandes resíduos de regressão Os outliers na direção de x em geral são inlfuente para a reta de regressão, sem apresentar necessariamente grande resíduos.

18 Exemplo Telefones vs ICMS Dados sobre número de telefones e arrecadação do ICMS em 3 sub-regiões administrativas do estado de São Paulo. Observações padronizadas em relação ao número de habitantes de cada sub-região # telefones telefone = x. # habitantes Planilha: telefones Fonte: Bussab et al. (988) Total de ICMS( em $.) arrecadacao = # habitantes Dados Sub-região Qte. Telefones Arrecadação ICMS Região Dracena 4,95 Interior Adamantina 44,39 Interior Avaré 48,5 Interior Catanduva 53 3, Interior Araçatuba 56 3,63 Interior Lins 58 3,54 Interior Assis 58 3,65 Interior Franca 65 4,49 Interior S. Carlos 68 5,78 Interior Bauru 7 5,4 Interior S. Sebastião 77,4 Litoral S. J. Campos 86 3,94 Vale do Paraíba S. Paulo 38,66 Capital Caso Apenas Interior Regression Analysis: arrecadacao versus telefones The regression equation is arrecadacao = - 3,48 +,7 telefones Predictor Coef SE Coef T P Constant -3,4768,67-5,79, telefones,69,55,3, Regressão significante S =,365 R-Sq = 94,8% R-Sq(adj) = 94,% Analysis of Variance Source DF SS MS F P Regression 3,553 3,553 44,7, Residual Error 8,749,94 Total 9 4,3 Unusual Observations S. Carlos Obs telefones arrecadacao Fit SE Fit Residual St Resid 9 68, 5,78 5,54,577,676,39R R denotes an observation with a large standardized residual.

19 Caso Reta Ajustada Caso - Apenas Interior 6 5 arrecadacao = - 3,477 +,69 telefones S. Carlos Arrecadação Qte. telefones Caso Análise Gráfica de Resíduos Residual Plots for arrecadacao Percent Normal Probability Plot of the Residuals Residuals Versus the Fitted Values Fitted Value Frequency 3 Histogram of the Residuals -, -,5,,5,,5,,5 Residuals Versus the Order of the Data Observation Order Caso Interior e Litoral Regression Analysis: arrecadacao versus telefones The regression equation is arrecadacao =,64 +,48 telefones Predictor Coef SE Coef T P Constant,64,34,8,789 telefones,4797,3935,,54 Regressão não significante S =,3884 R-Sq = 4,% R-Sq(adj) = 4,6% Analysis of Variance Source DF SS MS F P Regression,84,84,49,54 Residual Error 9 7,,9 Total,5 Unusual Observations S. Sebastião Obs telefones arrecadacao Fit SE Fit Residual St Resid 77,,4 4,334,853-3,94 -,93R R denotes an observation with a large standardized residual.

20 Caso Reta Ajustada Caso - Interior e Litoral 6 5 arrecadacao =,64 +,4797 telefones Arrecadação ICMS 4 3 S. Sebastião Qte. de telefones Alta taxa de telefones instalados e baixa arrecadação Caso Análise Gráfica de Resíduos Percent Normal Probability Plot of the Residuals , -,5,,5 3, Residual Plots for arrecadacao Residuals Versus the Fitted Values ,5 3, 3,5 4, 4,5 Fitted Value Frequency 6, 4,5 3,,5, Histogram of the Residuals Residuals Versus the Order of the Data Observation Order Caso 3 Interior e Interior Industrializado Regression Analysis: arrecadacao versus telefones The regression equation is arrecadacao = - 9,8 +,34 telefones Predictor Coef SE Coef T P Constant -9,8,9-4,,3 telefones,3375,375 6,3, Regressão significante S =,5456 R-Sq = 8,6% R-Sq(adj) = 79,5% Analysis of Variance Source DF SS MS F P Regression 9,94 9,94 39,8, Residual Error 9,373,64 Total,467 Unusual Observations S. J. Campos Obs telefones arrecadacao Fit SE Fit Residual St Resid 86, 3,94,9, 3,8,94R R denotes an observation with a large standardized residual.

21 Caso 3 Reta Ajustada Caso 3 - Interior e Interior Industrializado 4 arrecadacao = - 9,8 +,337 telefones S. J. Campos Arrecadação ICMS Qte. de telefones Alta arrecadação; telefones instalados fora do padrão geral Caso 3 Análise Gráfica de Resíduos Percent Normal Probability Plot of the Residuals , -,5,,5 3, Residual Plots for arrecadacao Residuals Versus the Fitted Values 3 -,,5 5, 7,5, Fitted Value Frequency 3 Histogram of the Residuals -, -,6,,6,,8,4 3, Residuals Versus the Order of the Data Observation Order Caso 4 Interior e Capital Regression Analysis: arrecadacao versus telefones The regression equation is arrecadacao = -,66 +, telefones Predictor Coef SE Coef T P Constant -,669,68-9,9, telefones,9,39 8,6, Regressão significante S =,363 R-Sq = 98,9% R-Sq(adj) = 98,8% Analysis of Variance Source DF SS MS F P Regression 87,6 87,6 87,69, Residual Error 9,958,6 Total 88, Unusual Observations Capital Obs telefones arrecadacao Fit SE Fit Residual St Resid 4,969,999,87,63R ,78 38,66,8,377 -,5 -,4 X R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large influence.

22 Caso 4 Reta Ajustada Caso 4 - Interior e Capital Aarrecadação de ICMS arrecadacao = -,66 +, telefones Capital 5 75 Qte. de telefones 5 5 Taxa de telefones instalados muito afastada Caso 4 Análise Gráfica de Resíduos Residual Plots for arrecadacao Percent Normal Probability Plot of the Residuals Residuals Versus the Fitted Values Fitted Value Frequency 4,8 3,6,4,, Histogram of the Residuals - 3 Residuals Versus the Order of the Data Observation Order Comparação dos Casos Caso - Apenas Interior Caso - Interior e Litoral arrecadacao = - 3,477 +,69 telefones arrecadacao =,64 +,4797 telefones Arrecadação 4 3 Arrecadação ICMS Qte. telefones Qte. de telefones Caso 3 - Interior e Interior Industrializado Caso 4 - Interior e Capital 5 arrecadacao = - 9,8 +,337 telefones Arrecadação ICMS 5 Aarrecadação de ICMS 9 6 arrecadacao = -,66 +, telefones Qte. de telefones Qte. de telefones

23 Comparação dos Casos Caso Caso Caso 3 Caso 4 Inclinação ep βˆ ) (,69,55,4797,3935,3375,375,9,39 Estatística T,3, 6,3 8,6 R 94,8% 4,% 8,6% 98,9% σˆ,94,9,64,6 Intercepto -3,4768,64-9,8 -,669 Modelo : Modelo significante; Comentários Análise gráfica de resíduos não fornece evidências de as suposições terem sido violadas O modelo parece ser adequado para explicar o aumento da arrecadação Modelo : Comentários () Observação acrescentada é litorânea, com muitas residências temporárias (alta taxa de telefones e baixa arrecadação) A regressão não é significante É razoável adotar o modelo sem esta observação

24 Modelo 3: Comentários (3) A observação acrescentada tem arrecadação alta, mas nem tanto o nível de telefones instalados. É razoável adotar o modelo, com ressalva desta situação (esperam-se poucas situações com o mesmo comportamento) Modelo 4: Comentários (4) A observação acrescentada não afeta as estimativas do modelo ; É um ponto que pode ser eliminado, pois, é praticamente caso único (valor exagerado da variável preditora x) Tratamento de outliers Outlier é um problema sério na construção de modelos de regressão: Etapas para detecção e tratamento: Identificação de possíveis pontos discrepantes; Avaliação dos efeitos sobre as estimativas e previsões Análise criteriosa para eliminação ou não da observação

25 Tratamento de Outliers () Pontos discrepantes resultados claramente de erro de mensuração devem ser corrigidos ou removidos do conjunto de dados; Outro tipo de outlier: Usa-se a análise de resíduos para detectar o ponto que apresenta resíduo muito grande (observações desajustadas) Exemplo 3 Desemprego Juvenil Taxas de desemprego de adolescentes e seguro desemprego, na Austrália, de 96 a 98 Variáveis: y : taxa de desemprego adolescentes homens y : taxa de desemprego adolescentes mulheres x: seguro desemprego (dólares constantes 98) Fonte: Maddala Planilha: desemprego_adol_australia Regression Analysis: Homens versus Dólares ctes 98 Homens The regression equation is Homens =,48 +, Dólares ctes 98 Predictor Coef SE Coef T P Constant,478,7,,6 Dólares ctes 98,83,343 6,7, S =,98987 R-Sq = 69,% R-Sq(adj) = 67,3% Analysis of Variance Source DF SS MS F P Regression 34,76 34,76 38,, Residual Error 7 5,97 8,94 Total 8 49,7 Dólares ctes Obs 98 Homens Fit SE Fit Residual St Resid 3,3 4,5 5,96,887 -,796 -,8 3, 3,4 5,75,889 -,875 -,66 3,7,5 5,69,9 -,669 -,94 4, 4,4 5,63,9 -,663 -,3 5,9 3, 4,999,98 -,899 -,67 6,6 4, 4,936,95 -,836 -,9 7,3 4,7 4,87,93 -,7 -,6 8 4, 5,8 5,465,869,335, 9 3,4 5,7 5,37,884,383,3,5 6,9 5,6,94,774,6, 8,6 6,75,76,885,65 54, 7,6 3,939,83-6,339 -,7R 3 6,7,9 5,76,35-3,86 -, ,8 4,6 5,993,357 -,393 -,5 5 55,8 3,6 4,99,9 -,699 -,5 6 5, 7, 3,33,6 3,797, ,4 6,4,59,97 3,88, , 5,9,68,86 4,9, ,5 5,7,846,764 4,854, R denotes an observation with a large standardized residual.

26 Dólares (Base: 98) Taxa de Desemprego e Seguro Desemprego - Adolescentes Homens Homens =,478 +,8 Dólares ctes Taxa de Desemprego (%) Austrália, 96 a Percent 6 7 Residual Plots for Homens Normal Probability Plot of the Residuals Residuals Versus the Fitted Values - - 5, 7,5,,5 5, Fitted Value Frequency 6, 4,5 3,,5, Histogram of the Residuals - - Residuals Versus the Order of the Data Observation Order Regression Analysis: Mulheres versus Dólares ctes 98 Mulheres The regression equation is Mulheres = 3,3 +,6 Dólares ctes 98 Predictor Coef SE Coef T P Constant 3,34,4,35,3 Dólares ctes 98,66,3943 5,73, S = 3,4368 R-Sq = 65,9% R-Sq(adj) = 63,9% Analysis of Variance Source DF SS MS F P Regression 388,6 388,6 3,86, Residual Error 7,74,8 Total 8 588,79 Dólares ctes Obs 98 Mulheres Fit SE Fit Residual St Resid 3,3 5,9 6,3,9 -,4 -,3 3, 4,5 6,98, -,798 -,55 3,7 4,4 6,85,34 -,785 -,54 4, 5, 6,7,47 -,97 -,3 5,9 5,5 6,4,55 -,54 -,5 6,6 5,7 5,937,63 -,37 -,7 7,3 6, 5,869,7,3,4 8 4, 6,3 6,5,999 -, -,6 9 3,4 5, 6,343,6 -,43 -,38,5 6, 6,4,39 -,4 -,, 9,3 7,835,876,465,44 54, 7,8 5,544,45-7,744 -,4R 3 6,7,3 7,488,53-5,88 -, ,8 6,7 7,737,56 -,37 -, ,8 5,6 5,98,97 -,38 -, 6 5, 8,8 4,866,56 3,934, 7 47,4 8,8 4,9,54 4,77, , 8,9 3,57,95 5,843, ,5 7,6,44,879 5,356, R denotes an observation with a large standardized residual. Resumo yˆ =,478 +,x R (,7) (,343) yˆ = 3,34 +,6x R (,4) (,394) = 69,% = 65,9% As estimativas dos coeficientes de x não mudaram muito e estão mais precisas Os valores de R estão mais altos

27 Dólares (Base: 98) Taxa de Desemprego e Seguro Desemprego - Adolescentes Mulheres, Mulheres = 3,34 +,6 Dólares ctes 98 Taxa de desemprego (%) 7,5 5,,5, 7,5 5, Austrália, 96 a Percent 6 7 Residual Plots for Mulheres Normal Probability Plot of the Residuals Residuals Versus the Fitted Values Fitted Value Frequency Histogram of the Residuals - - Residuals Versus the Order of the Data Observation Order Exclusão dos Valores Outliers Minitab Data > Copy > Columns to Columns Regression Analysis: Homens_ versus Dólares ctes 98_ The regression equation is Homens_ =,6 +,3 Dólares ctes 98_ Exclusão dos Valores Outliers Saídas Predictor Coef SE Coef T P Constant,557,63 3,53,5 Dólares ctes 98_,69,96 8,83, S =,459 R-Sq = 87,6% R-Sq(adj) = 86,5% Analysis of Variance Source DF SS MS F P Regression 54,4 54,4 77,93, Residual Error,74,98 Total 75,78 Regression Analysis: Mulheres_ versus Dólares ctes 98_ The regression equation is Mulheres_ =,8 +,5 Dólares ctes 98_ Predictor Coef SE Coef T P Constant,7985,3936 7,, Dólares ctes 98_,55,48 5,, S =,96736 R-Sq = 95,5% R-Sq(adj) = 95,% Analysis of Variance Source DF SS MS F P Regression 89,9 89,9 3,97, Residual Error 9,4,8 Total 98,94

28 Resumo Exclusão Valores yˆ =,56 +,3x R (,6) (,3) yˆ =,799 +,5x R (,394) (,48) = 87,6% = 95,5% Equações sugerem que aumento no seguro desemprego leva a aumento na taxa de desemprego Resíduos grandes para 973, 974 e 977 a 98. Comentários Neste exemplo não seria correto a exclusão das observações com altos resíduos Os resíduos podem ser devidos ao lapso de tempo entre o requerimento do benefício e sua concessão, que deveria ser incorporado no modelo O exemplo ilustra o fato de que nem todos os outliers devem ser excluídos Transformações Estabilizadoras

29 Homocedasticidade É hipótese fundamental na derivação das propriedades amostrais dos estimadores Exemplo de heterocedasticidade: Espera-se que o ganho assalariado segundo o nível de instrução não seja homogêneo : Baixo nível de instrução Salários baixos e próximos uns dos outros A ausência de homogeneidade apresenta quase sempre um padrão identificável; A variabilidade é, em geral, função da variável preditora ou de uma outra variável independente. Os EMQO, em presença de heterocedasticidade continuam nãoviciados, mas não possuem mais a propriedade de variância mínima; É importante corrigir a heterocedasticidade Correção da Heterocedasticidade Mínimos quadrados ponderados; Transformação da variável respota y ou da preditora x Transformações estabilizadoras da variância

30 Transformação de Estabilização Variância () Gráfico do Resíduo: e ŷ i Transformação: y Recomendada quando Var(e i ) é proporcional a x i. Transformação de Estabilização Variância () Gráfico do Resíduo: e ŷ i Transformação: log y Sugerido quando a variância cresce mais acentuadamente, isto é, proporcional a x i. Transformação de Estabilização Variância () Gráfico do Resíduo: ê Transformação: ŷ i arcsen y Sugerido quando a variável resposta é do tipo proporção, isto é, =y =.

31 Exemplo 4 Empresa de Eletricidade Investigar relacionamento entre demanda diária de pico (kw) e consumo total de energia elétrica (kwh) Problema: enquanto o consumidor paga pelo uso da energia, o sistema de geração deve ser grande o suficiente para atender a máxima demanda Planilha: energia_eletrica Saída Dados Originais Regression Analysis: Demand (kw) versus Usage (kwh) The regression equation is Demand (kw) = -,833 +,3683 Usage (kwh) S =,577 R-Sq = 7,5% R-Sq(adj) = 69,9% Analysis of Variance Source DF SS MS F P Regression 3,633 3,633,66, Error 5 6,866,488 Total 5 49,499 Regressão Ajustada Dados Originais 6 4 Fitted Line Plot Demand (kw) = -,833 +,3683 Usage (kwh) S,577 R-Sq 7,5% R-Sq(adj) 69,9% Demand (kw) Usage (kwh) 3 4

32 Gráficos de Resíduos Dados Originais Heterocedasticidade Percent Normal Probability Plot of the Residuals Residual Plots for Demand (kw) Residuals Versus the Fitted Values Fitted Value Frequency Histogram of the Residuals - - Residuals Versus the Order of the Data Observation Order Saída Dados Transformados Regression Analysis: SQR(Demand)* versus Usage (kwh) The regression equation is SQR(Demand)* =,58 +,953 Usage (kwh) S =,46444 R-Sq = 64,8% R-Sq(adj) = 64,% Analysis of Variance Source DF SS MS F P Regression,585,585 94,8, Error 5,98,53 Total 5 3,47 Regressão Ajustada Dados Transformados Fitted Line Plot SQR(Demand)* =,58 +,953 Usage (kwh) 4 S,46444 R-Sq 64,8% R-Sq(adj) 64,% 3 SQR(Demand)* Usage (kwh) 3 4

33 Gráfico de Resíduos Dados Transformados Residual Plots for SQR(Demand)* Percent Normal Probability Plot of the Residuals , -,5,,5 3, - Residuals Versus the Fitted Values 3 4 Fitted Value Frequency Histogram of the Residuals Residuals Versus the Order of the Data Observation Order Comparação Gráfico de Resíduos Residuals Versus the Fitted Values (response is Demand (kw)) - - Residuals Versus the Fitted Values (response is SQR(Demand)*) Fitted Value ,,5,,5 Fitted Value 3, 3,5 4, Transformações Estabilizadoras Relação de s a E(Y) σ σ σ constante E( Y ) E( Y σ σ σ )[ E( Y )] [ E(Y ] ) [ E(Y ] 3 [ E(Y ] 4 ) ) Transformação y ' = y ' = y y y ' = arcsen( y ) y'= log y ( ) y' = y y' = y

34 Comentários A força da transformação depende da quantidade de curvatura que ela induz Pode ir de moderada (vx ), `a forte (/x) Geralmente transformação moderada sobre faixa de valores estreita produz pouco efeito y y max min < ou 3 Por outro lado, transformação forte sobre faixa de valores estreito trará efeito dramático na análise Em geral, a transformaçãofornecerá estimativas mais precisas dos parâmetros do modelo Intervalos de confiança e de predição podem ser covertidos diretamente de uma métrica a outra, mas não se assegura que eles sejam os menores possíveis. Omissão de Variáveis

35 Referências Bibliografia Recomendada Hill, R. C., Griffiths, W. E. e Judge, G. (Saraiva) Econometria Gujarati, D. N. (Pearson) Econometria Básica Maddala, G. S. (LTC) Introdução à econometria

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos 1 Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 27 de Setembro de 2016 2 3 O modelo de regressão linear é dado por 3 O modelo de regressão linear é dado por Y i = β

Leia mais

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 1 de Setembro de 2014 3 O modelo de regressão linear é dado por Y i = β 0 + β 1 x i + ɛ i onde ɛ i iid N(0,σ 2 ). O erro

Leia mais

Transformações e Ponderação para corrigir violações do modelo

Transformações e Ponderação para corrigir violações do modelo Transformações e Ponderação para corrigir violações do modelo Diagnóstico na análise de regressão Relembrando suposições Os erros do modelo tem média zero e variância constante. Os erros do modelo tem

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICPAL NO BRASIL Focando

Leia mais

Correlação e Regressão

Correlação e Regressão Correlação e Regressão Vamos começar com um exemplo: Temos abaixo uma amostra do tempo de serviço de 10 funcionários de uma companhia de seguros e o número de clientes que cada um possui. Será que existe

Leia mais

Métodos Quantitativos para Avaliação de Políticas Públicas

Métodos Quantitativos para Avaliação de Políticas Públicas ACH3657 Métodos Quantitativos para Avaliação de Políticas Públicas Aula 11 Análise de Resíduos Alexandre Ribeiro Leichsenring alexandre.leichsenring@usp.br Alexandre Leichsenring ACH3657 Aula 11 1 / 26

Leia mais

Aula 2 Uma breve revisão sobre modelos lineares

Aula 2 Uma breve revisão sobre modelos lineares Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar

Leia mais

Modelos de Análise de Variância

Modelos de Análise de Variância Modelos de Análise de Variância Delineamento Completamente Aleatorizado: k tratamentos, r réplicas (balanceado) yi iid ~ N ; i i Normalidade Variância constante ( homocedasticidade ) Independência Análise

Leia mais

Análise de Regressão EST036

Análise de Regressão EST036 Análise de Regressão EST036 Michel Helcias Montoril Instituto de Ciências Exatas Universidade Federal de Juiz de Fora Regressão sem intercepto; Formas alternativas do modelo de regressão Regressão sem

Leia mais

Análise de Resíduos. investiga características que comprometem a validade do MRLS:

Análise de Resíduos. investiga características que comprometem a validade do MRLS: Análise de Resíduos investiga características que comprometem a validade do MRLS: (1) relação entre X e Y não é linear (2) erros não tem variância constante (3) erros correlacionados (4) erros não são

Leia mais

UM ESTUDO COMPARATIVO DO USO DO MINITAB, SPSS E XL-STAT EM REGRESSÕES UTILZIANDO DADOS SOBRE LIBERDADE ECONÔMICA DE 157 PAÍSES NO CENÁRIO MUNDIAL

UM ESTUDO COMPARATIVO DO USO DO MINITAB, SPSS E XL-STAT EM REGRESSÕES UTILZIANDO DADOS SOBRE LIBERDADE ECONÔMICA DE 157 PAÍSES NO CENÁRIO MUNDIAL UM ESTUDO COMPARATIVO DO USO DO MINITAB, SPSS E XL-STAT EM REGRESSÕES UTILZIANDO DADOS SOBRE LIBERDADE ECONÔMICA DE 157 PAÍSES NO CENÁRIO MUNDIAL LOURENÇO AUGUSTO C. GRANATO PONTIFÍCIA UNIVERSIDADE CATÓLICA

Leia mais

Verificando as pressuposições do modelo estatístico

Verificando as pressuposições do modelo estatístico Verificando as pressuposições do modelo estatístico Prof. a Dr. a Simone Daniela Sartorio de Medeiros DTAiSeR-Ar 1 As pressuposições do modelo estatístico: 1) os efeitos do modelo estatístico devem ser

Leia mais

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre. UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO PROJETO DE EXTENSÃO Software R: Capacitação em análise estatística de dados utilizando um software livre. Fonte: https://www.r-project.org/ Módulo

Leia mais

Modelo de Regressão Múltipla

Modelo de Regressão Múltipla Modelo de Regressão Múltipla Modelo de Regressão Linear Simples Última aula: Y = α + βx + i i ε i Y é a variável resposta; X é a variável independente; ε representa o erro. 2 Modelo Clássico de Regressão

Leia mais

Análise de Resíduos. investigar características que comprometem a validade do MRLS:

Análise de Resíduos. investigar características que comprometem a validade do MRLS: Análise de Resíduos investigar características que comprometem a validade do MRLS: (1) relação entre X e Y não é linear (2) erros não tem variância constante (3) erros correlacionados (4) erros não são

Leia mais

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa REGRESSÃO LINEAR Parte I Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação para o Planejamento Julho de 2015 Onde Estamos Para onde vamos Inferência Esta5s6ca se resumindo a uma equação

Leia mais

Regression and Clinical prediction models

Regression and Clinical prediction models Regression and Clinical prediction models Session 6 Introducing statistical modeling Part 2 (Correlation and Linear regression) Pedro E A A do Brasil pedro.brasil@ini.fiocruz.br 2018 Objetivos Continuar

Leia mais

Correlação e Regressão Linear

Correlação e Regressão Linear Correlação e Regressão Linear Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais CORRELAÇÃO LINEAR Coeficiente de correlação linear r Mede o grau de relacionamento linear entre valores

Leia mais

Seção 2.6 Duas Variáveis Quantitativas: Regressão Linear

Seção 2.6 Duas Variáveis Quantitativas: Regressão Linear Seção 2.6 Duas Variáveis Quantitativas: Regressão Linear A Reta de Regressão Predições Resíduos Sumário Interpretando a Inclinação e o Intercepto Cuidados com a Regressão Grilos e Temperatura Você pode

Leia mais

ANOVA - Etapas de Análise

ANOVA - Etapas de Análise ANOVA - Etapas de Análise Entender o Delineamento Estrutura de Tratamento Aleatorização das Unidades Amostrais Aleatorização das Unidades Experimentais aos Tratamentos Adotar um Modelo Estrutural e Distribucional

Leia mais

TESTES DE NORMALIDADE E SIGNIFICÂNCIA. Profª. Sheila Regina Oro

TESTES DE NORMALIDADE E SIGNIFICÂNCIA. Profª. Sheila Regina Oro TESTES DE NORMALIDADE E SIGNIFICÂNCIA Profª. Sheila Regina Oro A suposição de normalidade dos dados amostrais ou experimentais é uma condição exigida para a realização de muitas inferências válidas a respeito

Leia mais

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre. UFFS Universidade Federal da Fronteira Sul Campus Cerro Largo PROJETO DE EXTENSÃO Software R: capacitação em análise estatística de dados utilizando um software livre Fonte: https://www.r-project.org/

Leia mais

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012 1 AULA 09 Regressão Ernesto F. L. Amaral 17 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à

Leia mais

Multicolinariedade e Autocorrelação

Multicolinariedade e Autocorrelação Multicolinariedade e Autocorrelação Introdução Em regressão múltipla, se não existe relação linear entre as variáveis preditoras, as variáveis são ortogonais. Na maioria das aplicações os regressores não

Leia mais

Seleção de Variáveis e Construindo o Modelo

Seleção de Variáveis e Construindo o Modelo Seleção de Variáveis e Construindo o Modelo Seleção de modelos candidatos A idéia é selecionar um conjunto menor de variáveis explanatórias de acordo com algum(s) critério(s), e assim selecionar o modelo

Leia mais

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla 9 Correlação e Regressão 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla 1 9-1 Aspectos Gerais Dados Emparelhados há uma relação? se há, qual

Leia mais

Mais Informações sobre Itens do Relatório

Mais Informações sobre Itens do Relatório Mais Informações sobre Itens do Relatório Amostra Tabela contendo os valores amostrados a serem utilizados pelo método comparativo (estatística descritiva ou inferencial) Modelos Pesquisados Tabela contendo

Leia mais

Capítulo 3. O Modelo de Regressão Linear Simples: Especificação e Estimação

Capítulo 3. O Modelo de Regressão Linear Simples: Especificação e Estimação Capítulo 3 O Modelo de Regressão Linear Simples: Especificação e Estimação Introdução Teoria Econômica Microeconomia: Estudamos modelos de oferta e demanda (quantidades demandadas e oferecidas dependem

Leia mais

Análise de regressão linear simples. Diagrama de dispersão

Análise de regressão linear simples. Diagrama de dispersão Introdução Análise de regressão linear simples Departamento de Matemática Escola Superior de Tecnologia de Viseu A análise de regressão estuda o relacionamento entre uma variável chamada a variável dependente

Leia mais

Planejamento de Experimentos

Planejamento de Experimentos Planejamento de Experimentos 1 6.4 Os Modelos fatoriais 2 k : o caso geral. O modelo estatístico para um plano 2 k inclui k ( k 2 ( k ) ) efeitos principais efeitos de interação de ordem 2 efeitos de interação

Leia mais

Associação entre duas variáveis

Associação entre duas variáveis Associação entre duas variáveis Questões de interesse: Será que duas variáveis são independentes ou pelo contrário dependentes? E se forem dependentes, qual o tipo e grau de dependência? Existem diversas

Leia mais

Curso de MINITAB Universidade Federal de Ouro Preto. Planejamento de Experimentos (DOE)

Curso de MINITAB Universidade Federal de Ouro Preto. Planejamento de Experimentos (DOE) Planejamento de Experimentos (DOE) - Introdução Um experimento é um procedimento no qual as alterações propositais são feitas nas variáveis de entrada de um processo ou sistema, de modo que se possa avaliar

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semana Conteúdo 1 Apresentação da disciplina. Princípios de modelos lineares

Leia mais

Análise de Regressão Linear Simples e

Análise de Regressão Linear Simples e Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução A análise de regressão estuda o relacionamento entre uma variável

Leia mais

Homocedasticidade? Exemplo: consumo vs peso de automóveis

Homocedasticidade? Exemplo: consumo vs peso de automóveis REGRESSÃO Análise de resíduos Homocedasticidade? Exemplo: consumo vs peso de automóveis 60 50 Consumo (mpg) 40 30 0 10 0 1500 000 500 3000 3500 4000 4500 Peso 0 Diagrama de resíduos 15 10 Resíduos 5 0-5

Leia mais

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE CIÊNCIAS CONTÁBEIS PROGRAMA DE PÓS GRADUAÇÃO EM CIÊNCIAS CONTÁBEIS - PPGCC FICHA DE DISCIPLINA

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE CIÊNCIAS CONTÁBEIS PROGRAMA DE PÓS GRADUAÇÃO EM CIÊNCIAS CONTÁBEIS - PPGCC FICHA DE DISCIPLINA FICHA DE DISCIPLINA Disciplina Métodos Quantitativos II Código PPGCC Carga Horária 60 Créditos 4 Tipo: Optativa OBJETIVOS Discutir com os alunos um conjunto de instrumentos estatísticos de pesquisa, necessários

Leia mais

Correlação e Regressão

Correlação e Regressão Correlação e Regressão Exemplos: Correlação linear Estudar a relação entre duas variáveis quantitativas Ou seja, a força da relação entre elas, ou grau de associação linear. Idade e altura das crianças

Leia mais

Nome: Turma: Processo

Nome: Turma: Processo Instituto Superior de Economia e Gestão Universidade de Lisboa Licenciaturas em Economia e em Finanças Econometria Época de Recurso 01/02/2017 Duração: 2 horas Nome: Turma: Processo Espaço reservado para

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

Métodos Quantitativos Aplicados

Métodos Quantitativos Aplicados Métodos Quantitativos Aplicados Aula 10 http://www.iseg.utl.pt/~vescaria/mqa/ Tópicos apresentação Análise Regressão: Avaliação de relações de dependência em que se explica o comportamento de uma/várias

Leia mais

Regressões: Simples e MúltiplaM. Prof. Dr. Luiz Paulo Fávero 1

Regressões: Simples e MúltiplaM. Prof. Dr. Luiz Paulo Fávero 1 Regressões: Simples e MúltiplaM Prof. Dr. Luiz Paulo FáveroF Prof. Dr. Luiz Paulo Fávero 1 1 Técnicas de Dependência Análise de Objetivos 1. Investigação de dependências entre variáveis. 2. Avaliação da

Leia mais

Modelos de regressão para dados correlacionados. Cibele Russo

Modelos de regressão para dados correlacionados. Cibele Russo Modelos de regressão para dados correlacionados Cibele Russo cibele@icmc.usp.br ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo

Leia mais

REGRESSÃO LINEAR Parte II. Flávia F. Feitosa

REGRESSÃO LINEAR Parte II. Flávia F. Feitosa REGRESSÃO LINEAR Parte II Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação para o Planejamento Julho de 2015 ANÁLISE DE REGRESSÃO Análise de regressão é uma ferramenta estatística que

Leia mais

Correlação Serial e Heterocedasticidade em Regressões de Séries Temporais. Wooldridge, Cap. 12

Correlação Serial e Heterocedasticidade em Regressões de Séries Temporais. Wooldridge, Cap. 12 Correlação Serial e Heterocedasticidade em Regressões de Séries Temporais Wooldridge, Cap. 1 Porto Alegre, 11 de novembro de 010 1 CORRELAÇÃO SERIAL Ocorrência Conseqüência Análise gráfica Autocorrelação

Leia mais

ANÁLISE ESTATÍSTICA DOS ÍNDICES DE DESENVOLVIMENTO DAS AMÉRICAS, BASEADA NO HDR Fátima Alexandre

ANÁLISE ESTATÍSTICA DOS ÍNDICES DE DESENVOLVIMENTO DAS AMÉRICAS, BASEADA NO HDR Fátima Alexandre ANÁLISE ESTATÍSTICA DOS ÍNDICES DE DESENVOLVIMENTO DAS AMÉRICAS, BASEADA NO HDR 2005 Fátima Alexandre PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa

Leia mais

Regressão Linear Simples

Regressão Linear Simples Regressão Linear Simples Capítulo 16, Estatística Básica (Bussab&Morettin, 8a Edição) 10a AULA 18/05/2015 MAE229 - Ano letivo 2015 Lígia Henriques-Rodrigues 10a aula (18/05/2015) MAE229 1 / 38 Introdução

Leia mais

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves Capítulo 9 - Regressão Linear Simples RLS: Notas breves Regressão Linear Simples Estrutura formal do modelo de Regressão Linear Simples RLS: Y i = β 0 + β 1 x i + ε i, 1 onde Y i : variável resposta ou

Leia mais

Econometria. Econometria ( ) O modelo de regressão linear múltipla. O modelo de regressão linear múltipla. Aula 2-26/8/2010

Econometria. Econometria ( ) O modelo de regressão linear múltipla. O modelo de regressão linear múltipla. Aula 2-26/8/2010 Aula - 6/8/010 Econometria Econometria 1. Hipóteses do Modelo de RLM O modelo de regressão linear múltipla Estudar a relação entre uma variável dependente e uma ou mais variáveis independentes. Forma genérica:

Leia mais

Teste F-parcial 1 / 16

Teste F-parcial 1 / 16 Teste F-parcial Ingredientes A hipótese nula, H 0, define o modelo restrito. A hipótese alternativa, H a : H 0 é falsa, define o modelo irrestrito. SQR r : soma de quadrado dos resíduos associada à estimação

Leia mais

UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO

UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO Aluno: Claudemir

Leia mais

Teste F-parcial 1 / 16

Teste F-parcial 1 / 16 Teste F-parcial A hipótese nula, H 0, define o modelo restrito. Ingredientes SQR r : soma de quadrado dos resíduos sob H 0. R 2 r: coeficiente de determinação sob H 0. g: número de restrições a serem testadas

Leia mais

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei Regressão PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei Regressão Introdução Analisar a relação entre duas variáveis (x,y) através da equação (equação de regressão) e do gráfico

Leia mais

Especialização em Engenharia de Processos e de Sistemas de Produção

Especialização em Engenharia de Processos e de Sistemas de Produção Especialização em Engenharia de Processos e de Sistemas de Produção Projetos de Experimento e Confiabilidade de Sistemas da Produção Prof. Claudio Luis C. Frankenberg 3ª parte Conforme foi apresentado

Leia mais

REGRESSÃO E CORRELAÇÃO

REGRESSÃO E CORRELAÇÃO REGRESSÃO E CORRELAÇÃO A interpretação moderna da regressão A análise de regressão diz respeito ao estudo da dependência de uma variável, a variável dependente, em relação a uma ou mais variáveis explanatórias,

Leia mais

RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO

RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO Regressão simples: desvantagem de apenas uma variável independente explicando y mantendo ceteris paribus as demais (ou

Leia mais

Estatística Aplicada II. } Regressão Linear

Estatística Aplicada II. } Regressão Linear Estatística Aplicada II } Regressão Linear 1 Aula de hoje } Tópicos } Regressão Linear } Referência } Barrow, M. Estatística para economia, contabilidade e administração. São Paulo: Ática, 007, Cap. 7

Leia mais

INTRODUÇÃO A ECONOMETRIA

INTRODUÇÃO A ECONOMETRIA INTRODUÇÃO A ECONOMETRIA Análise de regressão e uso do Eviews Introdução O modelo de regressão linear se utiliza para estudar a relação que existe entre uma variável dependente e uma ou várias variáveis

Leia mais

Introdução aos Modelos Lineares em Ecologia

Introdução aos Modelos Lineares em Ecologia Introdução aos Modelos Lineares em Ecologia Prof. Adriano Sanches Melo - Dep. Ecologia UFG asm.adrimelo no gmail.com Página do curso: www.ecologia.ufrgs.br/~adrimelo/lm/ Livro-texto: Crawley, M.J. 2005.

Leia mais

BIE5782. Unidade 7: INTRODUÇÃO AOS MODELOS LINEARES

BIE5782. Unidade 7: INTRODUÇÃO AOS MODELOS LINEARES BIE5782 Unidade 7: INTRODUÇÃO AOS MODELOS LINEARES ROTEIRO 1.Motivação 2. Método dos mínimos quadrados 3. Ajuste no R: função lm 4. Resultado no R: objeto lm 5. Premissas, interpretação e diagnóstico 6.

Leia mais

VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO DE ANÁLISE DE VARIÂNCIA ANÁLISE DE RESÍDUOS

VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO DE ANÁLISE DE VARIÂNCIA ANÁLISE DE RESÍDUOS VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO DE ANÁLISE DE VARIÂNCIA ANÁLISE DE RESÍDUOS Conforme foi apresentado anteriormente, o modelo de análise de variância assume que as observações são independentes e normalmente

Leia mais

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância) AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância) Susan Schommer Econometria I - IE/UFRJ Variância dos estimadores MQO Vamos incluir mais uma hipótese: H1 [Linear nos parâmetros]

Leia mais

Violação dos pressupostos básicos do modelo clássico de regressão linear

Violação dos pressupostos básicos do modelo clássico de regressão linear AGOSTO 2017 Lutemberg Florencio Doutorando em Eng. Civil (Real Estate) USP Engenheiro Civil (POLI-UPE) Espec. em Aval. e Perícias de Eng. (FOC-SP) Mestre em Estatística (UFPE) Eng. Civil do Banco do Nordeste

Leia mais

Contabilometria. Aula 9 Regressão Linear Inferências e Grau de Ajustamento

Contabilometria. Aula 9 Regressão Linear Inferências e Grau de Ajustamento Contabilometria Aula 9 Regressão Linear Inferências e Grau de Ajustamento Interpretação do Intercepto e da Inclinação b 0 é o valor estimado da média de Y quando o valor de X é zero b 1 é a mudança estimada

Leia mais

Exemplo Regressão Robusta

Exemplo Regressão Robusta Exemplo Regressão Robusta Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 1 o Semestre 2013 G. A. Paula (IME-USP) Abastecimento de Refrigerantes 1 o Semestre 2013 1 /

Leia mais

Modelos de Regressão Múltipla - Parte VI

Modelos de Regressão Múltipla - Parte VI 1 Modelos de Regressão Múltipla - Parte VI Erica Castilho Rodrigues 7 de Fevereiro de 2017 2 3 Podemos fazer uma transformação na variável resposta Y e/ou na preditora X para: solucionar problemas de variância

Leia mais

Análise da Regressão. Prof. Dr. Alberto Franke (48)

Análise da Regressão. Prof. Dr. Alberto Franke (48) Análise da Regressão Prof. Dr. Alberto Franke (48) 91471041 O que é Análise da Regressão? Análise da regressão é uma metodologia estatística que utiliza a relação entre duas ou mais variáveis quantitativas

Leia mais

Ralph S. Silva

Ralph S. Silva ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S Silva http://wwwimufrjbr/ralph/multivariadahtml Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Revisão:

Leia mais

Na aula do dia 24 de outubro analisamos duas variáveis quantitativas conjuntamente com o objetivo de verificar se existe alguma relação entre elas.

Na aula do dia 24 de outubro analisamos duas variáveis quantitativas conjuntamente com o objetivo de verificar se existe alguma relação entre elas. Regressão Múltipla Na aula do dia 24 de outubro analisamos duas variáveis quantitativas conjuntamente com o objetivo de verificar se existe alguma relação entre elas. 1. definimos uma medida de associação

Leia mais

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra Análise da Regressão múltipla: MQO Assintótico Capítulo 5 do Wooldridge Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades

Leia mais

ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos:

ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos: ANÁLISE DOS RESÍDUOS Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos: seguem uma distribuição normal; têm média zero; têm variância σ 2 constante

Leia mais

MAE Planejamento e Pesquisa II

MAE Planejamento e Pesquisa II MAE0327 - Planejamento e Pesquisa II EXPERIMENTOS/ESTUDOS NÃO-BALANCEADOS COM FATORES FIXOS - PARTE 1 7 de agosto de 2016 Denise A Botter MAE0327 7 de agosto de 2016 1 / 1 PLANEJAMENTO E PESQUISA I Estudos

Leia mais

AULAS 14 E 15 Modelo de regressão simples

AULAS 14 E 15 Modelo de regressão simples 1 AULAS 14 E 15 Modelo de regressão simples Ernesto F. L. Amaral 30 de abril e 02 de maio de 2013 Avaliação de Políticas Públicas (DCP 046) Fonte: Wooldridge, Jeffrey M. Introdução à econometria: uma abordagem

Leia mais

Exemplo Vida Útil de Ferramentas

Exemplo Vida Útil de Ferramentas Exemplo Vida Útil de Ferramentas Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2016 G. A. Paula (IME-USP) Vida útil de Ferramentas 2 o Semestre 2016 1 /

Leia mais

Pesquisa Quantitativa Regressão e Correlação Roteiro Geral Roteiro do Módulo Regressão e correlação

Pesquisa Quantitativa Regressão e Correlação Roteiro Geral Roteiro do Módulo Regressão e correlação Pesquisa Quantitativa Regressão e Correlação Lupércio França Bessegato Mestrado em Administração/UFJF 1. Introdução 2. Coleta de dados Roteiro Geral 3. Modelos probabilísticos 4. Distribuições amostrais

Leia mais

Econometria. Econometria MQO MQO. Resíduos. Resíduos MQO. 1. Exemplo da técnica MQO. 2. Hipóteses do Modelo de RLM. 3.

Econometria. Econometria MQO MQO. Resíduos. Resíduos MQO. 1. Exemplo da técnica MQO. 2. Hipóteses do Modelo de RLM. 3. 3. Ajuste do Modelo 4. Modelo Restrito Resíduos Resíduos 1 M = I- X(X X) -1 X Hipóteses do modelo Linearidade significa ser linear nos parâmetros. Identificação: Só existe um único conjunto de parâmetros

Leia mais

Modelos de Regressão Linear Simples - parte II

Modelos de Regressão Linear Simples - parte II Modelos de Regressão Linear Simples - parte II Erica Castilho Rodrigues 14 de Outubro de 2013 Erros Comuns que Envolvem a Análise de Correlação 3 Erros Comuns que Envolvem a Análise de Correlação Propriedade

Leia mais

AULA 03 Análise de regressão múltipla: estimação

AULA 03 Análise de regressão múltipla: estimação 1 AULA 03 Análise de regressão múltipla: estimação Ernesto F. L. Amaral 17 de julho de 2013 Análise de Regressão Linear (MQ 2013) www.ernestoamaral.com/mq13reg.html Fonte: Cohen, Ernesto, e Rolando Franco.

Leia mais

Small Caps Ou Ações De Segunda Linha Análise De Retorno De Portfólios De Ações Dos Setores De Metalurgia, Alimentos E Papel E Celulose

Small Caps Ou Ações De Segunda Linha Análise De Retorno De Portfólios De Ações Dos Setores De Metalurgia, Alimentos E Papel E Celulose Small Caps Ou Ações De Segunda Linha Análise De Retorno De Portfólios De Ações Dos Setores De Metalurgia, Alimentos E Papel E Celulose José Augusto Da Silva Rezende PONTIFÍCIA UNIVERSIDADE CATÓLICA DE

Leia mais

Exercícios Selecionados de Econometria para Concursos Públicos

Exercícios Selecionados de Econometria para Concursos Públicos 1 Exercícios Selecionados de Econometria para Concursos Públicos 1. Regressão Linear Simples... 2 2. Séries Temporais... 17 GABARITO... 20 2 1. Regressão Linear Simples 01 - (ESAF/Auditor Fiscal da Previdência

Leia mais

AULAS 17 E 18 Análise de regressão múltipla: estimação

AULAS 17 E 18 Análise de regressão múltipla: estimação 1 AULAS 17 E 18 Análise de regressão múltipla: estimação Ernesto F. L. Amaral 22 e 24 de outubro de 2013 Avaliação de Políticas Públicas (DCP 046) Fonte: Cohen, Ernesto, e Rolando Franco. 2000. Avaliação

Leia mais

ENADE Exame Nacional de Desempenho de Estudantes. Instituições do Ensino Superior do Município de São Paulo

ENADE Exame Nacional de Desempenho de Estudantes. Instituições do Ensino Superior do Município de São Paulo PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO PUC-SP MÉTODOS QUANTITATIVOS DE PESQUISA EMPÍRICA Prof. Dr. ARNOLDO HOYOS ENADE 9 Exame Nacional de Desempenho de Estudantes Instituições do Ensino Superior

Leia mais

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc. ECONOMETRIA Prof. Patricia Maria Bortolon, D. Sc. Cap. 11 Heterocedasticidade: o que acontece se a variância do erro não é constante? Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição. Rio de Janeiro.

Leia mais

ANÁLISE ESTATÍSTICA DOS PRINCIPAIS INDICADORES DO MUNICÍPIO DE SÃO PAULO 2004

ANÁLISE ESTATÍSTICA DOS PRINCIPAIS INDICADORES DO MUNICÍPIO DE SÃO PAULO 2004 ANÁLISE ESTATÍSTICA DOS PRINCIPAIS INDICADORES DO MUNICÍPIO DE SÃO PAULO 24 Fátima Alexandre PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos

Leia mais

Modelos Lineares Generalizados - Introdução

Modelos Lineares Generalizados - Introdução Modelos Lineares Generalizados - Erica Castilho Rodrigues 18 de Março de 2014 3 Por que queremos modelar os dados? A forma do modelo revela padrões de interação e associação nos dados. Através de procedimentos

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski

UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA Jayme Gomes dos Santos Junior Luciana Helena Kowalski MODELAGEM DA EXPECTATIVA DE VIDA NOS MUNICÍPIOS DO PARANÁ A PARTIR DE COVARIÁVEIS DO CENSO 2010

Leia mais

Regressão linear simples

Regressão linear simples Regressão linear simples Universidade Estadual de Santa Cruz Ivan Bezerra Allaman Introdução Foi visto na aula anterior que o coeficiente de correlação de Pearson é utilizado para mensurar o grau de associação

Leia mais

Módulo 16- Análise de Regressão

Módulo 16- Análise de Regressão Módulo 6 Análise de Regressão Módulo 6- Análise de Regressão Situação Problema Um grupo de investidores estrangeiros deseja aumentar suas atividades no Brasil. Considerando a conjuntura econômica de moeda

Leia mais

Modelos de Regressão Linear Simples - parte III

Modelos de Regressão Linear Simples - parte III 1 Modelos de Regressão Linear Simples - parte III Erica Castilho Rodrigues 20 de Setembro de 2016 2 3 4 A variável X é um bom preditor da resposta Y? Quanto da variação da variável resposta é explicada

Leia mais

Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito

Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito Unidade IV - Regressão Regressões Lineares Modelo de Regressão Linear Simples Terminologia Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito Regressão correlação Diferença

Leia mais

AULA 07 Regressão. Ernesto F. L. Amaral. 05 de outubro de 2013

AULA 07 Regressão. Ernesto F. L. Amaral. 05 de outubro de 2013 1 AULA 07 Regressão Ernesto F. L. Amaral 05 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas

Leia mais

Cap. 13 Correlação e Regressão

Cap. 13 Correlação e Regressão Estatística Aplicada às Ciências Sociais Sexta Edição Pedro Alberto Barbetta Florianópolis: Editora da UFSC, 2006 Cap. 13 Correlação e Regressão Correlação X e Y variáveis quantitativas X Y Correlação

Leia mais

4.1 Análise da Correlação entre PIB e os Níveis de Lucro dos Setores

4.1 Análise da Correlação entre PIB e os Níveis de Lucro dos Setores 58 4 RESULTADOS 4.1 Análise da Correlação entre PIB e os Níveis de Lucro dos Setores Foram efetuados os testes de correlação entre o PIB e o níveis de lucro dos setores da indústria para um nível de significância

Leia mais

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total. INSTRUÇÕES Para a realização desta prova, você recebeu este Caderno de Questões. 1. Caderno de Questões Verifique se este Caderno de Questões contém a prova de Conhecimentos Específicos referente ao cargo

Leia mais

AULA 9 - MQO em regressão múltipla: Propriedades Estatísticas (Valor Esperado)

AULA 9 - MQO em regressão múltipla: Propriedades Estatísticas (Valor Esperado) AULA 9 - MQO em regressão múltipla: Propriedades Estatísticas (Valor Esperado) Susan Schommer Econometria I - IE/UFRJ Valor esperado dos estimadores MQO Nesta aula derivamos o valor esperado dos estimadores

Leia mais

MAE 317 Planejamento de Experimentos I. Profa. Júlia Maria Pavan Soler IME/USP

MAE 317 Planejamento de Experimentos I. Profa. Júlia Maria Pavan Soler IME/USP MAE 37 Planeamento de Experimentos I Profa. Júlia Maria Pavan Soler pavan@ime.usp.br IME/USP MAE 37 Planeamento de Experimentos I Profa. Júlia Maria Pavan Soler pavan@ime.usp.br IME/USP Delineamento Completamente

Leia mais

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância) AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância) Susan Schommer Econometria I - IE/UFRJ Variância dos estimadores MQO Vamos incluir mais uma hipótese: H1 [Linear nos parâmetros]

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS quantidade São Paulo (j = 1) Rio de Janeiro (j = 2) Minas Gerais (j = 3) Rio Grande do Sul (j = 4) total casos novos (X, em milhões) casos pendentes (Y, em milhões) processos

Leia mais

(a) Teste e IC para Duas Variâncias. (b) Teste para médias. Duas Amostras de Teste T e IC

(a) Teste e IC para Duas Variâncias. (b) Teste para médias. Duas Amostras de Teste T e IC Exercício 1 Contexto: amostras independentes de populações normais (a) Teste e IC para Duas Variâncias Método Hipótese nula Variância(Primeiro) / Variância(Segundo) = 1 Hipótese alternativa Variância(Primeiro)

Leia mais