Módulo 16- Análise de Regressão

Documentos relacionados
Módulo 16- Análise de Regressão

Exame de Recorrência de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro

Associação entre duas variáveis

Exame Final de Métodos Estatísticos

INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 EXAME: DATA 24 / 02 / NOME DO ALUNO:

Regressão Linear em SPSS

Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito

Regressão linear múltipla - Correlação parcial

INTRODUÇÃO A ECONOMETRIA

i j i i Y X X X i j i i i

Estatística Aplicada II. } Regressão Linear

4 Análise dos resultados 4.1. Perfil do respondente

([DPHGH5HFRUUrQFLDGH0pWRGRV(VWDWtVWLFRV

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa

TÉCNICAS EXPERIMENTAIS APLICADAS EM CIÊNCIA DO SOLO

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

Gabarito Lista 2 LES0773 Estatística III. Os resultados dessa regressão são apresentados na seguinte tabela:

Correlação e Regressão

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

CORRELAÇÃO E REGRESSÃO

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.

6 OS DETERMINANTES DO INVESTIMENTO NO BRASIL

Econometria Semestre

BIOESTATÍSTICA. Análise de regressão

Renda x Vulnerabilidade Ambiental

Módulo 18- Análise de Cluster Tutorial SPSS Análise dos Resultados Método Hierárquico e Não-Hierárquico

Testes de Hipóteses. : Existe efeito

Esse material foi extraído de Barbetta (2007 cap 13)

Módulo 17- Análise fatorial Tutorial SPSS Análise dos Resultados

Análise de Regressão EST036

FACULDADE DE ECONOMIA DO PORTO. Licenciatura em Economia E C O N O M E T R I A II

Teste F-parcial 1 / 16

UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EXATAS CURSO DE ESPECIALIZAÇÃO EM MÉTODOS ESTATÍSTICOS COMPUTACIONAIS

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

Capítulo 3. O Modelo de Regressão Linear Simples: Especificação e Estimação

Análise Multivariada Aplicada à Contabilidade

Estatística Aplicada ao Serviço Social

4. ANÁLISE DOS RESULTADOS DA PESQUISA

CORRELAÇÃO E REGRESSÃO. Modelos Probabilísticos para a Computação Professora: Andréa Rocha. UNIVERSIDADE FEDERAL DA PARAÍBA Dezembro, 2011

Teste F-parcial 1 / 16

ANÁLISE ECONOMÉTRICA DO CONSUMO DE CARNE BOVINA NA REGIÃO METROPOLITANA DE BELÉM UTILIZADO O SOFTWARE EVIEWS 3.0.

I.1. Seleccionado um passageiro ao acaso, qual a probabilidade de ter idade no intervalo [20 a 50) anos e ser fraudulento?

Gabarito Trabalho 2. Variable Coefficient Std. Error t-statistic Prob.

Mais Informações sobre Itens do Relatório

Segundo Trabalho de Econometria 2009

CORRELAÇÃO. Flávia F. Feitosa

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

ECONOMETRIA I. I (12 valores)

Estatística II Licenciatura em Gestão. Parte I

Módulo 19 - Análise Discriminante Geração de Tabelas

ISCTE Instituto Superior de Ciências do Trabalho e da Empresa

Licenciaturas em Economia e em Finanças Econometria ER 26/06/2015 Duração 2 horas

ANÁLISE DISCRIMINANTE (MÓDULO I)

Instituto Universitário de Lisboa (ISCTE-IUL) Licenciaturas em Gestão e Finanças & Contabilidade Estatística II - Exame de 1ª época

REGRESSÃO E CORRELAÇÃO

Exame Final de Métodos Estatísticos

Estatística descritiva

Group Statistics. residência N Mean Std. Deviation Std. Error Mean. Avaliação Breve do Estado Mental. meio rural 11 27,73 1,849,557

MÉTODOS QUANTITATIVOS APLICADOS

Modelos de Escolha Discreta. a)pretende-se conhecer os coeficientes da função de utilidade, assim como a sua significância estatística.

Modelos de Regressão Linear Simples - parte III

ME613 - Análise de Regressão

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

AULAS 17 E 18 Análise de regressão múltipla: estimação

b) Teste a hipótese de efeito significante do tamanho da população sobre a venda do produto, na presença de renda per capita

Introdução Regressão linear Regressão de dados independentes Regressão não linear. Regressão. Susana Barbosa

Estatística II Licenciatura em Gestão TESTE I

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

Transcrição:

Módulo 6 Análise de Regressão Módulo 6- Análise de Regressão Situação Problema Um grupo de investidores estrangeiros deseja aumentar suas atividades no Brasil. Considerando a conjuntura econômica de moeda desvalorizada que favorece a estrutura exportadora e recuperação econômica o grupo estuda a possibilidade de iniciar uma transportadora que atuaria mais no setor exportador. Antes de decidir por realizar ou não o investimento, o grupo contratou uma empresa de consultoria para um estudo de mercado em que o ponto central é a mensuração da demanda para a atividade de transporte de cargas de forma geral no Brasil. Este tutorial apresenta como analisar as tabelas na análise de regressão múltipla. Regressão Linear Múltipla Parte - Análise dos resultados Como escolhemos o método de regressão enter, a tabela nos mostra que todas as variáveis independentes selecionadas foram consideradas no estudo, nenhuma foi removida. Neste caso, como se trata de uma regressão múltipla com três variáveis independentes e todas elas foram consideradas no estudo. Profa. Dra. Adriana Backx Noronha Viana

Módulo 6 Análise de Regressão Model Variables Entered/Removed b Variables Entered variação no PIB real, produção de papel e papelão, valor exportado em reais a Variables Removed a. All requested variables entered. Method, Enter b. Dependent Variable: quantidade de toneladas de carga transpostadas Tabela : Variáveis independentes incluídas na análise. Model Model Summary b Std. Error Adjusted R of the R R Square Square Estimate,987 a,974,970 4789,0 a. Predictors: (Constant), variação no PIB real, produção de papel e papelão, valor exportado em reais b. Dependent Variable: quantidade de toneladas de carga transpostadas Tabela : Coeficientes de determinação. R: é o coeficiente de correlação, ou seja, mostra a relação entre a variável dependente e a variável independente. É também chamado de coeficiente linear da regressão e neste caso é de 0,987; R-square: é o coeficiente de determinação, que diz quanto da variável dependente é explicada pelo modelo de regressão, neste caso 97,40% da variabilidade na quantidade de cargas transportadas é explicada pelo modelo de regressão, isto é, pelos variáveis independentes. Observe como este valor foi maior que o obtido na regressão linear simples (com apenas uma variável); Profa. Dra. Adriana Backx Noronha Viana

Módulo 6 Análise de Regressão 3 Adjusted R-square: é o coeficiente de determinação ajustado. É analisado nas regressões múltiplas, pois faz o ajuste pela inclusão de variáveis independentes. Seu valor deve ser próximo do valor de R ², caso contrário é possível que variáveis independentes inadequadas tenham sido colocadas no estudo (variáveis que não exercem influência forte no estudo). Neste caso os valores são bem próximos, então, não parece haver variáveis inadequadas neste estudo; Std. Error of the estimate: é o erro padrão da estimativa. A tabela 3 mostra uma análise de variância. Model Regression Residual Total ANOVA b Sum of Mean Squares df Square F Sig.,6E+ 3 5,39E+0 46,534,000 a 4,37E+09 0,9E+08,66E+ 3 a. Predictors: (Constant), variação no PIB real, produção de papel e papelão, valor exportado em reais b. Dependent Variable: quantidade de toneladas de carga transpostadas Tabela 3: Análise de variância. O objetivo de se realizar esta análise é de saber se a variação explicada (variação na variável dependente explicada pela variável independente) é suficientemente forte para provocar uma regressão. Compara a variação explicada com a variação residual (não explicada). A coluna mean square mostra estas variações: 0 iação explicada = 5,39 0 e var 8 iação não explicada =,9 0. var Temos um teste de hipóteses: H0: β = 0, β = 0, β = 3 0 (não existe regressão); H: β 0 ou β 0 ou β 3 0 (existe regressão para pelo menos uma das variáveis consideradas no modelo). Profa. Dra. Adriana Backx Noronha Viana 3

Módulo 6 Análise de Regressão 4 Considerando um nível de significância α = 5%, temos o nível de significância observado sig = 0%. Como sig = 0 % < α = 5% devemos rejeitar a hipótese nula, ou seja, neste caso admitimos que existe regressão para pelo menos uma das variáveis independentes. F é o valor da estatística f observado. Neste caso temos F = 46, 534, isto indica a variação explicada é 46,534 vezes maior que a variação não-explicada. Model (Constant) valor exportado em reais produção de papel e papelão variação no PIB real Unstandardized Coefficients Coefficients a Standardi zed Coefficien ts 95% Confidence Interval for B Lower Upper B Std. Error Beta t Sig. Bound Bound 699,930 9050,775,585,565-43605,95 7759,785-3,74E-04,000 -,30 -,84,00 -,00,000 49,688 7,79,650 9,53,000 9,785 306,59,056E-04,000,666 5,46,000,000,000 a. Dependent Variable: quantidade de toneladas de carga transpostadas Tabela 4: Resultados da análise. A tabela 4 nos dá os coeficientes da equação de regressão. Temos: B: mostra os coeficientes da equação de regressão. A constante e os coeficientes das variáveis independentes: Y = a x + ax + a3x3 + b = 0,000374x + 49,688x + 0,000374x3 + 699,930 ; t: estatística t observada para cada variável; sig: é o P-valor, ou seja, o nível de significância observado. Testa se a variáveis independentes influencia a variável dependente. O teste é realizado para cada variável separadamente: a) Valor exportado em reais: H0: β = 0 (a variável independente não influencia a variável dependente); H: β 0 (a variável independente influencia a variável dependente). Profa. Dra. Adriana Backx Noronha Viana 4

Módulo 6 Análise de Regressão 5 Como o sig para a variável independente é menor que o nível de significância α = 5% rejeitamos a hipótese nula, ou seja, as exportações influenciam a quantidade de carga transportada nas rodovias, considerando nível de significância de 5%. b) Produção de papel e papelão: H0: β = 0 (a variável independente não influencia a variável dependente); H: β 0 (a variável independente influencia a variável dependente). Como o sig para a variável independente é menor que o nível de significância α = 5% rejeitamos a hipótese nula, ou seja, a produção de papelão influencia a quantidade de carga transportada nas rodovias, considerando nível de significância de 5%. c) Variação do PIB real: H0: β = 3 0 (a variável independente não influencia a variável dependente); H: β 3 0 (a variável independente influencia a variável dependente). Como o sig para a variável independente é menor que o nível de significância α = 5% rejeitamos a hipótese nula, ou seja, a variação do PIB influencia a quantidade de carga transportada nas rodovias, considerando nível de significância de 5%. A tabela 5 mostra estatísticas descritivas dos resíduos. Residuals Statistics a Minimum Maximum Mean Std. Deviation N Predicted Value 999,70 477783,94 3457,63 83863,74 4 Residual -34685,9 35,80,43E- 3790,8 4 Std. Predicted Value -,459,66,000,000 4 Std. Residual -,345,436,000,933 4 a. Dependent Variable: quantidade de toneladas de carga transpostadas Tabela 5: Análise dos resíduos. Os gráficos a seguir servem para a análise de resíduos. Profa. Dra. Adriana Backx Noronha Viana 5

Módulo 6 Análise de Regressão 6 7 Histogram 6 5 4 3 Frequency 0 -,50 -,00 -,50 -,00 -,50 0,00,50,00,50 Std. Dev =,93 Mean = 0,00 N = 4,00 Regression Standardized Residual Gráfico : Histograma dos resíduos. O gráfico é um histograma dos resíduos padronizados. Este gráfico deve seguir uma distribuição normal. Neste caso temos uma distribuição que relativamente se aproxima de uma normal. Profa. Dra. Adriana Backx Noronha Viana 6

Módulo 6 Análise de Regressão 7,00,75,50 Expected Cum Prob,5 0,00 0,00,5,50,75,00 Observed Cum Prob Gráfico : Plotagem de resíduos padronizados. O gráfico mostra a distribuição das probabilidades dos resíduos. Mostra a probabilidade de cada ponto (erro) ocorrer. Eles devem estar o mais próximo possível da reta sem se aglomerar em só lugar da reta. Profa. Dra. Adriana Backx Noronha Viana 7

Módulo 6 Análise de Regressão 8 Scatterplot Regression Standardized Residual 0 - - -3 00000 300000 400000 500000 quantidade de toneladas de carga transpostadas Gráfico 3: Gráfico de dispersão dos resíduos. O gráfico 3 é um diagrama de dispersão dos erros. Idealmente os pontos deveriam situar-se próximos de zero formando uma figura parecida com uma nuvem. Neste caso percebemos que os pontos situam-se relativamente próximos de zero, o que indica não ter havido muita subestimação ou superestimação das previsões. Uma ressalva faz-se necessária! Geralmente não se deve utilizar variáveis altamente correlacionadas como variáveis independentes na regressão ao mesmo tempo, podendo gerar o problema da multicolinearidade. Neste exemplo, em especial, para fins didáticos, foram utilizadas as mesmas variáveis do módulo 5- Análise de Correlação, mesmo que com correlação alta entre as variáveis independentes. Profa. Dra. Adriana Backx Noronha Viana 8