Regressão Linear em SPSS



Documentos relacionados
Módulo 16- Análise de Regressão

Aula 10. ANOVA Análise de Variância em SPSS

Análise de Variância simples (One way ANOVA)

Aula 6. Testes de Hipóteses Paramétricos (I) Métodos Estadísticos 2008 Universidade de Averio Profª Gladys Castillo Jordán. Teste de Hipóteses

Exame Final de Métodos Estatísticos

Exame de Recorrência de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro

6 OS DETERMINANTES DO INVESTIMENTO NO BRASIL

Associação entre duas variáveis

Exemplo 1. a)faça a análise exploratória dos dados e verifique que a amostra é muito enviezada e não normal.

Análise de Variância com dois ou mais factores - planeamento factorial

UNIVERSIDADE DOS AÇORES Mestrado em Gestão (MBA)

Discriminant Rácios de Altman Output Created Comments Missing Value Handling

IMES Catanduva. Probabilidades e Estatística. no Excel. Matemática. Bertolo, L.A.

Métodos Estatísticos sticos Aplicados à Engenharia de Software Experimental

Regressão Linear com Excel

Modelo de Regressão Linear e suas Aplicações

Correlação e Regressão

TUTORIAL SOBRE ANÁLISE DE REGRESSÃO

Sumário. Modelar relações entre variáveis quantitativas. Correlação. Modelar relações entre variáveis quantitativas

CAPÍTULO 5 APRESENTAÇÃO E ANÁLISE DOS RESULTADOS

Testes (Não) Paramétricos

Group Statistics. residência N Mean Std. Deviation Std. Error Mean. Avaliação Breve do Estado Mental. meio rural 11 27,73 1,849,557

INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 EXAME: DATA 24 / 02 / NOME DO ALUNO:

4 Resultados e análises

([DPHGH5HFRUUrQFLDGH0pWRGRV(VWDWtVWLFRV

II Análise de variância... 17

Métodos Matemáticos para Gestão da Informação

Intervalo de confiança para α

3. Características amostrais. Medidas de localização e dispersão

QUEDA LIVRE. Permitindo, então, a expressão (1), relacionar o tempo de queda (t), com o espaço percorrido (s) e a aceleração gravítica (g).

PROGRAMAÇÃO LINEAR. Resolução de problemas de programação linear usando o comando Solver, no Excel.

Planeamento experimental Tutorial para o DX 6.

Instituto Universitário de Lisboa (ISCTE-IUL) Licenciaturas em Gestão e Finanças & Contabilidade Estatística II - Exame de 1ª época

Introdução. Existem situações nas quais há interesse em estudar o comportamento conjunto de uma ou mais variáveis;

ANÁLISE GRÁFICA DOS RESULTADOS EXPERIMENTAIS

Estatística e Probabilidade

AULAS 24 E 25 Análise de Regressão Múltipla: Inferência

PRO FOR WINDOWS (FPW)

Departamento de Física Universidade do Algarve PÊNDULO SIMPLES

Capítulo 8 - Testes de hipóteses. 8.1 Introdução

Contabilometria. Aula 10 Grau de Ajustamento e Verificação das Premissas MQO

AULAS 13, 14 E 15 Correlação e Regressão

Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística

Exercício 5: Analisar Dados Recolhidos em Páginas da Internet

A calculadora se vamos utilizar na proposta de resolução deste exame nacional é a fx-cg20

Medição de Tensões e Correntes Eléctricas Leis de Ohm e de Kirchoff (Rev. 03/2008) 1. Objectivo:

Dois Quentes, Dois Frios

Sessão Saber profundo Contribuição dos xs (

Capítulo 7. Experimentos com dois ou três Fatores de Interesse. Gustavo Mello Reis José Ivo Ribeiro Júnior

Análise Estatística Utilizando o SPSS Guia prático de comandos

Análise de Regressão Linear Simples e Múltipla

VALIDAÇÃO DE MODELOS DE REGRESSÃO POR BOOTSTRAP. João Riboldi 1

CRM e Prospecção de Dados

MAE Séries Temporais

INE Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis

INTRODUÇÃO À ANÁLISE ESTATÍSTICA UTILIZANDO O SPSS 13.0

Análise de regressão linear simples. Departamento de Matemática Escola Superior de Tecnologia de Viseu

Testes não paramétricos são testes de hipóteses que não requerem pressupostos sobre a forma da distribuição subjacente aos dados.

SLEEVE GÁSTRICO : RESULTADOS E FATORES PREDITORES DE PERDA DE PESO

Ajuste de Curvas. Ajuste de Curvas

4 Aplicação: Modelo LOGIT para Avaliar o Risco de Crédito

Desempenho Acadêmico em Métodos Quantitativos nos Cursos de Ciências Contábeis

Correlação e Regressão

Delineamento em Blocos ao Acaso

CAP. I ERROS EM CÁLCULO NUMÉRICO

CENTRO DE FORMAÇÃO DE ENTRE HOMEM E CÁVADO AMARES TERRAS DE BOURO

Anova Univariada e Multivariada

Estatística descritiva. Também designada Análise exploratória de dados ou Análise preliminar de dados

ficha 3 espaços lineares

ECONOMETRIA EXERCÍCIOS DO CAPÍTULO 2

Relação potência ou alométrica

A densidade de CoRoT-Exo-3b

BIOESTATÍSTICA. EXERCÍCIOS Folha 7 ANO LECTIVO: 2007/2008 ANOVA

RELATÓRIO PESQUISA DE MERCADO

EXCEL NA ANÁLISE DE REGRESSÃO

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr

AVALIAÇÃO DO MODELO DE ONDAS

Investigação Sociológica

4 Análise dos Resultados

O modelo ANOVA a dois factores, hierarquizados

Case Processing Summary

Escola Secundária de Oliveira do Bairro

1. INTRODUÇÃO AO EVIEWS Construção da Base de Dados

Exame Final de Métodos Estatísticos

Teste de hipóteses com duas amostras. Estatística Aplicada Larson Farber

Testes não paramétricos

EC330 Tratamento da Informação

Transcrição:

Regressão Linear em SPSS 1. No ficheiro Calor.sav encontram-se os valores do consumo mensal de energia, medido em milhões de unidades termais britânicas, acompanhados de valores de output, em milhões de kwh, de electricidade fornecida por uma central termo-eléctrica em Inglaterra. 1.1. Construa um gráfico de dispersão que permita relacionar ambas as variáveis com a intenção de identificar uma possível relação linear. em SPSS: Graph / Interactive /Scatterplot 15,00 0 12,50 0 Da observação do gráfico de dispersão é razoável afirmar que existe uma relação linear entre as duas variáveis. Unidades fornecidas 10,00 0 7,500 5,000 50000 100000 150 000 200 000 Calor Consumido (milhões de UBT)

1.2. Estabeleça o modelo a ajustar aos dados Como do gráfico de dispersão podemos constatar que existe uma relação linear entre as duas variáveis podemos usar um modelo de regressão linear para ajustar estes dados. Note que se seleccionamos no menu: Graph / Interactive /Scatterplot, o tab Fit como método para ajustar os dados Regression podemos obter o gráfico de dispersão com a recta de regressão desenhada e a sua equação. 15,000 Unidades fornecidas = -0,87 + 0,00 * calor R-Square = 0,99 Linear Regression 12,500 Unidades fornecidas 10,000 7,500 5,000 50000 100000 150000 200000 Calor Consumido (milhões de UBT) Note que o valor do declive na recta de regressão é 0.00, mas isto é devido à aproximação usada. Como poderemos verificar logo este valor é diferente de 0, porem é um valor muito pequeno, da ordem de 10-5 Mas de uma forma mais geral, a análise de regressão linear no SPSS é efectuada através do menu: em SPSS: nalize / Regression /Linear

O método do mínimo dos quadrados é o método implementado em SPSS para estimar os coeficientes de regressão Com as opções do SPSS seleccionadas podemos obter como output a seguintes 4 tabelas: Model 1 Variables Entered/Removed b Variables Variables Entered Removed Method Calor Consumid. Enter o (milhões de UBT) a a. ll requested variables entered. b. Dependent Variable: Unidades fornecidas Model Summary djusted R Std. Error of Model R R Square Square the Estimate 1,997(a),995,994,282649 a Predictors: (Constant), Calor Consumido (milhões de UBT) NOV(b) O coeficiente de correlação R=0, 997 1, pelo que é evidente a existência de uma relação linear entre as variáveis em estudo O teste realizado pela NOV é: H 0: b 1 = 0 vs. H 1: b 1 0 Como o p-value=0 para q.q. nível de significância rejeita-se H 0 b 1 0 a regressão linear tem significado para q.q. nível de significância Model 1 Sum of Squares df Mean Square F Sig. Regression 302,731 1 302,731 3789,321,000(a) Residual 1,598 20,080 Total 304,329 21 a Predictors: (Constant), Calor Consumido (milhões de UBT) b Dependent Variable: Unidades fornecidas Unstandardized Coefficients Coefficients(a) Standardized Coefficients t Sig. Model B Std. Error Beta B Std. Error 1 (Constant) -,869,201-4,329,000 Calor Consumido (milhões de UBT) 7,20E-005,000,997 61,557,000 a Dependent Variable: Unidades fornecidas Modelo de Regressão Linear: unid. fornecidas = b0 + b1 x calor consumido + ε com erro ε N (0, σ2) Estimativas dos coeficientes: b0 = -0, 869, b1 = 7,20 x 10-5 p-value para a ordenada na origem: 0 p-value para o declive: 0 Valores observados das estatísticas dos testes: para a ordenada na origem b0: t0obs = -4, 328 (T0 t n-2 ) para o declive b1: t0obs = 61, 328 (T1 t n-2 )

1.3. Com base nos resultados obtidos responda as seguintes questões: a. Quais as estimativas do declive (b 1) e da ordenada na origem (b 0) da recta de regressão? ˆb 0 = -0, 869 ˆb 1 = 7,20 x 10-5 b. Qual a equação da recta de regressão? y = -0, 869 + 7,20 x 10-5 x c. O valor do declive é significativamente diferente de 0, ao nível de significância 5%? i. Escreva as hipóteses em causa H 0: b 1 = 0 vs H 1: b 1 0 ii. Indique o valor do p-value do teste p-value = 0 iii. Conclua hipótese nula é rejeitada para q.q nível de significância. Concluise que o declive não é nulo para q.q. nível de significância d. ordenada na origem é significativamente diferente de 0, ao nível de significância 5%? i. Escreva as hipóteses em causa H 0: b 0 = 0 vs H 1: b 0 0 ii. Indique o valor do p-value do teste: 0 iii. Conclua: hipótese nula é rejeitada para q.q nível de significância. Concluise que a ordenada na origem não é nula para q.q. nível de significância 1.4. Efectue os cálculos necessários para obter os p-values dos testes para os coeficientes de regressão mostrados na tabela dos coeficientes Unidades fornecidas Calor Consumido (milhões de UBT) Valid N (listwise) Descriptive Statistics N Minimum Maximum Mean Std. Deviation 22 3,173 15,852 10,91527 3,806819 22 55266 233603 163559,41 52698,343 22 Da tabela das estatísticas descritivas obtemos n=22 O p-value para um teste bilateral é igual a: 2P(T < t obs H 0) se t obs for reduzido 2P(T > t obs H0) se t obs for elevado

O valor observado da estatística do teste t obs considera-se reduzido (elevado) se a estimativa que se obtém para o parâmetro a testar é inferior (superior) ao valor especificado em H 0 Teste de hipótese para a ordenada na origem b 0 da recta de regressão: H 0: b 0 = 0 vs. H 1: b 0 0 t 0obs = -4,329 (valor observado da estatística do teste, ver tabela dos coeficientes ) o valor observado da estatística do teste é reduzido pois a estimativa que se obtém para b 0 (-0.869) é um valor inferior a 0 (o valor especificado em H 0). ssim: p-value = 2 P(T<-4.329) = 2 t n-2(-4.329) = 2 (1- t n-2(4.329)) = 2 (1- CDF.T(4.329, 20)) = 2 x 0 = 0 Teste de hipótese para o declive b 1 da recta de regressão: H 0: b 1 = 0 vs. H 1: b 1 0 t 1obs = 61,777 (valor observado da estatística do teste, ver tabela dos coeficientes) o valor observado da estatística do teste é elevado pois a estimativa que se obtém para b 1 (7,20 x 10-5 ) é um valor superior a 0 (o valor especificado em H 0). ssim: p-value = 2 P(T>61.777) = 2 (1- P(T <61.557) = 2 (1- t n-2(61.557)) = 2 (1-CDF.T(61.557, 20)) = 2 x 0 = 0 1.5. Qual é a proporção de variabilidade de Y explicada por x? Da tabela de NOV podemos obter o coeficiente de determinação R 2 =,995 (ver R square). Este coeficiente mede a quantidade de variabilidade explicada por x, isto é, pelo modelo de regressão já que consiste na razão entre a soma dos quadrados devido aos resíduos (SS R) e a soma dos quadrados total (S YY ). Então, R 2 =,995 quer dizer que 99.5% da variabilidade encontrada para y é explicada por x e apenas os restantes 0,5% se devem a outros factores. Um bom ajuste do modelo deve reflectir-se num valor de R 2 próximo de 1. Como neste caso o coeficiente de determinação é bastante elevado (muito próximo de 1), podemos concluir que a relação linear entre as duas variáveis é forte.

1.6. Proceda à análise dos resíduos com a intenção de validar os pressupostos do modelo. Pressupostos de regressão: os erros são independentes e identicamente distribuídos com distribuição Normal de media zero e variância σ 2. Uma vez que não conhecemos os erros temos que analisar a sua estimativa que é dada pelos resíduos: Para validar que os resíduos têm distribuição Normal: construir QQ-plot ou PP-plot dos resíduos, realizar teste de ajustamento de Kolmogorov-Smirnov através do menu de Regressão Linear podemos fazer directamente um PP-plot dos resíduos Para validar que os resíduos são independentes e identicamente distribuídos (são aleatórios e com variância constante): construir gráficos de resíduos versus valores preditos ou observados. Todos estes gráficos podem ser feitos através do menu de Regressão Linear:

Normal P-P Plot of Regression Standardized Residual Dependent Variable: Unidades fornecidas 1,0 Expected Cum Prob 0,8 0,6 0,4 0,2 0,0 0,0 0,2 0,4 0,6 0,8 Observed Cum Prob 1,0 O PP-plot não nos dá qualquer indicação que contrarie o pressuposto da normalidade dos resíduos O gráfico de dispersão dos resíduos em função dos valores preditos estandardizados mostra-se bastante aleatório Também podemos fazer um QQ-plot ou um teste de ajustamento de K-S para validar os pressupostos de normalidade dos resíduos. Para isto devemos guardar os resíduos numa nova variável, usando a opção Save do menu de Linear Regression

Depois podemos escolher o menu nalyze \ Descriptive Statistics \ Explore com a opção Normality plots with tests Usando a variável RES-1 (os resíduos guardados) e fazendo um QQ-plot e os testes de ajustamento de Kolmogorov-Smirnov e de Shapiro Wilk podemos concluir que os resíduos têm distribuição Normal (o QQ-plot identifica um ajuste entre os quantis amostrais e os quantis de distribuição Normal e os testes de ajustamentos fornecem valores de p-values superiores aos níveis usuais de significância. Tests of Normality Kolmogorov-Smirnov(a) Shapiro-Wilk Statistic df Sig. Statistic df Sig. Unstandardized Residual,085 22,200(*),982 22,940 * This is a lower bound of the true significance. a Lilliefors Significance Correction