TUTORIAL SOBRE ANÁLISE DE REGRESSÃO



Documentos relacionados
Sessão Saber profundo Contribuição dos xs (

Exemplo de Regressão Linear Simples

Regressão Linear em SPSS

Curso de MINITAB Universidade Federal de Ouro Preto. Planejamento de Experimentos (DOE)

2008 Mini-manual do SAS

Contabilometria. Aula 10 Grau de Ajustamento e Verificação das Premissas MQO

Roteiro para a construção do gráfico seqüencial

TUTORIAL PARA PREPARAÇÃO E IMPORTAÇÃO DE DADOS PARA. Os dados de suas coletas devem ser organizados em uma planilha eletrônica, de modo

Dicas rápidas do Minitab

Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística

IMES Catanduva. Probabilidades e Estatística. no Excel. Matemática. Bertolo, L.A.

Estatística Descritiva III. Análises de Correlação e Regressão

EXCEL NA ANÁLISE DE REGRESSÃO

ANÁLISE ESTATÍSTICA DE DADOS

MATLAB Avançado. Melissa Weber Mendonça

Estatística Computacional A - Aula SAS 01 Estatísticas Descritivas Prof. José Carlos Fogo

Linguagem R R-Gui e R-Commander

Regressão linear múltipla - Correlação parcial

Sistema topograph 98. Tutorial Módulo Fundiário

Correlação e Regressão

Análise de séries temporais aplicada aos valores do salário mínimo necessário do Brasil

RESUMO DA AULA PRÁTICA DE EXCEL

Linguagem R R-Gui e R-Commander

Apostila de estatística básica Minitab Organizador: Daniel Magalhães Lima. Autores:

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO

Por que estudar econometria? Passos para uma análise econômica empírica. Por que estudar econometria? Tipos de dados Cross Section

VPL do Projeto. Parte 3. O VPL Projetado Como fazer na planilha Excel

SOLID EDGE ST3 TUTORIAL 2 CRIANDO UM DESENHO NO AMBIENTE DRAFT

Análise de Regressão - Aula Prática 1 R, SAS, Minitab e SPSS

TUTORIAL AMBIENTE WEB PORTUGOL

Ajuste de Curvas. Ajuste de Curvas

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro RESUMO -

Métodos de Previsão em Negócios Soluções das Atividades

Tutorial Processo Seletivo - cadastros

Usando o NVU Parte 2: Inserindo imagens

PROGRAMA DE PÓS-GRADUAÇÃO EM ZOOTECNIA (GENÉTICA E MELHORAMENTO ANIMAL) CURSO DE : MESTRADO ( X ) DOUTORADO ( ) DADOS SOBRE A DISCIPLINA

FSP/USP. HEP5800 Bioestatística_2011 Denise Pimentel Bergamaschi

Tratamento de Dados Utilizando o SciDAVis Tutorial Parte 1 Como construir um gráfico e fazer um ajuste linear

PRINCÍPIOS DE INFORMÁTICA PRÁTICA OBJETIVO 2. BASE TEÓRICA. 2.1 Definição de Planilha Eletrônica

P3 da 2ª Etapa/2013 Valor: 3,0 pontos. Atividades usando o GEOGEBRA.

16 - SCARTA. 1. Abrir o SCARTA clicando no ícone que se encontra na área de trabalho (Fig.1). Fig.1- Ícone do SCARTA

Tutorial. Exportando mapas para KML. Versão /01/2009. Autores: Natalia Estevam, Vitor Pires Vencovsky

AULAS 14, 15 E 16 Análise de Regressão Múltipla: Problemas Adicionais

Aula 01 Conceitos Iniciais sobre Excel 2010

Manual de Procedimentos Gestão de Riscos e Controles Internos 1 OBJETIVO

Análise de Regressão Linear Simples e Múltipla

SPSS Statistical Package for the Social Sciences Composto por dois ambientes:

Todos os direitos reservados e protegidos pela Lei de 19/02/1998.

ESTUDANDO ESTATÍSTICA DESCRITIVA COM AUXÍLIO DO SOFTWARE CALC

Instituto Nacional de Pesquisas da Amazônia EXERCÍCIOS PARA O CURSO DE ESTATÍSTICA

ENADE Exame Nacional de Desempenho de Estudantes. Instituições do Ensino Superior do Município de São Paulo

IMPRESSÃO DE DADOS VARIÁVEIS usando Adobe InDesign e OpenOffice.org

5 Cap 8 Análise de Resíduos. Outline. 2 Cap 2 O tempo. 3 Cap 3 Funções de Sobrevida. Carvalho MS (2009) Sobrevida 1 / 22

VALIDAÇÃO DE MODELOS DE REGRESSÃO POR BOOTSTRAP. João Riboldi 1

Com este tutorial, temos por objetivo determinar a distância entre duas localidades.

Planilhas Eletrônicas Básico. André Aziz Francielle Santos

UTILIZAÇÃO DOS PROGRAMAS GS+ E VARIOWIN

Solução do Conjunto de Problemas 2

CONDICIONAMENTO OPERANTE

EXCEL Público Alvo: Arquitetos Engenheiros Civis Técnicos em Edificações Projetistas Estudantes das áreas de Arquitetura, Decoração e Engenharia

Tutorial de Viga: Ansys - Beam3

Prof. Dr. Iron Macêdo Dantas

1. OBJETIVO Este documento tem por objetivo, estabelecer um padrão para a emissão dos relatórios anuais com base na NR 7.

Estatística no EXCEL

RESPOSTAS DAS QUESTÕES ANULADAS OU COM MUDANÇA DE GABARITO

Aula Prática: Regressão Linear Simples

PROF. Ms. GUSTAVO CELESTINO MARTINS PROF. Dr. GUANIS DE BARROS VILELA JUNIOR

ANÁLISE DE DADOS. Familiarização com o SPSS

TRABALHO FINAL. Análise Estatística da Pesquisa de Clima aplicada em operadores de uma empresa do segmento alimentício

Para criar uma nova apresentação: 1.Escolha a opção Apresentação em Branco Clique no botão Ok

Altere ou exclua os números aqui

Conteúdo GERACÃO DO ARQUIVO PARA EMISSÃO DA NF ELETRÔNICA... 2

CADUB 2.1. Tutorial de auxílio ao usuário

BIOESTATÍSTICA. Análise de regressão

CURSO ON-LINE PROFESSOR GUILHERME NEVES

Capítulo 7. Experimentos com dois ou três Fatores de Interesse. Gustavo Mello Reis José Ivo Ribeiro Júnior

APOIO À ATIVIDADE DE ANÁLISE DESCRITIVA DESENVOLVIDA NA OFICINA ESTATÍSTICA PARA TODOS"

SPID TOPO GUIA DE USO

16. O PRIMEIRO CARRO. O custo real de um carro financiado. Guia do Professor

BIE5782. Unidade 7: INTRODUÇÃO AOS MODELOS LINEARES

Nero AG SecurDisc Viewer

CONTEÚDO PROGRAMÁTICO

Treinamento em BrOffice.org Writer

RELATÓRIO PESQUISA DE MERCADO

2. A FERRAMENTA SOLVER (EXCEL)

Capítulo 2. VARIÁVEIS DO TIPO INTEIRO

Estatística Descritiva

Transcrição:

TUTORIAL SOBRE ANÁLISE DE REGRESSÃO I. No R: ### Exemplo dados dos alunos: altura x peso ### x = altura e y = peso ############################################ # Entrada de Dados x <- c(.6,.57,.77,.75,.83,.69,.9,.75,.7,.68,.9,.58,.77) y <- c(54.5,43.0,7.0,77.0,76.0,83.0,78.0,90.0,59.0,75.4,0.0,43.0,88.0) a) Calculando as expressåes na raéa : plot(x,y, pch=9, col="red3") n <- length(x) xbar <- mean(x) ybar <- mean(y) sx <- var(x) sy <- var(y) sxy <- (sum(x*y)-n*xbar*ybar)/(n-) rxy <- cor(x,y) # gráfico peso x altura # tamanho da amostra # média das alturas # média dos pesos # variância das alturas # variância dos pesos # covariância entre peso e altura # correlação entre peso e altura ## Ajuste de mínimos quadrados ## estimativas dos coeficientes beta <- sxy/sx beta0 <- ybar-xbar*beta c(beta0,beta) ## Coeficiente de determinação R <- (sxy^)/(sy*sx) R (rxy)^ beta*sxy/sy ## Valores ajustados e resíduos ych <- beta0 + beta*x ei <- y - ych # relação de R com rxy # relação de R com beta # valores ajustados # resíduos ## plotando a reta ajustada plot(x,y, pch=9, col="red3", main="gráfico de pontos", xlab="altura", ylab="peso") lines(x[order(x)], ych[order(x)],col="blue3", lwd=) ## Análise gráfica para verificação das suposições ## do modelo (normalidade e igualdade de variâncias) # histograma hist(ei, col="bisque", main="histograma dos resíduos", xlab="resíduos", ylab="frequência", cex.main=.5) # normal qq-plot dos resíduos qqnorm(ei) qqline(ei) # resíduos x valores ajustados plot(ych,ei, main="resíduos x Ajustados", pch=9, col="red3") # resíduos x ordem (timeplot) plot(ei, main="resíduos x ordem", pch=9, col="red3") lines(ei, lwd=, col="blue3")

b) Explorando os recursos do R: # Usando o comando - lm reta <- lm(y~x) reta # guardando os resultados do ajuste summary(reta) # sumário do ajuste ## O commando summary fornece: ## i) descritivas dos resíduos; ## ii) coeficientes estimados com respectivos testes de siginificância; ## iii) erro padrão dos resíduos (estimativa do desvio padrão sigma); ## iv) coef. de determinação R e R-ajustado; ## v) teste F da tabela ANOVA, para testar Ho:beta=0. aov(reta) res <- reta$residuals sdres <- rstandard(reta) ajus <- reta$fitted # somas de quadrado dos resíduos e do modelo # resíduos # resíduos padronizados # valores ajustados # traçando a reta de regressão plot(x,y, pch=9, col="red3", main="gráfico de pontos", xlab="altura", ylab="peso") abline(coef(reta), col="blue3", lwd=) # verificação das suposições do modelo: # teste de normalidade de Kolmogorov-Smirnov ks.test(sdres,pnorm,0,) ## Análise gráfica para verificação das suposições ## do modelo (normalidade e igualdade de variâncias) ## gráfico 4x par(mfrow = c(,)) # esse comando divide a janela gráfica numa matriz x # histograma dos resíduos hist(sdres, col = "bisque", xlab="resíduos padronizados", ylab=" ", main="histograma dos Resíduos", cex.main=) # gráfico normal qq-plot dos resíduos qqnorm(sdres, pch=9, col="red", xlab="quantis teóricos", ylab="quantis amostrais", main="normal Q-Q plot dos Resíduos", cex.main=) qqline(sdres, col="blue3") # gráfico resíduos x valores ajustados plot(ajus,sdres,pch=9,col="red", xlab="valores ajustados", ylab="resíduos padronizados", main="resíduos x Ajustados", cex.main=) lines(c(0,max(ajus)),c(0,0),lty=) # resíduos x ordem (timeplot) plot(sdres, main="resíduos x ordem", ylab="resíduos padronizados", pch=9, col="red3", cex.main=) lines(sdres, col="blue3") lines(c(0,max(ajus)),c(0,0),lty=) par(mfrow = c(,))

II. No SAS: a) Na janela Editor do SAS digitar (ou colar) os comandos abaixo; b) Marcar as linhas conforme os 3 blocos de comandos: a. parte; a. parte e 3a. parte; c) Clicar no botão submit, (ver figura) para cada bloco de comandos marcado; d) Observar as saídas (quando houver) na janela Output. Comando /* a. parte - entrada dos dados */ data exemplo; input altura peso; cards;.6 54.5.57 43.0.77 7.0.75 77.0.83 76.0.69 83.0.9 78.0.75 90.0.7 59.0.68 75.4.9 0.0.58 43.0.77 88.0 ; proc corr data=exemplo noprob; Descrição O comando data é usado para criar o conjunto de dados, que no caso, recebeu o nome de exemplo. O conjunto de dados exemplo tem duas variáveis contínuas: altura e peso. O comando proc corr calcula o coeficiente de correlação linear entre as variáveis /* a. parte - ajuste da regressao */ title 'Analise Grafica do Ajuste'; symbol v=dot h= c=green; proc reg data=exemplo; model peso=altura; output out=saida p=ajus r=res student=sdres; title 'Grafico de pontos'; plot peso*altura /lline= cline=red; proc print data=saida; As definições title e symbol são fixadas para os gráficos. O comando para o ajuste e análise da regressão é o proc reg, que utiliza os dados em exemplo. O modelo ajustado é definido pela opção model peso=altura, que define o modelo de regressão linear simples para peso e altura. A opção output define o arquivo saida com os valores ajustados (ajus); resíduos (res) e resíduos padronizados (sdres). A opção plot constrói o gráfico de pontos peso*altura, com a reta ajustada. Como saídas do proc reg o SAS fornece a tabela análise de variâncias (tabela ANOVA); o coeficiente de determinação R e os testes individuais para os parâmetros do modelo.

/* 3a. parte - avaliação das suposições do modelo */ title 'Residuos x Valores Ajustados'; plot r.*p. /nostat; title 'Residuos x Ordem'; plot r.*obs. /nostat; title 'Normal QQ-plot dos Residuos'; plot student.*nqq. /noline nostat; quit; O comando plot é usado para a construção dos gráficos que servirão para a avaliação das suposições de normalidade e igualdade de variância. Cada gráfico é identificado pelo seu subtítulo, dado pela opção title.

III. No Minitab: a) Digitar os dados na planilha do Minitab (Worksheet) conforme figura. Pode ser copiado e colado direto do Excel se preferir; b) No menu Stat, selecionar Basic Statistics e em seguida Correlation; c) Na próxima janela, selecionar as variáveis para o coeficiente de correlação linear e clicar OK;

d) No menu Stat, selecionar a opäåo Regression e na sequçncia, selecionar Regression novamente; e) Na janela que vai abrir, selecionar as variéveis resposta e preditora, conforme abaixo; f) Ainda na janela Regression, selecionar a opäåo Graphs e marcar os gréficos desejados, individualmente (Figura da esquerda) ou todos os 4 gréficos na opäåo quatro em um Four in one (Figura da direita). Na opäåo Residuals for Plots, marcar Standardized.

g) Observar a saída no janela Session e o gráfico gerado na janela independente. Correlations: altura; peso Pearson correlation of altura and peso = 0.797 Regression Analysis: peso versus altura The regression equation is peso = - 85 + 49 altura Predictor Coef SE Coef T P Constant -84.87 59.8-3. 0.00 altura 49.0 34.05 4.38 0.00 S = 3.40 R-Sq = 63.5% R-Sq(adj) = 60.% Analysis of Variance Source DF SS MS F P Regression 330.6 330.6 9.7 0.00 Residual Error 899.8 7.7 Total 50.5 Residual Plots for peso Percent 99 90 50 0 Normal Probability Plot - - 0 Standardized Residual Standardized Residual 0 - - 50 Versus Fits 75 Fitted Value 00 Frequency 3 0 Histogram -.0 -.5 -.0-0.5 0.0 0.5.0 Standardized Residual.5 Standardized Residual 0 - - 3 Versus Order 4 5 6 7 8 9 0 3 Observation Order

Exemplo: Medidas feitas em um grupo de homens envolvidos em um curso de fitness na N.C. State University. As variáveis coletadas foram: Idade (anos); peso (kg); taxa de consumo de oxigênio (ml por kg de peso por minuto); tempo gasto para correr.5 milhas (minutos); frequência cardíaca em repous (pulso); frequência cardíaca durante a corrida (medida ao mesmo tempo que a taxa de consumo de oxigênio) e frequência cardíaca máxima registrada na corrida. Abaixo são apresentadas apenas as variáveis tempo de corrida e taxa de consumo de oxigênio. Avalie se o modelo de regressão linear simples pode ser ajustado para as variáveis tempo de corrida e taxa de consumo de oxigênio. tempo oxigenio.37 44.609 0.07 45.33 8.65 54.97 8.7 59.57 9. 49.874.63 44.8.95 45.68 0.85 49.09 3.08 39.44 8.63 60.055 0.3 50.54 4.03 37.388. 44.754 0.60 47.73 0.33 5.855 8.95 49.56 0.95 40.836 0.00 46.67 0.5 46.774 0.08 50.388.63 39.407.7 46.080 9.63 45.44 8.9 54.65.08 45.8.88 39.03 0.47 45.790 9.93 50.545 9.40 48.673.50 47.90 0.50 47.467