REGRESSÃO LINEAR SIMPLES Noções preliminares

Tamanho: px
Começar a partir da página:

Download "REGRESSÃO LINEAR SIMPLES Noções preliminares"

Transcrição

1 Pàg 1 de 66

2 Quando temos duas variáveis numéricas podemos ter: Relação funcional entre as duas variáveis Y = f(x) Relação estatística entre as duas variáveis A relação entre X e Y não é perfeita Exemplo de relação funcional e relação estatística Pàg 2 de 66

3 Pàg 3 de 66

4 Pàg 4 de 66

5 Pàg 5 de 66

6 Pàg 6 de 66

7 Pàg 7 de 66

8 Pàg 8 de 66

9 Pàg 9 de 66

10 Pàg 10 de 66

11 Pàg 11 de 66

12 Após executar o script acima obtemos, dentre outros, o seguinte resultado: A equação de regressão acima nos diz que: Se não aplicarmos dose alguma de fertilizante (isto é X = 0) então esperamos que o talhão de 1 ha produza kg da cultura plantada. A cada aumento de uma unidade de dose de fertilizante, isto é a cada kg de fertilizante aplicado, espera-se que, além da produção de kg, seja produzido adicionalmente kg da cultura plantada. Pàg 12 de 66

13 E este outro resultado apresentado abaixo, o que significa? Bem, estamos lidando com uma amostra (no caso n = 28 talhões). Foi com base nesta amostra que estimamos β 0 e β 1 através do algoritmo de mínimos quadrados. Este procedimento matemático foi feito via comando lm do R. Ok, mas por se tratar de uma amostra, devemos realizar um teste estatístico de hipótese, ou simplesmente um teste de hipótese. Aliás, o procedimento lm já realiza dois testes de hipótese. Um teste para β 0 e outro para β 1. Pàg 13 de 66

14 O teste de hipótese é para nós uma caixa preta. Mas vamos tentar entender o resultado que ele nos indica. Isto é importante para considerarmos se a reta de regressão obtida pode ser, de fato, representativa para o nosso problema. O primeiro teste de hipótese testa a seguinte hipótese denominada H 0 (hipótese nula) contra a hipótese alternativa H a : H 0 : β 1 = 0 X H a : β 1 0 Em essência, queremos saber se existe uma reta de regressão ou, em outras palavras, se a variável preditora X (em nosso exemplo, DOSE de fertilizante) tem relação estatística com a produção da cultura (Y), aumentando ou diminuindo conforme o valor de X. Se X tem relação estatística Y, então vai existir um valor não nulo para β 1. Então o teste tende a apontar a hipótese alternativa H a. Lembre-se que β 1 é o coeficiente angular da reta!!!! Mas se X não tem relação estatística com Y, então β 1 é nulo, ou seja, β 1 = 0. Pàg 14 de 66

15 Como interpretar o resultado do teste de hipótese para β 1 sem entender a lógica do mesmo? Passo 1 Com base no valor estimado de β 1, que é o coeficiente da variável preditora X (em nosso exemplo, DOSE) é calculado um t valor (t value). Passo 2 O t valor (t value) é uma espécie de representante do valor estimado β 1. Então se calcula a probabilidade de se obter este t valor (t value) ou um valor maior (Pr > t ), supondo que H 0 é a hipótese correta!!! Passo 3 Normalmente se decide assim: Se Pr > t for menor ou igual a 5%, então aceitamos a hipótese H a. Caso contrário aceitamos H 0. Pàg 15 de 66

16 Veja na figura abaixo o resultado que obtivemos: Passo 1 O valor estimado de β 1 é O t valor correspondente é t = Passo 2 Supondo H 0 correta (isto é supondo que β 1 = 0, o que significa que não há relação linear) a probabilidade de se obter t value maior ou igual a é de 6.06e-11 = 6.06 x = = %. Passo 3 Como Pr(> t ) = 6.06 x < 5%, então aceitamos a hipótese H a, isto é, β 1 0, o que significa dizer que há evidências de que ocorre relação linear entre as variáveis PROD e DOSE. Pàg 16 de 66

17 Uma vez que o modelo de regressão linear seja construído, é possível calcular uma medida de associação linear entre a variável resposta e a variável preditora/explicativa. Esta medida denomina-se coeficiente de determinação e é representada pelo símbolo R 2, onde 0 R 2 1 A interpretação de R 2 é a seguinte: quanto mais próximo de 1 for R 2, significa que a variável preditora explica melhor a variabilidade da variável resposta. Quanto mais próximo R 2 estiver de zero, significa que a variável preditora não é boa para explicar a variabilidade de valores da variável resposta. Em nosso exemplo R 2 = 81,24%. A variável DOSE explica bem a variabilidade de valores da variável resposta PROD Pàg 17 de 66

18 Pàg 18 de 66

19 Pàg 19 de 66

20 Sobre a influência dos pontos no modelo de regressão... Pàg 20 de 66

21 Pàg 21 de 66

22 Pàg 22 de 66

23 Sobre a alvancagem (leverage) dos pontos no modelo de regressão... Pàg 23 de 66

24 Sobre os pontos discrepantes (outliers) no modelo de regressão... Pàg 24 de 66

25 Para medir o grau de influência de cada ponto no modelo de regressão podemos usar a distância de Cook D i... REGRESSÃO LINEAR SIMPLES Noções preliminares Pàg 25 de 66

26 Veja abaixo as distâncias de Cook D i calculadas para o modelo de regressão com os 28 talhões. Note que o gráfico destacou os talhões 7, 14 e 25. Contudo, apresentam baixo valores para D i indicando baixa influência no modelo de regressão ajustado com os 28 pontos. Então podemos considerar que neste grupo de 28 pontos não ocorre ponto influente, se considerarmos, por exemplo, ponto influente com D i >= 0.5. Pàg 26 de 66

27 Se aos 28 talhões acrescentarmos o talhão 29 com DOSE = 75 kg e PROD = 92 kg obteremos o resultado abaixo. Observa-se que o talhão 29 é realmente um ponto influente (D 29 = 2.25) e é um ponto discrepante (outlier) com alta alavancagem (high leverage). Sua permanência ou retirada produz modelos de regressão consideravelmente diferentes entre si. Pàg 27 de 66

28 Agora se aos 28 talhões acrescentarmos o talhão 29 com DOSE = 32 kg e PROD = 610 kg obteremos o resultado abaixo. Observa-se que o talhão 29 não é um ponto influente (D 29 = 0.182) apesar de poder ser considerado um ponto discrepante (outlier) porém com baixa alavancagem (low leverage). Sua permanência ou retirada não altera significativamente o modelo de regressão Pàg 28 de 66

29 Para medir o grau de alavancagem (leverage) de cada ponto no modelo de regressão podemos usar o hat-value h i... h i com valores altos indicam alta alavancagem (high leverage) mas não necessariamente apresentam alta influência no modelo Como regra prática, h i com valor que seja maior que o dobro do valor médio dos h i da amostra deve ser analisado mais detalhadamente. Se a amostra de dados é muito grande, recomenda-se considerar h i com valor que seja maior que o triplo do valor médio dos h i Pàg 29 de 66

30 Veja abaixo os hat-values h i calculadas para o modelo de regressão com os 28 talhões. Note que o ponto 16 apresentará alta alavancagem (high leverage) se considerarmos que h 16 > 2h medio (h 16 = e h medio = ) Pàg 30 de 66

31 Se aos 28 talhões acrescentarmos o talhão 29 com DOSE = 75 kg e PROD = 92 kg obteremos o resultado abaixo. Note que o talhão 29 (h 29 = 0.191) realmente é um ponto de alta alavancagem (e já vimos que é também influente...) Já o ponto/talhão 16 foi considerado de alta alavancagem pelo fato de seu valor ser mais que o dobro do valor médio (h 16 = > (2* h medio ). Mas não é influente para o modelo. Pàg 31 de 66

32 Para medir o grau de discrepância (outlier) de cada ponto no modelo de regressão poderíamos usar os resíduos semiestudentizados (semistudentized residuals) e* i... Note que raiz(mse) refere-se ao grupo de resíduos... Mas cada resíduo e i pode apresentar variância(e consequentemente desvio padrão) diferente de alguns outros e i. Então os resíduos semiestudentizados, embora possam, não são usados para detectar outliers... Pàg 32 de 66

33 Para medir o grau de discrepância (outlier) de cada ponto no modelo de regressão podemos usar os resíduos padronizados (standardized residuals) r i também denominados resíduos studentizados internamente (internally studentized residuals). Os resíduos padronizados (standardized residuals) dos 28 talhões não apresentam outliers Pàg 33 de 66

34 Se aos 28 talhões acrescentarmos o talhão 29 com DOSE = 75 kg e PROD = 92 kg obteremos o resultado abaixo. Note que o talhão 29 (r 29 = ) realmente é um ponto discrepante (outlier) Pàg 34 de 66

35 Porquê Análise de Resíduos???? Pàg 35 de 66

36 Mas antes... vamos usar os resíduos para ver outras coisas em nossa massa de dados... Pàg 36 de 66

37 Vamos verificar a linearidade da função de regressão via gráfico da variável preditora X Resíduos. (No exemplo, a variável preditora é DOSE)... Observe que no gráfico DOSE versus Resíduos não se observa um padrão... os pontos estão espalhados de forma relativamente simétrica em relação ao resíduo 0... Então, a priori a linearidade é boa... Será? Um gráfico de resíduos consegue mostrar eventuais tendências... e queremos não encontrar tendência/padrão para poder considerar o modelo adequado... Pàg 37 de 66

38 Tem casos que o gráfico variável preditora versus resíduo vai apontar a não linearidade... veja abaixo... Note por exemplo que no gráfico acima Weight X Resíduo, poderíamos passar uma reta com inclinação pelos pontos... Isto é uma tendência (um padrão) que aponta que o modelo não está adequado... Pàg 38 de 66

39 Olha o exemplo abaixo ( Pàg 39 de 66

40 No exemplo abaixo, o gráfico de resíduos X variável resposta predita mostra que a regressão linear simples Y ~ X não é boa para representar a relação estatística entre Y e X, pois pelo gráfico nota-se um padrão de distribuição dos resíduos... Pàg 40 de 66

41 Veja abaixo a ideia conceitual de homocedasticidade e heterocedasticidade... Pàg 41 de 66

42 Para verificar a homocedasticidade dos resíduos... Para os 28 talhões temos: Pàg 42 de 66

43 Para verificar a homocedasticidade observando-se os gráficos devemos esperar que a linha vermelha (lowess curve) seja uniforme horizontalmente. No caso dos 28 talhões há indícios de heterocedasticidade. Assim, o requisito de homocedasticidade não é atendido, o que pode comprometer a validade do modelo de regressão linear construído... Veja abaixo outro exemplo: Pàg 43 de 66

44 Podemos também realizar testes de hipótese para verificar a ocorrência ou não de homocedasticidade. Neste teste temos: Hipótese nula H 0 : Hipótese alternativa H a : Ocorre homocedasticidade Não ocorre homocedasticidade (ocorre heterocedasticidade) Vamos realizar 3 teste de hipótese para averiguação de homocedasticidade: Teste de Breusch-Pagan NCV teste Tesste de Brown-Forsythe Lembre-se que se o p-valor do teste de hipótese for menor que 5%, adota-se o procedimento de rejeitar a hipótese H 0, aceitando portanto válida a hipótese H a. Em caso contrário, aceita-se H 0. Pàg 44 de 66

45 Vejamos os resultados dos testes para os dados dos 28 talhões E agora??? Em dois testes o p-valor foi maior que 5% (68,12% e 79,18%) indicando aceitação de H 0 e no teste de Brown- Forsythe foi significativo (1,44%) indicando aceitação de H a. Qual a sua decisão? Os resíduos apresentam ou não homocedasticidade? Pàg 45 de 66

46 Para verificar a normalidade dos resíduos... Para analisar a normalidade dos resíduos podemos usar (1) box plot; (2) histograma e (3) diagrama ramo-e-folhas dos resíduos. Estes gráficos apresentam maior utilidade quando a amostra de dados é grande. Para os 28 talhões temos: Pàg 46 de 66

47 Para analisar graficamente a normalidade dos resíduos podemos usa-se também o gráfico Q-Q plot (Quantile-Quantile plot) Veja o gráfico QQ plot para o exemplo dos 28 talhões... E então? Você acha que podemos sustentar a normalidade dos resíduos com base na observação do QQ plot? Pàg 47 de 66

48 APENDICE - SCRIPT R e Dados 28 talhões TALHAO;DOSE;PROD 1;33.2;476 2;58.8;514 3;30;400 4;52.6;578 5;52.8;512 6;30;284 7;47.4;576 8;30;226 9;30;334 10;41;420 11;61;580 12;19.8;318 13;20.8;248 14;10;244 15;12.6;178 16;5.2;126 17;8;82 18;51.8;430 19;55.8;482 20;24.6;194 21;37.8;280 22;47.6;412 23;46.4;522 24;62.6;652 25;15.8;110 26;41.4;490 27;41.4;358 28;36.6;414 Pàg 48 de 66

49 SCRIPT R #---> Obs.: para executar este script copie o comando abaixo e execute-o no ambiente do R ##### source("c:/estatistica/cursos/tut002_codr01.r") # # Pegar o diretório atual... initial.dir<-getwd() # # Mudar para o diretório de trabalho... setwd("c:/estatistica/cursos") # # Carregar eventuais bibliotecas necessárias ao processamento... library("lmtest") library("car") library("hh") # # Definir o arquivo "log" com resultados do processamento... #sink("result01.out", append = FALSE) # # Ler os dados... vdados <- read.csv("tut002_dose_prod.csv", sep=";", dec=".", header=true, stringsasfactors = FALSE) #############vdados <- read.csv("tut002_dose_prod_29outlier.csv", sep=";", dec=".", header=true, stringsasfactors = FALSE) Pàg 49 de 66

50 cat("\n \n") cat("variáveis disponíveis\n") cat(" \n") print(names(vdados)) cat("\n \n") # cat("\n \n") cat("dados da amostra\n") cat(" \n") print(vdados) cat("\n \n") ###sink("result09.txt", append = FALSE) # # #---> aqui executa a regressão linear (com o comando lm) #... o resultado fica armazenado na variável vregrlin # vregrlin <- lm(vdados$prod ~ vdados$dose) # Pàg 50 de 66

51 cat("\n \n") cat("estimadores obtidos via regressão linear\n") cat(" \n") print(vregrlin) # cat("\n \n") cat("inferências para os estimadores de Beta0 e Beta1\n") cat(" \n") print(summary(vregrlin)) # # Mostrar os resíduos... # vdataframeaux = cbind(vdados,vregrlin$fitted.values, vregrlin$residuals) cat("\n \n") cat("dados completos - mostrando resíduos\n") cat(" \n") print(vdataframeaux) # # Mostrar variável preditora X resíduos... # vdataframeaux = cbind(vdados$dose, vregrlin$residuals) vdataframeaux = as.data.frame(vdataframeaux) Pàg 51 de 66

52 names(vdataframeaux)[names(vdataframeaux)=="v1"] <- "DOSE" names(vdataframeaux)[names(vdataframeaux)=="v2"] <- "RESÍDUO" cat("\n \n") cat("variável preditora X Resíduo\n") cat(" \n") print(vdataframeaux) # cat("\n \n") cat("distância de Cook\n") cat(" \n") vdistcook = cooks.distance(vregrlin) vdataframeaux = cbind(vdados$talhao,vdistcook) vdataframeaux = as.data.frame(vdataframeaux) names(vdataframeaux)[1] <- "TALHÃO" names(vdataframeaux)[2] <- "DIST_COOK" print(vdataframeaux) cat("\n \n") # cat("\n \n") cat("hat-values\n") cat(" \n") Pàg 52 de 66

53 vhatvalues = hatvalues(vregrlin) vmediahatvalues = mean(vhatvalues) cat("\n") cat("valor médio: hmedio = ") cat(vmediahatvalues) cat("\n\n") # #---> Hat values que requerem atenção... maior que o dobro da média... vstatushatvalues = c() for (i in 1:length(vHatValues)) { if (vhatvalues[i] > (2* vmediahatvalues)) { vstatushatvalues[i] = "***" } else { vstatushatvalues[i] = "" } } vdataframeaux = cbind(vdados$talhao,vhatvalues,vstatushatvalues) vdataframeaux = as.data.frame(vdataframeaux) names(vdataframeaux)[1] <- "TALHÃO" names(vdataframeaux)[2] <- "Hat Value (h)" names(vdataframeaux)[3] <- "Obs" print(vdataframeaux) cat("\n \n") # Pàg 53 de 66

54 # f_calcula_mse <- function(avetnumerico) { vsomaquad = sum(avetnumerico * avetnumerico) vmse = vsomaquad /(length(avetnumerico) - 2) # 2 glib #--- return(vmse) } cat("\n \n") cat("resíduos semi-studentizados (semistudentized residuals)\n") cat(" \n") cat("\n") cat("---> Para melhor detectar outliers usa-se os \n") cat(" resíduos padronizados (STANDARDIZED RESIDUALS) conhecidos por \n") cat(" INTERNALLY STUDENTIZED RESIDUALS...\n\n") vresiduos vmse = vregrlin$residuals = f_calcula_mse(vresiduos) vsemistudentizeedresiduals = vresiduos / sqrt(vmse) vdataframeaux = cbind(vdados$talhao, vresiduos, vsemistudentizeedresiduals) vdataframeaux = as.data.frame(vdataframeaux) names(vdataframeaux)[1] <- "TALHAO" names(vdataframeaux)[2] <- "Residuo" names(vdataframeaux)[3] <- "Residuo semistudentizado" print(vdataframeaux) cat("\n \n") Pàg 54 de 66

55 # # # Testes de hipótese para verificação de homocedasticidade # cat("\n \n") cat("testes de hipótese para verificação de homocedasticidade\n") cat(" \n") cat("\n") cat("1) Teste de Breush-Pagan\n") cat(" \n") cat("\n") cat(" H0: ocorre homocedasticidade nos resíduos \n") cat(" Ha: não ocorre homocedasticidade nos resíduos \n") vbptest = bptest(vregrlin) print(vbptest) cat("\n") cat("2) NCV Test\n") cat(" \n") cat("\n") cat(" H0: ocorre homocedasticidade nos resíduos \n") cat(" Ha: não ocorre homocedasticidade nos resíduos \n") cat("\n") Pàg 55 de 66

56 vncvtest = ncvtest(vregrlin) print(vncvtest) cat("\n") cat("3) Brown-Forsythe Test \n") cat(" \n") cat("\n") cat(" H0: ocorre homocedasticidade nos resíduos \n") cat(" Ha: não ocorre homocedasticidade nos resíduos \n") cat("\n") cat(" Obs.: Este teste não depende da normalidade dos erros.\n") cat(" cat(" É um teste robusto quanto à forte não normalidade\n") dos dados. \n") vbrownforsythe = hov(prod ~ DOSE, data=vdados) print(vbrownforsythe) cat("\n") # # Gráfico dos dados com reta de regressão # dev.new() # Or X11() dev.1 <- as.integer(dev.cur()) dev.set(dev.1) plot(vdados$dose, vdados$prod, main="dados com reta de regressão", Pàg 56 de 66

57 xlab="dose (Kg)", ylab="produção (Kg)", pch=20) abline(vregrlin, col="red", lwd=4) # # Gráficos para verificar a distância de Cook # dev.new() # Or X11() dev.2 <- as.integer(dev.cur()) dev.set(dev.2) par(mfrow=c(1,2)) #---> Grafico 1... plot(vdados$dose, vdados$prod, main="os dados dos 28 talhões", cex.main=0.8, xlab="dose (Kg)", ylab="produção (Kg)", pch=20) abline(vregrlin, col="blue", lwd=4) text(vdados$dose, vdados$prod, labels=vdados$talhao, pos=1, cex=0.7, col="red") #---> Grafico 2... plot(vregrlin, which = 4, xaxt="n", main="distância de Cook \n Regressão com 28 talhões", cex.main=0.8 ) axis(1,vdados$talhao, cex.axis=0.6, xlab="observação (talhão)") # # Gráficos para verificar alavancagem (hat-values) Pàg 57 de 66

58 # dev.new() # Or X11() dev.3 <- as.integer(dev.cur()) dev.set(dev.3) par(mfrow=c(1,2)) #---> Grafico 1... plot(vdados$dose, vdados$prod, main="os dados dos 28 talhões", cex.main=0.8, xlab="dose (Kg)", ylab="produção (Kg)", pch=20) abline(vregrlin, col="blue", lwd=4) text(vdados$dose, vdados$prod, labels=vdados$talhao, pos=1, cex=0.7, col="red") #---> Grafico 2... plot(vhatvalues, xaxt="n", main="alavancagem (leverage) \n Regressão com 28 talhões", cex.main=0.8, ylab="hat values (h)", type="h", xlab="observação (talhão)" ) axis(1,vdados$talhao, cex.axis=0.6, xlab="observação (talhão)") for (i in 1:length(vHatValues)) { if (vhatvalues[i] > (2* vmediahatvalues)) { #### points(vdados[i,1], vhatvalues[i], col='red', pch=20) text(vdados[i,1], vhatvalues[i], labels=vdados[i,1], pos=3, cex=0.7) } } Pàg 58 de 66

59 # # Gráficos para verificar linearidade da função de regressão # dev.new() # Or X11() dev.4 <- as.integer(dev.cur()) dev.set(dev.4) par(mfrow=c(1,2)) #---> Grafico 1... vresiduos = resid(vregrlin) plot(vdados$dose, vresiduos, main="verificar linearidade via resíduos", cex.main=0.8, xlab="dose (Kg)", ylab="resíduos", pch=20) abline(0,0, col="blue", lwd=4, lty=2) vx = vdados$dose vy = vresiduos vcurvalowess = loess(vy ~ vx) vxloess_seq = seq(min(vx),max(vx), (max(vx)- min(vx))/1000) lines(vxloess_seq, predict(vcurvalowess,vxloess_seq), col='red', lwd=1) #---> Grafico 2... plot(vdados$dose, vdados$prod, main="gráficos dos dados \n para verificar linearidade", cex.main=0.8, xlab="dose (Kg)", ylab="produção (Kg)", pch=20) abline(vregrlin, col="red", lwd=4) Pàg 59 de 66

60 # # Gráficos para verificar homocedasticidade (constância da variância) # dev.new() # Or X11() dev.5 <- as.integer(dev.cur()) dev.set(dev.5) par(mfrow=c(1,3)) #---> Grafico 1... vresiduos = resid(vregrlin) plot(vdados$dose, vresiduos, main="serve para \n verificar homocedasticidade", cex.main=0.9, xlab="dose (Kg)", ylab="resíduos", pch=20) abline(0,0, col="blue", lwd=4, lty=2) vx = vdados$dose vy = vresiduos vcurvalowess = loess(vy ~ vx) vxloess_seq = seq(min(vx),max(vx), (max(vx)- min(vx))/1000) lines(vxloess_seq, predict(vcurvalowess,vxloess_seq), col='red', lwd=1) #---> Grafico 2... vresiduos = resid(vregrlin) plot(vregrlin$fitted, vresiduos, main="serve para \n verificar homocedasticidade", cex.main=0.9, xlab="produção ajustada(kg)", ylab="resíduos", pch=20) Pàg 60 de 66

61 abline(0,0, col="blue", lwd=4, lty=2) vx = vregrlin$fitted vy = vresiduos vcurvalowess = loess(vy ~ vx) vxloess_seq = seq(min(vx),max(vx), (max(vx)- min(vx))/1000) lines(vxloess_seq, predict(vcurvalowess,vxloess_seq), col='red', lwd=1) #---> Grafico 3... # # Gráfico Scale-Location # #------> Padronização dos resíduos... para auxiliar detecção de homo/hetero...cedasticidade!!! vresiduos = resid(vregrlin) # pegar os resíduos... vresiduos = vresiduos / (summary(vregrlin)$sigma) # resíduos (semi)studentizados... vresiduos = abs(vresiduos) vresiduos = sqrt(vresiduos) vdataframeaux = cbind(vregrlin$fitted.values, vresiduos) vdataframeaux = as.data.frame(vdataframeaux) names(vdataframeaux)[1] <- "PROD_ESTIMADA" names(vdataframeaux)[2] <- "RAIZ_RESIDUO_PADRONIZADO" plot(vdataframeaux$prod_estimada, vdataframeaux$raiz_residuo_padronizado, main="gráfico SCALE-LOCATION \n Para verificar homocedasticidade", cex.main=0.9, xlab="produção ajustada (Kg)", ylab="raiz(resíduo-standardized)", pch=20) vy = vdataframeaux$raiz_residuo_padronizado Pàg 61 de 66

62 vx = vdataframeaux$prod_estimada vcurvalowess = loess(vy ~ vx) vxloess_seq = seq(min(vx),max(vx), (max(vx)- min(vx))/1000) lines(vxloess_seq, predict(vcurvalowess,vxloess_seq), col='red', lwd=1) # # Gráficos para verificar normalidade dos resíduos # dev.new() # Or X11() dev.6 <- as.integer(dev.cur()) dev.set(dev.6) par(mfrow=c(2,2)) #---> Grafico 1... Box plot dos resíduos vresiduos = resid(vregrlin) # pegar os resíduos... boxplot(vresiduos, main="resíduos dos 28 talhões", ylab="resíduo") #---> Grafico 2... Histograma dos resíduos vresiduos = resid(vregrlin) # pegar os resíduos... vnumclassessturges = nclass.sturges(vresiduos) hist(vresiduos, main="histograma dos resíduos (default do R)", cex.main=0.9, xlab="resíduo", ylab="núm. talhões") #---> Grafico 3... Histograma dos resíduos vresiduos = resid(vregrlin) # pegar os resíduos... vnumclassessturges = nclass.sturges(vresiduos) hist(vresiduos, main="histograma dos resíduos com + ou - classes", cex.main=0.9, xlab="resíduo", ylab="núm. talhões", breaks=3) Pàg 62 de 66

63 #---> Grafico 4... Histograma dos resíduos vresiduos = resid(vregrlin) # pegar os resíduos... vnumclassessturges = nclass.sturges(vresiduos) hist(vresiduos, main="histograma dos resíduos com + ou - classes", cex.main=0.9, xlab="resíduo", ylab="núm. talhões", breaks=10) #---> Grafico 5... Ramo-e-folhas(steam-and-leaf cat("\n") cat("diagrama ramo-e-folhas (steam-and-leafs)\n") cat(" \n") vresiduos = resid(vregrlin) # pegar os resíduos... stem(vresiduos) cat("\n") # # Gráfico QQ-plot para verificar normalidade dos resíduos # dev.new() # Or X11() dev.7 <- as.integer(dev.cur()) dev.set(dev.7) par(mfrow=c(2,2)) vresiduos = resid(vregrlin) # pegar os resíduos... vresiduos = sort(vresiduos) # tem que estar ordenado... N = length(vresiduos) Pàg 63 de 66

64 n.props = pnorm(vresiduos, mean(vresiduos), sd(vresiduos)) # here I calculate the probabilities associated # w/ these data if they came from a normal # distribution w/ the same mean & SD # I calculate the proportion of x we've gone through at each point props = 1:N /(N+1) n.quantiles = qnorm(props, mean=mean(vresiduos), sd=sd(vresiduos)) # this calculates the quantiles (ie # z-scores) associated w/ the props # here I bundle them together my.data = data.frame(x=vresiduos, props=props, normal.proportions=n.props, normal.quantiles=n.quantiles) vmedia = mean(my.data$normal.quantiles) vdesvpad = sd(my.data$normal.quantiles) vquantisnormaisescorez = (my.data$normal.quantiles - vmedia) / vdesvpad my.data = cbind(my.data,vquantisnormaisescorez) names(my.data)[names(my.data)=="vquantisnormaisescorez"] <- "QuantisTeoricos" vdadosgrafico = round(my.data, digits=3) cat("\n") cat("dados para composição 'manual' do QQ plot \n") cat(" \n") cat("\n") print(vdadosgrafico) cat("\n") Pàg 64 de 66

65 #---> Plot PP-plot plot(my.data$props,my.data$normal.props, main="pp plot", xlab="proporção dados %", ylab="proporção normalidade %") #---> Plot QQ-plot plot(my.data$quantisteoricos,my.data$x, main="qq plot", xlab="quantis teóricos", ylab="resíduos") #---> QQ plot do R... qqnorm(vresiduos) qqline(vresiduos,col="red") # # Para finalizar... cat("\n") cat(" \n") cat("fim DE PROCESSAMENTO \n") cat(" \n") # fechar o arquivo de saida #sink() # descarregar as bibliotecas eventualemnte usadas... detach("package:mass") detach("package:tseries") # volta a apontar ao diretório inicial setwd(initial.dir) Pàg 65 de 66

66 #====================================== F I M =============================================== Pàg 66 de 66

Análise de Resíduos. investigar características que comprometem a validade do MRLS:

Análise de Resíduos. investigar características que comprometem a validade do MRLS: Análise de Resíduos investigar características que comprometem a validade do MRLS: (1) relação entre X e Y não é linear (2) erros não tem variância constante (3) erros correlacionados (4) erros não são

Leia mais

Métodos Quantitativos para Avaliação de Políticas Públicas

Métodos Quantitativos para Avaliação de Políticas Públicas ACH3657 Métodos Quantitativos para Avaliação de Políticas Públicas Aula 11 Análise de Resíduos Alexandre Ribeiro Leichsenring [email protected] Alexandre Leichsenring ACH3657 Aula 11 1 / 26

Leia mais

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos 1 Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 27 de Setembro de 2016 2 3 O modelo de regressão linear é dado por 3 O modelo de regressão linear é dado por Y i = β

Leia mais

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 1 de Setembro de 2014 3 O modelo de regressão linear é dado por Y i = β 0 + β 1 x i + ɛ i onde ɛ i iid N(0,σ 2 ). O erro

Leia mais

Correlação e Regressão

Correlação e Regressão Correlação e Regressão Vamos começar com um exemplo: Temos abaixo uma amostra do tempo de serviço de 10 funcionários de uma companhia de seguros e o número de clientes que cada um possui. Será que existe

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski

UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA Jayme Gomes dos Santos Junior Luciana Helena Kowalski MODELAGEM DA EXPECTATIVA DE VIDA NOS MUNICÍPIOS DO PARANÁ A PARTIR DE COVARIÁVEIS DO CENSO 2010

Leia mais

Exemplo de Regressão Linear Simples

Exemplo de Regressão Linear Simples Exemplo de Regressão Linear Simples Dados: Valores de vendas de empresas do ramo de bebidas, sendo: Y = Total das vendas (US$10mil) e X = gastos com propaganda. X 11 5 3 9 1 6 5 9 Y 5 13 8 0 5 1 10 15

Leia mais

Falha(s) nas pressuposições da ANOVA

Falha(s) nas pressuposições da ANOVA Falha(s) nas pressuposições da ANOVA Prof. a Dr. a Simone Daniela Sartorio de Medeiros DTAiSeR-Ar 1 Na prática, é comum que uma ou mais hipóteses não se verifique. A mais comum é não existir homocedasticidade.

Leia mais

Regressão linear simples

Regressão linear simples Regressão linear simples Universidade Estadual de Santa Cruz Ivan Bezerra Allaman Introdução Foi visto na aula anterior que o coeficiente de correlação de Pearson é utilizado para mensurar o grau de associação

Leia mais

Mais Informações sobre Itens do Relatório

Mais Informações sobre Itens do Relatório Mais Informações sobre Itens do Relatório Amostra Tabela contendo os valores amostrados a serem utilizados pelo método comparativo (estatística descritiva ou inferencial) Modelos Pesquisados Tabela contendo

Leia mais

Modelos de Regressão Múltipla - Parte VIII

Modelos de Regressão Múltipla - Parte VIII 1 Modelos de Regressão Múltipla - Parte VIII Erica Castilho Rodrigues 15 de Fevereiro de 2017 2 3 Observações não usuais 4 As observações não usuais podem ser: Outliers: não se ajustam bem ao modelo (resíduo

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR DENNIS LEÃO GRR LUAN FIORENTIN GRR

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR DENNIS LEÃO GRR LUAN FIORENTIN GRR UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR -20149072 DENNIS LEÃO GRR - 20160239 LUAN FIORENTIN GRR - 20160219 MODELAGEM DA QUANTIDADE DE MATRÍCULAS NO ENSINO REGULAR NO ESTADO DO

Leia mais

MAE Estatística Descritiva - 1 o semestre de 2017 Professora: Márcia D Elia Branco Monitora PAE: Simone Harnik Gabarito - Lista 4

MAE Estatística Descritiva - 1 o semestre de 2017 Professora: Márcia D Elia Branco Monitora PAE: Simone Harnik Gabarito - Lista 4 MAE0217 - Estatística Descritiva - 1 o semestre de 2017 Professora: Márcia D Elia Branco Monitora PAE: Simone Harnik Gabarito - Lista 4 Exercício 1 Uma rede de supermercados decidiu dar um bônus aos clientes

Leia mais

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012 1 AULA 09 Regressão Ernesto F. L. Amaral 17 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à

Leia mais

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei Regressão PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei Regressão Introdução Analisar a relação entre duas variáveis (x,y) através da equação (equação de regressão) e do gráfico

Leia mais

Associação entre duas variáveis

Associação entre duas variáveis Associação entre duas variáveis Questões de interesse: Será que duas variáveis são independentes ou pelo contrário dependentes? E se forem dependentes, qual o tipo e grau de dependência? Existem diversas

Leia mais

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina. Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina. De forma geral, a prova manteve o padrão das questões da

Leia mais

A UTILIZAÇÃO DE MÉTODOS ESTATÍSTICOS NO PLANEJAMENTO E ANÁLISE DE ESTUDOS EXPERIMENTAIS EM ENGENHARIA DE SOFTWARE (FONTE:

A UTILIZAÇÃO DE MÉTODOS ESTATÍSTICOS NO PLANEJAMENTO E ANÁLISE DE ESTUDOS EXPERIMENTAIS EM ENGENHARIA DE SOFTWARE (FONTE: A UTILIZAÇÃO DE MÉTODOS ESTATÍSTICOS NO PLANEJAMENTO E ANÁLISE DE ESTUDOS EXPERIMENTAIS EM ENGENHARIA DE SOFTWARE (FONTE: ESELAW 09 MARCOS ANTÔNIO P. & GUILHERME H. TRAVASSOS) 1 Aluna: Luana Peixoto Annibal

Leia mais

ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos:

ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos: ANÁLISE DOS RESÍDUOS Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos: seguem uma distribuição normal; têm média zero; têm variância σ 2 constante

Leia mais

Análise de Regressão Prof. MSc. Danilo Scorzoni Ré FMU Estatística Aplicada

Análise de Regressão Prof. MSc. Danilo Scorzoni Ré FMU Estatística Aplicada Aula 2 Regressão Linear Simples Análise de Regressão Prof. MSc. Danilo Scorzoni Ré FMU Estatística Aplicada Conceitos Gerais A análise de regressão é utilizada para explicar ou modelar a relação entre

Leia mais

BIE5782. Unidade 7: INTRODUÇÃO AOS MODELOS LINEARES

BIE5782. Unidade 7: INTRODUÇÃO AOS MODELOS LINEARES BIE5782 Unidade 7: INTRODUÇÃO AOS MODELOS LINEARES ROTEIRO 1.Motivação 2. Método dos mínimos quadrados 3. Ajuste no R: função lm 4. Resultado no R: objeto lm 5. Premissas, interpretação e diagnóstico 6.

Leia mais

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla 9 Correlação e Regressão 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla 1 9-1 Aspectos Gerais Dados Emparelhados há uma relação? se há, qual

Leia mais

Aula 2 Uma breve revisão sobre modelos lineares

Aula 2 Uma breve revisão sobre modelos lineares Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar

Leia mais

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves Capítulo 9 - Regressão Linear Simples RLS: Notas breves Regressão Linear Simples Estrutura formal do modelo de Regressão Linear Simples RLS: Y i = β 0 + β 1 x i + ε i, 1 onde Y i : variável resposta ou

Leia mais

ME613 - Análise de Regressão

ME613 - Análise de Regressão ME613 - Análise de Regressão Parte 12 Gráficos de Regressão Parcial Samara F. Kiihl - IMECC - UNICAMP file:///users/imac/documents/github/me613-unicamp/me613-unicamp.github.io/aulas/slides/parte12/parte12.html#1

Leia mais

Notas de Aulas Econometria I ** Eduardo P. Ribeiro, 2010 PARTE II

Notas de Aulas Econometria I ** Eduardo P. Ribeiro, 2010 PARTE II Notas de Aulas Econometria I ** Eduardo P Ribeiro, 00 PARTE II Autocorrelação Autocorrelação: violação da hipótese: E [ε t ε t-s ] = 0, para s > 0, como por exemplo, ε t = ε t- + υ t, onde υ t é ruído

Leia mais

aula ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES

aula ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES 18 aula META Fazer com que o aluno seja capaz de realizar os procedimentos existentes para a avaliação da qualidade dos ajustes aos modelos. OBJETIVOS Ao final

Leia mais

Lucas Santana da Cunha de julho de 2018 Londrina

Lucas Santana da Cunha de julho de 2018 Londrina Análise de Correlação e Lucas Santana da Cunha email: [email protected] http://www.uel.br/pessoal/lscunha/ 26 de julho de 2018 Londrina 1 / 17 Há casos em que pode existir um relacionamento entre duas variáveis:

Leia mais

Aula Prática 1. Uso do R com exemplos Adaptação: Flávia Landim/UFRJ

Aula Prática 1. Uso do R com exemplos Adaptação: Flávia Landim/UFRJ Aula Prática 1 Uso do R com exemplos Adaptação: Flávia Landim/UFRJ Objetivos Analisar duas variáveis quantitativas: traçando diagramas de dispersão, para avaliar possíveis relações entre as duas variáveis;

Leia mais

Métodos Estatísticos Avançados em Epidemiologia

Métodos Estatísticos Avançados em Epidemiologia 1 / 44 Métodos Estatísticos Avançados em Epidemiologia Análise de Variância - ANOVA Referência: Cap. 12 - Pagano e Gauvreau (2004) - p.254 Enrico A. Colosimo/UFMG Depto. Estatística - ICEx - UFMG 2 / 44

Leia mais

Na aula do dia 24 de outubro analisamos duas variáveis quantitativas conjuntamente com o objetivo de verificar se existe alguma relação entre elas.

Na aula do dia 24 de outubro analisamos duas variáveis quantitativas conjuntamente com o objetivo de verificar se existe alguma relação entre elas. Regressão Múltipla Na aula do dia 24 de outubro analisamos duas variáveis quantitativas conjuntamente com o objetivo de verificar se existe alguma relação entre elas. 1. definimos uma medida de associação

Leia mais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti. Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Regressão David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Regressão Linear ( e Múltipla ) Não-Linear ( Exponencial / Logística

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com [email protected] Turma: 2º / 2016 1 Agenda

Leia mais

Análise de Regressão EST036

Análise de Regressão EST036 Análise de Regressão EST036 Michel Helcias Montoril Instituto de Ciências Exatas Universidade Federal de Juiz de Fora Regressão sem intercepto; Formas alternativas do modelo de regressão Regressão sem

Leia mais

Análise de Regressão Linear Simples e

Análise de Regressão Linear Simples e Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução A análise de regressão estuda o relacionamento entre uma variável

Leia mais

Os Mínimos Quadrados Ordinários Assintóticos

Os Mínimos Quadrados Ordinários Assintóticos Os Mínimos Quadrados Ordinários Assintóticos Enquadramento 1. A analise assintótica, é o método matemático que descreve a limitação de um determinado comportamento. O termo assintótico significa aproximar-se

Leia mais

Esse material foi extraído de Barbetta (2007 cap 13)

Esse material foi extraído de Barbetta (2007 cap 13) Esse material foi extraído de Barbetta (2007 cap 13) - Predizer valores de uma variável dependente (Y) em função de uma variável independente (X). - Conhecer o quanto variações de X podem afetar Y. Exemplos

Leia mais

Modelos de Regressão Linear Simples - parte III

Modelos de Regressão Linear Simples - parte III 1 Modelos de Regressão Linear Simples - parte III Erica Castilho Rodrigues 20 de Setembro de 2016 2 3 4 A variável X é um bom preditor da resposta Y? Quanto da variação da variável resposta é explicada

Leia mais

Planejamento de Experimentos

Planejamento de Experimentos Planejamento de Experimentos 1 6.4 Os Modelos fatoriais 2 k : o caso geral. O modelo estatístico para um plano 2 k inclui k ( k 2 ( k ) ) efeitos principais efeitos de interação de ordem 2 efeitos de interação

Leia mais

Métodos Quantitativos Aplicados

Métodos Quantitativos Aplicados Métodos Quantitativos Aplicados Aula 10 http://www.iseg.utl.pt/~vescaria/mqa/ Tópicos apresentação Análise Regressão: Avaliação de relações de dependência em que se explica o comportamento de uma/várias

Leia mais

RELATÓRIO DA ANÁLISE DE REGRESSÃO (Ex1 - Reg. Linear Simples) ****************************** PASSO 1 *******************************

RELATÓRIO DA ANÁLISE DE REGRESSÃO (Ex1 - Reg. Linear Simples) ****************************** PASSO 1 ******************************* RELATÓRIO DA ANÁLISE DE REGRESSÃO (Ex1 - Reg. Linear Simples) ****************************** PASSO 1 ******************************* O grau do polinomio é 1 (Linear) Tem um outlier *TESTE DA HOMOCEDASTICIDADE

Leia mais

VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO DE ANÁLISE DE VARIÂNCIA ANÁLISE DE RESÍDUOS

VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO DE ANÁLISE DE VARIÂNCIA ANÁLISE DE RESÍDUOS VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO DE ANÁLISE DE VARIÂNCIA ANÁLISE DE RESÍDUOS Conforme foi apresentado anteriormente, o modelo de análise de variância assume que as observações são independentes e normalmente

Leia mais

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Testes de Hipóteses Ricardo Ehlers [email protected] Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Introdução e notação Em geral, intervalos de confiança são a forma mais

Leia mais

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa REGRESSÃO LINEAR Parte I Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação para o Planejamento Julho de 2015 Onde Estamos Para onde vamos Inferência Esta5s6ca se resumindo a uma equação

Leia mais

Introdução ao modelo de Regressão Linear

Introdução ao modelo de Regressão Linear Introdução ao modelo de Regressão Linear Prof. Gilberto Rodrigues Liska 8 de Novembro de 2017 Material de Apoio e-mail: [email protected] Local: Sala dos professores (junto ao administrativo)

Leia mais

b) Variáveis Aleatórias Contínuas

b) Variáveis Aleatórias Contínuas Disciplina: 221171 b) Variáveis Aleatórias Contínuas Prof. a Dr. a Simone Daniela Sartorio de Medeiros DTAiSeR-Ar 1 Uma variável aleatória é contínua (v.a.c.) se seu conjunto de valores é qualquer intervalo

Leia mais

Homocedasticidade? Exemplo: consumo vs peso de automóveis

Homocedasticidade? Exemplo: consumo vs peso de automóveis REGRESSÃO Análise de resíduos Homocedasticidade? Exemplo: consumo vs peso de automóveis 60 50 Consumo (mpg) 40 30 0 10 0 1500 000 500 3000 3500 4000 4500 Peso 0 Diagrama de resíduos 15 10 Resíduos 5 0-5

Leia mais

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016.

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016. de Matemática Financeira e Estatística do ISS Teresina, aplicada em 8/08/016. 11 - (ISS Teresina 016 / FCC) Joana aplicou todo seu capital, durante 6 meses, em bancos ( e Y). No Banco, ela aplicou 37,5%

Leia mais

1 z 1 1 z 2. Z =. 1 z n

1 z 1 1 z 2. Z =. 1 z n Gabarito Lista 3. Tópicos de Regressão. 2016-2. 1. Temos que y i ind N (µ, φi ), com log φ i = α + γz i, para i = 1,..., n, portanto (i) para o γ = (α, γ) a matriz modelo ca Z = 1 z 1 1 z 2.. 1 z n (ii)

Leia mais

Aula 03 Estatística, Correlação e Regressão

Aula 03 Estatística, Correlação e Regressão BIS0005-15 Bases Computacionais da Ciência Aula 03 Estatística, Correlação e Regressão http://bcc.compscinet.org Prof. Rodrigo de Alencar Hausen [email protected] 1 Medidas de tendência central: Média,

Leia mais

Coleta e Modelagem dos Dados de Entrada

Coleta e Modelagem dos Dados de Entrada Coleta e Modelagem dos Dados de Entrada Capítulo 2 Páginas 24-52 Este material é disponibilizado para uso exclusivo de docentes que adotam o livro Modelagem e Simulação de Eventos Discretos em suas disciplinas.

Leia mais

Modelos de Regressão Linear Simples - Erro Puro e Falta de Ajuste

Modelos de Regressão Linear Simples - Erro Puro e Falta de Ajuste Modelos de Regressão Linear Simples - Erro Puro e Falta de Ajuste Erica Castilho Rodrigues 2 de Setembro de 2014 Erro Puro 3 Existem dois motivos pelos quais os pontos observados podem não cair na reta

Leia mais

b) Variáveis Aleatórias Contínuas

b) Variáveis Aleatórias Contínuas Disciplina: 1171 b) Variáveis Aleatórias Contínuas Prof. a Dr. a Simone Daniela Sartorio de Medeiros DTAiSeR-Ar 1 Uma variável aleatória é contínua (v.a.c.) se seu conjunto de valores é qualquer intervalo

Leia mais

Prova de Estatística

Prova de Estatística Prova de Estatística 1. Para um número-índice ser considerado um índice ideal, ele precisa atender duas propriedades: reversão no tempo e o critério da decomposição das causas. Desta forma, é correto afirmar

Leia mais

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre. UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO PROJETO DE EXTENSÃO Software R: Capacitação em análise estatística de dados utilizando um software livre. Fonte: https://www.r-project.org/ Módulo

Leia mais

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari EXPERIMENTAÇÃO AGRÍCOLA Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari [email protected] 1. Medidas de tendência central As duas medidas de tendência central mais utilizadas para resumir um conjunto

Leia mais

Quiz Econometria I versão 1

Quiz Econometria I versão 1 Obs: muitos itens foram retirados da ANPEC. Quiz Econometria I versão 1 V ou F? QUESTÃO 1 É dada a seguinte função de produção para determinada indústria: ln(y i )=β 0 + β 1 ln( L i )+β 2 ln( K i )+u i,

Leia mais

Coleta e Modelagem dos Dados de Entrada

Coleta e Modelagem dos Dados de Entrada Slide 1 Módulo 02 Coleta e Modelagem dos Dados de Entrada Prof. Afonso C. Medina Prof. Leonardo Chwif Três Etapas Coleta Tratamento Inferência Coleta dos Dados 1. Escolha adequada da variável de estudo

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ), Cinthia Zamin Cavassola(GRR ) e Luiza Hoffelder da Costa(GRR )

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ), Cinthia Zamin Cavassola(GRR ) e Luiza Hoffelder da Costa(GRR ) UNIVERSIDADE FEDERAL DO PARANÁ Adriane Machado (GRR20149152), Cinthia Zamin Cavassola(GRR20149075) e Luiza Hoffelder da Costa(GRR20149107) AJUSTE DE MODELO DE REGRESSÃO LOGÍSTICA REFERENTE À PRESENÇA DE

Leia mais

Gabarito e resolução da prova de seleção PPGE FURG Estatística

Gabarito e resolução da prova de seleção PPGE FURG Estatística Gabarito e resolução da prova de seleção PPGE FURG 2019. Questão 1) Resposta: letra c) i. (FALSO) Estatística Variáveis de interação sempre podem ser incluídas mos modelos de regressão, se isso não gerar

Leia mais

Estatística. Correlação e Regressão

Estatística. Correlação e Regressão Estatística Correlação e Regressão Noções sobre correlação Existem relações entre variáveis. Responder às questões: Existe relação entre as variáveis X e Y? Que tipo de relação existe entre elas? Qual

Leia mais

Hoje vamos analisar duas variáveis quantitativas conjuntamente com o objetivo de verificar se existe alguma relação entre elas.

Hoje vamos analisar duas variáveis quantitativas conjuntamente com o objetivo de verificar se existe alguma relação entre elas. Correlação e Regressão Hoje vamos analisar duas variáveis quantitativas conjuntamente com o objetivo de verificar se existe alguma relação entre elas. Vamos 1. definir uma medida de associação entre duas

Leia mais

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Lic. Eng. Biomédica e Bioengenharia-2009/2010 Modelos de regressão É usual estarmos interessados em estabelecer uma relação entre uma variável

Leia mais

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc. ECONOMETRIA Prof. Patricia Maria Bortolon, D. Sc. Cap. 11 Heterocedasticidade: o que acontece se a variância do erro não é constante? Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição. Rio de Janeiro.

Leia mais

Princípios em Planejamento e Análise de Dados Ecológicos. Regressão linear. Camila de Toledo Castanho

Princípios em Planejamento e Análise de Dados Ecológicos. Regressão linear. Camila de Toledo Castanho Princípios em Planejamento e Análise de Dados Ecológicos Regressão linear Camila de Toledo Castanho 217 Conteúdo da aula 1. Regressão linear simples: quando usar 2. A reta de regressão linear 3. Teste

Leia mais

CE062c José Luiz Padilha da Silva e Cesar Augusto Taconeli 06 de novembro de 2018

CE062c José Luiz Padilha da Silva e Cesar Augusto Taconeli 06 de novembro de 2018 A função plot.gamlss() CE062c José Luiz Padilha da Silva e Cesar Augusto Taconeli 06 de novembro de 2018 Considere os dados de circunferência abdominal discutido anteriormente. relacionamos a circunferência

Leia mais

Modelos de Regressão Linear Simples parte I

Modelos de Regressão Linear Simples parte I Modelos de Regressão Linear Simples parte I Erica Castilho Rodrigues 27 de Setembro de 2017 1 2 Objetivos Ao final deste capítulo você deve ser capaz de: Usar modelos de regressão para construir modelos

Leia mais

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo 1 Modelos Lineares Generalizados - Verificação do Ajuste do Modelo Erica Castilho Rodrigues 9 de Abril de 2015 2 3 Função Deviance Podemos ver o ajuste de um modelo a um conjunto de dados como: uma forma

Leia mais

CE062c José Luiz Padilha da Silva e Cesar Augusto Taconeli 13 de setembro de 2018

CE062c José Luiz Padilha da Silva e Cesar Augusto Taconeli 13 de setembro de 2018 CE062c José Luiz Padilha da Silva e Cesar Augusto Taconeli 13 de setembro de 2018 Examplo usando gamlssnp(): dados de cérebros de animais O tamanho do cérebro (brain) e peso corporal (body) foram registrados

Leia mais

Modelos de Regressão Linear Simples - parte I

Modelos de Regressão Linear Simples - parte I Modelos de Regressão Linear Simples - parte I Erica Castilho Rodrigues 19 de Agosto de 2014 Introdução 3 Objetivos Ao final deste capítulo você deve ser capaz de: Usar modelos de regressão para construir

Leia mais

1 semestre de 2014 Gabarito Lista de exercícios 3 - Estatística Descritiva III C A S A

1 semestre de 2014 Gabarito Lista de exercícios 3 - Estatística Descritiva III C A S A Exercício 1. (1,0 ponto). A tabela a seguir mostra o aproveitamento conjunto em Física e Matemática para os alunos do ensino médio de uma escola. Notas Notas Notas Física/Matemática Altas Regulares Baixas

Leia mais

AULA 4 - MQO Simples: Propriedades algébricas e Estatísticas

AULA 4 - MQO Simples: Propriedades algébricas e Estatísticas AULA 4 - MQO Simples: Propriedades algébricas e Estatísticas Susan Schommer Econometria I - IE/UFRJ Estimação: MQO recapitulando Na aula passada aprendemos estimação por MQO. Recapitulando brevemente Em

Leia mais

O objetivo dessa apostila é apresentar os comandos básicos do software R, especialmente os voltados para a estimação de modelos econométricos.

O objetivo dessa apostila é apresentar os comandos básicos do software R, especialmente os voltados para a estimação de modelos econométricos. APOSTILA BÁSICA - SOFTWARE R Luiz Guilherme Scorzafave O objetivo dessa apostila é apresentar os comandos básicos do software R, especialmente os voltados para a estimação de modelos econométricos. 1.

Leia mais

Análise da Regressão. Prof. Dr. Alberto Franke (48)

Análise da Regressão. Prof. Dr. Alberto Franke (48) Análise da Regressão Prof. Dr. Alberto Franke (48) 91471041 O que é Análise da Regressão? Análise da regressão é uma metodologia estatística que utiliza a relação entre duas ou mais variáveis quantitativas

Leia mais

Cálculo das Probabilidades e Estatística I

Cálculo das Probabilidades e Estatística I Cálculo das Probabilidades e Estatística I Prof a. Juliana Freitas Pires Departamento de Estatística Universidade Federal da Paraíba - UFPB [email protected] Distribuição Normal Motivação: Distribuição

Leia mais

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência Introdução 1 Muito frequentemente fazemos perguntas do tipo se alguma coisa tem relação com outra. Estatisticamente

Leia mais

Métodos Estatísticos Avançados em Epidemiologia

Métodos Estatísticos Avançados em Epidemiologia Métodos Estatísticos Avançados em Epidemiologia Análise de Variância - ANOVA Cap. 12 - Pagano e Gauvreau (2004) - p.254 Enrico A. Colosimo/UFMG Depto. Estatística - ICEx - UFMG 1 / 39 Introdução Existem

Leia mais

ANÁLISE DE REGRESSÃO

ANÁLISE DE REGRESSÃO ANÁLISE DE REGRESSÃO Lucas Santana da Cunha http://www.uel.br/pessoal/lscunha/ Universidade Estadual de Londrina 09 de janeiro de 2017 Introdução A análise de regressão consiste na obtenção de uma equação

Leia mais

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari EXPERIMENTAÇÃO ZOOTÉCNICA Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari [email protected] ALGUNS CONCEITOS BÁSICOS População e Amostra População é o conjunto de elementos que têm, em comum, uma

Leia mais

x n 3.3. Medidas descritiva de variáveis quantitativas: Medidas de Posição: Considere uma amostra com n observações: x 1, x 2,..., x n.

x n 3.3. Medidas descritiva de variáveis quantitativas: Medidas de Posição: Considere uma amostra com n observações: x 1, x 2,..., x n. 3.3. Medidas descritiva de variáveis quantitativas: 3.3.1. Medidas de Posição: Considere uma amostra com n observações: x 1, x,..., x n. a) Média amostral: (ou média aritmética amostral) é representada

Leia mais

Estatística Aplicada ao Serviço Social

Estatística Aplicada ao Serviço Social Estatística Aplicada ao Serviço Social Módulo 7: Correlação e Regressão Linear Simples Introdução Coeficientes de Correlação entre duas Variáveis Coeficiente de Correlação Linear Introdução. Regressão

Leia mais

CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte

CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte 4.3 Medidas de posição 4.4 Medidas de dispersão 4.5 Separatrizes Prof. franke 2 Vimos que a informação contida num conjunto de dados pode ser resumida

Leia mais

AULA 06 Correlação. Ernesto F. L. Amaral. 04 de outubro de 2013

AULA 06 Correlação. Ernesto F. L. Amaral. 04 de outubro de 2013 1 AULA 06 Correlação Ernesto F. L. Amaral 04 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de

Leia mais