Lista de Exercicios 3

Documentos relacionados
Teste F-parcial 1 / 16

Teste F-parcial 1 / 16

BIE5782. Unidade 7: INTRODUÇÃO AOS MODELOS LINEARES

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

MRLM COM COVARIÁVEIS CATEGÓRICAS. criar uma variável dummy para representar uma categoria da variável. variável dummy: assume só dois valores: 0 ou 1

Gabarito Lista 2 LES0773 Estatística III. Os resultados dessa regressão são apresentados na seguinte tabela:

Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito

Modelos de Regressão Linear Simples parte I

b) Teste a hipótese de efeito significante do tamanho da população sobre a venda do produto, na presença de renda per capita

Introdução Regressão linear Regressão de dados independentes Regressão não linear. Regressão. Susana Barbosa

Modelos de Regressão Linear Simples - parte I

Regressão linear múltipla

1 semestre de 2014 Gabarito Lista de exercícios 3 - Estatística Descritiva III C A S A

ME613 - Análise de Regressão

UNIVERSIDADE FEDERAL DO RIO GRANDE Instituto de Matemática, Estatística e Física Programa de Pós-Graduação em Modelagem Computacional

Análise de Carteiras usando o R - Parte 6

Modelos de Regressão Múltipla - Parte VII

i j i i Y X X X i j i i i

Correlação e Regressão

CE062c José Luiz Padilha da Silva e Cesar Augusto Taconeli 13 de setembro de 2018

MEDIÇÃO DA QUALIDADE DO VINHO BRANCO NORTE PORTUGUÊS

Lista de Exercícios Estatística 2 CE003 Prof. Leonardo Melo

Análise de Regressão EST036

Análise da Regressão. Prof. Dr. Alberto Franke (48)

Análise de Regressão Linear no Pacote R

Exemplo 1. Conjunto de dados de uma amostra de 12 meninas da escola: y i x i

Esse material foi extraído de Barbetta (2007 cap 13)

UNIVERSIDADE FEDERAL DE RONDÔNIA CAMPUS DE JI-PARANÁ DEPARTAMENTO DE ENGENHARIA AMBIENTAL LISTA DE EXERCÍCIOS 5

TÉCNICAS EXPERIMENTAIS APLICADAS EM CIÊNCIA DO SOLO

Análise Multivariada Aplicada à Contabilidade

Módulo 16- Análise de Regressão

ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS

1 AULA 3 - MODELO DE REGRESSÃO LINEAR

Planejamento de Experimentos

Testes de cointegração

Modelos de Regressão Linear Simples - parte II

Relatório do Experimento 1 Sistema Massa - Mola. Fernando Henrique Ferraz Pereira da Rosa

ANÁLISE DE REGRESSÃO

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

Modelos de Regressão Linear Simples - Erro Puro e Falta de Ajuste

BIOESTATÍSTICA. Análise de regressão

Estatística. Correlação e Regressão

Delineamento e Análise Experimental Aula 4

Última Lista de Exercícios

Análise de Regressão

Lista 1 - Gabarito. Prof. Erica Castilho Rodrigues Disciplina: Modelos Lineares Generalizados. 29 de Abril. f(y i, θ i ) = θ i exp( yiθ i ).

Universidade Federal de Alfenas Programa de Pós-graduação em Estatística Aplicada e Biometria-PPGEAB Prova de Conhecimentos Específicos

Econometria Aplicada com uso do R

Introdução ao modelo de Regressão Linear

INTRODUÇÃO A ECONOMETRIA

Projeto de Experimentos

Estatística Descritiva. Objetivos de Aprendizagem. 6.1 Sumário de Dados. Cap. 6 - Estatística Descritiva 1. UFMG-ICEx-EST. Média da amostra: Exemplo:

Testes de raiz unitária

Estudar a relação entre duas variáveis quantitativas.

Análise de Regressão - parte I

Estatística Descritiva (III) Associação entre Variáveis

Exame de Recorrência de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro

CORRELAÇÃO E REGRESSÃO. Modelos Probabilísticos para a Computação Professora: Andréa Rocha. UNIVERSIDADE FEDERAL DA PARAÍBA Dezembro, 2011

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

Estatística II Licenciatura em Gestão. Parte I

ESCOLA POLITÉCNICA DA UNIVERSIDADE DE SÃO PAULO DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO PRO 3200 ESTATÍSTICA P2

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Exame 14/06/10 NOME:

Prof. Dr. Lucas Barboza Sarno da Silva

Aula Prática 1. Uso do R com exemplos Adaptação: Flávia Landim/UFRJ

Modelos Lineares Generalizados

MODELOS MATEMÁTICOS E APLICAÇÕES 2015/2016 EXERCÍCIOS DE MODELOS LINEARES MISTOS PARTE I

BIE5782 Uso da Linguagem R para Análise de Dados em Ecologia

Estatística II Licenciatura em Gestão TESTE I

5.3 Experimentos fatoriais a dois fatores (Revisando...)

Estatística Aplicada II. } Regressão Linear

Aula prática 4 Parte I - Correlação e regressão linear simples

Associação entre duas variáveis

ME613 - Análise de Regressão

Econometria I Lista 2: modelo de regressão linear clássico e regressão simples

Regressão linear simples

Transcrição:

Departamento de Física é Matemática. USP-RP. Prof. Rafael A. Rosales 3 de junho de 2009 Lista de Exercicios 3 ANOVA. Regressão Linear Simples Exercício 77. Três diferentes bancos possuem agências de mesmo porte em uma avenida movimentada de Salvador, BA. Para testar se essas agências têm movimento médio equivalente, foi escolhida uma semana típica de trabalho e o desempenho, nesses dias, foi registrado. Os dados obtídos, em milhares de reais, esta apresentador na tabela a seguir, Banco 1 2 3 146,4 194,3 173,7 199,2 227,2 246,5 179,5 203,4 289,8 98,4 111,8 127,4 263,7 275,0 265,6 Qual seria a sua conclusão ao nível α =5%? Exercício 78. Um estudo deseja avaliar o efeito de determinado treinamento no tempo de reação de atletas submetidos a um certo estímulo. O treinamento consiste na repetição de um movimento e foi utilizada uma amostra de 37 atletas. Para cada atleta foi atribuído um certo número de repetições (X) e, então, foi medido o tempo de reação (Y ), em milisegundos. Uma reta de mínimos quadrados foi ajustada aos dados, fornecendo a equação (i) Interprete as estimativas de α e β. ŷ i = 80, 5 0, 9x i, i = 1,..., n. Exercício 79. R Procure e carregue os dados cabbage.txt. Estes dados contem informações sobre plantios de repolhos e estão constituídos por quatro colunas: Cult: origem do cultivo, Date: data da plantação, HeadWt: peso da cabeça do repolho (em Kg), VitC: conteúdo de ácido ascorbico (vitamina C, em unidades arbitrárias). Ao digitar 1

minharegressao <- lm(headwt~vitc) deverá aparecer Call: lm(formula = HeadW~VitC) Coefficients: (Intercept) VitC 5.92806-0.05754 O argumento a lm é a fórmula de um modelo. Na sua forma mais simples, o modelo y~x indica que y é uma variável dependente e x a variável independente (esta última é conhecida em uma regressão como a variável descritiva). Neste caso, como saídas de lm obtemos a intercepção (β) com o eixo y e a pendente (α) da reta que melhor descreve os dados. A estimativa para a reta de regressão portanto é HeadWt = 5.92806 0.05754 VitC. Maiores informações sobre a regressão são obtidos ao escrever summary(minharegressao) o qual gera a seguinte informação Call: lm(formula = HeadWt ~ VitC) Residuals: Min 1Q Median 3Q Max -1.0150-0.5117-0.1575 0.4244 1.6095 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 5.928059 0.505983 11.716 < 2e-16 *** VitC -0.057545 0.008603-6.689 9.75e-09 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 0.6687 on 58 degrees of freedom Multiple R-squared: 0.4355, Adjusted R-squared: 0.4257 F-statistic: 44.74 on 1 and 58 DF, p-value: 9.753e-09 Residuals fornece algumas propriedades que resumem a distribuição dos erros e i. Lembramos que a distribuição de estes apresenta a priori média 0, portanto a mediana dos erros deve estar próxima de este valor (neste caso -0.1575). 2

Coefficients; mostra novamente as estimativas para β e α e para cada uma o seu erro padrão, testes t, e p-valores. Os símbolos a direita correspondem a um indicador gráfico do nível do teste; * significa 0, 01 < p < 0, 05 (veja a linha Signif.codes:...). Residual standard error é a variação residual, uma quantidade que mede a variabilidade das observações a respeito da reta de regressão, e fornece uma estimativa para σ, a variância dos e i. Multiple R-squared é o coeficiente de correlação de Pearson. F-statistics corresponde ao resultado do teste H 0 : α = 0, H a : α 0. Finalmente, os comandos plot(vitc,headwt,xlab="concentracao de vitamina C (unidades arbitrarias)", ylab="peso da cabeca do repolho (Kg)", cex=0.9, lwd=0.65) abline(lm(headwt~vitc), lwd=1.5, col="navy", lty=2) produzem a figura 79. (i) Baseado em estes resultados, você acredita que o modelo de regressão linear é apropriado em este exemplo? Qual dos resultados fornecidos por R levo você a sua conclusão? (ii) Qual é o peso esperado de uma cabeça de repolho com 60 unidades de vitamina C? e para 100 unidades? peso da cabeca do repolho (Kg) 1.0 1.5 2.0 2.5 3.0 3.5 4.0 40 50 60 70 80 concentracao de vitamina C (unidades arbitrarias) Figura 1: gráfico típico para uma regressão linear. Exercício 80. Para verificar o efeito da variável X sobre a variável Y, foi realizado um experimento que forneceu os pares (x i, y i ) dados por (3; 13,3), (7; 24,3), (5; 15,9), (2; 12,8), (9; 29,6), (7; 29,5), (3; 14,5), (5; 23,3), (8; 32,6), (2; 12,0) e (1; 4,6). Obtehna a reta ajustada. Construa o diagrama de despersão, baseando-se nos pares de valores fornecidos e, em seguida, desenhe a 3

3.5 3 2.5 2 # filhos 1.5 1 0.5 0-0.5 10 15 20 25 30 35 40 45 # salarios minimos Figura 2: renda e número de filhos reta ajustada. Baseando-se apenas no gráfico, você diria que o ajuste é adequado? Verificar se o valore de x influi sobre o valor de y, utilizando α = 5%. Exercício 81. Para verificar se existe relação entre a renda familiar (em salários mínimos) e o número de filhos, foi coletada uma amostra de 8 famílias em uma ciudade. Os resultados obtidos são apresentados na seguinte tabela, e graficados na figura 81. Família 1 2 3 4 5 6 7 8 Renda 12 14 15 17 23 27 34 43 Filhos 3 2 2 1 1 0 0 0 (i) Que conclusões podem ser tiradas, baseando-se em um diagrama de dispersão, apresentado acima, e no coeficiente de correlação? (ii) Calcule a reta de mínimos quadrados e interprete os parâmetros. (iii) Verifique se a renda influi no número de filhos, utilizando α = 5%. Exercício 82. Verifique se é razoável considerar um modelo de regressão linear relacionando as notas de cálculo, Y, e estatística, X, segundo os dados apresentados na tabela a seguir. Disciplinas Notas Cálculo 5,5 3,5 7,0 2,5 8,5 6,5 6,0 4,0 0,5 5,0 Estatística 7,0 4,5 8,5 3,5 9,0 4,5 5,0 5,5 1,5 6,5 4

Exercício 83. A quantidade de chuva é um fator importante na produtividade agrícola. Para medir esse efeito, foram anotadas, para 8 regiões diferentes produtoras de soja, o índice pluviométrico e a produção do último ano. Chuva (mm) 120 140 122 150 115 190 130 118 Produção (ton) 40 46 45 37 25 54 33 30 (i) Ajuste a reta de regressão. Como você interpretaria o coeficiente β? (ii) Utilizando a reta ajustada, encontre a produção esperada para uma região com índice pluviométrico é igual a 160 mm. (iii) Construa uma tabela ANOVA para verificar, ao nível de 5%, se existe evidência estatística de que o índice pluvométrico influencia na produção de soja. Exercício 84. Foi realizado um experimento para comparar as qualidades de desgaste de 3 tipos de tinta submetidas a ação abrasiva de uma roda forrada que gira lentamente. Foram testadas 10 especímenes para cada tipo de tinta e foram registrados o número de horas transcoridas até o aparecimento de uma abrasão visível em cada caso. Os resultados são apresentados na tabela abaixo. Há provas suficientes de uma diferença no tempo médio até o aparecimento de uma abrasão visível entre os 3 tipos de pintura? Considere o nível α = 5%. Tipo de tinta 1 2 3 148 513 335 76 264 643 393 433 216 520 94 536 236 535 128 134 327 723 55 214 258 166 135 380 415 280 549 153 304 465 Exercício 85. Com o aumento dos custos de perforação de poços petroleros, a tarefa de medir o rendimento da perfuração é essêncial para o éxito de uma companhia petrolera. Um método para reduzir os custos da perfuração consiste em aumentar a velocidade de perfuração. Pesquisadores da Cities Service Co, inventaram uma broca de perfuração, chamada PD-1, que eles acreditam perfurar uma rocha a uma velocidade maior que outras brocas do mercado.decidiu-se comparar a velocidade da PD-1 com as brocas mais rápidas conhecidas, a JADC 1-2-6 e a JADC 5-1-7, em 12 sítios de perfuração no Texas. Designaram-se 4 locais de perfuração aleatoriamente a cada broca e se observou a velocidade de 5

penetração (RoP) em pês por hora depois de perfurar 3000 pês em cada local. Os dados são apresentados na tabela correspondente. Com base nesta informação, Cities Service Co. pode supor que a velocidade de penetração média difere ao menos de duas das 3 brocas? Prove como nível de significância de α = 0.5. PD-1 IADC 1-2-6 IADC 5-1-7 35,2 25,8 14,7 30,1 29,7 28,9 37,6 26,6 23,3 34,3 30,1 16,2 Exercício 86. R Procure e carrege do site do curso os dados Cars93.txt. Utilize a função read.table. Estes dados contém 93 linhas e 27 colunas, e apresentam diversas características de vários automóveis americanos em 1993. Os dados foram tomados do pacote MASS, e podem ser carregados na memória aos escrever library(mass) 1, caso este pacote esteja instalado na sua distribuição de R. Uma vez carregados os dados, digite help(cars93) e também diretamente Cars93 para obter maiores informações. O boxplot mostrado na figura 86 foi realizado com boxplot(price~type,notch=f). (i) Baseado neste gráfico, você acredita que existe evidência para pensar que os preços médios dos vehículos variam de acordo ao tipo? (ii) O teste ANOVA para os preços dos veículos de acordo as preco (unidades arbitrarias) 10 20 30 40 50 60 Compact Large Midsize Small Sporty Van Tipos Figura 3: preços de diversos tipos de carros americanos em 1993. classes em Types pode ser realizado como 1 MASS contém os dados e as funções que acompanham a referéncia: Venables, W. N. e Ripley, B. D. (1999) Modern Applied Statistics with S-PLUS. Terceira Edição. Springer Verlag. 6

anova(lm(price~type)) resultando Analysis of Variance Table Response: Price Df Sum Sq Mean Sq F value Pr(>F) Type 5 3421.4 684.3 11.532 1.477e-08 *** Residuals 87 5162.6 59.3 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Em base a este teste podemos descartar a hipotese que consiste em pensar que todos os tipos de carros apresentam o mesmo valor médio? (iii) Faça uma regressão linear utilizando Weight como variável independente e MPG.highway. Qual é o resultado do teste F associado? (iv) Considere o teste t.test(price~origin, alternative=two.sided) onde Origin e uma variável com dois valores USA e non-usa. O que esta sendo testado (quais são H 0 e H a )? Qual é o resultado do teste? (v) Considere o teste t.test(price~origin, alternative=greather). Quais são as hipoteses? Qual é o resultado do teste? (veja como muda a conclusão do teste em alternative hypotesis). Exercício 87. R Uma agência de empregos deseja verificar o grau de satisfação de seus clientes. Para tanto, escolheu domicílios de famílias de classe A, B e C, que fizeram uso da agência, e solicitou que um questionário fosse preenchido. Os questionários foram devidamente codificados, a fim de fornecer um índice de satisfação que varia de 1 a 5 (insatisfeito a satisfeito). Os resultados do questionario se encontram no aquivo agencia.txt. Faça um teste ANOVA para verificar se o índice de satisfação médio varia ou não de classe a classe. Qual é a conclusão se α =0,05%? 7