Aula 12: Correlação e Regressão



Documentos relacionados
Análise de Regressão. Notas de Aula

Medidas de Localização

Instituto Federal Fluminense Campus Campos Centro Programa Tecnologia Comunicação Educação (PTCE)

Métodos Quantitativos Aplicados a Custos Análise Estatística como um auxiliar valioso nas decisões

Correlação e Regressão linear simples

Plano da Apresentação. Correlação e Regressão linear simples. Correlação linear. Associação entre hábitos leitura e escolaridade.

Matemática Básica Intervalos

Unidade 3 Função Afim

Regressão linear múltipla. Prof. Tatiele Lacerda

PLANO DE AULA I. Escrito por Eliani Pereira de Souza Nascimento. Supervisionado por Rosana Silva Bonfim

Regressão, Interpolação e Extrapolação Numéricas

BIOESTATÍSTICA. Parte 1 - Estatística descritiva e análise exploratória dos dados

Matriz de Referência de Matemática da 3ª série do Ensino Médio Comentários sobre os Temas e seus Descritores Exemplos de Itens

Aula 6 Propagação de erros

Disciplina de Matemática Professora Valéria Espíndola Lessa. Atividades de Revisão 1º ano do EM 1º bimestre de Nome: Data:

x = xi n x = xifi fi 1. MÉDIA Exercício: Quando a distribuição é simétrica, a média e a mediana coincidem.

5. Derivada. Definição: Se uma função f é definida em um intervalo aberto contendo x 0, então a derivada de f

Matemática. A probabilidade pedida é p =

Os eixo x e y dividem a circunferência em quatro partes congruentes chamadas quadrantes, numeradas de 1 a 4 conforme figura abaixo:

Modelos de Probabilidade e Inferência Estatística

ANÁLISE EXPLORATÓRIA DE DADOS

Curso de Análise Estatística Comparação entre variáveis contínuas: correlação e regressão Linear

A. Equações não lineares

REGRESSÃO. Análise de Correlação

Análise de Regressão Linear Simples III

Medidas de Tendência Central. Introdução Média Aritmética Moda Mediana

DISTRIBUIÇÃO DE FREQUÊNCIA DE VARIÁVEIS QUALITATIVAS E QUANTITATIVAS DISCRETAS (TABELAS E GRÁFICOS)

21- EXERCÍCIOS FUNÇÕES DO SEGUNDO GRAU

Coeficiente de Assimetria e Curtose. Rinaldo Artes. Padronização., tem as seguintes propriedades: Momentos

Noções de Microeconomia

b b 4ac =, onde 2 , é um número REAL que pode ser: positivo, nulo ou negativo.

Atividade extra. Exercício 1. Exercício 2. Matemática e suas Tecnologias Matemática

ATIVIDADE DE MATEMÁTICA (PARA CASA) Data de entrega 18/04/2012

Para mais de duas variáveis independentes, em função de uma variável dependente.

Aula 3 Função do 1º Grau

FUNÇÕES. É uma seqüência de dois elementos em uma dada ordem. 1.1 Igualdade. Exemplos: 2 e b = 3, logo. em. Represente a relação.

SEQUÊNCIA DIDÁTICA PODCAST ÁREA CIÊNCIAS DA NATUREZA FÍSICA - ENSINO MÉDIO

Planificação do 2º Período

EXERCÍCIOS DE REVISÃO MATEMÁTICA II GEOMETRIA ANALÍTICA PLANA (Ponto, reta e circunferência)

Aula demonstrativa Apresentação... 2 Prova Resolvida Matemática Financeira TRF 3ª Região... 4

Projeto Jovem Nota 10 Geometria Analítica Circunferência Lista 3 Professor Marco Costa

Capítulo 4 Inferência Estatística

MATEMÁTICA B 10ºANO ANO LETIVO 2015/2016 Módulo Inicial

MEDIDAS DE DISPERSÃO. o grau de variabilidade, ou dispersão, dos valores em torno da média.

0.1 Curvas de Ofertas e Demandas Lineares

3 Modelos de Simulação

Aula 4 Gráficos e Distribuição de Frequências

3º Ano do Ensino Médio. Aula nº09 Prof. Paulo Henrique

Distribuições Conjuntas (Tabelas de Contingência)

MINISTÉRIO DA DEFESA EXÉRCITO BRASILEIRO COLÉGIO MILITAR DO RECIFE PROVA DE MATEMÁTICA 1ª SÉRIE DO ENSINO MÉDIO

Função do 2º Grau. 2 =, onde 2. b 4ac. , é um número REAL que pode ser: positivo, nulo ou negativo.

Variáveis Frequências Gráficos Medidas de Posição Medidas de Dispersão Medidas Complementares Inferência

PROVA DE MATEMÁTICA CONCURSO DE ADMISSÃO 2013/2014 1º ANO DO ENSINO MÉDIO

Estatística. Conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos ou de massa.

UNIVERSITÁRIO DE SINOP CURSO DE ENGENHARIA CIVIL

Projeto Jovem Nota 10 Geometria Analítica Circunferência Lista 2 Professor Marco Costa

Tópico 2. Funções elementares

CONHECIMENTOS ESPECÍFICOS

Assunto: Estudo do ponto

AULA 04 Estimativas e Tamanhos Amostrais

Medidas de dispersão e assimetria

ÁLGEBRA. Aula 5 _ Função Polinomial do 1º Grau Professor Luciano Nóbrega. Maria Auxiliadora

CORRELAÇÃO E REGRESSÃO. Modelos Probabilísticos para a Computação Professora: Andréa Rocha. UNIVERSIDADE FEDERAL DA PARAÍBA Dezembro, 2011

AGRUPAMENTO DE ESCOLAS DA SÉ GUARDA. MATEMÁTICA B Curso de Artes Visuais

1º ano. Unidade 1: Conjuntos Numéricos. Unidade 2: Expressões Algébricas. Capítulo 9 - Itens: 2, 3 (2º ano) Unidade 3: Equações

SERVIÇO PÚBLICO FEDERAL CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA DE PELOTAS DIRETORIA DE RECURSOS HUMANOS ANEXO

Lição 5 Medidas Descritivas Medidas de Dispersão

Estatística - exestatmedposic.doc 25/02/09

Stela Adami Vayego DEST/UFPR

A Derivada. 1.0 Conceitos. 2.0 Técnicas de Diferenciação. 2.1 Técnicas Básicas. Derivada de f em relação a x:

ESCOLA SECUNDÁRIA DE CASQUILHOS

a) Qual a sentença matemática que define a função que relaciona o salário mensal do professor de musculação e do professor de aeróbica?

Ensinando a trigonometria através de materiais concretos

. B(x 2, y 2 ). A(x 1, y 1 )

MATEMÁTICA (11º ano) Exercícios de Exames e Testes Intermédios Equações de retas e planos

Erros e Incertezas. Rafael Alves Batista Instituto de Física Gleb Wataghin Universidade Estadual de Campinas (Dated: 10 de Julho de 2011.

Teste de Hipótese e Intervalo de Confiança. Parte 2

Os dados quantitativos também podem ser de natureza discreta ou contínua.

1 - RECORDANDO 2 - CENTRO NA ORIGEM 3 - EQUAÇÃO GERAL DA CIRCUNFERÊNCIA. Exercício Resolvido 2: Exercício Resolvido 1: Frente I

Lista 4 Introdução à Programação Entregar até 07/05/2012

MATEMÁTICA PROVA 3º BIMESTRE

Elaboração e Análise de Projetos

Aula 2 Regressão e Correlação Linear

TEORIA 5: EQUAÇÕES E SISTEMAS DO 1º GRAU MATEMÁTICA BÁSICA

FUNÇÃO DO 2º GRAU PROF. LUIZ CARLOS MOREIRA SANTOS

Teorema do Limite Central e Intervalo de Confiança

PROGRAMAÇÃO DE COMPUTADORES I - BCC Lista de Exercícios do Módulo 1 - Preparação para a Prova 1

Programa de Ciências Experimentais

Disciplina: FÍSICA I Curso: MATEMÁTICA PROF. ZENAR PEDRO SCHEIN Sala: ATIVIDADES PARA O DIA 29/2/2015

Estimação. Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança

AVALIAÇÃO DIAGNÓSTICA DE MATEMÁTICA

SEEC UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE UERN FACULDADE DE CIÊNCIAS EXATAS E NATURAIS FANAT DEPARTAMENTO DE CIÊNCIAS BIOLÓGICAS DECB

Unidade Medidas de Posição ou de Tendência Central

Prova Escrita de MATEMÁTICA A - 12o Ano a Fase

Probabilidade III. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período

Centro Educacional Juscelino Kubitschek

UNICAMP ª Fase MATEMÁTICA BERNOULLI COLÉGIO E PRÉ-VESTIBULAR

A vida sem reflexão não merece ser vivida Sócrates Disciplina: ESTATÍSTICA e PROBABILIDADE

Resistência dos Materiais

Transcrição:

Aula 12: Correlação e Regressão Sumário Aula 12: Correlação e Regressão... 1 12.l Correlação... 2 12.2 Diagrama de dispersão... 2 12.3 Correlação linear... 3 12.3.1 Coeficiente de correlação linear... 5 12.3.2 Propriedades do coeficiente de correlação linear... 5 12.4 Regressão linear simples... 7 12.4.1 Determinação da equação de regressão... 8 Exercícios... 10 Respostas da aula 12... 15 Quando se trabalha com duas ou mais variáveis, elas poderão estar ou não relacionadas. Poderemos, então, procurar estabelecer algum tipo de relação entre as variáveis observadas, caso tal relação exista. Se estiverem relacionadas, deveremos elaborar uma sentença matemática que estabeleça o grau dessa dependência. As variáveis podem estabelecer diferentes tipos de relações. A matemática classifica as relações em funcionais e não funcionais. Relações funcionais São relações matemáticas expressas por sentenças matemáticas. Exemplos dessas relações matemáticas: Área do retângulo (A = a.b) e a relação entre os lados do retângulo; Densidade de massa (d m =m/v) é a relação entre a massa e o volume de um corpo; Perímetro de uma circunferência (C = 2nR) é a relação entre o comprimento da circunferência e o valor do raio. As curvas que expressam essas relações contêm todos os pontos da função. Isso significa que nenhum ponto da função poderá estar localizado fora da curva. Relações estatísticas e correlações Relações matemáticas não funcionais, também chamadas de relações estatísticas, são as relações matemáticas que não são representadas por funções matemáticas. Exemplo desse tipo de relação: correlação. Uma relação estatística é composta por duas ou mais variáveis cujos valores coletados numa pesquisa. Por não ser uma relação funcional, deveremos comparar as variáveis para verificar se há algum tipo de dependência entre elas, verificar se as variáveis estão relacionadas. Duas ou mais variáveis estão relacionadas quando as alterações sofridas uma das variáveis são acompanhadas por alterações proporcionais nas demais.

Numa relação estatística, a representação gráfica é obtida mediante a "plotagem" no gráfico dos pontos da distribuição obtidos na coleta dos dados, sendo que a curva média da distribuição não abrange todos os pontos, ou seja, existem pontos localizados fora da curva. Exemplos: Relação entre a idade e a estatura de uma criança; Relação entre a classe social de uma pessoa e a expectativa de vida dessa pessoa. Podemos estabelecer relações estatísticas que envolvem variáveis tais como: classe social, idade, sexo, cultura, situação econômica, salário etc. Exemplo 12.l Observe o gráfico que representa a relação entre duas variáveis aleatórias, A e B, obtidas numa pesquisa, e verifique que existem pontos localizados fora da reta média. Figura 12.1 Relação entre duas variáveis. 12.l Correlação Segundo o dicionário Aurélio: Correlação: significa relação mútua entre dois termos; Correlacionar: significa estabelecer relação. Quando duas ou mais variáveis estão relacionadas, dizemos que há "correlação" entre elas. A utilidade e importância da correlação entre duas variáveis é que pode conduzir à descoberta de novos métodos ou estabelecer novas relações entre determinados eventos, cujo conhecimento seja vital para a tomada de decisões. 12.2 Diagrama de dispersão O diagrama de dispersão é um gráfico cartesiano em que cada um dos eixos corresponde às variáveis correlacionadas. A variável dependente (y) situa-se no eixo vertical e o eixo das abscissas é reservado para a variável independente (x). Os pares ordenados distribuem-se em determinada região do espaço, formando em geral uma nuvem de pontos. Após a distribuição dos pares ordenados no gráfico devemos obter a curva de tendência (ou curva média) Linha de tendência ou curva média é a linha que melhor se ajusta à distribuição dos pontos. Por outro lado, corresponde a uma linha média, pois deixa a mesma quantidade de pontos abaixo e acima da linha.

A configuração geométrica do diagrama de dispersão pode estar associada a uma linha reta (correlação linear), uma linha curva (correlação curvilínea) ou, ainda, ter os pontos dispersos de maneira que não definam nenhuma configuração linear; nesta última situação, não há correlação (Figura 12.2). Correlação Linear Correlação curvilínea Ausência de correlação 12.3 Correlação linear Correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se de uma linha. É uma linha de tendência, porque procura acompanhar a tendência da distribuição de pontos, que pode corresponder a uma reta ou uma curva. Por outro lado, é uma linha média, porque procura deixar a mesma quantidade de pontos abaixo e acima da linha. Na relação estatística, dizemos que a correlação linear entre duas variáveis caminha no mesmo sentido ou em sentidos opostos. No mesmo sentido, podemos ter como exemplos: mais automóveis nas ruas, mais poluição (dióxido de carbono); maior o número de roubos de automóveis em uma região, maior o preço do seguro nessa região; mais produtos vendidos, mais lucro. No sentido oposto, podemos ter como exemplos: maior o valor do empréstimo, menor a taxa de juros; mais desemprego, menos alunos na faculdade; mais segurança, menos criminalidade. Correlação positiva: as duas variáveis caminham no mesmo sentido, ou seja, o aumento dos valores da variável independente X implica no aumento dos valores da variável dependente Y (variáveis diretamente proporcionais). Nesse caso, o coeficiente angular da reta é positivo (reta ascendente).

Correlação negativa: as duas variáveis caminham em sentidos opostos, ou seja, o aumento dos valores da variável independente X implica na redução dos valores da variável dependente Y (variáveis inversamente proporcionais). Nesse caso, o coeficiente angular da reta é negativo (reta descendente). Exemplos: os gráficos de dispersão 12.4, 12.5 e 12.6 mostram diversas correlações entre uma variável independente e uma variável dependente. Figura 12.4 Gráfico entre o número de funcionários e o lucro das empresas. No gráfico da Figura 12.4, temos: Variável independente X: número de funcionários; Variável dependente y: lucro (em milhares). A correlação é positiva, pois os pontos estão próximos a uma reta com coeficiente angular positivo (linha de tendência ascendente). Figura 12.5 Gráfico de dispersão da correlação entre a venda de produtos e o preço.

No gráfico da Figura 12.5, temos: Variável independente X: preço; Variável dependente Y venda de produtos. A correlação é negativa porque os pontos estão próximos a uma reta com coeficiente angular negativo (linha de tendência descendente). Figura 12.6 Gráfico de dispersão da correlação entre o preço de toalhas e o preço de cadeiras. No gráfico da Figura 12.6, temos: Variável independente X: preço de toalhas; Variável dependente Y: preço de cadeiras. A correlação é extremamente fraca ou inexistente, pois os pontos estão muito dispersos, não caracterizando uma linha de tendência para a distribuição. 12.3.1 Coeficiente de correlação linear O coeficiente de correlação linear pode ser apresentado como uma medida de correlação, pois mede o quanto a distribuição de pontos no diagrama de dispersão aproxima-se de uma reta; sendo assim, indica o nível de intensidade (força) que ocorre na correlação entre as variáveis que se pretende relacionar. O coeficiente de correlação linear pode ser positivo ou negativo. Pearson desenvolveu uma equação que permite calcular o grau de correlação linear entre as variáveis, denominada coeficiente de correlação linear ou coeficiente de correlação de Pearson (r). r: coeficiente de correlação de Pearson n: número de observações das variáveis xi: variável independente yi: variável dependente 12.3.2 Propriedades do coeficiente de correlação linear -1 r +1, isto significa que o valor de r varia dentro do intervalo fechado entre -1 e + 1; r é adimensional, não tem unidade de medida, ou seja, não depende da unidade de medida da variável dependente (X) nem da variável independente (Y) O sinal positivo ou negativo do coeficiente de correlação linear está atrelado ao sentido da correlação, ou seja, indica se a reta é ascendente ou descendente.

sinal positivo do coeficiente de correlação linear indica uma reta ascendente; sinal negativo do coeficiente de correlação linear indica uma reta descendente A intensidade da correlação de Pearson está relacionada aos valores numéricos de r: quanto mais o valor de r se aproximar de + 1 ou - 1, maior a correlação entre as variáveis; quanto mais o valor de r se aproximar de 0, menor será a correlação. r Correlação 0 Não há correlação entre as variáveis -1 Correlação perfeita e negativa entre as variáveis +1 Correlação perfeita e positiva entre as variáveis Em geral, multiplica-se o valor de r por 100, dessa forma o resultado passa a ser expresso em porcentagem. Na prática, o coeficiente de correlação para r = +1 ou r = - 1 não chega a acontecer nas relações estatísticas, pois isso corresponde à exatidão (perfeição) na relação entre as variáveis, indica uma relação funcional matemática. Os valores de r = +1 ou r = - 1 são valores de referência, isto é, quanto mais o coeficiente de correlação se aproximar desses valores de referência, mais a correlação está próxima de ser perfeita. Na prática, as conclusões obtidas sobre o comportamento da relação entre as variáveis estudadas são as seguintes: Exemplo 12.l Uma pesquisa pretende verificar numa empresa se há correlação significativa entre o peso total do lixo descartado com o peso do papel contido nesse lixo. Para tanto, foi efetuado um levantamento desses valores pelo período de 10 dias. Tabela 72.1 Peso total do lixo descartado e o peso do papel contido nesse lixo. Com base nos dados apresentados na Tabela 12.1, faremos a representação gráfica. Os pares ordenados formam o diagrama de dispersão.

Figura 12.7 Correlação entre o peso total do lixo descartado e o peso do papel contido nesse lixo. Observamos por meio da construção gráfica que os pontos estão dispostos ao longo de uma reta com pouco afastamento em relação a ela. Isso é indício da existência de correlação significativa entre as variáveis. Para verificar qual o nível de intensidade da correlação, devemos calcular o coeficiente de correlação de Pearson. Tabela 12.2 Cálculo do coeficiente de Pearson para a correlação entre o peso total do lixo descartado e o peso do papel contido nesse lixo. Após os cálculos na tabela, substituiremos os valores obtidos na fórmula do coeficiente: O valor de r está dentro do intervalo 0,6 < r < 1. Observando-se que o coeficiente de correlação, r =0,95, está muito próximo do valor de referência r = +1, temos a indicação de que há uma forte correlação entre as variáveis. Sendo assim, podemos concluir que existe uma correlação linear positiva altamente significativa entre o peso total do lixo descartado e o peso do papel contido nesse lixo. 12.4 Regressão linear simples Correlação e regressão são duas técnicas relacionadas. a) correlação: quantifica a intensidade (força) da relação, resulta num número que exprime o grau de relacionamento entre duas variáveis; b) regressão: explicita a forma dessa relação por meio de uma equação matemática.

Para apurar a correlação linear entre duas variáveis, construímos um gráfico de dispersão (ou diagrama de dispersão) em que a linha de tendência é definida por uma reta, denominada reta de regressão. A equação matemática que relaciona os pontos dessa reta é chamada equação de regressão. A equação de regressão linear será calculada para as relações em que for comprovada correlação significativa entre as variáveis; caso contrário, não há motivo para o cálculo da equação. Uma das finalidades da equação de regressão é predizer (ou estimar) valores futuros de uma variável (dependente) com base nos valores conhecidos da outra variável (independente). 12.4.1 Determinação da equação de regressão A regressão linear é a função da reta que melhor se ajusta aos pontos das variáveis plotadas no gráfico. Poderá haver diversas retas que se ajustem ao diagrama de regressão. Utilizaremos o processo de ajuste da reta de forma a minimizar a soma dos quadrados dos desvios (reta de mínimos quadrados). O ajuste de uma reta consiste na aplicação de um modelo linear que relaciona a variável independente x e a variável dependente Sendo: por meio da equação de uma reta do tipo zero). = variável dependente; x = variável independente; a (valor constante) = coeficiente angular da reta de regressão (ou inclinação da reta); b (valor constante) = ponto de intersecção entre a reta e o eixo vertical y (é o valor de y quando x é E conveniente diferenciar a representação da variável dependente, de y para : y é a variável dependente de uma relação matemática funcional; é a variável dependente de uma relação estatística, na qual a distribuição está baseada em estimativas de dados colhidos por amostragem. Os parâmetros a e b para estabelecer a equação da reta de regressão podem ser calculados pelas fórmulas. Sendo: Exemplo 12.2 Para ilustrar o cálculo da equação da reta de regressão, tomaremos como base o Exemplo12.1, em que foi realizada uma pesquisa visando determinar a existência de correlação entre o peso total do lixo descartado por dia (num hotel) com o peso do papel contido nesse lixo, pelo período de 10 dias. Os dados estão apresentados na Tabela 12.3. Tabela 12.3 Peso total do lixo descartado e o peso do papel contido nesse lixo.

Tabela 12.4 Correlação entre o peso total do lixo descartado e o peso do papel contido nesse lixo (cálculos intermediários). Na Geometria Euclidiana, conhecidos dois pontos no plano cartesiano, existe uma única reta que passa por esses pontos. Cálculo de dois pontos da reta: Para construir a reta de regressão da Figura 12.8, devemos traçar uma linha reta pelos pontos P 1 (0; 1,38) e P 2 (50; 12,03):

Figura 12.8 Correlação entre o peso total do lixo descartado e o peso do papel contido nesse lixo. Com base no conhecimento da equação da reta, podem-se interpolar e extrapolar valores. Interpolação: a interpolação ocorre quando o valor considerado pertence ao intervalo da tabela, porém não figura entre os dados coletados. Supondo o valor de 15 kg para o peso total do lixo descartado, pode-se estimar o peso de papel contido nesse lixo. Uma vez que 15 kg não é um dado coletado e, consequentemente, não pertence à Tabela 12.4, utiliza-se a equação da reta para determinar o valor correspondente ao peso do papel. lixo. Para 15 kg de lixo descartado, estima-se por interpolação que haja 4,58 kg de papel contido nesse Extrapolação: a extrapolação ocorre quando o valor considerado não pertence ao intervalo da tabela, e também não figura entre os dados coletados. Suponha que o peso do lixo seja de 60 kg, esse valor não é um dado coletado e nem se encontra dentro do intervalo [10,47; 49,14]. Essa situação é semelhante à anterior e utiliza-se a equação da reta para determinar o peso do papel: lixo. Para 60 kg de lixo descartado, estima-se por extrapolação que haja 74,16 kg de papel contido nesse Exercícios 1. Uma agência de turismo estudou a demanda de passagens em relação à variação do preço de venda e obteve os valores da Tabela 12.5. Tabela 12.5 Demanda de passagens em relação ao preço de venda. O diagrama de dispersão está representado no gráfico da Figura 12.9

Figura 12.9 Demanda de passagens em relação ao preço de venda. Preencha a Tabela 12.6 e calcule o coeficiente de correlação linear por meio da fórmula do coeficiente de correlação de Pearson. Tabela 12.6 Estudo da correlação entre duas variáveis Comente o resultado obtido e indique o nível da correlação entre as variáveis. 2. Considere os dados da Tabela 12.7: Tabela 12.7 Variável dependente (y) e variável independente (x). Preencha a Tabela 12.8 e calcule o coeficiente de correlação linear por meio da fórmula do coeficiente de correlação de Pearson. Tabela 12.8 Estudo da correlação entre duas variáveis Comente o resultado obtido e indique o nível da correlação entre as variáveis.

3. Considere os dados da Tabela 12.9, preencha a Tabela 12.10 e calcule o coeficiente de correlação linear através do coeficiente de correlação de Pearson. Tabela 12.9 Variável dependente (y) e variável independente (x). Tabela 12.10 Estudo da correlação entre duas variáveis Comente o resultado obtido, indicando o nível da correlação entre as variáveis. 4. Considere os dados da Tabela 12.11 e calcule o coeficiente de correlação linear por meio do coeficiente de correlação de Pearson. Tabela 12.11 Variável dependente (y) e variável independente (x). 5. Uma agência de viagens realizou um estudo sobre as passagens de avião que vendeu nos últimos meses e a soma de horas trabalhadas por todos seus funcionários (lembre que o número de funcionários é variável). Calcule o coeficiente de correlação linear pelo coeficiente de correlação de Pearson. Tabela 12.12 Vendas de passagens e número de horas trabalhadas. 6. Foi realizada uma pesquisa visando determinar a existência de correlação entre o preço de um litro de leite e do quilo do queijo. Para tanto, foi efetuado um levantamento da média mensal dos preços em 30 estabelecimentos, pelo período de um ano. Calcule o coeficiente de correlação linear pelo coeficiente de correlação de Pearson. Tabela 12.13 Preço do litro de leite e do quilo de queijo.

7. Em determinada cidade praiana, foi realizada uma série de investimentos e, posteriormente, foram pesquisados os benefícios resultantes deles. O resultado está expresso na Figura 12.70: Figura 12.10 Benefícios resultantes de investimentos. a) Podemos concluir que existe ou não uma correlação entre os investimentos e os benefícios? b) Como seria a equação da reta correspondente ao gráfico anterior? 8. Um hospital registrou um aumento no número de leitos ocupados, ao ano, de acordo com a Tabela 12.14. Calcule: a) O coeficiente de correlação. b) A reta ajustada. c) O número de ocupação de leitos estimados para 2009. d) O número de leitos ocupados no ano de 1999. Tabela 12.14 Número de leitos ocupados no período de 2003/2008. 9. Um trem circula entre duas cidades ao realizar um passeio turístico ecológico. a) Verifique, pelo diagrama, se existe uma correlação retilínea entre as passagens vendidas e os anos correspondentes (Tabela 12.15). b) Calcule o coeficiente de correlação de Pearson. c) Escreva a equação da reta ajustada. d) Estime a quantidade de bilhetes vendidos em 2009. Tabela 12.15 Passagens vendidas durante o período de 2002/2008.

10. Acrescenta-se ao exercício anterior uma coluna, em que estão expressos os gastos (em milhares) com os funcionários da companhia de trem. Tabela 12.16 Passagens vendidos durante o período de 2002/2008 cálculos intermediários. a) Verifique, pelo diagrama, se existe uma correlação retilínea entre as passagens vendidas e os gastos com funcionários. b) Calcule o coeficiente de correlação de Pearson. c) Estabeleça uma função matemática (reta de ajuste) que explique a dependência existente entre o número de passagens vendidas durante os últimos anos e o gasto (em reais), devido à folha de pagamento dos funcionários. d) Estime os gastos com a folha de pagamento dos funcionários para o ano de 2009 (sugestão: utilize o resultado do item "d" do exercício anterior). 11. Durante certo período, foram feitos investimentos numa empresa. A Tabela 12.17 mostra os benefícios colhidos nos períodos que correspondem aos investimentos realizados na empresa. a) Calcule o coeficiente de correlação de Pearson. b) Estabeleça uma função matemática (reta de ajuste) que explique a dependência existente entre os investimentos e os benefícios obtidos. Tabela 12.17 Investimentos e benefícios colhidos no período de 2004/2008. 12. Uma agência de viagens realizou um estudo sobre as passagens de avião que vendeu nos últimos meses e a soma de horas trabalhadas por todos seus funcionários (lembrando que o número de funcionários é variável). a) Estabeleça uma função matemática que explique a dependência existente entre a quantidade de passagens vendidas e o número de horas trabalhadas.

b) Calcule o coeficiente de correlação de Pearson. Tabela 12.18 Passagens vendidas e horas trabalhadas no período de janeiro a setembro. Respostas da aula 12 1. r = - 0,98. Este resultado indica que há uma forte correlação entre as variáveis ou, ainda, que o nível da correlação entre as duas variáveis é próximo da correlação linear perfeita negativa. Pode-se concluir que existe correlação entre a demanda de passagens e a variação do preço de venda. 2. 3.

4. 5. 6. y=12,82x - 10,47 7. a) não há correlação; b) Y=constante 8. a) r=0,97764; b) y=0,6904x + 1994,5; c) 21,00(x1000) leitos; d) 6,52 (x1000) leitos 9. a)

Pelo diagrama, conclui-se que existe uma correlação retilínea entre as passagens vendidas e os anos correspondentes. b) r = 0,9877; c) y = 0,0018x + 1978,3; d) valor estimado= 17.056 leitos 10. a) Sim, existe uma correlação retilínea entre as passagens vendidas e os gastos. b) 0,9469; c) y = 0,0665x - 418,683; d) gasto estimado: 715,54 (valor em milhares). 11. a) r = 0,9696; b) y = 0,2497x + 13,171. 12. a) y= 0,11x - 2,4969; b) r = 0,8227.