Introdução. Existem situações nas quais há interesse em estudar o comportamento conjunto de uma ou mais variáveis;



Documentos relacionados
Introdução. São duas técnicas estreitamente relacionadas, que visa estimar uma relação que possa existir entre duas variáveis na população.

Correlação e Regressão Linear

Só Matemática O seu portal matemático FUNÇÕES

Universidade Federal Rural de Pernambuco

IMES Catanduva. Probabilidades e Estatística. no Excel. Matemática. Bertolo, L.A.

3. Limites. = quando x está muito próximo de 0: a) Vejamos o que ocorre com a função f ( x)

Módulo 4 PREVISÃO DE DEMANDA

9. Derivadas de ordem superior

Í N D I C E Introdução Função Constante Função Linear... 02

Potenciação no Conjunto dos Números Inteiros - Z

Todos os exercícios sugeridos nesta apostila se referem ao volume 1. MATEMÁTICA I 1 FUNÇÃO DO 1º GRAU

MESTRADO EM MACROECONOMIA e FINANÇAS Disciplina de Computação. Aula 04. Prof. Dr. Marco Antonio Leonel Caetano

Estatística Aplicada Lista de Exercícios 7

Slides de Estatística Descritiva na HP-12C 01/10/2009 ESTATÍSTICAS. Na HP-12C. 01/10/2009 Bertolo 2. O que é Estatística?

Análise Exploratória de Dados

O gráfico de. Freqüentemente você se depara com tabelas. Nossa aula

AULAS 13, 14 E 15 Correlação e Regressão

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA 4 a LISTA DE EXERCÍCIOS GBQ12 Professor: Ednaldo Carvalho Guimarães AMOSTRAGEM

Funções. Funções. Você, ao longo do curso, quando apresentado às disciplinas de Economia, terá oportunidade de fazer aplicações nos cálculos

INE Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis

Estatística e Probabilidade

Tópico 11. Aula Teórica/Prática: O Método dos Mínimos Quadrados e Linearização de Funções

UNIVERSIDADE SEVERINO SOMBRA UNIDADE MARICÁ CURSO DE ADMINISTRAÇÃO DE EMPRESAS MATEMÁTICA 2 PROF. ILYDIO PEREIRA DE SÁ

Métodos Matemáticos para Gestão da Informação

Vetores Aleatórios, correlação e conjuntas

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014

PROBLEMAS DE OTIMIZAÇÃO

Valeska Andreozzi 2010

APLICAÇÕES DA DERIVADA

A seguir, uma demonstração do livro. Para adquirir a versão completa em papel, acesse:

LISTA DE EXERCÍCIOS 2 INE 7001 PROF. MARCELO MENEZES REIS ANÁLISE BIDIMENSIONAL

MATEMÁTICA. Aula 1 Revisão. Prof. Anderson

Erros. Número Aproximado. Erros Absolutos erelativos. Erro Absoluto

A Curva de Lorenz e o Índice de Gini

INTRODUÇÃO AO ESTUDO DE EQUAÇÕES DIFERENCIAIS

11. Problemas de Otimização

FUNÇÕES E SUAS PROPRIEDADES

Distribuição de Freqüência

Limites e continuidade

Conjuntos numéricos. Notasdeaula. Fonte: Leithold 1 e Cálculo A - Flemming. Dr. Régis Quadros


AVALIAÇÃO DO MODELO DE ONDAS

UM ESTUDO DAS FUNÇÕES DE 1º E 2º GRAUS APLICADAS À ECONOMIA

EXERCÍCIOS DE REVISÃO PFV - GABARITO

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA MATEMÁTICA PARA ADMINISTRAÇÃO B 2005/2

( ) , L x x. L x x x. (17) Lx ( ) L(17) L(17) L(17)

Lógica Matemática e Computacional 5 FUNÇÃO

Uma lei que associa mais de um valor y a um valor x é uma relação, mas não uma função. O contrário é verdadeiro (isto é, toda função é uma relação).

Faculdade Sagrada Família

Objetivos: Construção de tabelas e gráficos, escalas especiais para construção de gráficos e ajuste de curvas à dados experimentais.

2. Função polinomial do 2 o grau

GUIA DE LABORATÓRIO LABORATÓRIO 2 LEI DE OHM

REGRESSÃO LINEAR SIMPLES

CURSO INTRODUTÓRIO DE MATEMÁTICA PARA ENGENHARIA Função do 1 Grau. Isabelle Araujo 5º período de Engenharia de Produção

1 - Conceituação e importância do estudo da matemática financeira

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL FACULDADE DE MATEMÁTICA MATEMÁTICA PARA ADMINISTRAÇÃO E CIÊNCIAS CONTÁBEIS 2008/1

NECESSIDADE DE CAPITAL DE GIRO E OS PRAZOS DE ROTAÇÃO Samuel Leite Castelo Universidade Estadual do Ceará - UECE

O que é a estatística?

UTILIZAÇÃO DE RECURSOS ESTATÍSTICOS AVANÇADOS DO EXCEL PREVISÃO

Resolução dos Exercícios sobre Derivadas

Pesquisa Operacional. Função Linear - Introdução. Função do 1 Grau. Função Linear - Exemplos Representação no Plano Cartesiano. Prof.

3 Previsão da demanda


Plano Curricular de Matemática 9º ano /2015-3º Ciclo

CÁLCULO DE ZEROS DE FUNÇÕES REAIS

Departamento de Matemática - UEL Ulysses Sodré. Arquivo: minimaxi.tex - Londrina-PR, 29 de Junho de 2010.

MÉTODOS DE CALIBRAÇÃO

Matemática - UEL Compilada em 18 de Março de Prof. Ulysses Sodré Matemática Essencial:

PROVA OBJETIVA DE MATEMÁTICA VESTIBULAR FGV CURSO DE ADMINISTRAÇÃO RESOLUÇÃO: Profa. Maria Antônia C. Gouveia

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

(Testes intermédios e exames 2005/2006)

MATERIAL MATEMÁTICA I

1. Registou-se o número de assoalhadas da população de 100 apartamentos vendidos num bairro residencial

2 - Generalidades sobre funções reais de variável real

Contabilidade Gerencial 2. Contabilidade Gerencial. Projeção do orçamento. Administração. Prof: Marcelo dos Santos. Projeção Orçamento

TECNOLOGIA MECÂNICA. Aula 04. Carregamento Axial Tensão Normal

ESCOLA DR. ALFREDO JOSÉ BALBI UNITAU APOSTILA PROF. CARLINHOS NOME: N O :

2 A Derivada. 2.1 Velocidade Média e Velocidade Instantânea

Aula 7 Valores Máximo e Mínimo (e Pontos de Sela)

COM A TÉCNICA DE REGRESSÃO LINEAR SIMPLES

Engenharia Informática. Física II. 1º Ano 2º Semestre. Instituto politécnico de Bragança Escola Superior de Tecnologia e de Gestão

Análise de Regressão Linear Simples e Múltipla

QUEDA LIVRE. Permitindo, então, a expressão (1), relacionar o tempo de queda (t), com o espaço percorrido (s) e a aceleração gravítica (g).

Problemas de O-mização. Material online: h-p://

Método dos mínimos quadrados - ajuste linear

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO PARANÁ CURSO DE ENGENHARIA CIVIL DISCIPLINA DE CÁLCULO DIFERENCIAL E INTEGRAL I

Questão 1. Questão 3. Questão 2. alternativa D. alternativa C. alternativa A

Capítulo 1. x > y ou x < y ou x = y

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I

Ajuste de Curvas. Ajuste de Curvas

Correlação. Ivan Bezerra Allaman

IBM1018 Física Básica II FFCLRP USP Prof. Antônio Roque Aula 4

Revisão Extra UECE. 1. (Espcex- 2013) A figura a seguir apresenta o gráfico de um polinômio P(x) do 4º grau no intervalo 0, no intervalo 0,5 é

O comportamento conjunto de duas variáveis quantitativas pode ser observado por meio de um gráfico, denominado diagrama de dispersão.

Máximos e mínimos. Problemas de máximos e mínimos estão presentes. Nossa aula

Regressão Linear em SPSS

x 1 f(x) f(a) f (a) = lim x a

Estatística: Conceitos e Organização de Dados. Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos

INSTITUTO TECNOLÓGICO

AULAS 02 E 03 Modelo de Regressão Simples

Transcrição:

UNIVERSIDADE FEDERAL DA PARAÍBA Correlação e Regressão Luiz Medeiros de Araujo Lima Filho Departamento de Estatística

Introdução Eistem situações nas quais há interesse em estudar o comportamento conjunto de uma ou mais variáveis; Em muitos casos, a eplicação de um fenômeno de interesse pode estar associado a outros fatores (variáveis) que contribuem de algum modo para a ocorrência deste fenômeno. O comportamento conjunto de duas variáveis quantitativas pode ser observado por meio do gráfico de dispersão.

Introdução

Eemplo Para desenhar um diagrama de dispersão, é necessário sempre fazer o eio cartesiano para identificar os pontos das variáveis quantitativas consideradas. Representa-se primeiramente uma das variáveis no eio das abscissas (variável X) e a outra variável no eio das ordenadas (variável Y). Os valores das variáveis são marcados sob os respectivos eios e assim marca-se um ponto para cada par de valores.

Eemplo

Correlação e Regressão São duas técnicas estreitamente relacionadas, que visa estimar uma relação que possa eistir entre duas variáveis na população. Correlação: resume o grau de relacionamento entre duas variáveis (X e Y, por eemplo). Regressão: tem como resultado uma equação matemática que descreve o relacionamento entre variáveis.

Correlação O objetivo do estudo da correlação é determinar (mensurar) o grau de relacionamento entre duas variáveis. Caso os pontos das variáveis, representados num plano cartesiano (X, Y) ou gráfico de dispersão, apresentem uma dispersão ao longo de uma reta imaginária, dizemos que os dados apresentam uma correlação linear.

Coeficiente de correlação linear de Pearson Uma medida do grau e do sinal da correlação linear entre duas variáveis (X,Y) é dado pelo Coeficiente de Correlação Linear de Pearson, definido por: O valor de r estará sempre no intervalo de -1 a 1.

Propriedades do Coeficiente de Correlação Linear Este coeficiente é adimensional, logo não é afetado pelas unidades de medidas das variáveis X e Y. O sinal positivo indica que as variáveis são diretamente proporcionais, enquanto que o sinal negativo indica que a relação entre as variáveis é inversamente proporcional.

Eemplo 1: A tabela abaio apresenta os preços médios das ações e títulos divulgados pela Bolsa de Nova York entre 1950 e 1959. Calcule o coeficiente de correlação de Pearson e interprete o resultado.

Eemplo2: Eistecorrelaçãoentre o númerode faltase a nota final? De que forma? Nota final 95 90 85 80 75 70 65 60 55 50 45 40 0 2 4 6 8 10 12 14 16 Faltas X Faltas Nota final y 8 78 2 92 5 90 12 58 15 43 9 74 6 81

REGRESSÃO Quando analisamos dados que sugerem a eistência de uma relação funcional entre duas variáveis, surge então o problema de se determinar uma função matemática que eprima esse relacionamento, ou seja, uma equação de regressão. Ao imaginar uma relação funcional entre duas variáveis, digamos X e Y, estamos interessados numa função que eplique grande parte da variação de Y por X. Entretanto, uma parcela da variabilidade de Y não eplicada por X será atribuída ao acaso, ou seja, ao erro aleatório. Quando se estuda a variação de uma variável Y em função de uma variável X, dizemos que Y é a variável dependente e que X é a variável eplanatória (ou independente).

O modelo em que busca eplicar uma variável Y como uma função linear de apenas uma variável X é denominado de modelo de regressão linear simples. Variável independente, X Variável dependente, Y Temperatura do forno ( C) Resistência mecânica da cerâmica (MPa) Quantidade de aditivo (%) Octanagam da gasolina Renda(R$) Consumo(R$) Memória RAM do computador (Gb) Tempo de resposta do sistema (s) Área construída do imóvel (m 2 ) Preço do imóvel (R$)

REGRESSÃO LINEAR SIMPLES

ESTIMAÇÃO DOS PARÂMETROS O objetivo é estimar valores para α e β através dos dados fornecidos pela amostra. Além disso, encontrar a reta que passe o mais próimo possível dos pontos observados segundo um critério pré-estabelecido.

MÉTODO DOS MÍNIMOS QUADRADOS É usado para estimar os parâmetros do modelo (α e β) e consiste em fazer com que a soma dos erros quadráticos seja menor possível, ou seja, este método consiste em obter os valores de α e β que minimizam a epressão: Aplicando-se derivadas parciais à epressão acima, e igualando-se a zero, acharemos as estimativas para α e β.

MÉTODO DOS MÍNIMOS QUADRADOS Após aplicar as derivadas parciais, e igualando-se a zero, é possível obter as seguintes estimativas para α e β, as quais chamaremos de a e b, respectivamente: e

A chamada equação (reta) de regressão é dada por e para cada valor (i = 1,..., n) temos, pela equação de e para cada valor i (i = 1,..., n) temos, pela equação de regressão, o valor predito:

A diferença entre os valores observados e os preditos será chamada de resíduo do modelo de regressão, sendo denotado por: O resíduo relativo à i-ésima observação (e i ) pode ser O resíduo relativo à i-ésima observação (e i ) pode ser considerado uma estimativa do erro aleatório (e i ), como ilustrado abaio.

COEFICIENTE DE DETERMINAÇÃO (R 2 ) O coeficiente de determinação é uma medida descritiva da proporção da variação de Y que pode ser eplicada por variações em X, segundo o modelo de regressão especificado. Ele é dado pela seguinte razão: Quanto mais próimo de 1 estiver o coeficiente de determinação, melhor será o grau de eplicação da variação de Y em termos da variável X. É uma medida sempre positiva, e é obtida, na regressão linear simples, elevando-se o coeficiente de correlação de pearson ao quadrado.

EXEMPLO 3: Considere um eperimento em que se analisa a octanagem da gasolina (Y) em função da adição de um novo aditivo (X). Para isso, foram realizados ensaios com os percentuais de 1, 2, 3, 4, 5 e 6% de aditivo. Os resultados são mostrados no gráfico de dispersão. Índice de octanagem 86 85 84 83 82 81 80 0 1 2 3 4 5 6 7 Quantidade de aditivo (%) a) Eiste uma relação linear entre a adição de um novo aditivo e a octanagem da gasolina? Qual o grau dessa relação? b) Determine a reta de regressão que eplica a octanagem da gasolina em função da adição do novo aditivo. Calcule o coeficiente de determinação do modelo. c) Se adicionarmos 5,5% de aditivo, qual o índice de octanagem esperado? d) Calcule o erro de estimação para cada valor de X.

EXEMPLO 4: Quantidade de procaína hidrolisada, em 10 moles/litro, no plasma humano, em função do tempo decorrido após sua administração. a) Eiste uma relação linear entre a quantidade de procaína e o tempo decorrido após sua administração? Qual o grau dessa relação? b) Determine a reta de regressão que eplica a quantidade de procaína em função do tempo. Calcule o coeficiente de determinação do modelo. c) Qual a quantidade de procaína hidrolisada após 6 minutos de sua administração? E após 13 minutos? d) Calcule o erro de estimação para cada valor de X.

Eemplo 5: A tabela abaio apresenta os preços médios das ações e títulos divulgados pela Bolsa de Nova York entre 1950 e 1959. Calcule o coeficiente de correlação de Pearson e interprete o resultado. a) Determine a reta de regressão que eplique os títulos divulgados em função do preço médio das ações. Calcule o coeficiente de determinação do modelo. b) Qual o número de títulos divulgados para um preço médio da ação de 45,00? E para um preço médio de 50,00? c) Calcule o erro de estimação para cada valor de X.

REGRESSÃO LINEAR MÚLTIPLA Em algumas situações o interesse é estudar o comportamento de uma variável dependente Y em função de duas ou mais variáveis independentes X i. Os métodos para tratar com o problema de prever uma variável por meio de diversas outras são semelhantes àqueles para uma variável independente.