1. CORRELAÇÃO E REGRESSÃO LINEAR

Documentos relacionados
É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Prof. Lorí Viali, Dr.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental.

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr.

Análise de Regressão

Regressão Linear Simples by Estevam Martins

PRESSUPOSTOS DO MODELO DE REGRESSÃO

Cap. 11 Correlação e Regressão

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

Métodos Avançados em Epidemiologia

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

Associação entre duas variáveis quantitativas

REGRESSÃO NÃO LINEAR 27/06/2017

CORRELAÇÃO E REGRESSÃO

Regressão Múltipla. Parte I: Modelo Geral e Estimação

Prof. Lorí Viali, Dr.

Estatística II Antonio Roque Aula 18. Regressão Linear

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Análise Exploratória de Dados

Gabarito da Lista de Exercícios de Econometria I

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

Contabilometria. Aula 8 Regressão Linear Simples

Gráficos de Controle para Processos Autocorrelacionados

4 Critérios para Avaliação dos Cenários

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

Capítulo 1. Exercício 5. Capítulo 2 Exercício

Estatística Aplicada II CORRELAÇÃO. AULA 21 07/11/16 Prof a Lilian M. Lima Cunha

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens

3. Estatística descritiva bidimensional

Algarismos Significativos Propagação de Erros ou Desvios

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira

3 A técnica de computação intensiva Bootstrap

Tipo tratamento idade Tipo tratamento sexo

Correlação. Frases. Roteiro. 1. Coeficiente de Correlação 2. Interpretação de r 3. Análise de Correlação 4. Aplicação Computacional 5.

CAPÍTULO 9 REGRESSÃO LINEAR PPGEP REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES UFRGS. Regressão Linear Simples

Tabela 1. Porcentagem de crianças imunizadas contra DPT e taxa de mortalidade de menores de 5 anos para 20 países, 1992.

Testes não-paramétricos

Covariância na Propagação de Erros

Análise Exploratória de Dados

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011

Dados ajustáveis a uma linha recta

ESTATÍSTICA APLICADA II ANO LECTIVO 2011/2012. Exame Final 26 de Julho de 2012

INSTITUTO POLITÉCNICO DE VISEU ESCOLA SUPERIOR DE TECNOLOGIA E GESTÃO

REGRESSÃO E CORRELAÇÃO

MODELOS DE REGRESSÃO PARAMÉTRICOS

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

DELINEAMENTOS EXPERIMENTAIS

Capítulo 2. Modelos de Regressão

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA

Análise de Variância. Comparação de duas ou mais médias

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

Regressão Linear Simples. Frases. Roteiro

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

AULA EXTRA Análise de Regressão Logística

Elementos de Estatística e Probabilidades II

Professor Mauricio Lutz CORRELAÇÃO

(B) Considere X = antes e Y = depois e realize um teste t para dados pareados e um teste da ANOVA de um DBC com 5 blocos. Compare os resultados.

ALTERNATIVA AO USO DA REGRESSÃO LINEAR SIMPLES PARA GRANDES BASES DE DADOS

Variáveis Aleatórias

REGRESSÃO LINEAR ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA REGRESSÃO CURVILÍNEA FUNÇÃO QUADRÁTICA

AEP FISCAL ESTATÍSTICA

Ajuste de Curvas Regressão. Computação 2º Semestre 2016/2017

R X. X(s) Y Y(s) Variáveis aleatórias discretas bidimensionais

REGRESSÃO APLICADA À DADOS FLORESTAIS

Análise de Regressão Linear Múltipla IV

Nome: Nº: Estatística para Economia e Gestão Licenciaturas em Economia e Gestão. 2.º Semestre de 2008/2009

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária.

AULA 4. Segundo Quartil ( Q observações são menores que ele e 50% são maiores.

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

Métodos Experimentais em Ciências Mecânicas

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

Estudo e Previsão da Demanda de Energia Elétrica. Parte II

Análise de Regressão Linear Múltipla VII

ANÁLISE DA RELAÇÃO ENTRE AS NOTAS DAS DISCIPLINAS DE MATEMÁTICA E FÍSICA DE ESTUDANTES DO ENSINO MÉDIO

Avaliação do tamanho da amostra de segmentos regulares para estimar a área plantada com café na região sul de Minas Gerais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

REGRESSÃO LINEAR ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA REGRESSÃO CURVILÍNEA FUNÇÃO QUADRÁTICA VERIFICAÇÃO DO AJUSTE A UMA RETA PELO COEFICIENTE 3 X 3

Serão abordados nesse capítulo os modelos causais, utilizados como ferramentas para o desenvolvimento e análise desse trabalho.

ESTUDO DE MODELOS PARA AJUSTE E PREVISÃO DE UMA SÉRIE TEMPORAL

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 4

Escola Superior de Tecnologia de Viseu. Fundamentos de Estatística 2006/2007 Ficha nº 7

2 Incerteza de medição

Probabilidade e Estatística. Correlação e Regressão Linear

METODOLOGIA PARA O CÁLCULO DE VAZÃO DE UMA SEÇÃO TRANSVERSAL A UM CANAL FLUVIAL. Iran Carlos Stalliviere Corrêa RESUMO

Transcrição:

1 CORRELAÇÃO E REGREÃO LINEAR Quando deseja-se estudar se exste relação entre duas varáves quanttatvas, pode-se utlzar a ferramenta estatístca da Correlação Lnear mples de Pearson Quando essa correlação é sgnfcatva e exste uma relação de causa e efeto entre essas duas varáves, pode-se estabelecer uma equação de prmero grau por meo de uma ferramenta estatístca conhecda como Regressão Lnear mples Além dsso, pode exstr mas de uma varável (ndependente) que cause efeto sobre a varável dependente, onde podemos utlzar a Regressão Lnear Múltpla Nesse capítulo, serão estudadas essas ferramentas 11 CORRELAÇÃO LINEAR IMPLE O Coefcente de Correlação Lnear mples, também conhecdo como Coefcente de Correlação de Pearson (, no caso de dados populaconas; ou r no caso de dados amostras) 1, tem o objetvo de quantfcar a relação exstente entre duas varáves quanttatvas Antes de calcular esse coefcente, é nteressante fazer uma análse gráfca dos dados por meo de um gráfco conhecdo como Gráfco (ou Dagrama) de Dspersão Esse Gráfco tem por objetvo verfcar se exste uma correlação percebda vsualmente entre as duas varáves e qual o tpo (dreta ou nversa) e a ntensdade (forte, moderada ou fraca) dela A correlação lnear entre duas varáves e pode ser dreta (postva) ou nversa (negatva) conforme mostram os gráfcos de dspersão da Fgura 1 e a varável aumenta, em geral, à medda que aumenta, então exste uma correlação dreta ou postva entre e Porém, se a varável dmnu, em geral, à medda que aumenta, então exste uma correlação nversa ou negatva entre e Essa nuvem de pontos tende a sugerr uma relação lnear, ou seja, uma reta magnára crescente (dreta) ou decrescente (nversa) no dagrama de dspersão e esses pontos estão perfetamente alnhados nessa reta, então a correlação lnear é perfeta, podendo ser dreta (a) ou nversa (f) e esses pontos não estão exatamente alnhados, mas a dferença para esse alnhamento for pequena, há ndícos de que essa correlação seja forte, podendo ser dreta (b) ou nversa (e) e esses pontos não estão exatamente alnhados, e a dferença para esse alnhamento não for tão pequena, há ndícos de que essa correlação seja moderada ou fraca, podendo ser dreta (c) ou nversa (d) 1 Todas as fórmulas utlzadas aqu rão consderar a correlação amostral, portanto, o coefcente r Para a correlação amostral, os cálculos são smlares

1 1 1 1 1 1 1 1 (a) (b) 1 1, 9, 1, 7,, 5,, 3,, 1, 1 1, 1 1 (c) (d) 1 1 1 1 1 1 1 1 (e) Fgura 1 (f) Padrões de Correlações Lneares e a nuvem de pontos não formar nenhuma tendênca lnear crescente ou decrescente, dzemos que a correlação entre e é nula (ou nexstente) ou muto baxa, a ponto de não ser sgnfcatva, tas como os gráfcos (a) e (b) da Fgura e a nuvem de pontos formar alguma tendênca não-lnear, como em (c) e (d), então exste uma correlação entre e, porém ela não é lnear

9 7 5 9 7 5 3 3 1 1 1 1 1 1 (a) (b) 1 1 1 1 1 1 1 1 (c) (d) Fgura Padrões de Correlações Lneares O Coefcente de Correlação de Pearson pode varar entre -1 e 1, ou seja, 1 r 1 e r for postvo, então exste uma correlação dreta (ou postva) entre as varáves; porém se r for negatvo, então exste uma correlação nversa (ou negatva) entre as varáves A magntude de r ndca quão próxmos de uma lnha reta estão os pontos, ou seja, quanto mas próxmo de +1 (ou 1), mas forte é a correlação, e quanto mas próxmo de zero, mas fraca é a correlação entre as duas varáves, conforme mostra a Fgura 3 e r 1, então a correlação lnear é postva e perfeta, mas se r 1, a correlação lnear é negatva e perfeta Fgura 3 Tpo e ntensdade da Correlação de Pearson Fonte: Lopes et al () O Coefcente de Correlação de Pearson pode ser obtdo por:

COV(, ) rxy VAR( ) VAR( ) COV(, ) é a covarânca entre e, VAR( ) é o desvo padrão de, e n ( ) ( ) n n VAR( ) é o desvo padrão de Alternatvamente, a fm de facltar as contas, esse coefcente pode ser calculado por: n( ) ( ) r xy n ( ) n ( ) e não exste relação entre as duas varáves, então Entretanto, é um parâmetro populaconal, desconhecdo, porém estmado na amostra por r Ou seja, se o valor da estmatva r for muto próxmo de zero (mas não exatamente zero), como saberemos se r é estatstcamente dferente de zero ou seja, se a correlação é sgnfcatva? Para responder essa questão, é necessáro fazer um teste de hpótese para testar se r é estatstcamente dferente de zero, 111 TETE PARA O COEFICIE NTE DE CORRELAÇÃO Para testar o coefcente de correlação, ou seja, verfcar se a correlação é sgnfcatva (ou sgnfcatvamente dferente de zero) é necessáro fazer os procedmentos de um Teste de Hpótese blateral, descrto em Erro! Fonte de referênca não encontrada As hpóteses formuladas serão: H: ρ = e H1: ρ O valor do t tabelado é defndo com um nível de sgnfcânca α (blateral) com n graus de lberdades A estatístca calculada é dada por: t C rxy n 1 ( r ) xy A ntensdade da correlação (Fgura 3) fornece ndcações para esse teste, ou seja, quando a correlação é fraca (próxma de zero), há grande probabldade de ela ser não sgnfcatva, porém se ela for forte, provavelmente será sgnfcatva 1 REGREÃO LINEAR IMPLE A Regressão Lnear mples tem por objetvo estabelecer uma equação de prmero grau entre duas varáves e quando elas estão correlaconadas e exste uma relação de causa e efeto entre essas duas varáves, para estmar valores de uma varável (dependente), com base em valores conhecdos da outra varável (ndependente) A Regressão Lnear mples exge algumas pressuposções:

A relação entre e é lnear; é uma varável aleatóra que depende entre outras cosas dos valores de ; são os erros aleatóros, que devem ser ndependentes e devem ter dstrbução normal, com méda zero e varânca constante, ou seja, ~ N(; ) O modelo de regressão lnear smples é dado por:, é o valor da varável dependente para cada observação ; é o valor da varável ndependente para cada observação ; α é o coefcente lnear (ntercepto da reta); β é o coefcente de regressão (coefcente angular ou nclnação da reta); é o erro aleatóro de para a observação,ou seja, ˆ, denotado por d (desvo da observação ) na Erro! Fonte de referênca não encontrada Fgura Desvos entre o valor observado e o valor estmado Fonte: Lopes et al () A equação da regressão lnear smples é dada por: ˆ a b, ˆ é o valor estmado da varável dependente para cada observação ; é o valor da varável ndependente para cada observação ; a é o estmador de α; b é o estmador de β Há város métodos para encontra estmatvas para os parâmetros α e β, sendo que o mas efcaz é o Método dos Mínmos Quadrados O Método dos Mínmos Quadrados consste em adotar como estmatva dos parâmetros os valores que mnmzem a soma dos quadrados dos desvos apresentados na Erro! Fonte de referênca não encontrada, de tal forma que e Aplcando-se o Método dos Mínmos Quadrados, obtemos as seguntes estmatvas para os parâmetros α e β, respectvamente: a b, e

COV (, ) b n, VAR( ) ( ) n podendo ser obtdo também por: n( ) ( ) b n ( ) O parâmetro β é correlaconado com o parâmetro, como pode-se perceber pela semelhança entre as fórmulas Da mesma forma que no caso da correlação, é necessáro fazer um teste de hpótese para testar se b é estatstcamente dferente de zero Em geral, se a correlação for sgnfcatva, o parâmetro β também deverá ser De qualquer forma, o teste para o coefcente β é apresentado a segur, e, na sequênca é apresentado o teste de sgnfcânca para o parâmetro α, o qual também poderá ser não sgnfcatvo, ndependente dos resultados dos testes para, e β 11 TETE PARA O COEFICIE NTE DE REGREÃO Para testar o coefcente de regressão, ou seja, verfcar se o coefcente β é sgnfcatvo (ou sgnfcatvamente dferente de zero) é necessáro fazer os procedmentos de um Teste de Hpótese blateral, descrto em Erro! Fonte de referênca não encontrada As hpóteses formuladas serão: H: β = e H1: β O valor do t tabelado é defndo com um nível de sgnfcânca α (blateral) com n graus de lberdades A estatístca calculada é dada por: b tc, b n Esse teste, além de ser extremamente relaconado com o teste para o coefcente de correlação, também está relaconado com o teste para verfcar a sgnfcânca da regressão, não apresentado aqu Embora esse últmo se basee na estatístca F de nedecor, os resultados, em termos de acetação ou rejeção de H, são os mesmos do teste de sgnfcânca para o coefcente de regressão, ou seja, eles são equvalentes 1 TETE PARA O COEFICIE NTE LINEAR (INTERCEPTO) Para testar o coefcente de lnear, ou seja, verfcar se o coefcente α é sgnfcatvo (ou sgnfcatvamente dferente de zero) é necessáro fazer os procedmentos de um Teste de Hpótese blateral, descrto em Erro! Fonte de referênca não encontrada As hpóteses formuladas serão: H: α = e H1: α O valor do t tabelado é defndo com um nível de sgnfcânca α (blateral) com n graus de lberdades A estatístca calculada é dada por:

t C a n b n, 13 COEFICIENTE DE DETERMINAÇÃO (R²) O Coefcente de Determnação R ndca o percentual das varações de que são explcados ou justfcados pelas varações de e também serve para avalar a qualdade de ajuste do modelo de regressão Esse coefcente é dado por: COV (, ) R b b n, VAR( ) ( ) n podendo também ser calculado por: R r ) ( xy

REFERÊNCIA BUAB, W O; MORETTIN, P A Estatístca Básca 5 Edção ão Paulo: arava, CARREIRA, A; PINTO, G; OUA, B Cálculo da Probabldade Cênca e Técnca Lsboa: Insttuto Paget, CLARKE, A B, DINE, R L Probabldade e Processos Estocástcos, Ro de Janero: Lvros Técncos e Centífcos Edtora A, 1979 COTA NETO, P L O Estatístca ª Edção ão Paulo: Edgard Blücher, CREPO, A A Estatístca Fácl 15ª Edção ão Paulo: Edtora arava, 1997 FONECA, J ; MARTIN, G A Curso de Estatístca ª Edção ão Paulo: Edtora Atlas: 199 HITÓRIA DA ETATÍTICA Insttuto de Matemátca - Unversdade Federal do Ro Grande do ul Dsponível em <http://wwwufrgsbr/mat/graduacao/estatstca/hstorada-estatstca> Acesso em /3/13 LOPE, L F D; MÜLLER, I; OUZA, A M; ANUJ, A P; MORAE, D A O; MOREIRA JUNIOR, F J; PULGATI, F H; TRAZZABOCO, F Caderno ddátco: Estatístca Geral, 3ª edção anta Mara: UFM, MARTIN, G A Estatístca Geral e Aplcada 3ª Edção ão Paulo: Atlas, 5 MCDANIEL, C GATE, R Fundamentos de Pesqusa de Marketng Quarta EdçãoRo de Janero: LTC, MEMÓRIA, J M P Breve Hstóra da Estatístca Brasíla: Embrapa Informação Tecnológca, Dsponível em <http://wwwmufrjbr/~lpbraga/prob1/hstora_estatstcapdf > Acesso em /3/13 MURTEIRA, B J F Probabldades e Estatístca Volume I Porto: Edtora McGrawn-Hll de Portugal, 1979 RIBEIRO, J L D; TEN CATEN, C Controle Estatístco do Processo ére monográfca Qualdade Fundação Empresa Escola de Engenhara da UFRG, Unversdade Federal do Ro Grande do ul, Escola de Engenhara, Programa de Pós Graduação em Engenhara de Produção Porto Alegre, R, 11 ALBURG, D Uma enhora Toma Chá Como a estatístca revoluconou a cênca no século Ro de Janero: Zahar, 9