1 CORRELAÇÃO E REGREÃO LINEAR Quando deseja-se estudar se exste relação entre duas varáves quanttatvas, pode-se utlzar a ferramenta estatístca da Correlação Lnear mples de Pearson Quando essa correlação é sgnfcatva e exste uma relação de causa e efeto entre essas duas varáves, pode-se estabelecer uma equação de prmero grau por meo de uma ferramenta estatístca conhecda como Regressão Lnear mples Além dsso, pode exstr mas de uma varável (ndependente) que cause efeto sobre a varável dependente, onde podemos utlzar a Regressão Lnear Múltpla Nesse capítulo, serão estudadas essas ferramentas 11 CORRELAÇÃO LINEAR IMPLE O Coefcente de Correlação Lnear mples, também conhecdo como Coefcente de Correlação de Pearson (, no caso de dados populaconas; ou r no caso de dados amostras) 1, tem o objetvo de quantfcar a relação exstente entre duas varáves quanttatvas Antes de calcular esse coefcente, é nteressante fazer uma análse gráfca dos dados por meo de um gráfco conhecdo como Gráfco (ou Dagrama) de Dspersão Esse Gráfco tem por objetvo verfcar se exste uma correlação percebda vsualmente entre as duas varáves e qual o tpo (dreta ou nversa) e a ntensdade (forte, moderada ou fraca) dela A correlação lnear entre duas varáves e pode ser dreta (postva) ou nversa (negatva) conforme mostram os gráfcos de dspersão da Fgura 1 e a varável aumenta, em geral, à medda que aumenta, então exste uma correlação dreta ou postva entre e Porém, se a varável dmnu, em geral, à medda que aumenta, então exste uma correlação nversa ou negatva entre e Essa nuvem de pontos tende a sugerr uma relação lnear, ou seja, uma reta magnára crescente (dreta) ou decrescente (nversa) no dagrama de dspersão e esses pontos estão perfetamente alnhados nessa reta, então a correlação lnear é perfeta, podendo ser dreta (a) ou nversa (f) e esses pontos não estão exatamente alnhados, mas a dferença para esse alnhamento for pequena, há ndícos de que essa correlação seja forte, podendo ser dreta (b) ou nversa (e) e esses pontos não estão exatamente alnhados, e a dferença para esse alnhamento não for tão pequena, há ndícos de que essa correlação seja moderada ou fraca, podendo ser dreta (c) ou nversa (d) 1 Todas as fórmulas utlzadas aqu rão consderar a correlação amostral, portanto, o coefcente r Para a correlação amostral, os cálculos são smlares
1 1 1 1 1 1 1 1 (a) (b) 1 1, 9, 1, 7,, 5,, 3,, 1, 1 1, 1 1 (c) (d) 1 1 1 1 1 1 1 1 (e) Fgura 1 (f) Padrões de Correlações Lneares e a nuvem de pontos não formar nenhuma tendênca lnear crescente ou decrescente, dzemos que a correlação entre e é nula (ou nexstente) ou muto baxa, a ponto de não ser sgnfcatva, tas como os gráfcos (a) e (b) da Fgura e a nuvem de pontos formar alguma tendênca não-lnear, como em (c) e (d), então exste uma correlação entre e, porém ela não é lnear
9 7 5 9 7 5 3 3 1 1 1 1 1 1 (a) (b) 1 1 1 1 1 1 1 1 (c) (d) Fgura Padrões de Correlações Lneares O Coefcente de Correlação de Pearson pode varar entre -1 e 1, ou seja, 1 r 1 e r for postvo, então exste uma correlação dreta (ou postva) entre as varáves; porém se r for negatvo, então exste uma correlação nversa (ou negatva) entre as varáves A magntude de r ndca quão próxmos de uma lnha reta estão os pontos, ou seja, quanto mas próxmo de +1 (ou 1), mas forte é a correlação, e quanto mas próxmo de zero, mas fraca é a correlação entre as duas varáves, conforme mostra a Fgura 3 e r 1, então a correlação lnear é postva e perfeta, mas se r 1, a correlação lnear é negatva e perfeta Fgura 3 Tpo e ntensdade da Correlação de Pearson Fonte: Lopes et al () O Coefcente de Correlação de Pearson pode ser obtdo por:
COV(, ) rxy VAR( ) VAR( ) COV(, ) é a covarânca entre e, VAR( ) é o desvo padrão de, e n ( ) ( ) n n VAR( ) é o desvo padrão de Alternatvamente, a fm de facltar as contas, esse coefcente pode ser calculado por: n( ) ( ) r xy n ( ) n ( ) e não exste relação entre as duas varáves, então Entretanto, é um parâmetro populaconal, desconhecdo, porém estmado na amostra por r Ou seja, se o valor da estmatva r for muto próxmo de zero (mas não exatamente zero), como saberemos se r é estatstcamente dferente de zero ou seja, se a correlação é sgnfcatva? Para responder essa questão, é necessáro fazer um teste de hpótese para testar se r é estatstcamente dferente de zero, 111 TETE PARA O COEFICIE NTE DE CORRELAÇÃO Para testar o coefcente de correlação, ou seja, verfcar se a correlação é sgnfcatva (ou sgnfcatvamente dferente de zero) é necessáro fazer os procedmentos de um Teste de Hpótese blateral, descrto em Erro! Fonte de referênca não encontrada As hpóteses formuladas serão: H: ρ = e H1: ρ O valor do t tabelado é defndo com um nível de sgnfcânca α (blateral) com n graus de lberdades A estatístca calculada é dada por: t C rxy n 1 ( r ) xy A ntensdade da correlação (Fgura 3) fornece ndcações para esse teste, ou seja, quando a correlação é fraca (próxma de zero), há grande probabldade de ela ser não sgnfcatva, porém se ela for forte, provavelmente será sgnfcatva 1 REGREÃO LINEAR IMPLE A Regressão Lnear mples tem por objetvo estabelecer uma equação de prmero grau entre duas varáves e quando elas estão correlaconadas e exste uma relação de causa e efeto entre essas duas varáves, para estmar valores de uma varável (dependente), com base em valores conhecdos da outra varável (ndependente) A Regressão Lnear mples exge algumas pressuposções:
A relação entre e é lnear; é uma varável aleatóra que depende entre outras cosas dos valores de ; são os erros aleatóros, que devem ser ndependentes e devem ter dstrbução normal, com méda zero e varânca constante, ou seja, ~ N(; ) O modelo de regressão lnear smples é dado por:, é o valor da varável dependente para cada observação ; é o valor da varável ndependente para cada observação ; α é o coefcente lnear (ntercepto da reta); β é o coefcente de regressão (coefcente angular ou nclnação da reta); é o erro aleatóro de para a observação,ou seja, ˆ, denotado por d (desvo da observação ) na Erro! Fonte de referênca não encontrada Fgura Desvos entre o valor observado e o valor estmado Fonte: Lopes et al () A equação da regressão lnear smples é dada por: ˆ a b, ˆ é o valor estmado da varável dependente para cada observação ; é o valor da varável ndependente para cada observação ; a é o estmador de α; b é o estmador de β Há város métodos para encontra estmatvas para os parâmetros α e β, sendo que o mas efcaz é o Método dos Mínmos Quadrados O Método dos Mínmos Quadrados consste em adotar como estmatva dos parâmetros os valores que mnmzem a soma dos quadrados dos desvos apresentados na Erro! Fonte de referênca não encontrada, de tal forma que e Aplcando-se o Método dos Mínmos Quadrados, obtemos as seguntes estmatvas para os parâmetros α e β, respectvamente: a b, e
COV (, ) b n, VAR( ) ( ) n podendo ser obtdo também por: n( ) ( ) b n ( ) O parâmetro β é correlaconado com o parâmetro, como pode-se perceber pela semelhança entre as fórmulas Da mesma forma que no caso da correlação, é necessáro fazer um teste de hpótese para testar se b é estatstcamente dferente de zero Em geral, se a correlação for sgnfcatva, o parâmetro β também deverá ser De qualquer forma, o teste para o coefcente β é apresentado a segur, e, na sequênca é apresentado o teste de sgnfcânca para o parâmetro α, o qual também poderá ser não sgnfcatvo, ndependente dos resultados dos testes para, e β 11 TETE PARA O COEFICIE NTE DE REGREÃO Para testar o coefcente de regressão, ou seja, verfcar se o coefcente β é sgnfcatvo (ou sgnfcatvamente dferente de zero) é necessáro fazer os procedmentos de um Teste de Hpótese blateral, descrto em Erro! Fonte de referênca não encontrada As hpóteses formuladas serão: H: β = e H1: β O valor do t tabelado é defndo com um nível de sgnfcânca α (blateral) com n graus de lberdades A estatístca calculada é dada por: b tc, b n Esse teste, além de ser extremamente relaconado com o teste para o coefcente de correlação, também está relaconado com o teste para verfcar a sgnfcânca da regressão, não apresentado aqu Embora esse últmo se basee na estatístca F de nedecor, os resultados, em termos de acetação ou rejeção de H, são os mesmos do teste de sgnfcânca para o coefcente de regressão, ou seja, eles são equvalentes 1 TETE PARA O COEFICIE NTE LINEAR (INTERCEPTO) Para testar o coefcente de lnear, ou seja, verfcar se o coefcente α é sgnfcatvo (ou sgnfcatvamente dferente de zero) é necessáro fazer os procedmentos de um Teste de Hpótese blateral, descrto em Erro! Fonte de referênca não encontrada As hpóteses formuladas serão: H: α = e H1: α O valor do t tabelado é defndo com um nível de sgnfcânca α (blateral) com n graus de lberdades A estatístca calculada é dada por:
t C a n b n, 13 COEFICIENTE DE DETERMINAÇÃO (R²) O Coefcente de Determnação R ndca o percentual das varações de que são explcados ou justfcados pelas varações de e também serve para avalar a qualdade de ajuste do modelo de regressão Esse coefcente é dado por: COV (, ) R b b n, VAR( ) ( ) n podendo também ser calculado por: R r ) ( xy
REFERÊNCIA BUAB, W O; MORETTIN, P A Estatístca Básca 5 Edção ão Paulo: arava, CARREIRA, A; PINTO, G; OUA, B Cálculo da Probabldade Cênca e Técnca Lsboa: Insttuto Paget, CLARKE, A B, DINE, R L Probabldade e Processos Estocástcos, Ro de Janero: Lvros Técncos e Centífcos Edtora A, 1979 COTA NETO, P L O Estatístca ª Edção ão Paulo: Edgard Blücher, CREPO, A A Estatístca Fácl 15ª Edção ão Paulo: Edtora arava, 1997 FONECA, J ; MARTIN, G A Curso de Estatístca ª Edção ão Paulo: Edtora Atlas: 199 HITÓRIA DA ETATÍTICA Insttuto de Matemátca - Unversdade Federal do Ro Grande do ul Dsponível em <http://wwwufrgsbr/mat/graduacao/estatstca/hstorada-estatstca> Acesso em /3/13 LOPE, L F D; MÜLLER, I; OUZA, A M; ANUJ, A P; MORAE, D A O; MOREIRA JUNIOR, F J; PULGATI, F H; TRAZZABOCO, F Caderno ddátco: Estatístca Geral, 3ª edção anta Mara: UFM, MARTIN, G A Estatístca Geral e Aplcada 3ª Edção ão Paulo: Atlas, 5 MCDANIEL, C GATE, R Fundamentos de Pesqusa de Marketng Quarta EdçãoRo de Janero: LTC, MEMÓRIA, J M P Breve Hstóra da Estatístca Brasíla: Embrapa Informação Tecnológca, Dsponível em <http://wwwmufrjbr/~lpbraga/prob1/hstora_estatstcapdf > Acesso em /3/13 MURTEIRA, B J F Probabldades e Estatístca Volume I Porto: Edtora McGrawn-Hll de Portugal, 1979 RIBEIRO, J L D; TEN CATEN, C Controle Estatístco do Processo ére monográfca Qualdade Fundação Empresa Escola de Engenhara da UFRG, Unversdade Federal do Ro Grande do ul, Escola de Engenhara, Programa de Pós Graduação em Engenhara de Produção Porto Alegre, R, 11 ALBURG, D Uma enhora Toma Chá Como a estatístca revoluconou a cênca no século Ro de Janero: Zahar, 9