Prof. Lorí Val, Dr. val@pucrs.r http://www.pucrs.r/famat/val/ Em mutas stuações duas ou mas varáves estão relacoadas e surge etão a ecessdade de determar a atureza deste relacoameto. A aálse de regressão é uma técca estatístca para modelar e vestgar o relacoameto etre duas ou mas varáves. De fato a regressão pode ser dvdda em dos prolemas: ( o da especfcação e ( o da determação. O prolema da especfcação é descorr detre os possíves modelos (lear, quadrátco, expoecal, etc. qual o mas adequado. O prolema da determação é uma vez defdo o modelo (lear, quadrátco, expoecal, etc. estmar os parâmetros da equação.
Normalmete é suposto que exsta uma varável (depedete ou resposta, que está relacoada a k varáves (depedetes ou regressoras (,,..., k. A varável resposta é aleatóra, equato que as varáves regressoras são ormalmete cotroladas. O relacoameto etre elas é caracterzado por uma equação deomada de equação de regressão Quado exstr apeas uma varável regressora ( tem-se a regressão smples, se depeder de duas ou mas varáves regressoras, etão tem-se a regressão múltpla. Vamos supor que a regressão é do tpo smples e que o o modelo seja lear, sto é, vamos supor que a equação de regressão seja do tpo: α β U y α β U; x x x x O termo U é o termo erro, sto é, U represeta outras fluêcas sore a varável, além da exercda pela varável. A varação resdual (termo U é suposto de méda zero e desvo costate e gual a σ.
Ou ada pode-se admtr que o modelo forece o valor médo de, para um dado x, sto é, E(/x α β α β U; E(/x α β, sto é, E(U 0 V(/x σ ; Cov(U, Uj 0, para j; A varável permaece fxa em oservações sucessvas e os erros U são ormalmete dstruídos. O modelo suposto E(/x α β é populacoal. Vamos supor que se teha pares de oservações, dgamos: (x, y, (x, y,..., (x, y e que através deles queremos estmar o modelo acma. por: A reta estmada será represetada Ŷ a ou a E Ode a é um estmador de α e é um estmador de β, sedo Ŷ um estmador de E(/x. Exstem dversos métodos para a determação da reta desejada. Um deles, deomado de MMQ (Métodos dos Mímos Quadrados, cosste em mmzar a soma dos quadrados das dstâcas da reta aos potos. Tem-se: a x E, Etão: E - (a x 3
4 Deve-se mmzar: φ a ( Ŷ ( E E a E y ŷ x Dervado parcalmete tem-se: a ( x a ( a φ φ Igualado as dervadas parcas a zero vem: 0 a ( x 0 a ( Isolado as cógtas, tem-se: a Resolvedo para a e, segue: a y
Lemrado que: Fazedo: Um egehero químco está vestgado o efeto da temperatura de operação do processo o redmeto do produto. O estudo resultou os dados da taela, ao lado. Determar a lha de regressão. Temperatura, C 0 ( 00 0 0 30 40 50 60 70 80 90 Redmeto ( 45 5 54 6 66 70 74 78 85 89 Da mesma forma que para 0 96 calcular o coefcete de correlação é 30 37 40 4356 ecessáro a costrução de três ovas 50 4900 coluas. Uma para, uma para e outra para. 60 80 5476 75 70 90 6084 89 690 3600 79 00 0 450 45 5 54 6 66 70 74 78 85 673 4500 560 6480 7930 940 0500 840 360 5300 0570 0000 00 4400 6900 9600 500 5600 8900 3400 8500 05 60 475 5
Tem-se: Etão: 0 450 673 45 67,3 0570 8500 475 0570 0.45.67,3 3985 8500 0.45 850 475 0.67,3 93,0 A equação de regressão, será, etão: a,7394 3985 850,74 0,4830 0,48 67,30 0,4830.45 ˆ, 74 0,48 x A perguta que cae agora é: este modelo represeta em os potos dados? A resposta é dada através do erro padrão da regressão. O ojetvo do MMQ é mmzar a varação resdual em toro da reta de regressão. Uma avalação desta varação é dada por: E ( a 6
O cálculo da varâca resdual, por esta expressão, é muto traalhoso, pos é ecessáro prmero determar os valores prevstos. Etretato é possível oter uma expressão que ão requera o cálculo dos valores prevstos, sto é, de ˆ a s Erro padrão da regressão E ( a Cosderado os valores do exemplo ateror, determar o erro padrão da regressão. Tem-se: 93,0 3985 850 850 0,4830 Etão: s 3985 93,0 850 0 0,9503 0,95.3985 7
Os valores de a e são estmadores de α e β. As propredades estatístcas destes estmadores são útes para testar a adequação do modelo. Eles são varáves aleatóras uma vez que são comações leares dos que são, por sua vez, varáves aleatóras. As prcpas propredades de teresse são a méda (expectâca, a varaldade (erro padrão e a dstrução de proaldade de cada um dos estmadores. Comportameto de a ( Expectâca ( Varâca V ( a V ( α E( a E... (... σ Portato a dstrução da estatístca a, será: a ~ N ( α, σ Como o valor σ ão é cohecdo e precsa ser estmado por s, etão, de fato, utlza-se a dstrução t -. Comportameto de ( Expectâca E( E... β ( Varâca V ( V... σ Portato a dstrução da estatístca, será: σ ~ N ( β, Como o valor σ ão é cohecdo e precsa ser estmado por s, etão, de fato, utlza-se a dstrução t -. 8
" α" O IC de α de cofaça para o coefcete lear α é dado por: P( a t α a t α " β" O IC de α de cofaça para o coefcete da regressão β é dado por: P( t β t α Determar tervalos de cofaça de 95% para os parâmetros da equação de regressão, utlzado os dados do exercíco ateror. ˆ, 74 0,48 x 93,0 850 3985 45 67,30 a,7394 0,4830 s 0,9503 0 α 95% 9
O IC de - α para o Coef. Lear α é dado por: a ± t Etão: -,7394 -,7394 [-6,3; ±,306.0,95 03 ± 3,5663 0,83] 0 45 850 O IC de - α para o Coef. Agular β é dado por: Etão: ± t 0,4830 ±,306. 0,9503 850 0,4830 ± 0,04 [0,4589; 0,507] [0,46; 0,5] Da mesma forma que foram otdos IC para os parâmetros da regressão, pode-se oter IC para os valores estmados de para um dado x. Vamos cosderar dos casos: (a Cosderado somete a certeza da lha de regressão (tervalo para a estmatva; ( Cosderado a certeza da lha mas a varação da varável (tervalo para a prevsão. Para costrur o IC de α para o valor médo de (para a estmatva, dado x, é ecessáro cohecer sua dstrução. Tem-se: Ŷ ~ N( αβx ; σ ( Etão IC de α de cofaça para o um valor médo de, dado x,é: Ŷ ± t ( 0
Uma estmatva do valor dvdual de (prevsão é dado por a x e a Etão IC de α de cofaça para o um valor dvdual de, dado x, dstrução desta estmatva será dada será: por: Ŷ ~ N( 0; σ ( Ŷ ± t ( Determar tervalos de cofaça de 95% para os valores médo e dvdual de, a hpótese de x 00. 93,0 850 a, 7394 0,4830 3985 s 0, 9503 45 0 67,30 α 95% x 00 O IC de - α para o valor médo de, dado x é: Etão: Ŷ ± t ( ŷ,7394 0,4830.00 93,8606
Etão, o IC para o valor médo, será: 93,8606 93,8606 ± ± [9,36; 95,36],306.0,9503,4970 0 ( 0045 850 O IC de - α para o valor dvdual de, dado x é: Etão: Ŷ ± t ( O IC será: 93,8606 93,8606 [9,; 96,5] ±,306.0,9503 ±,6539 0 ( 0045 850 " α" Da mesma forma que foram testados todos os parâmetros até etão pode-se testar os parâmetros α e β da regressão. A varável teste para testar o coefcete lear é dado por: t a α
" β" A varável teste para testar o coefcete da regressão β é dada por: t β (a Testar, a % de sgfcâca, se é possível afrmar que a lha de regressão, do exemplo dado, ão passa pela orgem. ( Testar se é possível, a % de sgfcâca, afrmar que exste regressão postva etre as duas varáves. a, 7394 0,4830 s 0,9503 0 α % 93,0 850 3985 Hpóteses: H 0 : α 0 H : α 0 Dados: 0 a -,739 α % Trata-se de um teste lateral para o coefcete lear da regressão. A varável vel teste é: Etão: t t,739 0 45 0,9503 0 850 8 a α,77 3
O valor crítco t c é tal que: P( T > t c α Etão t c -3,355. Assm RC [-3,355; DECIÃO e CONCLUÃO: Como t 8 -,77 RC ou -,77 > -3,355. Aceto H 0, sto é,, a % de sgfcâca, ão se pode afrmar que a lha de regressão ão passe pela orgem. Hpóteses: H 0 : β 0 H : β > 0 Dados: 0 0,4830 α % Trata-se de um teste ulateral para o coefcete agular da regressão. A varável vel teste é: Etão: t β 0,4830 0 t 8 46,65 0,9503 / 850 O valor crítco t c é tal que: P(T > t c α Etão t c,896. Assm RC [,896; DECIÃO e CONCLUÃO: Como t 8 46,65 RC ou 46,65 >,896. Rejeto H 0, sto é,, a % de sgfcâca, pode-se afrmar que exste regressão etre as duas varáves. ves. Ŷ Ŷ Ŷ Ŷ Ŷ ( ( Ŷ ( Ŷ VT VR VE x 4
VR (a Varação Total: VT VT ( ( Varação Resdual: VR ( ˆ VT VE (c Varação Explcada: VE VE ( ˆ Uma maera de medr o grau de aderêca (adequação de um modelo é verfcar o quato da varação total de é explcada pela reta de regressão. Para sto, toma-se o quocete etre a varação explcada, VE, pela varação total,vt: R VE / VT Este resultado é deomado de Coefcete de Determação. R VE VT Este resultado mede o quato as varações de uma das varáves são explcadas pelas varações da outra varável. Ou ada, ele mede a parcela da varação total que é explcada pela reta de regressão, sto é: VE R A varação resdual correspode a: VR ( R Assm R é o Coefcete de Idetermação. 5
O % de mpurezas o gás oxgêo produzdo por um processo de destlação supõem-se que esteja relacoado com o % de hdrocaroo o codesador prcpal do processador. Os dados de um mês de operação produzram a segute taela:,0,,43,,0 0,95, 0,87,43,0 86,9 89,85 90,8 86,34 9,58 87,33 86,9 9,86 95,6 89,86,46,55,55,55,40,5,0 0,99 0,95 0,98 96,73 99,4 98,66 96,07 93,65 87,3 95,00 96,85 85,0 90,56 (a Ajuste um modelo lear aos dados; ( Teste a exstêca da regressão; (c Determe o valor de R para este modelo; (d Determe um IC, de 95%, para o valor da pureza, a hpótese do % de hdrocaroo ser,0%. 6