Probabldade e Estatístca Correlação e Regressão Lnear
Varáves Varável: característcas ou tens de nteresse de cada elemento de uma população ou amostra Também chamada parâmetro, posconamento, condção... Duas varáves estão relaconadas se a mudança de uma provoca a mudança na outra. Exemplo: velocdade x consumo combustível
Correlação Correlação entre duas varáves Quando uma delas está, de alguma forma, relaconada com a outra. Quando a alteração no valor de uma varíavel (dta ndependente) provoca alterações no valor da outra varável (dta dependente)
Dagramas de Dspersão Um dagrama de dspersão mostra a relação entre duas varáves quanttatvas, meddas sobre os mesmos ndvíduos. Os valores de uma varável aparecem no exo horzontal, e os da outra, no exo vertcal. Comumente, coloca-se no exo x um parâmetro Cada ndvíduo aparece como o ponto do gráfco defndo pelos valores de ambas as varáves para aquele ndvíduo
Exemplos Fabrcação Número de peças produzdas e número de peças defetuosas Construção Número de falhas em uma obra e a satsfação méda dos construtores Das de atraso de entrega x número de das chuvosos Fnancero Méda de tempo de atraso de pagamento e número de erros de fatura Vendas % de móves venddos na data de entrega da obra x satsfação méda dos clentes nos últmos 10 empreendmentos.
Exemplo - Peso x altura Peso (kg) Altura (m) 80 1,80 85 1,83 50 1,65 70 1,90 55 1,60 77 1,80 85 1,78 93 1,86 65 1,70 60 1,65 Altura Peso x Altura 1,95 1,9 1,85 1,8 1,75 1,7 1,65 1,6 1,55 40 50 60 70 80 90 100 Peso
Exemplo Peso x Altura Estratfcando... Peso (kg) Altura homens (m) Altura Mulheres (m) 80 1,80 --- 85 1,83 50 --- 70 --- 55 --- 77 1,80 85 --- 93 1,86 65 1,70 60 --- --- 1,65 1,90 1,60 --- 1,78 --- --- 1,65 Pesos 110 90 70 50 30 10 Peso x Altura (por sexo) Homens Mulheres 1,5 1,6 1,7 1,8 1,9 Alturas
Dcas Exo x Varável que é alterada por uma modfcação no processo (varável ndependente) Geralmente uma possível causa de um problema Exo y Varável que pode mudar de acordo com a mudança da varável em x (varável dependente) Geralmente um ndcador de qualdade ou efeto gerado por uma causa.
Analsando Dagramas de Dspersão Os aspectos abaxo são relevantes na análse dos Dagramas: DIREÇÃO (crescente, decrescente) FORMA (lnear, não-lnear, aglomerados) PONTOS DISCREPANTES
Interpretando Padrões de Dspersão Quanto maor a correlação, mas próxma de uma reta a 45 o ou 135 o será a dstrbução.
Interpretando Grau de Relaconamento Escala?...
Problemas da Análse Gráfca A análse gráfca da relação entre varáves é mportante, mas os olhos nem sempre são um bom juz da ntensdade de uma relação lnear. Os dagramas a segur lustram precsamente os mesmos dados, mas o gráfco nferor é menor em um campo mas amplo (escala dferente).
Problemas da Análse Gráfca Nossos olhos podem ser enganados por uma mudança de escalas, ou pela quantdade de espaço em branco em torno do aglomerado dos pontos. Deve-se, então, utlzar uma medda numérca para suplementar o gráfco. Coefcente de Correlação Lnear (r)
Coefcente de Correlação Lnear r mede o grau de relaconamento lnear entre valores emparelhados x e y em uma amostra. Mede a ntensdade e a dreção da relação lnear entre duas varáves quanttatvas. Chamado também de Coefcente de Correlação de Pearson (Karl Pearson, 1857-1936).
Coefcente de Correção Lnear ou Coefcente de Pearson = = n xx x x S 1 ) ( = = n yy y y S 1 ) ( = = n xy y y x x S 1 ) )( ( S xx S yy Sxy r. = -1 r 1 = ) ( ) ( xx x x n S = ) ( ) ( yy y y n S ) )( (. = xy y x y x n S
Coefcente de Correção Lnear ou Coefcente de Pearson ( ) ( )( ) ( ) ( ) 1 1 = r y y n x x n y x y x n r
Interpretando o Coefcente de Correlação Lnear r sempre será um valor entre -1 r 1 Quanto mas próxmo de 1: maor correlação negatva Quanto mas próxmo de 1: maor correlação postva Quanto mas próxmo de 0: menor a correlação lnear
Interpretação do Valor de r valor de r -1 0 +1 correlação negatva forte correlação negatva fraca ausênca de correlação correlação postva fraca correlação postva forte
Propredades do Coefcente de Correlação de Pearson -1 r +1 O valor de r não vara se todos os valores de qualquer uma das varáves são convertdos para uma escala dferente. O valor de r não é afetado pela escolha de x ou y. Permutando x e y, r permanece nalterado. r: só mede a ntensdade ou grau de relaconamentos lneares. Não serve para medr ntensdade de relaconamentos nãolneares.
Ex.: Alturas e Pesos de Ursos Sberanos Comprmento (pol.) Peso (lb.) x y x.y x y 53,0 80 4.40.809,00 6.400 67,5 344 3.0 4.556,5 118.336 7,0 416 9.95 5.184,00 173.056 7,0 348 5.056 5.184,00 11.104 73,5 6 19.57 5.40,5 68.644 68,5 360 4.660 4.69,5 19.600 73,0 33 4.36 5.39,00 110.4 37,0 34 1.58 1.369,00 1.156 Totas 517.176 151.879 34.55,75 78.50
Ex.: Alturas e Pesos de Ursos Sberanos r = r = = n n x ( x ) ( )( ) y x y ( ) x n y ( y ) 8(151.879) (516,5)(.176) 8(34.55,75) (516,5) 91.18 = 0,897 9433,75 1.093.184 8(78.50) (.176) =
Reta de Regressão Lnear Dferentes retas podem ser traçadas, a olho nu, e um dagrama de dspersão Cada pessoa terá uma tendênca dferente Nenhuma reta passará exatamente por todos os pontos (se a correlação não for máxma) Precsamos encontrar uma reta que esteja tão próxma dos pontos quanto possível Os erros de predção para a reta são erros em y (dreção vertcal)
Reta de Regressão Lnear Se um dagrama de dspersão sugere uma relação lnear, é de nteresse representar este padrão através de uma reta Usa-se o método dos mínmos quadrados para ajustar uma reta de regressão ao conjunto de pontos do dagrama A reta de regressão descreve como uma varável resposta (dependente) y vara em relação a uma varável explanatóra (ndependente) x
Varáves Varável resposta (y) (dependente) Mede um resultado em um estudo Varável explanatóra (x) (ndependente) Procura explcar os resultados observados Varável ndependente (x) Temperatura do forno ( o C) Quantdade de adtvo (%) Renda (R$) Memóra RAM (GB) Varável dependente (y) Resstênca mecânca da cerâmca (MPa) Octanagem da gasolna Consumo (R$) Tempo de resposta do sstema (s)
Defnção Dada uma coleção de dados amostras emparelhados, a segunte equação de regressão descreve a relação entre as duas varáves ŷ = α + β O gráfco da equação é chamado reta de regressão (ou reta de melhor ajuste, ou reta de mínmos quadrados) x
Defnção β = α = α = ŷ = α + β x ( ) ( )( ) ( ) ( ) n x x n x y x y ( )( y ) ( )( ) x x xy ( ) ( ) n x x y β n x β: coefcente angular α: ponto onde a reta ntercepta exo y
Exemplo Consdere um expermento em que se analsa a octanagem da gasolna (Y) em função da adção de um adtvo (X). Para sto, foram realzados ensaos com os percentuas de 1,, 3, 4, 5 e 6% de adtvo. Os resultados seguem.
Exemplo X Y 1 80,5 81,6 3 8,1 4 83,7 5 83,9 6 85,0 Índce de Octanagem 85,5 85,0 84,5 84,0 83,5 83,0 8,5 8,0 81,5 81,0 80,5 80,0 0 1 3 4 5 6 7 Quantdade de Adtvo (%)
Exemplo Calculando a equação de regressão... x y x x y 1 80,5 1 80,5 81,6 4 163, 3 8,1 9 46,3 4 83,7 16 334,8 5 83,9 5 419,5 6 85,0 36 510,0 Soma 1 496,8 91 1.754,3 6(1754,3) (1)(496,8) 93 β = = = 6(91) (1) 105 496,8 (0,886)(1) α = = 79,7 6 yˆ = 79,7 + 0,886x 0,886
Exemplo yˆ = 79,7 + 0, 886x Índce de Octanagem 85,5 85,0 84,5 84,0 83,5 83,0 8,5 8,0 81,5 81,0 80,5 80,0 0 1 3 4 5 6 7 Quantdade de Adtvo (%)