TLF 00/ Cap. X Covarânca e correlação lnear Capítulo X Covarânca e Correlação Lnear 0.. Valor médo da grandeza (,) 0 0.. Covarânca na propagação de erros 03 0.3. Coecente de correlação lnear 05 Departamento de Físca da FCTUC 0
TLF 00/ Cap. X Covarânca e correlação lnear Covarânca e Correlação Lnear 0.. Valor médo da grandeza (,) Suponhamos que pretendemos determnar a grandeza a partr da medção de duas outras grandezas e, e que azemos meddas de cada uma delas obtendo-se os valores (, ),..., (, ). Para calcular procedemos do segunte modo: calculamos os valores da quantdade (, ),,...,, a partr dos pares (, ),..., (, ) e a partr dos valores,..., calculados, determnamos a méda (melhor estmatva para ), o desvo padrão (ncerteza méda aleatóra nos valores ), e (ncerteza assocada à própra méda). Assumndo que todas as ncertezas são pequenas e que, portanto, todos os valores,..., estão perto de e todos os valores,..., estão perto de podemos usar o desenvolvmento de Talor para duas varáves e azer a segunte apromação: (, ) (, ) ( ) ( ) (0.) esta epressão, as dervadas parcas e são calculadas nos pontos e e têm, portanto, o mesmo valor para todos os,...,. Usando 0. o valor médo de pode escrever-se como: (, ) ( ) ( ) (0.) Esta méda corresponde então à soma de 3 termos. Os termos que envolvem as dervadas parcas são nulos uma vez que, como sabemos, por denção de valor médo a soma de todos os desvos dá zero. Chegamos assm ao resultado, muto smples: ( ), (0.3) ou seja, para determnarmos o valor médo, basta calcular a partr das meddas,...,,, a partr dos,..., e, nalmente, calcular a grandeza (,) no ponto e. Antes de trabalharmos sobre a ncerteza a assocar a, açamos uma breve releão. Departamento de Físca da FCTUC 0
TLF 00/ Cap. X Covarânca e correlação lnear É precso ter em atenção que os pares de meddas (, ),..., (, ) que estveram na base do desenvolvmento anteror correspondem a derentes meddas dos mesmos valores das grandezas. Por eemplo, para um dado comprmento de um pêndulo zeram-se 5 meddas desse comprmento (l) e 5 meddas do tempo de dez osclações completas (t), ou seja, zeram-se 5 medções derentes para determnar o melhor valor para cada uma das grandezas. Se quséssemos determnar a aceleração da gravdade a partr dessas medções segundo a conclusão da relação 0.3, calcularíamos prmero os valores médos do comprmento do pêndulo e do tempo das dez osclações e depos usaríamos esses valores na epressão g 4π. t 0 para determnar a aceleração da gravdade. A questão que se pode pôr agora é: e se as medções ossem de valores derentes das grandezas (por eemplo, de 5 comprmentos derentes do pêndulo e dos correspondentes tempos de osclação) anda se podera proceder do mesmo modo, ou seja, a conclusão 0.3 anda sera válda? ão, neste caso o procedmento não só não tem sentdo como está mesmo ncorrecto, como veremos. Imagne-se, por eemplo, que se suspendem derentes massas conhecdas numa mola e se medem os períodos de osclação do movmento vertcal do sstema molamassa, de orma a determnar a constante elástca da mola através da relação: k mmola m 4π 3. (0.4) T Ora, determnar a méda de todas as massas suspensas, por um lado, e a méda de todos os períodos meddos correspondentes, por outro, não tem sgncado. ão há nenhuma relação das massas entre s, nem dos períodos entre s. É, portanto, ncorrecto determnar o valor de k a partr da relação 0.4 usando esses dos valores médos. O que tem sentdo é utlzar cada par de valores (m,t ) para determnar os derentes k e depos achar a méda desses valores. A relação 0.3 não é sempre válda. 0.. Covarânca na propagação de erros E quando à ncerteza assocada a, como a determnamos? Voltando a trabalhar com os valores,..., obtdos a partr dos pares (, ),..., (, ), a varânca assocada a esses valores calculados é dada, como sabemos, por: ( ). Substtundo e por 0. e 0.3, respectvamente, e desenvolvendo o quadrado, vem: Departamento de Físca da FCTUC 03
TLF 00/ Cap. X Covarânca e correlação lnear Departamento de Físca da FCTUC 04 ( ) ( ) ( ) ( ) ( )( ). os prmeros termos aparecem as varâncas e. O 3º termo é novo e tem uma componente que se desgna por covarânca de e : ( )( ) (0.5) A varânca vem então: (0.6) o capítulo V (Propagação de ncertezas ndependentes e aleatóras) denmos ncerteza assocada à grandeza (,) apenas como. (0.7) A equação 0.6 consttu uma órmula mas completa para o cálculo da ncerteza em pos, ao juntar o termo da co-varânca, permte que a órmula seja aplcada quer as meddas de e sejam ndependentes, quer não. Se as meddas de e orem ndependentes podemos ver aclmente que, depos de mutas meddas, a covarânca de e deve apromar-se de zero. a verdade, nesse caso qualquer que seja o valor de, é tão provável que a quantdade ( ) seja postva como negatva. Assm, depos de mutas meddas, os termos postvos e negatvos em (0.5) devem compensar-se; no lmte de um nº nnto de meddas, o actor /(-) assegura que é nulo. Então, depos de um nº nto de meddas, não será eactamente zero mas espera-se que seja pequeno se os erros em e orem realmente ndependentes e aleatóros. este caso, a ncerteza em é bem avalada pela eq. 0.7. Quando a covarânca não é nula, mesmo no lmte de um nº nnto de meddas, dzemos que as ncertezas em e em estão correlaconadas e nesse caso o erro em deve ser avalado pela relação 0.6. Para eemplos de meddas aparentemente ndependentes mas que se mostram, de acto, como estando correlaconadas veja os eercícos nºs 5 e 6 da Folha de Problemas º 5.
TLF 00/ Cap. X Covarânca e correlação lnear 0.3. Coecente de Correlação Lnear Uma questão que se pode pôr quando temos uma sére de pares de valores meddos (, ),..., (, ) e que o capítulo anteror não abordou, é a de como podemos saber se os resultados das medções estão realmente de acordo com a hpótese de estr uma relação lnear entre e. É claro que as varáves e podem estar relaconadas por equações muto mas compleas do que uma equação lnear mas vamos restrngr as nossas consderações apenas à hpótese de uma relação lnear. Como podemos então avalar se uma sére de meddas (, ),..., (, ) de duas varáves, se adequa à hpótese de e estarem lnearmente relaconados? A noção de covarânca ajudar-nos-á a responder a esta questão. De acto, a partr dos pares de valores (, ),..., (, ) a hpótese de uma relação lnear entre e é avalada através do coecente de correlação lnear dendo como: r. (0.8) ote que os pares de valores que agora consderamos são muto derentes dos reerdos na secção 0.. essa secção consderaram-se meddas do mesmo valor da grandeza e meddas do mesmo valor da grandeza. Agora consderam-se meddas de derentes valores da grandeza e meddas dos correspondentes derentes valores da grandeza. a secção 0., como,, eram medções do mesmo valor, se essas meddas ossem precsas sera pequeno. O mesmo relatvamente às meddas,, e a. esta secção, tanto os,, como os,, correspondem a derentes valores das varáves e, portanto, não há razão para admtrmos que e devam ser pequenos. Substtundo cada parâmetro da denção 0.7 pela sua epressão matemátca, obtemos: r ( )( ) ( ) ( ). (0.9) Vejamos qual o valor esperado para r no caso de sabermos que a relação é lnear. Para tal suponhamos que os pares de pontos (, ) estão todos eactamente sobre a recta A B. este caso, A B para todos os e, portanto, A B. Subtrando as duas últmas equações, vem: B( ) para cada. Inserndo este resultado na eq. 0.8, vem: r ( ) B ( ) B ( ) B B ±, ou seja, se os pontos (, ) estverem peretamente alnhados sobre a recta, r dá ±, sendo a escolha entre o snal postvo ou negatvo determnado pelo declve da lnha, o snal de B. a Folhas de cálculo do tpo Ecel, máqunas de calcular e derentes autores usam também o quadrado do coecente de correlação, r, que é desgnado por coecente de determnação. Departamento de Físca da FCTUC 05
TLF 00/ Cap. X Covarânca e correlação lnear prátca, quando analsamos um conjunto de dados epermentas, não esperamos que r seja eactamente gual a ± mas sm que esteja perto de ± se a relação entre e or lnear. Suponhamos agora que não há relação lnear entre e. Então, qualquer que seja o valor de, é tão provável que cada que acma como abao de. Assm, os termos da no numerador de r, tanto podem ser postvos como negatvos. O soma ( )( ) termo do denomnador, contudo, é sempre postvo. o lmte em que o nº de meddas se aproma de nnto, o coecente de correlação r será zero. a prátca, com um nº nto de meddas não esperamos que r seja eactamente zero mas esperamos que seja pequeno no caso de as duas varáves não estarem relaconadas pela equação de uma recta. Resumndo, r é um número que vara entre - e. Se r estver perto de ±, os pontos estão perto de uma lnha recta; se r está perto de zero, os pontos têm pouca ou nenhuma tendênca para serem ajustados por uma lnha recta. Departamento de Físca da FCTUC 06