TLF 00/ Cap. IX juste dos mínmos quadrados Capítulo IX juste dos Mínmos Quadrados 9.. juste de uma lnha recta a dados epermentas 9 9.. Determnação dos parâmetros da recta, e B (Incertezas apenas em e guas a para todas as meddas) 93 9.3. Cálculo da ncerteza nas meddas 94 9.4. Cálculo das ncertezas assocadas aos parâmetros e B 9.4.. Incertezas em, guas entre s 95 9.4.. Incertezas dferentes em 96 9.4.3. Incertezas em e 97 9.5. juste dos mínmos quadrados a outras curvas: - Função polnomal 98 - Função eponencal 99 - Regressão múltpla 00 Departamento de Físca da FCTUC 9
TLF 00/ Cap. IX juste dos mínmos quadrados juste dos Mínmos Quadrados 9.. juste de uma lnha recta a dados epermentas s eperêncas em Físca consstem geralmente na medção de grandezas em determnadas condções epermentas, a fm de se nvestgar a relação matemátca entre s ou entre essas varáves meddas e outras grandezas com elas relaconadas e não drectamente meddas. Um eemplo realzado nas aulas prátcas de TLF é a medda da tensão aos termnas de uma lâmpada ncandescente e da corrente eléctrca que a percorre a fm de se conhecer a varação da potênca dsspada em função da temperatura da lâmpada. Como já refermos em capítulos anterores, a representação gráfca de grandezas permte vsualzar de forma smples e drecta uma eventual dependênca entre as varáves envolvdas. este capítulo vamos consderar apenas o caso de grandezas entre as quas este uma relação lnear, ou seja, grandezas e relaconadas pela recta + B. Se as medções das grandezas e não estvessem neoravelmente sujetas a ncertezas epermentas, cada um dos pares de pontos (, ) meddos, estara eactamente sobre a recta + B, como mostra a fgura 9.-a). Fgura 9. Recta que melhor se ajusta aos pontos epermentas, no caso de (a) os pontos (, ) não terem erros epermentas; (b) terem erros epermentas. a prátca há ncertezas epermentas e o mámo que podemos esperar é que a dstânca entre cada ponto (, ) e a melhor recta ajustável aos pontos epermentas seja razoável (fgura 9.-b). Uma vez que neste capítulo damos como garantdo que e estão lnearmente relaconadas, então o problema é precsamente encontrar a recta + B que melhor se ajusta aos resultados epermentas, ou seja, encontrar as melhores estmatvas para as constantes e B com base nos dados (, ),..., (, ). Esta questão pode ser abordada grafcamente e pode também ser tratada analtcamente, como faremos, aplcando o prncípo da máma probabldade. este caso, o método analítco para encontrar a recta que melhor se ajusta a uma sére de dados epermentas é desgnado por regressão lnear ou ajuste dos mínmos quadrados. TP6 nálse da radação emtda por uma lâmpada de ncandescênca. Departamento de Físca da FCTUC 9
TLF 00/ Cap. IX juste dos mínmos quadrados 9.. Determnação dos parâmetros da recta, e B (Incertezas apenas em e guas a para todas as meddas) Trata-se, portanto, de encontrar a melhor recta + B que se ajusta aos pontos meddos (, ),..., (, ). Para smplfcar admtremos que a ncerteza na medda de é desprezável. Quanto à grandeza, assumremos que cada é governado por uma dstrbução Gaussana e que as ncertezas nas meddas de têm todas o mesmo valor 3, ou seja, que todas as dstrbuções têm a mesma largura. Se conhecêssemos as constantes e B, poderíamos defnr que para qualquer valor (que consderámos não ter ncerteza assocada) o verdadero valor de sera dado por: (verdadero valor de ) + B. Uma vez que a medda de segue uma dstrbução ormal centrada no seu verdadero valor e com largura, a probabldade de obter o valor, de facto observado, é: Prob,B ( ) ( Y ) ( B ) e e. (9.) Os índces e B lembram que a probabldade depende dos valores (desconhecdos) de e de B. probabldade de obter a nossa sére completa de meddas,, corresponde ao produto: ou seja, onde o epoente é dado por: (,..., ) Prob ( )... ( ) Prob,, B,B Prob, B Prob χ,b χ (,..., ) e, (9.) ( ) B. (9.3) gora, de um modo que já nos é famlar, consderaremos que as melhores estmatvas para as constantes desconhecdas e B são os valores de e B que mamzam a probabldade da eq. 9., ou seja, que mnmzam a eq. 9.3 do χ. Para encontrarmos esses valores de e B, dferencamos a eq. 9.3 relatvamente a e a B, separadamente, e gualamos as dervadas a zero: χ ( B ) 0, (9.4) dmta, para eemplfcar, que os pares de grandezas (, ) são os pares de valores (comprmento do pêndulo (l), período de osclação (T)) necessáros para a determnação da aceleração da gravdade (TP). Se consderar apenas um par (l,t ), lembre-se que medu 5 vezes o mesmo comprmento do fo e 50 vezes o mesmo período. Se os tvesse meddo um número ncontável de vezes obtera uma dstrbução Gaussana tanto para l como para T. Ora esta observação é também verdadera para os outros 4 pares de valores (l,t ) que determnou no mesmo trabalho. 3 Esta apromação é razoável em mutas realzações epermentas. Departamento de Físca da FCTUC 93
TLF 00/ Cap. IX juste dos mínmos quadrados χ B ( B ) 0, (9.5) s duas condções anterores (9.4 e 9.5) dão orgem, respectvamente, às equações:, (9.6) + B B +. (9.7) O sstema formado pelas equações 9.6 e 9.7, por vezes desgnadas por equações normas, pode ser resolvdo de modo a fornecer a estmatva dos mínmos quadrados para as constantes e B: e onde (9.8) B, (9.9). (9.0) Os resultados 9.8 e 9.9 correspondem às melhores estmatvas para as constantes e B da recta + B, baseadas nos pares de ponto meddos (, ),..., (, ). recta resultante é desgnada por recta de ajuste dos mínmos quadrados ou regressão lnear de em. 9.3. Cálculo da ncerteza nas meddas Relembremos que os números,..., correspondem a meddas de realzadas em condções epermentas dferentes (as mesmas dos,..., correspondentes) e, portanto, não são meddas do mesmo número 4. Por sso, não tem sentdo olharmos para os dferentes e analsarmos a dspersão dos valores entre s. pesar dsso, é possível fazermos uma estmatva da ncerteza a partr dos própros pares de valores (, ) meddos. a verdade, segundo o prncípo da máma probabldade, a melhor estmatva para o parâmetro é aquela que mamza a probabldade dada pela equação 9. e, portanto, mnmza o epoente 9.3. Então, dferencando 9.3 relatvamente a e gualando a dervada a zero, obtém-se ( B ). (9.) 4 Usando novamente o eemplo da nota de rodapé nº, nesse trabalho prátco (TP) obtveram-se 5 pares dferentes das grandezas (comprmento do pêndulo (l), período de osclação (T)). Departamento de Físca da FCTUC 94
TLF 00/ Cap. IX juste dos mínmos quadrados Os verdaderos valores dos parâmetros e B da eq. 9. são desconhecdos. Devem, portanto, ser substtuídos pelas melhores estmatvas de e B, dadas pelas equações 9.8 e 9.9. Esta substtução reduz lgeramente o valor de 9. e pode mostrar-se que essa redução é compensada se substturmos o factor do denomnador por. 5 ssm, o resultado fnal para a ncerteza é: ( B ). (9.) É razoável admtrmos a substtução de por se consderarmos a hpótese de termos apenas dos pontos epermentas meddos: (, ) e (, ). Como sabemos, por apenas dos pontos passa uma e uma só recta e o ajuste dos mínmos quadrados fornece precsamente os parâmetros e B dessa recta. ssm, os dos termos da soma no numerador das equações 9. e 9. dão zero. Contudo, com no denomnador obteríamos a resposta absurda 0 (eq. 9.). Com, obtemos a ndetermnação 0/0, o que ndca, correctamente, que não se pode conhecer com apenas dos pares de meddas. É claro que, se for grande, a dferença entre e não é mportante. a verdade, este factor é uma remnscênca do factor que aparece no desvo padrão de meddas de uma mesma quantdade, por eemplo,. esse caso, para calcularmos tvemos prmero que determnar o valor médo. Uma vez que este cálculo relacona os valores meddos que eram, à partda, ndependentes (dz-se que, à partda, estam graus de lberdade), passam a haver apenas valores ndependentes. Podemos assm dzer que, tendo calculado, já só restam graus de lberdade. o presente caso fzeram-se também pares de meddas. Logo, à partda, estam graus de lberdade. Contudo, para se calcular, fo necessáro determnar prevamente as duas quantdades, e B, a partr dos pares de valores. Restam, então, graus de lberdade. Em geral, defne-se nº de graus de lberdade em qualquer passo de um cálculo estatístco como o nº de meddas ndependentes menos o nº de parâmetros calculados a partr desse nº de meddas. Pode demonstrar-se (o que não faremos) que é o nº de graus de lberdade, e não o nº de meddas, que deve aparecer em fórmulas tas como a defnção 9.. 9.4. Cálculo das ncertezas assocadas aos parâmetros e B 9.4.. Incertezas em, guas entre s Tendo encontrado o valor da ncerteza, podemos agora estmar faclmente as ncertezas assocadas aos parâmetros e B. De facto, como as estmatvas de e B são funções bem defndas dos números meddos,..., e,...,, as ncertezas em e B são obtdas por smples propagação de erros. Tendo em conta que os têm ncerteza desprezável e que os vêm afectados por, pode mostrar-se que: (9.3) 5 De facto, se consderarmos a eq. 9.3, vmos que esta função é mínma para os valores de e B obtdos pelas fórmulas 9.8 e 9.9. Departamento de Físca da FCTUC 95
TLF 00/ e que onde, como anterormente, Cap. IX juste dos mínmos quadrados B, (9.4). o caso partcular de uma recta que passa na orgem, ou seja, de B, as equações 9.9, 9. e 9.4 smplfcam-se, dando: B, (9.5) e B ( B ) (9.6). (9.7) 9.4.. Incertezas dferentes em Os resultados apresentados até agora foram baseados na suposção de que só hava ncerteza nos valores epermentas de e que essa ncerteza era gual para todos os. O que acontece se as ncertezas dos forem dferentes? Se conhecermos os dferentes usamos o método dos mínmos quadrados pesados, atrbundo a cada o peso: w. epressão do χ que aparece na probabldade total (eq. 9.) vem, então: χ ( B ) w (9.8) e, aplcando o prncípo da máma probabldade da forma habtual, obtemos todos os parâmetros de nteresse que caracterzam a melhor recta que se ajusta aos dados epermentas: e w w w w (9.9) w w w w B, (9.0) Departamento de Físca da FCTUC 96
TLF 00/ onde Cap. IX juste dos mínmos quadrados w w w. (9.) Por sua vez, as ncertezas defnem-se como e B w (9.) w. (9.3) 9.4.3. Incertezas em e Consderemos prmero o caso de as meddas vrem afectadas de erro mas as meddas não. fgura 9. mostra a melhor recta + B de um ajuste a pontos epermentas e também um ponto partcular meddo (, ), o qual não está sobre a recta devdo à ncerteza que afecta a medda de. partr do mesmo gráfco, podemos perceber que se admtíssemos que a medda de era eacta e tomássemos antes a ncerteza em, o ponto (, ) estara gualmente afastado da recta. Podemos então defnr um erro em equvalente ao erro em e podemos relaconá-los, em ª apromação, pela sére de Talor 6 : d ( equvalente). d Substtundo as ncertezas pelos respectvos desvos padrão vem: d ( equvalente). d (, ) em Fgura 9. O ponto epermental (, ) está desvado da recta devdo ao erro em. 6 + d d! d d ( ) + ( ) +... ; d d Departamento de Físca da FCTUC 97
TLF 00/ Cap. IX juste dos mínmos quadrados Este resultado é verdadero qualquer que seja a curva () mas é partcularmente smples se se tratar de uma lnha recta uma vez que, neste caso, d/d corresponde ao declve da recta, ou seja, à constante B. ssm, para uma recta: ( equvalente) B. (9.4) Em partcular, se todas as ncertezas são guas, o mesmo é verdade para as ncertezas equvalentes. Portanto, o problema de ajustar uma recta aos pontos (, ) com guas ncertezas em e sem ncertezas em é equvalente ao problema de ter guas ncertezas em e nenhuma em. 7 Podemos agora estender este argumento ao caso em que ambas as meddas e têm ncertezas. ncerteza em é equvalente à ncerteza em dada por 9.4. lém dsso, também está sujeto à sua própra ncerteza,. Estas duas ncertezas são ndependentes e os seus quadrados devem ser adconados da forma conhecda para erros ndependentes e aleatóros. ssm, o problema orgnal com ncertezas em e pode ser substtuído por um problema equvalente no qual apenas tem ncerteza dada por: ( equvalente) + ( B ). (9.5) Se as ncertezas forem guas entre s e as ncertezas forem também guas entre s, então as ncertezas resultantes da eq. 9.5 são também guas e podemos usar as fórmulas 9.8 a 9.4. Se, pelo contráro, as ncertezas em e/ou em não são guas, a eq. 9.5 contnua válda mas teremos que usar o método dos mínmos quadrados pesados (equações 9.9 a 9.3). Como vmos, no caso do ajuste de uma recta aos pontos epermentas, o facto de estrem ncertezas em ambas as grandezas e altera pouco a stuação mas smples, de ncertezas apenas nas meddas de. 9.5. juste dos mínmos quadrados a outras curvas Função Polnomal : + B + C +... + n H Para smplfcar, e sem perda de generaldade, consderemos o polnómo: + + B C. 8 (9.6) Como anterormente, suponhamos que temos uma sére de meddas (, ),,,, com os sem ncertezas e os gualmente ncertos. Para cada, o correspondente verdadero valor de é dado pela eq. 9.6, onde, B e C são anda desconhecdos. Consderando que os seguem dstrbuções normas, centradas no verdadero valor correspondente e com a 7 a prátca, os pontos não fcam eactamente sobre a recta e os dos problemas equvalentes não dão eactamente a mesma solução para e B. Contudo, as rectas concordam dentro das ncertezas dadas pelas defnções 9.3 e 9.4. 8 Um eemplo bem conhecdo é o da equação do espaço percorrdo por um corpo em queda lvre: 0 + v 0 t gt Departamento de Físca da FCTUC 98
TLF 00/ Cap. IX juste dos mínmos quadrados mesma largura, a probabldade de obter os valores observados,, é, à semelhança do procedmento usado nas secções anterores: onde χ Prob χ (,..., ) e, (9.7) ( B ) C. (9.8) plcando o prncípo da máma probabldade, dervando o epoente e gualando a zero, obtemos as seguntes equações: + B + C 3 + B + C 3 4 + B + C. (9.9) Etrando os parâmetros, B e C do sstema de equações 9.9 obtém-se o ajuste polnomal dos mínmos quadrados ou a regressão polnomal. 9 Função Eponencal: B e (9.30) Para podermos determnar as constantes e B recorrendo ao prncípo da máma probabldade, transformamos a eq. 9.30, não lnear, numa relação lnear entre e, à qual sabemos depos aplcar o ajuste dos mínmos quadrados. Escolhemos então a transformação fazendo prmero e depos ( ) (, z ),, ln ln + B z ln + B. (9.3) O método dos mínmos quadrados dá-nos a melhor estmatva para as constantes ln (de onde etraímos ) e B. Repare-se que mesmo quando as ncertezas em são guas, as ncertezas em z não o são, uma vez que: dz z. d Em rgor, deveríamos usar, portanto, o método dos mínmos quadrados pesados. a prátca, mutas vezes a dspersão das ncertezas em z não é grande e torna-se razoável assumr ncertezas guas em z, aplcando então o método normal. 9 Em prncípo, um método semelhante pode ser aplcado a qualquer função f() que dependa de parâmetros desconhecdos, B, etc. Embora alguns casos possam ser compleos, são sempre resolúves aqueles que correspondam a funções que dependem lnearmente dos parâmetros, B, etc, como é o caso, por eemplo, de sn + Bcos. Departamento de Físca da FCTUC 99
TLF 00/ Cap. IX juste dos mínmos quadrados Regressão Múltpla té aqu consderámos apenas a relação entre varáves. E se estrem mas? Recordemos, por eemplo, a equação dos gases deas PVnRT, onde se relaconam as três grandezas pressão (P), volume (V) e temperatura (T). Consderemos a relação geral entre z, e : z + B + C (9.3) e admtamos, para smplfcar, que numa sére de meddas (,, z ), com,,, os e são eactos e os z têm assocadas guas ncertezas. plcando o prncípo da máma probabldade, como anterormente, concluímos que as constantes, B e C podem ser determnadas a partr do sstema de equações: + B + C + B + C + B + C z z z. (9.33) Este método é conhecdo por regressão múltpla. Departamento de Físca da FCTUC 00