TLF 00/ Cap. XI Teste do Capítulo XI Teste do Qu-quadrado ( ).. Aplcação do teste do a uma dstrbução de frequêncas 08.. Escolha de ntervalos para o teste do.3. Graus de lberdade e reduzdo.4. Tabela de probabldades do reduzdo 3.5. Aplcação do teste do ao ajuste de uma função 5 Departamento de Físca da FCTUC 07
TLF 00/ Cap. XI Teste do Teste do Embora não tenha havdo tempo para apresentarmos outras dstrbuções com nteresse em Físca além da dstrbução normal ou Gaussana [] vamos, contudo, reflectr sobre o modo como podemos avalar a dstrbução teórca que melhor se ajusta a uma determnada dstrbução expermental de frequêncas. Para realzarmos essa avalação de modo quanttatvo apresentaremos um parâmetro de mérto, o qu-quadrado, que será também utlzado na avalação da qualdade do ajuste de uma dada função teórca aos dados expermentas. O teste do é um dos testes mas mportantes no que se refere à frequênca de uma dada medda e à valdade de um ajuste... Aplcação do teste do a uma dstrbução de frequêncas Para facltar a apresentação, consderaremos um exemplo concreto. Suponhamos que realzamos 00 meddas t,..., t 00 do tempo que um dsco leva a descer uma determnada rampa nclnada, sem velocdade ncal e em condções de ausênca de atrto. Os resultados das meddas são apresentados na tabela.. Admtmos, à partda, que estes resultados seguem uma dstrbução normal ou Gaussana, Gt, σ t () t, mas queremos avalar se essa hpótese é razoável. Para tal devemos calcular como esperaríamos que os 00 resultados estvessem dstrbuídos se correspondessem, de facto, a uma dstrbução normal e comparar esses resultados com os expermentalmente obtdos. Tabela. Valores meddos de t (s), 0,85 0,88 0,87 0,94 0,78 0,93 0,87, 0,78 0,93, 0,93,06 0,9 0,88 0,94 0,7 0,75 0,9 0,88 0,97 0,7 0,8 0,94 0,89 0,9 0,8 0,7 0,86 0,78 0,77 0,75 0,9 0,78 0,88 0,8 0,83 0,9 0,88 0,97 0,84 0,7 0,8 0,97 0,89 0,7 0,9 0,94 0,88 0,88 0,85 0,84 0,83,03 0,78 0,85 0,94 0,85 0,84 0,8 0,97 0,97 0,97 0,84 0,8 0,9 0,84 0,87 0,8 0,79 0,95 0,97 0,8 0,94 0,84 0,8 0,87 0,93 0,87 0,87 0,9 0,8 0,87 0,84 0,87 0,68 0,9 0,93 0,75 0,7 0,87 0,8 0,8 0,8 0,88 0,97 0,8 0,85 0,84 0,96 0,95 0,84 0,85 0,75 0,94 0,9 0,88 0,75 0,9 0,87 0,75 0,95 0,78 0,88 0,88 0,9 0,8 0,9 0,7 0,9 0,87 0,75 0,84 0,84 0,8 0,77 0,87 0,75 0,7 0,9 0,75 0,9 0,84 0,94 0,88 0,83 0,94 0,85 0,88 0,94,03 0,9 0,80 0,96 0,76 0,9 0,96 0,8 0,84 0,88 0,93 0,94 0,84 0,8 0,87 0,88 0,87 0,87 0,8 0,75 0,88 0,7 0,95 0,75 0,85 0,84 0,78 0,96 0,75 0,9 0,78 0,95 0,88 0,88 0,8 0,79 0,84 0,84 0,84 0,96 0,84 0,9 0,97 0,9 0,85 0,97 0,78 0,78 0,75 0,8 0,84 0,84 0,75 0,88 0,77 A partr dos dados da Tabela., começamos por calcular os dos parâmetros necessáros para defnr a dstrbução esperada, ou seja, o valor médo e o desvo padrão: t t 00 0.8644 s e ( ) t t σ 99 0.08 s t. [] Anda que muto resumdamente, apresentam-se em apêndce as dstrbuções Bnomal e de Posson. Departamento de Físca da FCTUC 08
TLF 00/ Cap. XI Teste do Sendo o tempo meddo t uma varável contínua, não podemos consderar o nº esperado de meddas de um determnado valor de t. Em vez dsso, devemos ter em conta o nº esperado de meddas num dado ntervalo de valores de t: a < t < b. Vamos então dvdr os valores possíves em n ntervalos de valores. Os ntervalos escolhdos são mostrados na tabela. e na fgura.. Defndos os ntervalos, contamos o n o de meddas (O ) que ca (observado) em cada ntervalo. Intervalo Tabela. Lmtes do ntervalo (s) t O (nº de meddas observadas no ntervalo ) t t σ (t 0.78) 38 t σt < t t (0.78 < t 0.8644) 58 3 t < t t + σt (0.8644 < t 0.9467) 74 4 t > t + σ (t > 0.9467) 30 t Em seguda, vamos calcular o nº de meddas E que sera esperado que caísse em cada ntervalo. O cálculo dos E é bastante rápdo pos, como sabemos, a probabldade de qualquer medda car num ntervalo a < x < b é a área delmtada pela função de Gauss entre os pontos x a e x b. Neste exemplo, tendo defndo 4 ntervalos, devemos consderar as 4 probabldades (Prob, Prob, Prob 3 e Prob 4 ) correspondentes às áreas defndas na fgura.. Fgura. Áreas delmtadas pela função Gaussana e pelos lmtes dos n ntervalos. As duas áreas Prob e Prob 3 correspondem à conhecda quantdade 68%. Portanto, Prob Prob 3 0.34. As outras duas probabldades correspondem à quantdade remanescente (3%) e, portanto, Prob Prob 4 0.6. Para encontrarmos os n os esperados E temos apenas de multplcar as probabldades pelo nº total de meddas N, neste caso 00. Os resultados são mostrados na Tabela.3. Intervalo Probabldade (Prob ) Tabela.3 E (nº de meddas esperadas no ntervalo N Prob ) 0.6 3 38 0.34 68 58 3 0.34 68 74 4 0.6 3 30 O Para avalarmos a justeza da nossa hpótese, ou seja, avalarmos se a dstrbução de frequêncas expermental é bem ajustada por uma dstrbução de probabldades Gaussana vamos analsar os desvos (O E ). Departamento de Físca da FCTUC 09
TLF 00/ Cap. XI Teste do Tabela.4 Intervalo O E O E 38 3 6 58 68-0 3 74 68 6 4 30 3 - A tabela.4 mostra os desvos (O E ) e coloca-nos perante a questão de sabermos se as dferenças (O E ) são sufcentemente pequenas para podermos consderar que a dstrbução é, de facto, Gaussana. Para calbração desse ajuste vamos então adoptar um número de mérto desgnado por qu-quadrado. Ao longo dos últmos capítulos, a defnção de apareceu váras vezes e em todos os casos correspondeu a uma soma de quadrados de fórmula geral: N valor observado valor esperado. desvo padrão No presente caso, este nº é extraído da comparação dos dados expermentas com os valores prevstos pela dstrbução esperada e que é dado pelo somatóro (desde até ao nº total de ntervalos n): n ( O E ). (.) E Embora não seja possível dar aqu uma justfcação cabal da fórmula., a sua plausbldade para avalar a qualdade de um ajuste pode compreender-se se escrevermos a gualdade. como n O E E E. (.) Como se pode perceber, o número do tem em conta o valor dos desvos relatvos O E E pesados pelo valor esperado correspondente. Através deste peso, atrbu-se um maor sgnfcado aos desvos relatvos dos valores com maor probabldade. Por exemplo, no caso da dstrbução Gaussana é de atrbur maor sgnfcado aos desvos relatvos junto ao máxmo (valor central da Gaussana), do que a valores nas suas caudas, onde o desvo relatvo tende a ser grande uma vez que os valores da probabldade são pequenos. O nº do consttu um ndcador razoável para verfcarmos o acordo entre a dstrbução observada e a esperada. Se 0, o acordo é perfeto, embora essa stuação seja altamente mprovável. Em geral, espera-se que cada termo da soma seja da ordem de [] e,, [] Isto sgnfca que se espera que as dferentes meddas regstadas em O tenham como valor médo E, flutuando em torno desse valor com um desvo padrão da ordem de E. Esta conclusão compreende-se Departamento de Físca da FCTUC 0
TLF 00/ Cap. XI Teste do portanto, como haverá n termos (n ntervalos), em que a hpótese é verfcada expermentalmente. Pelo contráro, hpótese estava ncorrecta. n. Esta corresponderá então à stuação >> n sgnfcará que a No nosso exemplo: n ( O E ) ( 6) ( 0) ( 6) ( ) + + + 3 68 68 3. +.47 + 0.53 + 0. 3.4 E que é um valor menor do que 4, não havendo, portanto, razão para duvdar da valdade da hpótese proposta. As secções.3 e.4 completarão consderações mportantes a ter em conta sobre o crtéro de ajuste do... Escolha de ntervalos para o teste do O resultado n ( O E ) é geral e pode ser aplcado a mutas experêncas E dferentes. Uma questão que devemos agora abordar é saber qual o procedmento que devemos segur para escolher o nº de ntervalos adequado à realzação do teste do. Essa escolha depende do tpo de experênca e, em partcular, da grandeza x medda ser de natureza contínua ou dscreta. Apresentam-se a segur algumas consderações sobre este aspecto. Caso de uma varável contínua Seja qual for a dstrbução de frequêncas esperada, f(x), a área total crcunscrta pelo gráfco de f(x) em função de x deve valer (condção de normalzação) e a probabldade de obtermos uma medda entre x a e x b corresponderá à área entre a e b, que é dada, como sabemos por: b ( a < x < b) f ( x) Prob dx. Então, se o ntervalo for crcunscrto por x a e x a +, o nº esperado de meddas no ntervalo (para um total de N meddas realzadas) é a E ( a < x < a ) N Prob + a + a ( x) N f dx. melhor assemelhando o resultado a uma experênca de contagens do tpo descrto por uma dstrbução de Posson (ver defnção de dstrbução de Posson no Apêndce). Departamento de Físca da FCTUC
TLF 00/ Cap. XI Teste do O nº de meddas E esperado em cada ntervalo não deve ser muto pequeno. Embora não haja lmte nferor, E deve ser maor ou gual a 5: E 5. Por outro lado, o nº de ntervalos não deve ser nferor a 4, tal como no exemplo que consderámos acma. Desta forma, concluremos que, para aplcarmos o teste do qu-quadrado a uma dstrbução de frequêncas de forma útl, o nº de meddas realzadas não deve ser nferor a 0. Caso de uma varável dscreta Suponhamos que medmos uma varável dscreta ν, como por exemplo, o nº de vezes que sa o algarsmo quando jogamos cnco dados. Neste caso, os valores possíves para ν são 0,,, 3, 4 e 5 e não é necessáro agregarmos os valores em ntervalos. Ou melhor, escolhemos 6 ntervalos mas cada um deles contém apenas um valor possível. Contudo, por vezes acontece ser necessáro agruparmos város resultados possíves no mesmo ntervalo. Por exemplo, se atrarmos os mesmos 5 dados 00 vezes, de acordo com o cálculo das probabldades que rege este tpo de acontecmentos [3], a dstrbução dos resultados esperada sera a apresentada na ª coluna da tabela.5. Como podemos verfcar, os valores esperados para a probabldade de sar 4 ou 5 vezes o nº é de apenas 0.6 e 0.03. Estes ntervalos não estão, portanto, em stuação adequada à aplcação do teste do qu-quadrado. Devemos, então, reagrupar os resultados ν 3, 4 e 5 num únco ntervalo, fcando no total com n 4 ntervalos, como se mostra na 4ª coluna, com os E fnas. Defndos os ntervalos procedemos como anterormente, ou seja, contamos as ocorrêncas observadas O em cada ntervalo, determnamos (O E ) e calculamos o, avalando a partr dele se as dstrbuções esperada e medda concordam [4]. Tabela.5 Nº de dados em que sa o nº E Intervalo E fnal 0 80.4 80.4 80.4 80.4 3. 3 3. 3 6.4 4 0.6 4 7.0 5 0.03.3. Graus de Lberdade e reduzdo Na secção., comparámos o parâmetro com o nº de ntervalos em que dvdmos os nossos dados. Contudo, mostra-se que um procedmento mas correcto é compará-lo com o nº de graus de lberdade, d, do cálculo estatístco. Como já refermos, num cálculo estatístco o nº de graus de lberdade é defndo como o nº de dados observados menos o nº de parâmetros obtdos a partr desses dados e usados nos cálculos. No exemplo do dsco que desce o plano nclnado, regstámos os n os O que caem nos n ntervalos,, n. Portanto, o nº de dados observados é apenas n, o nº de ntervalos. O nº de graus de lberdade é dado por d n c, [3] A dstrbução bnomal, que pode ser consultada no apêndce [4] Como nesta experênca sabemos que a dstrbução medda é certamente uma dstrbução bnomal B 5,/6 (ν), o teste do acaba por ser um modo de saber se os dados são verdaderos ou se estão falseados. Departamento de Físca da FCTUC
TLF 00/ Cap. XI Teste do sendo c o nº de parâmetros que tveram que ser calculados para determnarmos os n os E esperados. Este valor c é frequentemente desgnado por número de constrangmentos e vara com o tpo de experênca. No caso de dstrbuções de frequênca devemos ter em conta que exste sempre o constrangmento assocado à condção de normalzação da dstrbução. Tempo de descda de um dsco Exemplos Os dados foram agrupados em 4 ntervalos. Logo, n 4. Nessa experênca, para determnar a dstrbução Gt, σ t () t calculámos t e σ t. Além dsso, a dstrbução fo normalzada. Assm, o nº total de constrangmentos fo, portanto, de 3. O nº de graus de lberdade é então: d 4 3. Este resultado explca porque não podemos usar um nº de ntervalos nferor a 4. Quando n é elevado, a dferença entre n e d não é mportante, mas quando n é pequeno (o que acontece mutas vezes), percebe-se como é mportante esta dferença. Lançamento de 5 dados e regsto do nº de vezes em que sa o número. Nesta experênca, onde estamos a testar a hpótese dos dados serem verdaderos, a dstrbução esperada do nº de vezes ν que sa o número é a dstrbução bnomal B 5,/6 (ν), onde ν 0,,, 3, 4 ou 5. Ambos os parâmetros desta função, o nº de dados (5) e a probabldade de sar o número num dado (/6), são conhecdos à partda e não têm que ser calculados a partr dos dados expermentas. A dstrbução deve ser normalzada e como vmos na tabela.5, os dados foram agrupados em 4 ntervalos e, portanto, n 4. Então, neste caso, c e d 4 3 e há, portanto, 3 graus de lberdade. Prova-se que o valor esperado para é exactamente d, ou seja, o nº de graus de lberdade. Uma forma mas convenente de avalar o é usar o reduzdo ou normalzado, que aqu representaremos por ~ : ~, d sendo ~ o valor esperado para o qu-quadrado reduzdo..4. Tabela de probabldades do reduzdo Voltemos à experênca do dsco que deslza sobre o plano nclnado sem atrto. Vmos que 3. e como para esta experênca d, o reduzdo vale também 3.. Será este um valor acetável para conclurmos que a experênca é bem ajustada por uma dstrbução Gaussana? O procedmento geral é o segunte: depos de completarmos qualquer sére de meddas, calculamos o normalzado, regstando-o como ~ O, uma vez que é o que resulta drectamente das nossas observações. Depos, consderando que as nossas meddas seguem Departamento de Físca da FCTUC 3
Cap. XI Teste do TLF 00/ uma determnada dstrbução (a dstrbução esperada), calculamos a probabldade de O : maor ou gual a ~ encontrarmos um valor de ~ Prob (~ ~ O ). ( ) Tabela.6 Probabldade percentual Prob ~ ~ O de obter um valor de ~ ~ O numa experênca com d graus de lberdade. Os espaços em branco correspondem a probabldades nferores a 0.05%. ~ O é o valor do qu-quadrado reduzdo (ou normalzado) observado. Departamento de Físca da FCTUC 4
TLF 00/ Cap. XI Teste do Se esta probabldade for elevada, o nosso valor de ~ O é perfetamente acetável e não há razão para rejetarmos a dstrbução esperada. Se a probabldade for muto baxa, um valor de ~ da ordem do nosso ~ O observado é mprovável e, por sso, é-o também a correspondênca entre a dstrbução esperada e a expermental. Uma frontera possível é o nível de confança de 5% que já usámos noutros contextos. Assm, uma ( ~ ~ Prob O ) < 5% ndcara um desacordo sgnfcatvo. Se o nível de confança estabelecdo for de % então uma ( ~ ~ Prob O ) < % ndcara um desacordo altamente sgnfcatvo. O cálculo das Prob ( ~ ~ O ) é complexo para o âmbto desta dscplna, mas os resultados estão tabelados e podem ser encontrados faclmente na lteratura da especaldade. As percentagens da probabldade de obtermos um valor de ~ maor ou gual a um valor partcular ~ O para certo nº de graus de lberdade d são apresentadas na tabela.6. Os espaços em branco ndcam probabldades nferores a 0.05%. Por exemplo: para d 0 graus de lberdade, a probabldade de obter um ~ é gual a.9%. Portanto, se tvéssemos obtdo um reduzdo de numa experênca de 0 graus de lberdade, concluríamos que as nossas observações dferam sgnfcatvamente da dstrbução esperada, tendo em conta um nível de confança de 5%..5. Aplcação do teste do ao ajuste de uma função Este é o caso que geralmente mas nos nteressa, nomeadamente quando pretendemos avalar a qualdade do ajuste de determnadas funções aos dados recolhdos no âmbto de trabalhos laboratoras. O racocíno a fazer segue de muto perto o anterormente utlzado para a avalação da qualdade do ajuste de uma dstrbução. Fgura. Representação da função y f(x) ajustada a N pares de valores (x,y ) (não representados). As meddas dos x têm ncerteza desprezável e as dos y têm dstrbução Gaussana centrada em Y e com ncerteza σ. Os pontos (x,y ) são, portanto, os pontos ajustados (sobre a curva de ajuste) aos pontos (x,y ). Consderemos uma stuação em que medmos duas grandezas expermentas, x e y, e esperamos que haja uma determnada relação funconal entre elas, y f(x). Suponhamos que foram fetos N pares de meddas (x,y ) onde os x têm ncerteza desprezável e os y têm Departamento de Físca da FCTUC 5
TLF 00/ Cap. XI Teste do dstrbução Gaussana centrada no valor esperado Y f(x ) e ncerteza σ (Fgura.). Podemos então testar até que ponto a função y f(x) se ajusta aos valores (x,y ) através de: N y f σ x ( ). (.3) Para tornar mas claro o procedmento de aplcação do teste do, consderaremos o resultado de medções da corrente eléctrca que atravessa uma lâmpada de ncandescênca e da dferença de potencal aos seus termnas, no regme em que a lâmpada está acesa (emte radação). Os N 0 valores meddos são apresentados na tabela.7 e o gráfco da ddp em função da corrente eléctrca está representado na fgura.3. O mesmo gráfco apresenta também o ajuste de uma recta de equação y A + Bx aos pontos expermentas. Tabela.7 I (A) V±0,0 (V) I (A) V±0,0 (V) 0,0847,8 0,53 3,8 0,093,53 0,590 4,09 0,003,76 0,63 4,4 0,083,03 0,683 4,53 0,38, 0,77 4,74 0,3,54 0,786 5,04 0,79,75 0,87 5,5 0,356 3,07 0,883 5,55 0,400 3,5 0,93 5,76 0,466 3,53 0,967 6,00 Para avalação da qualdade do ajuste procede-se do segunte modo: Ajusta-se a recta y A + Bx aos N pontos expermentas representados na fgura.3 utlzando o método dos mínmos quadrados (regressão lnear). As ncertezas assocadas à medda da corrente foram desprezadas e apenas foram tdas em conta as ncertezas na tensão eléctrca (± 0,0 V). Obteve-se a recta representada no gráfco, de equação y -.6 + 4.6x. (Não foram determnadas as ncertezas assocadas aos parâmetros A e B por não serem ndspensáves no que segue.) Determnou-se (para comparação) o parâmetro coefcente de correlação lnear, usando a defnção 0.9 do capítulo anteror: r ( x x)( y y) ( x x) ( y y). Obteve-se o valor r 0.997, ndcando a exstênca de uma correlação de tpo lnear entre a ddp e a corrente eléctrca. Conhecdos os melhores valores para os parâmetros A e B, determnou-se o parâmetro através da fórmula.3, onde a função de ajuste f(x) fo substtuída por A + Bx: Departamento de Físca da FCTUC 6
TLF 00/ Cap. XI Teste do N y ( A + ) Bx σ. A soma fo feta sobre os 0 pares de valores meddos (x,y ), e o σ assocado a cada y fo tomado como o erro de 0.0 V acma referdo. 3 O valor do obtdo fo depos dvddo pelo nº de graus de lberdade dando orgem ao qu-quadrado reduzdo. Aos 0 pares de valores meddos subtraíram-se constrangmentos (uma vez que o cálculo do depende da determnação anteror dos parâmetros A e B). O nº de graus de lberdade fo, portanto, de 8. Repare-se que, embora o parâmetro r fosse bom, o valor elevado do reduzdo (55.7) ndca um mau ajuste de uma recta aos dados expermentas. 7,00 6,00 5,00 y 4,6x -,6 r 0,997 red 55,7 V (V) 4,00 3,00,00,00 0,07 0,09 0, 0,3 0,5 0,7 0,9 0, I (A) Fgura.3 Gráfco da ddp aos termnas da lâmpada de ncandescênca em função da corrente eléctrca que a percorre. A lnha contínua corresponde à recta de ajuste y A + Bx. O procedmento anteror fo então repetdo mas tentando ajustar uma equação dferente aos dados expermentas. B Ajustou-se a curva y Ax aos pontos expermentas da tabela.7, agora representados na fgura.4, tendo-se obtdo a relação y 7.7x.8. Com base nos valores de A e B obtdos a partr do ajuste, determnou-se o parâmetro através de: N B ( ) y Ax σ, Departamento de Físca da FCTUC 7
TLF 00/ Cap. XI Teste do onde a soma fo feta sobre os 0 pares de valores meddos (x,y ) e como σ assocado a cada y fo tomado o erro de 0.0 V. 3 O valor do obtdo ( 6.7) fo depos dvddo pelo nº de graus de lberdade dando orgem ao qu-quadrado normalzado. Aos 0 pares de valores meddos subtraíram-se constrangmentos, uma vez que o cálculo do depende da determnação anteror dos parâmetros A e B. O nº de graus de lberdade fo, portanto, de 8, tendo-se obtdo ~.5. Consultando a tabela.6 para d 8 graus de lberdade, vê-se que a ( ~ ~ ) Prob ( ~ Prob O.5) 8. 6, sgnfcando que não há desacordo sgnfcatvo entre a curva ajustada e os pontos expermentas (para um nível de confança 5%) e que, portanto, a curva pode ser tomada como uma boa representação da relação entre a ddp aos termnas da lâmpada e a corrente que a percorre. 7,0 6,0 5,0 y 7,7x,8 6,7 red,5 V (V) 4,0 3,0,0,0 0,07 0,09 0, 0,3 0,5 0,7 0,9 0, Fgura.4 Gráfco da ddp aos termnas da lâmpada de ncandescênca em função da corrente eléctrca que a percorre. A lnha contínua corresponde à curva de ajuste y Ax B. I (A) Antes de fnalzarmos este capítulo, repare-se que se calcularmos o valor de σ y ( y A Bx ) defndo no capítulo IX, e que caracterza a dspersão dos N valores y relatvamente à função ajustada, encontramos o valor σ y 0. V. Este valor é bastante superor ao erro assumdo à partda em cada valor y (0.0 V). Se agora calcularmos o B valor de σ y ( y Ax ) para avalar a dspersão destes valores relatvamente à N B curva y Ax encontramos σ y 0. 005V, desta vez nferor à dspersão assocada a cada medda ndvdual. Como se depreende, este parâmetro também é sensível à qualdade do ajuste. Departamento de Físca da FCTUC 8