Tratamento estatístico de observações Prof. Dr. Carlos Aurélio Nadal OBSERVAÇÃO: é o valor obtido durante um processo de medição. DADO: é o resultado do tratamento de uma observação (por aplicação de uma técnica ou de um modelo matemático) para retirada de erros. INFORMAÇÃO: é o resultado do tratamento de dados (via modelo matemático/estatístico).
é o valor de uma grandeza. é o ato de medir. OBSERVAÇÃO = MEDIÇÃO Medida = 10,0 cm 10,0 cm é o menor valor de uma medida que um instrumento fornece ou a menor unidade detectável em um aparelho. Graduação da régua: centímetros e milímetros Sensibilidade da régua: 1mm
Dados quantitativos ou numéricos discretos, i.e. contagens ou número inteiros: número de ovos postos pela tartaruga marinha número de ataques de asma no ano passado contínuos, i.e. medidas numa escala contínua: volume, área, peso, massa velocidade de corrente Dados qualitativos ou categóricos: Nominais: sexo: masculino, feminino classificação de fósseis ordinais, i.e. categorias ordenadas salinidade: baixa, média, alta abundância: dominante, abundante, freqüente, ocasional, raro amostra: Conjunto de dados representativos de uma população. amostragem: Procedimento utilizado para constituir uma amostra. tratamento de dados: Aplicação de operações que expressem, em termos relativos, as diferenças de atributos entre os dados.
Tabulando dados Analisou-se as medidas observadas, ordenando-se por intervalos, sendo a unidade metros, obteve-se: Distâncias percorridas Freqüência (f) Freqüência relativa (fr) Percentagem % Até 500 17 0,07 0,7 550-600 9 0,354 35,4 600-700 14 0,171 17,1 700-750 0,68 6,8 N=8 1 100 MEDIDAS DE POSIÇÃO Mínimo, Máximo, Moda, Média, Mediana, Percentis MEDIDAS DE DISPERSÃO Amplitude, Intervalo-Interquartil, Variância, Desvio Padrão, Coeficiente de Variação.
Valor mais provável de uma medida. verdadeiro valor de uma grandeza indica quanto cada uma de um conjunto de observações para um mesmo evento, se aproxima da média do conjunto de observações Quanto uma medida se aproxima do valor real Baixa Resolução Precisão Alta Resolução Acurácia
Sem precisão e sem acurácia Preciso mas sem acurácia Com acurácia, sem precisão Com precisão e acurácia Tipos de erros Erros grosseiros (blunders) são aqueles oriundos de falhas, falta de atenção do observador e do mau funcionamento de um instrumento, deve ser evitado, pois é de difícil detecção após as medidas Erros sistemáticos são produzidos por causas conhecidas, podem ser evitados por técnicas especiais de observações ou podem ser modelados matematicamente e eliminados das observações. Erros acidentais ocorrem de maneira aleatória e devem ser tratados estatisticamente.
causas dos erros humanos ou pessoais naturais instrumentais superabundância de observações: permite obter o valor mais provável de uma grandeza: média Substitui-se um conjunto de observações por um único número a média aritmética. A precisão do conjunto de observações é fornecida pelo erro médio quadrático da média A precisão de uma observação é fornecida pelo erro médio quadrático de uma observação isolada ou seu valor positivo denominado de desvio padrão. Média Aritmética (valor mais provável de uma observação)
a b a 1 a observação = 10,4 cm b a a observação = 10,45 cm b 3 a observação = 10,3 cm Qual o valor da medida? Qual a confiabilidade desta medição? numero observação (cm) desvio desvio ao quadrado 1 10,4 0,0167 0,000789 10,45 0,0667 0,0044489 3 10,3-0,0833 0,0069389 soma 31,15 0,0001 0,01167 Valor mais provável da observação: x = 31,15/3 x = 10,38cm Precisão: Variância: Σ v. v 0,01167 σ = = = 0,0058 cm n 1 Precisão: desvio padrão: σ = 0,08 cm
Manual técnico do instrumento Medida angular precisão resolução Manual técnico do instrumento Medida de distância precisão resolução
QUAL A PRECISÃO DO GPS COVARIÂNCIA A covariância entre dois conjuntos de medidas, x 1 e x, é dada por: S 1 ( x x )( x x ) 1 1 i = n 1 i Se S 1 = 0 Não há dependência entre G 1 e G Se S 1 # 0 Há dependência entre G 1 e G
COEFICIENTE DE CORRELAÇÃO O coeficiente de covariância entre dois conjuntos de medidas x 1 e x é dado por: r = S S S 1 1 + -1 r 1 Método dos mínimos quadrados Métodologia: evitam-se os erros grosseiros -Eliminam-se os erros sistemáticos por técnicas observacionais ou por aplicação de modelos matemáticos -Ajustam-se os erros acidentais Principio do Método A soma dos quadrados dos resíduos é mínima. Σvv = min.
LEI DA PROPAGAÇÃO DAS VARIÂNCIAS Seja a função que representa um conjunto de dados F = f(m 1, m,..., m k ) Utilizando-se dos conceitos de Gauss: F F F ( σ F ) = ( ) ( σm1 ) + ( ) ( σm ) +... + ( ) ( σmk ) m m m 1 k Os erros não se propagam linearmente! ACURÁCIA DE MEDIÇÃO - Grau de concordância entre o resultado de uma medição e um valor verdadeiro do mensurando. CLASSIFICAÇÃO - consiste em distribuir em classes ou grupos segundo um sistema de classificação. A norma brasileira NBR13133 (Execução de levantamentos topográficos), define as classes que devem ser enquadrados os instrumentos baseando-se no desvio padrão de um conjunto de observações obtidas seguindo uma metodologia própria.
CALIBRAÇÃO - conjunto de operações que estabelece, em condições especificadas, a correlação entre valores de quantidades indicados por um instrumento de medida, ou sistema de medida, ou uma medida materializada e os verdadeiros convencionais da grandeza medida. Interferômetro HP 558A do Laboratório de Aferição da UFPr. Carro com sensor Emissor/ receptor (1) () Distância calibrada: 9,965cm Erro = Diferença entre o valor observado e o valor real Desvio = Diferença entre o valor observado e a média medida Valor mais provável erro desvio acurácia valor real
Exercício: Um ângulo foi medido dez vezes, como é mostrado abaixo: (Gemael,C. 1994 p93) observação 1 3 4 5 6 7 8 9 10 Σ medida (l) 10 31 40,1 41, 40,8 4,1 4,9 4,4 43,0 40,7 41,9 41,5 41,66 v= (l-x) -1,56-0,46-0,86 0,44 1,4 0,74 1,34-0,96 0,4-0,16 3,55E-14 v =(l-x),4336 0,116 0,7396 0,1936 1,5376 0,5476 1,7956 0,916 0,0576 0,056 8,464 Estimativa Pontual Valor mais provável da observação: x = 10 31 41,66 b) Desvio padrão 8,464 σ = = 0,9698 9 No software FreeMat v3.5 a=[40.1 41. 40.8 4.1 4.9 4.4 43.0 40.7 41.9 41.5] [' média ='] m=mean(a) [' desvio padrão ='] s=std(a)
Estimativa por intervalo de confiança da média σ σ P[ x - t 1-α/ u x - t 1-α/ ] = 1-α n n Sendo 1-α denominado de nível de significância, usualmente igual a 95%. Assim: 1-α = 0,95 1-α/ = 0,975 Na tabela de Student para n-1 =9 (graus de liberdade) t 0,975 =,6 σ x - t 1-α/ = 10 31 40,96 n σ x + t 1-α/ = 10 31 4,36 n Extrato da tabela de Student Pode-se concluir que há 95% de chance de uma observação estar contida no intervalo de confiança: P = [10 31 40,96 u 10 31 4,36 ] = 95% Adotando-se um nível de confiança mais alto (99%) obtém-se um intervalo de confiança maior t 0,995 = 3,50 P = [10 31 40,65 u 10 31 4,67 ] = 99%
No software Excel Um dos principais produtos do ajustamento das observações é a matriz variância covariância, que é um arranjo matricial na forma: σ 1 σ 1 σ 13... σ 1n Σ = σ 1 σ σ 3...... σ n............ σ n1 σ n... σ n3... σ n Na diagonal principal tem-se as variâncias. Suas raízes quadradas representam os desvios padrões das observações correspondentes. Fora da diagonal principal aparecem as covariâncias.
Elipse de erros: é a figura que representa os desvios padrões máximos e mínimos de uma medida. Deseja-se a localização do ponto B do segmento AB. Precisão angular 10 precisão linear ±3mm Precisão angular x Área de localização provável do ponto B A y Precisão linear Exercícios: Um ângulo foi medido cinco vezes, obtendo-se os resultados constantes da coluna medida, da tabela a seguir. Calcular o valor mais provável de sua medida, sua variância e seu erro médio quadrático da média. Verificar se todas as observações se encontram dentro de um intervalo de confiança com probabilidade de 95% de certeza obs Medida V ( ) V ( ) 1 0 3 15" -4,6 1,16 0 3 0" 0,4 0,16 3 0 3 3" 3,4 11,56 4 0 3 18" -1,6,56 5 0 3 ",4 5,76 SOMA 10 41 38" 0,0 41,0
a) Cálculo da média aritmética (valor mais provável da medida) Σob 10 41 38" X = = n 5 x = 0 3 19,6" b) Cálculo da variância Σv σ = n-1 41,0 σ = 5 1 σ =10,3 " c) Cálculo do desvio padrão σ= ±3, " d) Cálculo do intervalo de confiança das medidas com probabilidade de certeza de 95%. Da análise estatística tem-se que para probabilidade de 95% deve-se pré-multiplicar o desvio padrão por 1,96, para 99% por,58, assim obtém-se: P[ x 1,96σ< α < x + 1,96σ] =95% P[0 3 13,33" < α < 0 3 5,87"] =95%
Uma distância de 00m foi medida com uma trena de 0m de comprimento. O desvio padrão de cada medida efetuada é conhecido e igual a 5mm. Qual o desvio padrão da distância total medida? a) Modelo matemático para a distância total medida D = d 1 + d + d 3 + d 4 + d 5 + d 6 + d 7 + d 8 + d 9 + d 10 D=0,00+0,00+0,00+0,00+0,00+0,00+0,00+0,00+0,00 +0,00 D = 00,00m b) Cálculo da propagação do desvio padrão D D D σ D= σ d1+ σ d+... + σ d10 d 1 d d 10 σ d1= 5 mm = 5mm σ d1= σ d= σ d3= σ d4= σ d5= σ d6= σ d7= σ d8= σ d9= σ d10= 5mm D D D = =... = = 1 d 1 d d 10 σ D= σ d1+ σ d+σ d3+σ d4+σ d5+σ d6+σ d7+σ d8+σ d9+σ d10 σ D= 50mm σ D = 15,8mm