Métodos Experimentais em Ciências Mecânicas Professor Jorge Luiz A. Ferreira
Pertencem ao grupo de ferramentas estatísticas que permitem caracterizar um conjunto de dados sob ponto de vista da tendência central ou da dispersão dos dados estudados Medidas de Dispersão Amplitude, Faixa, ou Range Variância Desvio Padrão Coeficiente de Variação Distância Interquartílica Medidas de Tendência Central Médias Aritmética Harmônica Geométrica Quadrática Ponderada Aparada (Trimmed) Mediana Moda Quartis Medidas de Assimetria e Curtose
Medidas de Tendência Central Como o próprio nome já diz, medidas de tendência central são aquelas cujo valor tende a localizar-se no centro de uma série de dados. Freqüentemente, quando se analisa os valores de uma variável em uma amostra, constata-se que os dados não se distribuem uniformemente, havendo concentração em alguns pontos, notadamente próximos ao centro da distribuição. Qual a posição que melhor representa o centro destes dados?
Medidas de Tendência Central e de Dispersão Valor Esperado Expectância - Momento Se x(t) ou x k = Resultados de uma medição E [( ) ] 1 n T x a = ( x( t) a) T 0 n dt = 1 K K k = 0 ( x a) k n
Medidas Resumo Medidas de Tendência Central Média Aritmética A Média Aritmética é o Valor Que Define o ponto de equilíbrio dos Dados de uma Distribuição.
Medidas de Tendência Central Média Aritmética Cálculo exato: (da população) Estimativa: (da amostra) µ = = Lim T Lim N 1 T 1 N T 0 x ( t) N k = 1 dt x k m = = = 1 T 1 N K T 0 k = 1 x ( t) N k = 1 x k dt x k f k
Medidas Resumo Medidas de Tendência Central Média Geométrica Média geométrica é a média dos elementos amostrais em relação à multiplicação. Sua estimativa é realizada por meio da seguinte expressão: N m N g = k = 1 x k Exercício: Aplicar a função log na expressão acima e análisar resultado
Medidas Resumo Medidas de Tendência Central Mediana A mediana é um número que caracteriza as observações de uma determinada variável de tal forma que a sua posição, em um grupo de dados ordenados, separe a metade inferior da amostra, população ou distribuição de probabilidade, da metade superior. Esta medida também é conhecida como média posicional! 11 1 3 5 7 9 8 4 11 9 8 7 5 3 6 7 + 5 = 2 11 9 8 7 5 4 3 1 1
Medidas Resumo Medidas de Tendência Central Mediana Estimadores da Mediana Dados não Agrupados Dados Agrupados Md Pos = N +1 2 N = l + c 2 s i Onde: Pos = 4 l si - Limite Inferior da Classe Mediana c Intervalo de Classe N - Tamanho da Amostra f Md - freqüência absoluta da classe mediana F ant - freqüência acumulada anterior à classe mediana f F Md ant 11 1 3 5 7 9 8 4 11 9 8 7 5 3 1 6 7 + 5 = 2 11 9 8 7 5 Pos = 4,5 4 3 1
Medidas Resumo Medidas de Tendência Central Média Aparada Uma média aparada, trimmed, não é mais do que uma mistura entre os conceitos de média e mediana por forma a combinar as qualidades de ambas. Podendo ser entendida também como uma média que é calculada excluindo uma certa proporção de observações em cada extremo da amostra.
Medidas de Tendência Central Moda A moda é o valor que detém o maior número de observações, ou seja, o valor ou valores mais freqüentes. A moda não é necessariamente única, ao contrário da média ou da mediana. É especialmente útil quando os valores ou observações não são numéricos, uma vez que a média e a mediana podem não ser bem definidas. 5 1 8 11 7 3 9 4 Não Possui Moda 4 1 8 11 7 3 9 4 Possui Moda Igual a 4
Medidas de Tendência Central Moda Estimadores da Moda Dados não Agrupados Dados Agrupados Moda de King Mo = xi pos Mok = ls + c i ant + = ponto médio da classe de maior freqüência f ( f f ) post Onde: l si = limite inferior da classe modal onde se localiza a moda c - intervalo de classe f mo - freqüência da classe modal f ant - freqüência anterior à classe modal f post - freqüência posterior à classe modal
Medidas de Tendência Central Moda Estimadores da Moda Dados não Agrupados Dados Agrupados Moda de Czuber Mo = xi mo ant Moc = ls + c i 2 fmo ant + = ponto médio da classe de maior freqüência f f ( f f ) Onde: l si = limite inferior da classe modal onde se localiza a moda c - intervalo de classe f mo - freqüência da classe modal f ant - freqüência anterior à classe modal f post - freqüência posterior à classe modal post
Média, Mediana, Moda Aplicação A média permite explicar muito bem o comportamento de resultados experimentais, A mediana também permite explicar muito bem o comportamento de resultados experimentais de fenômenos com eventos extremos, Idade dos Pessoal da Turma 20 28 30 25 24 20 25 20 50 24 A moda é apropriada para representar o comportamento de dados ao nível nominal 22 21 20 Média = 25,2 Mediana = 24 Moda = 20 24
Média, Mediana, Moda Aplicação A média permite explicar muito bem o comportamento de resultados experimentais, A mediana também permite explicar muito bem o comportamento de resultados experimentais de fenômenos com eventos extremos, Idade dos Pessoal da Turma Média = 23,3 Mediana = 24 Moda = 20 A moda é apropriada para representar o comportamento de dados ao nível nominal 22 20 21 28 30 25 24 20 20 25 20 50 24 24
Média, Mediana, Moda Aplicação A média permite explicar muito bem o comportamento de resultados experimentais, A mediana também permite explicar muito bem o comportamento de resultados experimentais de fenômenos com eventos extremos, Numeração dos calçados do Pessoal da Turma Média = 38,2??? Mediana = 35,5 Moda = 39 A moda é apropriada para representar o comportamento de dados ao nível nominal 35 38 39 44 36 36 36 39 37 37 39 39 40 40
Medidas Resumo Medidas Separatrizes Quartis Um quartil é qualquer um dos três valores que divide o conjunto ordenado de dados em quatro partes iguais, e assim cada parte representa 1/4 da amostra ou população. 1o quartil = quartil inferior = é o valor aos 25% da amostra ordenada 2 o quartil = mediana = é o valor até ao qual se encontra 50% da amostra ordenada 3 o quartil = quartil superior = valor a partir do qual se encontram 25% dos valores mais elevados
Medidas Resumo Medidas Separatrizes Quartis Um quartil é qualquer um dos três valores que divide o conjunto ordenado de dados em quatro partes iguais, e assim cada parte representa 1/4 da amostra ou população. Mediana = Q 2/4 = 37,5 36 + 39 37,5 = 2 7 15 40 36 41 39 Q 3/4 = 40 Q 1/4 = 7 41 40 39 36 15 7
Medidas Resumo Medidas Separatrizes Decil e Percentil O Decil é responsável por dividir o conjunto em dez partes iguais. Já o Percentil (ou centil), é a Medida que dividirá o conjunto em cem partes iguais Medidas Separatrizes Mediana Quartil Decil Percentil!-------------------!-------------------! Md!---------!---------!---------!---------! Q1 Q2 Q3!---!---!---!---!---!---!---!---!---!---! D1 D2 D3 D4 D5 D6 D7 D8 D9!---!---!---!---!---!---!---!---!---!---! C10 C20 C30 C40 C50 C60 C70 C80 C90
Medidas de Dispersão Variação ou dispersão é o grau com que os dados numéricos tendem a se espalhar em torno de um valor médio. Ou seja, medidas de dispersão são indicadores do grau de variabilidade demonstrada pelos indivíduos em torno das medidas de tendência central.
Medidas Resumo Medidas de Dispersão - Amplitude É a Diferença entre o maior valor e o menor valor observado na Amostra Min. Amplitude = Max. Min. = 30 Max. 20 20 20 20 21 22 24 24 24 25 25 28 30 50 25 20 24 22 30 21 28 20 20 20 25 24 50 24 Amplitude =30
Medidas de Dispersão Usando o Conceito de Expectância E E 0 [( x a) ] = ( x( t) a) 2 1 = T 1 T K k = k x 0 K 2 dt ( x ˆ) a = 0 E[(x-a) 2 ] é o Desvio Médio Quadrático a = ^x E[(x-a) 2 ] é a Variância. [( x xˆ ) r ] Momento central do ordem r 2
Medidas de Dispersão Desvio Padrão Cálculo exato: (da população) Estimativa: (da amostra) σ n i= 1 = lim n ( x i µ ) n x 2 s = n i= 1 ( x i n 1 xˆ) x i i-ésima indicação xˆ média Amostral (Base da Estimativa: "n" indicações) n número de medições repetitivas efetuadas µ x Média Populacional 2
Medidas de Dispersão Desvio Padrão Desvio Padrão: É um valor que quantifica a dispersão dos eventos de uma determinada população, ou seja, a média das diferenças entre o valor de cada evento e a média central. A vantagem que apresenta sobre a variância é de permitir uma interpretação direta da variação do conjunto de dados, pois o desvio padrão é expresso na mesma unidade que a variável Apesar de ser a medida de dispersão mais usada, tal medida não tem uma interpretação intuitivamente óbvia.
Medidas de Dispersão Desvio Padrão Desiqualdade de Chebyshev: Para qualquer conjunto de dados e qualquer constante h > 1, no mínimo 1 (1/ h 2 ) dos dados estarão situados dentro de um intervalo formado por h desvios padrões abaixo e acima da média. Espécime Dimensão Espécime Dimensão 1 81 11 99 2 81 12 99 3 83 13 100 4 86 14 101 5 88 15 104 6 91 16 105 7 94 17 107 8 97 18 107 9 97 19 107 10 98 20 111 h 1,5 Percentual 55,6% Lim Inf. 83,05 Lim. Sup. 110,55 Espécime Dimensão Espécime Dimensão 1 81 11 99 2 81 12 99 3 83 13 100 4 86 14 101 5 88 15 104 6 91 16 105 7 94 17 107 8 97 18 107 9 97 19 107 10 98 20 111 Percentual de dados no interior do intervalo: 80%
Medidas de Dispersão Coeficiente de Variação O coeficiente de variação de Pearson, cv, é uma medida relativa de variabilidade. É independente da unidade de medida utilizada. Estimador: cv(%) = 100 s Karl Pearson D1857-1936 mˆ
Medidas de Dispersão Coeficiente de Variação Por ser uma medida relativizada, o coeficiente de variação tem, portanto, aplicações na pesquisa para comparar a precisão de diferentes experimentos, quando a unidade de medição é diferente. Dicas para tomada de decisão: Baixa dispersão: cv 15% Média dispersão: cv 15-30% Alta dispersão: cv 30% Karl Pearson D1857-1936
Medidas de Dispersão Coeficiente de Variação Aplicação: Comparação de dispersão de resultado de experimentos realizados com unidades de medição diferentes Tipo de Lâmpada Horas de Uso Até Falhar Incandecente (1) 976 898 1020 1102 1096 1139 825 981 1088 913 Fluorecente (2) 10271 9710 9939 9729 10423 10001 10853 9845 9448 9398 Medidas Resumo Lampada (1) (2) Média 1004 9962 Desvio Padrão 103 449 C.V. 10.3% 4.5%
Medidas de Dispersão Distância Interquartílica É a diferença entre o 3º e o 1º quartis, Q 3 - Q 1. Ou seja, no intervalo interquartílico concentra-se metade das observações mais centrais. 50%
Medidas de Assimetria e Curtose As medidas de assimetria e curtose complementam as medidas de posição e de dispersão no sentido de proporcionar uma descrição e compreensão mais completa das distribuições de freqüências. Ampliando o conceito de Momento Estatístico: São medidas de caráter mais geral e dão origem às demais medidas descritivas, como as de tendência central, dispersão, assimetria e curtose. Conforme a potência considerada tem-se a ordem ou o grau do momento calculado.
Medidas de Assimetria e Curtose - Momentos Momentos Simples ou Centrados na Origem, M r m r = = 1 N i= 1 Nclas N i= 1 c r i x r i f i N = tamanho da amostra, x = observação amostral, c = centro da classe da distribuição de freqüências de x f = freqüência relativa Nclas = número de Classes da distribuição de freqüências de x
Medidas de Assimetria e Curtose - Momentos Momentos ou Centrados na Média, M r M r = = 1 N i= 1 Nclas N i= 1 ( x xˆ ) ( c xˆ ) c = centro da classe da distribuição de freqüências de x i i r r f i N = tamanho da amostra, x i = i-ésima observação amostral, f = freqüência relativa m 2 = Variância Nclas = número de Classes da distribuição de freqüências de x r é um número inteiro positivo que define a ordem do momento
Medidas de Assimetria e Curtose - Momentos Momentos Abstratos, α r α r = M s r r s = Desvio Padrão
Medida de Assimetria Coeficiente de Assimetria O coeficiente de assimetria quantifica o grau de desvio, afastamento da simetria ou grau de deformação de uma distribuição de freqüências. Estimadores: Coeficiente de Assimetria de Pearson x Mo As = ˆ s Se As < 0 a curva será assimétrica negativa Se As > 0 a curva será assimétrica positiva Se As = 0 a curva será simétrica Coeficiente Momento de Assimetria α 3 = M s 3 3 Se α 3 < 0,2 a curva será simétrica Se 0,2 < α 3 < 1,0 a curva será assimétrica fraca Se α 3 > 1,0 a curva será assimetria forte.
Medida de Assimetria Coeficiente de Assimetria Assimetria positiva Quase simetria Assimetria negativa Coef.ass. >0 Coef.ass. ~ 0 Coef.ass. <0
Medidas de Curtose ou de Achatamento Mostram até que ponto uma distribuição é a mais aguda ou a mais achatada do que uma curva normal, de altura média. Classificação: Mesocúrtica: É considerada a curva padrão. Leptocúrtica: É uma curva mais alta do que a normal. Apresenta o topo relativamente alto, significando que os valores se acham mais agrupados em torno da moda. Curva Platicúrtica: É uma curva mais baixa do que a normal. Apresenta o topo achatado, significando que várias classes apresentam freqüências quase iguais.
Medidas de Curtose ou de Achatamento Mostram até que ponto uma distribuição é a mais aguda ou a mais achatada do que uma curva normal, de altura média. Estimadores: Coeficiente de Curtose K = Q3 Q1 2 P ( P ) 90 10 - K > 0.263 distribuição Platicúrtica; - K = 0.263 distribuição Mesocúrtica; - K < 0.263 distribuição Leptocúrtica; Coeficiente Momento de Curtose α 4 = M s 4 4 - α 4 < 3 distribuição Platicúrtica; - α 4 = 3 distribuição Mesocúrtica; - α 4 > 3 distribuição Leptocúrtica;
Medidas de Assimetria e de Achatamento Atenção Numa amostra é quase impossível observar simetria e curtose puras. Por isso os coeficientes de assimetria e de curtose assumem valores quase sempre diferentes de zero, 0,263 e 3. Para termos uma ideia se a assimetria ou curtose é relevante devemos comparar o valor dos coeficientes com o erro associado. Se o coeficiente não exceder 2 ou 3 vezes o erro, o seu valor não será muito relevante, especialmente quando queremos extrapolar para a população.
Estatística Descritiva Tipos de Gráficos Gráfico de Caixa Boxplot Exemplo - Para ilustrar o uso do gráfico de caixa, consideremos os dados apresentados na tabela abaixo, que representam leituras de durezas obtidas por tipos diferentes de tratamento térmico realizados durante a fabricação de uma determinada peça. 300 Dureza Brinell, HB [Mpa] (1) (2) (3) 220,2 214,9 203,3 235,0 225,6 204,9 238,3 226,7 216,7 253,8 227,8 219,5 254,9 241,8 222,8 259,0 244,6 224,5 266,7 246,2 270,0 Visualização dos Dados Dureza Brinell, HB [MPa] 250 200 150 1 2 3 Tratamento Térmico
Estatística Descritiva Tipos de Gráficos Gráfico de Caixa Boxplot T1 Exemplo Estatísticas descritivas Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Descriptives Lower Bound Upper Bound Statistic Std. Error 24,6843,6131 23,1842 26,1844 24,7220 25,3800 2,631 1,6220 22,02 26,67 4,65 2,4000 -,586,794 -,594 1,587 T2 Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Descriptives Lower Bound Upper Bound Statistic Std. Error 23,2514,4455 22,1613 24,3416 23,2733 22,7800 1,389 1,1788 21,49 24,62 3,13 1,9000 -,138,794-1,435 1,587 T3 Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Descriptives Lower Bound Upper Bound Statistic Std. Error 22,3100,8422 20,2493 24,3707 22,1594 21,9500 4,965 2,2282 20,33 27,00 6,67 1,9600 1,879,794 4,262 1,587 O que conseguimos Extrair do Gráfico e das Medidas Resumo?
Estatística Descritiva Tipos de Gráficos Gráfico de Caixa Boxplot Exemplo Nova Representação Gráfica 280 280 7 260 260 240 Dureza Brinell, HB [MPa] 240 Dureza Brinell, HB [MPa] 220 200 180 N = 7 7 7 A B C 220 Tratamento Térmico 200 T1 T2 T3 Tratamento Térmico O que conseguimos Extrair do Gráfico?
Estatística Descritiva Tipos de Gráficos Gráfico de Caixa Boxplot Exemplo Nova Representação Gráfica + Outliers ou Dados Discrepantes ou Dados espúrios Condição de Assimetria Máximo da Amostra, mas não mais do que Q 1 + k (Q 3 -Q 1 ) 3 o Quartil 2 o Quartil - Mediana Valor Típico de k = 1,5 1 o Quartil Mínimo da Amostra, mas não menos do que Q 1 - k (Q 3 -Q 1 )
Estatística Descritiva Tipos de Gráficos Gráfico de Caixa Boxplot Exemplo Nova Representação Gráfica Assimetria positiva Simetria Assimetria negativa Boxplot (Diagrama de Caixa) ou Box-whiskers (Diagrama de Bigode) São gráficos que apresentam os valores centrais dos dados e alguma informação a respeito da amplitude deles.