Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM
TÓPICOS DESTA AULA Revisão de Estatística Coleta de dados Análise de dados 2
INTRODUÇÃO Como tomar decisões num ambiente industrial? 3
COLETA DE DADOS Quantos? Amostra DADOS População INFERÊNCIA 4
População σ µ Amostra (x 1, x 2,..., x n ) Estimação Inferência s x 5
ESTRATIFICAÇÃO DE DADOS 6
TIPOS DE DADOS - ATRIBUTOS características qualitativas 7
TIPOS DE DADOS - VARIÁVEIS Característica quantitativa 8
ANÁLISE DE DADOS 1) Medidas de tendência central 2) Medidas de variabilidade 3) Histograma 4) Boxplot 5) Distribuição de probabilidade Normal 6) Gráfico de normalidade 9
MEDIDAS DE TENDÊNCIA CENTRAL Moda Mediana Média aritmética 10
MÉDIA ARITMÉTICA Exemplo: Anota-se a temperatura corporal de um indivíduo de 1 em 1 hora, durante 8 horas. Qual a temperatura média do indivíduo? n = 7 (tamanho da amostra) 1 x = n n i= 1 x i x i = 37, 37, 38, 39, 37, 39, 39 em ºC (valores observados) 37+ 37+ 38+ 39+ 37+ 39+ 39 x = = 38 C 7 11
MEDIANA Exemplo ~ x x(( n+ 1)/ 2) = x( n / 2) + x( n / 2+ 2 1) n n ímpar par Qual a mediana da temperatura corporal do indivíduo? n = 7 (tamanho da amostra é ímpar) x i = 37, 37, 38, 39, 37, 39, 39 em ºC (valores observados) x i = 37, 37, 37, 38, 39, 39, 39 em ºC (valores observados ordenados) ~ x = 38 C 12
MODA Exemplo: Qual a moda da temperatura corporal do indivíduo? n = 7 (tamanho da amostra) x i = 37, 37, 38, 39, 37, 39, 39 em ºC (valores observados) x i = 37, 37, 37, 38, 39, 39, 39 em ºC (valores observados ordenados) M = 37 e 39 13
RELAÇÃO ENTRE MÉDIA E MEDIANA A mediana é mais robusta a dados atípicos Simétrica Forma de Sino x x x~ ~ x x ~ x Assimétrica à Direita Assimetria Positiva Assimétrica à Esquerda Assimetria Negativa A Distribuição simétrica 10 12 14 16 18 x = 14 = ~ x = 14 B Distribuição assimétrica à direita 10 12 14 16 23 x = 15 > ~ x = 14 C Distribuição assimétrica à esquerda 05 12 14 16 18 x = 13 < ~ x = 14 14
MEDIDAS DE DISPERSÃO (VARIABILIDADE) Observações individuais apresentam alguma dispersão em torno do valor médio Dispersão ou variabilidade das observações Amplitude Quartil Variância e desvio-padrão Coeficiente de Variação 15
AMPLITUDE R = X max - X min Exemplo max min x i = 8,5; 8,7; 8,9; 10,1; 10,5; 10,7; 11,5; 11,9 R = 11,9-8,5 = 3,4 16
QUARTIL É qualquer um dos três valores que divide o conjunto ordenado de dados em quatro partes iguais cada parte representa 1/4 da amostra ou população 1º quartil ou quartil inferior (Q1) = valor aos 25% da amostra ordenada 2º quartil ou mediana (Q2) = valor até ao qual se encontra 50% da amostra ordenada 3º quartil ou quartil superior (Q3) = valor a aos 75% da amostra ordenada 17
EXEMPLO DE CÁLCULO DOS QUARTIS x i = 36, 40, 7, 41, 15, 39 (valores observados) x i = 7, 15, 36, 39, 40, 41 (valores observados ordenados) Q1 = 15 Q2 = (39+36)/2 = 37,5 Q3 = 40 Amplitude (intervalo) interquartílica: Q3 - Q1 (40-15 = 25) use a mediana para dividir os dados ordenados em duas metades, não inclua a mediana nas metades o quartil inferior (ou superior) é a mediana da metade inferior (ou superior) 18
BOXPLOT Gráfico que apresenta a variabilidade de um conjunto de dados através de 6 medidas Exemplo: 1, 2, 2, 3, 4, 5, 6 Dimensão 7 6 5 4 3 2 1 0 Valor máximo = 6 Q3 = 5 x bar = média = 3,3 Q2 = Mediana = 3 Q1 = 2 Valor mínimo = 1 19
BOXPLOT, MAIS UM EXEMPLO a b c 120 Q3 70 75 57 Max 100 110 90 Mediana 40 45 50 Média 40 40 50 Min 10 15 18 Q1 20 22 30 100 80 60 40 20 0 a b c Q3 Max Mediana Média Min Q1 20
VARIÂNCIA E DESVIO PADRÃO 10/08/2011 2 2 1 2 2 1 ( ) 1 ( ) n i i n i i x x s n x n µ σ = = = = 2 1 2 1 ( ) 1 ( ) n i i n i i x x s n x n µ σ = = = = 21
EXEMPLO DE VARIÂNCIA E DESVIO PADRÃO x i = 10, 12, 14, 16, 18 (cm) x = 14cm s (10 14) + (12 14) + (14 14) + (16 14) + (18 14) = = 9,98 cm 5 1 2 2 2 2 2 2 2 2 s= 9,98 = 3,16 cm A média e o desvio padrão possuem a mesma unidade de medida Os desvios de cada valor em relação à média totalizam zero pois a média é o valor central 22
COEFICIENTE DE VARIAÇÃO CV s = x 100 Um desvio padrão pode ser considerado grande ou pequeno dependendo da ordem de grandeza da média da variável Quanto menor o CV mais homogêneo é o conjunto de dados Útil para comparar resultados de amostras cujas unidades podem ser diferentes 23
EXEMPLO DE COEFICIENTE DE VARIAÇÃO Duas turmas de Sistemas da Qualidade II obtiveram as seguintes notas nas avaliações: Turma B: média = 60, desvio padrão = 5 Turma C: média = 70, desvio padrão = 10 Qual das duas turmas é relativamente mais homogênea? CV B = (5 / 60)*100 = 8,3% CV C = (10 / 70)*100 = 14,3% 24
HISTOGRAMA 25
DISTRIBUIÇÃO DE PROBABILIDADES É um modelo matemático que relaciona um certo valor da variável em estudo com a sua probabilidade de ocorrência Distribuições Discretas quando a variável que está sendo medida só pode assumir certos valores, como por exemplo os valores inteiros: 0, 1, 2, etc., por exemplo, binomial, poisson Distribuições Contínuas quando a variável que está sendo medida é expressa em uma escala contínua, como no caso de uma característica dimensional, por exemplo, normal 26
DISTRIBUIÇÃO NORMAL Px a = Fa ( ) = { } a 1 x µ 2 σ 1 e dx σ 2π a µ a µ Px { a} = P z Φ σ σ 2 a µ a µ Px { a} = 1 Px { < a} = 1 P z< 1 Φ σ σ 27
GENERALIZANDO A DISTRIBUIÇÃO NORMAL N ~ ( x, σ ) x x σ x 2σ x 3σ x+σ x+ 2σ x+3σ 28
QUANTIFICANDO A DISTRIBUIÇÃO NORMAL z = a x σ 99,87% 97,72% 84,13% 50,00% N 2 ~ (0,1 ) 15,87% 2,28% 0,13% A tabela de distribuição Normal reduzida (média = 0 e variância =1) dá as probabilidades acumuladas de - até a -3-2 -1 0 1 -z +z -2z 68,27% +2z 2 3-3z 95,45% +3z 99,73% 29
EXEMPLO A força de tensão de sacos plásticos de supermercado é normalmente distribuída com média 40 N/mm 2 com desvio padrão de 2 N/mm 2. O comprador exige que os sacos tenham resistência de pelo menos 35 N/mm 2. Qual a probabilidade do produto atender a especificação? P x> 35 = 1 P x 35 { } { } 35 40 P{ x 35} = P z = P{ z 2,5 } =Φ ( 2,5) = 0,0062 2 P x> 35 = 1 0,0062 = 0,9938 Função no Excel { } DIST.NORMP( ) 30
CONTINUANDO O EXEMPLO N 2 ~ (40, 2 ) N 2 ~ (0,1 ) { } P{ z } P x 35 = 2, 5 = Φ ( 2, 5) = 0, 62% 31
ANALISANDO O COMPORTAMENTO DAS DIFERENTES DISTRIBUIÇÕES NORMAIS 10/08/2011 f(x) A B C x 32
TESTES DE NORMALIDADE DOS DADOS Muitos testes usados partem do princípio que os dados amostrados são provenientes de uma população normal Deve-se testar se um conjunto de dados tem uma distribuição normal Método qualitativo Gráfico de normalidade (Normal Probability Plot) Métodos quantitativos Kolmogorov-Smirnov, Lilliefors e Shapiro-Wilks 33
GRÁFICO DE NORMALIDADE zj teórico 3,00 2,50 2,00 1,50 1,00 0,50 0,00-3,00-2,00-1,00-0,500,00 1,00 2,00 3,00-1,00-1,50-2,00-2,50 zj amostral Se os pontos do gráfico apresentarem um padrão linear, então a distribuição normal é um bom modelo para este conjunto de dados 34