Distribuição de Frequências ENG09004 2014/2 Prof. Alexandre Pedott pedott@producao.ufrgs.br
2.1. Distribuições de Frequência Na análise de conjuntos de dados é costume dividi-los em classes ou categorias e verificar o número de indivíduos pertencentes a cada classe, ou seja, a freqüência da classe. Exemplo: A Tabela abaixo apresenta 50 observações de uma característica dimensional (em ordem crescente). Tabela2.1. Valores de espessura de peças cerâmicas 12,58 12,97 13,45 13,53 13,59 13,61 13,62 13,78 13,97 14,21 14,47 14,51 14,53 14,58 14,65 14,78 14,83 14,97 15,06 15,13 15,17 15,23 15,29 15,37 15,40 15,45 15,51 15,62 15,67 15,73 15,83 15,98 16,01 16,11 16,17 16,23 16,35 16,43 16,49 16,52 16,67 16,83 16,97 17,05 17,13 17,22 17,3 17,48 17,8 18,47
2.1. Distribuições de Frequências Tabela2.1. Valores de espessura de peças cerâmicas 12,58 12,97 13,45 13,53 13,59 13,61 13,62 13,78 13,97 14,21 14,47 14,51 14,53 14,58 14,65 14,78 14,83 14,97 15,06 15,13 15,17 15,23 15,29 15,37 15,40 15,45 15,51 15,62 15,67 15,73 15,83 15,98 16,01 16,11 16,17 16,23 16,35 16,43 16,49 16,52 16,67 16,83 16,97 17,05 17,13 17,22 17,3 17,48 17,8 18,47 A Tabela apresenta a distribuição de frequência das 50 observações Intervalos de classe Freqüência absoluta 12,50 a 13,50 3 13,51 a 14,50 8 14,51 a 15,50 15 15,51 a 16,50 13 16,51 a 17,50 9 17,51 a 18,50 2 Os dados estão agrupados e os detalhes originais dos dados são perdidos.
2.2. Intervalos de Classe O intervalo de cada classe é caracterizado pela Amplitude e pelo Ponto Médio. A amplitude é dada pela diferença entre os limites das classes. Em geral, os intervalos são definidos para amplitudes constantes. Limite inferior da classe Intervalos de classe Freqüência absoluta 12,50 a 13,50 3 13,51 a 14,50 8 14,51 a 15,50 15 15,51 a 16,50 13 16,51 a 17,50 9 17,51 a 18,50 2 Limite superior da classe N o de observações em cada classe Intervalos de Classe
Amplitude e Ponto Médio do Intervalo de Classe Em alguns casos, pode-se usar intervalos abertos, do tipo 13,50 ou menor; 17,50 ou maior. Quando todos os intervalos de classe têm a mesma amplitude: Amplitude = diferença entre os limites das classes Caso contrário, teremos uma amplitude variável. Para o exemplo, a amplitude é 13,50-12,50 = 14,50-13,50 = 1
Ponto Médio de uma Classe Ponto médio = (limite inferior + limite superior) / 2 Assim, o ponto médio do intervalo 12,50 a 13,50 é (12,50+13,50) / 2 = 13,00
2.3. Passos para elaborar uma Distribuição de Freqüência a) Determina-se o maior e menor valor do conjunto de dados; Min = 12,58 e Max = 18,47 b) Define-se o limite inferior da primeira classe (LI), que deve ser igual ou ligeiramente inferior ao menor valor das observações; LI =12,50 c) Define-se o limite superior da última classe (LS), que deve ser igual ou ligeiramente superior ao maior valor das observações; LS=18,50
2.3. Passos para elaborar uma Distribuição de Freqüência d) Define-se o número de classes (K), que pode ser calculado usando K n e deve estar compreendido entre 5 e 20; K 50 7 Por praticidade, foi escolhido K = 6 e) Conhecido o número de classes, define-se a amplitude de cada classe: a = (LS - LI) / K; a ( LS K LI) (18,50 12,50) 6 1
2.3. Passos para elaborar uma Distribuição de Freqüência f) Conhecida a amplitude das classes, define-se os limites inferior e superior para cada classe. Por exemplo, para a 1 a classe: lim. inf. = LI; lim. sup. = LI+ a; lim inf = 12,50 e lim sup = 12,50 + 1 = 13,50 g) Calcula-se a freqüência de cada classe, ou seja, o número de observações que caem em cada classe, e completa-se a tabela de freqüência; 12,50 a 13,50 é 3
2.4. Histogramas e Polígono de Freqüência Histogramas e polígonos de freqüência são representações gráficas da distribuição de freqüência. Um histograma consiste de um conjunto de retângulos que têm: a) a base sobre um eixo horizontal com centro no ponto médio e largura igual à amplitude do intervalo de classes; b) a área proporcional às freqüências das classes.
Histograma Polígono de Freqüência 16 12 8 4 16 12 8 4 0 12 13 14 15 16 17 18 19 0 12 13 14 15 16 17 18 19 Se todos os intervalos tiverem a mesma amplitude, as alturas dos retângulos serão proporcionais às freqüências das classes, e então costuma-se tomar as alturas numericamente iguais a essas freqüências. Um polígono é um gráfico obtido ligando-se os pontos médios dos topos dos retângulos de um histograma.
2.5. Distribuição de Freqüências Relativas Freqüência relativa de uma classe Freq. da classe Freq. de todas as classes Geralmente expressa em % x 100 Por exemplo, a freqüência relativa da 1 a classe é Freq. da classe Freq. de todas as classes = 3 50 x 100 = 6%
2.5. Distribuição de Freqüências Relativas Se as freqüências da Tabela anterior forem substituídas pelas freqüências relativas, tem-se uma tabela de freqüências relativas e então pode-se plotar um histograma de freqüências relativas ou um polígono de freqüências relativas. Intervalos de classe Freqüência absoluta Freqüência relativa 12,50 a 13,50 3 6% 13,51 a 14,50 8 16% 14,51 a 15,50 15 30% 15,51 a 16,50 13 26% 16,51 a 17,50 9 18% 17,51 a 18,50 2 4%
2.5. Distribuição de Freqüências Relativas As Figuras abaixo representam o histograma e polígono de freqüências relativas Histograma Polígono de Freqüência 32% 32% 24% 24% 16% 16% 8% 8% 0% 12 13 14 15 16 17 18 19 0% 12 13 14 15 16 17 18 19
2.6. Distribuição de Freqüências Acumuladas A freqüência total de todos os valores inferiores ao limite superior de uma dada classe é denominada freqüência acumulada para aquele intervalo. Por exemplo, a freqüência acumulada até e inclusive o intervalo 13,51 a 14,50 é 3 + 8 = 11, o que significa que 11 das 50 peças cerâmicas apresentam característica dimensional inferior a 14,50. Intervalos de classe Freqüência absoluta 12,50 a 13,50 3 13,51 a 14,50 8 14,51 a 15,50 15 15,51 a 16,50 13 16,51 a 17,50 9 17,51 a 18,50 2
2.6. Distribuição de Freqüências Acumuladas Uma tabela que apresente essas freqüências é chamada de tabela de freqüência acumulada. Intervalos de classe Freqüência absoluta Freqüência relativa Freqüência acumulada absoluta Freqüência acumulada relativa abaixo de 12,50 0 0% 0 0% 12,50 a 13,50 3 6% 3 6% 13,51 a 14,50 8 16% 11 22% 14,51 a 15,50 15 30% 26 52% 15,51 a 16,50 13 26% 39 78% 16,51 a 17,50 9 18% 48 96% 17,51 a 18,50 2 4% 50 100%
2.6. Distribuição de Freqüências Acumuladas Um gráfico que apresente a freqüência acumulada é denominado de polígono de freqüência acumulada. Dividindo-se a freqüência acumulada pelo total das observações, tem-se a tabela de freqüências acumuladas relativas e o correspondente polígono de freqüências acumuladas relativas. Polígono de Freqüência Acumulada Absoluta Polígono de Freqüência Acumulada relativa 50 100% 40 80% 30 60% 20 40% 10 20% 0 12,5 13,5 14,5 15,5 16,5 17,5 18,5 0% 12,5 13,5 14,5 15,5 16,5 17,5 18,5
2.7. Curvas de Freqüência Suavizadas O polígono de freqüência e o polígono de freqüência acumulada podem ser suavizados. Filtrar o ruído presente em qualquer conjunto de dados. O polígono de freqüência suavizado é a distribuição de freqüência (relativa ou acumulada) ou distribuição de probabilidade de uma característica. A análise das distribuições de probabilidade indica o comportamento que seria observado no caso de uma amostra muito grande ou infinita.
2.8. Tipos Distribuição de probabilidade Na Figura abaixo apresenta-se diversos tipos de distribuições de probabilidade (freqüência relativa). Simétrica Forma de Sino Assimétrica à Direita Assimetria Positiva Assimétrica à Esquerda Assimetria Negativa Uniforme Exponencial Bimodal A distribuição de probabilidade são caracterizadas por três parâmetros: forma, localização (tendência central) e dispersão (variabilidade).
2.8. Tipos Distribuição de Freqüência Características de qualidade do tipo nominal-é-melhor (por exemplo, características dimensionais) tendem a apresentar uma distribuição de probabilidade aproximadamente simétrica, pois as causas de variabilidade geram valores que podem se afastar tanto para cima como para baixo do alvo.
2.8. Tipos Distribuição de Freqüência Características de qualidade do tipo maior-é-melhor (por exemplo, resistência mecânica) tendem a apresentar uma distribuição de probabilidade assimétrica à esquerda, pois muitas vezes existem limitações tecnológicas que dificultam a obtenção de valores altos, enquanto que muitos causas de variabilidade podem gerar valores baixos.
2.8. Tipos Distribuição de Freqüência Características de qualidade do tipo menor-é-melhor (por exemplo, nível de ruído) tendem a apresentar uma distribuição de probabilidade assimétrica à direita, pois muitas vezes existem limitações tecnológicas dificultando a obtenção de valores baixos, enquanto que muitos causas de variabilidade podem gerar valores altos.
Exercícios 2.1. Os dados a seguir representam tempos (em minutos) medidos em uma certa operação. Organize esses dados em uma tabela de freqüência e em seguida plote o histograma, o polígono de freqüências e o gráfico de freqüências acumuladas. 5,1 5,3 5,3 5,6 5,8 5,9 6,0 6,1 6,2 6,2 6,3 6,3 6,3 6,4 6,4 6,4 6,5 6,5 6,6 6,7 6,7 6,8 6,8 6,9 6,9 7,0 7,1 7,1 7,2 7,2 7,3 7,4 7,5 7,5 7,6 7,6 7,6 7,7 7,7 7,8 7,8 7,9 7,9 8,0 8,0 8,1 8,2 8,3 8,3 8,4 8,5 8,5 8,6 8,7 8,8 8,8 8,9 9,0 9,1 9,2 9,4 9,4 9,5 9,5 9,6 9,8 9,9 10,0 10,2 10,2 10,4 10,6 10,8 10,9 11,2 11,5 11,8 12,3 12,7 14,9 2.2. Suavize o gráfico de freqüências acumuladas obtido no exercício anterior, e então estime o percentual das operações onde o tempo deverá ultrapassar 10 minutos.
Exercícios 2.3. Os dados a seguir representam a espessura de uma peça mecânica (em mm). Organize esses dados em uma tabela de freqüências relativas e depois plote o histograma de freqüências relativas, o polígono de freqüências relativas e o gráfico de freqüências relativas acumuladas. 20,4 22,3 23,1 23,5 23,8 24,1 24,3 24,3 24,6 24,8 24,9 25,0 25,1 25,3 25,3 25,4 25,6 25,7 25,8 26,0 26,0 26,1 26,2 26,2 26,3 26,5 26,6 26,7 26,8 26,9 27,1 27,1 27,3 27,5 27,7 27,9 28,0 28,3 28,7 29,6 2.4. Suavize o gráfico de freqüências acumuladas obtido no exercício anterior, e então estime o percentual de peças que deve apresentar espessura inferior a 24 mm.
Exercícios 2.5. Tendo em vista os polígonos de freqüência obtidos nos exercícios 2.1. e 2.3. você diria que as populações do tempo e da espessura apresentam distribuição de probabilidade simétrica ou assimétrica?
Exercícios 2.6. Plote os histogramas correspondentes às tabelas de freqüência a seguir e indique o tipo de curva de freqüência em cada caso. X1: Característica dimensional de uma peça; X2: Tempo de uso (horas/semana) de um produto; X3: Tempo até a falha de um produto. X 1 Freq. X 2 Freq. X 3 Freq. 25,52 a 25,53 6 0 a 4 1 0 a 100 20 25,53 a 25,54 14 4 a 8 2 100 a 200 16 25,54 a 25,55 20 8 a 12 9 200 a 300 11 25,55 a 25,56 18 12 a 16 24 300 a 400 7 25,56 a 25,57 15 16 a 20 48 400 a 500 4 25,57 a 25,58 7 20 a 24 6 500 a 600 2