O poder da ANOVA e da igualdade de variância Por Marcelo Rivas Fernandes A ANOVA e o Teste de Iguldade de Variância são tão imprescindíveis para a estatística inferencial, quanto a média e o desvio padrão são para a estatística descritiva! Os cursos de Green Belts e Black Belts que ministro são compostos por entrevistas que tem por objetivo auxiliar aos participantes no desenvolvimento de um Projeto Seis Sigma, seja para conduzí-los à uma correta definição do escopo do projeto ou para identificar algumas ferramentas estatísticas importantes que não estão sendo utilizadas no projeto. Durante as fases de tratamento da coleta de dados amostrais, observamos uma tendência natural de sintetização de informações demonstrando basicamente a média e o desvio padrão das amostras selecionadas dos processos. Isso nos leva a pensar na seguinte pergunta: Qual a finalidade da estatística? Descrever o comportamento dos dados coletados através de um grupo de amostras ou utilizar o resultado do comportamento desses dados amostrais para prever o comportamento do processo global doravante? Não faz sentido desenvolvermos análises de acontecimentos passados ao menos que também utilizemos tais informações para conhecermos o futuro! A estatística descritiva utiliza dados históricos para entregar ao investigador as medidas de posição, dispersão e forma, tais como média, mediana, moda, variância, desvio padrão e o tipo de distribuição dos dados selecionados de uma amostra. Já a estatística inferencial utiliza o conceito de probabilidade onde através de ferramentas poderosas como testes de hipóteses e DOE, atribuem um risco do processo seguir o comportamento resultante da amostra OU NÃO. Esta é a verdadeira finalidade da estatística! Na fase analisar, entre as ferramentas de testes de hipóteses existentes citamos duas consideradas de alto potencial para identificar a igualdade entre médias e a igualdade entre a variância de um processo: A ANOVA e o Teste de Variância. O exemplo abaixo analisado através do MINITAB demonstra o grau de importância dessas ferramentas: Vamos supor que uma empresa engarrafadora de cerveja esteja recebendo muitas reclamações dos seus clientes alegando que o volume contido na garrafa está menor que a especificação. Para isso, uma equipe de projeto decidiu analisar alguns fatores com o objetivo de reduzir essa variabilidade. O processo requer que sejam envazadas garrafas de cerveja de ml com tolerância variando em 5%. [585<>615]. O processo roda com três máquinas engarrafadoras e dois operadores trabalhando em dois turnos. A figura 1 demonstra a formatação para uma amostra com 60 observações.
Figura 1 A estatística descritiva dos dados coletados demonstra resumidamente o que está na figura 2. Summary for ml A nderson-darling Normality Test A -Squared 0,72 P-V alue 0,058 Mean 597,88 StDev 17,33 V ariance 300,44 Skew ness 0,310693 Kurtosis -0,278352 N 60 Minimum 564,20 1st Q uartile 586,87 Median 595,67 3rd Q uartile 611,82 Maximum 639,18 95% C onfidence Interv al for Mean 593,40 602,36 95% C onfidence Interv al for Median 593,34 597,56 95% Confidence Intervals 95% C onfidence Interv al for StDev 14,69 21,14 Mean Median 592 594 596 598 602 Que as 60 observações possuem uma média de envazamento de 597,88 ml com um desvio padrão de 17,33. Existem envazamentos mínimos de 564,20 ml comprovando através da amostra a constatação da reclamação dos clientes. Porém, necessitamos inferir estatísticamente que o processo como um todo, e não apenas um caso isolado, está entregando envazamentos fora da especificação e apurar qual o fator que está impactando nesta baixa performance.
Máquinas Temos três fatores importantes que, individualmente ou em conjunto, poderão estar influenciando negativamente neste processo: Máquinas, Turnos e Operadores. Vamos analisar a capacidade do processo, o teste de igualdade de variância e de médias (ANOVA) para cada um dos subgrupos de cada fator objetivando identificar se as variações e médias dos subgrupos são similares ou diferentes: Se o valor de p for maior do que alfa (atribuíndo 0,05 para IC de 95%) diremos que não há diferenças entre variação e média do subgrupo analisado. Se o valor de p for menor do que alfa, existirá um fator importante para ser investigado. A formulação das hipóteses para os testes será então: H0: subgrupo não possui diferença significativa (Hipótese nula) Ha: subgrupo possui diferença significativa (Hipótese alternativa) a) Para o fator Máquina e subgrupo 1,2 e 3 teremos a seguinte capacidade do processo (Figura 3). Process Capability of ml Process Data LSL 585 Target * U SL 615 Sample Mean 597,88 Sample N 60 StDev (Within) 16,457 StDev (O verall) 17,3332 LSL USL Within Overall Potential (Within) C apability Z.Bench 0,34 Z.LSL 0,78 Z.USL 1,04 C pk 0,26 O verall Capability Z.Bench 0,28 Z.LSL 0,74 Z.USL 0,99 Ppk 0,25 C pm * O bserved Performance PPM < LSL 233333,33 PPM > USL 150000,00 PPM Total 383333,33 Exp. Within Performance PPM < LSL 216913,95 PPM > USL 149105,23 PPM Total 366019,18 Exp. O verall Performance PPM < LSL 228712,19 PPM > USL 161651,65 PPM Total 390363,84 Figura 3 Observamos que o desempenho global das máquinas 1,2 e 3 entregam 390.363 PPM em defeito e que existe(m) alguma(s) máquina(s) entregando 366.019 PPM em defeito, portanto, menor quantidade de defeitos em relação à(s) outra(s). Há uma oportunidade de melhoria no processo. Mas o quanto ela serásuficiente? Vamos aos testes de hipóteses na figura 4. Test for Equal Variances for ml Máquina 1 Bartlett's Test Test Statistic 1,20 P-Value 0,548 Levene's Test Test Statistic 0,30 P-Value 0,742 Máquina 2 Máquina 3 10 15 20 25 30 95% Bonferroni Confidence Intervals for StDevs Figura 4
ml O teste de variância Bartlett (dados normais) demonstra um valor de p maior que 0,05 nos conduzindo a formulação da hipótese nula mencionada acima (H0: não existe diferença significativa entre as variações da máquina 1,2 e 3) embora observamos, graficamente, que há uma oportunidade de melhoria do processo a ser feita na máquina 1 que tem a maior dispersão. Vamos agora observar se existe diferença entre as médias das máquinas (figuras 5 e 6). Process Capability of ml Process Data LSL 585 Target * U SL 615 Sample Mean 597,88 Sample N 60 StDev (Within) 15,9191 StDev (O verall) 17,3332 LSL USL Figura 6 Within Overall Potential (Within) C apability Z.Bench 0,38 Z.LSL 0,81 Z.USL 1,08 C pk 0,27 O v erall C apability Z.Bench 0,28 Z.LSL 0,74 Z.USL 0,99 Ppk 0,25 C pm * O bserv ed Performance PPM < LSL 233333,33 PPM > USL 150000,00 PPM Total 383333,33 Exp. Within Performance PPM < LSL 209228,82 PPM > USL 141092,43 PPM Total 350321,25 Exp. O v erall Performance PPM < LSL 228712,19 PPM > USL 161651,65 PPM Total 390363,84 Figura 5 Boxplot of ml 630 610 590 570 Máquina 1 Máquina 2 Máquinas Máquina 3 One-way ANOVA: ml versus Máquinas Source DF SS MS F P Máquinas 2 2423 1212 4,51 0,015 Error 57 15303 268 Total 59 17726 S = 16,38 R-Sq = 13,67% R-Sq(adj) = 10,64% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---+---------+---------+---------+------ Máquina 1 20 601,10 18,71 (--------*---------) Máquina 2 20 589,00 15,20 (--------*--------) Máquina 3 20 603,54 14,97 (--------*---------) ---+---------+---------+---------+------ 584,0 592,0,0 608,0
ml Turnos Turnos Como podemos observar no resultado da ANOVA, o valor de p está menor do que 0,05 nos conduzindo a formulação da hipótese alternativa (Ha: Existe diferença significativa entre as médias da máquina 1, 2 e 3), constatando realmente a necessidade de ajustes das médias no subgrupo máquina, o que poderá ser talvez uma calibração de instrumento de nível, principalmente da máquina 2. Vamos analisar o fator Turno: b) Para o fator Turno e subgrupo Manhã e Tarde teremos a seguinte capacidade do processo (Figura 7) Este fator está entregando em um dos turnos 350.321 PPM em defeitos, uma menor entrega de defeitos, o que poderá não requerer uma melhoria necessária nos subgrupos deste fator. Vamos aos testes de hipóteses (figuras 8, 9 e 10). Test for Equal Variances for ml Manhã Tarde F-Test Test Statistic 0,85 P-Value 0,662 Levene's Test Test Statistic 0,06 P-Value 0,812 12 14 16 18 20 22 24 95% Bonferroni Confidence Intervals for StDevs 26 Manhã Tarde ml Boxplot of ml 630 610 590 570 Manhã Turnos Tarde One-way ANOVA: ml versus Turnos Source DF SS MS F P Turnos 1 671 671 2,28 0,136 Error 58 17055 294 Total 59 17726 S = 17,15 R-Sq = 3,78% R-Sq(adj) = 2,12% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---+---------+---------+---------+------ Manhã 30 601,22 16,43 (-----------*------------) Tarde 30 594,54 17,84 (-----------*------------) ---+---------+---------+---------+------ 590,0 595,0,0 605,0
Operadores Operadores Os resultados dos testes para o fator Turno comprovam valores de p maior do que 0,05 para variâncias = 0,662 e médias = 0,136 dos subgrupos Manhã e Tarde conduzindo à formulação da hipótese nula (H0: Não existe diferença significativa para a variação e média entre os subgrupos manhã e tarde) não havendo necessidade de maiores esforços de melhoria, embora devam ser observados os motivos dos pontos que encontram-se selecionados no Box Plot com envazamentos superiores à tolerância de 615 ml.e para finalizarmos a investigação, vamos analisar o fator Operador: c) Para o fator X1-operador e subgrupo e Antonio teremos a seguinte capacidade do processo (figura11). Process Capability of ml Process Data LSL 585 Target * U SL 615 Sample Mean 597,88 Sample N 60 StDev (Within) 16,315 StDev (O v erall) 17,3332 LSL USL Within Overall Potential (Within) C apability Z.Bench 0,35 Z.LSL 0,79 Z.USL 1,05 C pk 0,26 O v erall C apability Z.Bench 0,28 Z.LSL 0,74 Z.USL 0,99 Ppk 0,25 C pm * O bserv ed Performance PPM < LSL 233333,33 PPM > USL 150000,00 PPM Total 383333,33 Exp. Within Performance PPM < LSL 214919,45 PPM > USL 147013,31 PPM Total 361932,75 Exp. O v erall Performance PPM < LSL 228712,19 PPM > USL 161651,65 PPM Total 390363,84 Test for Equal Variances for ml Antonio Figura 11 F-Test Test Statistic 0,46 P-Value 0,040 Levene's Test Test Statistic 6,58 P-Value 0,013 10 15 20 25 95% Bonferroni Confidence Intervals for StDevs 30 Antonio ml Este fator entrega 361.932 PPM para um ou mais operadores em relação ao total do subgrupo 390.363 PPM. Vamos aos testes de hipóteses (figura 12). Para o fator operador, observamos a necessidade de melhoria do processo com relação a variação do subgrupo, pois o teste resultou um valor de p menor que 0,05. Já, em relação as médias dos operadores, não existem diferenças entre Antonio e, pois ambos estão trabalhando próximo aos ml (figuras 13 e14).
ml One-way ANOVA: ml versus Operadores Source DF SS MS F P Operadores 1 598 598 2,03 Boxplot 0,160 of ml Error 58 17128 295 Total 59 17726 S = 17,18 630 R-Sq = 3,37% R-Sq(adj) = 1,71% Individual 95% CIs For Mean Based on Pooled StDev Level 610 N Mean StDev ---+---------+---------+---------+------ Antonio 30 594,72 13,63 (-----------*------------) 590 30 601,04 20,12 (-----------*------------) ---+---------+---------+---------+------ 590,0 595,0,0 605,0 570 Antonio Operadores Figura 13 Concluímos o estudo elencando as ações de melhorias, as quais deveremos focar: 1- Reduzir a dispersão da máquina 1 2- Ajustar a média da máquina 2 3- Analisar os eventos além da tolerância no turno da tarde 4- Reduzir a dispersão do operador Cada uma das ações acima poderá demandar um novo projeto a depender do nível de complexidade e aprofundamento da causa raíz Marcelo Rivas Fernandes é Master Black Belt formado pela Six Sigma Academy - USA, Lean Especialista formado pela Lean Value Solutions - USA, Pós Graduado em Engenharia Econômica formado pela Universidade Estácio de Sá RJ, Espacializado em Didática do Ensino Superior pela Faculdade Jorge Amado Salvador/Ba. Foi palestrante da Seis Sigma Summit 2007 e já ministrou vários cursos de formação de Black e Green Belts para mais de 300 pessoas. Tem vasta experiência no desenvolvimento de projetos Seis Sigma - marcelorivas@uol.com.br