Procedimento de comparações múltiplas baseado na distribuição F e sua implementação no pacote Experimental Designs

Procedimento de comparações múltiplas baseado na distribuição F e sua implementação no pacote Experimental Designs Mariani Tabarim Vieira 1 2 Patrícia de Siqueira Ramos 3 Eric Batista Ferreira 4 1 Introdução Na experimentação geralmente o pesquisador tem a necessidade de comparar mais de duas médias de diferentes tratamentos, o que é feito principalmente com o emprego dos Procedimentos de Comparações Múltiplas (PCM), sendo essa a segunda metodologia estatística mais utilizada, logo após o teste F na análise de variância [4]. Têm surgido diversos testes de comparações múltiplas, aplicados quando o teste F de análise de variância é significativo. Porém, os pesquisadores encontram dificuldade para trabalhar com esses testes, devido a ambiguidade dos resultados obtidos, o que prejudica a determinação precisa dos melhores tratamentos [7]. O erro tipo I ocorre quando a hipótese nula (H 0 ) verdadeira é rejeitada e o tipo II, quando H 0 falsa não é rejeitada. Na experimentação, é muito importante a utilização de testes com maior capacidade de controlar a taxa do erro tipo I, sendo esse controlado pelo pesquisador, e apresentar altos valores de poder, ou seja, detectar reais diferenças entre as médias dos tratamentos [4]. Existem testes, como o t de Student e Duncan, que apresentam elevadas taxas de erro tipo I por experimento, sendo considerados bastante liberais, enquanto outros, como Scheffé e Tukey apresentam taxas de erro tipo I por experimento geralmente menores do que o nível nominal de significância e são tidos como muito conservadores. Alguns testes, como o SNK, controlam o erro tipo I por experimento sob H 0 completa mas é muito liberal sob H 0 parcial [4]. Programas livres e gratuitos, como o Sisvar [2] e o R [5] são muito usados para realizar análise de experimentos. Além de ser livre, o R possui vários pacotes para as mais diversas áreas e possibilita que o usuário crie suas próprias funções. Além disso, ele recebe contribuições de pesquisadores do mundo todo na forma de pacotes, fazendo com que haja um grande desenvolvimento do programa e possibilite que soluções para problemas reais sejam encontradas com facilidade ou criadas pelo próprio pesquisador. 1 Faculdade de Nutrição - UNIFAL-MG. e-mail: marianivieira@hotmail.com 2 Agradecimento à FAPEMIG pelo apoio financeiro. 3 ICEx - UNIFAL-MG. e-mail: patricia.ramos@unifal-mg.edu.br 4 ICEx - UNIFAL-MG. e-mail: eric@unifal-mg.edu.br 1

Seguindo essa ideia de contribuição ao R feita por parte da comunidade científica, foi criada em 2009 a biblioteca de funções Experimental Designs (ExpDes), um pacote destinado a análise de experimentos balanceados por meio modelos de análise de variância de efeito fixo [3]. O objetivo principal do pacote é propiciar análises simples, rápidas e a custo zero de experimentos conduzidos em diversos delineamentos e esquemas de análise. Atualmente, a versão em inglês deste pacote pode ser baixada diretamente do CRAN do R. Versões em português, inglês e tutoriais podem ser encontradas em https://sites.google.com/site/ericbferreira/unifal/downloads-1. O ExpDes permite a análise de experimentos conduzidos em DIC, DBC e DQL, em esquema fatorial duplo, parcelas subdivididas, fatorial duplo com um tratamento adicional, fatorial triplo com ou sem tratamento adicional. Após verificar a significância pelo teste F da análise de variância, o pacote permite a realização da comparação de múltiplas médias pelos testes de Tukey, SNK, Scott-Knott, Duncan, t (LSD), Bonferroni (LSD protegido) e bootstrap de [6] se os tratamentos forem qualitativos ou o ajuste de modelos de regressão polinomial se os tratamentos forem quantitativos. O objetivo deste trabalho é descrever o procedimento de comparações múltiplas baseado na distribuição F, proposto por [1], e implementá-lo no pacote ExpDes, em código R, para complementar análises de experimentos balanceados, propiciando mais uma opção de teste de comparação de médias que apresente resultados não ambíguos e de forma direta. 2 Material e métodos Seja uma amostra aleatória em que se tenham k tratamentos qualitativos e não estruturados e r repetições. O estimador da média de cada tratamento é obtida pela razão entre a soma das observações de cada tratamento e o número de repetições r. O teste F na análise de variância é utilizado para verificar se existem diferenças reais entre os tratamentos. Quando a hipótese nula de igualdade entre as médias de todos os tratamentos é rejeitada, considera-se verdadeira a hipótese alternativa, de que há pelo menos uma diferença entre os tratamentos. A seguir, deve-se investigar quais os tratamentos são diferentes entre si. O procedimento baseado na distribuição F de [1] testa a homogeneidade das médias dentro de cada dois ou mais subgrupos. O primeiro grupo formado é composto por todas as médias e a cada passo, as médias serão divididas sucessivamente, ou seja, o número de partições p crescerá, p = 1,2,3,... O critério de parada é baseado na soma de quadrados SQ p do subgrupo em questão. A cada p, a partição escolhida é aquela em que a soma de quadrados dentro dos grupos for menor, o que é equivalente a encontrar a partição em p grupos para a qual a soma de quadrados entre grupos é maior. Em cada estágio, diferentes grupos podem ser formados sendo, por isso, chamado de um método não hierárquico. 2

O teste utiliza a distribuição F para calcular o valor-p por meio de ( ) SQ p valor-p = Pr F α,k 1,ν > QME(k 1) p = 1,2,3,...,k (1) em que k é o número de tratamentos, QME é o quadrado médio do resíduo da análise de variância e ν são os graus de liberdade associados ao QME. O valor-p é confrontado com o nível nominal de significância α. O primeiro passo de fusão em que o valor-p for maior do que o nível de significância α será o ponto de corte e o último agrupamento obtido será o considerado. A função ccf() para aplicar o procedimento descrito foi feita em linguagem R [5]. O procedimento foi incluído no pacote ExpDes (Experimental Designs) [3], oferecendo mais uma opção de procedimento de comparação de múltiplas médias a custo zero para pesquisadores. Posteriormente, o desempenho do teste será avaliado por meio de simulação Monte Carlo sob a hipótese nula e sob a hipótese alternativa, em que serão mensurados os erros tipo I e poder, de acordo com a situação. Um exemplo de uso de ccf() dentro da função dbc() foi ilustrado com um conjunto de dados de um experimento em DBC que avaliou a aparência de 5 barras alimentícias (tratamentos A, B, C, D e E) por 70 provadores (blocos), denominado ex2 no tutorial do pacote ExpDes. Foi apresentada a saída da análise de variância seguida do teste de comparações múltiplas baseado na distribuição F, onde podem ser observados os valores das médias de cada tratamento. 3 Resultados e discussões Para se utilizar a função dbc() é necessário, primeiramente, carregar o pacote ExpDes. A função que aplica o teste de comparações múltiplas baseado na distribuição F é chamada dentro da função dbc() e um exemplo de uso dessa função é: dbc(trat, bloco, resp, mcomp = "ccf"). Deve ser notado que foram usados os valores padrão quali = T e de 0,05 para os argumentos sigf e sigt. Assim, o R assume que os tratamentos são qualitativos e o nível de significância adotado para o teste F e para o teste de comparações múltiplas é de 5%. Ao se escolher a opção ccf, a função ccf(), que realiza o teste de comparações múltiplas aqui descrito, é chamada automaticamente. Com a criação da função dbc() do pacote ExpDes já havia sido possível realizar a análise de variância seguida do teste de comparações múltiplas escolhido de uma só vez, facilitando muito a execução e interpretação da análise de um experimento em DBC. Com a incorporação da função ccf() será dada mais uma opção de um teste de comparação de médias que apresenta os resultados sem ambiguidade. A saída obtida é a análise de variância dos dados seguida das médias com os agrupamentos realizados pelo teste, ilustrada na Figura 1. Houve diferença entre os tratamentos pois o valorp para a fonte de variação Tratamento foi menor do que o nível nominal de significância 3

Figura 1: Análise de variância, seguida do teste de comparação de médias baseado na distribuição F a 5% para um experimento que avaliou a aparência de 5 barras alimentícias (A, B, C, D e E) por 70 provadores (blocos). de 0,05. A função dbc() verifica se os resíduos seguem uma distribuição normal e isso foi confirmado para o conjunto de dados do exemplo. O teste de comparações múltiplas baseado na distribuição F resultou em três agrupamentos (a, b e c), podendo-se dizer que os tratamentos que apresentam maior média são o D, E e C, não havendo diferença entre eles, em seguida aparecem os tratamentos B e A, respectivamente, com resultados inferiores. Esse foi agrupamento obtido também pelos outros testes 4 Conclusões A função ccf() foi adicionada à função dbc() e retornou as médias, bem como as letras que correspondem aos agrupamentos formados por elas, de forma rápida, clara e eficiente, mesmo para usuários que não sejam estatísticos. Referências [1] CALIŃSKI, T.; CORSTEN, L. C. A. Clustering means in ANOVA by Simultaneous Testing. Biometrics. v. 41, p. 39-48, 1985. [2] FERREIRA, D. F. Sisvar: Um programa para análises e ensino de estatística. Revista Symposium. v. 6, p. 36-41, 2008. 4

[3] FERREIRA, E. B.; CAVALCANTI, P. P.; NOGUEIRA, D. A. Experimental Designs package. 2011. Disponível em: http://cran-r.c3sl.ufpr.br/bin/windows/contrib/rrelease/expdes 1.1.1.zip. Acesso: 23 de dezembro de 2011. [4] MACHADO, A. A.; DEMÉTRIO, C. G. B.; FERREIRA D. F.; SILVA J. G. C. Estatística experimental: uma abordagem fundamentada no planejamento e no uso de recursos computacionais. In: 50 a Reunião Anual da Região Brasileira da Sociedade Internacional de Biometria, Londrina. Londrina: Editora ISBN. 2005. 290 p. [5] R Development Core Team. R: A language and enviroment for statistical computing. Vienna, Austria: R Foundation for Statistical Computing. 2011. Disponível em: http://www.r-project.org. Acesso: 01 de novembro de 2011. [6] RAMOS, P. S.; FERREIRA, D. F. Agrupamento de médias via bootstrap de populações normais e não-normais. Revista Ceres. v. 56, p. 140-149, 2009. [7] SILVA, E. C.; FERREIRA, D. F.; BEARZOTI, E. C. G. B. Avaliação do poder e taxas de erro tipo I do teste de Scott-Knott por meio do método de Monte Carlo. Ciência Agrotécnica. v. 23, p. 687-696, 1999. 5