Comparação de testes paramétricos e não paramétricos aplicados em delineamentos experimentais

Comparação de testes paramétricos e ão paramétricos aplicados em delieametos experimetais Gustavo Mello Reis (UFV) gustavo_epr@yahoo.com.br José Ivo Ribeiro Júior (UFV) jivo@dpi.ufv.br RESUMO: Para comparar mais de dois íveis de um fator de iteresse sob os delieametos iteiramete (DIC) e em blocos casualizados (DBC), podem ser usados os testes ão paramétricos de Kruskal-Wallis e Friedma, respectivamete, além do teste F da aálise de variâcia (A OVA). Com base a simulação de mil amostras com 5, 10 e 5 repetições por amostra, foram estimados os alarmes falso (α) e verdadeiro (poder) sob as distribuições ormal, logormal e biomial, para Ho verdadeira e falsa, respectivamete. As estimativas desses alarmes se referem às proporções dos p-valores meores ou iguais a cada valor de α teórico, o itervalo de 0 α 1 as duas hipóteses. Desse modo, para um DIC, foram plotados um gráfico de dispersão, as estimativas de α pelos testes F da A OVA e de Kruskal-Wallis em fução do α teórico, sedo o mesmo feito para as estimativas do poder (Pd) destes testes. Para um DBC, de acordo com os testes F da A OVA e de Friedma, foram adotados os mesmos procedimetos. De acordo com os gráficos costruídos, cocluiu-se que o teste F, tato para o DIC quato para o DBC, proporcioou estimativas do Pd maiores que a dos testes ão paramétricos. Palavras-chave: Testes de hipóteses; Comparação; Delieametos experimetais. 1. Itrodução A formulação de hipóteses tem sido muito empregada em pesquisas de diversas áreas do cohecimeto. Para decidir se uma determiada hipótese é cofirmada por um cojuto de dados, é ecessário ter um procedimeto objetivo para aceitar ou rejeitar a hipótese (SIEGEL & CASTELLAN, 006). Segudo Shimakura, métodos estatísticos são utilizados para o plaejameto e codução de um estudo, descrição dos dados e para tomada de decisões, ode pode-se citar os testes de hipóteses que se baseiam os riscos associados às mesmas. Quado formulamos uma decisão sobre Ho podem ocorrer dois erros distitos. O primeiro, desigado por erro tipo I, cosiste em rejeitar a hipótese ula quado ela é verdadeira. O segudo, desigado por erro tipo II, cosiste em aceitar Ho quado ela é falsa. A estes erros estão associados uma probabilidade: P(rejeitar Ho Ho verdadeira) = α; P(aceitar Ho Ho falsa) = β (CÂMARA & SILVA, 001). Os testes de hipóteses se dividem em paramétricos e ão paramétricos. Os paramétricos são aqueles que utilizam os parâmetros da distribuição, ou uma estimativa destes, para o cálculo de sua estatística. Normalmete, estes testes são mais rigorosos e possuem mais pressuposições para sua validação. Já os ão paramétricos utilizam, para o cálculo de sua estatística, postos atribuídos aos dados ordeados e são livres da distribuição de probabilidades dos dados estudados. Segudo Moore & McCabe (00), os testes de hipóteses estão etre os tipos mais comus de iferêcia. Percebe-se que os testes de hipóteses paramétricos são os mais utilizados, muitas vezes devido ao ão cohecimeto dos seus cocorretes ão paramétricos. 1

No etato, segudo Siegel & Castella (006), a validação dos resultados dos testes paramétricos depede da verificação de suas pressuposições, como por exemplo a ormalidade dos dados, pressuposição básica para aplicação da maioria dos testes paramétricos. Desse modo, é iteressate verificar até que poto os resultados dos testes paramétricos serão prejudicados quado a pressuposição de ormalidade ão veha a ser satisfeita.. Testes de hipóteses aplicáveis em delieametos experimetais O teste paramétrico, sob ormalidade, mais usual em experimetos com um fator, com mais de dois íveis de iteresse, é o F da aálise de variâcia (ANOVA), que pode ser realizado segudo os delieametos iteiramete casualizado (DIC) e em blocos casualizados (DBC). O teste ão paramétrico de Kruskal-Wallis foi itroduzido por estes autores, Kruskal e Wallis, em 195, como um competidor ou um substituto do teste F da ANOVA segudo um IDC (CAMPOS, 1976). Assim como a maioria dos testes ão paramétricos, este também dispõe as respostas dos tratametos que serão comparados a forma de postos. Quato maior for a difereça etre a soma dos postos, maior será a evidêcia de que exista difereça etre os mesmos. Mesmo ão precisado da exigêcia de ormalidade ou de outra distribuição qualquer para as populações estudadas, o teste exige que a distribuição dos erros a mesma para todos os íveis. Como alterativa ão paramétrica ao teste F da ANOVA, segudo o DBC, existe o teste de Friedma. 3. Objetivo O presete trabalho teve como objetivo pricipal comparar a eficiêcia etre os métodos paramétricos e ão paramétricos aplicáveis em comparações múltiplas, para dados sob a preseça de ormalidade ou ão. A comparação foi feita através das estimativas do erro α e do poder do teste (Pd), em que α é a probabilidade de rejeitar a hipótese Ho quado ela é verdadeira (alarme falso) e Pd é a probabilidade de rejeitar a hipótese Ho quado ela é falsa (alarme verdadeiro). 4. Metodologia empregada 4.1. Simulação dos dados Para estimar o α e o Pd, foi aalisado o quadrado do parâmetro phi (Ф ) que, segudo Motgomery & Ruger (003), está relacioado ao parâmetro delta (δ) de ão cetralidade. Foi adotado Ф = 0 (Ho verdadeira) para estudar o e Ф = 4 (Ho falsa) para estudar o Pd estimado, de acordo com a seguite fórmula: Φ a τ i i= 1 =, em que: aσ = º de repetições (DIC) = º de blocos (DBC); τ i = efeito do tratameto i; a = º de médias a serem testadas; σ = variâcia do erro experimetal.

Os parâmetros (º de repetições) e a (º de médias a serem testadas) foram especificados em a = 5 (íveis) e = 5, 10 ou 5. Já os parâmetros τ i e σ foram estabelecidos de forma a obter Ф = 0 e Ф = 4, para as hipóteses Ho falsa e veradeira, respectivamete. No primeiro caso, para obter Ф = 0, basta adotar τ i = 0, i, i = {1,, 3, 4, 5}. Já o segudo caso, para obter Ф = 4, deve-se combiar os valores dos τ i s com os valores de σ. Φ a Logo, pode-se obter o valor do τ i através da equação de Ф, da seguite forma: a τ i i= 1 = => aσ a i= 1 τ i = i= 1 aσ Φ Neste estudo foram simulados dados por meio da imposição de que τ i 0 para somete um tratameto. Logo, para a = 5 e Ф = 4, tem-seτ = τ = τ = τ 0, sedo a equação utilizada para estimar τ 5 igual a: (0 5 4 + 0 + 0 + 0 +τ 5 ) = = > σ 0σ τ 5 = => 1 3 4 = τ 5 = σ No caso do DBC, primeiro foi realizada a simulação da distribuição com os parâmetros de iteresse, assim como o DIC, para depois somar a estes, os efeitos dos blocos e, em seguida, o erro aleatório relacioado a cada valor. O efeito do bloco foi represetado pela adição de 40 uidades em relação ao bloco aterior. Os efeitos do erro aleatório foram simulados de acordo com as seguites distribuições: Os parâmetros que regem as três distribuições e também o tamaho da amostra (), foram aalisados em diferetes situações com o objetivo de verificar qual o efeito que estes parâmetros têm sobre o α e o Pd estimados. Para os dados simulados a partir da distribuição logormal, foram cosiderados os parâmetros µ l = l(µ) e σ l = σ/ µ, de forma aproximada. A cofiabilidade deste estudo se baseia a quatidade de amostras simuladas. Para a costrução de cada gráfico ilustrado foram simuladas quihetas mil amostras e aplicados duzetos mil testes. Descosiderado as simulações em fase de teste e outras que tiveram que ser refeitas para alguma alteração, para a realização deste estudo foram simuladas dez milhões e quihetas mil amostras e aplicados quatro milhões e duzetos mil testes. 4.. Realização dos Testes Como α é a probabilidade de rejeitar Ho quado esta é verdadeira (Ф = 0) e o Pd é a probabilidade de rejeitar Ho quado esta é falsa (Ф = 4), a estimação destes foi realizada por meio de 1000 amostras simuladas de cada distribuição estudada. Em seguida foram aplicados os testes estatísticos paramétricos, F da ANOVA DIC () e da ANOVA DBC (), e ão paramétricos, de Kruskal-Wallis () e de Friedma (Fr). Os parâmetros utilizados a simulação dos dados foram aqueles utilizados a formulação das hipóteses Ho s. Para aplicação do teste biomial, foram realizadas algumas maipulações os dados simulados. Primeiro foi realizada uma subtração dos valores da amostra simulada pela média populacioal (µ). Em seguida foi atribuído o valor 1 para os valores positivos e 0 para os valores egativos, sedo os valores ulos descartados. Por fim, o teste biomial foi aplicado à ova amostra de zeros e us, sedo p = 0,5 a hipótese ula (Ho). 0 3

4.3. Programa R As simulações dos dados, a aplicação dos testes e as estimativas do α e do Pd, foram realizados utilizado-se o programa gratuito R. No programa, foram programadas fuções para gerar os dados de acordo com os parâmetros de iteresse e para aplicar os testes sobre os dados criados, armazeado o p-valor de cada teste, para as 1000 amostras de cada distribuição. Com os 1000 p-valores retorados de cada teste e de acordo com o variado de 0 a 1 em itervalos de 1, foram cotabilizados quatas amostras foram rejeitadas o respectivos valores de α que, pela defiição, é o ( αˆ ), para Ф = 0, ou seja, a probabilidade de rejeitar a hipótese ula quado esta é verdadeira (alarme falso) e, o Pd estimado ( Pˆ d ), para Ф = 4, ou seja, a probabilidade rejeitar a hipótese ula quado esta é falsa (alarme verdadeiro). Para obter valores mais precisos do α e do Pd estimados, a fução foi programada, também, para repetir o processo de simulação dos dados, aplicação dos testes e estimação do α e do Pd, por 100 vezes e, em seguida, calcular a média dos 100 valores ecotrados para cada. Assim, com mais precisão, a média ecotrada, em cada caso, será o α e o Pd estimados, que foram salvos em arquivos do tipo csv. 4.4. Gráfico de dispersão Para melhor avaliar o α e o Pd estimados, foram plotados gráficos de dispersão da probabilidade acumulada, ode para Ф = 0 permitiu estudar o (eixo y) em fução do (eixo x) e, para Ф = 4, foi estudado o Pd estimado (eixo y) em fução do α de referêcia (eixo x), para todos os testes aplicados. Sedo a distâcia o eixo x (), etre um par ordeado e outro, de apeas 1, estes pares foram ligados por lihas para reproduzir a cotiuidade destes valores, ou seja, ao ivés de mostrar iúmeros potos cosecutivos que distam etre si de apeas 1, foi exibida uma liha cotíua que percorre todo o digrama de dispersão. Os gráficos de dispersão da probabilidade acumulada, foram costruídos o programa comercial Microsoft Excel, cotedo uma liha represetativa de cada teste em estudo, para cada uma das três distribuições. 4.5. Aálise dos gráficos Para a aálise do erro α, primeiro foi comparada uma situação com o aumeto do desvio padrão (σ), para as distribuições de probabilidades ormal e logormal. Para a biomial, fez-se referêcia ao coeficiete de variação (CV), ao ivés do σ, porque a média em sempre era matida. Já para o CV ( σ / µ ), esta variação a média será cosiderada. Neste caso, tem-se σ = b p (1 p) e µ = b x p. Note que para idicar o úmero de ites avaliados a distribuição biomial, foi utilizado o símbolo b, com objetivo de difereciá-lo do símbolo que, este estudo, represeta o tamaho da amostra simulada. Em seguida, foi avaliado um aumeto do tamaho da amostra simulada (). Para aálise do Pˆ d, teve uma comparação a mais em relação ao α, que é a comparação do desvio para cima da média (τ positivo) com o desvio para baixo da média (τ egativo), sedo as outras iguais às utilizadas para o αˆ. As discussões para αˆ, será feita com base em α s de referêcia o itervalo de 0 a, o qual é exibido o gráfico. Já para o Pd, os α s de referêcia exibidos estarão o 4

itervalo de 0 a 0,30. Estes itervalos foram escolhidos de forma a obter uma melhor comparação visual dos testes, e, também, por abrager a maior parte dos estudos. Para facilitar a idicação dos parâmetros simulados em cada gráfico, cosidere como apresetado a Tabela 1, para i variado de 1 a 4. TABELA 1. Parâmetros das distribuições Distribuição ormal Distribuição Log ormal Distribuição Biomial i = 5 = i = 5 = i = 5 = µ i = µ; µ 5 = µ + τ µ li = µ l = l(µ); µ l5 = l(µ + τ) b i = b 5 = b σ i = σ σ li = σ l σ/µ; σ l5 σ/(µ+ τ) p i = p; p 5 = p + τ p Ode: 0 τ = σ e, τ p = σ p 0 p (1 p), sedo σ p =. b Em que σ p é o desvio padrão do parâmetro p da distribuição biomial. Note que quado τ = 0, para o estudo de alfa, tem-se µ i = µ 5 (ormal), µ li = µ l5 e σ li = σ l5 (logormal) e quado τ p = 0, p i = p 5 (biomial). 5. Resultados e Discussões 5.1. Alfa Observado os gráficos a seguir, pode-se perceber certa semelhaça etre os resultados obtidos para o DIC e DBC, sedo as especificações dos testes de Kruskal-Wallis (), e Friedma (Fr), semelhates para as distribuições ormal, logormal e biomial. Ao aumetar o σ ou o CV, observa-se as Figuras 1 e (ormal), 4 e 5 (logormal) e 7 e 8 (biomial), que ão houve grades alterações para o em todos os testes. Percebe-se também, que ao aumetar o de 5 para 5, observa-se as Figuras 1 e 3 (ormal), 4 e 6 (logormal) e 7 e 9 (biomial), que há um aumeto as estimativas de α para os testes ão paramétricos, e Fr, tato que estes passam a ter α s estimados semelhates aos observados para a ANOVA ( e ), sedo esta pouco iflueciada pelo aumeto de. De todo modo, todas as estimativas de α estão próximas aos valores teóricos. 5.1.1. Distribuição ormal FIGURA 1 - Amostras simuladas com = 5, µ = 1000, σ = 30, τ = 0 5

FIGURA - Amostras simuladas com = 5, µ = 1000, σ = 150, τ = 0 FIGURA 3 - Amostras simuladas com = 5, µ = 1000, σ = 30, τ = 0 5.1.. Distribuição Log ormal FIGURA 4 - Amostras simuladas com = 5, µ l = l(1000), σ l = 30/1000, τ = 0 6

FIGURA 5 - Amostras simuladas com = 5, µ l = l(1000), σ l = 150/1000, τ = 0 FIGURA 6 - Amostras simuladas com = 5, µ l = l(1000), σ l = 30/1000, τ = 0 5.1.3. Distribuição Biomial FIGURA 7 - Amostras simuladas com = 5, b = 1000, p = 0,1, τ p = 0 7

FIGURA 8 - Amostras simuladas com = 5, b = 100, p = 0,1, τ p = 0 FIGURA 9 - Amostras simuladas com = 5, b = 1000, p = 0,1, τ p = 0 5.. Poder Para a estimação do PD, a semelhaça observada etre o DIC e DBC está relacioada ao comportameto dos testes, quado se altera as variáveis em estudo. De forma geral, as estimativas do Pd dos testes utilizados o DBC foram meores que aquelas obtidas o DIC, em todas as situações estudadas. Etretato, essa difereça foi maior etre os testes ão paramétrico. Etre as distribuições, a semelhaça observada é com relação ao aumeto de, de 5 para 10, em que as estimativas do Pd dos testes aumetaram sigificativamete, sedo os aumetos ocorridos os testes ão paramétricos, maiores que os paramétricos, mas ão suficiete para alcaçar o Pd dos últimos que foram sempre superiores em todos os casos estudados. As mudaças o desvio da média, para baixo e para cima, provocado em um dos tratametos (τ), ão alterou o Pd dos testes sob distribuição ormal (Figuras 10 e 11), como já era de se esperar, já que é uma distribuição simétrica. Para a distribuição logormal (Figuras14 e 15), observa-se uma pequea queda o Pd dos testes ão paramétricos, e 8

Fr, ao provocar um desvio para baixo da média. Já para a distribuição biomial (Figuras 18 e 19) percebe-se um maior Pd para ambos os testes ao provocar um desvio para baixo da média. Para um aumeto o σ a distribuição ormal (Figuras 10 e 1), ão houve mudaça sigificativa a estimativa do Pd dos testes. Já para a distribuição logormal (Figuras 14 e 16), percebeu-se uma ligeira dimiuição o Pd do teste F da e da e um ligeiro aumeto o Pd dos testes e Fr. Esta difereça pode ser explicada pelo maior distaciameto da distribuição ormal ao aumetar o σ l da distribuição logormal. No etato, o teste F cotiuou tedo maior Pd para α <, que abrage a maior parte dos estudos. Já para a distribuição biomial (Figuras 18 e 0), houve uma dimiuição o Pd dos testes ao aumetar o CV. Novamete, esta alteração se deve ao maior distaciameto da distribuição ormal ao dimiuir o b (aumeto de CV) da distribuição biomial. No etato, a distâcia etre o Pd do teste F ( e ) e os testes ão paramétricos, e Fr, aumetou. Portato, este distaciameto da ormalidade beeficiou o teste paramétrico, diferetemete do esperado. 5..1. Distribuição ormal FIGURA 10 - Amostras simuladas com = 5, µ = 1000, σ = 30, τ = 60 FIGURA 11 - Amostras simuladas com = 5, µ = 1000, σ = 30, τ = -60 9

FIGURA 1 - Amostras simuladas com = 5, µ = 1000, σ = 150, τ =300 FIGURA 13 - Amostras simuladas com = 10, µ = 1000, σ = 30, τ = 30 5... Distribuição Log ormal FIGURA 14 - Amostras simuladas com = 5, µ l = l(1000), σ l = 30/1000, τ = 60 10

FIGURA 15 - Amostras simuladas com = 5, µ l = l(1000), σ l = 30/1000, τ = -60 FIGURA 16 - Amostras simuladas com = 5, µ l = l(1000), σ l = 150/1000, τ = 300 FIGURA 17 - Amostras simuladas com = 10, µ l = l(1000), σ l = 30/1000, τ = 30 11

5..3. Distribuição Biomial FIGURA 18 - Amostras simuladas com = 5, b=1000, p=0,1, τ p = 0,36 1000 FIGURA 19 - Amostras simuladas com = 5, b=1000, p=0,1, τ p = 0,36 1000 FIGURA 0 - Amostras simuladas com = 5, b=100, p=0,1, τ p = 0,36 100 1

FIGURA 1 - Amostras simuladas com = 10, b=1000, p=0,1, τ p = 0,18 1000 6. Coclusões O teste paramétrico F da ANOVA obteve resultados mais satisfatórios que os testes ão paramétricos de Kruskal-Wallis e de Friedma, mesmo para situações que se distaciam da ormalidade. Pode-se observar um maior Pd para o teste F o itervalo estudado (α ), além de que os valores de s por este teste foram muito próximos ao α de referêcia, em todos os casos estudados. Resultado semelhate foi obtido por Feir & Toothaker (1974), ode eles cocluíram que o teste de Kruskal-Wallis tem seu Pd afetado pela dimiuição do tamaho da amostra e, também, pela dimiuição da variâcia, para baixos íveis de sigificâcia (α), sedo o teste F da ANOVA capaz de se adaptar melhor às diferetes situações. A mudaça dos parâmetros das distribuições logormal e biomial provocam maiores alterações o comportameto dos testes em relação à distribuição ormal, pricipalmete para os testes ão paramétricos. Em sítese, ão há ecessidade de substituir o teste paramétrico F pelos seus respectivos competidores ão paramétricos a ausêcia de ormalidade. Referêcias CÂMARA, F. G. & SILVA, O. Estatística Não Paramétrica - Testes de Hipóteses e Medidas de Associação. Departameto de Matemática - Uiversidade dos Açores, Pota Delgada, 001. CAMPOS, H. Estatística experimetal ão paramétrica. ª ed. Escola Superior de Agricultura Luiz de Queiroz, USP. Piracicaba, 1976. FEIR, BETTY J. & TOOTHAKER, LARRY E. The ANOVA F-Test Versus The Kruskal-Wallis Test: A Robustess Study. Artigo publicado em: Aual Meetig of the America Educatioal Research Associatio. Chicago, 1974. MONTGOMERY, D.C. & RUNGER, G.C. Estatística aplicada e probabilidade para egeheiros. Tradução de Verôica Calado. a ed. Rio de Jaeiro: Editora LTC, 003. MOORE, D. S. & MCCABE, G. P. Itrodução à prática da estatística. 3ª ed. Rio de Jaeiro: Editora LTC, 00. SIEGEL, S. & CASTELLAN JR., N. J. Estatística ão-paramétrica para ciêcias do comportameto. Tradução de Sara Iada Correa Carmoa. ª ed. Porto Alegre: Editora Artmed, 006. SHIMAKURA, S. E. Bioestatística A. Departameto de Estatística, UFPR. Dispoível em: http://leg.ufpr.br/~shimakur/ce055/. Acesso em: 9/08/007. 13