ANÁLISE DE MEDIDAS REPETIDAS NO TEMPO USANDO O SAS Euclides Braga MALHEIROS * Medidas repetidas no tempo: medidas tomadas em uma seqüência de tempos, em uma mesma unidade experimental. Os experimentos com medidas repetidas no tempo envolvem geralmente fatores: tratamentos e tempos, e são freqüentes em experimentos com animais, plantas, humanos, etc. O objetivo principal desse tipo de experimento é examinar e comparar as tendências dos tratamentos ao longo do tempo. Isto pode envolver comparações entre tratamentos dentro de cada tempo, ou comparações de tempos dentro de cada tratamento. Considere o exemplo: Cinco variedades de uma cultura (tratamentos) avaliadas ao longo do tempo (0, 30, 60, 90, 10 e 150 dias), em um experimento inteiramente casualizado, com 3 repetições. Os dados observados são apresentados a seguir: Tabela 1. Dados de porcentagem de açúcar na cana, em pol%, obtidos em um DIC com 3 repetições, envolvendo 5 variedades de cana, observados em 6 tempos de desenvolvimento da cultura. Variedades Rep. Tempo em dias 0 30 60 90 10 150 1 11,8 14,86 13,84 15,53 15,49 15,8 V1 1,07 14,44 13,9 15,47 16,34 18,64 3 1,45 14,18 13,76 14,35 15,93 16,5 1 1,47 15,19 15,0 15,54 18,53 15,76 V 11,07 13,38 14,61 14,07 17,84 16,91 3 10,66 14, 13,54 15,93 15,94 16,81 1 1,9 14,49 13,40 13,68 16,6 14,78 V3 10,9 14,4 14,6 15,84 16,9 15,6 3 1,83 13,9 15,69 15,1 14,91 17, 1 11,96 14,71 14,98 15,5 16,1 15,53 V4 13,38 15,07 13,6 15,39 15,77 16,51 3 10,37 15,78 13,33 14,50 16,66 16,34 1 11,05 13,18 14,61 14,88 16,51 16,36 V5 10,63 13,14 14,53 14,1 16,57 15,4 3 13,43 14,08 14,3 14,11 15,86 17,50 Fonte: Nogueira (1995) Como se sabe, nas análise usuais do SAS (enfoque univariado) no SAS-DATA-SET as colunas são as variáveis e as linhas os registros, e assim sendo, os dados devem ser organizados na forma apresentada a seguir: * Departamento de Ciências Exatas FCAV/UNESP, Campus de Jaboticabal. 14870-000 Jaboticabal SP
Dados na forma univariada: Variedade Tempo Repetição Y 1 0 1 11.8 1 0 1.07 1 0 3 1.45 1 30 1 14.86............ 5 3 150 17.50 Para um tipo de análise de medidas repetidas no tempo (enfoque multivariado) o SAS- DATA-SET deve conter uma variável (coluna) para cada tempo. Dados na forma multivariada : Variedade Repetição T1 T... T6 1 1 11.8 14.86... 15.8 1 1.07 14.44... 18.64 1 3 1.45 14.18... 16.5 1 1.47 15.19... 15.76.................. 5 150 13.43 14.08... 17.50 Exercício 1: Fazer um programa SAS para criar os SAS-DATA-SET multivariado quando os dados estão digitados da forma univariada (MRT1U.TXT).! ##$%$&%'$%&$(%$'%)$)%** Exercício : Representar graficamente os perfis médios 5 tratamentos (Variedades), ao longo do tempo.
3 $$,-. ##$$''$&&$$))** '&) -!%)%&% / --%) '/ --%) &/ --%)./ --%) )/ --%) -- MÉTODOS PARA ANALISAR MEDIDAS REPETIDAS NO TEMPO 1. Comparação dos tratamentos em cada tempo. Exercício 3: Fazer um programa SAS para, com os dados da Tabela 1, avaliar os efeitos de tratamentos, em cada tempo. 01343560708943931:;908:1<3739:10 &
4. Tabela : Valores de F, com respectivas probabilidades, Coeficiente de Variação (CV), e médias obtidas na análise da variância, em cada tempo. Estatística Tempo 0 30 60 90 10 150 F p/ Tratam. 0,15(>0,10) 3,5(0,048) 0,56(>0,10) 0,49(>0,10),1(>0,10) 0,47(>0,10) CV 10,55% 3,96% 5,18% 5,1% 4,70% 6,49% Média Tr.1 1,11 14,49 ab* 13,84 15,1 15,9 16,99 Tr. 11,40 14,6 ab 14,39 15,18 17,44 16,49 Tr.3 1,01 14,8 ab 14,57 14,88 15,8 15,87 Tr.4 11,90 15,19 a 13,98 15,05 16,1 16,13 Tr.5 11,70 13,47 b 14,49 14,40 16,31 16,37 * Médias seguidas da mesma letra, na coluna, não diferem entre si pelo teste de Tukey (P<0,05). Nesta Tabela observa-se que apenas no tempo 30 há efeito significativo para tratamentos. Os resultados desse tipo de análise, apesar de informativos, não atendem aos objetivos do experimento que é comparar as tendências dos tratamentos ao longo do tempo.. Análise univariada como parcelas subdivididas. Historicamente, o método mais utilizado para análise de medidas repetidas no tempo é a análise univariada num esquema em parcelas subdivididas, tendo o tempo como subparcelas. Referenciado na literatura como parcelas subdivididas no tempo. Exercício 4: Fazer um programa SAS para a análise de variância univariada dos dados da Tabela 1, considerando um esquema em parcelas subdivididas.
5 /* Análise univariada como parcelas subdivididas */ #*& -#*.#*. Resultado da análise: Tabela 3: Valores de F, com respectivas probabilidades, Coeficiente de Variação (CV), e médias obtidas na análise da variância. ESTATÍSTICAS Variável Y F p/ Tratam.(Tr) 0,56(0,6969) F p/ Tempo (Tp) 54,4(0,0001) F p/ int. Tr x Tp 0,84(0,6546) CV% - Parcelas 6,5% CV% - Subparcelas 6,0% O problema deste método de análise é que o delineamento em parcelas subdivididas a matriz de covariâncias é do tipo homogênea (condição suficiente para que os testes F sejam exatos), ou seja: Se a matriz de variâncias e covariâncias é: σ 1 σ1... σ1 t = σ 1 σ... σ t,............ σ t1 σ t... σ t onde σ i é a variância no tempo i, e σ ij é a covariância entre os tempos i e j, na estrutura homogênea σ i =σ, i e σ ij= ρ, i j. Essa estrutura não é a esperada para dados com medidas repetidas no tempo, o que faz com que os testes F correspondentes a Tempo e interação Tempo x Tratam. podem não serem exatos. O que se encontra na literatura é que as medidas repetidas em uma mesma unidade experimental (animal, plantas ou humanos) são correlacionadas e que medidas em tempos mais próximos apresentam correlações mais altas que em tempos mais distantes. Uma estrutura que tem sido estudada é a autoregressiva. Segundo Huynh & Feldt (1970) uma condição necessária e suficiente para que os testes F sejam exatos, mais geral da forma de, é que: ( σ k σ k ' ) σ kk ' = λ, k k. onde λ é a diferença entre as médias das variâncias e as medias das covariâncias.
6 Esta condição, denominada condição H-F ou condição de esfericidade (ou circularidade) da matriz, eqüivale a especificar que as variâncias das diferenças entre pares de tempos sejam todas iguais, ou seja: σ Yk Y k ' = c, k k' Para exemplificar, verifique se a matriz abaixo satisfaz a condição de esfericidade: 5,0,5 = 5,0 7,5,5 10,0 7,5 10,0 5,0 7,5 15,0 1,5 7,5 10,0. 1,5 0,0 Observe que λ = (5,0 10,0 15,0 0,0) (,5 5,0 7,5 7,5 10,0 1,5) = 5,0 4 6 (5,0 10,0) (5,0 15,0) e σ 1 = 5,0 =,5, σ13 = 5,0 = 5, 0 ; e assim por diante. Ainda mais: σ Y 1 5,0 10,0 (,5) 10,0 1 Y = σ σ σ = = ; 1 σ Y 1 Y 3 = σ 1 σ 3 σ 13 = 5,0 15,0 (5,0) = 10,0 ; e assim por diante. Logo a matriz satisfaz a condição de esfericidade. Exercício 4: Fazer um programa SAS para obter a matriz de covariâncias entre os tempos dos dados da Tabela 1. /* OBTENÇÃO DA MATRIZ DE COVARIÂNIAS ENTRE TEMPOS */ $$,-
7 Observando a matriz de covariâncias resultante, observa-se que não é fácil visualizar se a condição de esfericidade é satisfeita. Murchly (1940) apresenta um teste para a condição de esfericidade. Segundo Box (1954), Geisser & Greenhouse (1958), Greenhouse & Geisser (1959) e Huynh & Feldt (1976), ainda que a matriz não satisfaça a condição de esfericidade, a distribuição F central poderá ser usada), de maneira aproximada, para sub-parcelas (S) e para a interação entre parcelas e sub-parcelas (P*S), se forem efetuadas correções nos graus de liberdade dessas fontes de variação (multiplicando os originais por um fator ε, (t-1) -1 ε 1, onde t é o número de tempos). Em 1984 o comando REPEATED foi incluído no PROC GLM do SAS. Este comando executa análises uni e multivariadas, incluindo o teste de esfericidade de e as correções de graus de liberdade sugeridas na literatura. 3. Análise usando o comando REPEATED do PROC GLM. Para este tipo de análise os dados devem estar na forma multivariada (uma coluna para cada tempo). A sintaxe para o uso desse procedimento é: Sintaxe: PROC GLM <opções 1>; CLASS <fator Tra.>; MODEL <Lista Var.Tempo>=<fator Trat.>/<opções >; REPEATED <fator tempo> <nº níveis fator tempo> [<(valores níveis fator tempo)>] <tipo de contrastes>/<opções 3>; RUN; Uma das possíveis <opções 1> é: DATA=<SDS> - especifica o SAS-DATA-SET a ser usado. Uma das possíveis <opções > é: NOUNI não executa as análises unidimensionais, dentro de cada tempo. Alguns dos possíveis <tipos de contrastes> são: CONTRAST [(nível referencial)] gera contrastes entre cada nível do fator tempo com o nível referencial. Quando o nível referencial não for especificado, considera o último. POLYNOMIAL gera contrastes de polinômios ortogonais para os níveis do fator tempo. HELMERT gera contrastes entre cada nível do fator tempo com a média dos subsequentes. MEAN (nível referencial) gera contrastes entre o cada nível (exceto o referencial) com a média dos outros. PROFILE gera contrastes entre níveis adjacentes do fator tempo.
8 Para exemplificar, para 4 níveis para o fator tempo, os coeficientes dos contrastes são: Tipo de contraste CONTRAST () POLYNOMIAL HELMERT MEANS (3) PROFILE Coeficientes dos contrastes -1 1 0 0 0 1-1 0 0 1 0-1 -3/0-1/0 1/0 3/0 1/4-1/4-1/4 1/4-1/0 3/0-3/0 1/0 1-1/3-1/3-1/3 0 1-1/ -1/ 0 0 1-1 1-1/3-1/3-1/3-1/3 1-1/3-1/3-1/3-1/3-1/3 1 1-1 0 0 0 1-1 0 0 0 1-1 Observe que apenas os contrastes tipo POLYNOMIAL e HELMERT são ortogonais. Algumas das <opções 3> são: CANONICAL executa uma análise canônica das matrizes H e E. HTYPE=n especifica o tipo da soma de quadrados a ser usado. NOM Não executa a análise multivariada. NOUNI Não executa as análises univariadas. PRINT E H M V Imprime a matriz especificada: E - matriz da soma de quadrados dos produtos cruzados (SS&CP) para erros. Com a opção PRINTE o SAS apresenta o teste de esfericidade da matriz de covariâncias. H - matriz da soma de quadrados dos produtos cruzados (SS&CP) para a Hipótese. M - matriz dos contrates. V - matriz dos auto-valores e auto-vetores associada ao teste. SUMMARY apresenta a tabela da análise da variância dos contrastes para o fator tempo. Exercício 5: Fazer um programa SAS obter a análise usando o comando REPEATED do PROC GLM, para os dados da Tabela 1. ;=>?8:@83;700<013;70 70 ' &##$%$&%'$%&$(%$'%)$)%** &
9 INTERPRETAÇÃO DOS RESULTADOS: a) Teste de esfericidade. :89A04B:4?<?9C3@<B>CD84?9:4?0;%()%' B?8E@34:40F?139?0;&'G?9B7A40HIB?8E@34:%)%( >?:79049B0J0;3>010;:;98 :89A04B:4?<?9C3@<B>CD84?9:4?0;%()%' B?8E@34:40F?139?0;&'G?9B7A40HIB?8E@34:%)%( O SAS apresenta testes de esfericidade. O primeiro depende do tipo de contrastes solicitado e o segundo é válido para qualquer conjunto de contrastes ortogonais. Observa-se com esses resultados que a condição de esfericidade da matriz não deve ser rejeitada. Assim sendo os testes envolvidos na análise anterior (Parcelas subdivididas) são exatos. Exercício 6: Fazer o gráfico de perfis médios e a análise usando o comando REPEATED do PROC GLM, para os dados da Tabela 4. Tabela 4. Dados de IAF de cinco genótipos de leguminosas, avaliados em 7 épocas (dias), obtidos em um DBC. Genótipo Bloco Número de dias 88 104 10 137,5 153,5 181,5 09,5 1 1 0,13 0,39 0,46 0,5 1,18 0,87 0,51 1 0,31 0,5 1,07 0,44 1,11 1,41 1,08 1 3 0, 0,40 0,53 3,61 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,9 0,74 1 0,13 0,36 0,89 0,6 1,64 1,61 1,4 0,7 0,10 0,53 0,60 1,5 1,01 1,09 3 0,13 0,41 1,03 3,60 1,9 0,56 1,09 4 0,08 0,55 0,6 1,04,47 1,45 1,1 3 1 0,84 1,44,31 6,07 3,90 3,4,00 3 0,45 1,18,66 3,88 4,03 3,09 0,99 3 3 0,67,39 4,5 6,33 4,13 3,46 0,96 3 4 1,8 3,45 5,04 5,57 3,87 0,36 0,77 4 1 0,4 0,80 0,7 1,07 1,0 1,08 1,6 4 0,15 0,40 0,4 0,85 0,66 0,85 0,71 4 3 0, 0,30 0,77 0,94 1,44 1,49 0,6 4 4 0,8 0,36 0,74 0,73 1,6 1,84 1,36 5 1 0,67 1,77,09 3,7 3,9,36,7 5 0,66 1,07,39 4,19 4,89 1,86 1,61 5 3 1,41,55 3,87 4,6 3,6 3,87 0,0 5 4 1,30,16 5,78 8,6 7,9 0,6 0,6 Fonte: Castro (1999)
10 PROGRAMA:!K '#.* '#.* '! ' ' %'' '%&' &)' )&))' )' '%()' ' ' LMN ' ##$$''$&&$$))** '&) / --%) '/ --%) &/ --%)./ --%) )/ --%) -- ;=>?8:@83;700<013;70 70 '
11 REPRESENTAÇÃO GRÁFICA: INTERPRETAÇÃO DOS RESULTADOS: a) Resultados do teste de esfericidade. :89A04B:4?<?9C3@<B>CD84?9:4?0;%%%' B?8E@34:40F?139?0;)''(G?9B'%7A40HIB?8E@34:%%%%% >?:79049B0J0;3>010;:;98 :89A04B:4?<?9C3@<B>CD84?9:4?0;%%%' B?8E@34:40F?139?0;)''(G?9B'%7A40HIB?8E@34:%%%%% Observa-se com esses resultados que a condição de esfericidade da matriz deve ser rejeitada. Assim sendo os testes da análise em parcelas subdivididas não são exatos. b) Resultados dos testes multivariados. O SAS apresenta 4 testes multivariados, ou sejam: Lambda de Wilks, traço de Pillai, traço de Hotelling-Lawley e teste de Roy. O teste para Tempo testa a hipótese de perfis horizontais e o teste para a Interação Trat. x Tempo testa a hipótese de paralelismo entre os perfis. Os resultados desses testes foram:
1 3;0O3:894?9:4?33;7F3<9 939?89?<8A049B:-C09B:8?80A;0AA:<9 -C:P394?FA044404P394?F ' 939?89?<3>@: @1 :; 4I Q?>R8D31H73%%&%'('')'&(%%%%%?>>3?D843<:%((%)'&(%%%%% -09:>>?;J3G>:C43<:&&'()'&(%%%%% 0CD84:39:89009&&'()'&(%%%%% 3;0O3:894?9:4?33;7 40F?139?0;8A04 9B:-C09B:8?80A;0AA:<9 -C:P394?FA044404P394?F %) 939?89?<3>@: @1 :; 4I Q?>R8D31H73%%)%'%&'%%''&%()%%')?>>3?D843<:)'%''&')'%') -09:>>?;J3G>:C43<:()&%%)&&('&%%%% 0CD84:39:89009()()(%(&%%%% 939?89?<A040CD84:39:89009?83;@:4H0@;7 Observa-se nestes resultados que a hipótese de perfis horizontais é rejeitada para todos os testes, e a de perfis paralelos só não é rejeitada pelo teste de Pillai. Os testes se baseiam em fundamentos distintos e, segundo SAS(Manual Cap.4, pag.98), uma ordem preferencial com base no poder do teste é: Pillai, Wilks, Hotelling-Lawley e Roy. c) Correção dos graus de liberdade dos testes univariados. O SAS apresenta também os testes univariados, sem correção dos graus de liberdade e com as correções de Greenhouse & Geisser (1959) G-G e Huynh & Feldt (1976) H-F. Os resultados são: :;:43>?;:3407:>840<:7@4: ::39:7:38@4:8;3>C8?80A34?3;<: ;?O34?39::8980A-C09B:8:8A04Q?9B?;@HS:<9AA:<98 0@4<: 7S4I C::3;E@34: 3>@:4I - ()%))))')((((%%%%%%%%%%%% 0@4<: 7S4I C::3;E@34: 3>@:4I - ''%'(''))'%&%%%%%%%)%%%% 0@4<:4404#* C::3;E@34: (%&))'(%''( 4::;B0@8::?88:48?>0;%&((' -@C;B :>798?>0;%%( Segundo SAS(Manual Cap.4, pag.300), com o ajuste G-G o teste F é conservativo para amostras de tamanhos pequenas e, no geral, com o ajuste H-F os testes são mais liberais que com o ajuste G-G. Littell et al. (1998) sugere o uso do ajuste G-G.
13 d) Interpretação dos contrastes. Como o tipo de contrastes POLYNOMIAL, obteve-se os seguintes resultados: :;:43>?;:3407:>840<:7@4: ::39:7:38@4:8;3>C8?80A34?3;<: ;3>C8?80A34?3;<:0A0;9438934?3H>:8 4:4:8:;989B:;9B7:J4::0>C;01?3><0;94389A04 0;9438934?3H>: 34?3H>: 0@4<: C::3;E@34: 3>@:4I %')%')'&(%%%& %'%'(&)%%&%& 4404)'&%&)&'%'%'&) 0;9438934?3H>:' 0@4<: C::3;E@34: 3>@:4I '&'&'%%%% )%%')'')'%%(%%%' 4404)'&%&%()')&)%& 0;9438934?3H>:& 0@4<: C::3;E@34: 3>@:4I '))%'))%%%%% %(()&&%'&()%&% 4404)))%%%&%&&% 0;9438934?3H>: 0@4<: C::3;E@34: 3>@:4I ())&())&(%%(( )%&&(('%)%&%') 4404)'%%%)%% 0;9438934?3H>:) H>:) 0@4<: C::3;E@34: 3>@:4I ')&&'(')&&'(&)%%%) &%)'%&'&'%&( 4404))&()'%&)(('&% 0;9438934?3H>: 0@4<: C::3;E@34: 3>@:4I %&')%%&')%%)%& '%&'')%)%(%%)%%)%& 4404))%&'%)&&)' Observe que para grau do polinômio (TP.1 a TP.6) dois testes são apresentados. Um para a média e um para Tratamentos (no caso GN). Segundo SAS(Manual Cap.4, pag.301 e 309), o teste para a MÉDIA testa a significância do contraste para a média de todos os tratamentos (perfil médio). O teste para tratamentos (GN) testa se a média do contraste é a mesma para cada nível do tratamento. Ou seja, se existe interação entre tratamento e tempo. Observe que os componentes de 5 º e 6 º graus são não significativos e não diferem entre os tratamentos. O componente médio de 4 º grau é significativo e é constante para todos os tratamentos (interação não significativa), o mesmo acontecendo com as componentes linear e cúbico. O componente quadrático é significativo, bem como a interação. Observações: 1) Se houver interesse em comparar as médias ajustadas dos tratamentos (GN), dentro de cada Tempo, basta incluir, após o comando REPEATED, o seguinte comando: /.
14 ) Se os níveis do fator tempo forem eqüidistantes, a colocação dos valores níveis fator tempo no REPEATED é dispensável, caso contrário tal colocação é necessária. Ex.: REPEATED TP 6 (0 0 50 90 110 150) POLYNOMIAL / PRINTE SUMMARY; 3) Se os dados forem desbalanceados, esse tipo de análise desconsidera as repetições com valores perdidos em algum nível do fator Tempo. Exemplo 3: Considere os dados de um experimento em medidas repetidas no tempo com cinco tratamentos, seis tempos, três repetições e duas variáveis dependentes (Y1 e Y). Os dados encontram-se no arquivo MTT_Y1.TXT. Fazer um programa SAS para testar a esfericidade de Y1 e Y. Programa: * ANALISE DE MEDIDAS REPETIDAS - TESTE DE ESFERICIDADE PARA MAIS QUE UMA VARIÁVEL DEPENDENTE; OPTIONS LS=78 PS=64 PAGENO=1; DATA UNI; INFILE A:\MRT_Y1.TXT FIRSTOBS=1; INPUT TR TP RP Y1-Y; PROC PRINT; RUN; %LET Y=Y; DATA UNI; SET UNI; KEEP TR TP RP &Y; *PROC PRINT; RUN; /* TRANSFORMAR DADOS DA FORMA UNIV. PARA MULT.*/ PROC SORT DATA=UNI; BY TR RP; PROC TRANSPOSE OUT=MULTI(RENAME=(_1=T1 _=T _3=T3 _4=T4 _5=T5 _6=T6)); BY TR RP; ID TP; RUN; PROC PRINT DATA=MULTI; RUN; /* TESTE DE ESFERICIDADE*/ PROC GLM DATA=MULTI; CLASS TR; MODEL T1-T6=TR/NOUNI; REPEATED TP 6 POLYNOMIAL/PRINTE SUMMARY; RUN;