R-Fácil. Análise de Variância. Universidade Federal de Goiás Escola de Veterinária e Zootecnia

Documentos relacionados
Função R para analisar experimentos em DBC com Fatorial Duplo e um Tratamento Adicional, em uma só Rodada

BIE5782. Unidade 7: INTRODUÇÃO AOS MODELOS LINEARES

Modificação do teste de Tukey para uso sob heterocedasticidade e desbalanceamento

UNIVERSIDADE ESTADUAL PAULISTA PLANO DE ENSINO DA DISCIPLINA

UNIVERSIDADE DE SÃO PAULO

Concurso Público para provimento de cargo efetivo de Docentes

Teste modificado de Tukey: avaliação do poder e eficiência

Procedimento de comparações múltiplas baseado na distribuição F e sua implementação no pacote Experimental Designs

Roteiro de Aula Delineamentos Fatoriais 05/06/2018

Análise de dados em Geociências

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Introdução Regressão linear Regressão de dados independentes Regressão não linear. Regressão. Susana Barbosa

Planejamento de instalação de experimentos no campo

Avaliação do coeficiente de variação na experimentação com cana-de-açúcar. Introdução

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

ESTATÍSTICA EXPERIMENTAL. Delineamento experimental. Aula 04

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

UNIVERSIDADE DE SÃO PAULO

Transformação de dados como alternativa a análise variância. univariada

Teste F-parcial 1 / 16

EXPERIMENTOS EM PARCELAS SUBDIVIDIDAS

Teste F-parcial 1 / 16

EXPERIMENTAÇÃO AGRÍCOLA

Delineamento em quadrado latino (DQL)

Ensaios Fatoriais. Universidade Estadual de Santa Cruz. Ivan Bezerra Allaman

UNIVERSIDADE ESTADUAL PAULISTA CAMPUS DE BOTUCATU FACULDADE DE CIÊNCIAS AGRONÔMICAS PROGRAMA DE PÓS-GRADUAÇÃO EM AGRONOMIA AGRICULTURA

TEAZ Técnicas Experimentais Aplicadas à Zootecnia PLANO DE ENSINO

Estatística Descritiva e Inferencial CE081. Prof. Dr. Jomar Camarinha

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

PLANEJAMENTO DE EXPERIMENTOS

Questão 1: Questão 2: Defina tratamentos, fator, nível, parcela, subparcela, coeficiente de variação e interação entre fatores.

Avaliação do conteúdo de potássio em grãos de soja em função dos níveis de água a potássio aplicados

Tópicos Extras 1ª parte. Testes Não Paramétricos, Análise Multivariada, Outras Técnicas

ESTATÍSTICA EXPERIMENTAL

Análise de Variância e outras análises. Airlane P. Alencar

Experimentos em Parcelas Subdivididas

3ª LISTA DE EXERCÍCIOS

Análise de modelos lineares mistos com dois fatores longitudinais: um fator quantitativo e um qualitativo ordinal.

Comparação de métodos para tratamento de parcelas perdidas em delineamento em blocos casualizados via simulação Monte Carlo

RELACÃO DO CRIME EM CIDADES PEQUENAS COM CUSTO, IDADE E ANOS DE ESTUDO DE ESTADOS DA AMERICA DO NORTE

R-Fácil. Testes de Hipóteses. Universidade Federal de Goiás Escola de Veterinária e Zootecnia

Delineamento Inteiramente Casualizado (DIC) Delineamento Casualizado em Blocos (DBC) Delineamento em Quadrado Latino (DQL)

MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DE CAMPINA GRANDE CENTRO DE CIENCIAS E TECNOLOGIA AGROALIMENTAR UNIDADE V

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

TÉCNICAS EXPERIMENTAIS APLICADAS EM CIÊNCIA DO SOLO

DELINEAMENTO EM BLOCOS CASUALIZADOS COM REPETIÇÕES. Profª. Sheila Regina Oro

Análise estatística do ganho de peso de suínos alojados em ambiente de alta temperatura

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Planejamento de Experimentos

Regression and Clinical prediction models

Planejamento Experimental

Qual o delineamento e quantas observações devo considerar em meu projeto? Ivan Barbosa Machado Sampaio Professor Emérito Escola de Veterinária - UFMG

DELINEAMENTO EM BLOCOS AO ACASO

PRINCÍPIOS BÁSICOS DE EXPERIMENTAÇÃO. Profª. Sheila Regina Oro

Técnicas Experimentais Aplicadas

INTRODUÇÃO A MODELOS MISTOS

Aula no SAS. Planejamento do Experimento - Delineamento inteiramente casualizado. Saídas

Aula Prática 02 Estatística Experimental DELINEAMENTO CASUALIZADO EM BLOCOS. *Planejamento do Experimento Delineamento Casualizado em Blocos (DBC);

Anexo II Resolução nº 133/2003-CEPE

Comparação dos modelos de Gompertz e Verhulst no ajuste de dados de uma variedade de feijão

Curso de Estatística Descritiva e Inferencial (Planejamento Experimental) Prof. Dr. Jomar Camarinha

Experimentos em parcelas subdivididas e procedimentos para a aplicação dos testes de comparação de médias

Importância daestatísticana Pesquisa Agronômica

Análise Conjunta de Experimentos

Precificação de apartamentos para o bairro Água Verde em Curitiba

Verificando as pressuposições do modelo estatístico

CE062c José Luiz Padilha da Silva e Cesar Augusto Taconeli 13 de setembro de 2018

Experimentos em Quadrado Latino. Estatística Experimental

25 a 30 de novembro de 2013

Esquema de distribuição dos tratamentos: Fatorial; Parcelas subdivididas.

MEDIÇÃO DA QUALIDADE DO VINHO BRANCO NORTE PORTUGUÊS

UNIVERSIDADE ESTADUAL PAULISTA CAMPUS DE BOTUCATU PROGRAMA DE PÓS-GRADUAÇÃO EM AGRONOMIA ENERGIA NA AGRICULTURA PLANO DE ENSINO

ANOVA com modelos encaixados

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Planejamento de Experimentos Suposições do Modelo e Comparações Múltiplas

COMPARAÇÕES MÚLTIPLAS

Técnicas Experimentais Aplicadas à Zootecnia UNIDADE 1. NOÇÕES DE PLANEJAMENTO EXPERIMENTAL

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Modelos de Análise de Variância

XIX CONGRESSO DE PÓS-GRADUAÇÃO DA UFLA 27 de setembro a 01 de outubro de 2010

Trabalho de Modelos Lineares Generalizados

Delineamento e Análise Experimental Aula 7. Anderson Castro Soares de Oliveira

Aumento amostral via arquétipos na avaliação do potencial hídrico de espécies de eucalipto

ANOVA - parte I Conceitos Básicos

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Testes de Comparações Múltiplas

PLANEJAMENTO E ANÁLISE ESTATÍSTICA DE EXPERIMENTOS AGRONÔMICOS

Éder David Borges da Silva Renato Gonçalves de Oliveira

Gabarito Lista 2 LES0773 Estatística III. Os resultados dessa regressão são apresentados na seguinte tabela:

Delineamento e Análise Experimental Aula 5

Mario de Andrade Lira Junior

XIX CONGRESSO DE PÓS-GRADUAÇÃO DA UFLA 27 de setembro a 01 de outubro de 2010

PROCESSOS ESTOCÁSTICOS

Planejamento da pesquisa científica: incerteza e estatística. Edilson Batista de Oliveira Embrapa Florestas

Lucas Santana da Cunha de outubro de 2018 Londrina

Curso de MINITAB Universidade Federal de Ouro Preto. Planejamento de Experimentos (DOE)

Aula 14 Quadrado Latino 13/06/17

UNIVERSIDADE ESTADUAL PAULISTA CAMPUS DE BOTUCATU FACULDADE DE CIÊNCIAS AGRONÔMICAS PROGRAMA DE PÓS-GRADUAÇÃO EM AGRONOMIA AGRICULTURA

Transcrição:

Universidade Federal de Goiás Escola de Veterinária e Zootecnia R-Fácil Análise de Variância Apostila destinada a usuários do R, com demonstrações de uso de funções em exemplos da área de Ciências Agrárias. Goiânia Março de 2014

Apresentação Atualmente encontram-se grande número de apostilas e livros abordando o uso do software R (R Core Team, 2014) para análises estatísticas. No entanto, são raros os materiais didáticos aplicados à área de ciências agrárias. Visando estimular o aprendizado com linguagem mais simples e aplicada, com exemplos práticos voltados, principalmente, as áreas de ciências agrárias e biológicas, o presente material foi desenvolvido para auxiliar a utilização do R na realização de análise de variância para tratamentos qualitativos. O público alvo são alunos de graduação, pós-graduação, professores e pesquisadores. O objetivo desta apostila não é aprofundar em aspectos teóricos, mas apenas apresentar um tutorial de análise de dados utilizando pacotes e funções de forma bastante prática. A apostila R-fácil: Análise de Variância faz parte de uma séria de quatro apostilas que contemplam parte do conteúdo do site http://r-facil.webnode.com/. Deve-se destacar que este material utiliza-se de funções de uso mais prático para a demonstração das análises e por isso o título R-fácil, com intuito de descomplicar um pouco a utilização do software. No texto as discussões estão na fonte Times 12 e as análises realizadas no R em fonte Inconsolata em negrito, sendo a programação em azul e os resultados em preto. Boa leitura e não deixe de conferir os demais materiais da séria R-fácil (download em http://r-facil.webnode.com/). O autor

Índice página Delineamento inteiramente ao acaso 1 Delineamento de blocos ao acaso 4 Delineamento em quadrado latino 7 Esquema fatorial 13 Fatorial duplo em delineamento inteiramente ao acaso 13 Fatorial duplo em delineamento de blocos ao acaso 18 Esquema de parcelas subdivididas (splitplot) 21 Parcelas subdivididas em delineamento inteiramente ao acaso 21 Parcelas subdivididas em delineamento de blocos ao acaso 25 Análise de covariância 29 Contrastes de médias 31 Referências 36

Delineamento inteiramente ao acaso A análise de variância em delineamento inteiramente ao acaso é realizada quando os tratamentos são distribuídos de forma totalmente (inteiramente) casualizada as unidades experimentais. Neste caso não é feito nenhum tipo de controle de uma fonte de variação sistemática no experimento. Para realizar análise de variância em delineamento inteiramente ao acaso vamos requerer o pacote "easyanova", que deve ser previamente instalado. require(easyanova) No próprio pacote existem dados disponíveis para exemplo. Vamos carregar o exemplo chamado data1, que são dados obtidos de Kaps e Lamberson (2009). data(data1) Para ver a forma de tabulação dos dados observamos no próprio exemplo fazemos: data1 Diet Gain 1 d1 270 2 d1 300 3 d1 280 4 d1 280 5 d1 270 6 d2 290 7 d2 250 8 d2 280 9 d2 290 10 d2 280 11 d3 290 12 d3 340 13 d3 330 14 d3 300 15 d3 300 1

No caso do delineamento inteiramente ao acaso a primeira coluna deve conter os códigos de tratamentos e as demais as variáveis respostas (neste exemplo temos somente uma variável resposta). Vamos usar a função ea1( )" do pacote easyanova e gravar o resultado em um objeto chamado "resultado". Na função o argumento "design" define o delineamento (1 = inteiramente ao acaso). resultado=ea1(data1, design=1) Para visualizar o resultado fazemos: resultado $`Analysis of variance` df type I SS mean square F value p>f treatments 2 3640 1820.0000 6.1348 0.0146 Residuals 12 3560 296.6667 - - $Means treatment mean standard.error tukey snk duncan t scott_knott 1 d3 312 7.7028 a a a a a 2 d1 280 7.7028 b b b b b 3 d2 278 7.7028 b b b b b $`Multiple comparison test` pair contrast p(tukey) p(snk) p(duncan) p(t) 1 d3 - d1 32 0.0310 0.0124 0.0124 0.0124 2 d3 - d2 34 0.0223 0.0223 0.0112 0.0088 3 d1 - d2 2 0.9816 0.8574 0.8574 0.8574 $`Residual analysis` values p.value Shapiro-Wilk test 0.8937 p.value Bartlett test 0.5662 coefficient of variation (%) 5.9400 first value most discrepant 7.0000 second value most discrepant 12.0000 third value most discrepant 11.0000 Ocorre diferença significativa entre tratamentos na análise de variância (p=0.0146). Assim, pode-se avaliar a diferença entre tratamentos aos pares através dos testes de médias. Pelos testes verifica-se que as dietas d1 e d2 são estatisticamente iguais e inferiores a d3. 2

Neste caso todos os testes auxiliam a conclusão de forma equivalente. Mas nem sempre este fato ocorre, sendo que o teste de Tukey é mais rigoroso no sentido da não diferença (valores de probabilidade maiores) e o teste t da diferença (valores de probabilidades menores). E esta diferença entre os dois testes se acentua com o aumento do número de tratamentos. Recomendo utilizar o teste de Tukey quando o número de tratamentos for inferior a cinco e o teste de ScottKnott quando igual ou superior a cinco. A função também retorna uma resumida análise de resíduos. No teste de normalidade (shapiro.test) e de homogeneidade de variâncias (bartlett.test) observa-se (p-value>0,05) que os resíduos podem ser considerados aproximadamente normais e com variâncias homogêneas (homocedasticidade). O coeficiente de variação foi de 5,94%. E ainda, a função apresenta as três observações mais discrepantes do conjunto de dados. No caso a 7, 12 e 11 na seqüência dos dados. Para julgar se os dados apontados como mais discrepantes são realmente fora da normalidade a função gera um gráfico dos resíduos padronizados versus a seqüência dos dados. Observe no gráfico gerado neste exemplo (Figura 1) que nenhum dado fica fora dos limites de +/-2,5 escores Z (+/-2,5 desvios padrões). Os valores 7, 12 e 11 são os que mais se aproximam destes limites. Dados fora do limite de dois desvios padrões já podem ser considerados suspeitos, principalmente em amostras pequenas. Figura 1. Gráfico dos resíduos padronizados versus a seqüência dos dados. 3

Delineamento em blocos ao acaso A análise de variância em delineamento de blocos ao acaso é realizada quando os tratamentos são distribuídos de forma totalmente (inteiramente) casualizada dentro de grupos homogêneos quanto a uma variável que atua no experimento de forma sistemática. Nestes casos os grupos são freqüentemente denominados de blocos. Um bloco deve ser homogêneo para a variável cujo efeito deseja-se controlar, mas pode ocorrer heterogeneidade entre blocos. Para realizar análise de variância em blocos ao acaso vamos requerer o pacote "easyanova", que deve ser previamente instalado. require(easyanova) No próprio pacote existem dados disponíveis para exemplo. Vamos carregar o exemplo chamado data2, que são dados obtidos de Kaps e Lamberson (2009). data(data2) Para ver a forma de tabulação dos dados observamos no próprio exemplo fazendo: data2 Treatments Blocks Gain 1 t1 b1 826 2 t1 b2 865 3 t1 b3 795 4 t1 b4 850 5 t2 b1 827 6 t2 b2 872 7 t2 b3 721 8 t2 b4 860 9 t3 b1 753 10 t3 b2 804 11 t3 b3 737 12 t3 b4 822 4

No caso do delineamento de blocos ao acaso a primeira coluna deve conter os códigos de tratamentos, a segunda os códigos dos blocos e as demais as variáveis respostas (somente uma variável resposta neste exemplo). Temos o ganho diário em grama de bovinos em experimento para avaliar três tratamentos. Os grupos (blocos) foram compostos por grupos de peso de bovinos, sendo cada grupo um bloco. Note que todos os tratamentos foram aplicados em cada bloco. Vamos usar a função ea1( )" do pacote easyanova e gravar o resultado em um objeto chamado "resultado". Na função o argumento "design" define o delineamento (2 = blocos ao acaso). resultado=ea1(data2, design=2) Para visualizar o resultado fazemos: resultado $`Analysis of variance` df type III SS mean square F value p>f treatments 2 6536 3268 5.3399 0.0465 blocks 3 18198 6066 9.9118 0.0097 Residuals 6 3672 612 - - $`Adjusted means` treatment adjusted.mean standard.error tukey snk duncan t scott_knott 1 t1 834 12.3693 a a a a a 2 t2 820 12.3693 ab ab ab ab a 3 t3 779 12.3693 b b b b b $`Multiple comparison test` pair contrast p(tukey) p(snk) p(duncan) p(t) 1 t1 - t2 14 0.7165 0.4540 0.4540 0.4540 2 t1 - t3 55 0.0456 0.0456 0.0230 0.0200 3 t2 - t3 41 0.1246 0.0575 0.0575 0.0575 $`Residual analysis` values p.value Shapiro-Wilk test 0.2759 p.value Bartlett test 0.4075 coefficient of variation (%) 3.0500 first value most discrepant 7.0000 second value most discrepant 3.0000 third value most discrepant 11.0000 Ocorre diferença significativa entre tratamentos na análise de variância (p=0.0465). Assim, pode-se avaliar a diferença entre tratamentos aos pares através dos testes de médias. 5

Observando o teste de ScottKnott pode-se concluir que os tratamentos t1 e t2 foram estatisticamente iguais e, ambos estatisticamente diferentes do t3. Observando o valor de probabilidade referente aos blocos (faixas de peso) pode-se concluir que ocorre diferença significativa (p=0.0097). Certamente a decisão de blocar o efeito de peso neste experimento foi muito importante para a qualidade do mesmo. No teste de normalidade (shapiro.test) e de homogeneidade de variâncias (bartlett.test) observa-se (p-value>0,05) que os resíduos podem ser considerados aproximadamente normais e com variâncias homogêneas (homocedasticidade). O coeficiente de variação foi de 3,05%. Para julgar se os dados apontados como mais discrepantes são realmente fora da normalidade a função gera um gráfico dos resíduos padronizados versus a seqüência dos dados. Observe no gráfico gerado neste exemplo (Figura 2) que nenhuma observação fica fora do limite de +/-2,5 escores Z (+/-2,5 desvios padrões), não sendo detectado problema com outliers. Figura 2. Gráfico dos resíduos padronizados versus a seqüência dos dados. 6

Caso alguma observação seja descartada, deve-se inserir NA no local do dado e a análise refeita da mesma forma como anteriormente ilustrado. A função ea1( ) faz os ajustes recomendados no caso de um ou mais dados faltantes (desbalanceamento experimental). Delineamento em quadrado latino A análise de variância em delineamento de quadrado latino é realizada quando os tratamentos são distribuídos de forma a ser controlada duas fontes de variação sistemática em um experimento. O número de tratamentos deve ser igual ao número de categorias de cada fonte de variação controlada no experimento. Por exemplo, em um experimento onde se deseja testar o efeito de quatro tratamentos. Podem-se avaliar estes quatro tratamentos em quatro animais (o efeito de animal é uma das fontes de variação sistemática) em quatro períodos (o efeito de período é uma segunda fonte de variação sistemática a ser controlada no experimento). Para realizar análise de variância em quadrado latino vamos requerer o pacote "easyanova", que deve ser previamente instalado. require(easyanova) No próprio pacote existem dados disponíveis para exemplo. Vamos carregar o exemplo chamado data3, que são dados obtidos de Kaps e Lamberson (2009). data(data3) Para ver a forma de tabulação dos dados observamos no próprio exemplo fazendo: data3 treatment period steer response 1 B p1 a1 10.0 2 D p1 a2 9.0 3 C p1 a3 11.1 4 A p1 a4 10.8 5 C p2 a1 10.2 7

6 A p2 a2 11.3 7 D p2 a3 9.5 8 B p2 a4 11.4 9 D p3 a1 8.5 10 B p3 a2 11.2 11 A p3 a3 12.8 12 C p3 a4 11.0 13 A p4 a1 11.1 14 C p4 a2 11.4 15 B p4 a3 11.7 16 D p4 a4 9.9 No caso do delineamento em quadrado latino a primeira coluna deve conter os códigos de tratamentos, a segunda e a terceira o código das duas variáveis controladas no experimento (linhas e colunas) sem importar a ordem destas. E as demais colunas as variáveis respostas (somente uma variável resposta neste caso). No exemplo temos o desempenho de bovinos em experimento para avaliar quatro tratamentos. Foi controlado o efeito de período e de animal (quatro períodos e quatro animais). Note que todos os tratamentos foram aplicados em cada período e em cada animal. Vamos usar a função ea1( )" do pacote easyanova e gravar o resultado em um objeto chamado "resultado". Na função o argumento "design" define o delineamento (3 = quadrado latino). resultado=ea1(data3, design=3) Para visualizar o resultado fazemos: resultado $`Analysis of variance` df type III SS mean square F value p>f treatments 3 12.0219 4.0073 27.6763 <0.001 rows 3 1.4819 0.4940 3.4115 0.0938 columns 3 3.5919 1.1973 8.2691 0.0149 Residuals 6 0.8688 0.1448 - - $`Adjusted means` treatment adjusted.mean standard.error tukey snk duncan t scott_knott 1 A 11.500 0.1903 a a a a a 2 B 11.075 0.1903 a a a a a 3 C 10.925 0.1903 a a a a a 4 D 9.225 0.1903 b b b b b 8

$`Multiple comparison test` pair contrast p(tukey) p(snk) p(duncan) p(t) 1 A - B 0.425 0.4538 0.1654 0.1654 0.1654 2 A - C 0.575 0.2429 0.1623 0.0847 0.0765 3 A - D 2.275 0.0006 0.0006 0.0002 0.0001 4 B - C 0.150 0.9411 0.5974 0.5974 0.5974 5 B - D 1.850 0.0019 0.0011 0.0006 0.0005 6 C - D 1.700 0.0030 0.0007 0.0007 0.0007 $`Residual analysis` values p.value Shapiro-Wilk test 0.6961 p.value Bartlett test 0.8254 coefficient of variation (%) 3.5600 first value most discrepant 11.0000 second value most discrepant 4.0000 third value most discrepant 8.0000 Ocorre diferença muito significativa entre tratamentos (p<0,001) com posterior avaliação da comparação aos pares de tratamentos pelos testes de médias. Também se observa aproximação da normalidade (p>0,05 no teste de Shapiro-Wilk) e homogeneidade de variâncias (p>0,05 no teste de Bartlett). Nenhum dado deve ser a priori considerado outlier, pois estão dentro da faixa de +/- 2.5 escores z (Figura 3). Figura 3. Gráfico dos resíduos padronizados versus a seqüência dos dados. 9

Em quadrados latinos pequenos, com quatro ou menos tratamentos, recomenda-se uma duplicação ou triplicação do quadrado, para atingir uma amostra mais confiável para análise. Este é o caso do exemplo a seguir, também obtido de Kaps e Lamberson (2009). data(data4) data4 diet square steer period response 1 B 1 1 1 10.0 2 D 1 2 1 9.0 3 C 1 3 1 11.1 4 A 1 4 1 10.8 5 C 1 1 2 10.2 6 A 1 2 2 11.3 7 D 1 3 2 9.5 8 B 1 4 2 11.4 9 D 1 1 3 8.5 10 B 1 2 3 11.2 11 A 1 3 3 12.8 12 C 1 4 3 11.0 13 A 1 1 4 11.1 14 C 1 2 4 11.4 15 B 1 3 4 11.7 16 D 1 4 4 9.9 17 C 2 5 5 11.1 18 A 2 6 5 11.4 19 D 2 7 5 9.6 20 B 2 8 5 11.4 21 B 2 5 6 10.7 22 D 2 6 6 9.8 23 C 2 7 6 11.6 24 A 2 8 6 11.3 25 A 2 5 7 11.3 26 C 2 6 7 11.6 27 B 2 7 7 11.9 28 D 2 8 7 10.0 29 D 2 5 8 9.0 30 B 2 6 8 13.1 31 A 2 7 8 11.6 32 C 2 8 8 11.4 10

No caso de duplicação do delineamento em quadrado latino a primeira coluna deve conter os códigos de tratamentos, a segunda os códigos das repetições do quadrado e a terceira e quarta os códigos das duas variáveis controladas no experimento (linhas e colunas) sem importar a ordem destas. E as demais colunas as variáveis respostas (temos somente uma variável resposta neste caso). No exemplo temos o desempenho de bovinos em experimento para avaliar quatro tratamentos. Foi controlado o efeito de período e de animal (quatro períodos e quatro animais). O quadrado foi repetido (foram realizados dois quadrados utilizando 8 animais e 8 períodos). Vamos usar a função ea1( )" do pacote easyanova e gravar o resultado em um objeto chamado "resultado". Na função o argumento "design" define o delineamento (3 = quadrado latino). resultado=ea1(data4, design=4) Para visualizar o resultado fazemos: resultado $`Analysis of variance` df type I SS mean square F value p>f treatments 3 22.8934 7.6311 38.7737 <0.001 squares 1 1.0878 1.0878 5.5272 0.0328 rows 6 5.4819 0.9136 4.6422 0.0074 columns 6 2.0569 0.3428 1.7418 0.1793 Residuals 15 2.9522 0.1968 - - $`Adjusted means` treatment adjusted.mean standard.error tukey snk duncan t scott_knott 1 A 11.4500 0.1568 a a a a a 2 B 11.4250 0.1568 a a a a a 3 C 11.1750 0.1568 a a a a a 4 D 9.4125 0.1568 b b b b b $`Multiple comparison test` pair contrast p(tukey) p(snk) p(duncan) p(t) 1 A - B 0.0250 0.9995 0.9117 0.9117 0.9117 2 A - C 0.2750 0.6123 0.4489 0.2577 0.2340 3 A - D 2.0375 0.0000 0.0000 0.0000 0.0000 4 B - C 0.2500 0.6790 0.2773 0.2773 0.2773 5 B - D 2.0125 0.0000 0.0000 0.0000 0.0000 6 C - D 1.7625 0.0000 0.0000 0.0000 0.0000 $`Residual analysis` values p.value Shapiro-Wilk test 0.0946 p.value Bartlett test 0.2910 coefficient of variation (%) 4.0800 11

first value most discrepant 30.0000 second value most discrepant 11.0000 third value most discrepant 18.0000 Os resultados foram semelhantes ao primeiro exemplo de quadrado latino. Porém, nota-se uma menor aproximação da normalidade (p=0.0946 no teste de Shapiro-Wilk) quando comparado ao exemplo anterior (p=0.6961). Este resultado é devido a dois possíveis outliers, referentes aos dados das posições 30 e 11 (Figura 4). Assim, pode-se avaliar a retirada de um ou ambos os dados. Caso alguma observação seja descartada, deve-se inserir NA no local do dado e a análise refeita da mesma forma como anteriormente ilustrado. A função ea1( ) faz os ajustes recomendados no caso de um ou mais dados faltantes (desbalanceamento experimental). Figura 4. Gráfico dos resíduos padronizados versus a seqüência dos dados. 12

Esquema fatorial Fatorial não é um delineamento, é um esquema experimental onde são combinados os níveis de dois ou mais fatores. Assim, um experimento em esquema fatorial pode ser delineado de forma inteiramente ao acaso, em blocos ao acaso, quadrados latinos e outros delineamentos. A seguir serão apresentados exemplos de esquemas fatoriais no delineamento inteiramente ao acaso e de blocos ao acaso. Fatorial duplo em delineamento inteiramente ao acaso Para realizarmos a análise de variância de um esquema fatorial no R, de forma bastante prática, utilizaremos a função ea2( ) do pacote easyanova. Primeiro vamos carregar o pacote que deve estar previamente instalado. require(easyanova) Também utilizaremos exemplo disponível no pacote easyanova. Para carregar o exemplo faremos: data(data5) O nome do conjunto de dados é data5. Os dados se referem a a inclusão ou não de duas vitaminas na alimentação de suínos, visando aumentar o ganho de peso dos mesmos (dados de Kaps e Lamberson, 2009). Abaixo podemos verificar os dados. data5 Vitamin_1 Vitamin_2 Gains 1 0 0 0.585 2 0 0 0.536 3 0 0 0.458 4 0 0 0.486 5 0 0 0.536 6 0 5 0.567 7 0 5 0.545 8 0 5 0.589 9 0 5 0.536 13

10 0 5 0.549 11 4 0 0.473 12 4 0 0.450 13 4 0 0.869 14 4 0 0.473 15 4 0 0.464 16 4 5 0.684 17 4 5 0.702 18 4 5 0.900 19 4 5 0.698 20 4 5 0.693 Reparem nos dados que as duas primeiras colunas devem ser referentes aos códigos dos fatores e as demais referentes aos valores numéricos das variáveis respostas. Para analisar os dados e gravar o resultado em um objeto chamado resultado fazemos: resultado=ea2(data5, design=1) O argumento design=1 define que será realizado análise em esquema fatorial duplo inteiramente ao acaso. Para observar o resultado fazemos: resultado $`Analysis of variance` df type III SS mean square F value p>f factor_1 1 0.0519 0.0519 4.7069 0.0454 factor_2 1 0.0642 0.0642 5.819 0.0282 factor_1:factor_2 1 0.0291 0.0291 2.639 0.1238 Residuals 16 0.1765 0.0110 - - $`Adjusted means (factor 1)` factor_1 adjusted.mean standard.error tukey snk duncan t scott_knott 1 4 0.6406 0.0332 a a a a a 2 0 0.5387 0.0332 b b b b b $`Adjusted means (factor 2)` factor_2 adjusted.mean standard.error tukey snk duncan t scott_knott 1 5 0.6463 0.0332 a a a a a 2 0 0.5330 0.0332 b b b b b $`Adjusted means (factor 1 in levels of factor 2)` $`Adjusted means (factor 1 in levels of factor 2)`$`factor_1 in 0` treatment adjusted.mean standard.error tukey snk duncan t scott_knott 2 4.0 0.5458 0.047 a a a a a 1 0.0 0.5202 0.047 a a a a a 14

$`Adjusted means (factor 1 in levels of factor 2)`$`factor_1 in 5` treatment adjusted.mean standard.error tukey snk duncan t scott_knott 4 4.5 0.7354 0.047 a a a a a 3 0.5 0.5572 0.047 b b b b b $`Adjusted means (factor 2 in levels of factor 1)` $`Adjusted means (factor 2 in levels of factor 1)`$`factor_2 in 0` treatment adjusted.mean standard.error tukey snk duncan t scott_knott 3 0.5 0.5572 0.047 a a a a a 1 0.0 0.5202 0.047 a a a a a $`Adjusted means (factor 2 in levels of factor 1)`$`factor_2 in 4` treatment adjusted.mean standard.error tukey snk duncan t scott_knott 4 4.5 0.7354 0.047 a a a a a 2 4.0 0.5458 0.047 b b b b b $`Residual analysis` values p.value Shapiro-Wilk test 0.0002 p.value Bartlett test (factor_1) 0.0005 p.value Bartlett test (factor_2) 0.0540 p.value Bartlett test (treatments) 0.0028 coefficient of variation (%) 17.8100 first value most discrepant 13.0000 second value most discrepant 18.0000 third value most discrepant 12.0000 Na análise de variância a fonte de variação referente ao fator 1 se refere a primeira coluna de dados e a do fator 2 a segunda coluna dos dados. Ambas as vitaminas tiveram seus efeitos significativos (p<0,05). Porém a interação foi não significativa na análise de variância (p>0,05). Observando a análise de resíduos, nota-se ausência de normalidade (p<0,05 no teste de Shapiro-Wilk) e de homogeneidade de variâncias (p<0,05 no teste de Bartlett) para o fator 1 e para os tratamentos (interação). No gráfico de resíduos (Figura 5) percebe-se que a observação 13 é um provável outlier. A observação 18, apesar de não estar fora dos limites de 2.5 desvios padrões também é suspeita, pois destoa bastante dos demais resíduos. 15

Figura 5. Gráfico dos resíduos padronizados versus a seqüência dos dados. Também podemos observar os resíduos em outros tipos de gráficos fazendo: ea2(data5, design=1, plot=1) ea2(data5, design=1, plot=3) No primeiro caso o argumento plot=1 define um gráfico tipo caixa (Figura 6) onde são identificados dois possíveis outliers, provavelmente as observações 13 e 18. E no gráfico com o argumento plot=3 observamos um gráfico dos resíduos padronizados versus os resíduos teóricos considerando distribuição normal (Figura 7). Neste último observamos as observações 13 e 18 muito fora do esperado considerando normalidade. Assim, pode-se considerar a possibilidade de retirada destes valores e, com esta operação, é provável que os dados se aproximem da normalidade, ocorra diminuição do coeficiente de variação e alteração de outros resultados. Neste caso a análise pela função ea2( ) faz os ajustes necessários devido ao desbalanceamento do experimento. Caso a retirada dos dados não seja considerada adequada, os dados poderão ser submetidos a alguma forma de transformação. Ou então, pode-se optar por utilizar um teste não paramétrico. 16

Figura 6. Gráfico de caixa (Box plot) dos resíduos padronizados Figura 7. Gráfico dos resíduos padronizados versus os resíduos teóricos considerando distribuição normal 17

Fatorial duplo em delineamento de blocos ao acaso Semelhante ao procedimento do delineamento inteiramente ao acaso, utilizaremos a função ea2( ) do pacote easyanova. Primeiro vamos carregar o pacote e o exemplo que esta disponível no pacote. require(easyanova) data(data6) Para observar os dados: data6 factor1 factor2 block yield 1 0 0 1 18.0 2 0 0 2 8.6 3 0 0 3 9.4 4 0 0 4 11.4 5 1 0 1 20.6 6 1 0 2 21.0 7 1 0 3 18.6 8 1 0 4 20.6 9 0 1 1 19.6 10 0 1 2 15.0 11 0 1 3 14.6 12 0 1 4 15.8 13 1 1 1 19.2 14 1 1 2 19.6 15 1 1 3 18.4 16 1 1 4 20.2 Este exemplo foi obtido de Pimentel Gomes e Garcia (2002) e se refere a um fatorial duplo (2 x 2) para avaliar a presença e ausência de dois tipos de adubos na produção de uma cultivar. Neste experimento foi blocado o efeito de solo. Para a digitação dos dados para utilizar a função ea2( ) a primeira e segunda coluna devem ser reservadas aos códigos dos 18

fatores, a terceira coluna para os códigos de blocos e as demais para as variáveis respostas (valores numéricos das variáveis respostas). Para analisar os dados e gravar o resultado em um objeto chamado resultado fazemos: resultado=ea2(data6, design=2) O argumento design=2 define que será realizado análise em esquema fatorial duplo em blocos ao acaso. Para observar o resultado fazemos: resultado $`Analysis of variance` df type III SS mean square F value p>f factor_1 1 131.1025 131.1025 31.2956 <0.001 factor_2 1 12.6025 12.6025 3.0084 0.1169 blocks 3 37.8275 12.6092 3.0099 0.0871 factor_1:factor_2 1 27.5625 27.5625 6.5795 0.0304 Residuals 9 37.7025 4.1892 - - $`Adjusted means (factor 1)` factor_1 adjusted.mean standard.error tukey snk duncan t scott_knott 1 1 19.775 0.7236 a a a a a 2 0 14.050 0.7236 b b b b b $`Adjusted means (factor 2)` factor_2 adjusted.mean standard.error tukey snk duncan t scott_knott 1 1 17.800 0.7236 a a a a a 2 0 16.025 0.7236 a a a a a $`Adjusted means (factor 1 in levels of factor 2)` $`Adjusted means (factor 1 in levels of factor 2)`$`factor_1 in 0` treatment adjusted.mean standard.error tukey snk duncan t scott_knott 2 1.0 20.20 1.0234 a a a a a 1 0.0 11.85 1.0234 b b b b b $`Adjusted means (factor 1 in levels of factor 2)`$`factor_1 in 1` treatment adjusted.mean standard.error tukey snk duncan t scott_knott 4 1.1 19.35 1.0234 a a a a a 3 0.1 16.25 1.0234 a a a a a $`Adjusted means (factor 2 in levels of factor 1)` $`Adjusted means (factor 2 in levels of factor 1)`$`factor_2 in 0` treatment adjusted.mean standard.error tukey snk duncan t scott_knott 3 0.1 16.25 1.0234 a a a a a 1 0.0 11.85 1.0234 b b b b b $`Adjusted means (factor 2 in levels of factor 1)`$`factor_2 in 1` treatment adjusted.mean standard.error tukey snk duncan t scott_knott 2 1.0 20.20 1.0234 a a a a a 4 1.1 19.35 1.0234 a a a a a 19

$`Residual analysis` values p.value Shapiro-Wilk test 0.5583 p.value Bartlett test (factor_1) 0.7014 p.value Bartlett test (factor_2) 0.2195 p.value Bartlett test (treatments) 0.2472 coefficient of variation (%) 12.1000 first value most discrepant 1.0000 second value most discrepant 13.0000 third value most discrepant 2.0000 Neste experimento ocorre interação significativa, ou seja, o efeito de um dos adubos é alterado significativamente dependendo do efeito do outro adubo. Este fato pode ser observado no desdobramento da interação. Na análise de resíduos verificam-se resíduos com aproximação da normalidade (p>0,05 do teste de Shapiro-Wilk) e homogeneidade de variâncias (p>0,05 nos testes de Bartlett). No entanto, a observação 1 é um possível outlier, como pode ser verificado na Figura 8. Figura 8. Gráfico dos resíduos padronizados versus a seqüência dos dados. 20

Esquema de parcelas subdivididas (splitplot) O esquema de parcelas subdivididas é um esquema experimental e não um delineamento. Podemos fazer um experimento em esquema de parcelas subdivididas em vários delineamentos, sendo mais comuns os delineamentos inteiramente ao acaso, blocos ao acaso e quadrado latino. O esquema de parcelas subdivididas é obtido quando um experimento possui um fator A, onde seus níveis compõem o que chamamos de parcelas. E um fator B, com seus níveis casualizados dentro de cada parcela, criando o que chamamos de subparcelas. Quando uma parcela ou unidade experimental é avaliada repetida vezes no tempo, também teremos um esquema de parcelas subdivididas, chamada comumente de parcelas subdivididas no tempo. Neste caso o efeito de um fator A é denominado parcela e o efeito do tempo será o fator B denominado subparcela. A análise de um esquema de parcelas subdivididas, em termos práticos, traz os mesmos desdobramentos (informações) que uma análise de um fatorial duplo. Mas aqui, neste material, não iremos fazer desenvolvimento teórico quanto aos métodos matemáticos e particularidades teóricas dos procedimentos estatísticos. A seguir será demonstrado como utilizar funções do R para obter uma análise bastante completa em esquema de parcelas subdivididas em delineamento inteiramente ao acaso e em blocos ao acaso. Esquema de parcelas subdivididas em delineamento inteiramente ao acaso Aqui também utilizaremos o pacote easyanova com a função ea2( ) que em caso de dados faltantes (desbalanceamento) faz os ajustes necessários. Abaixo carregaremos o pacote e exemplo denominado data7 contido no pacote. require(easyanova) data(data7) 21

Para visualizar os dados: data7 treatment rep week gain 1 t1 1 w9 1.2 2 t1 1 w10 1.0 3 t1 1 w11 1.1 4 t1 1 w12 1.3 5 t1 2 w9 1.2 6 t1 2 w10 1.1 7 t1 2 w11 1.4 8 t1 2 w12 1.5 9 t1 3 w9 1.3 10 t1 3 w10 1.4 11 t1 3 w11 1.4 12 t1 3 w12 1.6 13 t1 4 w9 1.1 14 t1 4 w10 1.1 15 t1 4 w11 1.2 16 t1 4 w12 1.3 17 t1 5 w9 1.2 18 t1 5 w10 1.3 19 t1 5 w11 1.2 20 t1 5 w12 1.3 21 t1 6 w9 1.1 22 t1 6 w10 1.1 23 t1 6 w11 1.1 24 t1 6 w12 1.2 25 t1 7 w9 1.1 26 t1 7 w10 1.2 27 t1 7 w11 1.3 28 t1 7 w12 1.5 29 t1 8 w9 1.3 30 t1 8 w10 1.3 31 t1 8 w11 1.3 32 t1 8 w12 1.4 33 t2 1 w9 1.2 34 t2 1 w10 1.5 35 t2 1 w11 1.9 36 t2 1 w12 2.1 37 t2 2 w9 1.3 38 t2 2 w10 1.2 39 t2 2 w11 1.4 40 t2 2 w12 1.7 41 t2 3 w9 1.5 42 t2 3 w10 1.7 43 t2 3 w11 1.6 44 t2 3 w12 1.7 45 t2 4 w9 1.4 46 t2 4 w10 1.5 47 t2 4 w11 1.7 48 t2 4 w12 1.8 49 t2 5 w9 1.2 50 t2 5 w10 1.2 51 t2 5 w11 1.4 52 t2 5 w12 1.6 53 t2 6 w9 1.0 54 t2 6 w10 1.1 55 t2 6 w11 1.4 22

56 t2 6 w12 1.5 57 t2 7 w9 1.4 58 t2 7 w10 1.8 59 t2 7 w11 2.1 60 t2 7 w12 2.1 61 t2 8 w9 1.1 62 t2 8 w10 1.3 63 t2 8 w11 1.4 64 t2 8 w12 1.8 65 t2 9 w9 1.2 66 t2 9 w10 1.5 67 t2 9 w11 1.7 68 t2 9 w12 1.9 Neste exemplo, obtido de Kaps e Lamberson (2009) a primeira coluna refere-se aos códigos do fator designado como parcela. A segunda coluna aos códigos de repetição de cada parcela. A terceira coluna refere-se ao fator designado como subparcela (no caso as semanas de avaliação). As demais colunas referem-se às variáveis respostas (numéricas). No exemplo existe apenas uma variável resposta. Assim, temos um esquema de parcelas subdivididas no tempo, pois os animais são avaliados em quatro semanas, sendo portanto as semanas consideradas como subparcelas. Para analisar os dados e gravar o resultado em um objeto chamado resultado fazemos: resultado=ea2(data7, design=4) O argumento design=4 define que será realizada análise em esquema de parcelas subdivididas em delineamento inteiramente ao acaso. Para observar o resultado fazemos: resultado $`Marginal anova (Type III Sum of Squares)` numdf dendf F-value p-value plot 1 15 13.25397 0.0024 split.plot 3 45 40.09483 <.0001 plot:split.plot 3 45 9.20168 0.0001 $`Adjusted means (plot)` plot adjusted.mean standard.error tukey snk duncan t 1 t2 1.5250 0.0512 a a a a 2 t1 1.2531 0.0543 b b b b $`Adjusted means (split.plot)` split.plot adjusted.mean standard.error tukey snk duncan t 1 w12 1.5937 0.0435 a a a a 2 w11 1.4361 0.0435 ab b b b 23

3 w10 1.3049 0.0435 bc c c c 4 w9 1.2215 0.0435 c c c c $`Adjusted means (plot in levels of split.plot)` $`Adjusted means (plot in levels of split.plot)`$`plot in w10` plot.split.plot adjusted.means standard.error tukey snk duncan t 2 t2.w10 1.4222 0.0596 a a a a 1 t1.w10 1.1875 0.0632 b b b b $`Adjusted means (plot in levels of split.plot)`$`plot in w11` plot.split.plot adjusted.means standard.error tukey snk duncan t 4 t2.w11 1.6222 0.0596 a a a a 3 t1.w11 1.2500 0.0632 b b b b $`Adjusted means (plot in levels of split.plot)`$`plot in w12` plot.split.plot adjusted.means standard.error tukey snk duncan t 6 t2.w12 1.8000 0.0596 a a a a 5 t1.w12 1.3875 0.0632 b b b b $`Adjusted means (plot in levels of split.plot)`$`plot in w9` plot.split.plot adjusted.means standard.error tukey snk duncan t 8 t2.w9 1.2556 0.0596 a a a a 7 t1.w9 1.1875 0.0632 a a a a $`Adjusted means (split.plot in levels of plot)` $`Adjusted means (split.plot in levels of plot)`$`split.plot in t1` plot.split.plot adjusted.means standard.error tukey snk duncan t 5 t1.w12 1.3875 0.0632 a a a a 3 t1.w11 1.2500 0.0632 a a ab ab 1 t1.w10 1.1875 0.0632 a a b b 7 t1.w9 1.1875 0.0632 a a b b $`Adjusted means (split.plot in levels of plot)`$`split.plot in t2` plot.split.plot adjusted.means standard.error tukey snk duncan t 6 t2.w12 1.8000 0.0596 a a a a 4 t2.w11 1.6222 0.0596 ab b b b 2 t2.w10 1.4222 0.0596 bc c c c 8 t2.w9 1.2556 0.0596 c c c c $`Residual analysis` values p.value Shapiro-Wilk test 0.6596 p.value Bartlett test (plot) 0.0056 p.value Bartlett test (split.plot) 0.9215 p.value Bartlett test (plot*split.plot) 0.2922 AIC -17.1973 BIC 5.8405 first value most discrepant 59.0000 second value most discrepant 42.0000 third value most discrepant 44.0000 Neste experimento ocorre interação significativa, ou seja, o efeito dos tratamentos (fator da parcela) é alterado significativamente dependendo da semana de avaliação (subparcela). Este fato pode ser observado no desdobramento da interação, onde o tratamento dois é superior nas três primeiras semanas e equivalente ao tratamento um na quarta semana. Na análise de resíduos verificam-se resíduos com aproximação da normalidade (p>0,05 no teste de Shapiro-Wilk) e homogeneidade de variâncias para a subparcela 24

(split-plot) e a interação (plot*split-plot) (p>0,05 nos testes de Bartlett). O efeito principal de parcela (plot) não teve homogeneidade de variâncias no teste de Bartlett. No entanto, este efeito (parcela) não deve ser considerado importante na análise e sim, o efeito da interação que foi significativo. Também não deve ocorrer outliers neste conjunto de dados, pois nenhum resíduo fica fora dos limites de 2,5 desvios padrões (Figura 9). Figura 9. Gráfico dos resíduos padronizados versus a seqüência dos dados. Esquema de parcelas subdivididas em delineamento de blocos ao acaso Aqui também utilizaremos o pacote easyanova com a função ea2( ) que em caso de dados faltantes (desbalanceamento) faz os ajustes necessários. Abaixo carregaremos o pacote e exemplo denominado data8 contido no pacote. require(easyanova) data(data8) 25

Para visualizar os dados: data8 pasture block mineral milk 1 p4 1 m2 30 2 p4 1 m1 29 3 p1 1 m2 27 4 p1 1 m1 25 5 p2 1 m1 26 6 p2 1 m2 28 7 p3 1 m2 26 8 p3 1 m1 24 9 p2 2 m1 32 10 p2 2 m2 37 11 p1 2 m2 30 12 p1 2 m1 31 13 p4 2 m1 34 14 p4 2 m2 37 15 p3 2 m1 33 16 p3 2 m2 32 17 p1 3 m2 34 18 p1 3 m1 31 19 p2 3 m1 30 20 p2 3 m2 31 21 p4 3 m2 36 22 p4 3 m1 38 23 p3 3 m1 33 24 p3 3 m2 32 No exemplo, obtido de Kaps e Lamberson (2009), o efeito de parcela (primeira coluna) foi composto por quatro tipos de pastagem. O efeito de bloco composto por faixas de solo homogêneas para o plantio das pastagens (segunda coluna). A subparcela foi composta por efeito de suplementação mineral (terceira coluna). A quarta coluna refere-se a produção de leite (variável resposta numérica). Para analisar os dados e gravar o resultado em um objeto chamado resultado fazemos: resultado=ea2(data8, design=5) O argumento design=5 define que será realizada análise em esquema de parcelas subdivididas em delineamento de blocos ao acaso. Para observar o resultado fazemos: 26

resultado $`Marginal anova (Type III Sum of Squares)` numdf dendf F-value p-value plot 3 6 5.456869 0.0377 split.plot 1 8 3.629630 0.0932 block 2 6 24.450479 0.0013 plot:split.plot 3 8 0.864198 0.4981 $`Adjusted means (plot)` plot adjusted.mean standard.error tukey snk duncan t 1 p4 34.0000 0.8512 a a a a 2 p2 30.6667 0.8512 ab b b b 3 p3 30.0000 0.8512 ab b b b 4 p1 29.6667 0.8512 b b b b $`Adjusted means (split.plot)` split.plot adjusted.mean standard.error tukey snk duncan t 1 m2 31.6667 0.5243 a a a a 2 m1 30.5000 0.5243 a a a a $`Adjusted means (plot in levels of split.plot)` $`Adjusted means (plot in levels of split.plot)`$`plot in m1` plot.split.plot adjusted.mean standard.error tukey snk duncan t 4 p4.m1 33.6667 1.0486 a a a a 3 p3.m1 30.0000 1.0486 a b b b 2 p2.m1 29.3333 1.0486 a ab b b 1 p1.m1 29.0000 1.0486 a ab b b $`Adjusted means (plot in levels of split.plot)`$`plot in m2` plot.split.plot adjusted.mean standard.error tukey snk duncan t 8 p4.m2 34.3333 1.0486 a a a a 6 p2.m2 32.0000 1.0486 a a ab ab 5 p1.m2 30.3333 1.0486 a a b b 7 p3.m2 30.0000 1.0486 a a b b $`Adjusted means (split.plot in levels of plot)` $`Adjusted means (split.plot in levels of plot)`$`split.plot in p1` plot.split.plot adjusted.mean standard.error tukey snk duncan t 5 p1.m2 30.3333 1.0486 a a a a 1 p1.m1 29.0000 1.0486 a a a a $`Adjusted means (split.plot in levels of plot)`$`split.plot in p2` plot.split.plot adjusted.mean standard.error tukey snk duncan t 6 p2.m2 32.0000 1.0486 a a a a 2 p2.m1 29.3333 1.0486 a a a a $`Adjusted means (split.plot in levels of plot)`$`split.plot in p3` plot.split.plot adjusted.mean standard.error tukey snk duncan t 3 p3.m1 30 1.0486 a a a a 7 p3.m2 30 1.0486 a a a a $`Adjusted means (split.plot in levels of plot)`$`split.plot in p4` plot.split.plot adjusted.mean standard.error tukey snk duncan t 8 p4.m2 34.3333 1.0486 a a a a 4 p4.m1 33.6667 1.0486 a a a a $`Residual analysis` values p.value Shapiro-Wilk test 0.5153 p.value Bartlett test (plot) 0.8121 p.value Bartlett test (split.plot) 0.4609 27

p.value Bartlett test (plot*split.plot) 0.4044 AIC 106.1717 BIC 114.4794 first value most discrepant 10.0000 second value most discrepant 20.0000 third value most discrepant 11.0000 Neste experimento não ocorre interação significativa. Observando o efeito dos fatores isolados tem-se efeito significativo (p<0,05) somente para parcela (tipo de pastagem). Na análise de resíduos verificam-se resíduos com aproximação da normalidade (p>0,05 no teste de Shapiro-Wilk) e homogeneidade de variâncias ( (p>0,05 nos testes de Bartlett). Também não deve ocorrer outliers neste conjunto de dados, pois nenhum resíduo fica fora dos limites de 2,5 desvios padrões (Figura 10). Figura 10. Gráfico dos resíduos padronizados versus a seqüência dos dados. 28

Análise de covariância Uma análise de covariância é uma análise onde o efeito de uma variável quantitativa que atua no experimento vai ser estimado, testado e utilizado para ajustar os dados do experimento. A seguir faremos um exemplo utilizando a função ea1( ) do pacote easyanova. Segue programação para carregar o pacote e os dados para exemplo. require(easyanova) data(data10) Para visualizar os dados: data10 Diets Initial_weight Repetitions Gain 1 A 350 1 970 2 A 400 2 1000 3 A 360 3 980 4 A 350 4 980 5 A 340 5 970 6 B 390 1 990 7 B 340 2 950 8 B 410 3 980 9 B 430 4 990 10 B 390 5 980 11 C 400 1 990 12 C 320 2 940 13 C 330 3 930 14 C 390 4 1000 15 C 420 5 1000 Estes dado, obtidos de Kaps e Lamberson (2009), representam o efeito de três dietas no ganho de peso diário de bezerros. O experimento foi instalado no delineamento inteiramente ao acaso. Ocorre que animais inicialmente mais pesados têm a tendência de ganhar mais peso. Se ocorrer diferença entre os grupos de cada tratamento, um ajuste através da análise de covariância é adequado. 29

A ordem das colunas no conjunto de dados para análise com a função ea1( ) deve ser: 1) tratamento; 2) covariável (no caso o peso inicial); 3) ganho de peso (variável resposta). A coluna referente às repetições (terceira coluna) deve ser retirada antes de proceder à análise, como programado a seguir. datacov=data10[,-3] resultado=ea1(datacov, design=5) Para visualizar o resultado. resultado $`Analysis of variance` df type I SS mean square F value p>f covariate 1 4441.253 4441.2526 46.9153 <0.001 treatments 2 1050.762 525.3810 5.5499 0.0216 Residuals 11 1041.319 94.6653 - - $`Adjusted means` treatment adjusted.mean standard.error tukey snk 1 A 988.8645 4.3512 a a 2 C 973.6117 4.3512 ab b 3 B 967.5238 4.3512 b b duncan t scott_knott 1 a a a 2 b b b 3 b b b $`Multiple comparison test` pair contrast p(tukey) p(snk) p(duncan) p(t) 1 A - C 15.2528 0.0728 0.0306 0.0306 0.0306 2 A - B 21.3407 0.0134 0.0134 0.0067 0.0053 3 C - B 6.0879 0.5983 0.3438 0.3438 0.3438 $`Residual analysis` values p.value Shapiro-Wilk test 0.9014 p.value Bartlett test 0.1274 coefficient of variation (%) 1.0000 first value most discrepant 14.0000 second value most discrepant 13.0000 third value most discrepant 6.0000 Ocorre efeito significativo para tratamentos e para a covariável. Sem problemas quanto à normalidade e homogeneidade de variâncias. A seguir se procede a análise sem considerar a covariável (peso inicial). Assim, temos um delineamento inteiramente ao acaso (função ea1( ) design=1). Repare que não ocorre 30

diferença entre as médias dos tratamentos e aumenta o coeficiente de variação, demonstrando a importância da análise de covariância neste exemplo. resultado=ea1(datacov[,-2], design=1) resultado $`Analysis of variance` df type I SS mean square F value p>f treatments 2 173.3333 86.6667 0.1635 0.851 Residuals 12 6360.0000 530.0000 - - $Means treatment mean standard.error tukey snk duncan t scott_knott 1 A 980 10.2956 a a a a a 2 B 978 10.2956 a a a a a 3 C 972 10.2956 a a a a a $`Multiple comparison test` pair contrast p(tukey) p(snk) p(duncan) p(t) 1 A - B 2 0.9897 0.8930 0.8930 0.8930 2 A - C 8 0.8487 0.8487 0.6110 0.5928 3 B - C 6 0.9113 0.6875 0.6875 0.6875 $`Residual analysis` values p.value Shapiro-Wilk test 0.3583 p.value Bartlett test 0.1274 coefficient of variation (%) 2.3600 first value most discrepant 13.0000 second value most discrepant 12.0000 third value most discrepant 14.0000 Contrastes de médias O objetivo deste tópico não é demonstrar contrastes entre pares de médias ou os chamados testes de comparações múltiplas. Os mesmos são demonstrados nos tópicos anteriores em cada exemplo apresentado segundo o tipo de esquema experimental e delineamento estatístico. Neste tópico demonstraremos como proceder para comparar grupos de médias. Primeiro vamos demonstrar como fazer contrastes de grupos de médias utilizando a função ec( ) do pacote easyanova. Carregando exemplo de Kaps e Lamberson (2009) contido no pacote easyanova. require(easyanova) 31

data(data1) Para visualizar os dados: data1 Diet Gain 1 d1 270 2 d1 300 3 d1 280 4 d1 280 5 d1 270 6 d2 290 7 d2 250 8 d2 280 9 d2 290 10 d2 280 11 d3 290 12 d3 340 13 d3 330 14 d3 300 15 d3 300 Realizando a analise de variância: resultado=ea1(data1, design=1) Observando o resultado: resultado $`Analysis of variance` df type I SS mean square F value p>f treatments 2 3640 1820.0000 6.1348 0.0146 Residuals 12 3560 296.6667 - - $Means treatment mean standard.error tukey snk duncan t scott_knott 1 d3 312 7.7028 a a a a a 2 d1 280 7.7028 b b b b b 3 d2 278 7.7028 b b b b b 32

$`Multiple comparison test` pair contrast p(tukey) p(snk) p(duncan) p(t) 1 d3 - d1 32 0.0310 0.0124 0.0124 0.0124 2 d3 - d2 34 0.0223 0.0223 0.0112 0.0088 3 d1 - d2 2 0.9816 0.8574 0.8574 0.8574 $`Residual analysis` values p.value Shapiro-Wilk test 0.8937 p.value Bartlett test 0.5662 coefficient of variation (%) 5.9400 first value most discrepant 7.0000 second value most discrepant 12.0000 third value most discrepant 11.0000 Desdobrando em contrastes ortogonais. Primeiro contraste, fazendo d3 versus demais, ocorrendo diferença significativa. mg1=312 mg2=c(278,280) sdg1=7.7028 sdg2=c(7.7028,7.7028) df=12 ec(mg1,mg2,sdg1,sdg2,df) grupos contrast standard.error tcal p.value 1 group.1 vs group.2 66 18.8679 3.5 0.0044 Segundo contraste, fazendo d1 versus d2, sem ocorrência de diferença significativa. mg1=280 mg2=278 sdg1=7.7028 sdg2=7.7028 df=12 ec(mg1,mg2,sdg1,sdg2,df) grupos contrast standard.error tcal p.value 1 group.1 vs group.2 2 10.8934 0.18 0.8574 33

ortogonais. Ou então fazendo via funções do R base, primeiro criando uma matriz de contrastes c=matrix(c(-1,-1,2,1,-1,0),ncol=2) c=t(c) c [,1] [,2] [,3] [1,] -1-1 2 [2,] 1-1 0 Invertendo (inversa generalizada) a matriz de contrastes ortogonais. c1=ginv(c) c1 [,1] [,2] [1,] -0.1666667 5.000000e-01 [2,] -0.1666667-5.000000e-01 [3,] 0.3333333 2.076565e-17 Modelo com os contrastes e o resultado. contrasts(data1$diet)=c1 m=lm(gain~diet, data=data1) summary(m) Call: lm(formula = Gain ~ Diet, data = data1) Residuals: Min 1Q Median 3Q Max -28-11 0 12 28 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 290.000 4.447 65.209 <2e-16 *** Diet1 66.000 18.868 3.498 0.0044 ** Diet2 2.000 10.893 0.184 0.8574 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 34

Residual standard error: 17.22 on 12 degrees of freedom Multiple R-squared: 0.5056, Adjusted R-squared: 0.4231 F-statistic: 6.135 on 2 and 12 DF, p-value: 0.01461 35

Referências KAPS, M. and LAMBERSON, W. R. Biostatistics for Animal Science: an introductory text. 2nd Edition. CABI Publishing, Wallingford, Oxfordshire, UK, 2009. 504p. SAMPAIO, I. B. M. Estatistica aplicada a experimentacao animal. 3nd Edition. Belo Horizonte: Editora FEPMVZ, Fundacao de Ensino e Pesquisa em Medicina Veterinaria e Zootecnia, 2010. 264p. R-Fácil (2014) URL http://r-facil.webnode.com/ R Core Team (2014). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL http://www.r-project.org/. 36