EXPERIMENTAÇÃO AGRÍCOLA Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari amanda@fcav.unesp.br
INTRODUÇÃO Um dos principais objetivos da estatística é a tomada de decisões a respeito da população, com base na observação de amostras. ou seja, obtenção de conclusões válidas para toda a população com base em amostras retiradas dessas populações.
INTRODUÇÃO Para tanto, torna-se necessário a formulação de hipóteses ou suposições relativas às populações. Essas suposições, que podem ou não ser verdadeiras, são chamadas de hipóteses estatísticas e constituem, geralmente, em considerações a respeito das distribuições de probabilidade das populações.
INTRODUÇÃO É muito comum formularmos uma hipótese estatística com o objetivo de rejeitá-la. Exemplo: Quando realizamos um experimento com o objetivo de verificar qual o cultivar de milho mais produtivo Formulamos a hipótese de que não existam diferenças entre os cultivares em relação à produção. Assim, quaisquer diferenças observadas são devidas às aos fatores não controláveis (o acaso)
INTRODUÇÃO A hipótese inicial que formulamos, é denominada de hipótese de nulidade (ou hipótese nula) e é representada por H o. Se verificarmos que os resultados obtidos em um experimento diferem acentuadamente dos resultados esperados para essa hipótese Devemos concluir que as diferenças observadas são significativas, e rejeitase a hipótese H o.
INTRODUÇÃO Ao rejeitarmos a hipótese de nulidade, aceitamos outra hipótese que é representada por H 1 e denominada de hipótese alternativa. No exemplo anterior sobre a comparação entre cultivares, a hipótese alternativa seria: os cultivares testados diferem entre si em relação à produção de milho.
INTRODUÇÃO Os métodos que permitem decidir se uma hipótese deve ser aceita ou rejeitada, ou se os resultados obtidos diferem significativamente dos esperados, são denominados testes de significância, ou testes de hipóteses.
H 0 : m produção de milho = 25t/ha H 1 : m produção de milho < 25t/ha f(x) Porém, ao tomarmos decisões de rejeitar ou aceitar uma determinada hipótese, estamos sujeitos a cometer dois tipos de erros: ERRO DO TIPO I é o erro que cometemos ao rejeitar uma hipótese verdadeira que deveria ser aceita, ou seja, o teste apresenta um resultado significativo, quando não existem diferenças entre os efeitos dos tratamentos. Região de rejeição de H 0 INTRODUÇÃO Região de não rejeição de H 0 Erro tipo I curva para H 0 valor crítico = 20 m = 25 variável X
H 0 : m produção de milho = 25t/ha H 1 : m produção de milho < 25t/ha f(x) m < 25 m = 25 variável X ERRO DO TIPO II é o erro que cometemos ao aceitar uma hipótese falsa que deveria ser rejeitada, INTRODUÇÃO ou seja, o teste apresenta um resultado não significativo, quando existem diferenças entre os efeitos tratamentos. Região de rejeição de H 0 Região de não rejeição de H 0 curva para H 1 curva para H 0 Erro tipo I Erro tipo II
f(x) INTRODUÇÃO Na prática, quando diminuímos a probabilidade de um dos erros, aumentamos a probabilidade de ocorrência do outro. Região de rejeição de H 0 H 0 : m produção de milho = 25t/ha H 1 : m produção de milho < 25t/ha Região de não rejeição de H 0 curva para H 1 Erro tipo II curva para H 0 Erro tipo I valor crítico = 19 m = 25 variável X
INTRODUÇÃO Quando aplicamos um teste de hipóteses, geralmente controlamos o ERRO DO TIPO I, através do nível de significância do teste. O nível de significância do teste, representado por α, é a probabilidade máxima aceitável de cometer um ERRO TIPO I. Geralmente, fixamos esse nível de significância em 5% α = 0,05 ou em 1% α = 0,01. 5% 95% Se utilizarmos o nível de significância de 5%, temos 5 chances em 100 de rejeitarmos uma hipótese que deveria ser aceita, isto é, há uma confiança de 95% de que tenhamos tomado uma decisão correta.
INTRODUÇÃO Essa confiança de termos tomado uma decisão correta é denominada de grau de confiança, e é dada por: 100 1 α % O teste de significância mais utilizado em estatística experimental é o teste F para comparação de variâncias.
INTRODUÇÃO p-valor é a probabilidade de que a estatística do teste (como variável aleatória) tenha valor extremo em relação ao valor observado (estatística) quando a hipótese nula é verdadeira. Exemplo: considere um teste de hipóteses para a média no qual o valor da estatística é dado por Z obs p-valor DENTRO da região de rejeição de H 0 p-valor FORA da região de rejeição de H 0
INTRODUÇÃO Assim, o p-valor indica o quanto nossos resultados são compatíveis com a hipótese nula. Valor alto do p-valor indica que os resultados são compatíveis com a hipótese nula, neste caso aceita-se H 0. Valor baixo do p-valor indica que os resultados NÃO são compatíveis com a hipótese nula, neste caso rejeita-se H 0 em favor de H 1.
TESTE F PARA ANÁLISE DE VARIÂNCIA A análise de variância é uma técnica que permite fazer a decomposição da variância total em partes atribuídas a causas conhecidas e independentes, e a uma porção residual de origem desconhecida e de natureza aleatória.
TESTE F PARA ANÁLISE DE VARIÂNCIA O teste F serve para comparar duas estimativas de variâncias independentes. Na análise de variância, as estimativas de variância são dadas pelos quadrados médios (QM), logo devemos obter um QM para cada causa de variação. Em um experimento inteiramente casualizado (DIC), temos 2 estimativas de variância: Uma devido aos efeitos de tratamento (QM Tratamento) A outra devido aos efeitos dos fatores não controlados ou acaso (QM Resíduo).
TESTE F PARA ANÁLISE DE VARIÂNCIA Para aplicar o teste F na análise de variância, utilizamos sempre no denominador o QM do resíduo Comparamos sempre uma variância causada pelos efeitos do fator que está sendo estudado (tratamentos, blocos, linhas, colunas, outros), com a variância causada pelos efeitos dos fatores não controlados ou acaso (resíduo). Assim, F = QMTratamentos QMResíduo = QM Trat QM Res
TESTE F PARA ANÁLISE DE VARIÂNCIA Sob a hipótese da nulidade (supondo que os efeitos dos tratamentos são todos nulos) teríamos duas estimativas de variância: QM Tratamento e QM Resíduo que não deveriam diferir, a não ser por variações amostrais (pois ambas estimam a variação do acaso). Variância Função Notação QM Resíduo estima a variação do acaso. σ 2 QM Tratamento estima a variação do acaso mais a variação causada pelo efeito de tratamentos. σ 2 + JΦ t, Φ t = I i=1 I 1 t i 2 F = QM Trat QM Res = σ2 + JΦ t σ 2
TESTE F PARA ANÁLISE DE VARIÂNCIA
TESTE F PARA ANÁLISE DE VARIÂNCIA
TESTE F PARA ANÁLISE DE VARIÂNCIA Critério do teste: se logo então F calculado F tabelado F calculado < F tabelado F = QMTratamentos QMResíduo o teste é significativo ao nível de significância α considerado. o teste é não significativo ao nível de significância α considerado. Deve-se rejeitar a hipótese nula H o : σ 2 2 1 = σ 2 em favor de H 1 e concluir que os efeitos dos tratamentos diferem entre si ao nível de significância α considerado. Essas diferenças não devem ser atribuídas ao acaso e sim ao efeito dos tratamentos, com um grau de confiança de 100 1 α %. Não rejeitamos a hipótese nula H o : σ 1 2 = σ 2 2 e concluímos que os efeitos dos tratamentos não diferem entre si ao nível de significância α considerado.
TESTE F PARA ANÁLISE DE VARIÂNCIA Resumindo o critério do teste: se logo então notação F calc < F tab (5%) F tab 5% < F calc < F tab (1%) F tab 1% < F calc o teste é não significativo ao nível de significância α = 0,05. o teste é significativo ao nível de significância α = 0,05. o teste é significativo ao nível de significância α = 0,01. Aceitamos H o Rejeitamos H o em favor de H 1 com um grau de confiança de 95% Rejeitamos H o em favor de H 1 com um grau de confiança de 99% NS F calc F calc F calc
e contados o número de sementes em 10 bagas. TESTE F PARA ANÁLISE DE VARIÂNCIA Exemplo. Em um estudo para analisar os efeitos da Giberelina aplicada antes, durante e depois do florescimento sobre cachos de videira, foram realizados os seguintes tratamentos: 1. Imersão dos cachos em solução de Giberelina na concentração de 20 ppm no florescimento; 2. Imersão dos cachos em solução de Giberelina na concentração de 20 ppm no florescimento e 15 ppm no início da frituficação; 3. Imersão dos cachos em solução de Giberelina na concentração de 05 ppm antes do florescimento e 20 ppm no florescimento; 4. Desbaste manual das bagas; 5. Testemunha
TESTE F PARA ANÁLISE DE VARIÂNCIA O delineamento experimental utilizado foi em blocos casualizados, com 4 repetições por tratamento. As hipóteses para tratamentos que desejamos testar são: H 0 : Os tratamentos não diferem entre si em relação ao número de sementes em 10 bagas. H 1 : Os tratamentos diferem entre si em relação ao número de sementes em 10 bagas. As hipóteses para blocos que desejamos testar são: H 0 : Os blocos não diferem entre si em relação ao número de sementes em 10 bagas. H 1 : Os blocos diferem entre si em relação ao número de sementes em 10 bagas.
TESTE F PARA ANÁLISE DE VARIÂNCIA As somas de quadrados obtidas para análise de variância do número de sementes em 10 bagas normais (média de 4 cachos por parcela), foram: SQ Tratamento = 640,2365 SQ Blocos = 30,6812 SQ Total = 722,3056 Para testar as hipóteses, podemos construir o seguinte quadro de análise de variância: Causas de Variação GL SQ QM F Tratamentos n trat 1 = 640, 2365 SQ trat GL trat = QM trat QM resíduo = Blocos n blocos 1 = 30,6812 SQ blocos GL blocos = QM blocos QM resíduo = Resíduo GL Total GL trat + GL blocos = SQ Total SQ trat + SQ blocos = SQ resíduo GL resíduo = Total n trat n rep 1 = 722, 3056
TESTE F PARA ANÁLISE DE VARIÂNCIA Quadro de análise de variância: Causas de Variação GL SQ QM F Tratamentos 4 640,2365 160,0591 37, 38 ** Blocos 3 30,6812 10,2271 2, 39 NS Resíduo 12 51,3879 4,2823 Total 19 722,3056 o Valores de F da tabela Para Tratamento 4GL 12 GL : F calc = 37, 38 > 5, 41 = F tab 1% Para Bloco 3GL 12GL : F calc = 2, 39 < 3, 49 = F tab 5% 5% 3, 26 1% 5, 41 5% 3, 49 1% 5, 95
TESTE F PARA ANÁLISE DE VARIÂNCIA Conclusões: Para Tratamento Uma vez que F calc = 37, 38 > 5, 41 = F tab 1% o teste foi significativo ao nível de significância de 1%. Deve-se rejeitar a hipótese nula em favor de H 1 e concluir que os efeitos dos tratamentos diferem entre si ao nível de significância 1%. Essas diferenças não devem ser atribuídas ao acaso e sim ao efeito dos tratamentos. Portanto, conclui-se que os tratamentos testados possuem efeitos diferentes quanto ao número de sementes em 10 bagas, com um grau de confiança de 99%.
TESTE F PARA ANÁLISE DE VARIÂNCIA Conclusões: Para Blocos Uma vez que F calc = 2, 39 < 3, 49 = F tab 5% o teste foi não significativo ao nível de significância de 5% deve-se aceitar a hipótese nula e concluir que os efeitos dos blocos não diferem entre si ao nível de significância 5%. Portanto, conclui-se que os blocos testados possuem efeitos semelhantes quanto ao número de sementes em 10 bagas.
Exercício
TESTE F PARA ANÁLISE DE VARIÂNCIA Exemplo. Em um estudo para analisar os efeitos da adubação fosfatada na produção e qualidade de sementes de populações de amendoim, analisou-se o comportamento de 5 populações de amendoim. Os tratamentos foram constituídos por três cultivares (Tatu, Oirã e Tupã) e duas linhagens obtidas na FCA (FCA 170 e FCA 265). O experimento foi realizado em blocos casualizados, com 4 repetições. Sabendo-se que a soma de quadrados para o peso de 100 sementes (g) das 5 populações, submetidas a uma adubação de 40kg/ha de P 2 O 5 foram: SQ Tratamento = 844,80 SQ Blocos = 85,23 SQ Total = 971,60 Verifique se existe diferença significativa entre os tratamentos no peso de 100 semente.
TESTE F PARA ANÁLISE DE VARIÂNCIA As hipóteses para tratamentos que desejamos testar são: H 0 : As populações submetidas a uma adubação de 40kg/ha de P 2 O 5 não diferem entre si em relação ao peso de 100 sementes(g). H 1 : As populações submetidas a uma adubação de 40kg/ha de P 2 O 5 diferem entre si em relação ao peso de 100 sementes (g). As hipóteses para blocos que desejamos testar são: H 0 : Os blocos não diferem entre si em relação em relação ao peso de 100 sementes (g). H 1 : Os blocos diferem entre si em relação em relação ao peso de 100 sementes (g).
TESTE F PARA ANÁLISE DE VARIÂNCIA Para testar as hipóteses, construímos o seguinte quadro de análise de variância: Causas de Variação GL SQ QM F Tratamentos n trat 1 = 844, 80 SQ trat GL trat = QM trat QM resíduo = Blocos n blocos 1 = 85,23 SQ blocos GL blocos = QM blocos QM resíduo = Resíduo GL Total GL trat + GL blocos = SQ Total SQ trat + SQ blocos = SQ resíduo GL resíduo = Total n trat n rep 1 = 971, 60
TESTE F PARA ANÁLISE DE VARIÂNCIA Quadro de análise de variância: Causas de Variação GL SQ QM F Tratamentos 4 844,80 211,20 60, 97 Blocos 3 85,23 28,41 8, 20 ** Resíduo 12 41,57 3,4642 Total 19 971,60 o Valores de F da tabela Para Tratamento 4 12 g. l. : F calc = 60, 97 > 5, 41 = F tab 1% Para Bloco 3 12 g. l. : F calc = 8, 20 > 5, 95 = F tab 1% 5% 3, 26 1% 5, 41 5% 3, 49 1% 5, 95
TESTE F PARA ANÁLISE DE VARIÂNCIA Conclusões: Para Tratamento Uma vez que F calc = 60, 98 > 5, 41 = F tab 1% o teste foi significativo ao nível de significância de 1%. Deve-se rejeitar a hipótese nula em favor de H 1 e concluir que os efeitos dos tratamentos diferem entre si ao nível de significância 1%. Essas diferenças não devem ser atribuídas ao acaso e sim ao efeito dos tratamentos. Portanto, conclui-se que as populações submetidas a uma adubação de 40kg/ha de P 2 O 5 diferem entre si em relação ao peso de 100 sementes (g), com um grau de confiança de 99%.
TESTE F PARA ANÁLISE DE VARIÂNCIA Conclusões: Para Blocos Uma vez que F calc = 8, 20 > 5, 95 = F tab 1% o teste foi significativo ao nível de significância de 1%. Deve-se rejeitar a hipótese nula em favor de H 1 e concluir que os efeitos dos tratamentos diferem entre si ao nível de significância 1%. Essas diferenças não devem ser atribuídas ao acaso e sim ao efeito dos tratamentos. Portanto, conclui-se que os blocos diferem entre si em relação ao peso de 100 sementes (g), com um grau de confiança de 99%.
Aula Prática
Em um DIC, estudou-se o efeito da idade da semente sobre a capacidade de emergência e o vigor de sementes de maracujá amarelo. Foram utilizados como tratamentos sementes de 0, 1, 2, 3, 4 e 5 anos de idade, e os resultados obtidos para o comprimento médio do hipocótilo das plântulas (cm) foram os seguintes: EXERCÍCIO AULA PRÁTICA Idade da Repetições Semente 1 2 3 4 0 anos 4,81 4,76 4,80 4,33 1 anos 3,83 3,31 3,75 3,58 2 anos 3,46 3,78 3,81 4,16 3 anos 3,73 3,33 3,53 3,88 4 anos 2,53 3,10 3,28 2,66 5 anos 3,26 3,31 3,40 2,93
EXERCÍCIO AULA PRÁTICA Solução. Passo 1. Defina as hipóteses a serem testadas H 0 : As idades das sementes testadas possuem efeitos semelhantes sobre o comprimento do hipocótilo das plântulas. H 1 : As idades das sementes testadas possuem efeitos distintos sobre o comprimento do hipocótilo das plântulas.
Solução. EXERCÍCIO AULA PRÁTICA Passo 2. Coloque os dados em uma planilha do Excel 2.1 Digite os dados 2.2 Clique em arquivo, salvar como 2.3 Escolha: Nome: aula4 Tipo: Texto (MS-DOS) Salvar
Solução. EXERCÍCIO AULA PRÁTICA Passo 3. Entre com os dados no software R 3.2. Definição do modelo FTR <- as.factor(tr) # toda fonte de variação deve ser um fator mod <- aov(y~ftr) # anova sem análise de resíduo summary(mod)
Solução. EXERCÍCIO AULA PRÁTICA Passo 3. Entre com os dados no software R 3.3. Complete a tabela da ANOVA Causas de Variação Tratamento Resíduo Total GL SQ QM F Conclua:
Solução. EXERCÍCIO AULA PRÁTICA Passo 3. Entre com os dados no software R 3.3. Complete a tabela da ANOVA Causas de Variação GL SQ QM F Tratamentos 5 7,3184 1,4637 21, 23 Resíduo 18 1,2411 0,0689 Total 23 8,5595 Conclua: O teste foi significativo, com nível de significância α = 0,001. Deve-se rejeitar H 0 em favor de H 1 e concluir que os efeitos dos tratamentos diferem entre si. Essas diferenças não devem ser atribuídas ao acaso e sim ao efeito dos tratamentos. Portanto, conclui-se que as idades das sementes testadas possuem efeitos distintos sobre o comprimento do hipocótilo das plântulas.
Solução. EXERCÍCIO AULA PRÁTICA Passo 3. Entre com os dados no software R 3.4. Determine o coeficiente de variação do experimento QMRes <- 0.069; QMRes cv <- 100*sqrt(QMRes)/mean(Y,na.rm=T);cv Conclua: o coeficiente de variação do experimento foi de: CV = 7,22%
Solução. EXERCÍCIO AULA PRÁTICA Passo 3. Entre com os dados no software R 3.5. Verifique o gráfico Box_Plot por TRatamento plot(y~ftr)
EXERCÍCIO AULA PRÁTICA Solução. Passo 3. Entre com os dados no software R 3.6. Verifique os gráficos de diagnóstico par(mfrow=c(1,3)) rs <- rstudent(mod) hist(rs, main="histograma"); boxplot(rs, main="boxplot") qqnorm(rs, main="normalidade"); qqline(rs)
Solução. EXERCÍCIO AULA PRÁTICA Passo 3. Entre com os dados no software R 3.7. Verifique a normalidade dos resíduos (teste de Shapiro Wilk) shapiro.test(rs) Conclua: O teste de normalidade foi não significativo, pois: p valor = 0,11 > 0,05 Portanto aceitamos a hipótese nula e concluímos que os resíduos dos tratamentos possuem distribuição normal.
Solução. EXERCÍCIO AULA PRÁTICA Passo 3. Entre com os dados no software R 3.8. Verifique a homocedasticidade dos resíduos (teste de Bartlett) bartlett.test(y~ftr) Conclua: O teste de homocedasticidade foi não significativo, pois: p valor = 0,95 > 0,05 Portanto aceitamos a hipótese nula e concluímos que os a variância dos resíduos dos tratamentos são homogêneas.