ESTATÍSTICA EXPERIMENTAL ESTUDO DE VARIABILIDADE DOS DADOS EXPERIMENTAIS Prof. Miguel Toledo del Pino, Eng. Agrícola (Dr.) INTRODUÇÃO Realizamos experimentos para compararmos os efeitos de tratamentos Contudo, no experimento há causas de variabilidade encontradas na variável resposta que são controladas pelo pesquisador (tratamentos, controle local) e outras de natureza desconhecida, portanto, não controláveis 1
INTRODUÇÃO Em geral, as causas de variabilidade em experimentos podem ser resumidas em: Tratamentos Ambiente heterogêneo Variabilidade genéticas entre indivíduos Diferenças na condução do experimento Causas aleatórias não previstas ANÁLISE DE VARIÂNCIA O objetivo é separar da VARIAÇÃO TOTAL DOS DADOS EXPERIMENTAIS as partes devida as causas controláveis (tratamentos) de outra devida as causas não controláveis O pesquisador Sir Ronald Amler Fisher (1935) desenvolveu uma técnica estatística denominada ANÁLISE DE VARIÂNCIA, também denominada de ANAVA ou ANOVA 2
ANÁLISE DE VARIÂNCIA A Análise de Variância consiste na decomposição da variação total de um conjunto de dados experimentais em partes atribuídas: Causas conhecidas e controláveis Tratamentos e blocos Causas desconhecidas e incontroláveis Erro experimental ou Resíduo ANÁLISE DE VARIÂNCIA ESQUEMA: Variação total dos dados Variação entre tratamentos = + Variação dentro de tratamentos A variação dentro de tratamentos reflete a variação entre as unidades experimentais que receberam o mesmo tratamento, portanto, refere-se ao erro experimental 3
ANÁLISE DE VARIÂNCIA ESQUEMA: Variação total dos dados Variação entre tratamentos = + Variação do erro experimental HIPÓTESES DA ANAVA Ao planejar e executar um experimento, o pesquisador tem como objetivo verificar uma hipótese científica A verificação da hipótese científica é realizada a formulação de hipóteses estatísticas a ela associadas Uma hipótese estatística consiste numa suposição sobre valores dos parâmetros populacionais que será submetida a um teste estatístico 4
HIPÓTESES DA ANAVA Na experimentação, as hipóteses estão relacionadas com as médias populacionais dos tratamentos ( ) Basicamente, temos dois tipos de hipóteses estatísticas: H 0 : hipótese de nulidade, no qual será testada H 1 ou H a : que consiste em qualquer hipótese contrária a H 0 HIPÓTESES DA ANAVA Hipótese de nulidade (H 0 ) Não existem diferenças entre os efeitos dos tratamentos Não existem diferenças entre as médias dos tratamentos H 0 : 1 = 2 H 0 : 1 = 2 =... = t (dois tratamentos) (para t > dois tratamentos) 5
HIPÓTESES DA ANAVA Hipótese alternativa (H 1 ) Existem pelo menos uma diferença entre os efeitos dos tratamentos Existe pelo menos uma diferença entre as médias dos tratamentos H 1 : 1 2 (dois tratamentos) H 0 : ti ti+1 (para ti > dois tratamentos) TABELA DA ANAVA Causas de Variação (CV) Fontes de Variação (FV) Graus de Liberdade (GL) Soma de Quadrados (SQ) Quadrado Médio (QM) Tratamentos GL Trat SQ Trat QM Trat Erro experimental ou Resíduo GL Erro SQ Erro QM Erro TOTAL GL Total SQ Total Fator F calculado (Fc) QM Trat / QM Erro 6
TABELA DA ANAVA Fontes de Variação ou Causas de Variação Causas de variabilidade nos dados experimentais Graus de Liberdade GL Total = n 1, em que n é o número de parcelas do experimento GL Trat = t 1, em que t é o número de tratamentos GL Erro = GL Total GL Trat TABELA DA ANAVA Soma de Quadrados Total (SQ Total) n n SQTotal = Y 2 i C C = 1 n i=1 i 1 Y i 2 Em que Y é a variável resposta e C é a correção 7
TABELA DA ANAVA Soma de Quadrados Tratamento (SQ Trat) t SQTrat = 1 T 2 r i C C = 1 i n i=1 i 1 Em que T i é o total de tratamentos e r i é o número de repetições do tratamento i Normalmente os experimentos são planejados com o mesmo número de repetições para cada tratamento n Y i 2 TABELA DA ANAVA Quadrado Médio de Tratamentos (QM Trat) Corresponde a razão entre a Soma de Quadrados (SQ) pelo respectivo Grau de Liberdade (GL) QMTrat = SQTrat GLTrat QMErro = SQErro GLErro 8
TESTE F (SNEDECOR) Teste de hipótese ou significância Processo estatístico utilizado para decidir objetivamente sobre a rejeição ou aceitação de hipóteses estatísticas Testa se a hipótese científica é falsa ou verdadeira TESTE F (SNEDECOR) Aplicação do teste de F, desenvolvido por Snedecor Estabelecer o nível de significância ( ) do teste Podemos ter dois tipos de erros: Erro Tipo I: probabilidade ( ) de rejeitar H 0 quando for verdadeira Erro Tipo II: probabilidade ( ) de aceitar H 0 quando for falsa 9
TESTE F (SNEDECOR) Geralmente são utilizados os níveis de % de 5% e 1% de probabilidade A probabilidade de (1- )% é denominada de nível de confiança Para obter o fator F calculado (Fc), associado a hipótese estatística em estudo Fc = QMTrat QMErro TESTE F (SNEDECOR) Comparar o Fc com valores tabelados, de acordo com o nível de significância escolhido ( %) e os graus de liberdade associado às fontes de variação da ANAVA n 1 (numerador): GL dos Tratamentos n 2 (denominador): GL do Erro Tabela: F tab ( %, n 1, n 2 ) = F tab ( %, GLTrat, GLErro) 10
TESTE F (SNEDECOR) Regra de decisão Se F c F tab, em nível de % de probabilidade, rejeita-se H 0 e aceita-se H 1 Neste caso, o teste é considerado significativo em nível de % de probabilidade, ou seja, EXISTE PELO MENOS UMA DIFERENÇAS ENTRE OS TRATAMENTOS TESTE F (SNEDECOR) Regra de decisão Se F c < F tab, em nível de % de probabilidade, aceita-se H 0 Neste caso, o teste é considerado não significativo em nível de % de probabilidade, ou seja, NÃO EXISTEM DIFERENÇAS ENTRE OS TRATAMENTOS 11
TESTE F (SNEDECOR) Graficamente COEFICIENTE DE VARIAÇÃO O coeficiente de variação experimental é uma medida da relativa dispersão dos dados Normalmente expressa em porcentagem Retrata a proporção de variação dos dados (desvio padrão) relativa a média 12
COEFICIENTE DE VARIAÇÃO A equação de cálculo do CV é expressa por: CV = 1 തY QMErro. 100 തY = 1 n i=1 n Y i തY é média geral do experimento e n é o número total de parcelas experimentais COEFICIENTE DE VARIAÇÃO O coeficiente de variação (CV) tem sido utilizado como medida de precisão experimental Indicador da quantidade e da qualidade da informação a ser retirada a partir dos dados experimentais 13
COEFICIENTE DE VARIAÇÃO Valores recomendados: Baixos: CV <10% Médios: 10% < CV < 20% Altos: 20% < CV < 30% Muito altos: CV > 30% Ambientes controlados podem apresentar valores de CV < 5% 14