Éder David Borges da Silva Renato Gonçalves de Oliveira
Conteúdo abordado: Revisão de Estatística Experimental Princípios básicos de experimentação Delineamento inteiramente casualizado (DIC) Delineamento blocos ao acaso (DBA) Delineamento Quadrado latino (DQL) Esquema Fatorial Delineamento em parcela subdividida Delineamento em faixas Procedimentos de comparações multiplas Introdução ao Software R Análise de variância Analise de regressão linear Analise de regressão não linear
Momentos estatísticos _ x 1 n i n 1 x 1 n x... i 1 x n s 1 n 1 i n 1 _ x i x 4
Funções de distribuição de probabilidade normal f x,, 1 x exp 5
4 Intervalos de confiança e teste de hipótese N(0,1),1 8 6 4 1 0 - -z crít 0 z crít + 0 5 10 15 0 rejeição de H 0 z <<< 0 Se H 0 falsa aceitação de H 0 z = 0 Se H 0 verdadeira 0,14 0,1 0,1 0,08 0,06 0,04 rejeição de H 0 z >>> 0 Se H 0 falsa 1 N( 0, ) n N( 1, ) n 0,0 0 0 5 10 15 0-0 X + crít 1 6
Tipos de erro no teste de hipóteses Realidade Decisão H0 é verdadeira H0 é falsa Rejeitar H0 Erro tipo I Decisão correta Não Rejeitar H0 Decisão correta Erro tipo II 7
P-valor 8
Propriedades da distribuição F g / ( g g ) [( g g ) ] g g f x x x x ( g ) ( g ) g g 1 1 1 1 g1 / 1 1 ( ) 1 0 1 EX ( ) Var( X ) g g g ( g1 g ) g ( g ) ( g 4) 1 X ~ F g 1, g (lê-se: X tem distribuição F com g 1 e g graus de liberdade) 0 + Propriedades: a) seu ~ g e V 1 ~ g então 1 b) se X ~ F g 1, g então ~ F g, g 1 U/ g V / g 1 ~ F g, g 1 1 P( Fg, g F) P( Fg, g ) F X 1 1 F g 1, g 0 F + F g, g 1 0 1 + F 9
Teste F F calc QMT QME F r 1, nt r H 0 verd. 0 1 + F crít H 0 falso ac. H 0 rej. H 0 10
Circularidade do Método científico HIPÓTESE PLANEJAMENTO CONCLUSÃO/DESENV. TEORIA EXPERIMENTO TESTE DA HIPÓTESE ANÁLISE ESTATÍSTICA 1
Princípios básicos da experimentação Casualização Repetição Controle local A aleatorização torna os testes estatísticos válidos A repetição torna os testes estatísticos possíveis O controle local torna o experimento mais eficiente 14
Pressupostos de modelos lineares (ANOVA) Y X 16
Pressupostos de modelos lineares (ANOVA) Normalidade da distribuição dos erros; Homogeneidade das variâncias; Aditividade dos efeitos dos fatores de variação; Independência dos erros; 17
f(x) 0.0 0.1 0. 0.3 0.4 Normalidade da distribuição dos erros -4-0 4 x Analise gráfica e pelo teste Shapiro-Wilk W n i 1 n i 1 a x i i x i _ x 18
Resíduos -50 0 50 Homogeneidade das variâncias, t1 t t3 t4 t5 t6 t7 t8 t9 Linhagens Analise gráfica e pelo teste Bartlett C 1 3 1 k 1 k i 1 1 ni 1 n 1 k K n k logqmre C i K 1 ni 1 logs i ~ X k 1 19
Aditividade dos efeitos dos fatores de variação y ij i ij Cada componente do modelo deve ter efeito aditivo; 0
Resíduos -50 0 50 Independência dos erros: 4 6 8 Linhagens Os erros devem possuir independência dos demais cov( ij, ' ij ) 0 1
Definição Efeitos fixos: Os níveis em estudo forem escolhidos pelo pesquisador, de modo que o interesse centra centra-se nesses níveis; Inferência restrita aos níveis em estudo. Efeitos aleatórios (variáveis aletórias): Os níveis em estudo correspondem a uma amostra aleatória de uma população de referência; Os níveis provem de uma distribuição de probabilidade; A inferência é extrapolada para uma população de referência; 3
Observações do experimento Os valores observados quando da avaliação dos materiais representa a média fenotípica: Observação fenotípica = Efeitos genéticos + Efeitos ambientais + Efeitos residuais 4
Modelo estatístico inteiramente casualizado y ij i ij onde ij IDD ~ N(0, ) yij é o valor do i-ésimo tratamento na j-ésima parcela é a constante geral do modelo (normalmente a média) i ij é o efeito do i-ésimo tratamento é o erro experimental associado ao i-ésimo tratamento na j-ésima parcela 6
Quadro de anova DIC Fonte Tratamento Erro Total ( t GL t 1 1)( r tr 1 1) SQ SQtrat SQerro SQtotal ( t QM SQtrat t 1 SQerro 1)( r 1) EMEF r t i 1 EMEA r 7
Delineamentos blocos ao acaso Considerações importantes: O bloco é uma restrição à casualização; Isto implicará em perda de precisão experimental e ganho na facilidade de condução do experimento; Isso se deve a perda de graus de liberdade do resíduo; O bloco não é necessariamente espacial, áreas desuniformes, ele pode ser virtual, no caso de épocas de plantio por exemplo. 9
Modelo estatístico Blocos ao acaso y ij i j ij onde ij IDD ~ N(0, ) yij é o valor do i-ésimo tratamento na j-ésima parcela é a constante geral do modelo (normalmente a média) i é o efeito do i-ésimo tratamento ij j é o efeito do j-ésimo bloco é o erro experimental associado ao i-ésimo tratamento na j-ésima parcela 30
Quadro de anova DBA Fonte Bloco Tratamento Erro ( j GL j 1 t 1 1)( t 1) SQ SQbloco SQtrat SQerro QM QMbloco QMtrat QMerro EMEF t j j t 1 t 1 j j EMEA t j t Total jt 1 SQtotal QMtotal 31
DBA a c b c b a c a b 3
DBA Outra Estufa E N T R A D A Canteiro Corredor _RS _Tke _Pe _P _RSe _RS _RS _P _RSe _RSe _Pe _Tke _P _RSe _TK _TK _Tke _Pe _Pe _TK _TKe _P _TK _RS C E R C A 33
Modelo estatístico Quadrado latino y ijk i l j c k ijk onde ijk IDD ~ N(0, ) y ij é o valor do i-ésimo tratamento na j-ésima parcela é a constante geral do modelo (normalmente a média) l c i j k ij é o efeito do i-ésimo tratamento é o efeito da j-ésima linha é o efeito da k-ésima coluna é o erro experimental associado ao i-ésimo tratamento na j-ésima parcela 35
Delineamento Quadrado latino Casualização: Somente uma repetição de cada tratamento aparece em cada bloco; Limitação: O número de tratamentos deve ser igual ao número de repetições. Isso implica na necessidade de grandes áreas e grande volumes de material experimental; Desvantagem: O número de repetições aumentará a medida que o número de tratamentos também aumente; 36
Delineamento Quadrado latino Linhas Colunas I II III IV V I D A B C E II C E A B D III E B C D A IV B D E A C V A C D E B 37
Esquema fatorial Esquema fatorial não é um delineamento, é apenas um arranjo entre os tratamentos; O arranjo fatorial pode ser conduzido em Delineamento inteiramente casualisado; Blocos ao acaso; Quadrado latino; Outros; 39
Esquema fatorial Definições Fator: uma causa de variação conhecida e de interesse do pesquisador (um tipo de tratamento); Nível: subdivisão do fator; Efeito principal: pode-se estudar isoladamente o efeito de cada fator no experimento; Efeito da interação: quando existir, estudar o comportamento de cada fator, na presença ou ausência de níveis dos demais fatores 40
Modelo estatístico Esquema Fatorial y ( ) ijk i j ij ijk onde ij IDD ~ N(0, ) y ijk é o valor do i-ésimo tratamento na j-ésima parcela e na k-ésima repetição é a constante geral do modelo (normalmente a média) i é o efeito do i-ésimo nível do fator A j é o efeito da j-ésimo nível do fator B ( ) ij é o efeito da interação entre i-ésimo nível do fator A e j-ésimo nível do fator B ijk é o erro experimental entre i-ésimo nível do fator A e j-ésimo nível do fator B na k-ésima repetição. 41
Quadro de anova fatorial Fonte TratamentoA TratamentoB AB Erro GL a 1 b 1 ( a 1)( b 1) ab( r 1) SQ SQA SQB SQAB SQErro QM QMA QMB QMAB QMErro EMEF br ar r ( a a t ( 1)( b i 1 j 1 ) ij 1) EMEA r r r br ar 4
Modelo estatístico Delineamento em parcela subdividida y ijk yijk i j ij k é o valor do i-ésimo tratamento na j-ésima parcela e na k-ésima repetição é a constante geral do modelo (normalmente a média) ik ijk onde ijk IDD ~ N(0, ) i j ij k ik ijk é o efeito do i-ésimo nível do fator A é o efeito da j-ésimo bloco é o erro experimental entre i-ésimo nível do fator A e j-ésimo bloco é o efeito da k-ésimo nível do fator B é o efeito da interação entre o i-ésimo nível do fator A e da k-ésimo nível do fator B é o erro experimental entre i-ésimo nível do fator A e j-ésimo bloco e k-ésimo nível do fator B 44
Anova de split-plot 45 SQtotal abr Total QMerroB SQerrob r b a ErroB r b a r QMAB SQAB b a AB ra b ra QMB SQB b B b b QMerroa SQerroa a r ErroA rb b a rb b QMA SQA a A ab b ab b QMBloco SQBloco r Bloco EMEA EMEF QM SQ GL Fonte ij j i p p 1 1) 1)( ( 1) 1)( ( ) ( 1) 1)( ( 1 1 1) 1)( ( 1 1 1
Experimento Split-plot Quando instalar: Em experimentos fatoriais com dois ou mais fatores; Quando há alguma limitação para instalar o experimento; Facilidade para instalação; Em alguns casos é a única forma de aplicação dos tratamentos às unidades experimentais; 46
Experimento em Split-plot Definição: Esse tipo de experimento aloca o fator A em parcelas principais, ou primária, e o fator B nas sub-parcelas, ou secundárias; Cada parcela funciona como um bloco para as subparcelas; Se existem mais de dois fatores o experimento é chamado de parcelas sub-divididas e assim por diante; 47
Experimento Split-plot Croqui de uma parcela principal de um experimento em Parcelas subdivididas Parcela principal (Fator A) Sub-parcela (Fator B)
Experimento Split-plot Por exemplo: Experimento com fatores (A e B), cada um com 4 níveis, dispostos em 3 blocos: A = A1; A; A3; A4 B = B1; B; B3; B4 BLOCO = I; II; IV Bloco I A1 B4 B1 B3 B A3 B1 B3 B4 B A4 B1 B3 B B4 A B B1 B3 B4
Experimento Split-plot O fator de maior interesse deve ser colocado nas subparcelas quando possível (maior número de graus de liberdade); Caso não seja possível a aplicação dos tratamentos às parcelas principais ou sub-parcelas dependerá da facilidade de instalação do experimento; 50
Experimentos em faixas ou Split Block É uma variação dos experimentos em parcelas subdivididas; Os fatores A e B são dispostos em faixas como se fossem parcelas principais; 5
Modelo estatístico Delineamento em faixas y ijk j i ij k jk ( ) ij ijk onde ijk IDD ~ N(0, ) y ijk é o valor do i-ésimo tratamento A e k-ésimo tratamento B no j-ésima bloco é a constante geral do modelo (normalmente a média) j é o efeito do j-ésimo bloco i é o efeito da i-ésimo tratamento A ij é o erro experimental entre i-ésimo nível do fator A e j-ésimo bloco k é o efeito da k-ésimo nível do fator B ( jk ) ij é o erro experimental entre k-ésimo nível do fator B e j-ésimo bloco é o efeito da interação entre o i-ésimo nível do fator A e da k-ésimo nível do fator B ijk é o erro experimental entre i-ésimo nível do fator A e k-ésimo nivel de B no j-ésimo bloco 53
Experimento Em Faixas CROQUI B4 B B3 B1 A A1 A3
Procedimentos para comparações múltiplas Teste de Tukey ou DHS (HSD): Teste de Duncan: q p, v, QME r q p, v, p QME r 56
Procedimentos para comparações múltiplas Teste Scott-Knott: SQgrupos G1 k1 G k G3 k3 0 SQmédias k v v QME r * 0 0 57
Procedimentos para comparações múltiplas Um teste pode ter dois parâmetros; Poder do teste: Capacidade do teste em detectar diferenças reais entre os tratamentos. Rigorosidade: Confiança no resultado obtido. 58
Procedimentos para comparações múltiplas Erro tipo I por comparação: Probabilidade de se rejeitar uma hipótese verdadeira nas comparações dos tratamentos tomados dois a dois; Erro tipo I por experimento: Probabilidade de se realizar pelo menos uma inferência errada por experimento; Erro tipo III: Probabilidade de se classificar um tratamento superior ao outro quando o segundo supera o primeiro; 59
Procedimentos para comparações múltiplas Linhagens Médias 1 14,65 a 1,34 ab 3 10,4 b Ambigüidade dos resultados 60
Procedimentos para comparações múltiplas Valores médios Procedimentos de comparações múltiplas Trat. Par. Est. Tukey SNK LSD LSDB SK 3 85 80,461 D C E D B 1 85 83,498 D C DE CD B 4 85 86,488 CD C DE CD B 85 90,74 CD BC DE CD B 6 95 95,986 CD BC CD BCD B 5 95 96,511 BCD BC CD BCD B 7 105 107,689 ABC AB BC ABC A 8 115 10,436 AB A AB AB A 9 15 13,49 A A A A A 10 15 13,94 A A A A A 61
Procedimentos para comparações múltiplas Comparação do teste de Scott-Knott com os demais: Comparações realizadas através de experiemntos com dados simulados; Taxas de erro tipo I sempre abaixo do nível de significância (menores que α); O poder do teste foi duas vezes maiores que os do teste de Duncan, t e SNK, oito vezes mais poderoso que o teste Tukey e semelhante ao t-bayesiano; 6
Novas ferramentas para análise GLM: Modelos Lineares Generalizados; AMMI: Additive main effects and Multiplicative Interaction model; Selegen: Sistemas REML/BLUP de análise via modelos mistos; 64
GLM Modelos lineares generalizados; Distribuição Poisson 65
AMMI Additive main effects and Multiplicative Interaction model; Interação GxE; Interação em modelos estatísticos com efeitos fixos 66
AMMI Interação GxE; 67
AMMI Interação em modelos estatísticos com efeitos fixos; 68
Sistemas REML/BLUP REML: Máxima verossimilhança restrita; BLUP: Melhor predição linear não viesada; 69
Sistemas REML/BLUP 70
Sistemas REML/BLUP Safra 1 Safra 71
Sistemas REML/BLUP 7
Experimento hipotético Para se estudar padrões nutricionais e expressão gênica em híbridos Bt comerciais de milho decidiu-se trabalhar com dois híbridos Bt e suas respectivas isolinhas submetendo-os a três diferentes regimes de controle de lagarta. Para esse experimento definiu-se que seriam usadas 5 repetições. 74
DIC Fontes de variação Graus de liberdade Tratamentos 11 Híbridos 3 Tratamentos Hib. x Trat. 6 Erro experimental 48 Total 59 75
DBA Fontes de variação Graus de liberdade Blocos 4 Tratamentos 11 Híbridos 3 Tratamentos Hib. x Trat. 6 Erro experimental 44 Total 59 76
Parcela subdividida Fontes de variação Graus de liberdade Blocos 4 Híbridos 3 Erro a 1 Tratamento Híb. x Trat. 6 Erro b 3 Total 59 77
Parcela subdividida Fontes de variação Graus de liberdade Blocos 4 Tratamento Erro a 8 Híbrido 3 Trat. x Híb. 6 Erro b 36 Total 59 78
Delineamento em faixas Fontes de variação Graus de liberdade Blocos 4 Híbrido 3 Erro a 1 Tratamento Erro b 8 Híb. x Trat. 6 Erro c 4 Total 59 79
Delineamento em faixas Fontes de variação Graus de liberdade Blocos 4 Tratamento Erro a 8 Híbrido 3 Erro b 1 Trat. x Híb. 6 Erro c 4 Total 59 80