Verificando as pressuposições do modelo estatístico

Documentos relacionados
Delineamento Inteiramente Casualizado (DIC) Delineamento Casualizado em Blocos (DBC) Delineamento em Quadrado Latino (DQL)

Falha(s) nas pressuposições da ANOVA

ANÁLISE DE VARIÂNCIA (ANOVA) Prof. Anderson Rodrigo da Silva

Mario de Andrade Lira Junior lira.pro.br\wordpress

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

ANÁLISE DE VARIÂNCIA. y j = µ + τ i + e i j = µ i + e i j

Delineamento e Análise Experimental Aula 3

EXPERIMENTAÇÃO AGRÍCOLA

Modelos de Análise de Variância

Lucas Santana da Cunha de outubro de 2018 Londrina

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DE CAMPINA GRANDE CENTRO DE CIENCIAS E TECNOLOGIA AGROALIMENTAR UNIDADE V

ANÁLISE DE VARIÂNCIA DE UM CRITÉRIO (DIC)

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos

H 0 : m 1 = m 2 =... = m I = 0 H a : pelo menos m u m k, para algum u k (u,k=1,2,...,i)

Lucas Santana da Cunha 27 de novembro de 2017

H 0 : m 1 = m 2 =... = m I = 0 H a : pelo menos m u m k, para algum u k (u,k=1,2,...,i)

INTRODUÇÃO A MODELOS MISTOS

Tópicos Extras 1ª parte. Testes Não Paramétricos, Análise Multivariada, Outras Técnicas

Pressuposições à ANOVA

Lucas Santana da Cunha de outubro de 2018 Londrina

Assim, de acordo com o tipo de níveis atribuídos para o fator, a técnica apropriada será escolhida. Logo temos o seguinte esquema:

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

RELATÓRIO DA ANÁLISE DE REGRESSÃO (Ex1 - Reg. Linear Simples) ****************************** PASSO 1 *******************************

Teste de Cochran (Homogeneidade de Variância)

Projeto de Experimentos

ANÁLISE DE VARIÂNCIA DE DOIS CRITÉRIOS (DBC)

Planejamento de Experimentos Suposições do Modelo e Comparações Múltiplas

Pro. Marcio Leles Romarco de Oliveira 1

Planejamento Experimental

MAE Planejamento e Pesquisa II

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Testes de Comparações Múltiplas

PLANEJAMENTO DE EXPERIMENTOS

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

EXPERIMENTAÇÃO AGRÁRIA

Homocedasticidade? Exemplo: consumo vs peso de automóveis

DELINEAMENTO INTEIRAMENTE CASUALIZADO. Profª. Sheila Regina Oro

Métodos Estatísticos Avançados em Epidemiologia

Especialização em Engenharia de Processos e de Sistemas de Produção

Delineamento e Análise Experimental Aula 6. Anderson Castro Soares de Oliveira

ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos:

DELINEAMENTO INTEIRAMENTE CASUALIZADO e CASUALIZADOS

MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DE CAMPINA GRANDE CENTRO DE CIENCIAS E TECNOLOGIA AGROALIMENTAR UNIDADE IV

TESTES DE NORMALIDADE E SIGNIFICÂNCIA. Profª. Sheila Regina Oro

EXERCÍCIO SOBRE TESTE T

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Bioexperimentação. Prof. Dr. Iron Macêdo Dantas

Estimação e Testes de Hipóteses

ESTATÍSTICA EXPERIMENTAL

Delineamento e Análise Experimental Aula 4

A UTILIZAÇÃO DE MÉTODOS ESTATÍSTICOS NO PLANEJAMENTO E ANÁLISE DE ESTUDOS EXPERIMENTAIS EM ENGENHARIA DE SOFTWARE (FONTE:

Análise de Dados da Avaliação II

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

EXERCÍCIOS SOBRE TESTE T

DELINEAMENTO EM BLOCOS AO ACASO

Éder David Borges da Silva Renato Gonçalves de Oliveira

ENGENHARIA DA QUALIDADE A ENG AULA 8 PROJETOS DE EXPERIMENTOS - ANOVA

Correlação e Regressão

Mais Informações sobre Itens do Relatório

Estatística Descritiva e Inferencial CE081. Prof. Dr. Jomar Camarinha

EXPERIMENTAÇÃO AGRÁRIA

Métodos Quantitativos Aplicados

Aula 14 Quadrado Latino 13/06/17

DELINEAMENTO EM BLOCOS CASUALIZADOS (DBC)

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Princípios em Planejamento e Análise de Dados Ecológicos. Regressão linear. Camila de Toledo Castanho

1 - Noções de álgebra matricial

Regression and Clinical prediction models

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Aula 2 Uma breve revisão sobre modelos lineares

Renda x Vulnerabilidade Ambiental

9 a 14 de Setembro Pós-Graduação em Produção Vegetal UFPR. Éder David Borges da Silva Renato Gonçalves de Oliveira

Esquema de distribuição dos tratamentos: Fatorial; Parcelas subdivididas.

Esquema de distribuição dos tratamentos: Fatorial; Parcelas subdivididas.

UNIVERSIDADE FEDERAL DA PARAÍBA

Delineamento e Análise Experimental Aula 5

Análise da Regressão. Prof. Dr. Alberto Franke (48)

Aula Prática 02 Estatística Experimental DELINEAMENTO CASUALIZADO EM BLOCOS. *Planejamento do Experimento Delineamento Casualizado em Blocos (DBC);

VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO DE ANÁLISE DE VARIÂNCIA ANÁLISE DE RESÍDUOS

UNIVERSIDADE FEDERAL DA BAHIA INSTITUTO DE MATEMÁTICA DEPARTAMENTO DE ESTATÍSTICA NOTAS DE AULA MAT236 MÉTODOS ESTATÍSTICOS 3ª UNIDADE

ANÁLISE DE VARIÂNCIA - ANOVA. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM

Instituto Universitário de Lisboa (ISCTE-IUL) Licenciaturas em Gestão e Finanças & Contabilidade Estatística II - Exame de 1ª época

Delineamento em Quadrado Latino (DQL)

Regressões: Simples e MúltiplaM. Prof. Dr. Luiz Paulo Fávero 1

MAE 317 Planejamento de Experimentos I. Profa. Júlia Maria Pavan Soler IME/USP

SEEC UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE UERN FACULDADE DE CIÊNCIAS EXATAS E NATURAIS FANAT DEPARTAMENTO DE CIÊNCIAS BIOLÓGICAS DECB

DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM

Planejamento de Experimentos Introdução - Teste t

Exame de Recorrência de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro

COMPARAÇÕES MÚLTIPLAS

Prof. a Dr. a Simone Daniela Sartorio de Medeiros. DTAiSeR-Ar

DELINEAMENTO EM QUADRADO LATINO (DQL)

Econometria Semestre

MAE 317 Planejamento e Pesquisa I Profa. Júlia Maria Pavan Soler

1 Introdução aos Métodos Estatísticos para Geografia 1

Transcrição:

Verificando as pressuposições do modelo estatístico Prof. a Dr. a Simone Daniela Sartorio de Medeiros DTAiSeR-Ar 1

As pressuposições do modelo estatístico: 1) os efeitos do modelo estatístico devem ser aditivos; ) os erros experimentais devem ser independentes; 3) os erros experimentais devem ser normalmente distribuídos; 4) os erros experimentais tem variâncias iguais. e ~ N(0, ) 5) Não ter a presença de outliers. Assim, se o modelo for apropriado, os resíduos devem refletir as propriedades impostas pelo termo de erro do modelo. As técnicas utilizadas para verificar as suposições podem ser informais (como gráficos) ou formais (como testes). As técnicas gráficas, por serem visuais, podem ser subjetivas e por isso técnicas formais são mais indicadas para a tomada de decisão. O ideal é combinar as técnicas formais e informais para o diagnóstico de problemas nas suposições do modelo.

Técnicas gráficas a) Análise de resíduos b) Gráfico quantil-quantil com envelope simulado 3

a) Análise de resíduos Chamamos de Análise dos Resíduos um conjunto de técnicas utilizadas para investigar a adequabilidade de um modelo com base nos resíduos. 4

Alguns tipos de Resíduos Valor predito: yˆ mˆ ˆ t i Resíduos ordinários tˆ i mˆ i mˆ eˆ eˆ y y yˆ mˆ i y ( mˆ tˆ ) i y mˆ ( mˆ i mˆ ) Resíduo padronizado d e QM Re s e s e s Resíduo estudentizado Rs i e V ( e ( i) ) ˆ ( ) i V i ( r ) é estimativa da variância residual sem a observação i. Rs i ~ t (n p 1), onde n é o número de observações e p número de parâmetros. 5

Análise de resíduos A característica do gráfico construído, com os resíduos obtidos, pode fornecer as orientações ou padrões quanto à identificação de possíveis inadequações do modelo adotado, quando comparados com os gráficos apresentados a seguir: Condição ideal: indica homogeneidade de variâncias (ou homocedasticidade) e não apresenta outlier(s). d 3 0 ŷ 3 Figura 1. Gráfico dos resíduos padronizados valores preditos 6

b) Gráfico quantil-quantil 7

Gráfico quantil-quantil com envelope simulado OBS: Os erros para seguirem a distribuição normal com média zero e variância constante devem estar próximos a reta identidade e dentro do envelope simulado. Normal (proximidade da reta) 8

Como verificar as pressuposições do modelo estatístico? (DIC) 9

1) Modelo aditivo 10

1) Aditividade do modelo Condição imposta pelo modelo, em que os diversos efeitos se somam. A aditividade possibilita que os dados observados sejam sempre combinações lineares dos efeitos investigados. 11

) Independência das observações 1

) Erros devem ser independentes Até certo ponto é garantido pela casualização. Os efeitos de tratamentos sejam independentes, que não haja correlação entre eles. Que uma parcela não influencie a outra. Isso significa que não se pode dizer, em função da resposta obtida numa parcela, que a(s) parcela(s) vizinha(as) terá(ão) respostas mais alta(s) ou mais baixa(s), a priori. OBS1: Isso não ocorre quando os tratamentos são doses crescentes de proteína, fósforo, fibra, adubos, inseticidas, fungicidas, herbicidas, etc. ocasião em que a análise de variância deve ser feita estudando-se a regressão. OBS: Isso também não é verdade quando medimos na mesma parcela dados ao longo do tempo. OBS3: O simples fato de aleatorizar (sortear) as parcelas que receberão os tratamentos diminui a dependência entre os erros. OBS4: O sinal dos desvios no croqui experimental pode indicar dependência dos erros e. 13

Análise de resíduos a) Os erros não são independentes, correlação positiva entre os erros. b) Os erros não são independentes, correlação negativa entre os erros. d d 3 3 0 v ŷ 0 ŷ 3 v v 3 14

.1.) Teste de Durbin-Watson Teste de independência É utilizado para detectar a presença de autocorrelação (dependência) nos resíduos de uma análise de regressão. Este teste é baseado na suposição de que os erros no modelo de regressão são gerados por um processo autoregressivo de primeira ordem. Tarefa 1. Pesquise e responda: a) Quais são as hipóteses desse teste Durbin-Watson? b) Qual é a estatística do teste? c) Qual é a distribuição de probabilidade da estatística do teste? d) Como se faz a decisão do teste? 15

3) Erros com distribuição normal 16

3) Erros normais Os erros (e ) devem ser normalmente distribuídos. Isto implica em que as observações (y ) se ajustam a uma distribuição normal dentro de cada tratamento. Isso pode ser verificado através de um teste de normalidade, como por exemplo: a) Shapiro-Wilk; b) Lilliefors; c) Kolmogorov-Smirnov; e d) Teste qui-quadrado, entre outros. As hipóteses, em geral, desses testes são: H 0 : os erros são normais H a : os erros não são normais Decisão pelo valor-p - Regra prática: Se o valor-p < Rejeita-se H 0 Se o valor-p > Aceita-se H 0 17

3.1.) Teste de Shapiro-Wilk Teste de normalidade O teste de Shapiro-Wilk é baseado na estatística W (0 < W 1). Valores pequenos da estatística W levam a rejeitar a hipótese H 0. Tarefa. Pesquise e responda: a) Quais são as hipóteses desse teste Shapiro-Wilk? b) Qual é a estatística do teste? c) Qual é a distribuição de probabilidade da estatística do teste? d) Como se faz a decisão do teste? Nos software R avaliamos o valor da probabilidade (valor-p). Se o valor da probabilidade for menor que o nível de significância (α) rejeitamos a hipótese H 0. Caso contrário, aceitamos H 0. No R: shapiro.test(rstudent(mod)) Shapiro-Wilk normality test Data: rstudent(mod) W = 0.9396, p-value = 0.359 Conclusão: Portanto, como o valor-p é 0,359 > 0,05, então, não rejeita-se H 0, ou seja, os resíduos padronizados seguem uma distribuição Normal ao nível de 5% de significância. 18

Teste de normalidade 3..) Teste de Lilliefors 3.3.) Teste Anderson-Darling 3.4.) Teste de Kolmogorov-Smirnov 3.5.) Teste Cramer-von Mises 3.6.) Teste de Shapiro-Francia 3.7.) Teste qui-quadrado para normalidade Tarefa 3. Pesquise e responda sobre os testes 3..); 3.3.); 3.4.); 3.5.); 3.6.) e 3.7.): a) Quais são as hipóteses desse teste? b) Qual é a estatística do teste? c) Qual é a distribuição de probabilidade da estatística do teste? d) Como se faz a decisão do teste? 19

Teste de normalidade No R: # Teste de Lilliefors (Kolmogorov-Smirnov) require(nortest) lillie.test(rstudent(mod)) # Teste Anderson-Darling require(nortest) ad.test(rstudent(mod)) # Teste de Kolmogorov-Smirnov ks.test(rstudent(mod), "pnorm", mean(rstudent(mod)), sd(rstudent(mod))) # Teste Cramer-von Mises cvm.test(rstudent(mod)) # Teste de Shapiro-Francia sf.test(rstudent(mod)) 0

4) Homocedasticidade 1

4) Homogeneidade de variâncias (ou homocedasticidade) Os erros ou desvios (e ), devem possuir uma variância comum. Em outras palavras, A variabilidade de um tratamento deve ser semelhante à dos outros. Pode ser verificada por um dos seguintes testes, dentre outros: Teste de Hartley (ou Razão máxima, ou Teste F máximo) Teste de Cochran Teste de Bartlett Teste de Levene Usado mesmo quando se tem n. o diferente de repetições por tratamento, mas exige normalidade dos dados. Todos os tratamentos devem ter o mesmo n. o de repetições. As hipóteses desses testes são: H H 0 1 : 1 :! i..., i i', i, i' 1,,..., I i' I (Variâncias homogêneas) (Variâncias heterogêneas)

4.1.) Teste de Hartley (ou Razão máxima, ou Teste F máximo) Teste de homocedasticidade Calcula-se as variâncias dentro de cada tratamento e faz-se a razão máxima: F calc Considerando um nível α de significância, consulta-se a tabela específica do Teste de Hartley com: s s máx min F tab = H (I,J 1), OBS: Todos os tratamentos devem ter o mesmo n. o de repetições. onde I é o número de tratamentos e J é número de repetições. Considerando um nível α de significância, consulta-se a tabela específica com: Regra prática: F calc F tab Rejeita H 0 ao nível..., concluindo que... 4 para 1 Ou F calc < F tab Aceita H 0 ao nível..., concluindo que... 7 para 1 Tarefa 4: Faça o teste para o experimento com as 4 variedades de milho (DIC), feito em sala. Apresente as hipóteses, etc...e conclua o teste. 3

4..) Teste de Cochran Teste de homocedasticidade C calc s máx I si i1 OBS: Todos os tratamentos devem ter o mesmo n. o de repetições. Considerando um nível α de significância, consulta-se a tabela específica do Teste de Cochran com I e (n 1) graus de liberdade associado a essas estimativas. Assim, se: C calc C tab Rejeita H 0 ao nível..., concluindo que... C calc < C tab Aceita H 0 ao nível..., concluindo que... Tarefa 5: Faça o teste para o experimento com as 4 variedades de milho (DIC), feito em sala. Apresente as hipóteses, etc...e conclua o teste. 4

4.3.) Teste de Bartlett Sendo α o nível de significância; I é o número de estimativas de variâncias; média ponderada dos. Temos que a estatística do teste é dada por: s i s é a K,306 n I log s n 1 log s 1 1 3( I 1) I i1 i1 1 n 1 i I i 1 n I i ~ ( I 1) Se K calc ( I 1; ) ( I 1; ) Caso, contráriok calc < Rejeita H 0 ao nível..., concluindo que... Aceita H 0 ao nível..., concluindo que... No R: bartlett.test(y ~ trat, data=dic) Bartlett test of homogeneity of variances data: y by trat Bartlett's K-squared= 6.881, df= 8, p-value= 0.615 Tarefa 6: Faça o teste para o experimento com as 4 variedades de milho (DIC), feito em sala. Apresente as hipóteses, etc...e conclua o teste. OBS: Usado mesmo quando se têm n. o diferentes de repetições por tratamento, mas exige normalidade dos dados. 5

4.4.) Teste de Levene Este teste foi proposto por Levene em 1960. O procedimento consiste em fazer uma transformação dos dados originais e aplicar aos dados transformados o teste da ANOVA. OBS: O teste de Levene é mais eficiente que o teste de Bartlett quando rejeitamos a hipótese de normalidade dos dados. No R: require(car) levenetest(y ~ trat, data=dic) Levene's Test for Homogeneity of Variance (center = median) Df F value Pr(>F) group 8 0.901 0.9604 18 Tarefa 7. Pesquise e responda: a) Quais são as hipóteses desse teste de Levene? b) Qual é a estatística do teste? c) Qual é a distribuição de probabilidade da estatística do teste? d) Como se faz a decisão do teste? e) Considere a saída do software R acima e conclua o teste. 6

Análise de resíduos Padrão que indica heterogeneidade de variância a) Heterocedasticidade, a variância decresce com ŷ. b) Heterocedasticidade, a variância cresce com ŷ. d d 3 3 0 v ŷ 0 v ŷ 3 v 3 v 7

Análise de resíduos c) Heterocedasticidade, a variância cresce quando tende para a média. ŷ d) Heterocedasticidade, a variância decresce quando ŷ tende para a média. d d 3 3 0 ŷ 0 ŷ 3 3 8

Possíveis inadequações podem ser identificadas abaixo. Itens: a) situação ideal, b) e c) modelo não linear; d) elemento atípico, e), f) e g) heterocedasticidade e h) não-normalidade 9

5) Não ter outlier 30

a) Boxplot Figura 1. Boxplot sem observações atípicas. 8 10 1 14 Figura. Boxplot com observações atípicas. 31

b) Gráfico quantil-quantil com envelope simulado c) Predito Resíduo Normal (proximidade da reta) Aleatório, sem padrão 3

Outlier? 33

Não Normal (afastamento da reta) Outlier? Outlier? 34

Análise: com outlier e sem outlier Pode mudar os resultados!!! Exemplo Ana Carolina 35