Poder do teste e determinação do tamanho da amostra:pca & PBC

Documentos relacionados
Teste de hipótese em modelos normais lineares: ANOVA

Experimentos Balanceados com Dois Fatores

DELINEAMENTO EM BLOCOS AO ACASO

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) EXPERIMENTOS COM DOIS FATORES E O PLANEJAMENTO FATORIAL

Experimentos Fatoriais

ESQUEMA FATORIAL. Lucas Santana da Cunha Universidade Estadual de Londrina Departamento de Estatística

Experimentos Balanceados com Dois Fatores

EXPERIMENTAÇÃO AGRÁRIA

Inferência para várias populações normais análise de variância (ANOVA)

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Modelo de Regressão Múltipla

ANOVA - parte I Conceitos Básicos

ANÁLISE DE VARIÂNCIA DE DOIS CRITÉRIOS (DBC)

Questão 1: Questão 2: Defina tratamentos, fator, nível, parcela, subparcela, coeficiente de variação e interação entre fatores.

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Esquema Fatorial. Esquema Fatorial. Lucas Santana da Cunha 06 de outubro de 2018 Londrina

MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DE CAMPINA GRANDE CENTRO DE CIENCIAS E TECNOLOGIA AGROALIMENTAR UNIDADE V

Modelo g.l. SQ Retas concorrentes ,46 Retas paralelas ,22 Retas com intercepto comum ,49 Retas coincidentes ,23

MAE Planejamento e Pesquisa II

DELINEAMENTO EM BLOCOS CASUALIZADOS COM REPETIÇÕES. Profª. Sheila Regina Oro

DELINEAMENTO EM BLOCOS CASUALIZADOS (DBC)

Probabilidade e Estatística

5.3 Experimentos fatoriais a dois fatores. Ambos os fatores são supostos fixos e os efeitos de tratamento são definidos como desvios da média tal que

Planejamento de Experimentos Experimento com um fator aleatório

EXPERIMENTAÇÃO AGRÁRIA

AULA 7 - Inferência em MQO: ICs e Testes de

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski

Planejamento de Experimentos. 13. Experimentos com fatores aleatórios

Estatística e Modelos Probabilísticos - COE241

DELINEAMENTO INTEIRAMENTE CASUALIZADO. Profª. Sheila Regina Oro

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

EXPERIMENTAÇÃO AGRÍCOLA

Modelos de Regressão Linear Simples - parte III

Estatística - Análise de Regressão Linear Simples. Professor José Alberto - (11) sosestatistica.com.br

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Análise Multivariada Aplicada à Contabilidade

Experimentos em parcelas subdivididas e procedimentos para a aplicação dos testes de comparação de médias

Lucas Santana da Cunha de outubro de 2018 Londrina

Lucas Santana da Cunha de outubro de 2018 Londrina

Delineamento e Análise Experimental Aula 4

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Testes de Comparações Múltiplas

25 a 30 de novembro de 2013

Distribuições Amostrais - Tamanho da Amostra

Cap. 4 - Estimação por Intervalo

TESTES DE HIPÓTESES. Lucas Santana da Cunha Universidade Estadual de Londrina

Teoria da Estimação. Fabricio Goecking Avelar. junho Universidade Federal de Alfenas - Instituto de Ciências Exatas

Análise de Dados Longitudinais Aula

DELINEAMENTO EM QUADRADO LATINO (DQL)

Especialização em Engenharia de Processos e de Sistemas de Produção

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos

TESTE DE HIPÓTESE. Introdução

Prof. Lorí Viali, Dr.

Delineamento e Análise Experimental Aula 7. Anderson Castro Soares de Oliveira

DELINEAMENTO FATORIAL. Profª. Sheila Regina Oro

Delineamento em Quadrado Latino (DQL)

EXPERIMENTAÇÃO AGRÁRIA

DELINEAMENTO INTEIRAMENTE CASUALIZADO e CASUALIZADOS

BIOESTATÍSTICA. Parte 5 Testes de Hipóteses

Distribuições Amostrais

Gráficos alternativos ao gráfico de R

Cap. 9 Comparação entre tratamentos

Aula 9 Intervalo de confiança para a média da N(μ; σ 2 ), σ 2 desconhecida

Esquema Fatorial. Lucas Santana da Cunha Universidade Estadual de Londrina

Roteiro de Aula Delineamentos Fatoriais 05/06/2018

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Análise de Regressão EST036

TESTE DE COMPARAÇÃO MÚLTIPLA

3 Modelo Matemático Definições Iniciais. Denote-se, em geral, o desvio-padrão do processo por σ = γσ 0, sendo σ 0 o

ANÁLISE DE VARIÂNCIA DE UM CRITÉRIO (DIC)

MAE Modelos Lineares Generalizados 2 o semestre 2017

Análise de Variância com mais de duas variáveis independentes (mais de dois fatores) Na aula do dia 17 de outubro (aula #08) introduzimos

Delineamento e Análise Experimental Aula 3

Prof. Lorí Viali, Dr.

2 ou mais fatores são de interesse.

UNIVERSIDADE DE SÃO PAULO ESCOLA SUPERIOR DE AGRICULTURA LUIZ DE QUEIROZ DEPARTAMENTO DE CIÊNCIAS EXATAS

UNIVERSIDADE DE SÃO PAULO ESCOLA SUPERIOR DE AGRICULTURA LUIZ DE QUEIROZ DEPARTAMENTO DE CIÊNCIAS EXATAS

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Avaliação de Desempenho de Sistemas Discretos

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos. 6 a aula Testes de Hipóteses

ESTATÍSTICA EXPERIMENTAL

Técnicas Experimentais Aplicadas à Zootecnia UNIDADE 1. NOÇÕES DE PLANEJAMENTO EXPERIMENTAL

Unidade IV Inferência estatística

MAE 317 Planejamento e Pesquisa I Profa. Júlia Maria Pavan Soler

Testes de Hipóteses Paramétricos

ANOVA FACTORIAL EXEMPLO 1. ANOVA TWO-WAY COM O SPSS. a capacidade de reconhecimento do odor materno

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS EM ENGENHARIA

Especialização em Engenharia de Processos e de Sistemas de Produção

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

Esse material foi extraído de Barbetta (2007 cap 13)

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

3ª LISTA DE EXERCÍCIOS

Estimação e Testes de Hipóteses

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

Estatística e Modelos Probabilísticos - COE241

Transcrição:

Poder do teste e determinação do tamanho da amostra:pca & PBC

Relembrando: α = probabilidade do erro do tipo I: P(Rejeitar H 0 H 0 é verdadeira). β = probabilidade do erro do tipo II: P(Não rejeitar H 0 H 0 é falsa). ψ = poder do teste : = 1 β=p(rejeitar H 0 H 0 é falsa). Em geral, em qualquer experimento, a probabilidade do erro do tipo I é controlada (α). A probabilidade do erro do tipo II (consequentemente o poder do teste) não é, em geral, controlada. Como determinar tamanhos de amostra (por tratamento/no geral) que garantam um poder mínimo? Como calcular o poder do teste, para um dado experimento?

ind Sejam X 1, X 2,..., X n N(µ i, σi 2). Defina Y = n i=1 ( Xi σ i ) 2. Dizemos então que Y tem distribuição qui-quadrado não central com n graus de liberdade e parâmetro de não-centralidade δ = ( ) 2 n µi i=1 σ i Notação Y χ 2 (n,δ), cuja fdp é dada por f y (y) = e δ/2 (δ/2) i f Wn+2i (y) 1 (0, ) (y), i! i=0 em que W n+2i χ 2 (n+2i) Se δ = 0, então Y χ 2 (n).

Seja V uma outra v.a., independente de Y, V χ 2 (m). Defina F = Y /n V /m. Então, F tem distribuição F não central com graus de liberdade, n e m e parâmetro de não centralidade δ. Notação F χ 2 (n,m,δ), cuja fdp é dada por f F (f ) = i=0 e δ/2 (δ/2) i ( n ) ( ) n/2+i (n+m)/2+i m β(m/2, n/2 + i)i! m m + nf f n/2 1+i 1 (0, ) (f ) em que β(a, b) = 1 0 x a 1 (1 x) b 1 dx

ANOVA PCA com um único fator Tem-se um único fator com k níveis (grupos ou tratamentos). Em cada grupo tem-se n i, i = 1, 2,.., k unidades experimentais. Tem-se um total de n = k i=1 n i observações.

Modelo (CR) para um único fator Y ij = µ + α i + ξ ij, i = 1, 2,.., k (grupos); j = 1,..., n i (unidades experimentais) Erros ξ ij i.i.d N(0, σ 2 ), µ, α i não aleatórios. α 1 = 0. Hipótese de interesse (primário) H 0 : α 2 = α 3 =... = α k = 0 vs H 1 : pelo menos uma desigualdade

Lembremos que, sob H 0, V = SQF /σ 2 χ 2 (k 1). Independentemente de H 0 ser verdadeira, W = SQR/σ 2 χ 2 (n k). Assim, sob H 0 = F = V /(k 1) W /(n k) F (k 1,n k). Lembrando que : E(SQF ) = (k 1)σ 2 + k n i (µ i µ) 2, µ = 1 k i=1 No caso da parametrização CR, tem-se que µ i µ = α i α, α = 1 k k i=1 α i assim E(SQF /σ 2 1 k ) = (k 1) + }{{} σ 2 n i (α i α) 2. i=1 graus de liberdade }{{} parâmetro de não centralidade k i=1 µ i

Assim, se H 0 não for verdadeira, então V χ 2 (k 1,δ), δ = k i=1 n i (α i α) 2 σ 2. Portanto, E(SQF /σ 2 ) = (k 1) + δ. Segue-se que, sob H 1, F F (k 1,n k,δ) Regra para obtenção do parâmetro de não-centralidade: em geral, E(Soma de Quadrados (Fator, Interação, Bloco)/σ 2 ) = graus de liberdade + parâmetro de não centralidade

Assim, para um dado valor de δ e para um nível de significância fixado α, temos que o poder do teste é dado por ψ = P(F 1 > f c H 0 é falsa), F 1 F (k 1,n k,δ) em que f c (valor crítico) é o valor da distribuição F (k 1,n k), P(F 0 > f c H 0 ) = α, (F 0 F (k 1,n k) ). A função poder (em δ) é dada por: ψ(δ) = P(F 1 > f c H 0 é falsa), F 1 F ((k 1, n k, δ)) (1)

Para um determinado conjunto de dados, podemos estimar δ, através de δ = k i=1 n i( α i α) 2 σ 2, em que α i, i = 1, 2.., k são os estimadores de mínimos quadrados, α = 1 k k i=1 α i e σ 2 = QMR. Logo, o poder estimado é dado por ψ = ψ( δ) ou seja, utiliza-se δ na equação (1)

Exemplo 2 (retomando) Exemplo 2: Uma bioquímica (Tecnologia de Alimentos) está interessada em estudar a extração de pigmentos naturais, com aplicação como corante em alimentos. Numa primeira etapa tem-se a necessidade de escolher o melhor solvente extrator. A escolha do(s) melhor(es) solventes foi realizada através da medida da absorbância de um pigmento natural do fruto de baguaçú. Fator = tipos de solvente; k=5 níveis; n k =5 repetições. Da análise anterior, temos: α = (0; 0, 06854; 0.02752; 0.34258; 0.08970) e σ 2 = 0, 0006358708.

Isto implica que δ = 851, 222. Neste caso, para um α = 0, 05, o valor crítico é igual à 2, 866. Assim, o poder estimado será igual à ψ = P(F 1 > 2, 866 é falsa) P(F 1 > 2, 866) > 0, 9999

Exemplo 3 (retomando) Tem-se o interesse em se saber se a quantidade de fósforo existente (administrada) no solo afeta a produção de milho (de uma certa variedade). Fator: quantidade de fósforo, k = 5 níves, n i = 4, i = 1, 2, 3, 4 repetições por tratamento (quantidade de fósforo administrada). Procedimento: 20 porções de terras, chamadas de parcelas, (em condições semelhantes) foram consideradas e cada uma delas recebeu uma determinada quantidade de fósforo, de modo aleatório (completamente casualizado).

Exemplo 3 (cont.) Da análise anterior, temos: α = (0; 4, 9925; 3, 6075; 3, 6525; 4, 7025) e σ 2 = 1, 556012; Logo δ = 40, 871. Assim, temos os seguintes resultados, conforme o valor de α escolhido. α f c ψ 0,90 2,36 0,9992 0,95 3,06 0,9965 0,99 4,89 0,9624

Exemplo 3 (cont.) Suponha que o pesquisador queira realizar um outro experimento semelhante à este em questão. Ele quer, para α = 0, 95, um poder de pelo menos 0,90. Qual deve ser o tamanho para cada tratamento (consequentemente o tamanho total) para obter este poder? n i n f c δ ψ 2 10 5,19 20,43 0,6289 3 15 3,47 30,65 0,9536 4 20 3,06 40,87 0,9965

Como proceder (PCA) Perguntar ao pesquisador e/ou usar informações de experimentos anteriores sobre o nível de significância (α). Perguntar ao pesquisador e/ou usar informações de experimentos anteriores sobre a variabilidade (σ 2 ). Perguntar ao pesquisador e/ou usar informações de experimentos anteriores sobre a magnitude das diferenças entre as médias.

Exemplo artificial Três grupos, experimento balanceado, α = 0, 95, σ 2 = 5. 3 i=1 α2 i n i n ψ 3 i=1 α2 i n i n ψ 0,5 2 6 0,0521 50 2 6 0,2746 3 9 0,0547 3 9 0,5794 4 12 0,0574 4 12 0,7886 5 15 0,0599 5 15 0,9032 10 30 0,0732 10 30 0,9991 2 2 6 0,0586 200 2 6 0,7437 3 9 0,0694 3 9 0,9919 4 12 0,0803 4 12 0,9998 5 15 0,0915 5 15 0,9999 10 30 0,15022 10 30 >0,9999

Curvas de poder n = 2,sigma2=5 n = 5,sigma2=5 poder do teste 0.0 0.4 0.8 alpha = 0,10 alpha=0,05 alpha=0,01 10 20 30 40 50 60 70 delta poder do teste 0.0 0.4 0.8 alpha = 0,10 alpha=0,05 alpha=0,01 50 100 150 delta n = 8,sigma2=10 n = 10,sigma2=5 poder do teste 0.0 0.4 0.8 alpha = 0,10 alpha=0,05 alpha=0,01 50 100 150 200 250 300 delta poder do teste 0.0 0.4 0.8 alpha = 0,10 alpha=0,05 alpha=0,01 50 100 150 200 250 300 350 delta

Curvas de poder n = 2,sigma2=10 n = 5,sigma2=10 poder do teste 0.0 0.4 0.8 alpha = 0,10 alpha=0,05 alpha=0,01 5 10 15 20 25 30 35 delta poder do teste 0.0 0.4 0.8 alpha = 0,10 alpha=0,05 alpha=0,01 20 40 60 80 delta n = 8,sigma2=10 n = 10,sigma2=10 poder do teste 0.0 0.4 0.8 alpha = 0,10 alpha=0,05 alpha=0,01 20 40 60 80 100 120 140 delta poder do teste 0.0 0.4 0.8 alpha = 0,10 alpha=0,05 alpha=0,01 50 100 150 delta

Curvas de poder n = 2,sigma2=20 n = 5,sigma2=20 poder do teste 0.0 0.4 0.8 alpha = 0,10 alpha=0,05 alpha=0,01 5 10 15 delta poder do teste 0.0 0.4 0.8 alpha = 0,10 alpha=0,05 alpha=0,01 10 20 30 40 delta n = 8,sigma2=20 n = 10,sigma2=20 poder do teste 0.0 0.4 0.8 alpha = 0,10 alpha=0,05 alpha=0,01 10 20 30 40 50 60 70 delta poder do teste 0.0 0.4 0.8 alpha = 0,10 alpha=0,05 alpha=0,01 20 40 60 80 delta

Comentários sobre o poder do teste Podemos notar que, quanto maior o valor do parâmetro de não centralidade (δ), maior o poder do teste. Quanto maior for a diferença entre as médias e menor for a variância, maior será o valor de δ, consequentemente, maior será o poder do teste. Além disso, quanto maior for o valor da probabilidade do erro do tipo I (α), maior será o poder do teste;

PCA desbalanceado com dois fatores Fator A: possui a níveis, i=1,..,a. Fator B: possui b níveis, j=1,...,b. Grupos: há um total de a b grupos (tratamentos), que são definidos pelas interseções dos níveis de cada grupo. Para cada grupos vamos considerar um total de n ij observações. Cada uma das n ij observações são alocadas aleatoriamente à cada uma das combinações (fatores). Temos uma PCA (planejamento completamente casualizado). Neste caso número total de observações n = a i=1 b j=1 n ij.

Esperanças das Somas de Quadrados E(SQF A ) = (a 1)σ 2 + b E(SQF B ) = (b 1)σ 2 + a a n ij (µ i. µ.. ) 2 i=1 b n ij (µ.j µ.. ) 2 j=1 a b E(SQF Int) = (a 1)(b 1)σ 2 + n ij [(µ ij + µ.. ) (µ i. + µ.j )] 2 i=1 j=1 µ ij = µ + α i + β j + (αβ) ij ; µ i. = 1 b b j=1 µ ij; µ.j = 1 a a i=1 µ ij; µ.. = 1 ab a i=1 b j=1 µ ij

Esperanças das Somas de Quadrados (cont.) a E(SQF A /σ 2 i=1 ) = (a 1) + b n ij(µ i. µ.. ) 2 }{{}}{{ σ 2 } gl pnc b E(SQF B /σ 2 j=1 ) = (b 1) + a n ij(µ.j µ.. ) 2 }{{}}{{ σ 2 } gl pnc a b E(SQF Int/σ 2 i=1 j=1 ) = (a 1)(b 1) + n ij[(µ ij + µ.. ) (µ i. + µ.j )] 2 }{{}} σ {{ 2 } gl pnc

Estimação dos parâmetros de não centralidade Para estimar os parâmrtros de não centralidade, basta substituir os parâmetros, pelos seus respectivos estimadores: µ ij = µ + α i + β j + (αβ) ij ; µ i. = 1 b b j=1 µ ij; µ.j = 1 a a i=1 µ ij; µ.. = 1 ab a i=1 b j=1 µ ij

Exemplo 4: Resistência de materiais Um engenheiro está desenvolvendo um tipo de bateria para ser usado em um dispositivo eletrônico sujeito à variações extremas de temperatura. Fatores de interesse: Tipo de material da placa: 1, 2 e 3. Temperatura: 15 o F, 70 o F e 125 o F. Equivalente à -9,44 o C, 21,11 o C e 51,67 o C, respectivamente Para cada combinação (tipo de material da placa temperatura) 4 baterias foram feitas. Variável resposta: tempo de vida em horas de cada bateria. Vamos considerar apenas os dois primeiros níveis de cada fator.

Exemplo 4: Resistência de materiais Neste caso, temos que β = (134, 75; 21, 00; 77, 50; 41, 50) e σ 2 = 857, 58. Assim, tem-se que δ A = 8, 130, δ B = 15, 022 e δ Int = 2, 008 ; parâmetros de não centralidade associados aos testes de existência de efeito do Fator A, Fator B e interação, respectivamente. Assim, temos os seguintes poderes estimados ψ A = 0, 7447, ψ B = 0, 9442 e ψ Int = 0, 2568.

PBC: Modelo (casela de referência) Y ij = µ + α i + τ j + ξ ij, (Fator), i = 1, 2, 3,...k; (Bloco), j = 1, 2, 3,..., b Erros ξ ij i.i.d N(0, σ 2 ), µ, α i, τ j, não aleatórios. Restrições : α 1 = τ 1 = 0.

Esperanças das Somas de Quadrados E(SQF ) = (k 1)σ 2 + b E(SQB) = (b 1)σ 2 + k k (µ i. µ.. ) 2 i=1 b (µ.j µ.. ) 2 j=1 µ i. = 1 b b j=1 µ ij; τ.j = 1 a a i=1 µ ij; µ.. = 1 ab a i=1 b j=1 µ ij

Esperanças das Somas de Quadrados (cont.) E(SQF /σ 2 ) = (k 1) + b k i=1 (µ i. µ.. ) 2 E(SQB/σ 2 ) = (b 1) + k b j=1 (µ.j µ.. ) 2 σ 2 σ 2

Estimação dos parâmetros de não centralidade Para estimar os parâmetros de não centralidade, basta substituir os parâmetros, pelos seus respectivos estimadores: µ ij = µ + α i + τ j ; µ i. = 1 b b j=1 µ ij; µ.j = 1 a a i=1 µ ij; µ.. = 1 ab a i=1 b j=1 µ ij Exercício: Fazer os desenvolvimentos acima para os modelos com três fatores e interações e com dois fatores (em bloco) e interação entre os fatores principais.