Aula 4 Planejamento e Análise de Experimentos

Documentos relacionados
4-Teste de Hipóteses. Teste de Hipóteses

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

AULA 05 Teste de Hipótese

AULA 04 Teste de hipótese

Unidade IV Inferência estatística

AULA 11 Teste de Hipótese

Unidade IV Inferência estatística

Estimação e Testes de Hipóteses

7 Teste de Hipóteses

Testes de Hipótese para uma única Amostra - parte I

Princípios de Bioestatística Teste de Hipóteses

Teste de hipóteses. Testes de Hipóteses. Valor de p ou P-valor. Lógica dos testes de hipótese. Valor de p 31/08/2016 VPS126

Tomada de Decisão para uma Única Amostra

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Testes de Hipóteses I

Inferência para duas populações

Teste de Hipóteses. Enrico A. Colosimo/UFMG enricoc/ Depto. Estatística - ICEx - UFMG 1/24

Planejamento e Otimização de Experimentos

1 Teoria da Decisão Estatística

TOMADA DE DECISÃO PARA DUAS AMOSTRAS INTRODUÇÃO ROTEIRO. Estatística Aplicada à Engenharia 1 INFERÊNCIA SOBRE A DIFERENÇA DE MÉDIAS

Probabilidade e Estatística

Planejamento e Otimização de Experimentos

Professora Ana Hermínia Andrade. Período

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos. 6 a aula Testes de Hipóteses

Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski

Teste de Hipóteses (ou Teste de Significância)

Teste de hipóteses para proporção populacional p

7. Testes de Hipóteses

TESTE DE HIPÓTESE. Introdução

(a) Teste e IC para Duas Variâncias. (b) Teste para médias. Duas Amostras de Teste T e IC

Testes de Hipóteses Paramétricos

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS EM ENGENHARIA

Probabilidade e Estatística

PROBABILIDADE E ESTATÍSTICA INFERÊNCIA ESTATÍSTICA Parte II

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

Universidade Federal do Pará Instituto de Tecnologia. Estatística Aplicada I

Inferência Estatística

Testes de Hipóteses Paramétricos

Para ajudar a interpretar os resultados, o Cartão de Relatórios do Assistente do teste de % de defeituosos para 1 amostra exibe os seguintes

Testes de Hipótese para uma única Amostra - parte II

Enrico A. Colosimo Depto. Estatística UFMG

Intervalos de Confiança - Amostras Pequenas

Delineamento e Análise Experimental Aula 3

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Aula 7. Testes de Hipóteses Paramétricos (II)

Aula 7. Testes de Hipóteses Paramétricos (II)

Razão para rejeitar H 0

Teste de hipóteses. Estatística Aplicada Larson Farber

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Cap. 4 - Estimação por Intervalo

Testes de Hipóteses: Média e proporção

Introdução a Estatística

Probabilidade e Estatística

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

EXEMPLOS DE CÁLCULO DO TAMANHO AMOSTRAL. Desenvolvido por Lucas Lima Ayres

Hipóteses. Hipótese. É uma pressuposição de um determinado problema.

AULA 07 Inferência a Partir de Duas Amostras

Stela Adami Vayego DEST/UFPR. Resumo 11 - Testes de Hipóteses

Parte 8 Testes de hipóteses Comparação de dois grupos

Teste de Hipótese e Intervalo de Confiança

1 Probabilidade - Modelos Probabilísticos

Fernando de Pol Mayer

TESTES DE HIPÓTESES. Lucas Santana da Cunha Universidade Estadual de Londrina

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

TESTE DE HIPÓTESES ELISETE AUBIN E MONICA SANDOVAL - IME

Prof. a Dr. a Simone Daniela Sartorio de Medeiros. DTAiSeR-Ar

Bioestatística CE001 Prof. Fernando de Pol Mayer Departamento de Estatística DEST Exercícios: inferência Nome: GABARITO

Testes de Hipótese para uma única Amostra - parte II

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

TESTES DE HIPÓTESES - Generalidades

Métodos Quantitativos

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Projeto de Experimentos

Notas de aula Testes de Hipóteses. Idemauro Antonio Rodrigues de Lara

Aula 5. Teste de Hipóteses II. Capítulo 12, Bussab&Morettin Estatística Básica 7ª Edição

Inferência Estatística:

MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Inferência Estatística. Teoria da Estimação

Medidas de Dispersão ou variabilidade

TESTES NÃO PARAMÉTRICOS (para mediana/média)

Profa.: Patricia Maria Bortolon, D.Sc. Statistics for Managers Using Microsoft Excel, 5e 2008 Pearson Prentice-Hall, Inc. Chap 9-1

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Estatística Inferencial

Disciplina de Modelos Lineares Professora Ariane Ferreira

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

Considerações. Planejamento. Planejamento. 3.3 Análise de Variância ANOVA. 3.3 Análise de Variância ANOVA. Estatística II

INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p

Testes de Hipótese PARA COMPUTAÇÃO

Em aplicações práticas é comum que o interesse seja comparar as médias de duas diferentes populações (ambas as médias são desconhecidas).

Transcrição:

Aula 4 Planejamento e Análise de Experimentos Professores Miguel Antonio Sovierzoski, Dr. miguelaso@utfpr.edu.br; Vicente Machado Neto, Dr. vmachado@utfpr.edu.br;

Revisão da aula anterior Fatores níveis tratamentos; Discussão sobre os trabalhos a serem desenvolvidos na disciplina, fatores, níveis, tratamentos; Valores aleatórios discretos e contínuos; Função densidade de probabilidade; Distribuições de probabilidade normal N, distribuição t de student,, distribuição gama, distribuição qui-quadrado e distribuição F; Distribuição normal padrão; Distribuição amostral da média; Teorema Central do Limite TCL; Intervalo de confiança conhecido e desconhecido;

Tamanho da Amostra Uma das questões principais a serem respondidas em um projeto de experimentos é : Quantas amostras ou observações devo usar? Infelizmente não existe uma resposta definitiva para esta questão. Contudo, com algumas informações adicional e fazendo-se algumas suposições é possível estimar o número mínimo de observações. Tem-se que pensar que quando fala-se em tamanho da amostra supõe-se a obtenção de dados nas mesmas condições. Se os dados forem obtidos em diferentes condições, mesmo que muitos, isto não significa replicata. Também tem-se que tomar cuidado com uma grande quantidade de dados obtidos na mesma condição de experimentação, os experimentos tem que explorar as diversas variáveis presentes no processo.

Tamanho da Amostra O objetivo de se fazer replicatas é testar a variabilidade dos resultados. Uma replicata para ser válida deve ser feita tudo da condição zero como se fosse um novo experimento. Um grave erro de muitos experimentos é não se fazer replicatas. Assim muito experimentos que dão um enorme trabalho são invalidados pela falta das replicatas. Observa-se ainda que a resposta obtida, pelo método aqui apresentado a seguir, pode não contemplar o erro tipo desejado.

Tamanho da Amostra Número de amostras para uma largura de Intervalo de Confiança Algumas vezes o objetivo é um particular intervalo de confiança. O intervalo de confiança da média é calculado como: s x ҧ ± t n Infelizmente para resolver a equação, depende-se de um particular valor de t student, que depende do número de amostras n. Assim a equação só pode ser resolvida para grandes valores de n, onde t torna-se constante (aproxima-se de uma distribuição normal), ou quando o desvio padrão é conhecido a priori. Para grandes valores de n, e uma largura pretendida de intervalo de confiança ±C, a seguinte equação pode ser usada: n min s Z 1 Τ2 C Para 95% de intervalo de confiança 1 Τ2 = 0,975 e z = 1,96; Para 99% de intervalo de confiança 1 Τ2 = 0,995 e z = 2,65. A equação acima é razoavelmente precisa para n>50. 2

Tamanho da Amostra Número de amostras para uma largura de Intervalo de Confiança Para pequenos valores de n e grandes C, a equação subestima o número de observações. Estimativas alternativas, para estes casos são: 1) Usar valores tabulados para pequenos valores de n. Para usar a tabela, calcula-se C/s para a largura de intervalo desejada e o desvio padrão esperado s. Encontre na tabela o valor imediatamente acima e determine o correspondente valor de n. 2) Usar um método interativo, isto é, faça um chute inicial para n e ajuste até que o desejado intervalo de confiança seja encontrado.

Tamanho da Amostra Número de amostras para uma largura de Intervalo de Confiança Exemplo No desenvolvimento de um protocolo de validação, para medição de Oxido Etileno em amostras, um analista deseja assegurar que o intervalo de confiança de 95% não seja maior do que C= 45 ppm. Sabe-se de ensaios prévios que o desvio padrão é igual a 45 ppm. Quantas observações são requeridas? 1) Usando-se a tabela. Para C= intervalo de confiança = 45ppm e s = 45 ppm. Observa-se na coluna de 95% de confiança que o valor imediatamente abaixo de C/s =1 é 0,925 que corresponde a n=7. Assim a validação do protocolo requer um mínimo de 7 replicatas.

Tamanho da Amostra Número de amostras para uma largura de Intervalo de Confiança Exemplo

Tamanho da Amostra Número de amostras para uma largura de Intervalo de Confiança Exemplo No desenvolvimento de um protocolo de validação, para medição de Oxido Etileno em amostras, um analista deseja assegurar que o intervalo de confiança de 95% não seja maior do que 45 ppm. Sabe-se de ensaios prévios que o desvio padrão é igual a 45 ppm. Quantas observações são requeridas? 2) Resolvendo de maneira iterativa utilizando o Excel, temos a figura abaixo, extraída do Excel, que comprova que o número de amostras fica entre 6 e 7:

Tamanho da Amostra Número de amostras no software Minitab Stat > Power and Sample Size > Sample Size for Estimation Tendo-se uma margem de erro para um intervalo de confiança da média pode-se determinar o tamanho da amostra. Inversamente conhecendo-se o tamanho da amostra pode-se determinar a margem de erro para um intervalo de confiança.

Tamanho da Amostra Número de amostras no software Minitab

Tamanho da Amostra Número de amostras no software Minitab Planning Value The necessary planning value depends on the chosen parameter. Statistical analysis you plan to conduct 1-Sample z 1-Sample t Paired t Estimated parameter Mean from a normal distribution Planning value Standard deviation To estimate samples size or margins of error, you need information about the data you expect to collect. You can obtain planning values from: Design specifications Expert opinions Prior studies or small pilot studies The planning value you need depends on the parameter you want to estimate.

Tamanho da Amostra Número de amostras no software Minitab An electronics company wants to estimate the voltage of a new line of resistors used in circuit boards. They want to know what sample size they need to obtain a margin of error of 5. Based on prior studies, the standard deviation is 22.5. 1 Choose Stat > Power and Sample Size > Sample Size for Estimation. 2 In Parameter, choose Mean (Normal). 3 Under Planning Value, enter 22.5 in Standard deviation. 4 Choose Estimate sample sizes. 5 In Margins of error for confidence intervals, 5. 6 Click OK. Session window output Interpreting the results To achieve a margin of error of 5 when estimating the mean voltage of resistors, the electronics company needs to collect 81 samples.

Sample Size for Estimation Method Tamanho da Amostra Número de amostras no software Minitab No software Minitab - Exemplo Parameter Mean Distribution Normal Standard deviation 22.5 (estimate) Confidence level 95% Confidence interval Two-sided Results Margin Sample of Error Size 5 81

Tamanho da Amostra Número de amostras no software Minitab Exemplo - Resolvendo o mesmo exercício anterior com o Minitab No desenvolvimento de um protocolo de validação, para medição de Oxido Etileno em amostras, um analista deseja assegurar que o intervalo de confiança de 95% não seja maior do que 45 ppm. Sabe-se de ensaios prévios que o desvio padrão é igual a 45 ppm. Quantas observações são requeridas?

Testes de hipóteses O teste de hipóteses é um procedimento estatístico em que se busca verificar uma hipótese a respeito da população, no sentido de aceitá-la ou rejeita-la, a partir de dados amostrais, tendo por base a teoria das probabilidades. Em geral, um problema científico (expresso na forma de pergunta) conduz a uma hipótese científica (resposta provisória a esta pergunta) que requer uma pesquisa científica para a sua verificação. O teste de hipótese é um dos procedimentos mais utilizados na pesquisa científica, sobretudo na pesquisa experimental.

Testes de hipóteses No uso de um teste de hipóteses fazemos algumas suposições tais como: a) Ambas as amostras foram extraídas de populações independentes que podem ser descritas por distribuições normais; b) Que o desvio padrão ou variância das populações são iguais; c) E que os dados são variáveis aleatórias independentes. A suposição de independência é crítica, mas se as rodadas de experimentação forem sorteadas e demais variáveis forem selecionadas aleatoriamente, normalmente, satisfaz-se a suposição de independência. As suposições de variância igual e normalidade são facilmente verificadas usando-se gráficos de verificação da normalidade. Normalmente softwares incorporam opções de verificação da normalidade, ou mesmo o procedimento pode ser executado manualmente, colocando os dados em ordem crescente e seguindo procedimento específico.

Testes de hipóteses O gráfico mostra a verificação da normalidade de medições de glicose em amostras de materiais de referência.

Testes de hipóteses De modo geral, podemos definir cinco passos para construção de um teste de hipóteses: 1) Definir as hipóteses estatísticas; 2) Fixar a taxa de erro aceitável; 3) Escolher a estatística para testar a hipótese e verificar as pressuposições para o seu uso; 4) Usar as observações da amostra para calcular o valor da estatística do teste; 5) Decidir sobre a hipótese testada e concluir.

Testes de hipóteses média 1) Definir as hipóteses estatísticas; A hipótese estatística é uma suposição feita a respeito de um ou mais parâmetros, tais como, média de populações ( ), variâncias de populações (σ 2 ), etc. As hipóteses estatísticas surgem de problemas científicos. Existem dois tipos básicos de hipóteses estatísticas: Hipótese de nulidade (H 0 ): é a hipótese que está sob verificação. Esta hipótese supõe a igualdade dos parâmetros que estão sendo testados; Hipótese alternativa (H A ): é a hipótese que será considerada caso a hipótese de nulidade seja rejeitada. Esta hipótese supõe que os parâmetros testados são diferentes.

Testes de hipóteses média Duas situações são comuns em testes de hipóteses a respeito da média da população ( ): 1. Comparação de uma média ( ) com um valor (μ 0 ). Nesta situação, temos uma população da qual é extraída uma amostra e a média desta amostra é comparada com um valor já conhecido (valor padrão) que serve como referência. H 0 : μ = μ 0 ou μ μ 0 = 0 H A : μ μ 0 ou μ μ 0 0 hipótese bilateral μ > μ 0 ou μ μ 0 > 0 hipótese unilateral direita μ < μ 0 ou μ μ 0 < 0 hipótese unilateral esquerda Devemos escolher a H A mais apropriada

Testes de hipóteses média 2. Comparação entre duas médias (μ 1 e μ 2 ). Nesta situação, temos duas populações, de cada uma é extraída uma amostra, e as médias das duas amostras são comparadas. H 0 : μ 1 = μ 2 ou μ 1 μ 2 = 0 H A : μ 1 μ 2 ou μ 1 μ 2 0 hipótese bilateral μ 1 > μ 2 ou μ 1 μ 2 > 0 hipótese unilateral direita μ 1 < μ 2 ou μ 1 μ 2 < 0 hipótese unilateral esquerda Devemos escolher a H A mais apropriada

Testes de hipóteses média Exemplificando com um teste de hipóteses no qual pretende-se avaliar duas formulações de argamassas, que devem ser avaliadas com respeito à resistência a compressão. Obviamente, seria impossível avaliar todas as argamassas produzidas. População 1 é a formulação 1 da argamassa, a População 2 é a formulação 2 da argamassa. Nestas populações vamos estudar a variável contínua X= resistência da argamassa, supondo que X~N μ, σ 2 e que σ 1 2 = σ 2 2.

Testes de hipóteses média Assim nossos parâmetros de interesse são: E X 1 = μ 1 = resistência média da população 1; E X 2 = μ 2 = resistência média da população 2; Assim devemos considerar as seguintes hipóteses estatísticas. H 0 : μ 1 = μ 2 H A : μ 1 μ 2

Testes de hipóteses média Observemos que a hipótese alternativa não corresponde necessariamente à expectativa do pesquisador, ou seja, à hipótese científica. A hipótese a ser testada em um teste é sempre a hipótese de igualdade entre os parâmetros, enquanto a hipótese alternativa deve ser definida pelo pesquisador, podendo ser bilateral ou unilateral. A escolha entre uma e outra, entretanto, jamais deve ser feita com base nos dados da amostra, tampouco na expectativa do pesquisador. A hipótese bilateral é mais genérica e deve ser utilizada quando não temos motivos suficientes para esperar que um dos parâmetros seja maior ou menor que outro. Assim, supomos apenas que os parâmetros serão diferentes, caso a hipótese de igualdade seja rejeitada.

Testes de hipóteses média As situações de aplicação da hipótese unilateral são mais restritas e nem sempre são muito claras. A opção por uma hipótese unilateral exige que tenhamos mais informações sobre o comportamento da variável de interesse na situação da pesquisa. Estudos anteriores, por exemplo, podem prover evidências que suportem uma hipótese unilateral.

Testes de hipóteses média A hipótese unilateral pode ser também uma decorrência lógica da situação de pesquisa, como, por exemplo, quando comparamos a média de um grupo tratado (que recebe determinado tratamento) com a média de um grupo controle ou testemunha (que não recebe o tratamento). Neste caso, se o tratamento não tem efeito, esperamos que as médias dos dois grupos sejam iguais; mas se o tratamento tem efeito significativo é bastante razoável esperar que a média do grupo tratado (que expressa este efeito) seja maior (e nunca menor do que a média do grupo controle.

Testes de hipóteses erros Um elemento intrínseco ao processo de inferência é o erro. Como as conclusões são obtidas a partir de dados amostrais, eventualmente, a amostra pode não representar o todo (população). Como a hipótese sob verificação é H 0, dois tipos de erro estão associados à decisão a respeito dela, são eles: Erro Tipo I: rejeitar H 0 quando ela é verdadeira = P(erro tipo I) probabilidade de cometer o erro tipo I Erro Tipo II: não rejeitar H 0 quando ela é falsa = P(erro tipo II) probabilidade de cometer o erro tipo II Decisão Situação de H 0 Verdadeira Falsa Não rejeitar Acerto Erro Tipo II - Rejeitar Erro Tipo I - Acerto

Testes de hipóteses erros Como consequência, temos que: (1- ) é a probabilidade de não cometer o erro tipo I, ou seja, é a capacidade de não rejeitar H 0 verdadeira, e (1- ) é a probabilidade de não cometer o erro tipo II, ou seja, é a capacidade de rejeitar H 0 falsa. A probabilidade (1- ) é denominada poder do teste. Podemos dizer, então, que o poder do teste é a probabilidade de declarar diferenças quando elas, de fato existem. O poder de um teste está relacionado com os seguintes fatores: tamanho da amostra, variabilidade da variável e magnitude da diferença existente entre as médias. Decisão Situação de H 0 Verdadeira Falsa Não rejeitar Acerto Erro Tipo II - Rejeitar Erro Tipo I - Acerto

Testes de hipóteses erros É importante ressaltar ainda que as duas taxas de erro ( e ) estão relacionadas negativamente, de modo que a redução de implica no aumento de e vice-versa. Para que os testes de hipóteses tenham validade, é necessário que sejam delineados de modo a minimizar os erros de conclusão. Entretanto, o único meio de reduzir ambos os tipos de erro é aumentando o tamanho da amostra, o que nem sempre é viável. Via de regra a preocupação está voltada para minimizar o erro tipo I. A probabilidade de ocorrência do erro tipo I ( ) é chamada de nível de significância do teste. Decisão Verdadeira Situação de H 0 Falsa Não rejeitar Acerto Erro Tipo II - Rejeitar Erro Tipo I - Acerto

Testes de hipóteses critério de decisão A regra de decisão a respeito de H 0 pode ser estabelecida com base num valor crítico: Teste bilateral: se a hipótese alternativa for bilateral, o valor crítico será: t ατ2(ν) : valor da estatística t, para graus de liberdade, que delimita a área ατ2, encontrado na tabela da distribuição t (limites bilaterais); Teste unilateral: se a hipótese alternativa for unilateral, o valor crítico será: t α(ν) : valor da estatística t, para graus de liberdade, que delimita a área, encontrado na tabela da distribuição t (limites unilaterais); Para decidir comparamos o valor da estatística t= θ S(θ) com o valor crítico: Rejeitamos H 0, ao nível, se o valor da estatística, em módulo, for maior que o valor crítico: t > valor crítico

Testes de hipóteses critério de decisão O Excel tem uma função que retorna o valor de t. A função =INV.T(probabilidade; graus de liberdade) retorna o valor de t. Para a função =INV.T(0,025;22) o valor retornado será -2,07387, ou se você entrar com a função =INV.T(0,975;22) obterá o valor 2,073873. No teste de hipóteses compara-se sempre o valor do t crítico como positivo, assim mesmo a função =INV.T(0,025;22) retornar o valor -2,07387 o valor do t crítico a ser comparado é 2,07387. Em alguns critérios de rejeição o sinal está a frente do valor crítico, neste caso o valor a ser comparado será negativo.

Testes de hipóteses critério de decisão Não temos motivos suficientes para rejeitar H 0, ao nível, se o valor da estatística, em módulo, for menor que o valor crítico: t < valor crítico. Podemos observar a seguir as regiões de rejeição H 0 na curva da distribuição t para cada uma das três possibilidades de hipótese alternativa: Para hipótese alternativa bilateral, ou seja, H A : μ 1 μ 2 0

Testes de hipóteses critério de decisão Para hipótese alternativa unilateral direita ou seja, H A : μ 1 μ 2 > 0

Testes de hipóteses critério de decisão Para hipótese alternativa unilateral esquerda ou seja, H A : μ 1 μ 2 < 0

Testes de hipóteses P valor Outro critério tem sido frequentemente utilizado para decidir sobre H 0. Essa decisão também pode ser baseada em um valor que expressa a probabilidade de que seja obtido um valor t mais extremo que o valor observado, dado que H 0 é verdadeiro. Esta probabilidade é conhecida como P valor.

Testes de hipóteses P valor A decisão a respeito de H 0 é tomada da seguinte forma: Se o valor P for maior ou igual a, não rejeitamos a hipótese nula, pois t é típico ou está em uma região de alta probabilidade. Se o valor P for menor que, rejeitamos a hipótese nula, pois t é atípico ou está em uma região de baixa probabilidade.

Testes de hipóteses P valor O P valor para distribuição Z é calculado para testes bilaterais como: P = 2 1 Φ Z 0 No caso dos testes unilaterais, o P valor é calculado pela equação: P = 1 Φ Z 0 para o teste unilateral superior; P = Φ Z 0 para o teste unilateral inferior.

Testes de hipóteses P valor Para simplificar o cálculo do P valor para uma hipótese bicaudal, utilizando a distribuição t, podemos utilizar a função do Excel DIST.T.BC(t 0 ; graus de liberdade). A função retorna diretamente o P valor. Da mesma forma a função DIST.T.CD (t 0 ; graus de liberdade), retorna o valor percentual da cauda direita e pode ser usada para cálculo do P valor para hipóteses unilaterais.

Testes de hipóteses P valor

Testes de hipóteses P valor

Testes de hipóteses P valor

Testes de hipóteses P valor

Testes de hipóteses P valor

Testes de hipóteses médias variância conhecida

Testes de hipóteses médias variância conhecida Intervalos de confiança തy Z Τ2 στ n μ തy + Z Τ2 στ n തy Z στ n μ തy + Z στ n σ 2 1 തy 1 തy 2 Z Τ2 + σ 2 2 μ n 1 n 1 μ 2 തy 1 തy 2 + Z Τ 2 2 σ 1 2 + σ 2 2 n 1 n 2

Testes de hipóteses médias variância desconhecida

Testes de hipóteses médias variância desconhecida Intervalos de Confiança Intervalos de Confiança Bilaterais തX t Τ 2 Sn < μ < തX + t Τ 2 S n S p = n 1 1 S 1 2 + n 2 1 S 2 2 n 1 + n 2 2 തy 1 തy 2 t Τ 2;n1 +n 2 2S p 1 n 1 + 1 n 2 μ 1 μ 2 തy 1 തy 2 + t Τ 2;n1 +n 2 2S p 1 n 1 + 1 n 2 2 S 1 തy 1 തy 2 t ατ2;ν + S 2 2 μ n 1 n 1 μ 2 തy 1 തy 2 + t Τ 2 2;ν S 1 2 + S 2 2 n 1 n 2

Testes de hipóteses variâncias

Testes de hipóteses variâncias Intervalos de confiança bilaterais n 1 S 2 χ 2 Τ α 2;n 1 σ 2 n 1 S2 χ 2 1 (ατ2);n 1 2 S 1 2 S F 1 Τ2,n 2 1,n 1 1 σ 1 2 2 σ 2 S 2 1 2 2 S F Τ 2 F 1,ν2,ν 1 = 1 F α,ν2,ν 1 2,n 2 1,n 1 1

Exercício 1 - Testes de hipóteses A resistência de um freio de fibra deve ser de pelo menos 150psi. Experiência anterior indica que o desvio padrão da resistência do freio é de =3psi. Uma amostragem aleatória de 4 peças são testadas e os resultados foram: y1= 145; y2=153; y3=150 e y4=147. (a) Estabeleça as hipóteses que você acha que deveriam ser testadas neste experimento. (b) Teste as hipóteses usando α = 0,05. Qual a sua conclusão? (c) Encontre o p-value para o teste do item (b). (d) Construa o intervalo de confiança de 95% da resistência média do freio.

Exercício 1 - Testes de hipóteses (a) Exercício envolve a comparação da média de uma população com um valor específico. Hipóteses: H 0 : μ = 150 psi H 1 : μ 150 psi A hipótese pode ser testada se a população é normal com uma variância conhecida. Resultados do Minitab: One-Sample Z: Resis Freios Test of mu = 150 vs not = 150 The assumed standard deviation = 3 Variable N Mean StDev SE Mean 95% CI Z P Resis Freios 4 148,75 3,50 1,50 (145,81; 151,69) -0,83 0,405

Exercício 1 - Testes de hipóteses O gráfico mostra em azul o intervalo de confiança de 95%

Exercício 1 - Testes de hipóteses O gráfico mostra os quartis e bigodes do box plot

Exercício 1 - Testes de hipóteses H 0 : µ= 150 pode ser rejeitada se Z 0 > Z Τ 2 Z 0 = തy μ 0 Τ σ n = 148,75 150 Τ 3 4 = 0,833.. Z Τ2 = Z 0,025 = 1,960

Exercício 1 - Testes de hipóteses Ou tabela Z aproximadamente pegando a probabilidade 97,5% (0,97500) correspondente ao Z de 1,96. Pelo excel =INV.NORMP.N(0,975)=1,959964 (ou INV.NORMP) Como Z 0 < Z Τ2 = 0,833 < 1,96 a hipótese nula não pode ser descartada. Ou seja não podemos descartar com 95% de certeza que a resistência dos freios seja igual a 150 psi.

Exercício 1 - Testes de hipóteses O P valor pode ser definido como o menor nível de significância que podemos rejeitar a hipótese nula. No software Minitab nota-se que o p-value é de 0,405 indicando que não podemos rejeitar a hipótese nula já que o p-value é maior que α=0,05. Pode-se utilizar a função do Excel =DIST.NORMP.N(- 0,833;VERDADEIRO) e obter o resultado 0,202422 e multiplicar por 2 para obter o P valor = 0,404845 Pela tabela (Z) encontramos o valor para P=(0,83) =0,79673 (aprox). Como o P valor é calculado para testes bilaterais como: P = 2 1 Φ Z 0 = 2.[1-0,797577635]=0,40484473 Ou seja não podemos descartar a hipótese nula de igualdade da resistência a 150 psi com o nível de significância de 95% como foi pedido.

Exercício 1 - Testes de hipóteses (d) O intervalo de confiança especificado para a condição em que temos uma população normalmente distribuída com variância conhecida é: തy Z Τ2 στ n μ തy + Z Τ2 στ n 148,75 1,96x Τ 3 4 148,75 148,75 + 1,96x Τ 3 4 Assim o intervalo de confiança de 95% da resistência do freio é : 145,81 148,75 151,69

Exercício 1 - Testes de hipóteses Podemos testar ainda H 0 de igualdade contra a hipótese que a média seja igual a 150 psi, diminuindo a significância para 60%. Pelo software Minitab obtemos os valores abaixo. Boxplot of Resistência Freios (with Ho and 60% Z-confidence interval for the Mean, and StDev = 3) _ X Ho 144 Test of mu = 150 vs not = 150 The assumed standard deviation = 3 145 146 147 148 149 150 Resistência Freios 151 152 153 Variable N Mean StDev SE Mean 60% CI Z P Resistência Freios 4 148,75 3,50 1,50 (147,49; 150,01) -0,83 0,405

Exercício 1 - Testes de hipóteses Neste caso ficamos no limite de aprovar ou descartar a hipótese H0 com o nível de significância de 60%. Já que 150 psi está no limite inferior do IC de 60%. Boxplot of Resistência Freios (with Ho and 60% Z-confidence interval for the Mean, and StDev = 3) _ X Ho 144 Test of mu = 150 vs not = 150 The assumed standard deviation = 3 145 146 147 148 149 150 Resistência Freios 151 152 153 Variable N Mean StDev SE Mean 60% CI Z P Resistência Freios 4 148,75 3,50 1,50 (147,49; 150,01) -0,83 0,405

Exercício 1 - Testes de hipóteses Podemos testar ainda H 0 de igualdade contra a hipótese que a média seja maior do que 150 psi. Pelo software Minitab obtemos os valores abaixo. Boxplot of C1 (with Ho and 95% Z-confidence interval for the Mean, and StDev = 3) _ X Ho 144 149 C1 Test of mu = 150 vs > 150 The assumed standard deviation = 3 95% Lower Variable N Mean StDev SE Mean Bound Z P C1 4 148,75 3,50 1,50 146,28-0,83 0,798 145 146 147 148 150 151 152 153

Exercício 1 - Testes de hipóteses Pela tabela Z apêndice I observamos que Z 0 está entre 1,64 (prob de 0,94950) e 1,65 (prob de 0,95053), já que o valor a ser procurado é a probabilidade de 0,95 e não mais 0,975 como no teste bilateral. Pelo Excel usando-se a função =INV.NORMP.N(0,95) obtemos o valor 1,644854. Para rejeitar H 0 devemos ter a condição que Z 0 > Z. Como Z 0 = 0,833 não é maior que 1,644854, não podemos descartar a hipótese H 0 de igualdade contra a hipótese alternativa que a média seja maior do que 150 psi.

Exercício 1 - Testes de hipóteses Obtemos o P valor usando a função excel =DIST.NORMP.N(-0,833;VERDADEIRO), que retorna o valor 0,202422, fazendo (1-0,202422) obtemos 0,797578 que é o P valor. Pelo P valor observamos que a hipótese de igualdade da média a 150 psi é forte já que o P valor é alto. Assim não podemos afirmar que o valor da resistência seja maior do que 150 psi. Desejávamos descartar a hipótese H 0 de igualdade contra a hipótese que a resistência fosse maior do que 150 psi, já que a condição estabelecida pelo problema é que a resistência tem que ser de no mínimo 150 psi.

Exercício 2 - Testes de hipóteses Duas máquinas são usadas para o enchimento de garrafas plásticas com 16,0 ml. O processo de enchimento pode ser assumido como normal, com um desvio padrão de σ 1 = 0,015 e σ 2 = 0,018. O departamento de engenharia suspeita da qualidade das maquinas, se ambas as máquinas encham o mesmo volume ou não. A referência é o volume de 16,0 ml. Um experimento é elaborado pegando amostras aleatórias da saída da cada máquina. (a) Estabeleça as hipóteses que deveriam ser testadas neste experimento; (b) Teste estas hipóteses usando α=0,05. Quais suas conclusões? (c) Encontre o valor de P para este teste; (d) Encontre o intervalo de confiança de 95%, da média de preenchimento das duas máquinas. Máquina 1 Máquina 2 16,03 16,01 16,02 16,03 16,04 15,96 15,97 16,04 16,05 15,98 15,96 16,02 16,05 16,02 16,01 16,01 16,02 15,99 15,99 16,00

Exercício 2 - Testes de hipóteses (a) Estabeleça as hipóteses que deveriam ser testadas neste experimento; Hipóteses: H 0 : μ 1 = μ 2 H 1 : μ 1 μ 2 (b) Teste estas hipóteses usando α=0,05. Quais suas conclusões? Z 0 = തy 1 തy 2 σ 2 1 n + σ 2 2 1 n 2 തy 1 = 16,0150 തy 2 = 16,0050 Z 0 = 16,0150 16,0050 0,015 10 + 0,018 = 0,17407765 10

Exercício 2 - Testes de hipóteses Z Τ2 = Z 0,025 = 1,960 Pelo excel =INV.NORMP.N(0,975)=1,959964 Critério de Rejeição: Z 0 > Z Τ2 como 0,1741 < 1,960 portanto não podemos rejeita H 0.

Exercício 2 - Testes de hipóteses (c) Encontre o valor de P para este teste; Pode-se utilizar a função do Excel =DIST.NORMP.N(0,1741;VERDADEIRO) e obter o resultado 0,569106, diminuir de 1 (1-0,569106) e multiplicar por 2 para obter o P valor = 0,861787. Pela tabela podemos obter o P Valor aproximado já que Z=0,17 indica uma probabilidade de 0,56749 P = 2 1 Φ Z 0 = 2[1 Φ 0,17410 ] =2[1-0,56749]= 2.[0,43251]=0,8650 Como o valor de P é maior do que 0,025 o critério de decisão para uma hipótese bilateral com =0,05, não podemos rejeitar H 0. (d) Encontre o intervalo de confiança de 95%, da diferenças das médias de preenchimento das duas máquinas. തX 1 തX 2 σ 2 1 + Z ατ2 + σ 2 2 > δ > തX n 1 n 1 തX 2 Z Τ 2 α 2 σ 1 2 + σ 2 2 n 1 n 2 16,015 16,005 ± 1,96 0,0152 10 + 0,0182 10 0,01 ± 0,014522 0,004522 < 0,01 < 0,024522

Exercício 2 - Testes de hipóteses Resolvendo usando-se o Mini Tab. Sample N Mean StDev SE Mean 1 10 16,0150 0,0150 0,0047 2 10 16,0050 0,0180 0,0057 Difference = mu (1) - mu (2) Estimate for difference: 0,01000 95% CI for difference: (-0,00563; 0,02563) T-Test of difference = 0 (vs not =): T-Value =1,35 P-Value = 0,195 DF = 17 Os resultados deram diferentes dos calculados anteriormente, porque o software calcula considerando valores da distribuição t e anteriormente considerou-se distribuição Z.

Exercício 3 - Testes de hipóteses O tempo de reparo de um instrumento eletrônico é normalmente distribuído, sendo a variável aleatória medida em horas. Os tempos de reparo de 16 destes instrumentos escolhidos aleatoriamente estão na tabela abaixo. (a) Deseja-se saber se o tempo de reparo excede 225 horas. Estabeleça as hipóteses apropriadas; (b) Teste as hipóteses, quais as conclusões? Use =0,05; (c) Encontre o P valor do teste; (d) Construa o intervalo de confiança de 95% do tempo médio de reparo. Horas 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170

Exercício 3 - Testes de hipóteses (a) Deseja-se saber se o tempo de reparo excede 225 horas. Estabeleça as hipóteses apropriadas; One-Sample T: Tempo de reparo Test of mu = 225 vs not = 225 Variable N Mean StDev SE Mean 95% CI T P Tempo de reparo 16 241,5 98,7 24,7 (188,9; 294,1) 0,67 0,514 Boxplot of Tempo de reparo (with Ho and 95% t-confidence interval for the mean) Ho _ X SE Mean = StDev / RAIZ(n) 100 200 300 Tempo de reparo 400 500

Exercício 3 - Testes de hipóteses (a) Deseja-se saber se o tempo de reparo excede 225 horas. Estabeleça as hipóteses apropriadas; H 0 : μ = 225 H 1 : μ 225 (b) Teste as hipóteses, quais as conclusões? Use =0,05; t 0 = തy μ 0 SΤ critério de rejeição: t n 0 > t Τ2;n 1 241,5 225 t 0 = 98,7Τ 16 = 0,6687 t Τ2;n 1 = t 0,025;15 = 2,131 Pelo Excel =INV.T(0,975;15) = 2,13245 Como t 0 < t 0,025;15 0,6687 < 2,131 Não podemos descartar H 0. (c) Encontre o P valor do teste; Pelo Excel = DIST. T. BC(0,6687; 15) = 0,513847 Como o valor de P é maior do que 0,025 o critério de decisão para uma hipótese bilateral com =0,05, não podemos rejeitar H 0.

Exercício 3 - Testes de hipóteses (d) Construa o intervalo de confiança de 95% do tempo médio de reparo. S IC μ; 1 α : തX ± t Τ2 n 241,5±2,13198,7 241,5 ± 52,58 188,92 16 294,08

Exercício 4 - Testes de hipóteses A tabela a seguir mostra os tempos de queima de duas diferentes formulações químicas combustíveis. O engenheiro projetista está interessado na média e na variância dos tempos de queima das formulações. Tipo 1 Tipo 2 65 82 64 56 81 67 71 69 57 59 83 74 66 75 59 82 82 70 65 79 (a) Teste as hipótese que as duas variâncias são iguais. Use =0,05. (b) Use os resultados de (a), teste as hipótese que a média dos tempos de queima são iguais. Use =0,05. Qual o valor de P para este teste? (c) Discuta o papel da normalidade assumida neste problema. Verifique a normalidade das duas formulações.

Exercício 4 - Testes de hipóteses (a) Teste as hipótese que as duas variâncias são iguais. Use =0,05. Pelo software Minitab obtemos: Test and CI for Two Variances: Tipo 1; Tipo 2 Method Null hypothesis Variance(Tipo 1) / Variance(Tipo 2) = 1 Alternative hypothesis Variance(Tipo 1) / Variance(Tipo 2) not = 1 Significance level Alpha = 0,05 Statistics Variable N StDev Variance Tipo 1 10 9,264 85,822 Tipo 2 10 9,367 87,733 Ratio of standard deviations = 0,989 Ratio of variances = 0,978

Exercício 4 - Testes de hipóteses (a) Teste as hipótese que as duas variâncias são iguais. Use =0,05. Test and CI for Two Variances: Tipo 1; Tipo 2 95% Confidence Intervals CI for Distribution CI for StDev Variance of Data Ratio Ratio Normal (0,493; 1,985) (0,243; 3,938) Continuous (0,508; 1,933) (0,258; 3,735) Tests Test Method DF1 DF2 Statistic P-Value F Test (normal) 9 9 0,98 0,974 Levene's Test (any continuous) 1 18 0,00 1,000

Exercício 4 - Testes de hipóteses (a) Teste as hipótese que as duas variâncias são iguais. Use =0,05. Teste estatístico F 0 = S 1 2 2 = 85,822 = 0,97823 S 2 87,732 Critério de rejeição: F 0 > F Τ2,n1 1,n 2 1 ou F 0 < F F Τ2,n1 1,n 2 1=4,03 ou F1 Τ2,n 1 1,n 2 1= 0,25 Pelo Excel =INV.F.CD(0,025;9;9) = 4,025994 Pelo Excel =INV.F.CD(0,975;9;9) = 0,248386 1 Τ2,n 1 1,n 2 1 Como F 0 < 4,03 e F 0 > 0,25 não podemos descartar H 0 de igualdade das variâncias. Podemos determinar o P Valor para o teste F, usando-se a seguinte função do Excel =DIST.F(0,97823;9;9;VERDADEIRO) =0,487191 e multiplicarmos por dois por ser hipótese bilateral, onde teremos o valor 0,974382.

Exercício 4 - Testes de hipóteses (b) Use os resultados de (a), teste as hipótese que a média dos tempos de queima são iguais. Use =0,05. Qual o valor de P para este teste? H 0 : μ 1 = μ 2 H 1 : μ 1 μ 2 Teste estatístico: t 0 = തy 1 തy 2 = 4,8011 10 2 = 0,048011 S p 1 n1 + 1 n2 S p = n 1 1 S 1 2 + n 2 1 S 2 2 n 1 + n 2 2 = 70,40 70,20 9,3147 1 10 + 1 10 = 10 1 85,74 + 10 1 87,79 10 + 10 2 = 9,3147 Critério de decisão: t 0 > t Τ2; ν ν = n 1 + n 2 2 = 18 t Τ2; ν = t 0,025;18 = 2,101 Pelo Excel =INV.T(0,975;18) = 2,100922 Como: t 0 > t Τ2; ν 0,048< 2,101 não podemos descartar H 0 de igualdade. Encontre o P valor do teste; Pelo Excel =DIST.T.BC(0,048011;18)= 0,962236 Como o valor de P é maior do que 0,025 o critério de decisão para uma hipótese bilateral com =0,05, não podemos rejeitar H 0.

Exercício 4 - Testes de hipóteses Two-sample T for Tipo 1 vs Tipo 2 N Mean StDev SE Mean Tipo 1 10 70,40 9,26 2,9 Tipo 2 10 70,20 9,37 3,0 Difference = mu (Tipo 1) - mu (Tipo 2) Estimate for difference: 0,20 95% CI for difference: (-8,55; 8,95) T-Test of difference = 0 (vs not =): T-Value = 0,05 P-Value = 0,962 DF = 18 Both use Pooled StDev = 9,3155

Exercício 4 - Testes de hipóteses (c) Discuta o papel da normalidade assumida neste problema. Verifique a normalidade das duas formulações. Probability Plot of Tipo 1 Normal Percent 99 95 90 80 70 60 50 40 30 20 Mean 70,4 StDev 9,264 N 10 AD 0,344 P-Value 0,409 10 5 1 50 60 70 Tipo 1 80 90

Exercício 4 - Testes de hipóteses (c) Discuta o papel da normalidade assumida neste problema. Verifique a normalidade das duas formulações. Probability Plot of Tipo 2 Normal Percent 99 95 90 80 70 60 50 40 30 20 Mean 70,2 StDev 9,367 N 10 AD 0,186 P-Value 0,876 10 5 1 50 60 70 Tipo 2 80 90

Exercício 4 - Testes de hipóteses (c) Discuta o papel da normalidade assumida neste problema. Verifique a normalidade das duas formulações. Observando os gráficos de normalidade das duas formulações, pode-se dizer que as duas formulações podem ser admitidas como normais, a segunda formulação com os pontos mais próximo de uma reta que a primeira formulação. Density 0,04 0,03 0,02 0,01 0,00 50 60 Histogram of Tipo 1; Tipo 2 Normal 70 Data 80 90 Variable Tipo 1 Tipo 2 Mean StDev N 70,4 9,264 10 70,2 9,367 10

Exercício 5 - Testes de hipóteses Cinco medidas do conteúdo de alcatrão em um cigarro X acusaram: 14,5; 14,2; 14,4; 14,8 e 14,1 miligramas por cigarro. Este conjunto de cinco valores tem média de 14,4 e desvio padrão 0,274. O leitor pretende testar a hipótese nula Ho: µ=14,1 (conforme declarado no maço) ao nível de 0,05 de significância. Ho seria aceita, contra a alternativa Ha: µ 14,1? Ho seria aceita, contra a alternativa Ha: µ<14,1? Ho seria aceita, contra a alternativa Ha: µ>14,1? Que suposições são necessárias para fazer o teste de hipóteses?

Exercício 5 - Testes de hipóteses Test of mu = 14,1 vs not = 14,1 Variable N Mean StDev SE Mean 95% CI T P C1 5 14,400 0,274 0,122 (14,060; 14,740) 2,45 0,070 Não rejeitamos H0 contra a hipótese que a média seja diferente do que 14,1. Obs: Podemos ver que o intervalo de confiança em azul inclui H0.

Exercício 5 - Testes de hipóteses 14,4 14,1 t 0 = 0,274Τ 5 = 2,44825 Pela tabela t Τ2;n 1 = t 0,025;4 = 2,776 Pelo Excel =INV.T(0,975;4) = 2,7764 Como t 0 < t 0,025;4 2,45 < 2,78 Não podemos descartar H 0. O P Valor do teste; Pelo Excel = DIST. T. BC(2,44825; 4) = 0,070578 Como o valor de P é maior do que 0,025 o critério de decisão para uma hipótese bilateral com =0,05, não podemos rejeitar H 0.

Exercício 5 - Testes de hipóteses Test of mu = 14,1 vs < 14,1 95% Upper Variable N Mean StDev SE Mean Bound T P C1 5 14,400 0,274 0,122 14,661 2,45 0,965 Não rejeitamos H0 contra a hipótese que a média seja menor do que 14,1.

Exercício 5 - Testes de hipóteses 14,4 14,1 t 0 = 0,274Τ 5 = 2,44825 Pela tabela t ;n 1 = t 0,05;4 = 2,132 Pelo Excel =INV.T(0,95;4) = 2,131847 Como t 0 > t 0,05;4 2,45 > 2,132 não podemos descartar H 0 contra a hipótese que a média seja menor do que 14,1. O P valor do teste; Pelo Excel temos que fazer = DIST. T. CD(2,44825; 4) = 0,035289 depois diminuir este valor de 1, assim (1-0,035289)=0,964711 que é o P Valor. Como o valor de P é bem maior do que 0,05 o critério de decisão para uma hipótese unilateral com =0,05, não podemos rejeitar H 0. Podemos notar que como o P valor é bem maior do que, ficamos seguros em rejeitar a hipótese alternativa que a média seja menor do que 14,1.

Exercício 5 - Testes de hipóteses Test of mu = 14,1 vs > 14,1 95% Lower Variable N Mean StDev SE Mean Bound T P C1 5 14,400 0,274 0,122 14,139 2,45 0,035 Rejeitamos H0 contra a hipótese que a média seja maior do que 14,1.

Exercício 5 - Testes de hipóteses 14,4 14,1 t 0 = 0,274Τ 5 = 2,44825 Pela tabela t ;n 1 = t 0,05;4 = 2,132 Pelo Excel =INV.T(0,95;4) = 2,131847 Como t 0 > t 0,05;4 2,45 > 2,132 descartamos H 0 contra a hipótese que a média seja maior do que 14,1. O P valor do teste; Pelo Excel temos que fazer = DIST. T. CD(2,44825; 4) = 0,035289 este já é o P valor. Como o valor de P é menor do que 0,05, o critério de decisão, para uma hipótese unilateral com =0,05, podemos rejeitar H 0. Podemos notar que como o P valor é menor do que, indicando que devemos rejeitar a hipótese H 0 que a média seja igual a 14,1.

Exercício 5 - Testes de hipóteses No exercício 5 fizemos 3 testes de hipóteses. No primeiro a hipótese de igualdade da média a 14,1, não pode ser descartada, contra a hipótese alternativa de que a média seria diferente de 14,1. Assim soubemos que a média era diferente, mas não sabíamos se para cima ou para baixo de 14,1. No segundo a hipótese de igualdade da média a 14,1, também não pode ser descartada, contra a hipótese alternativa de que a média seria menor do que 14,1. Neste caso o P Valor deu alto, indicando uma conclusão forte, que a média não era menor do que 14,1. No terceiro a hipótese de igualdade da média a 14,1, foi descartada, contra a hipótese alternativa de que a média seria superior a 14,1. Concluímos assim, estatisticamente, que a média é maior do que 14,1. Indicando que o cigarro está com mais alcatrão que o permitido.

Exercício 5 - Testes de hipóteses Observamos pelo exercício que já poderíamos suspeitar que a média das amostras estavam acima de 14,1 pelo próprio box plot das amostras e partir diretamente para uma hipótese alternativa que a média era maior do que 14,1.

Exercício 6 - Testes de hipóteses Na validação de um método de medição de óxido de etileno em produtos médicos, fez-se 7 medições de uma substância padrão que possuía o valor de referência de 1,697 ppm de OE. Determine com níveis de confiança de 95%, 99% e outros níveis, se os resultados obtidos validam ou não o método de medição. OE (ppm) 1,715 1,581 1,943 1,882 1,954 1,975 1,715 Fazendo inicialmente o teste de hipóteses para o nível de confiança de 95%.

Exercício 6 - Testes de hipóteses Boxplot of OE (with Ho and 95% t-confidence interval for the mean) Ho _ X 1,6 1,7 1,8 OE 1,9 2,0

Exercício 6 - Testes de hipóteses Fazendo agora o teste de hipóteses para o nível de confiança de 99%. Boxplot of OE (with Ho and 99% t-confidence interval for the mean) Observa-se que ao contrário do que pensamos é mais fácil aprovar o teste com nível de confiança de 99%. 1,6 Ho 1,7 1,8 _ X OE 1,9 2,0 2,1

Exercício 6 - Testes de hipóteses Fazendo agora o teste de hipóteses para o nível de confiança de 92,9%. Boxplot of OE (with Ho and 92,9% t-confidence interval for the mean) Neste caso ficamos na dúvida já que que o p value é igual a p crítico ou seja 0,071. Note que H0 está no limite do IC de 92,9% 1,6 Ho 1,7 1,8 OE _ X 1,9 2,0

Exercício 6 - Testes de hipóteses Fazendo agora o teste de hipóteses para o nível de confiança de 90%. Boxplot of OE (with Ho and 90% t-confidence interval for the mean) Neste caso a hipótese H0 é descartada já que o P Valor é 0,071 e deveria ser maior ou igual a 0,1. Ho _ X 1,6 1,7 1,8 OE 1,9 2,0

Testes de hipóteses Comparação pareada Em alguns experimentos comparativos podemos aumentar grandemente a precisão fazendo comparações combinadas aos pares do material. Por exemplo, considere uma máquina de medição de dureza, que com uma ponteira pressiona uma amostra, com uma determinada força. Pela medição da profundidade do afundamento causado pela ponteira, a dureza do material é determinada. Duas ponteiras diferentes estão disponíveis pela máquina, embora a precisão (variabilidade) das medições feitas pelas duas ponteiras seja a mesma, suspeita-se que uma ponteira produza diferente leitura em relação a outra. Um experimento poderia ser delineado como a seguir. Um número de amostras de metal (10) poderia ser aleatoriamente selecionado. Metade das amostras poderia ser testada por uma ponteira 1 e a outra metade pela ponteira 2.

Testes de hipóteses Comparação pareada Por ser um projeto completamente aleatório, as médias das durezas das duas amostras podem ser comparadas usando-se um teste t. Pode haver uma desvantagem deste projeto de aleatorização. Suponha que as amostras são obtidas em diferentes têmperas, ou que não seja completamente homogênea entre amostras. Esta falta de homogeneidade entre as amostras, ira contribuir para a variabilidade das medições de dureza aumentando o erro experimental. Para se proteger contra isto um projeto experimental alternativo pode ser feito. Este projeto pode dividir cada amostra em duas partes, submetendo, aleatoriamente, cada parte a um tipo de ponteira.

Testes de hipóteses Comparação pareada Podemos escrever a modelo estatístico que descreve os dados para este experimento como: y ij = μ i + β j + ε ij ሼi = 1,2 j = 1,2,, 10 Onde y ij e a medição de dureza da ponteira i na amostra j, μ i é a média de dureza da amostra i ésima, β j é um efeito da dureza devido à j ésima amostra e ε ij é o erro experimental aleatório com média zero e variância σ i 2. Isto é σ 1 2 é a variância das medições de dureza com a ponteira 1 e σ 2 2 é a variância das medições de dureza com a ponteira 2. Note que teremos se computarmos a diferença pareada das amostras. d j = y 1j y 2j j = 1,2,, 10 A diferença esperada é: μ d = E d j = E y 1j y 2j = E y 1j E y 2j = μ 1 + β j μ 2 β j = μ 1 μ 2 Nota-se que o feito aditivo das amostras β j medições pareadas desta forma. é cancelado quando as

Testes de hipóteses Comparação pareada Assim testar a hipótese: H 0 : μ 1 = μ 2 é equivalente a testar: H 0 : μ d = 0 H 1 : μ d 0 d O teste estatístico para esta hipótese é: t 0 = ത onde d ҧ = 1 σ n S d Τ n n j=1 é a média da diferença das amostras e σ j=1 n (d j d) ҧ 2 n 1 Τ 1 2 S d = = σ n j=1 d 2 j 1 n (σ n j=1 d j ) 2 n 1 É o desvio padrão da diferença. H 0 : μ d = 0 será rejeitada se t 0 > t Τ2;n 1 Este planejamento é usualmente chamado de teste t pareado. Τ 1 2 d j

Testes de hipóteses Comparação pareada Voltando ao nosso exemplo de medições de dureza. n ҧ d = 1 n j=1 S d = σ n j=1 d j = 1 10 d 2 j 1 n (σ n j=1 n 1 = 13 1 10 12 10 1 Supondo =0,05 1 = 0,10 Τ 1 2 d j ) 2 = 1,20 Τ 1 2 = Amos tra Pontei ra 1 Pontei ra 2 Difere nça 1 7 6 1 2 3 3 0 3 3 5-2 4 4 3 1 5 8 8 0 6 3 2 1 7 2 4-2 8 9 9 0 9 5 4 1 10 4 5-1

Testes de hipóteses Comparação pareada Supondo =0,05. Para tomarmos uma decisão, precisamos determinar t 0 e rejeitar H 0 se t 0 > t 0,025 ;9 = 2,262. A função Excel =INV.T(0,975;9) retorna 2,262157163. A função Excel =INV.T(0,025;9) retorna - 2,262157163. Amos tra Pontei ra 1 Pontei ra 2 Difer ença 1 7 6 1 2 3 3 0 3 3 5-2 4 4 3 1 5 8 8 0 6 3 2 1 7 2 4-2 8 9 9 0 9 5 4 1 10 4 5-1

Testes de hipóteses Comparação pareada d ത = 0,10 S d Τ n Τ O valor de t 0 = = 0,26 1,20 10 Como t 0 = 0,26 t 0,025;9 = 2,262, não podemos rejeitar a hipótese H 0 : μ d = 0. Ou seja não evidências que as duas ponteiras produzam diferentes leituras de dureza. Amos tra Pontei ra 1 Pontei ra 2 Difer ença 1 7 6 1 2 3 3 0 3 3 5-2 4 4 3 1 5 8 8 0 6 3 2 1 7 2 4-2 8 9 9 0 9 5 4 1 10 4 5-1

ҧ Testes de hipóteses Comparação pareada Analisando o ensaio notamos que embora 2n=2(10)=20 medições tenham sido feitas, temos somente n-1=9 graus de liberdade. Comparando o desvio padrão de todas as 20 medições obtemos o valor S p = 2,32, comparando com o desvio padrão das diferenças temos S d = 1,20, ou seja uma variabilidade quase 50% menor. Os intervalos de confiança para o ensaio pareado contra a análise independente são: d ± t 0,025;9 S d Τ n = 0,10 ± 2,262 1,20 Τ 10 = 0,10 ± 0,86 തy 1 തy 2 ± t 0,025;18 S p 1 n 1 + 1 n 2 = 4,80 4,90 ± 2,101 2,32 1 10 + 1 10 = 0,10 ± 2,18 O intervalo de confiança bem mais estreito da comparação pareada, ilustra a redução do ruído próprio da blocagem.

Testes de hipóteses Comparação pareada Nem sempre a comparação pareada é a melhor escolha, caso a variação da comparação pareada seja igual ao do ensaio normal, neste caso a melhor opção é o ensaio normal devido a redução de n-1 graus de liberdade do ensaio pareado.

Testes de hipóteses Comparação Exercício resolvido no Minitab: pareada Pelo P Valor = 0,798 não podemos afirmar que as ponteiras sejam diferentes.

Exercício teste de hipóteses Produtos médicos foram submetidos à esterilização com óxido etileno. Após o processo de esterilização os resíduos devem ser removidos, já que são nocivos à saúde humana. São aceitos limites máximos de 25 ppm. Utilizando o worksheet Minitab_worksheet_comp_residuos.MTW que contém os resíduos de óxido etileno e etilenocloridrina. Faça os testes de hipóteses necessários para comprovar se o produto cateter está dentro dos limites de norma de 25 ppm. Teste 1.

Exercício teste de hipóteses Teste 1. Boxplot of Cateter OE (with Ho and 95% t-confidence interval for the mean) Ho _ X 0 100 200 Cateter OE 300 400 500

Exercício teste de hipóteses Teste 2. Boxplot of Cateter OE (with Ho and 95% t-confidence interval for the mean) Ho _ X 0 100 200 Cateter OE 300 400 500

Exercício teste de hipóteses Teste 3. Boxplot of Cateter OE (with Ho and 95% t-confidence interval for the mean) Ho _ X 0 100 200 Cateter OE 300 400 500

Testes de hipóteses Proporções estudos baseados na dist normal O mesmo teste de hipóteses feito com respeito às médias pode ser feito com relação a dados obtidos na forma de proporções. Exercício: Um estudo foi projetado para investigar se um certo detonador usado em explosivos de uma mina de cal, atingem o requisito de 90% de funcionamento. No teste realizado com 200 detonadores, 174 funcionaram adequadamente. Determine com 95% de certeza se o detonador está dentro das especificações de 90% de funcionamento. Resolvendo o exercício pelo Minitab sem maiores explicações da formulação utilizada temos:

Testes de hipóteses Proporções estudos baseados na dist normal Exercício: No teste realizado com 200 detonadores, 174 funcionaram adequadamente, resolução pelo Minitab.

Testes de hipóteses Proporções estudos baseados na dist normal Exercício: No teste realizado com 200 detonadores, 174 funcionaram adequadamente, resolução pelo Minitab. Concluímos que não podemos descartar a hipótese que a proporção de detonadores que funcionam adequadamente seja igual a 90%. Já que o p value deu 0,079, portanto maior do que 0,05, valor de.

Testes de hipóteses Proporções estudos baseados na dist normal Exercício: Um estudo mostra que 16 de 200 bebes recém natos apresentam complicações em um hospital A. Um hospital B tem uma taxa de 14 complicações para 400. Para um nível de confiança de 99%, podemos afirmar que o hospital B é melhor que o hospital A para os recém natos? Hipótese nula p A = p B Hipótese alternativa p A > p B

Testes de hipóteses Proporções estudos baseados na dist normal Exercício: Hipótese nula p A = p B 16/200 = 14/400 Hipótese alternativa p A > p B

Testes de hipóteses Proporções estudos baseados na dist normal Exercício: Hipótese nula p A = p B 16/200 = 14/400 Hipótese alternativa p A > p B Concluindo podemos descartar a hipótese de igualdade das proporções contra a hipótese alternativa que p A > p B. Esta conclusão pode ser tirada já que o p valor = 0,009 é menor que =0,01.

Testes baseados em atributos A maioria das medições industriais usam escalas, micrometros e outros dispositivos que fornecem diretamente a medida física de um produto. Contudo, as vezes as medidas são subjetivas, classificações e avaliações, por exemplo: a) Classificação da fábrica pelo tipo de defeito; b) Classificação da solda como boa ou ruim; c) Ranking da qualidade do vinho na escala de 1 a 10; d) Ranking das bolhas de ar no vidro na escala de 1 a 5; Usa-se Análise de atributos para avaliar a consistência e a correção em rankings subjetivos. - Avaliações da taxa de acerto do avaliador em relação a um padrão; - Avaliação entre os avaliadores; - Consistência das avaliações de um mesmo avaliador.

Testes baseados em atributos Uma das preocupações em testes baseados em atributos é a consistência dos avaliadores. Por exemplo um mesmo avaliador pode avaliar um vinho com alta pontuação e em um segundo momento, avaliar o mesmo vinho com baixa pontuação. Caso não se confie na consistência dos avaliadores, não se pode confiar nos dados que eles reportam. Uma análise de atributos pode ajudar a decidir se os avaliadores são consistentes nas suas pontuações. Análises também podem ser feitas levando-se em conta padrões estabelecidos e as avaliações dos avaliadores.

Testes baseados em atributos Tipos de dados As variáveis devem ser colocadas em colunas de dados numéricos ou texto. Os dados podem ser tipo binário (good/bad), nominal (blue/yellow/red) ou ordinal (ruim/razoável/bom). Deve-se distinguir as respostas de acordo com o avaliador e tentativa. Para se criar uma planilha de atributos no Minitab, use o Create Attribute Agreement Analysis Worksheet.

Testes baseados em atributos Exercício Dois avaliadores avaliaram três substâncias, cada uma duas vezes. Tem-se um padrão de referência, para comparar os resultados. Os dados devem ser colocados no formato do Minitab.

Testes baseados em atributos Exercício Dois avaliadores avaliaram três substâncias, cada uma duas vezes. Tem-se um padrão de referência, para comparar os resultados.

Testes baseados em atributos Exercício Caso os avaliadores tenham duas ou mais avaliações do mesmo item, pode-se avaliar a consistência do avaliador. Deve-se observar que aqui não se faz uma comparação com o padrão, assim mesmo que as avaliações sejam consistentes, elas não são necessariamente corretas. Analisando a consistência dos resultados dos dois avaliadores. No exercício houve coincidência de duas das três avaliações feitas, para os dois avaliadores, Jim e Vanessa, ou seja 66,67% IC 95 % (9,43; 99,16).

Testes baseados em atributos Exercício Utilizando o coeficiente kappa para comparar os resultados dos avaliadores, tem-se que kappa=1 caso haja perfeita concordância dos resultados, caso kappa = 0 a concordância é aleatória. Valores negativos é uma concordância menor do que a aleatória. Valores de kappa menores do que 0,7, indicam que o sistema de mensuração precisa melhorias. Valores de kappa maiores que 0,9 são considerados excelentes.

Testes baseados em atributos Exercício Tem-se a comparação estatística conforme a estatística kappa para cada resposta e geral, assim pode-se responder à questão: Os avaliadores tem dificuldades com uma resposta em particular? Um teste de hipóteses é feito com as hipóteses: H 0 : A concordância do avaliador é igual a aleatória. H 1 : A concordância do avaliador não é igual a aleatória.

Testes baseados em atributos Exercício Analisando os resultados abaixo pode-se observar que os avaliadores Jim e Vanessa não apresentam resultados consistentes. A média geral dos dois para o p valor é de 0,0603 valor este que não permite descartar a hipótese de aleatoriedade dos resultados obtidos.

Testes baseados em atributos Exercício Coeficiente de concordância de Kendall expressa o grau de associação entre as várias avaliações feitas por um avaliador. Ele usa informações sobre as classificações relativas e é sensível à gravidade do erro de classificação. O coeficiente de concordância de Kendall é possível de ser obtido quando o avaliador faz duas ou mais avaliações da mesma unidade. Com 3 ou mais níveis o coeficiente Kendall pode ser calculado. O coeficiente de concordância de Kendall pode variar de 0 a 1, quanto maior o coeficiente de Kendal mais forte é a associação. O p valor testa as hipóteses: H 0 : Não há associação entre os vários rankings de um mesmo avaliador; H 1 : Os rankings de um mesmo avaliador estão associados entre si.

Testes baseados em atributos Exercício Para o exemplo observa-se que os rankings de um mesmo avaliador estão associados entre si, já que os p valores deram valores acima de, descartando a hipótese H 0. Observa-se que embora as classificações dos avaliadores possam ser consistentes, elas podem não ser corretas, já que não faz-se um comparação com o padrão estabelecido.

Testes baseados em atributos Exercício Caso tenha-se um padrão pode-se avaliar a assertividade de cada avaliador. No caso do avaliador Jim ele acertou 1 de 3 avaliações feitos, ou seja 33,33% - IC 95% (0,84; 90,57). No caso do avaliador Vanessa esta acertou 2 de 3 avaliações, ou seja 66,67% IC 95% (9,43; 99,16).

Testes baseados em atributos Exercício Caso tenha-se um padrão pode-se avaliar a assertividade de cada avaliador. No caso do avaliador Jim ele acertou 1 de 3 avaliações feitos, ou seja 33,33% - IC 95% (0,84; 90,57). No caso do avaliador Vanessa esta acertou 2 de 3 avaliações, ou seja 66,67% IC 95% (9,43; 99,16). Assessment Agreement Within Appraisers Percent 100 80 60 40 20 0 Jim Vanessa Appraiser 95,0% C I Percent Percent 100 80 60 40 20 Date of study: Reported by: Name of product: Misc: Appraiser vs Standard 0 Jim Appraiser Vanessa 95,0% C I Percent

Testes baseados em atributos Exercício O primeiro gráfico mostra o porcentual de concordância das avaliações de um mesmo avaliador. O segundo o porcentual de concordância das avaliações dos avaliadores com o padrão. O círculo azul indica o porcentual de acerto atual; A linha vermelha mostra o intervalo de confiança do acerto; E os Xs indicam os limites inferior e superior do intervalo de confiança. Assessment Agreement Within Appraisers Percent 100 80 60 40 20 0 Jim Vanessa Appraiser 95,0% C I Percent Percent 100 80 60 40 20 Date of study: Reported by: Name of product: Misc: Appraiser vs Standard 0 Jim Appraiser Vanessa 95,0% C I Percent

Testes baseados em atributos Exercício Utilizando a estatística de Fleiss Kappa para avaliar a assertividade dos avaliadores, teremos kappa =1 caso haja uma perfeita concordância, se kappa =0 a concordância é a mesma esperada para aleatoriedade. Kappa menores que 0,7 indicam que o sistema de medição precisa de melhorias e Kappa acima de 0,9 indicam que o sistema é excelente. O p valor testa as hipóteses: H 0 : A concordância entre os avaliadores e o padrão é aleatória; H 1 : A concordância entre os avaliadores e o padrão não é aleatória.

Testes baseados em atributos Exercício Para o exemplo em estudo observa-se que para a resposta 4 o avaliador Jim apresenta perfeita concordância com o padrão Kappa = 1 e p valor 0,0072. No entanto para a resposta 10 o avaliador Jim está abaixo da aleatoriedade com p valor 0,6879.

Testes baseados em atributos Exercício O coeficiente de correlação médio de Kendall é um coeficiente de correlação entre todas as avaliações de um mesmo avaliador. Coeficiente de concordância de Kendall expressa o grau de associação entre as várias avaliações feitas por um avaliador. Ele usa informações sobre as classificações relativas e é sensível à gravidade do erro de classificação. O coeficiente de Kendall pode variar de -1 até 1. Um valor positivo indica uma associação positiva e um valor negativo indica uma associação negativa. Quanto maior o coeficiente maior a associação. O p valor testa as hipóteses: H 0 : A concordância dos rankings são devido a aleatoriedade; H 1 : A concordância dos rankings não são devido a aleatoriedade.

Testes baseados em atributos Exercício Observa-se para o exemplo que com os p valor são altos (maior que ) não podemos descartar a hipótese da aleatoriedade H 0. O p valor testa as hipóteses: H 0 : A concordância dos rankings são devido a aleatoriedade; H 1 : A concordância dos rankings não são devido a aleatoriedade.

Testes baseados em atributos Exercício Observa-se para o exemplo que com os p valor são altos (maior que ) não podemos descartar a hipótese da aleatoriedade H 0. O p valor testa as hipóteses: H 0 : A concordância dos rankings são devido a aleatoriedade; H 1 : A concordância dos rankings não são devido a aleatoriedade.

Testes baseados em atributos Exercício No exercício pode-se determinar o quanto cada avaliador concorda com o outro. Observa-se um índice de 33,33% de concordância entre os avaliadores IC 95% (0,84; 90,57).

Testes baseados em atributos Exercício No exercício pode-se determinar a concordância entre os avaliadores e a resposta. No exemplo observa-se uma boa concordância entre os avaliadores somente para a resposta 4. O p valor testa as hipóteses: H 0 : A concordância entre os avaliadores e devido a aleatoriedade; H 1 : A concordância entre os avaliadores não é devido a aleatoriedade.

Testes baseados em atributos Exercício No exercício pode-se avaliar a concordância geral entre os avaliadores e o padrão estabelecido. O p valor testa as hipóteses: H 0 : A concordância entre os avaliadores e o padrão é devido a aleatoriedade; H 1 : A concordância entre os avaliadores e o padrão não é devido a aleatoriedade;

Testes baseados em atributos Exercício No exercício pode-se avaliar a concordância geral entre os avaliadores e o padrão estabelecido. O p valor testa as hipóteses: H 0 : Não há associação entre os rankings dos avaliadores e o padrão estabelecido; H 1 : Há associação entre os rankings dos avaliadores e o padrão estabelecido.