Comparação entre duas populações

Documentos relacionados
Estimação da média populacional

Contabilometria. Prof.: Patricia Maria Bortolon, D. Sc.

Estimação da média populacional

Objetivo. Estimar a média de uma variável aleatória X, que representa uma característica de interesse de uma população, a partir de uma amostra.

Teorema do limite central e es/mação da proporção populacional p

Teste de Hipóteses Paramétricos

Cap. 4 - Estimação por Intervalo

Introdução. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ...

Testes de Hipóteses sobre uma Proporção Populacional

6.1 Estimativa de uma média populacional: grandes amostras. Definição: Um estimador é uma característica amostral (como a média amostral

Estimadores de Momentos

Distribuições Amostrais

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Teste de Hipótese

ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL p

MAE Introdução à Probabilidade e Estatística II Resolução Lista 2

Instruções gerais sobre a Prova:

Intervalos Estatísticos para uma única Amostra - parte II

Teoria da Estimação 1

1 Distribuições Amostrais

e, respectivamente. Os valores tabelados para a distribuição t-student dependem do número de graus de liberdade ( n 1 e

Intervalos de Confiança

Distribuições de Estatísticas Amostrais e Teorema Central do Limite

Estimar uma proporção p (desconhecida) de elementos em uma população, apresentando certa característica de interesse, a partir da informação

1 Estimação de Parâmetros

Objetivo. Estimar a média µ de uma variável aleatória X, que representa uma característica de interesse de uma população, a partir de uma amostra.

7. INTERVALOS DE CONFIANÇA

Obtemos, então, uma amostra aleatória de tamanho n de X, que representamos por X 1, X 2,..., X n.

ESTIMAÇÃO DE PARÂMETROS

ESTATÍSTICA NÃO-PARAMÉTRICA

n ) uma amostra aleatória da variável aleatória X.

INTERVALOS DE CONFIANÇA

MAE0229 Introdução à Probabilidade e à Estatística II

ESTIMAÇÃO PARA A MÉDIA

MAE 116 Estimação para a média FEA - 2º Semestre de 2018

Nosso objetivo agora é estudar a média de uma variável quantitativa X. Denotamos a média desconhecida como E(X)=µ

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

CAPÍTULO 6 - ESTIMAÇÃO E TESTES DE HIPÓTESES

Faculdade de Economia Universidade Nova de Lisboa ESTATÍSTICA. Exame Final 2ª Época 26 de Junho de Grupo I (3 valores)

A Inferência Estatística é um conjunto de técnicas que objetiva estudar a população através de evidências fornecidas por uma amostra.

Estatística. Estatística II - Administração. Prof. Dr. Marcelo Tavares. Distribuições de amostragem. Estatística Descritiva X Estatística Inferencial

Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2004

Lista IC, tamanho de amostra e TH

INFERÊNCIA. Fazer inferência (ou inferir) = tirar conclusões

Virgílio A. F. Almeida DCC-UFMG 1/2005

Distribuições Amostrais

Objetivos. Os testes de hipóteses ser: Paramétricos e Não Paramétricos. Testes não-paramétricos. Testes paramétricos

d) A partir do item c) encontre um estimador não viciado para σ 2.

Distribuições Amostrais

Avaliação de Desempenho de Sistemas Discretos

ESTIMAÇÃO POR INTERVALO (INTERVALOS DE CONFIANÇA)

Caderno de Exercício 2

ESTIMAÇÃO DE PARÂMETROS

Sumário. 2 Índice Remissivo 17

Estimativa de Parâmetros

Mestrado Integrado em Engenharia Civil. Disciplina: TRANSPORTES. Sessão Prática 4: Amostragem

1. Dados: Deve compreender-se a natureza dos dados que formam a base dos procedimentos

Uma amostra aleatória simples de n elementos é selecionada a partir da população. Calcula-se o valor da média a partir da amostra

A finalidade dos testes de hipóteses paramétrico é avaliar afirmações sobre os valores dos parâmetros populacionais.

Estimação de Parâmetros. 1. Introdução

MAE Introdução à Probabilidade e Estatística II Resolução Lista 3

Stela Adami Vayego DEST/UFPR

n C) O EMV é igual a i 1

Distribuição Amostral da Média: Exemplos

Probabilidades e Estatística

TRANSPORTES. Sessão Prática 4 Amostragem de escalares

Objetivos. Testes não-paramétricos

Universidade Federal de Mato Grosso Probabilidade e Estatística - Curso: Engenharia Civil Introdução à Inferência Estatística - Prof a Eveliny

NOTAS DE AULA: DISTRIBUIÇÃO AMOSTRAL E INTERVALOS DE CONFIANÇA

FACULDADE DE ECONOMIA DO PORTO. Licenciatura em Economia E C O N O M E T R I A I I PARTE

Hipótese Estatística. Tipos de Hipóteses

MAE Introdução à Probabilidade e Estatística II Resolução Lista 1

Probabilidades e Estatística TODOS OS CURSOS

MAE116 Noções de Estatística

Unidade IX Estimação

Probabilidades e Estatística

Testes de Comparação Múltipla

CONCEITOS BÁSICOS E PRINCÍPIOS DE ESTATÍSTICA

Stela Adami Vayego Estatística II CE003/DEST/UFPR

Amostras Aleatórias e Distribuições Amostrais. Probabilidade e Estatística: afinal, qual é a diferença?

PROVA DE ESTATÍSTICA SELEÇÃO MESTRADO/UFMG 2005

O teste de McNemar. A tabela 2x2. Depois - Antes

Em aplicações práticas é comum que o interesse seja comparar as médias de duas diferentes populações (ambas as médias são desconhecidas).

Probabilidades e Estatística TODOS OS CURSOS

Estatística Aplicada I DISTRIBUIÇÃO AMOSTRAL MÉDIA ERRO AMOSTRAL

CAPÍTULO 6 ESTIMATIVA DE PARÂMETROS PPGEP. Introdução. Introdução. Estimativa de Parâmetros UFRGS

Probabilidades e Estatística

Como a dimensão da amostra é , o número de inquiridos correspondente é

DETERMINANDO A SIGNIFICÂNCIA ESTATÍSTICA PARA AS DIFERENÇAS ENTRE MÉDIAS

Centro de Ciências e Tecnlogia Agroalimentar - Campus Pombal Disciplina: Estatística Básica Aula 10 Professor: Carlos Sérgio

Estatística II Licenciatura em Gestão TESTE I

Capítulo 5- Introdução à Inferência estatística. (Versão: para o manual a partir de 2016/17)

Capítulo 5- Introdução à Inferência estatística.

Lista de Exercícios #6 Assunto: Propriedade dos Estimadores e Métodos de Estimação

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

Probabilidades e Estatística

Testes de Hipóteses. Júlio Osório. Os dois campos da Análise Estatística. Métodos Estatísticos. Inferência Estatística. Estatística Descritiva

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Estimação pontual e intervalar

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

INTERVALO DE CONFIANÇA

Transcrição:

Comparação etre duas populações

AMOSTRAS INDEPENDENTES

Comparação etre duas médias 3

Itrodução Em aplicações práticas é comum que o iteresse seja comparar as médias de duas diferetes populações (ambas as médias são descohecidas. Na comparação de duas populações, dispomos de duas amostras, em que são possíveis as seguites situações: amostras depedetes idepedetes variâcias pop. cohecidas variâcias pop. iguais descohecidas diferetes Discutiremos apeas os testes cohecidos como paramétricos, que assumem que as variáveis se comportam segudo um modelo Normal. 4

Exemplo : Um pesquisador deseja comparar o salário de profissioais da saúde, de ambos os sexos. Para isso, selecioou uma amostra aleatória de 50 profissioais, sedo do sexo femiio e 8 do sexo masculio. Sabe-se, de estudos ateriores, que o salário de profissioais da saúde segue uma distribuição ormal. Masculio Femiio 4708 44 400 3768 4603 3868 4 3939 407 45 4344 4459 4534 465 4446 387 440 4377 3938 497 456 4000 454 4306 4584 344 3400 3935 4594 47 464 3748 436 403 3850 3838 487 400 3676 406 4008 4464 3604 474 4083 4706 3788 468 4009 479 5

Exemplo As duas populações, de ode as amostras são proveietes, são idepedetes e ormalmete distribuídas; - a população dos salários de profissioais da saúde do sexo femiio tem média e variâcia ~ N(, - a população dos salários de profissioais da saúde do sexo masculio tem média e variâcia ~ N(, Iteresse: Comparar as médias das duas populações. 6

Hipóteses estatísticas: H 0 : = H : ou > ou < ou, equivaletemete, usado difereças H 0 : - = 0 H : - 0 ou - > 0 ou - < 0 da pop. ormal com média e desvio padrão extrai-se uma a.a. de tamaho x : média da amostra de s : desvio padrão da amostra de da pop. ormal com média e desvio padrão extrai-se uma a.a. de tamaho m y : média da amostra de s : desvio padrão daamostra de Obs.: ote que os úmeros de observações as amostras, e m, ão precisam ser iguais. 7

grupo grupo população amostra média desvio padrão média y desvio padrão s s tamaho m x Situações possíveis com respeito às variâcias e :. cohecidas: teste Z. descohecidas: - iguais: teste-t de duas amostras - diferetes: teste-t modificado Obs.: O teste de comparação de variâcias pode ser utilizado como um procedimeto prelimiar em teste de comparação de médias, auxiliado a escolha da técica adequada. 8

CASO : variâcias cohecidas Cosidere o Exemplo, dos salários de profissioais da saúde. Queremos verificar se o salário das mulheres é meor do que o dos homes. ( Hipóteses estatísticas: H 0 : = ou, equivaletemete, H 0 : - = 0 H : < usado difereças H : - < 0 ( Estatística de teste Estimador de - : - Distribuição amostral do estimador: Como e são idepedetes com distribuição ormal, com médias e e desvio padrão e, respectivamete, etão ~ N μ μ, σ σ m, 9

( Estatística de teste Se as variâcias são cohecidas, a estatística de teste é dada por Z ( σ σ m (3 Nível de sigificâcia: = 5% (4 Calcular medidas ecessárias: Sob H 0, Z ~ N(0, Tamaho da amostra Média Masculio ( 8 430,87 Femiio ( 40,68 Iformação dada: = 80 e = 300 0

(4 Calcular medidas ecessárias: z obs ( 40,68 430,87 8,9 80 300 8,33 8 3,45 (5A Região crítica (teste uilateral iferior A região crítica deve ter a forma: RC = { Z z tab } z tab =? Da tabela da N(0,, com = 5%, z tab = -,64 RC = { Z -,64} (6A Decidir e Cocluir z obs = -3,45 RC rejeita-se H 0 (5B Nível descritivo P P = P(Z -3,45 = 0,0003. (6B Decidir e Cocluir P < rejeita-se H 0

A média dos salários das mulheres é meor do que a dos homes. Quato meor? Itervalo de cofiaça para a difereça - : m z m z P z m z P z Z z P tab tab tab tab tab tab ( ( ( No exemplo: IC( - ;0% = (-8,9-,648,33; -8,9+,648,33; = (-46,;-46,7

CASO : variâcias descohecidas, iguais Exemplo : salário de profissioais da saúde. Queremos verificar se o salário das mulheres é meor do que o dos homes. Supoha agora: NÃO CONHECEMOS AS VARIÂNCIAS. Temos apeas a iformação de que SÃO IGUAIS ( x = =, mas ão sabemos o valor. ( Hipóteses estatísticas: H 0 : = ou, equivaletemete, H : < usado difereças H 0 : - = 0 H : - < 0 ( Estatística de teste Temos que: ~ N μ μ, σ σ m ~ N μ μ, σ m, 3

Assim, Z ( ( μ σ μ ~ m N ( 0, Não cohecemos, precisamos estimar por: s p ( s ( m s m. - A estimativa s p combia iformação de ambas amostras para se produzir uma estimativa mais cofiável de ; - Na verdade, s p é média poderada das duas variâcias amostrais s e s, ode cada variâcia é poderada pelos seus graus de liberdade associados; - Se é igual a m, s p é a média aritmética simples; caso cotrário, maior peso é dado à variâcia da maior amostra. 4

( Estatística de teste T ( S p ( m Sob H 0, T ~ t (+m-. (3 Nível de sigificâcia: = 5% (4 Calcular medidas ecessárias: Tamaho da amostra Média Desvio padrão Masculio 8 430,87 335,74 Femiio 40,68 30,08 s p= [(-30,08 +(8-335,74 ] / (+8- = 03.065 s p = 3,037 5

T obs ( 40,68 3,037 430,87 ( 8-3,074, (5A Região crítica A região crítica deve ter a forma: RC = { T t tab } t tab =? Da tabela da t(48 g.l., com = 5%, t tab = -,68 (6A Decidir e Cocluir RC = {T -,68} T obs = -3,074 RC rejeita-se H 0 (5B Nível descritivo P P= P(T 48-3,074 = 0,007 (6B Decidir e Cocluir P < rejeita-se H 0 6

Itervalo de cofiaça para a difereça - : em que t tab é obtido da tabela t com (+m- graus de liberdade. No exemplo: IC( - ; 0% = = (-8,9-,683,0370,85; -8,9+,683,0370,85 = (-434,85;-7,53. 7

CASO 3: variâcias descohecidas, diferetes Exemplo : salário de profissioais da saúde. Queremos verificar se o salário das mulheres é meor do que o dos homes. Supoha agora: NÃO CONHECEMOS AS VARIÂNCIAS E SABEMOS QUE SÃO DIFERENTES ( x. ( Hipóteses estatísticas: H 0 : = ou, equivaletemete, H 0 : - = 0 H : < usado difereças H : - < 0 ( Estatística de teste Temos que: ~ N μ μ, σ σ m 8

Assim, ( 0, ( ( N m σ σ μ μ Z ~ Não cohecemos e estimamos por s x e s. Fialmete, a estatística de teste, sob H 0, é. ( ( m S S T. / ] ( ( ( [( ] ( [( m m s s m s s / / / / / Sob H 0, T ~ t(, em que é o úmero de graus de liberdade dado por 9

(3 Nível de sigificâcia: = 5% (4 Calcular medidas ecessárias: Tamaho da amostra Média Desvio padrão Masculio 8 430,87 335,74 Femiio 40,68 30,08 40, 68 430, 87 t obs -3, 3008, 335, 74 8 [(30,08 [(30,08 / / (335,74 /( (335,74 /8] /8 /(8 ] 47,. Assim, usamos 47. 0

(5A Região crítica A região crítica deve ter a forma: RC = {T t tab } t tab =? Da tabela da t(47 g.l., com = 5%, t tab = -,68 RC = { T -,68} (6A Decidir e Cocluir t obs = -3, RC rejeita-se H 0 (5B Nível descritivo P P = P(T 47-3, = 0,005 (6B Decidir e Cocluir P < rejeita-se H 0

Itervalo de cofiaça para a difereça - : em que t tab é obtido da tabela t com graus de liberdade. No exemplo: IC( - ;0% = (-8,9-,6890,6; -8,9+,6890,6 = (-43,8; -9,56.

Comparação etre duas variâcias 3

Um teste de hipóteses importate cosiste em verificar se duas populações têm a mesma variâcia. Cosidere uma amostra,..., de uma população com distribuição N(, e uma amostra,..., m de uma população com distribuição N(,. Supoha que as duas amostras sejam idepedetes. ( Hipóteses estatísticas: H 0 : = H : ou > ou < ( Estatística de teste Se S e S são as variâcias amostrais respectivas, etão a estatística do teste é F S S Qual é a distribuição de probabilidade de F? 4

Resultado: Sejam ~ N(, e ~ N(,, idepedetes. Para amostras aleatórias,,...,, de e,,..., m, de, temos U S σ ~ ( V m S σ ~ ( m Se =, etão F S S U V m ~ F( ; m Se a hipótese ula H 0 é verdadeira ( =, a estatística F possui distribuição de probabilidade F de Sedecor com - graus de liberdade o umerador e m- graus de 5 liberdade o deomiador.

(3 Nível de sigificâcia: (4 Calcular medidas ecessárias: Obter S e S, as variâcias amostrais, e calcular F. (5A Região crítica Se H :, Se H : >, Se H : <, RC = {F: F < f ou F > f } RC = {F: F > f } RC = {F: F < f } Obteção dos valores críticos: Teste bilateral tabela Para fixado, ecotre a tabela F(-; m- um valor f tal que P(F (-; m- > f = / e Para fixado, ecotre a tabela F(m-; - (observe que os g.l. foram trocados um valor g tal que P(F (m-; - > g = / e calculamos f =/g. 6

(5B Nível Descritivo Se H :, Se H : >, Se H : <, P = P(F(-; m- > F obs ou P = P(F(-; m- < F obs P = P(F(-; m- > F obs P = P(F(-; m- < F obs (6 Decidir e cocluir (A Se F obs RC, rejeita-se H 0 Se F obs RC, ão se rejeita H 0 (B Se P rejeita-se H 0 Se P > ão se rejeita H 0 7

8 Itervalo de cofiaça para o quociete / com coeficiete de cofiaça ; ( S S f S S f P f S S f P f m V U f P f m F f P

Cosidere o Exemplo, dos salários de profissioais da saúde. Queremos verificar se a variabilidade do salário das mulheres é igual à dos homes. ( Hipóteses estatísticas: H 0 : M F H : M F ( Estatística de teste Se S M e S F são as variâcias amostrais respectivas, etão a estatística do teste é SF F ~ F(; 7 S (3 Nível de sigificâcia = 5%. M (4 Calcular as medidas ecessárias 30,08 S M = 335,74 e S F = 30,08 F obs 0, 804 335,74 9

(5A Região crítica RC = {F : F < f ou F > f }, sedo f e f obtidos por f : ecotre a tabela F(; 7 o valor f tal que P(F(;7 > f = 0,05 f =,5 (aprox. e f : ecotre a tabela F(7; um valor g tal que P(F (7; > g = 0,05 e calculamos f =/g =/,34 = 0,47 RC = {F : F < 0,47 ou F >,5 }, (6 Decidir e cocluir F obs = 0,804 RC ão se rejeita H 0 (5B Nível descritivo P = P(F(; 7 < 0,804 = (- 0,69 = 0,6 > ão se rejeita H 0 30 Dist F

Itervalo de cofiaça de 95% para o quociete / : O valor IC, como esperado. 3

Comparação etre duas proporções 3

Como vimos para a média, muito frequetemete, podemos estar iteressados a comparação de duas proporções de duas populações idepedetes. ( Hipóteses estatísticas: H 0 : p = p H : p p ou p > p ou p < p ( Estatística de teste extraímos uma uma a.a. de tamaho de uma população com proporção p ; se observamos x sucessos a amostra, etão pˆ. (estimador potual de p Aalogamete, selecioamos uma amostra de tamaho da população com proporção p e se observamos x sucessos, etão pˆ (estimador potual de p. 33

p p p ˆ ˆ ˆ A quatidade é uma média poderada das duas proporções das amostras, e. pˆ p p ˆ ˆ. ˆ - ˆ p p ˆ ˆ ˆ ˆ p p p p p p Var p p p p E ( ( ( ( Se a hipótese ula é verdadeira, temos que p = p = p, os dados de ambas as amostras podem ser combiados para estimar esse parâmetro comum p, por 34

Sob a hipótese ula H 0, o estimador do erro padrão da difereça pˆ - ˆ é dado por: p pˆ (- pˆ ( Estatística do teste: Z pˆ ( pˆ ( pˆ pˆ ( Se e são suficietemete grades, essa estatística, sob H 0, tem uma distribuição ormal com média 0 e desvio padrão. 35

(3 Nível de sigificâcia: (4 Calcular medidas ecessárias (5A Região crítica (5B Nível Descritivo (6 Decidir e cocluir (A Se Z obs RC, rejeita-se H 0 Se Z obs RC, ão se rejeita H 0 (B Se P rejeita-se H 0 Se P > ão se rejeita H 0 36

Exemplo : Para ivestigar a lealdade de cosumidores a um determiado produto, sorteou-se uma amostra de 00 homes e 00 mulheres. Foram classificados como tedo alto grau de fidelidade 00 homes e 0 mulheres. Os dados trazem evidêcias de difereça de grau de fidelidade etre os gêeros? Em caso afirmativo, costrua um itervalo de cofiaça para a difereça. Sejam: p H : proporção de homes com alto grau de fidelidade p M : proporção de mulheres com alto grau de fidelidade 37

H 0 : p H = p M H : p H p M, ( Hipóteses estatísticas: ( Estatística do teste (3 Fixar o ível de sigificâcia do teste : = 5% ( ( ( M H M H p p p p Z ˆ ˆ ˆ ˆ sedo M H M M H H p p p ˆ ˆ ˆ 38

(4 Calcular as medidas ecessárias H = 00 00 com alto grau de fidelidade pˆ H 00 00 0,5 M = 00 0 com alto grau de fidelidade 0 pˆ M 0,6 00 ˆp 000,5 000,6 00 00 0,55 Valor da estatística do teste: z obs ( 0, 5 0,6 0,55 ( 0,55 00 00,0 39

(5A Região crítica (teste bilateral = 5% RC = {Z : Z < -,96 ou Z >,96 } (5B Nível Descritivo P = P(Z -,0 = 0,044 (6 Decidir e cocluir (A z obs = -,0 RC, rejeita-se H 0 (B Se P rejeita-se H 0 40

pˆ - ˆ forece uma estimativa por poto para a H p M verdadeira difereça p H p M das proporções populacioais. Um itervalo de cofiaça de 95% para a difereça p H - p M, usado a aproximação ormal, é pˆ H - pˆ M,96 pˆ H ( H pˆ H pˆ M ( M pˆ M Note que o erro padrão da difereça das proporções amostrais ão é o mesmo que aquele usado o teste; o teste de hipóteses, o erro padrão empregado foi baseado a suposição de que a hipótese ula era verdadeira (p H =p M =p; essa suposição ão é ecessária o cálculo de um itervalo de cofiaça. 4

No exemplo, como pˆ H 0,5e pˆ M 0,6, um itervalo de cofiaça aproximado de 95% para p H p M é 0,5( 0,5 (0,5 0,6,96 00 ( 0, 0,097; 0, 0,097 0,6( 0,6 00 ( 0,97; 0,03 Note que, como esperado, o itervalo ão cotém o valor zero. 4

AMOSTRAS DEPENDENTES (teste t-pareado 43

característica das amostras depedetes (pareadas: para cada uidade amostral realizamos duas medições. As medidas são tomadas em um úico idivíduo em dois potos distitos o tempo. Em geral, observações pareadas correspodem a medidas tomadas ates e depois de uma dada iterveção -- cada idivíduo é examiado ates que um certo tratameto seja aplicado e ovamete depois que o tratameto foi completado. Outro tipo de emparelhameto: o pesquisador casa os idivíduos de um grupo com aqueles de um segudo grupo, de modo que os membros de um par sejam parecidos (em relação a características, tais como, a idade e o gêero. 44

Plaejameto empregado a tetativa de se cotrolar fotes de variação que poderiam iflueciar os resultados da comparação. Se as medidas são feitas o mesmo sujeito uma certa variabilidade biológica é elimiada -- ão temos que os preocupar com o fato de um sujeito ser mais velho do que outro ou se um é homem e o outro é mulher. A iteção do emparelhameto é, portato, fazer uma comparação mais precisa. 45

Exemplo 3: Uma empresa deseja estudar o efeito de uma pausa de dez miutos para um cafeziho sobre a produtividade de seus trabalhadores. Para isso, sorteou seis operários, e cotou o úmero de peças produzidas durate uma semaa sem itervalo e uma semaa com itervalo. Os resultados sugerem se há ou ão melhora a produtividade? Caso haja melhora, qual deve ser o acréscimo médio de produção para todos os trabalhadores da fábrica? Operário 3 4 5 6 Sem itervalo 3 35 9 33 43 3 Com itervalo 8 38 9 37 4 30 i : úmero de peças produzidas pelo operário i a semaa sem itervalo i : úmero de peças produzidas pelo operário i a semaa com itervalo 46

Efeito do emparelhameto: elimiar quaisquer distorções que poderiam ser itroduzidas ao se comparar idivíduos que diferem com relação a outras variáveis, como idade, sexo, peso, etc. Supoha que os dois grupos de observações possam ser dispostos como a seguir: Amostra Amostra d i = y i - x i x y x y...... d = y - x d = y - x... x y d = y - x Variável de iteresse: D =, e uma amostra de D é d, d,...d (as difereças amostrais. 47

O efeito produzido para o i-ésimo idivíduo pode ser represetado pela variável difereça D i = i - i ( com sem Supodo D i N( D, D, para i =,...,, uma situação geral, queremos testar as hipóteses: H 0 : D = 0 H : D 0 ou D < 0 ou D > 0 A pausa aumeta a produtividade média a pausa para o café ão produz efeito a pausa para o café produz algum efeito 48

O parâmetro D é estimado pela média amostral das difereças: Como ão temos iformação sobre a variâcia das difereças, estimamos seu valor por S D, dado por: i D i D ( D D S i i D Estatística do teste: S D T D Sob H 0, a estaística T tem distribuição t-studet com - graus de liberdade. 49

Cometários A média da amostra forece uma estimativa por poto para a verdadeira difereça das médias das populações D -. Em geral supomos que e têm distribuição ormal e, cosequetemete, podemos cosiderar que a distribuição das difereças tem distribuição ormal. Obs.: o caso geral, é ecessário uma verificação da suposição de ormalidade da difereça - pela aálise gráfica e/ou testes de hipóteses. Se a ormalidade ão é válida, esse teste t ão se aplica e técicas ão paramétricas de aálise são ecessárias. 50

Voltado ao exemplo, gostaríamos de saber se há alguma evidêcia estatística de que a pausa para o café aumeta a produtividade. ( Hipóteses: H 0 : D = 0 H : D > 0 ( com - sem que equivale a H 0 : = H : > D ( Estatística de teste: T ~ t (, sob H 0. S D (3 Nível de sigificâcia: = 5%. 5

(4 Calcular medidas ecessárias Amostra de pares d i = y i - x i : 5, 3, 0, 4, -, - s D t obs d 6 i 6 6 d 9 6 i i, ( d i d 6-5,, 88 (5A Região Crítica 6 5,88, 76 (média amostral das difereças (desvio padrão das difereças Sob a hipótese ula H 0, T tem distribuição t-studet com 6 - = 5 graus de liberdade. = 5% RC = {T : T 5,05 } 5

(5B Nível descritivo: P(T,76 0,5 (valor exato: 0,9 (6 Decidir e cocluir (A t obs =,76 RC ão se rejeita H 0 (B P > ão se rejeita H 0 ão há evidêcia experimetal para cocluirmos que a pausa para um cafeziho melhora a produtividade média.. 53

Se a hipótese ula H 0 é rejeitada: Iteresse: Ecotrar um itervalo de cofiaça para D IC( μ D sd ; % ( d t- ; d t - s D IC( μ D,88 ; 90% (,5,05 ;,5,05 6 (,5,37 ;,5,37,88 6 ( - 0,87; 3,87, que, este caso, cotem o " zero", como esperado. 54

55 volta

56 volta

Tabela da distribuição t-studet tabela

Parte iteira e primeira decimal de z Distribuição Normal : Valores de P( Z < z = A(z Seguda decimal de z 0 3 4 5 6 7 8 9 0.0 0.5000 0.5040 0.5080 0.50 0.560 0.599 0.539 0.579 0.539 0.5359 0. 0.5398 0.5438 0.5478 0.557 0.5557 0.5596 0.5636 0.5675 0.574 0.5753 0. 0.5793 0.583 0.587 0.590 0.5948 0.5987 0.606 0.6064 0.603 0.64 0.3 0.679 0.67 0.655 0.693 0.633 0.6368 0.6406 0.6443 0.6480 0.657 0.4 0.6554 0.659 0.668 0.6664 0.6700 0.6736 0.677 0.6808 0.6844 0.6879 0.5 0.695 0.6950 0.6985 0.709 0.7054 0.7088 0.73 0.757 0.790 0.74 0.6 0.757 0.79 0.734 0.7357 0.7389 0.74 0.7454 0.7486 0.757 0.7549 0.7 0.7580 0.76 0.764 0.7673 0.7704 0.7734 0.7764 0.7794 0.783 0.785 0.8 0.788 0.790 0.7939 0.7967 0.7995 0.803 0.805 0.8078 0.806 0.833 0.9 0.859 0.886 0.8 0.838 0.864 0.889 0.835 0.8340 0.8365 0.8389.0 0.843 0.8438 0.846 0.8485 0.8508 0.853 0.8554 0.8577 0.8599 0.86. 0.8643 0.8665 0.8686 0.8708 0.879 0.8749 0.8770 0.8790 0.880 0.8830. 0.8849 0.8869 0.8888 0.8907 0.895 0.8944 0.896 0.8980 0.8997 0.905.3 0.903 0.9049 0.9066 0.908 0.9099 0.95 0.93 0.947 0.96 0.977.4 0.99 0.907 0.9 0.936 0.95 0.965 0.979 0.99 0.9306 0.939.5 0.933 0.9345 0.9357 0.9370 0.938 0.9394 0.9406 0.948 0.949 0.944.6 0.945 0.9463 0.9474 0.9484 0.9495 0.9505 0.955 0.955 0.9535 0.9545.7 0.9554 0.9564 0.9573 0.958 0.959 0.9599 0.9608 0.966 0.965 0.9633.8 0.964 0.9649 0.9656 0.9664 0.967 0.9678 0.9686 0.9693 0.9699 0.9706.9 0.973 0.979 0.976 0.973 0.9738 0.9744 0.9750 0.9756 0.976 0.9767.0 0.977 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.98 0.987. 0.98 0.986 0.9830 0.9834 0.9838 0.984 0.9846 0.9850 0.9854 0.9857. 0.986 0.9864 0.9868 0.987 0.9875 0.9878 0.988 0.9884 0.9887 0.9890.3 0.9893 0.9896 0.9898 0.990 0.9904 0.9906 0.9909 0.99 0.993 0.996.4 0.998 0.990 0.99 0.995 0.997 0.999 0.993 0.993 0.9934 0.9936.5 0.9938 0.9940 0.994 0.9943 0.9945 0.9946 0.9948 0.9949 0.995 0.995.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.996 0.996 0.9963 0.9964.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.997 0.997 0.9973 0.9974.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.998.9 0.998 0.998 0.998 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990 3. 0.9990 0.999 0.999 0.999 0.999 0.999 0.999 0.999 0.9993 0.9993 3. 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995 3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997 3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998 3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 58 3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 3.9.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000