Teste t de Student para o caso de uma amostra (Teste de hipóteses para a média populacional) Exemplo: Quinze alunos foram inquiridos quanto ao seu grau de satisfação (numa escala de 0 a 00) em relação à sua Universidade, obtendo-se os seguintes resultados: 75 60 55 80 52 90 60 9 72 58 77 80 66 40 62 Teste a hipótese de que a média é 72, sendo α=5%. Resolução usando o SPSS: H 0 : µ = 72 H µ 72 (Teste bilateral) :
Output T-Test One-Sample Statistics Grau de satisfação Std. Error N Mean Std. Deviation Mean 5 67,87 4,45 3,73 One-Sample Test Grau de satisfação Test Value = 72 95% Confidence Interval of the Mean Difference t df Sig. (2-tailed) Difference Lower Upper -,08 4,287-4,33-2,4 3,87 2
Interpretação: Neste exemplo, dado tratar-se de um teste bilateral, compara-se directamente o valor de p-value=0.287 com α=0.05 (nível de significância). Como p-value=0.287 > 0.05 não se rejeita H 0. Assim, não há evidência estatística para rejeitar a hipótese de que a média de satisfação (numa escala de 0 a 00) em relação à sua Universidade na população de alunos que frequentam aquela Universidade é 72, com α=0.05. Testes de hipóteses para a diferença entre duas médias populacionais) A) Teste t de Student para amostras independentes Exemplo: Com o objectivo de testar a influência do olfacto no sono dos recém nascidos, foi registado o tempo (em minutos) que um bebé com uma semana demora a adormecer, tendo sido considerados dois grupos de bebés: grupo I (em que se colocou no berço uma peça de roupa utilizada pela mãe) e grupo II (em que se colocou no berço uma peça de roupa utilizada por outra pessoa). Os resultados obtidos encontram-se no quadro seguinte: Grupo I 2 5 4 6 8 9 7 5 6 5 Grupo II 9 3 8 7 0 9 7 8 Sabendo que a variável em estudo segue uma distribuição normal, teste se existem diferenças significativas entre o tempo que os dois grupos de bebés levaram a adormecer (α=0.05). Resolução usando o SPSS: H 0 : µ µ 2 = 0 ou H : µ = µ 0 2 H : µ µ 2 0 ou H : µ µ 2 (Teste bilateral) 3
Analyze/compare means/independent sample t-test 4
<Define Groups> <Continue> <OK> T-Test tempo levado até adormecer Grupo 2 Group Statistics Std. Error N Mean Std. Deviation Mean 0 5,70 2,003,633 0 8,30 2,359,746 5
tempo levado Equal variance até adormece assumed Equal variance not assumed Levene's Test for Equality of Variances F Sig. Independent Samples Test t-test for Equality of Means Mean t df Sig. (2-tailed) Difference 95% Confidence Interval of the Difference Std. Error Difference Lower Upper,03,75-2,657 8,06-2,600,979-4,656 -,544-2,657 7,537,06-2,600,979-4,660 -,540 Interpretação: A primeira tabela apresenta as medidas descritivas dos dados (dimensão n de cada amostra), média, desvio-padrão e erro-padrão amostrais) e o segundo quadro diz respeito ao teste de Levene para a homogeneidade (igualdade) das variâncias e ao teste t para a comparação de duas médias no caso de duas amostras independentes. No teste de Levene, as hipóteses são: H H 2 2 0 : σ = σ 2 2 2 0 : σ σ 2 Note que neste caso no que concerne ao teste de Levene p=0.75, pelo que não se rejeita a hipótese de que, neste exemplo, as variâncias são iguais. Assim, considera-se que as variâncias populacionais, embora desconhecidas, são iguais. O quadro anterior apresenta a seguir o valor da estatística do teste (t) para a igualdade das médias, o número de graus de liberdade e a probabilidade de significância do teste (nível de significância descritivo do teste/p-value - sig.). Neste exemplo, dado tratar-se de um teste bilateral, compara-se directamente p- value=0.06 com α=0.05 (nível de significância). Como p-value=0.06 0.05 rejeita-se H 0. Assim, podemos afirmar com 95% de confiança que existem diferenças significativas entre o tempo que os dois grupos de bebés levaram a adormecer. Obs. Se o teste fosse unilateral comparava-se o valor de p-value/2 com o valor de α. 6
B) Teste t de Student para amostras emparelhadas; Exemplo: Um grupo de 0 pessoas é submetido a um tipo de dieta durante um mês, sendo avaliado o peso no início da dieta (X) e no final da dieta (Y), tendo-se obtido os seguintes resultados: X 20 04 93 87 85 98 02 06 88 90 Y 6 02 90 83 86 97 98 08 82 85 Ao nível de 5%, podemos concluir que houve diminuição do peso médio pela aplicação da dieta? Resolução usando o SPSS: H 0 : µ µ 2 = 0 ou H 0 : µ = µ 2 H : µ µ 2 > 0 ou H : µ > µ 2 (Teste unilateral à direita) 7
<Ok> Output T-Test Pair X Y Paired Samples Statistics Std. Error Mean N Std. Deviation Mean 97,30 0 0,924 3,455 94,70 0,499 3,636 Paired Samples Correlations Pair X & Y N Correlation Sig. 0,975,000 Pair X - Y Paired Samples Test Paired Differences 95% Confidence Interval of the Std. Error Difference Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed) 2,600 2,59,89,747 4,453 3,74 9,0 Interpretação: O valor da estatística do teste é 3.74. 8
Neste exemplo, como o teste é unilateral, o valor do p-value dado pelo output deve ser p value dividido por 2 e comparado apenas com α. Assim, 0.0055 0. 05, logo 2 rejeita-se H 0, podendo afirmar-se, com 95% de confiança, que houve diminuição do peso médio pela aplicação da dieta. 9
Teste de aderência do Qui-Quadrado - Resolução no SPSS Exemplo : Um modelo de carro de determinada marca é vendido no mercado em 5 cores: vermelha, branca, preta, azul e cinzenta. Num estudo de mercado para saber a popularidade das várias cores, analisou-se uma amostra casual tendo-se obtido os seguintes resultados: Cor v b p a c Nº de Observações 88 65 52 45 50 Em face desta amostra, haverá razões para dizer que há preferência por determinada cor? <Data> <weight Cases> 0
Output: NPar Tests Chi-Square Test Frequencies
cor v b p a c Total Observed N Expected N Residual 88 60,0 28,0 65 60,0 5,0 52 60,0-8,0 45 60,0-5,0 50 60,0-0,0 300 Test Statistics Chi-Square a df Asymp. Sig. cor 9,967 4,00 a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 60,0. Exercício 2: Uma moeda foi lançada ao ar 00 vezes e observaram-se 42 caras e 58 coroas. Serão os resultados compatíveis com a hipótese de que a moeda é não viciada. Output: NPar Tests Chi-Square Test Frequencies face cara coroa Total Observed N Expected N Residual 42 50,0-8,0 58 50,0 8,0 00 2
Test Statistics Chi-Square a df Asymp. Sig. face 2,560,0 a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 50,0. Exercício 3: O último algarismo de 60 números telefónicos escolhidos ao acaso de uma lista foi: Nº 0 2 3 4 5 6 7 8 9 Freq. 8 3 2 5 4 5 6 5 Será razoável admitir a equiprobabilidade dos números? Output: NPar Tests Chi-Square Test Frequencies 3
NUMERO 0 2 3 4 5 6 7 8 9 Total Observed N Expected N Residual 8 6,0 2,0 3 6,0-3,0 2 6,0-4,0 5 6,0 -,0 4 6,0-2,0 6,0 5,0 5 6,0 -,0 6,0 5,0 6 6,0,0 5 6,0 -,0 60 Test Statistics Chi-Square a df Asymp. Sig. NUMERO 4,333 9, a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 6,0. 4
Teste de Homogeneidade do Qui-Quadrado Exemplo: Um investigador efectuou uma experiência para determinar o efeito da idade de um conferencista sobre a disposição estudantil para assistir às suas conferências. Para tal, foram eleitos ao acaso 50 estudantes. A todos os estudantes foi feita uma descrição igual do professor conferencista excepto no que diz respeito à idade: a metade foi dito que o professor tinha 65 anos e à outra metade foi dito que tinha 30 anos. Mais tarde foi pedido aos alunos que manifestassem a sua disposição para assistir à conferência, obtendo-se os seguintes resultados: Disposição para assistir à conf. Estudantes a quem se disse que o prof. tinha 65 anos Situação experimental Estudantes a quem se disse que o prof. tinha 30 anos Totais Com disposição 8 5 23 Sem disposição 7 0 27 Totais 25 25 50 Será que existem diferenças entre os 2 grupos de estudantes quanto à disposição para assistir à conferência (α=0.05)? Resolução no SPSS Disp_conf- disposição para assistir à conferência Idade Situação experimental 5
6
Output: Crosstabs Case Processing Summary Disposição para assistir à conferência * Situação experimental Cases Valid Missing Total N Percent N Percent N Percent 50 00,0% 0,0% 50 00,0% 7
Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test N of Valid Cases Chi-Square Tests Asymp. Sig. Value df (2-sided) 3,945 b,047 2,899,089 4,000,045 50 a. Computed only for a 2x2 table Exact Sig. (2-sided) Exact Sig. (-sided),088,044 b. 0 cells (,0%) have expected count less than 5. The minimum expected count is,50. Teste de Independência do Qui-Quadrado Exemplo: Inquiriu-se 200 pessoas sobre a frequência com que vêem TV e sobre o tipo de analgésicos antipiréticos que consumiam. A informação obtida resultou na seguinte tabela: Frequência com Analgésicos Total que vê TV A B C Nunca 0 0 5 25 Por vezes 25 40 9 74 Com frequência 40 3 30 0 Total 75 8 44 200 8
Haverá alguma relação entre o consumo de analgésicos e a frequência com que se vê televisão? Comente. Resolução no SPSS Output: Crosstabs Case Processing Summary Frequência com que vê TV * Analgésicos Cases Valid Missing Total N Percent N Percent N Percent 200 00,0% 0,0% 200 00,0% 9
Pearson Chi-Square Likelihood Ratio N of Valid Cases Chi-Square Tests Asymp. Sig. Value df (2-sided) 2,25 a 4,06 2,486 4,04 200 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 5,50. 20
Teste de Fisher Exemplo: Um estudo sobre hábitos tabágicos e consumo de álcool pretendia comparar dois grupos de indivíduos, fumadores e não-fumadores, quanto à proporção de consumidores de álcool. Recolhida uma amostra de 9 pessoas, obtiveram-se os seguintes dados: Fumadores Não Fumadores Totais Consumidor de álcool 3 4 Não consumidor de álcool 3 2 5 Totais 4 5 9 Pretende-se testar se (α=0.05): a) a proporção de consumidores de álcool é menor no grupo de fumadores; b) a proporção de consumidores de álcool é maior no grupo de fumadores; c) a proporção de consumidores de álcool é igual nos dois grupos; Resolução no SPSS Output: Crosstabs Case Processing Summary Alcool * Fumador Cases Valid Missing Total N Percent N Percent N Percent 9 00,0% 0,0% 9 00,0% Alcool * Fumador Crosstabulation Count Alcool Total não sim Fumador não sim Total 2 3 5 3 4 5 4 9 2
Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases a. Computed only for a 2x2 table Chi-Square Tests Asymp. Sig. Value df (2-sided),02 b,294,4,708,37,286,980,322 9 Exact Sig. (2-sided) Exact Sig. (-sided),524,357 b. 4 cells (00,0%) have expected count less than 5. The minimum expected count is,78. Nota: Para realizar o teste de Fisher usa-se os mesmos comandos do SPSS usados no caso do teste do qui-quadrado. A nota de rodapé do 2º quadro indica que 00% dos E ij são inferiores a 5. Neste caso não se deve utilizar o teste do qui-quadrado. A alternativa é o teste de Fisher, cuja probabilidade de significância unilateral é 0.357. O SPSS fornece também a probabilidade de significância exacta para um teste bilateral, neste caso, igual a 0.524. Para decidir sobre a rejeição ou não da hipótese nula deve-se, em ambos os casos, comparar-se p-value com α, rejeitando-se a H 0 quando p α. 22
Teste de McNemar Exemplo: Suponha que uma determinada empresa decide fazer uma campanha publicitária para promover um produto que tinha colocado no mercado há algum tempo. A admininstração da empresa pretende saber se as preferências dos consumidores se modificaram após a campanha publicitária. As respostas de 70 consumidores, aos quais se perguntou, antes e depois da campanha, se consumiam o produto em causa, encontram-se resumidas no quadro seguinte: Depois da campanha Não Sim Antes da campanha Sim 5 2 Não 33 20 Terá existido uma mudança significativa no consumo do produto em causa (α=0.05)? Resolução no SPSS Input: <Analyse>- Nonparametric tests > - <two related samples tests> 23
Output: NPar Tests McNemar Test Crosstabs Antes & Depois Antes 0 Depois 0 33 20 5 2 Test Statistics b N Exact Sig. (2-tailed) Antes & Depois 70,004 a a. Binomial distribution used. b. McNemar Test Sendo p = 0.004 < α = 0.05 rejeitamos H 0 e concluímos que houve uma mudança significativa do consumo após a campanha publicitária. 24