Significância do Coeficiente de Correlação

Documentos relacionados
Inferência Estatística:

Considerações. Planejamento. Planejamento. 3.3 Análise de Variância ANOVA. 3.3 Análise de Variância ANOVA. Estatística II

Esse material foi extraído de Barbetta (2007 cap 13)

7 Teste de Hipóteses

Por que testes não-paramétricos?

Inferência Estatística Básica. Teste de Hipóteses: decidindo na presença de incerteza

AULA 06 Correlação. Ernesto F. L. Amaral. 04 de outubro de 2013

AULA 05 Teste de Hipótese

Distribuições Amostrais

AULA 04 Teste de hipótese

Probabilidade e Estatística

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

3 Metodologia de Estudo

Testes de Hipóteses sobre a média: Várias Amostras

Estimação e Testes de Hipóteses

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

ANÁLISE DE VARIÂNCIA - ANOVA. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM

H 0 : m 1 = m 2 =... = m I = 0 H a : pelo menos m u m k, para algum u k (u,k=1,2,...,i)

Sumário. 2 Índice Remissivo 12

Capítulo 6 Estatística não-paramétrica

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

ESTATÍSTICA INFERENCIAL. Prof. Dr. Guanis de Barros Vilela Junior

Fração como Probabilidade - União e Interseção de Eventos. Sexto Ano do Ensino Fundamental

TESTES DE HIPÓTESES. Conceitos, Testes de 1 proporção, Testes de 1 média

Delineamento e Análise Experimental Aula 4

TESTE DE HIPÓTESE. Introdução

Testes de Hipótese para uma única Amostra - parte I

TESTE DE HIPÓTESES. Licenciatura em Ciências USP/ Univesp. Métodos estatísticos: coleta, tratamento e análise de dados; aplicação

Estatística (MAD231) Turma: IGA. Período: 2017/2

Testes de Hipóteses Paramétricos

Testes de Hipóteses Paramétricos

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Prof.Letícia Garcia Polac. 26 de setembro de 2017

H 0 : m 1 = m 2 =... = m I = 0 H a : pelo menos m u m k, para algum u k (u,k=1,2,...,i)

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

Análise Multivariada Aplicada à Contabilidade

Medidas de Dispersão ou variabilidade

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016.

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos. 6 a aula Testes de Hipóteses

Teste para a Média Populacional com Variância Conhecida

CORRELAÇÃO. Flávia F. Feitosa

Análise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013

Modelos de Regressão Linear Simples parte I

AULA 07 Inferência a Partir de Duas Amostras

José Aparecido da Silva Gama¹. ¹Professor do Instituto Federal de Educação, Ciência e Tecnologia de Alagoas.

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Modelos de Regressão Linear Simples - parte I

Resultados possíveis do nosso estudo

Estatística Aplicada ao Serviço Social

1 Teoria da Decisão Estatística

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA

Teste de hipóteses para uma média populacional com variância conhecida e desconhecida

Teste de Hipótese. Capítulo 8 Triola, 10 a. Ed. (Capítulo 7 Triola, 9 a. Ed.) 1 Visão Geral. 2 Fundamentos do teste de hipótese

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Testes de Hipótese para uma única Amostra - parte II

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

Intervalos de Confiança

Probabilidades. Wagner H. Bonat Elias T. Krainski Fernando P. Mayer

Testes para dados categóricos

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

Regressão linear simples

Testes de Aderência, Homogeneidade e Independência

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

47 = 1349 (ou multiplicando por 100 para converter para porcentagem: 3,5%).

Testes de hipóteses com duas amostras CURSO DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA. Módulo: ESTIMATIVA E TESTE DE HIPÓTESE.

Análise de Variância com mais de duas variáveis independentes (mais de dois fatores) Na aula do dia 17 de outubro (aula #08) introduzimos

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Métodos Quantitativos em Medicina. Prof. Neli Ortega

População e Amostra. População: O conjunto de todas as coisas que se pretende estudar. Representada por tudo o que está no interior do desenho.

Definição Há correlação entre duas variáveis quando os valores de uma variável estão relacionados, de alguma maneira, com os valores da outra variável

HEP Bioestatística

Turma: Engenharia Data: 12/06/2012

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa

Razão para rejeitar H 0

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

AULA 11 Teste de Hipótese

Teste Anova. Prof. David Prata Novembro de 2016

Testes de Hipótese para uma única Amostra - parte II

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS EM ENGENHARIA

TÉCNICAS DE AMOSTRAGEM

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Transcrição:

Significância do Coeficiente de Correlação A primeira coisa que vamos tentar fazer nesta aula é apresentar o conceito de significância do coeficiente de correlação. Uma vez entendido este conceito, vocês verão fórmulas matemáticas para o cálculo da significância. Essas fórmulas serão mais difíceis de serem explicadas neste curso, mas espera-se que vocês as aceitem com base no entendimento do que é a significância de um valor de correlação e do porquê da sua importância. Para apresentar o conceito de significância, consideremos o seguinte exemplo. Suponha que a Comissão de Graduação (CG) da Universidade tenha pedido a duas turmas diferentes do curso de psicologia, por exemplo, a turma do segundo ano e a turma do terceiro ano, para avaliar três professores do curso. Vamos supor que cada turma tenha feito duas disciplinas diferentes com cada professor, de maneira que os alunos tenham um bom conhecimento deles e de suas capacidades didáticas. A avaliação consiste de questionários distribuídos entre os alunos, cobrindo temas como dedicação do professor, capacidade de explicação, conhecimento da matéria, educação etc. Vamos supor que os questionários foram preenchidos por todos os alunos (infelizmente, algo raro na realidade) e entregues à CG. Os membros da CG fizeram, então, os cálculos das pontuações dos professores segundo a avaliação de cada turma (que envolveram médias das notas dadas pelos alunos de cada turma). Os resultados estão apresentados na tabela abaixo, tanto em termos da pontuação de cada professor como em termos da sua posição no ranking (vamos supor que as notas de cada professor variam numa escala de 1 a 5 e que dois professores não possam ter notas iguais). Turma do 2 o ano Turma do 3 o ano Professor Nota Posição no ranking Nota Posição no ranking A 3,5 2 4 2 B 4 1 4,5 1 C 3,2 3 3 3 1

Vamos considerar apenas as colunas que dão as classificações dos professores em termos da sua posição no ranking. Observe que as posições dos três professores nos rankings das duas turmas são as mesmas. Isto implica que a correlação das avaliações dos três professores feitas pelas duas turmas é perfeita. De fato, o cálculo do coeficiente de correlação de Spearman nos dá r S = 1 (mostre isso como exercício). A questão que se põe é: o coeficiente de correlação é +1, indicando uma correlação perfeita, mas será que isso não ocorreu apenas por coincidência? Dito de outra forma, quão significante é o valor r S = 1? Em estatística, aborda-se a questão da significância de um resultado usando-se o conceito de hipótese nula. A hipótese nula (H 0 ) simplesmente assume que um dado resultado estatístico foi obtido apenas por acaso, devido a flutuações probabilísticas dos eventos sendo medidos, e não devido a um efeito real que cause o resultado. Sempre que se trabalha com uma hipótese para explicar um dado fenômeno, temos que considerar a possibilidade de pelo menos uma hipótese concorrente a ela. No caso da estatística, a hipótese concorrente é chamada de hipótese alternativa (H A ). No nosso exemplo, o resultado empírico é que a correlação entre as avaliações dos três professores feitas pelas duas turmas é perfeita (r S = 1). Como hipótese nula, vamos considerar que esse resultado é pura coincidência e, portanto, que nada de mais profundo possa ser retirado dele. Já a hipótese alternativa considera o contrário, que o resultado é devido a uma real similaridade das opiniões dos alunos das duas turmas sobre os três professores, ou seja, que a correlação é significante. Uma vez que as duas hipóteses tenham sido enunciadas e os seus significados estejam bem claros na mente do pesquisador, a estratégia usada pela Estatística consiste em atacar a hipótese nula. Isso é feito com a seguinte pergunta: se a hipótese nula estiver correta e o resultado obtido for devido apenas ao acaso, qual a probabilidade de que ele ocorra? No nosso exemplo, se o resultado obtido for apenas obra do acaso, para calcular a probabilidade dele temos que considerar todos os resultados possíveis. 2

De quantas maneiras os três professores podem ser ordenados pela turma do 2 o ano? Como temos 3 professores, o número de maneiras é 3! = 3.2.1 = 6 (veja abaixo). Professor Possibilidades de rankeamento pela turma do 2 o ano A 1 1 2 2 3 3 B 2 3 1 3 1 2 C 3 2 3 1 2 1 Igualmente, os 3 professores podem ser ordenados pela turma do 3 o ano de 6 maneiras diferentes (as mesmas mostradas acima). Desta forma, como cada turma pode ordenar os 3 professores de 6 maneiras diferentes, o número de possíveis maneiras diferentes em que os 3 professores podem ser rankeados pelas duas turmas em conjunto é 6x6 = 36 (veja abaixo). Maneiras 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Prof. 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o A 1 1 1 1 1 2 1 2 1 3 1 3 1 1 1 1 1 2 1 2 1 3 1 3 2 1 2 1 2 2 2 2 2 3 2 3 B 2 2 2 3 2 1 2 3 2 1 2 2 3 2 3 3 3 1 3 3 3 1 3 2 1 2 1 3 1 1 1 3 1 1 1 2 C 3 3 3 2 3 3 3 1 3 2 3 1 2 3 2 2 2 3 2 1 2 2 2 1 3 3 3 2 3 3 3 1 3 2 3 1 r S 1 0,5 0,5-0,5-0,5-1 0,5 1-0,5 0,5-1 -0,5 0,5-0,5 1-1 0,5-0,5 Maneiras 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 Prof. 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o 2 o 3 o A 2 1 2 1 2 2 2 2 2 3 2 3 3 1 3 1 3 2 3 2 3 3 3 3 3 1 3 1 3 2 3 2 3 3 3 3 B 3 2 3 3 3 1 3 3 3 1 3 2 1 2 1 3 1 1 1 3 1 1 1 2 2 2 2 3 2 1 2 3 2 1 2 2 C 1 3 1 2 1 3 1 1 1 2 1 1 2 3 2 2 2 3 2 1 2 2 2 1 1 3 1 2 1 3 1 1 1 2 1 1 r S -0,5 0,5-1 1-0,5 0,5-0,5-1 0,5-0,5 1 0,5-1 -0,5-0,5 0,5 0,5 1 A última linha dessa tabela dá os valores do coeficiente de correlação de Spearman r S para cada um dos 36 casos possíveis. Vemos que em seis deles a correlação entre as avaliações das duas turmas é positiva e perfeita (r S = 1). Dadas todas as possibilidades acima, a probabilidade de se obter uma situação como a do exemplo, em que r S = 1 é: p = número de maneiras em que rs = 1 pode ocorrer 6 = = 0,167. número de combinações possíveis 36 3

Isto quer dizer que caso o resultado obtido no experimento seja fruto de mero acaso, a probabilidade de ele ocorrer é de 16,7%. Se você achar que este valor de probabilidade é suficientemente baixo (onde o critério de definição de suficientemente baixo tem que ser previamente definido), você pode rejeitar a hipótese nula. A idéia é a de que, se a probabilidade de o resultado ser obtido por mero acaso for muito baixa, deve-se considerar que a hipótese do acaso não é suficientemente forte para explicar o ocorrido e, portanto, que a hipótese alternativa tem mais chances de oferecer uma explicação melhor. Normalmente, o limiar do valor de probabilidade abaixo do qual a hipótese nula é rejeitada é 5% (p = 0,05). Se a probabilidade do evento caso a hipótese nula esteja certa for menor que 5%, rejeita-se a hipótese nula; caso a probabilidade for maior que 5%, não se pode rejeitar a hipótese nula. A probabilidade de se obter a classificação dos dois professores do nosso exemplo por mero acaso é de 16,7%, um valor bem maior que 5%. Sendo assim, mesmo com o valor de r S tendo sido máximo, não se pode concluir que ele é significante. A probabilidade de que ele tenha sido gerado apenas pelo acaso é muito grande. O que aconteceria se a CG pedisse para as duas turmas avaliar quatro professores e os dois rankings feitos por elas fossem perfeitamente iguais, de maneira que novamente r S = 1? Neste caso, cada turma poderia ordenar os quatro professores de 4! = 4.3.2.1 = 24 maneiras diferentes e o número de pareamentos possíveis dos dois ordenamentos seria 24x24 = 576. Desses, há 24 deles em que os rankeamentos são exatamente iguais. Desta forma, a probabilidade de se obter um pareamento idêntico por puro acaso é, neste caso, p = 24 = 576 0,042. Este valor é agora menor que o limiar de rejeição da hipótese nula, p = 0,05. Neste segundo caso, o acaso não é suficiente para explicar o resultado obtido (a um nível de significância de 0,05) e, portanto, a hipótese nula deve ser rejeitada. 4

Estes dois exemplos são muito simples e tiveram por objetivo apenas ilustrar o conceito de significância. Espero que eles tenham mostrado que um valor alto do coeficiente de correlação, tanto faz se for r ou r S, não é suficiente para se acreditar que existe de fato uma relação entre as duas variáveis. Quando o tamanho n da amostra é pequeno, é relativamente fácil (isto é, muito provável) obter um pareamento perfeito entre as duas variáveis apenas pelo acaso. Em um caso assim, tanto as regras da pesquisa científica como as regras do bom senso nos indicam que não devemos considerar um valor alto de r como significante. Por outro lado, quando n for grande, mesmo valores baixos do coeficiente de correlação (por exemplo, r = 0,2 ou menor) são difíceis de ser obtidos por mero acaso e, portanto, são considerados como significantes. É por isso que é muito comum hoje em dia lermos reportagens em jornais dizendo que algum estudo mostrou que existe uma pequena, mas significante tendência de algo (em geral, associada a uma pesquisa sobre a correlação entre algum alimento e alguma condição da saúde humana). Teste de Significância para o Coeficiente de Correlação de Pearson Agora que já fizemos uma discussão sobre o que é a significância do coeficiente de correlação e de porque é importante testar a significância dele quando se faz um estudo de correlação, vamos apresentar os passos necessários para se fazer um teste de significância para o coeficiente de correlação de Pearson entre duas variáveis X e Y. Primeiramente, vamos definir qual é objetivo do teste. Quando se coleta uma amostra de n pares de valores das variáveis (X, Y) e se calcula o seu coeficiente de correlação r, o que se quer saber é se esse valor de r é significante. Para se fazer isso, vai-se assumir como hipótese nula H 0 que não existe correlação para a população das variáveis X e Y (o que implicaria que o valor obtido para r ocorreu por mero acaso). Costuma-se denotar o coeficiente de correlação para a população das variáveis X e Y por ρ (não confundir com o coeficiente de correlação de Spearman). 5

Portanto, temos dois coeficientes de correlação: um para a população de valores de X e Y, denotado por ρ, que é puramente teórico; e o outro para uma amostra de n pares (x i, y i ), i = 1,..., n, retirada da população, denotado por r. A figura abaixo ilustra a situação. O valor de r é usado para estimar o coeficiente de correlação ρ e o teste de significância desse valor consiste em assumir como H 0 que ρ = 0 (ausência de correlação) para verificar se sob tal hipótese o valor obtido para r é muito ou pouco provável. Se a probabilidade de se obter o valor de r for menor que um certo valor crítico (por exemplo, 0,05), rejeita-se H 0 e assume-se como mais provável a hipótese alternativa, segundo a qual ρ 0. Os passos para se fazer um teste de significância para o coeficiente de correlação de Pearson serão apresentados aqui na forma de uma receita. Embora eles sejam dados como uma receita, vocês devem ter em mente que eles, na verdade, podem ser justificados matematicamente de maneira rigorosa, desde que a condição na qual eles se baseiam seja satisfeita. Condição para o teste de significância do coeficiente de correlação de Pearson entre X e Y: a distribuição de probabilidade conjunta para a população das variáveis X e Y é normal bidimensional. Não se assuste com o enunciado acima. Ele apenas quer dizer que se tivéssemos acesso à população das variáveis X e Y e fizéssemos um gráfico das freqüências de ocorrência conjunta de pares de valores (x, y), esse gráfico seria bem aproximado pela função teórica que generaliza a função normal para duas dimensões, cujo gráfico é mostrado abaixo. 6

Em geral, quando se trabalha com amostras de n pares de valores (x, y) onde n 30, a condição de normalidade das duas variáveis é satisfeita. Assumindo que a condição acima é válida, temos as seguintes hipóteses: H 0 : ρ = 0; H A : ρ 0. Siga, então, os passos: 1. Escolha um valor crítico α para a significância. Por exemplo, α = 0,05; 2. Como a amostra contém n pares de dados, consulte uma tabela da distribuição t de Student e obtenha o valor de t(gl) para o valor de α escolhido, onde gl = n 2; 3. Calcule a variável, t 0 = r n 2 ; 2 1 r 4. Se t 0 > t(gl) ou t 0 < t(gl), rejeita-se H 0. Caso contrário, não se rejeita H 0. a. Se H 0 for rejeitada, deve-se concluir que o valor de r obtido para a amostra é significante e que existe correlação r entre as variáveis X e Y com nível de significância igual a α (a probabilidade p de se errar é menor a α); b. Se H 0 não for rejeitada, deve-se concluir que o valor obtido de r não é significante: tanto pode haver correlação r como não haver correlação (ρ = 0). 7

Quando se apresenta o resultado de um teste como este em um artigo científico, a norma recomendada pela Associação Americana de Psicologia é a seguinte: Quando o resultado do teste (por exemplo, r = 0,243) dá que o valor de r é significante: r = 0,243 *, p < 0,05. Quando o resultado do teste dá que o valor de r não é significante: r = 0,243, ns. Teste de Significância para o Coeficiente de Correlação de Spearman O coeficiente de correlação de Spearman é um tipo de medida estatística que os estatísticos chamam de não-paramétrica. O coeficiente de correlação de Pearson, ao contrário, é uma medida chamada de paramétrica. O significado disso é que não há restrições para o teste de significância do coeficiente de correlação de Spearman, ao passo que o teste de significância para o coeficiente de correlação de Pearson depende da condição de normalidade da distribuição bidimensional de X e Y (ou de se tomar uma amostra com n > 30). Como não há restrições para o teste de significância do coeficiente de correlação de Spearman, ele pode ser aplicado sempre. Os passos para o teste são os mesmos apresentados acima para o teste de significância para o coeficiente de correlação de Pearson: A hipótese nula é H 0 : ρ = 0; e a hipótese alternativa é H A : ρ 0. Escolhe-se um nível de significância α; Consulta-se uma tabela da distribuição t de Student para se obter o valor de t(gl) para o valor de α escolhido, onde gl = n 2; n 2 Calcula-se a variável t0 = r ; 2 1 r Se t 0 > t(gl) ou t 0 < t(gl), rejeita-se H 0 ; caso contrário, não se rejeita H 0. 8

Um resumo do procedimento recomendado quando se quer fazer um teste de significância para o coeficiente de correlação entre duas variáveis X e Y está dado no diagrama abaixo. 9

Exemplo. Estatística II Antonio Roque Aula 15 Vários trabalhos indicam que estudantes universitários lidam com stress diariamente e que isso pode ter um impacto em sua saúde. Para pesquisar a relação entre stress e saúde foi feito um estudo de correlação com um grupo de estudantes universitários voluntários. Os sujeitos eram 50 estudantes universitários, 25 do sexo feminino e 25 do sexo masculino. A cada um foi entregue um questionário, para ser preenchido em casa e devolvido ao pesquisador em dois dias. O questionário era composto de duas partes. A primeira era um questionário sobre stress que pedia ao sujeito para indicar, de uma lista de 31 situações estressoras, quais ele tinha vivenciado nos últimos 12 meses. Cada situação estressora tem um escore, conhecido apenas pelo pesquisador, e a soma deles resulta no escore geral de stress do sujeito; quanto maior este escore, mais estressante foi a vida do sujeito nos últimos 12 meses. A outra parte do questionário era um questionário de avaliação de saúde, que testa 8 critérios de saúde de uma pessoa. Os critérios são: (1) funcionamento físico, (2) limitações nas atividades diárias devido a problemas físicos, (3) limitações nas atividades diárias devido a problemas emocionais, (4) fadiga/falta de energia, (5) bem-estar emocional, (6) funcionamento social, (7) dor e (8) saúde geral. Quanto maior o escore do sujeito em cada um dos critérios desse questionário, mais saudável ele está neste critério. Os dois questionários usados (para medir stress e para medir saúde) estão disponíveis na internet (em inglês): Stress survey (2001). Morehead State University Life Enhancement Office. Site: http://www.morehead-st.edu/units/development/life/stress/survey.html RAND 36-item Health Survey 1.0 (1995). RAND Health Organization. Site: http://www.rand.org/health/surveys/sf36item/ 10

Os escores obtidos na pesquisa estão mostrados na tabela abaixo. Estatística II Antonio Roque Aula 15 Escores Sujeito Sexo Stress 1 2 3 4 5 6 7 8 1 F 245 20 5 5 25 36 75 70 20 2 F 185 90 100 100 30 60 90 75 90 3 F 203 85 100 68 45 72 75 90 50 4 F 186 60 50 33 60 44 75 78 60 5 F 239 100 100 100 50 73 100 100 85 6 F 58 90 100 100 50 52 88 100 85 7 F 288 50 75 100 10 92 25 22 35 8 F 264 85 100 100 35 72 100 90 55 9 F 250 95 100 100 60 80 88 77 40 10 F 488 70 100 10 40 68 75 57 65 11 F 12 100 100 100 60 68 100 90 65 12 F 95 95 50 66 50 56 62 77 35 13 F 245 100 100 100 60 64 75 100 55 14 F 131 100 100 100 85 92 100 77 80 15 F 225 100 15 33 50 64 75 65 25 16 F 235 80 100 100 40 64 100 58 65 17 F 25 100 100 100 55 88 100 100 55 18 F 118 95 100 100 60 84 75 77 75 19 F 115 95 100 18 30 52 75 100 65 20 F 249 100 75 10 60 96 75 100 80 21 F 438 80 100 33 40 88 100 100 75 22 F 414 100 25 100 65 76 100 90 80 23 F 275 100 100 100 60 92 100 100 100 24 F 188 80 75 100 60 68 75 77 55 25 F 180 25 25 10 45 48 37 67 40 26 M 63 95 100 33 55 52 100 57 65 27 M 136 90 100 100 55 52 75 100 65 28 M 229 60 15 15 55 68 50 65 70 29 M 127 100 100 100 80 80 100 90 100 30 M 106 25 100 100 80 96 100 90 100 31 M 60 80 100 100 60 92 87 100 80 32 M 267 95 100 66 25 28 50 65 20 33 M 310 100 100 100 80 76 100 100 95 34 M 355 100 100 100 60 80 100 100 75 35 M 102 55 75 66 40 76 62 77 50 36 M 171 100 100 66 75 80 75 77 75 37 M 73 90 75 100 50 76 100 70 85 38 M 66 100 100 5 55 28 50 80 70 39 M 139 85 100 100 45 76 100 90 35 40 M 37 95 100 5 65 72 100 90 85 41 M 7 60 100 100 35 44 75 100 80 42 M 111 95 100 9 70 88 87 100 70 43 M 121 95 100 100 70 76 100 100 80 44 M 403 100 100 33 55 72 100 90 85 45 M 164 95 100 66 50 92 100 100 85 46 M 336 95 50 66 80 100 100 100 100 47 M 111 100 100 100 40 48 100 100 50 48 M 138 100 100 33 75 76 75 100 95 49 M 364 100 100 5 75 60 62 100 85 50 M 103 50 75 66 80 64 62 90 75 11

Os coeficientes de correlação de Pearson para as correlações entre o escore de stress e cada um dos escores de saúde estão mostrados na tabela abaixo. Podemos usar o coeficiente de correlação de Pearson neste caso porque a amostra é grande (contém mais de 30 dados) Correlação Stress x 1 Stress x 2 Stress x 3 Stress x 4 Stress x 5 Stress x 6 Stress x 7 Stress x 8 r 0,030-0,177-0,171-0,094 0,166-0,011-0,114-0,001 t 0 0,211-1,247-1,205-0,654 1,166-0,079-0,793-0,006 n 2 48 A última linha da tabela acima dá os valores de t0 = r = r 2 2 necessários para o 1 r 1 r teste de significância (note que gl = 50 2 = 48). Consultando uma tabela para a distribuição t de Student (por exemplo, a tabela da próxima página), vemos que (para α = 0,05) em todos os casos acima t(48) < t 0 < t(48). Portanto, nenhuma dessas correlações é significante para um valor de α = 0,05. A tabela da distribuição t de Student dada na próxima página não mostra os valores de t para o valor de gl do problema (48), mas note que para gl = 40 o valor de t associado à probabilidade p = 0,05 é 2,0211. Este valor já é maior (em módulo) que qualquer um dos valores de t 0 listados na tabela, de maneira que o valor de t(48) será maior ainda (note que os valores de t(gl) crescem com gl). Como, para α = 0,05, os valores de t 0 estão entre t(48) e t(48), a probabilidade de eles serem obtidos não é menor que α e, portanto, não devemos rejeitar a hipótese nula. Concluímos, portanto, que os valores dos coeficientes de correlação obtidos não são significantes. 12

Tabela. Distribuição t de Student A primeira coluna indica o número de graus de liberdade (gl). Os cabeçalhos das outras colunas dão a probabilidade (p) de que t exceda numericamente o valor da casa (o valor da área pintada). g.l. p 0,50 0,25 0,10 0,05 0,025 0,01 0,005 1 1,00000 2,4142 6,3138 12,706 25,542 63,657 127,32 2 0,81650 1,6036 2,9200 4,3027 6,2053 9,9248 14,089 3 0,76489 1,4226 2,3534 3,1825 4,1765 5,8409 7,4533 4 0,74070 1,3444 2,1318 2,7764 3,4954 4,6041 5,5976 5 0,72669 1,3009 2,0150 2,5706 3,1634 4,0321 4,7733 6 0,71756 1,2733 1,9432 2,4469 2,9687 3,7074 4,3168 7 0,71114 1,2543 1,8946 2,3646 2,8412 3,4995 4,0293 8 0,70639 1,2403 1,8595 2,3060 2,7515 3,3554 3,8325 9 0,70272 1,2297 1,8331 2,2622 2,6850 3,2498 3,6897 10 0,69981 1,2213 1,8125 2,2281 2,6338 3,1693 3,5814 11 0,69745 1,2145 1,7959 2,2010 2,5931 3,1058 3,4966 12 0,69548 1,2089 1,7823 2,1788 2,5600 3,0545 3,4284 13 0,69384 1,2041 1,7709 2,1604 2,5326 3,0123 3,3725 14 0,69242 1,2001 1,7613 2,1448 2,5096 2,9768 3,3257 15 0,69120 1,1967 1,7530 2,1315 2,4899 2,9467 3,2860 16 0,69013 1,1937 1,7459 2,1199 2,4729 2,9208 3,2520 17 0,68919 1,1910 1,7396 2,1098 2,4581 2,8982 3,2225 18 0,68837 1,1887 1,7341 2,1009 2,4450 2,8784 3,1966 19 0,68763 1,1866 1,7291 2,0930 2,4334 2,8609 3,1737 20 0,68696 1,1848 1,7247 2,0860 2,4231 2,8453 3,1534 21 0,68635 1,1831 1,7207 2,0796 2,4138 2,8314 3,1352 22 0,68580 1,1816 1,7171 2,0739 2,4055 2,8188 3,1188 23 0,68531 1,1802 1,7139 2,0687 2,3979 2,8073 3,1040 24 0,68485 1,1789 1,7109 2,0639 2,3910 2,7969 3,0905 25 0,68443 1,1777 1,7081 2,0595 2,3846 2,7874 3,0782 26 0,68405 1,1766 1,7056 2,0555 2,3788 2,7787 3,0669 27 0,68370 1,1757 1,7033 2,0518 2,3734 2,7707 3,0565 28 0,68335 1,1748 1,7011 2,0484 2,3685 2,7633 3,0469 29 0,68304 1,1739 1,6991 2,0452 2,3638 2,7564 3,0380 30 0,68276 1,1731 1,6973 2,0423 2,3596 2,7500 3,0298 40 0,68066 1,1673 1,6839 2,0211 2,3289 2,7045 2,9712 60 0,67862 1,1616 1,6707 2,0003 2,2991 2,6603 2,9146 120 0,67656 1,1559 1,6577 1,9799 2,2699 2,6174 2,8599 0,67449 1,1503 1,6449 1,9600 2,2414 2,5758 2,8070 13