Intervalos de conança

Intervalos de conança Prof. Hemílio Fernandes Campos Coêlho Departamento de Estatística - Universidade Federal da Paraíba - UFPB

Exemplo Suponha que se deseja estimar o diâmetro da pupila de coelhos adultos. A variável diâmetro possui distribuição normal. A partir de uma amostra de 12 animais, vericou-se que a média da variável foi 5,2mm. Sabe-se que o desvio padrão populacional é conhecido, e igual a 1,2mm. Se adotarmos um nível de conança de 95%, temos que IC 95% = [ 5, 2 ± 1, 96 1, 2 12 ] = [5, 2±0, 68] = [4, 52mm ; 5, 88mm] Este resultado indica que se pode ter uma conança de 95% de que a média verdadeira dos diâmetros pupilares em coelhos adultos esteja entre 4,52 e 5,88mm.

Tamanho da amostra para obter um intervalo de conança determinado Foi visto que a base da estimativa para a média populacional é uma média amostral. Para a média, vimos que é possível construir um intervalo, cujos limites são denidos por uma MARGEM DE ERRO, dada por z C σ n. Suponha que seja de interesse xar essa margem de erro como, no máximo, um valor diretamente proporcional à estimativa X. Ou seja, suponha que queremos o seguinte: z C σ n εx

continuação Com algumas manipulações algébricas, temos que n ( z C σ εx ) 2 Ou seja, este é o tamanho de amostra necessário para que os limites de conança assoacidos ao valor de C não diram mais do que a proporção ε de média amostral. Uma questão importante é: E QUANDO O DESVIO PADRÃO DA POPULAÇÃO NÃO FOR CONHECIDO? A resposta será: estimá-lo, através do cálculo do desvio padrão amostral. Uma vez que utilizamos uma estimativa do desvio padrão, não podemos recorrer à tabela da distribuição normal. Será necessário utilizar a tabela de outra distribuição de probabilidade contínua, a distribuição t-student.

continuação Lembre que a fórmula do desvio padrão amostral é dada por S = n ( ) 2 x i X i=1 n 1 Uma vez estimado o desvido padrão, temos que I.C. (1 α) 100% = [X ± t C S n ] Foi necessário o uso da tabela da t-student porque tivemos que incorporar outra fonte de incerteza à estimativa da média, neste caso uma estimativa do desvio padrão. Para t C, também será admitido que C = 1 α/2.

continuação O efeito prático desta alteração é aumentar o tamanho do intervalo de conança, o que signica uma estimativa mais prudente ou conservadora para a média populacional. Para termos uma ideia, para um nível de conança de 95%, tem-se que z C = 1, 96. Mantendo este mesmo nível, temos que t C = 2, 20, o que implica em um maior intervalo quando estimamos o valor do desvio padrão Vejamos alguns exemplos a seguir.

Uso da tabela t-student O uso da tabela t, é similar ao da distribuição normal. A busca também será feita através do cruzamento de linhas e colunas. Nas linhas, você identicará o valor ν = n 1. Nas colunas você identicará o valor de C = 1 α/2. Finalmente, o valor t C será resultante do cruzamento entre a linha referente a ν e a coluna referente a C.

Exemplos Considere α = 0, 20, n = 12 e C = 1 0, 20/2 = 0, 90. Logo, temos que ν = 12 1 = 11 e portanto t C = t 0,90 = 1, 36 Considere α = 0, 05, n = 30 e C = 1 0, 05/2 = 0, 975. Logo, temos que ν = 30 1 = 29 e portanto t C = t 0,975 = 2, 04 Considere α = 0, 10, n = 19 e C = 1 0, 10/2 = 0, 95. Logo, temos que ν = 19 1 = 18 e portanto t C = t 0,95 = 1, 34 Considere α = 0, 40, n = 41 e C = 1 0, 40/2 = 0, 80. Logo, temos que ν = 41 1 = 40 e portanto t C = t 0,80 = 0, 851

Exemplo aplicado Suponha que temos 12 coelhos disponíveis para um experimento onde é coletado o diâmetro pupilar. Suponha agora que o desvio padrão é desconhecido. Considere ainda que a estimativa será efetuada a partir de uma amostra, cujos dados são mostrados no quadro a seguir. Coelho 1 2 3 4 5 6 7 8 9 10 11 12 Diâmetro 5,0 5,5 5,0 4,5 4,5 6,0 6,5 5,5 5,5 5,0 5,5 4,0 Note que a média amostra é dada por X = 5, 2mm. Como o desvio padrão populacional é desconhecido, será necessário estimarmos a partir dos 12 coelhos da amostra. Assim, temos que S = 0, 69.

continuação Dessa forma, tem-se então que para um intervalo de conança de 95% é necessário determinar o valor de t C. Temos que n = 12, e portanto ν = 12 1 = 11. Ainda, temos que C = 1 α/2 = 1 0, 05/2 = 0, 975. Portanto, t C = t 0,975 = 2, 20. Portanto, o intervalo para a média populacional, ao nível de 95% de conança é dado por I.C. 95% = [ ] 0, 69 5, 2 ± 2, 20 = [5, 2 ± 0, 44] = [4, 76 ; 5, 64] 12 Mais uma vez, este é o intervalo com nível de conança 95% para a média populacional do diâmetro pupilar de coêlhos adultos normais calculado, neste caso a partir da estimativa de S.

Intervalo de conança para a diferença de médias populacionais No caso em que desejamos comparar dois grupos distintos de indivíduos em relação a uma determinada variável de interesse, recorreremos a uma diferença de médias. Se A representa o primeiro grupo, e B representa o segundo grupo, esta diferença será representada por X A X B. Neste caso, um intervalo de conança ao nível de (1 α) 100% para esta diferença entre as médias de duas populações A e B é dado por I.C. (1 α) 100% = [X A X B ± tc S A n A + S B n B ] Neste caso, temos que o valor ν para se olhar na tabela é dado por ν = n A + n B 2.

Exemplo Continuando o exemplo anterior, suponha que um outro grupo de coelhos, com 10 animais, foi submetido a um estímulo doloroso. Com isso, podemos considerar dois grupos de coelhos: Grupo A (com estímulo) e Grupo B (sem estímulo). Grupo 1 2 3 4 5 6 7 8 9 10 11 12 A 9 10 8 8 8 9 8,5 10 8 10,5 - - B 5,0 5,5 5,0 4,5 4,5 6,0 6,5 5,5 5,5 5,0 5,5 4,0 O intuito deste estudo seria saber qual o nível de alteração do diâmetro pupilar que os coelhos sofrem ao receber um estímulo. A construção de um intervalo de conança para a diferença entre as médias dos diâmetros nos dois grupos pode fornecer uma evidência plausível pra se chegar ao ponto do problema.

Exemplo Com base então nos dados do problema, temos que: X A = 8, 9mm S A = 0, 93 X B = 5, 2mm S B = 0, 47 Então, ao nível de conança de 95%, por exemplo, tem-se que = 2, 09, pois ν = 10 + 12 2 = 20. Portanto: t C I.C. 95% = [ (8, 9 5, 2) ± 2, 09 0, 93 10 ] 0, 47 + = [3, 7 ± 0, 76] 12 Interpretação: Este resultado pode ser interpretado da seguinte forma: Ao nível de 95% de conança, o estímulo doloroso aumenta o diâmetro pupilar entre 2,94 e 4,46mm.

continuação Observe um pouco mais o intervalo obtido: I.C. 95% = [2, 94 ; 4, 46]. Note que o valor 0 NÃO pertence a este intervalo. O que isto signica? Resposta: Signica que a interpreteção anterior pode ser reescrito de forma ainda mais forte: Ao nível de 95% de conança, HÁ EVIDÊNCIA ESTATÍSTICA SUFICIENTE PARA AFIRMAR QUE o estímulo doloroso interfere no diâmetro pupilar dos coelhos, como mostra o intervalo construído. Se o valor 0 estivesse presente no intervalo obtido, concluiríamos que NÃO HÁ EVIDÊNCIA ESTATÍSTICA SUFICIENTE para armar que o estímulo doloroso interfere no diâmetro pupilar dos coelhos, como mostra o intervalo construído. Note que o intervalo construído baseou-se em grupos diferentes. E se considerássemos o mesmo grupo de indivíduos avaliados em instante de tempo distintos? Neste caso, consideraríamos o que chamamos em estatística de amostra pareada.

Amostra pareada Amostras pareadas são dados referentes a um mesmo conjunto de indivíduos. Os dados são obtidos em duas situações diferentes. Exemplo de situações: ANTES e DEPOIS O objetivo é avaliar se estas duas situações são iguais ou não. Por exemplo, suponha que consideramos o peso de um grupo de indivíduos obesos ANTES da aplicação de uma dieta, e seis meses depois, admitindo que os pacientes foram acompanhados rigorosamente, consideramos novamente os pesos destes mesmo indivíduos. Uma amostra pareada pode ser representada pelo quadro a seguir

Representação de uma amostra pareada Antes x A1 x A2 x A3 x A4. x An Depois x B1 x B2 x B3 x B4. x Bn x Ai representa um valor genérico da variável X na situação antes, enquanto x Bi se refere à situação depois.

Construção do intervalo de conança para uma amostra pareada Observando a tabela anterior, devemos construir uma coluna de diferenças entre as observações: Antes Depois Diferenças (d i ) x A1 x B1 x A1 x B1 x A2 x B2 x A2 x B2 x A3 x B3 x A3 x B3 x A4 x B4 x A4 x B4... x An x Bn x An x Bn Considere as diferenças, e sua média das diferenças e o desvio padrão das diferenças: d i = x Ai x Bi d = n d i i=1 n S d = n i=1 ( ) 2 d i d n 1

Construção do intervalo de conança para uma amostra pareada Logo, o intervalo de conança ao nível (1 α) 100% para a diferença de médias na situação em que consideramos amostras pareadas é dado por [ I.C. (1 α) 100% = d ± t C ] S d n O nível de variabilidade deste tipo de intervalo é menor que o intervalo para amostras não-pareadas. Isto ocorre porque estamos lidando com os mesmos indivíduos nos dois grupos de teste.

Exemplo Considere que um grupo de 10 indivíduos com febre elevada foi tratado com um medicamento experimental. A temperatura destes foi avaliada ANTES de tomar a medicação (A) e 2h depois de tomar a medicação (B). Os dados são fornecidos no quadro a seguir. Paciente 1 2 3 4 5 6 7 8 9 10 A 38 39,5 38 38,7 37,5 39 38 37,8 36,7 39 B 36,5 37,8 37 37,5 36 38,5 37 36,5 36 37

continuação Temos que as diferenças são dadas por Paciente 1 2 3 4 5 6 7 8 9 10 A 38 39,5 38 38,7 37,5 39 38 37,8 36,7 39 B 36,5 37,8 37 37,5 36 38,5 37 36,5 36 37 d i 1,5 1,7 1,0 1,2 1,5 0,5 1,0 1,3 0,7 2,0 A média das diferenças é igual a 1, 19 o. Ou seja, d = 1, 19 o. O desvio padrão das diferenças é estimado em 0, 39 o. Ou seja, = 0, 39 o S d Como n = 10, então ν = 10 1. O nível de conança é estabelecido. Se for 95%, temos que t C = 2, 26, pois ν = 10 1 = 9. Logo: I.C. 95% = [ ] 0, 39 1, 19 ± 2, 26 = [1, 19 ± 0, 28] = [0, 91 o ; 1, 47 o ] 10

continuação Interpretação: Há evidência estatística suciente para armar que o medicamento contribuiu para redução na temperatura térmica corporal, e esta variação foi de 0,91 a 1,47 graus celsius. Mais uma vez, o intervalo de conança forneceu evidência, pois neste intervalo também não tivemos o zero incluído. Ou seja, o medicamento experimental de fato contribui para a diminuição da temperatura corporal após sua admistração.

Intervalo de conança para proporções populacionais O intervalo de conança ao nível de conança de (1 α) 100% associado a um determinado grau de conança para a proporção populacional P (ou π) é dado por [ I.C. (1 α) 100% = n ] p ± t C pq Temos neste caso que p é a proporção amostral. Temos ainda que q = 1 p. Veremos esta descrição através de um exemplo.

Exemplo Suponha que um levantamento sobre etilismo em adultos num determinado bairro mostrou que, de 30 entrevistados, 18 armam ingerir bebidas alcóolicas com frequência. A estimativa para a proporção de indivíduos que habitualmente usam bebidas alcóolicas, com um grau de conança de 95%, seria efetuada da seguinte forma: p = 18 18 = 0, 6 q = 1 p = 1 = 0, 4 ν = 30 1 29 30 30 Logo, o intervalo de conança com 95% de conança (t C = 2, 05), por exemplo, é dado por [ ] I.C. 95% 0, 6 0, 4 = 0, 6 ± 2, 05 = [0, 6±0, 1833] = [0, 4167 ; 0, 7833] 30

Intervalo de conança para diferenças de proporções populacionais No caso da coleta de duas proporções populacionais obtidas de dois grupos distintos, o intervalo de conança é bastante parecido com o intervalo para a diferença de médias entre dois grupos distintos: [ I.C. (1 α) 100% pa q A = p A p B ± t C n A + p B q B n B ] O valor ν é obtido de forma idêntica ao caso da comparação de médias de dois grupos distintos.