Deseja-se saber a proporção de pacientes com hipertensão arterial entre os pacientes de um ambulatório de diabetes mellitus. Estudos anteriores de diabetes têm encontrado uma proporção de 18,5%. 1. Qual o tamanho da amostra de pacientes que devem ser examinados por meio de uma amostra casual simples para se estimar a proporção de hipertensos neste ambulatório? Considere tolerar um erro absoluto de até 5% entre esta estimativa e a proporção real. Considere também que esta estimativa não deva ter uma probabilidade maior que 47,5% de ser menor ou maior que a proporção real (ou seja, caia entre os 95% de eventos possíveis em torno da proporção da população)? 2. Se considerarmos que 18,5% seja uma proporção verdadeira de hipertensos entre diabéticos, qual a probabilidade de numa amostra de 30 pacientes se encontrar uma proporção de 30,2% ou ainda maior? Você acha que esta amostra seria uma boa representação da população? 3. Se ao invés de apenas 30 pacientes fossem examinados 100, como seria a situação: qual seria a probabilidade de se encontrar esta proporção de 30,2% ou ainda maior? Esta amostra maior seria uma melhor representação da população? Respostas Resposta 1: Considerando que o objetivo é calcular a proporção de hipertensos, recorremos à fórmula abaixo: 2 p(1 p) n z 2 erro que é derivada da padronização da diferença entre a estimativa pela amostra e o valor populacional (erro) admitindo-se que a estimativa caia dentro de um intervalo de probabilidades em torno da proporção da população (expresso pelo Zres) que se admite como espaço de variações aleatórias. O tamanho mínimo da amostra, considerando que o valor a ser encontrado não difira mais do que 5% (0,05) da proporção real que seria encontrada se todos os doentes deste ambulatório de diabetes fossem examinados (erro que se aceita) e que esse valor a ser encontrado, quando padronizado (transformado em Zres), não diste da real proporção de hipertensão mais do que um valor Página 1 de 7
é correspondente a 47,5% a mais ou a menos (95% das variações aleatórias em torno da proporção da população) 1,, (, ) 1,96 232., Note a racionalidade deste cálculo: expressar a variabilidade habitual por unidades de erro admissível, 1º) definindo o que é habitual, v.g. 1 ou 2 ou 1,96 vezes o padrão de desvio (o erro padrão) ao qual corresponde uma probabilidade arbitrada (se 95%, 47,5% de desvios à E e 47,5% de desvios à D, que corresponde ao um Zres 1,96) ; 2º) e definindo o que é erro admissível, v.g. uma proporção de 5% ou 10% ou 2,5% a mais ou a menos que a proporção da população, da classe. A equação acima n... pode ser lida como: Em quantas variações de probabilidade resulta admitir-se uma proporção de 18,5%, da qual decorre uma variação habitual (variância [p.(1-p)]) em unidades de erro admissível de 5%. Feito o cálculo, concluí-se: 232 variações de habituais de probabilidade em unidades de erro de proporções de 5% Logo, sabendo que se espera 232 variações, melhor ver 232 pessoas para dar oportunidade de todas as possíveis variações se apresentarem. A figura abaixo provê uma representação gráfica deste exercício: Na curva padronizada de densidade de probabilidade normal, a origem (zero) dos valores que representam eventos é a proporção da classe, a proporção da população da qual se toma uma amostra. Aqui supostamente 18,5%; O intervalo de 95% dos eventos possíveis em torno da proporção populacional é dado pelo intervalo de valores de Zres entre -1,96 e +1,96 lembra-se? Entre estes dois valores ocorrem 95% dos eventos possíveis. Se 1 Algumas vezes você verá referência a este valor crítico como α, que é o complemento do intervalo que se quer admitir para coisas iguais, a probabilidade admitida para considerar coisas diferentes. Quando estudarmos relações de ordem você se familiarizará com esta nomenclatura. Página 2 de 7
você não se lembrar disto, basta consultar a Tabela Z para identificar este valor ; O erro de estimativa de proporção (diferença entre o que se encontra na amostra e o que é o valor populacional) que pode ter qualquer valor conforme a tolerância a erro que se admita (no nosso exemplo fixado em uma proporção de 5%) deve delimitar em valores de proporção (%) o intervalo de 95% (probabilidade) de eventos possíveis em torno da proporção da população; Ou seja, se admito um erro de 5% e espero que a proporção populacional seja de 18,5%, então admito que minha estimativa possa ser algo entre 13,5% e 23,5%, mas fixo que entre esses dois pontos deve haver uma probabilidade de 95% de estimativas de proporção para amostras semelhantes a que examino, amostras de mesmo tamanho. Espaço em que deve cair a proporção estimada pela amostra: Em probabilidade: 95% em torno da proporção verdadeira, da população; Em resíduos padronizados: entre Zres-1,96 e Zres+1,96 Erro: máxima diferença entre valor estimado e valor real não deve superar 5%, quer para um lado ou outro - 5% + 5% Proporção padronizada de hipertensos na população 13,5% 23,5% 18,5% Zres -1,96 Zres +1,96 Resposta 2: Para conhecer a probabilidade associada a um valor de proporção de hipertensos, temos que transformar esta medida em resíduo padronizado da proporção Página 3 de 7
populacional, de forma a podermos consultar uma curva normal padronizada. Para padronizar uma proporção de amostra em relação a uma proporção de população, dividimos a diferença (o resíduo em relação à proporção da população, a proporção esperada) pelo Erro Padrão da Proporção (o mesmo procedimento que antes fazíamos para padronizar uma medida em relação a uma distribuição, só que agora ao invés de desvio padrão usamos erro padrão) Zres p π π ( 1 π ) n,302,185 0,185.(1,0185) 30 0,117 1,65 0,070893 Graficamente, nossa pergunta corresponde a responder qual é a área sob a curva densidade de probabilidade normal do ponto Zres1,65 para frente: 1,65 Nossa tabela informa a área entre 0 e 1,65: Página 4 de 7
Logo, a que queremos saber é o complemento deste valor. Se até Zres1,65 tenho uma probabilidade x, de 1,65 para frente tenho uma probabilidade 1-x. Pra descobrir quanto vale o x, vamos à tabela: Se a probabilidade de valores até 1,65 (que a tabela informa) é p 0,95, então a probabilidade de Zres1,65 ou mais é de p 1-0,95, ou seja p 0,05 (arredondando) ou p (de uma proporção maior ou igual a 30,2% ou igual a 1,65 quando expressa em unidades de erro padrão) 5%. Esta amostra parece ser de um grupo que ocupa uma posição muito extrema na distribuição amostral, deixando dúvida se é um bom grupo para representar a população. No gráfico abaixo você vê em vermelho o que seria uma distribuição de eventos de mesma variância que a população, mas com centro em Zres1,65 ao invés de Zres0: parece tratar-se de outra turma, não? Parece que tirar amostras daí na maior parte das vezes não vai representar bem a população, a classe, que imagino tenha 18,5% como proporção de hipertensos. Página 5 de 7
Resposta 3: Novamente, precisamos padronizar a proporção 30,2%, agora considerando que o Erro Padrão da Proporção deverá considerar uma amostra de tamanho 100: Zres p π π ( 1 π ) n,302,185 0,185.(1,0185) 100 0,117 0,03883 3,013153 3 Para um Zres 3, nem precisamos consultar a tabela! A probabilidade de valores como este ou ainda maiores é praticamente nula! Precisamente é p 0,001, 1 em 1.000! Isto nos sugere que apenas uma vez em cada mil um grupo de 100 pacientes desta população, cuja proporção real é 18,5%, poderia chegar a por acaso vir a apresentar uma proporção de 30,2% em amostras de 100 indivíduos - parece que esta amostra de 100 com proporção 30,2% de hipertensos é amostra muito esdrúxula de uma população cuja proporção de hipertenso seja 18,5%. Mais ainda, aumentar o tamanho de 30 para 100 em nada ajudou se a proporção encontrada na amostra continua muito distante daquela esperada pela proporção da população. Isto está nos contando que Página 6 de 7
Se quando aumentamos a amostra esperamos mais nos aproximar do universo da população e assim melhor estimar o valor de população (lembrase? Se a amostra for tão grande que cubra toda a população, a estimativa será igual à proporção da população) E tendo aumentado o tamanho da amostra ainda encontramos um valor muito diferente do esperado para a população Nossa conclusão deve ser de que este grupo do qual estou tomando amostras não deva ser mesmo um grupo daquela população de onde estou tomando proporções de população deve ser um grupo que pertença a outra população! Isto desperta uma curiosidade será que se consegue com estas contas descobrir quais grupos pertencem a quais populações, v.g. grupos de diabéticos reconhecidos por suas medidas de pressão arterial numa população geral reconhecida por esta mesma medida que você satisfará daqui há pouco, estudando relações de ordem. Oba! Veja no gráfico abaixo, onde vai parar uma distribuição com centro em Zres3: Página 7 de 7