Bioestatística Aula 4 Anderson Castro Soares de Oliveira Anderson Bioestatística 1 / 32
Amostragem A amostragem é um campo da estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo de uma pequena parte de seus componentes, uma amostra. A amostragem é naturalmente usada em nossa vida diária Exemplos: Para verificar o tempero de um alimento em preparação, podemos provar (observar) uma pequena porção. A detectação das condições de um paciente por meio de um exame de sangue. O objetivo é sempre o mesmo: obter informações sobre o todo, baseando-se no resultado de uma parte Anderson Bioestatística 2 / 32
Amostragem Pontos importantes: É muito dispendioso entrevistar cada pessoa de toda uma população; recorremos, então, as amostras; Usa-se a proporção de pessoas em uma amostra, portadoras de determinada característica, para estimar a proporção, na população das que tem essa característica. O melhor método de escolha de uma amostra é a escolha aleatória, isto é, que toda amostra possível tenha a mesma chance de ser escolhida. Antes de se proceder a observação de uma determinada população surge a questão se a amostragem será com ou sem reposição. Se o tamanho da amostra é insignificante em relação à população o impacto da reposição será desprezível, Se a amostra for grande então a reposição ou não pode causar um impacto significativo no resultado da probabilidade. Anderson Bioestatística 3 / 32
Amostragem Pontos importantes: Como as características das populações estatísticas variam, às vezes, é necessário adequar esta população estatística para submetêla a um critério de seleção possível, sem, contudo, perder seu caráter aleatório. Anderson Bioestatística 4 / 32
Amostragem Amostragem é o processo de seleção de uma amostra, que possibilita o estudo das características da população. Os objetivos principais de amostragem são fornecer dados que permitam fazer inferências para uma população com base na análise de uma amostra. Em se tratando de amostra, a preocupação central é que ela seja representativa. Para obter informações através de um levantamento amostral, temos imediatamente dois problemas: Definir cuidadosamente a população de interesse Selecionar a característica que iremos pesquisar. Anderson Bioestatística 5 / 32
Unidade Amostral Unidade amostral é a unidade na qual são observadas e medidas as características quantitativas e qualitativas da população. A amostra é composta pelo conjunto de unidades amostrais. Cada unidade amostral gera uma única observação da variável de interesse. As unidades amostrais podem ser diversas, ex.: um animal, uma clinica, uma fazenda. Anderson Bioestatística 6 / 32
Fases do Levantamento por Amostragem Fase 1 Formular o problema: Qual objeto em estudo será considerado; Definir a população de estudo; Definir o objetivo (o que significa explicitar com precisão as evidências pretendidas e o uso do conhecimento adquirido); Definir as variáveis (identificar as características) que serão observadas e analisadas; Fase 2 Plano de amostragem: Definir a unidade amostral; Definir tipo de amostragem; Definir critério de inclusão de indivíduos na amostra; Calcular o tamanho da amostra. Fase 3 Análise dos dados: análise estatística e interpretação dos resultados. Anderson Bioestatística 7 / 32
Tipos de Amostra Amostragem não-probabilísticas: Critério de escolha é definido pelo investigador; Não permitem a inferência populacional (não-representativas); Não permitem a comprovação de hipóteses. Amostragem probabilísticas: Cada unidade amostral tem probabilidade igual de ser selecionada (base da amostra aleatória); Permitem a inferência populacional (representatividade populacional). Anderson Bioestatística 8 / 32
Tipos de Amostragem não-probabilísticas Amostragem por conveniência Amostragem intencional Anderson Bioestatística 9 / 32
Amostragem por Conveniência Amostragem por conveniência é quando a seleção da unidades de amostrais são feitos pelas amostras de mais fácil acesso. Quando a conveniência é o principal critério para a seleção de uma amostra, é muito improvável que a amostra seja verdadeiramente representativa da população do estudo, resultando em estimativas tendenciosas. Por exemplo, uma pesquisa pretende determinar estimar a prevalência claudicação em bovinos numa determinada propriedade: Sabe-se que existem 100 animais nessa propriedade. Se for escolhido os 10 primeiros animais que entrarem em uma sala de ordenha, a amostra pode subestimar a prevalência? Anderson Bioestatística 10 / 32
Amostragem Intencional Amostragem intencional é quando o investigador se dirige intencionalmente a um grupo de elementos dos quais deseja saber opinião. Seleciona-se um subgrupo da população, que com base nas informações disponíveis, possa ser considerado representativo de toda a população. Por exemplo, um veterinário deseja realizar um novo teste de tuberculose em vários rebanhos, para isso ira tomar amostras de sangue para obter titulação de anticorpos contra várias bactérias e vírus. Para isso toma-se somente um representante de cada rebanho que tenha sido diagnosticado com tuberculose. Anderson Bioestatística 11 / 32
Tipos de Amostragem probabilísticas Amostra aleatória simples Amostra sistemática Amostra estratificada Amostra por conglomerados Anderson Bioestatística 12 / 32
Amostra aleatória simples - AAS Uma amostra aleatória é selecionada a partir do quadro amostral (lista, cadastro) É utilizada para obter uma amostra representativa quando os elementos da população são todos homogêneos. A característica principal é que todos os elementos da população têm igual probabilidade de pertencer á amostra. Procedimento: A amostragem aleatória simples pode ser realizada numerando-se a população de 1 a N e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa seqüência, os quais corresponderão aos elementos pertencentes á amostra. Anderson Bioestatística 13 / 32
Amostra aleatória simples - AAS Exemplo: Selecionar 5 animais aleatóriamente de um grupo de 10 animais Notes Sorteia-se 5 números aleatórios: 2, 4, 5, 8, 10. Anderson Bioestatística 14 / 32
Amostra sistemática - AS Deve ser utilizada quando os elementos da população já estão ordenados, não há necessidade de construirmos um sistema de referência, para selecionarmos a amostra É usada quando todos os elementos são homogêneos e aumenta a representatividade da amostra dando maior cobertura à população. Os elementos da população já estão ordenados, não há necessidade de construirmos um sistema de referência, para selecionarmos a amostra. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, uma linha de produção, etc. Procedimento: Os indivíduos são selecionados com base em um intervalo (I) que pode ser definido inicialmente ou, se conhecidas as dimensões da população (N) e o tamanho da amostra (n), é definido por: I = N/n Notes Anderson Bioestatística 15 / 32
Amostra sistemática - AS Exemplo: Selecionar 5 animais aleatóriamente de um grupo de 10 animais Obter o intevalo I = 10/5 = 2, Sortear um numero entre 1 e 2, Por exemplo sorteia 1, assim, a amostra será composta pelo indíviduos 1, 3, 5, 7 e 9 Anderson Bioestatística 16 / 32
Amostra estratificada - AE Muitas vezes a população se divide, em sub-populações ou estratos (idade, sexo, dimensão do rebanho, distribuição geográfica...), É razoável supor que em cada estrato a variável de interesse (sendo estudada) apresente um comportamento substancialmente diverso Melhora a representatividade da amostra quando os elementos da população são heterogêneos, porém, podem ser agrupados em subpopulações (ESTRATOS) contendo elementos homogêneos. Procedimento: Na amostragem estratificada a população é dividida em grupos ou estratos contendo elementos homogêneos e as amostras são retiradas separadamente de cada um desses grupos por amostragem aleatória simples ou sistemática Anderson Bioestatística 17 / 32
Amostra estratificada - AE Exemplo: Um Estudo para verificar a produção de uma população de vacas leiteiras de duas raças A e B, nesse caso devido a variabilidade genética que afeta o volume de leite pode-se utilizar a estratificação. Notes Anderson Bioestatística 18 / 32
Amostra por conglomerado Amostra por conglomerado é tipo de amostragem é aplicado a um nível agregado (grupo) de unidades individuais. Na amostragem por conglomerado os elementos da população estão reunidos em grupos (conglomerados) e alguns destes conglomerados são sorteados para compor a amostra. Os conglomerados são internamente muito diferentes, mas de conglomerado para conglomerado existe certa semelhança. Pode-se ter conglomerados de tamanhos iguais ou diferentes. Usada quando a população pode ser dividida em subpopulações (conglomerados) heterogêneos representativos da população global Anderson Bioestatística 19 / 32
Amostra por conglomerado Procedimento: O primeiro passo para se usar este processo é especificar conglomerados apropriados. Após isso, pode-se sortear o conglomerado por meio de amostragem aleatória simples ou sistemática Dentro de cada conglomerado pode-se sortear os indivíduos a serem selecionados ou trabalhar com todos os indivíduos. Anderson Bioestatística 20 / 32
Amostra por conglomerado Exemplo: Um estudo para verificar a prevalência de E.coli em leitões. Não tem acesso diretamente aos leitões mas tem acesso as mães. Assim, pode-se considerar a Porca como um conglomerado. Seleciona-se aletoriamente uma porca e amostra todos os leitões Anderson Bioestatística 21 / 32
Determinação de tamanho de amostra Para determinar o tamanho da amostra é necessário estabelecer o tipo de variável e o método de amostragem a ser utilizado. Outro fator importante para determinar o tamanho da amostra é o precisão da estimativa a ser obtida. A precisão da estimativa é associada ao erro amostral. o erro amostral corresponde à diferença entre as estimativas amostrais e os parâmetros populacionais, ocorrendo em qualquer tipo de pesquisa ou experimento; Anderson Bioestatística 22 / 32
Tamanho de amostra para proporção (prevelência) Considerando uma amostra aleátoria simples considerando população infinita n = z 2 p(1 p) α 2 d 2 p é a proporção de sucessos ou prevelência d é a margem de erro ou erro máximo da estimativa z α 2 é um valor tabelado da distribuição normal. Anderson Bioestatística 23 / 32
Tamanho de amostra para proporção (prevelência) Um estudo quer estimar a soroprevalência de Brucella abortus em uma população de gado. Uma estimativa da prevalência oculta de B. abortus nesta população é de 0, 15. Com uma confiança de 95% de uma margem de erro de 10% calcular o tamanho da amostra. Temos z α 2 = 1, 96, p = 0, 15, d = 0, 10, assim 0, 15(1 0, 15) n = 1, 96 0, 10 2 = 49 Anderson Bioestatística 24 / 32
Tamanho de amostra para proporção (prevelência) Considerando uma amostra aleátoria simples considerando população finita z 2 α p(1 p)n 2 n = (N 1)d 2 + z 2 α p(1 p) 2 p é a proporção de sucessos ou prevelência d é a margem de erro ou erro máximo da estimativa z α 2 é um valor tabelado da distribuição normal. Anderson Bioestatística 25 / 32
Tamanho de amostra para proporção (prevelência) Em alguns casos a determinação de prevalência de doença é feita por meio de testes diagnóstico para identificar a doença, e esses testes não são Para determinar o tamanho de amostra nesses casos deve-se levar em consideração a sensibilidade e a especificidade do teste Anderson Bioestatística 26 / 32
Tamanho de amostra para proporção (prevelência) Em alguns casos a determinação de prevalência de doença é feita por meio de testes diagnóstico para identificar a doença, e esses testes não são Para determinar o tamanho de amostra nesses casos deve-se levar em consideração a sensibilidade e a especificidade do teste n = ( z α 2 d p é a prevelência ) 2 [se p + (1 esp)(1 p)][(1 se p) (1 esp)(1 p)] (se + esp 1) 2 d é a margem de erro ou erro máximo da estimativa z α 2 é um valor tabelado da distribuição normal. se é a sensibilidade do teste esp é a especificidade do teste Anderson Bioestatística 26 / 32
Tamanho de amostra para proporção (prevelência) Um estudo deseja estimar a prevalência de uma doença numa rebanho de vaca leitera, para isso será utilizado um teste diagnóstico com sensibilidade de 90% e especificidade de 80%. Uma estimativa da prevalência nesta população é de 0, 30, com uma confiança de 95% de uma margem de erro de 5% calcular o tamanho da amostra. Temos z α = 1, 96, p = 0, 30, d = 0, 05, se = 0, 90, esp = 0, 80, 2 assim n = ( ) 1, 96 2 [0, 90 0, 30 + (1 0, 80)(1 0, 30)][1 0, 90 0, 30 (1 0, 80)(1 0, 30)] 0, 05 = 758.5984 (0, 90 + 0, 80 1) 2 Anderson Bioestatística 27 / 32
Tamanho de amostra para proporção (prevelência) Quando temos uma amostragem estratificada, pode-se calcular o tamanho da amostra pela amostras aleatórias simples, e dividir proporcionalmente dentro de cada estrato. Um estudo deseja a prevalência da brucelose em fazendas numa região: O numero de animais foram estraficados de acordo com o tamanho da fazenda(pequeno, médio e grande). O tamanho da da população é 80000 O número de animais em cada estrato são 15000, 25000 e 40000 (respectivamente). Uma estimativa da prevalência nesta população é de 0, 20 Com uma confiança de 95% de uma margem de erro de 5% calcular o tamanho da amostra. Anderson Bioestatística 28 / 32
Tamanho de amostra para proporção (prevelência) Fazendo o calculo do tamanho da amostra aleatória simples teriamos n = 322 Assim 322/8000 = 0, 004025 Amostra em pequenas fazendas n 1 = 0, 004025 15000 = 60 Amostra em pequenas fazendas n 2 = 0, 004025 25000 = 101 Amostra em pequenas fazendas n 3 = 0, 004025 80000 = 161 Anderson Bioestatística 29 / 32
Tamanho de amostra para proporção (prevelência) Quando temos uma amostragem por conglomerado pode-se seguir os seguintes passos: Calcular o tamanho da amostra n0 pela amostras aleatórias simples Fazer a correção do tamanho da amostra para o efeito do desenho (deff ) na amostra de conglomerados n = n 0 deff Fixar um numero de elementos dentro de cada conglomerado nc Determinar o numero m de conglomerados a serem amostrados m = n n c sendo n c o tamanho da amostra dentro de cada conglomerado Anderson Bioestatística 30 / 32
Tamanho de amostra para proporção (prevelência) Um estudo deseja a prevalência hepatite tipo E em suinos em pequenas propriedades de um município. Uma estimativa da prevalência nesta população é de 0, 80 Com uma confiança de 95% de uma margem de erro de 5% calcular o tamanho da amostra. Podemos calcular selecionar a amostra em 2 estágios: propriedades e suínos. Para calcular o tamanho da amostra: n 0 = z 2 p(1 p) 2 0, 80 0, 20 α 2 d 2 = (1, 96) (0, 05) 2 = 245, 8534 246 Anderson Bioestatística 31 / 32
Tamanho de amostra para proporção (prevelência) Tomando o efeito do desenho deff = 1, 5, temos n = 245 1, 5 = 369 Determinar o numero m de conglomerados a serem amostrados m = n n c Fixando n c = 10 suínos em cada propriedade temos, o numero de propriedades a serem amostradas é: m = 369 10 = 36, 9 37 Anderson Bioestatística 32 / 32