Amostragem Fonte: CORRAR, L. J.; THEÓPHILO, C. R.; Pesquisa Operacional para Decisão em Contabilidade e Administração, Editora Atlas, São Paulo, 2ª. Edição, 2010.
Objetivos: Neste capítulo, você aprenderá: A distinguir entre diferentes métodos de amostragem Compreender o processo de obtenção de amostras aleatórias Reconhecer as aplicações da teoria da amostragem em áreas do conhecimento tais como finanças, auditoria, contabilidade, marketing, etc Utilizar a amostragem como instrumento auxiliar nos campos científico e profissional.
População População: é o todo Também designado universo Podem ser indivíduos, firmas, produtos manufaturados, inventários, escolas, notas de aula, preços ou qualquer coisa que possa ser mensurada, contada ou ordenada por postos; Podem ser finitas ou infinitas; Finitas: os produtos de um supermercado, os livros de uma biblioteca Infinitas: produção futura de uma fábrica, nascimentos de insetos, extrações com reposição de bolas de uma urna. Consistem tipicamente em um processo que gera itens. Refere-se a um conjunto específico de circunstâncias; Ex: os alunos de uma sala de aula podem representar uma população da qual extrairemos amostras para análise; em outra situação os alunos da mesma sala de aula podem ser uma amostra de todos os alunos do colégio, ou de toda a universidade.
Amostra Estatística: Prof. André Carvalhal É a parcela do grupo que é examinada Amostra População
Censo x Amostra Censo: envolve estudar TODOS os elementos da população Quando a amostragem é mais vantajosa: Quando a população é infinita (processos que nunca terminam) A amostra pode ser mais atualizada que o censo Quando a população tende a se modificar com o tempo Quando a população tende a se deteriorar (ex: frutas perecíveis, pesquisa em propagação de doenças) Testes destrutivos (lâmpadas, munição, resistência de concreto) Quando o custo do censo é proibitivo Quando o censo puder ter problemas de precisão (vários agentes coletores aumentam a chance de erros)
Censo x Amostra Quando o censo é mais vantajoso: Quando a população é pequena Quando o tamanho da amostra é grande em relação ao da população. Ex: quando há grande variabilidade na população a amostra terá que ser grande para ser representativa, neste caso o custo adicional para realizar o censo pode ser pequeno Se é necessário precisão completa Ex: contagem de dinheiro em guichês de bancos
Tipos de Métodos de Amostragens Amostra não-probabilística (ou não aleatória): Os itens ou indivíduos são selecionados sem conhecer suas respectivas probabilidades de seleção As teorias da estatística inferencial não se aplicam Exemplos de métodos: amostragem por conveniência e amostragem por julgamento Podem trazer problema de viés Amostra probabilística (ou aleatória): Itens selecionados com base em probabilidades conhecidas Permite que se faça inferências isentas de viés Na prática é difícil ou quase impossível obtê-la...... mas você deve tentar e reconhecer eventuais vieses da sua seleção.
Vantagens e Desvantagens Aleatória Vantagens a subjetividade do investigador não interfere na escolha da amostra possibilidade de definir o tamanho da amostra a partir da precisão e grau de confiança desejado Não aleatória menor custo menor necessidade de pessoal Desvantagens dificuldade de obter listagens completas da população a seleção aleatória pode gerar amostra dispersa geograficamente aumentando os custos do estudo há unidades no universo que não tem possibilidade de serem escolhidos pode ocorrer viés de opinião pessoal menor tempo de estudo não se sabe com que grau de confiança as conclusões obtidas podem ser inferidas da população
Amostragem com ou sem reposição? Quando há a reposição cada elemento permanece com a mesma probabilidade de ser selecionado, igual a 1/N, onde N é o tamanho da população. Questão relevante quando tratamos de populações finitas. Se o tamanho da amostra é pequeno em relação à população a questão torna-se irrelevante. Uma regra prática é fazer a reposição quando o tamanho da amostra excede 5% do tamanho da população.
Amostragem com ou sem reposição? A extração de toda uma amostra de uma só vez equivale à amostragem sem reposição. Na amostragem com reposição é possível extrair um mesmo item mais de uma vez. Algumas situações em que a amostragem sem reposição é justificada: Quando os testes destroem os elementos; Quando o teste é muito caro, e a reposição pode implicar reaplicar o teste em uma mesma unidade.
Amostras probabilísticas e não probabilísticas Amostras probabilísticas ou aleatórias Obtida por meios que envolvem o acaso Cada elemento da amostra tem uma probabilidade conhecida e diferente de zero de ser escolhido Obtida por meio de processo aleatório => processo aleatório = quando você não consegue saber com antecedência quais serão os elementos que comporão a amostra O pesquisador não influencia a amostra Pode-se usar sorteios, tabelas de nos. aleatórios e programas de computador
Amostras probabilísticas e não probabilísticas Amostras não probabilísticas Os itens ou indivíduos são selecionados sem conhecer suas respectivas probabilidades de seleção As teorias da estatística inferencial não se aplicam Exemplos de métodos: amostragem por conveniência e amostragem por julgamento Podem trazer problema de viés
Tipos de Amostras Técnicas de Amostragem Probabilística ou Aleatória Não Probabilística ou Não Aleatória Simples Por conveniência Estratificada Por julgamento Sistemática Por quotas Conglomerado
Amostragem aleatória simples Etapas: Atribui-se um no. para cada elemento da população Determina-se o tamanho da amostra adequado Emprega-se um procedimento aleatório, para sortear os elementos que irão compor a amostra Se a amostragem for com reposição o elemento volta para a população, se não o sorteio continua até atingir o tamanho da amostra Função excel: aleatórioentre Função excel: procv Ferramenta de análise excel: amostragem Statistics for Managers Using Microsoft Excel, 5e 2008 Pearson Prentice-Hall, Inc. Chap 5-14
Amostragem Sistemática Conveniente quando a população está ordenada sob algum critério: fichas de um fichário, lista telefônica Calcula-se o intervalo de amostragem N/n aproximando-se para o inteiro mais próximo: a. Sorteia-se um no. aleatório x entre 1 e a. A amostra será composta dos elementos x; x+a; x+2a;... Exemplo: N=1000, n=200. Logo: a=1000/200=5 se 3 for o no. sorteado entre 1 e 5 os elementos da população numerados por 3, 8, 13,..., 998 irão compor a amostra Frequentemente utilizada em pesquisas de opinião, realizadas em locais públicos Vantagens: amostras mais dispersas, fácil de ser conduzida Desvantagem: a presença de periodicidades ocultas pode produzir resultados tendenciosos
Amostragem aleatória estratificada A população é dividida em subgrupos e a amostragem aleatória é feita em cada subgrupo Muito aplicada em populações com subgrupos homogêneos internamente, mas diferentes entre si Tamanhos de amostra para alocação proporcional População de tamanho N k estratos de tamanhos N 1, N 2,..., N k Amostras de tamanhos n 1, n 2,..., n k Ni ni n para i 1,2,... e k N
Amostragem por conglomerado A população é subdividida em várias partes, e algumas dessas subdivisões ou conglomerados são selecionados aleatoriamente para integrar a amostra global. Os subgrupos devem ser tão heterogêneos quanto a população. Como se fossem grupos populacionais em escala reduzida. Útil quando a população é muito dispersa e a realização da amostragem aleatória simples revelar-se dispendiosa e demorada. Dentro de cada conglomerado pode-se selecionar todos ou alguns elementos. Se forem selecionados alguns, diz-se que a amostragem é em dois estágios. Não exige a listagem de todos os elementos da população, apenas os dos conglomerados selecionados.
Conglomerado x Aleatória Estratificada Conglomerado Heterogeneidade dentro deles Homogeneidade entre grupos Aleatória estratificada Estratos com características semelhantes Homogeneidade dentro dos estratos Heterogeneidade entre os estratos
Amostragem por Conveniência Quando a participação é voluntária Quando os elementos da amostra são escolhidos por uma questão de conveniência ou simplicidade A amostra não é representativa da população Deve ser empregada somente em casos especiais Exemplo: um pesquisador deseja estudar o comportamento dos preços de imóveis residenciais em lançamento em Florianópolis e desenvolve sua amostragem coletando dados em dois jornais da cidade
Amostragem por Julgamento A amostra é escolhida segundo opinião de um especialista Não deve ser considerada representativa da população Exemplo: em uma pesquisa sobre os livros mais relevantes para o mestrado e doutorado em Contábeis um especialista elaborou a lista dos alunos a serem entrevistados.
Amostragem por Quotas Difere da amostragem estratificada pelo fato da seleção dos elementos da população não ser aleatória As vantagens do método estão na rapidez, economia e facilidade de administração. Exemplo: uma empresa deseja lançar um novo produto de emagrecimento e o público-alvo são mulheres entre 15 e 40 anos das classes sociais A e B. A população é dividida em categorias de acordo com as variáveis de controle (idade e classe social). Uma amostra de 5% da população recebe uma amostra grátis do produto.
Nomenclatura Estatística Parâmetro Amostra População E usamos estatíticas das amostras para estimar parâmetros da população
Notação Medida Amostra População Média Desvio Padrão Variância x x 2 x 2 Tamanho n N Statistics for Managers Using Microsoft Excel, 5e 2008 Pearson Prentice-Hall, Inc. Chap 5-23
Variabilidade Amostral Você pode retirar várias amostras diferentes de uma mesma população!! Cada amostra pode te dar diferentes valores para a média, desvio-padrão ou proporção. Como saber então qual o valor do parâmetro na população? É preciso conhecer como a estatística varia de amostra para amostra...
Exemplo Vamos supor uma população finita com 5 elementos, que são os números 3, 5, 7, 9, 11. Neste caso, é fácil calcular os parâmetros média e desvio padrão da população: 3 5 7 9 11 A média dessa população é 7 5 E seu desvio padrão é 2 2 2 2 3 7 5 7 7 7 9 7 11 7 5 2,83 Vamos supor que eu não pudesse calcular diretamente a média da população e tivesse que fazê-lo através de estimativas com base em amostras de 2 elementos... 2 8
Exemplo Quantas amostras diferentes seria possível montar? 5 2 5! 2!3! 5x4x3! 2x3! 10 Vamos listar as amostras e suas médias: Amostras 3 e 5 3 e 7 3 e 9 3 e 11 5 e 7 5 e 9 5 e 11 7 e 9 7 e 11 9 e 11 Médias 4 5 6 7 6 7 8 8 9 10 Cada amostra tem uma probabilidade de ser escolhida igual a 1/10.
Exemplo Posso calcular a probabilidade de encontrar cada um dos diferentes valores de média nas amostras, que será: x Prob. 4 1/10 5 1/10 6 2/10 7 2/10 8 2/10 9 1/10 O que 10 acabamos 1/10 de construir foi uma distribuição de probabilidades da média da amostra 0,25 0,20 0,15 0,10 0,05 0,00 Mas isso nada mais é do que uma Distribuição Amostral!! 4 5 6 7 8 9 10
Distribuição Amostral Uma distribuição amostral é uma distribuição de probabilidades que indica até que ponto uma estatística amostral tende a variar devido a variações casuais na amostragem aleatória.
Voltando ao Exemplo No nosso exemplo qual a média das médias nas amostras? E qual o desvio-padrão dessas médias? x 1 1 2 2 2 1 1 4 5 6 7 8 9 10 7 10 10 10 10 10 10 10 É igual a média da população 2 x x 2 2 2 2 2 2 4 7 5 7 6 7 7 7 8 7 9 7 10 7 3 1 10 1 10 É menor que o desvio padrão da população 2 10 2 10 2 10 1 10 x 2 1 10 Prob. 4 1/10 5 1/10 6 2/10 7 2/10 8 2/10 9 1/10 10 1/10 3
Vamos ver outro exemplo, agora fazendo a amostragem com reposição...
Exemplo 2 Suponha uma população (simplificada) de quatro pessoas de seu departamento. Tamanho da população N=4 Variável aleatória, X, é a idade dos indivíduos Valores de X: 18, 20, 22, 24 (anos)
Exemplo 2 Parâmetros da distribuição da População: μ X i N 18 20 22 24 4 21 P(x).3.2.1 σ (X i N μ) 2 2.236 0 18 20 22 24 A B C D x Distribuição Uniforme
Exemplo 2 Agora, considere todas as amostras possíveis de tamanho n=2 1o. Obs. 2 o. Observação 18 20 22 24 18 18,18 18,20 18,22 18,24 20 20,18 20,20 20,22 20,24 22 22,18 22,20 22,22 22,24 24 24,18 24,20 24,22 24,24 16 amostras possíveis (amostragem com reposição) 1o. Obs. 16 médias amostrais 2 o. Observação 18 20 22 24 18 18 19 20 21 20 19 20 21 22 22 20 21 22 23 24 21 22 23 24
Exemplo 2 Distribuição Amostral de todas as médias amostrais 1 o. Obs 16 médias amostrais 2 o. Observação 18 20 22 24 P(X).3 Distribuição das médias amostrais 18 18 19 20 21.2 20 19 20 21 22.1 22 20 21 22 23 24 21 22 23 24 0 18 19 20 21 22 23 24 (não é mais uniforme) _ X
Exemplo 2 Parâmetros da distribuição amostral da média μ X X N i 18 19 21 16 24 21 σ X (X i μ N X ) 2 (18-21) 2 (19-21) 16 2 (24-21) 2 1.58
Exemplo 2 μ P(X).3.2.1 0 População N = 4 21 σ 2.236 18 20 22 24 A B C D Distribuição Amostral da Média n = 2 μ _ X P(X).3.2.1 21 σ X 1.58 0 X 18 19 20 21 22 23 24 _ X
Por enquanto... pelo menos em nossos exemplos..., a média da distribuição amostral de x, é igual a, a x x, a média da distribuição amostral de, é igual a, a média da população; x, o desvio padrão da distribuição x amostral de, é menor do que, o desvio padrão populacional. Observem a notação!!!!
Mas... será que sempre podemos enumerar todas as amostras possíveis para então analisar a média amostral e quanto ela está próxima da média da população? Não!! Alguns teoremas solucionam a questão... Teorema 1: Para amostras aleatórias de tamanho n extraídas de uma população com média e o desvio padrão, a distribuição amostral de x tem média x.
Erro Padrão Desvio padrão da estimativa Erro padrão: quanto menor, melhor! Erro padrão da média para populações infinitas e finitas: x n ou x n N N n 1 Você lembra? Fator de correção para populações finitas!! O que acontece se o erro padrão é pequeno? E se ele for grande? O que determina o tamanho do erro padrão?
Veja que interessante... No primeiro exemplo dessa aula tínhamos uma população com 5 elementos: 3, 5, 7, 9, 11 A média e o desvio padrão da população eram: 7 e Aí, listamos todas as amostras possíveis e calculamos a média e o desviopadrão (erro padrão) das médias das amostras: x 7 e Mas, se calcularmos o erro-padrão pela expressão do slide anterior, teremos: x n N n N 1 8 2 x 5 5 8 3 2 1 83 24 As expressões nos dão o erro padrão sem que seja necessário listar todas as amostras possíveis, calcular suas médias e então obter o erro padrão da média das amostras!! 3
Efeito do tamanho da amostra sobre uma distribuição amostral À medida que aumenta o tamanho da amostra, há variabilidade cada vez menor entre as médias das amostras; A média da distribuição amostral é igual ao parâmetro da população, ou seja, é igual à média da população; Na medida em que o tamanho da amostra aumenta, a distribuição dos resultados amostrais tende para a forma da distribuição.
Distribuição Amostral da Média Erro Padrão: População Normal Se a população é normal com média μ e desvio-padrão σ, a distribuição amostral da média é também distribuída normalmente com μ X μ e σ X (Assume-se que a amostragem é feita com reposição ou sem reposição em uma população infinita) σ n
Distribuição Amostral da Média Valor Z: População Normal Valor-Z para a distribuição amostral da média: Z (X μ σ X X ) (X μ) σ n onde: X μ σ = média da amostra = média da população = desvio padrão da população n = tamanho da amostra
Distribuição Amostral da Média Propriedades: População Normal μ x μ x (i.e. é não viesada ) População segue Distribuição Normal Distribuição Amostral da média segue Distribuição Normal (com a mesma média) μ μ x x x
Distribuição Amostral da Média Propriedades: População Normal Para amostragem com reposição: À medida que n aumenta, σ x diminui Maior tamanho de amostra Menor tamanho de amostra μ x
Teorema do Limite Central Para grandes amostras, a distribuição amostral da média pode ser muito bem aproximada por uma distribuição normal, lembrando que para populações infinitas: Podemos então dizer formalmente que: x e Se x é a média de uma amostra aleatória de tamanho n de uma população infinita com a média μ e o desvio padrão σ e se n é grande então z x x / tem aproximadamente a distribuição normal padrão. n n
Teorema do Limite Central Se aplica a populações infinitas...... e a populações finitas em que n é grande mas representa uma porção pequena da população, ou seja, n/n é pequeno Para a maioria das distribuições, n > 30 dará uma distribuição amostral próxima da normal Para distribuições aproximadamente simétricas, n > 15, a distribuição amostral também estará próxima da normal Quando sabemos que a população tem distribuição normal, a distribuição amostral da média pode ser aproximada pela normal, independentemente do tamanho de n.
Teorema do Limite Central Estatística: Prof. André Carvalhal À medida em que o tamanho da amostra aumenta (n 30)... X
Teorema do Limite Central Estatística: Prof. André Carvalhal À medida em que o tamanho da amostra aumenta (n 30)... A distribuição amostral tornase praticamente normal. X
Teorema do Limite Central Estatística: Prof. André Carvalhal À medida em que o tamanho da amostra aumenta (n 30)... x n A distribuição amostral tornase praticamente normal. x X
Distribuições de Amostragens População não-normal Distribuição da População Distribuição das amostras (aproxima-se da normal quando n cresce) Amostra pequena μ Amostra grande x μ x x Statistics for Managers Using Microsoft Excel, 5e 2008 Pearson Prentice-Hall, Inc. Chap 7-51
Distribuição Amostral da Média Exemplo Suponha uma população com média μ = 8 e desvio-padrão σ = 3. Suponha uma amostra aleatória de tamanho n = 36 é selecionada. Qual a probabilidade de que a média amostral esteja entre 7.75 e 8.25? Mesmo que a população não seja normalmente distribuída, o Teorema do Limite Central pode ser usado (n > 30). Então, a distribuição amostral da média é aproximadamente normal com σ 3 μ x 8 σ x 0.5 n 36
Distribuição Amostral da Média Exemplo Primeiro, vamos calcular os valores-z para 7.75 e 8.25. Z Z 7.75-8 0.5 3 36 8.25-8 0.5 3 36 Agora, usando uma tabela de probabilidades da Distribuição Normal teremos: P(7.75 μ 8.25) P(-0.5 Z 0.5) X 0.3830
Distribuição Amostral da Média Exemplo Distribuição da População = 2(.5000-.3085) = 2(.1915) Amostra μ 8 X = 0.3830 Distribuição Amostral Distribuição Normal Padrão 7.75 8.25 μ X 8 x -0.5 0.5 μ z 0 Z
Distribuição Amostral da Proporção A proporção da população com determinada característica é denotada por π. A proporção da amostra ( p ) com esta característica dá uma estimativa de π: p X n número de itens na amostra com a característica de interesse tamanho da amostra 0 p 1 p segue uma Distribuição Binomial (Assume-se que a amostragem é feita com reposição ou sem reposição em uma população infinita)
Distribuição Amostral da Proporção Erro padrão para a proporção: Z σ p (1 ) n Valor-Z para a proporção: p σ p p (1 ) n
Distribuição Amostral da Proporção Exemplo Se em um plebiscito a proporção de votantes à favor da Proposta A é π =.4, qual a probabilidade de que em uma amostra de 200 pessoas a proporção de votantes a favor esteja entre.40 and.45? Em outras palavras, se π =.4 e n = 200, qual a P(.40 p.45)?
Distribuição Amostral da Proporção Exemplo σ p Encontre : σ p (1 ) n.4(1.4) 200.03464 Converta para a Normal Padronizada: P(.40 p.45).40.40 P Z.03464 P(0 Z 1.44).45.40.03464
Distribuição Amostral da Proporção Exemplo Use a tabela de probabilidade Normal acumulada: P(0 Z 1.44) = P(Z 1.44) 0.5 =.4251 Distribuição Amostral Distribuição Normal Padronizada.4251 Padronize.40.45 0 1.44 p Z