Noções de Pesquisa e Amostragem André C. R. Martins 1
Bibliografia Silva, N. N., Amostragem probabilística, EDUSP. Freedman, D., Pisani, R. e Purves, R., Statistics, Norton. Tamhane, A. C., Dunlop, D. D., Statistics and Data Analysis, Prentice Hall. Barrentine, L. B., An Introduction to Design of Experiments, ASQ 2
Problemas Você precisa realizar estudos para buscar informações sobre os seguintes problemas: Estimar a altura média dos alunos da Usp Leste, assim como o desvio padrão da altura. Mesmo problema, mas para todos os alunos da sua sala. Determinar a opinião dos estudantes da Usp Leste sobre quem dirige melhor, homens ou mulheres. Você quer estimar a opinião de estudantes universitários brasileiros sobre as políticas educacionais do país. No entanto, por motivos quaisquer (econômicos, falta de pessoal/recursos, pressa, ser realmente impossível, etc.), você não tem condições de obter todos os dados possíveis, mas precisa trabalhar com uma amostra. Que cuidados e de que forma você deve realizar a amostragem para ter o melhor resultado possível na sua estimação? 3
Estimar a altura média dos alunos da Usp Leste, assim como o desvio padrão da altura. Suponha que você tem como obter a lista com o nome de todos os alunos, mas não a altura destes. Como proceder? 4
Amostragem Aleatória Simples Se você tem acesso a algum tipo de lista com todos os elementos de uma população, o problema da amostragem torna-se bem mais simples (em alguns casos, a lista pode não ser necessária). Suponhamos que você avalie que gostaria de ter uma amostra de 50 pessoas de uma população de 1.000 alunos. Tudo que você precisa fazer então é sortear, sem repetição, 50 números entre 1 e 1000 e obter os dados referentes a estes 5 elementos.
Cuidados no sorteio Para que possamos chamar uma amostragem de aleatória simples, devemos garantir que o sorteio obedeça algumas regras: Todos os elementos devem ter a mesma chance de serem sorteados. A ordem em que eles forem sorteados não importa. Não há elementos repetidos na amostra. 6
Vantagens Como você efetuou um sorteio com probabilidades iguais, em muitos casos, é possível calcular chances associadas a médias, desvios ou outras medidas de forma comparativamente simples. Todos os elementos entram com chances iguais, portanto não há nenhum grupo representado em excesso ou a menos, exceto por sorte. 7
Realizando o sorteio Existem várias formas para se efetuar o sorteio. Alguns livros trazem tabelas de números aleatórios, você pode utilizar moedas, dados ou cartas, desde que seja capaz de sortear qualquer elemento. Vários programas de computador possuem geradores de números aleatórios. As planilhas possuem funções que os geram que podem ser utilizadas neste caso. 8
Determinar a opinião dos estudantes da Usp Leste sobre quem dirige melhor, homens ou mulheres. Que cuidados adicionais você acha que valeria a pena se tomar aqui? 9
Amostragem Aleatória Estratificada No problema anterior, é muito provável que tenhamos dois estratos com características diferentes, a saber, a opinião de homens e de mulheres. A variabilidade entre os estratos (diferença de opinião entre homens e mulheres) é provavelmente bem maior do que as diferenças dentre as mulheres ou dentre os homens. Neste caso, vale a pena fazer pesquisas separadas em cada estrato, unificando-as no final. 10
Dada a menor variabilidade dentro de cada estrato, as incertezas da pesquisa serão menores. Além disto, obtém-se mais informação, pois teremos já pronto também um estudo sobre de que forma mulheres pensam e de que forma homens pensam. Assim, os efeitos que este fator podem ter podem ser observados como parte do estudo. 11
Você quer estimar a opinião de estudantes universitários brasileiros sobre as políticas educacionais do país. Certamente não existe uma lista com todos os estudantes universitários do país. Suponha então que você tem uma lista com as faculdades que existem no país. 12
Amostragem por Conglomerados (Cluster) Neste caso, você pode sortear, ao invés dos elementos que tem interesse direto, conjuntos maiores, como vizinhanças, bairros ou cidades e realizar a pesquisa nestes elementos sorteados. No exemplo, você sortearia uma amostra de faculdades a serem pesquisadas. 13
Suponha que você queira entrevistar 1000 universitários. Você poderia então: Sortear 50 faculdades, sorteando 20 estudantes em cada uma, a partir dos alunos inscritos nos cursos. Sortear 25 faculdades, sorteando 40 alunos em cada. Etc. 14
Pode haver mais níveis de conglomerados, por exemplo: Sorteie 20 faculdades, dentro de cada faculdade sorteie 10 turmas, dentro de cada turma, sorteie 5 alunos. 15
Amostragem por Conveniência e por Julgamento As amostragens discutidas anteriormente devem ser usadas sempre que possível, uma vez que elas permitem estimar erros na avaliação que se deseja fazer de forma razoavelmente simples. No entanto, por vezes, não é possível realizar a amostragem de acordo com qualquer destes padrões. 16
Por vezes, temos de nos contentar apenas com os elementos que conseguimos coletar de forma mais fácil (amostragem por conveniência) Outras, um especialista da área aponta elementos que ele considera significativos de uma boa amostra (julgamento). Em ambos os casos, é muito provável que a amostragem apresente vieses e não é possível estimar-se qual a certeza associada ao estimador. 17
Tipos de Estudos Estatísticos Estudos estatísticos podem ser divididos de diversas forma de acordo com suas características: De acordo com o objetivo: Comparativo (Analítico) Não comparativo (Descritivo) De acordo com a forma como os dados são obtidos na preparação: Observacionais Experimentais De acordo com o tipo de dados em relação ao tempo, um estudo observacional pode ser: Amostra Prospectivo Retrospectivo 18
Estudos Descritivos Um estudo descritivo tem por objetivo descrever as características de um grupo. Por exemplo, um estudo para medir a proporção de pessoas que vivem com menos de um salário mínimo ou para verificar a inflação para um determinado segmento da população. 19
Estudos Comparativos Em um estudo comparativo, deseja-se comparar a mesma característica entre grupos ou métodos diferentes, de forma a se verificar se há algum tipo de relação. Por exemplo, estudos para medir a eficiência de diferentes políticas econômicas ou comparar diferentes métodos de ensino. Um estudo comparativo deve sempre possuir um grupo de controle, ou seja, onde a(s) característica(s) que estamos estudando não esteja(m) presente(s), de forma a se poder tentar inferir o que é efeito desta característica. 20
Quanto ao Tempo Um estudo observacional pode ser descrito, de acordo com como o tempo em que as observações são feitas, como Amostragem Estudo Prospectivo Estudo Restrospectivo 21
Amostragem Trata do estudo das características de uma determinada população em um instante específico do tempo, como a opinião de um consumidor, ou a qualidade do equipamento produzido em uma fábrica. O objetivo, em geral, é utilizar alguma estatística da amostra (como a média amostral) para se estimar um parâmetro da população (a média da população). Se a população inteira for observada chama-se censo. 22
Motivos para se realizar uma amostragem: Um censo seria muito caro O teste a ser realizado é destrutivo, por exemplo, verificar-se-á as condições em que a peça a ser testada quebra. Uma amostragem, por vezes, fornece resultados mais precisos que um censo! 23
Estudo Prospectivo Um estudo prospectivo começa no presente com uma amostragem e segue o comportamento da amostra com o passar do tempo, por exemplo, observa-se em um grupo de crianças o comportamento de cada uma e estas são acompanhadas enquanto crescem e em sua vida adulta para se determinar se o comportamento em estudo estaria relacionado a diferentes chances de sucesso profissional. 24
Estudo Retrospectivo Um estudo retrospectivo também começa no presente, mas olha-se para o passado para se saber o que aconteceu com os dados antes. Estudos retrospectivos são, em geral, mais fáceis e baratos que prospectivos, mas apresentam mais problemas Lembrança do passado pode ser imprecisa. Não existe a possibilidade de ter algum controle sobre outras variáveis que possam afetar o estudo. 25
Estudo Observacional Em um estudo observacional, o pesquisador apenas observa as características nas quais está interessado, sem interferir no que está observando. Por exemplo, um estudo sobre a variação da luminosidade de algumas estrelas ou a verificação de se a população que consome uma determinada substância possui taxas diferentes de aparecimento de uma dada doença. 26
Estudo Observacional Isto significa que ele não tem controle sobre quaisquer variáveis que podem estar influenciando seus resultados. Se o objetivo for realizar um estudo comparativo, o pesquisador só poderá realmente medir associação, não causa e efeito. Ele pode obter evidência sobre causa e efeito, mas outros fatores podem ser a fonte da associação observada. 27
Estudo Experimental Ao contrário do estudo observacional, num estudo experimental o pesquisador interfere no processo que ele está estudando, de forma a controlar as condições do estudo. O objetivo é conseguir isolar a variável de interesse de outros efeitos que poderiam confundir os resultados, através de um experimento onde a única diferença entre os grupos estudados são as variáveis em questão, exceto por pura chance. 28
Objetivos Separar os fatores de forma a retirar a importância dos que não interessam. Selecionar a melhor combinação dos fatores em estudo. Se possível, ajustar um modelo que possa ser utilizado para fazer previsões ou controlar a resposta de forma a se atingir algum objetivo. 29
Controle Já mencionamos a necessidade de haver um grupo de controle para se comparar os resultados com o grupo de tratamento (os termos foram primeiro desenvolvidos em aplicações médicas, mas a lógica é a mesma, independente da área). Em um experimento, não apenas observa-se o que acontece com cada grupo; qual elemento que irá pertencer ao grupo de controle e qual será de um grupo de tratamento deve ser sorteado aleatoriamente, para que não haja outras variáveis que levam um elemento a estar em um grupo ou outro. 30
Placebo Os grupos de controle e tratamento devem ser idênticos em todos os aspectos, para evitar o efeito placebo. Num teste de um remédio, por exemplo, se você não receber um remédio ou receber um remédio falso, as chances de melhora são maiores no segundo caso, apenas por efeitos psicológicos. Para permitir a comparação, neste caso, todos os pacientes devem ser incapazes de dizer se eles estão em um grupo ou em oturo. 31
Duplo Cego Também é extremamente útil que o pesquisador não decida nem mesmo saiba que elemento está em que grupo, para que não haja diferenças na forma como ele trata cada elemento. 32
Estratégias Úteis no Desenho de Experimentos Pode-se preparar experimentos utilizando-se as estratégias abaixo: Blocos Análise de regressão Randomização 33
Blocos de Fatores Se um fator pode estar confundindo os resultados e este pode ser controlado, podese separar a sua influência dos resultados do experimento, dividindo-se a amostra em grupos que tenham valores iguais ou similares do fator e efetuando-se o estudo dentro de cada grupo (ou seja, grupos de tratamento e controle dentro de cada amostra) 34
Análise de Regressão Alguns fatores quantitativos que estejam atrapalhando não podem ser controlados, mas podem ser medidos. Neste caso, pode-se incluí-los em uma análise de regressão, ou seja, em um modelo que ajuste a melhor curva aos dados. Frequentemente, utilizamos uma regressão linear, ajustando uma reta de forma a medir se há uma tendência crescente ou decrescente, forte ou fraca. Estudaremos regressão mais tarde. 35