O erro da pesquisa é de 3% - o que significa isto? A Matemática das pesquisas eleitorais



Documentos relacionados
ActivALEA. ative e atualize a sua literacia

CAPÍTULO 5 - INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA

1.4- Técnicas de Amostragem

Lista 9 - Introdução à Probabilidade e Estatística

CAPÍTULO 8 - Noções de técnicas de amostragem

DISTRIBUIÇÃO AMOSTRAL DA MÉDIA E PROPORÇÃO ESTATISTICA AVANÇADA

PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE TRANSPORTES E GESTÃO TERRITORIAL PPGTG DEPARTAMENTO DE ENGENHARIA CIVIL ECV

Séries de Potências AULA LIVRO

CAP. I ERROS EM CÁLCULO NUMÉRICO

PRESTAÇÃO = JUROS + AMORTIZAÇÃO

Estatística stica para Metrologia

Jackknife, Bootstrap e outros métodos de reamostragem

Carteiras de Mínimo VAR ( Value at Risk ) no Brasil

Capitulo 6 Resolução de Exercícios

Testes de Hipóteses para a Diferença Entre Duas Médias Populacionais

INTRODUÇÃO. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ...

A seguir, uma demonstração do livro. Para adquirir a versão completa em papel, acesse:

JUROS COMPOSTOS. Questão 01 A aplicação de R$ 5.000, 00 à taxa de juros compostos de 20% a.m irá gerar após 4 meses, um montante de: letra b

VII Equações Diferenciais Ordinárias de Primeira Ordem

O QUE SÃO E QUAIS SÃO AS PRINCIPAIS MEDIDAS DE TENDÊNCIA CENTRAL EM ESTATÍSTICA PARTE li

Prof. Eugênio Carlos Stieler

SUMÁRIO 1. AMOSTRAGEM Conceitos básicos 4

Conceito 31/10/2015. Módulo VI Séries ou Fluxos de Caixas Uniformes. SÉRIES OU FLUXOS DE CAIXAS UNIFORMES Fluxo de Caixa

Os juros compostos são conhecidos, popularmente, como juros sobre juros.

AMOSTRAGEM. metodologia de estudar as populações por meio de amostras. Amostragem ou Censo?

Introdução ao Estudo de Sistemas Lineares

Módulo 4 Matemática Financeira

5- CÁLCULO APROXIMADO DE INTEGRAIS 5.1- INTEGRAÇÃO NUMÉRICA

A TORRE DE HANÓI Carlos Yuzo Shine - Colégio Etapa

Faculdade de Engenharia Investigação Operacional. Prof. Doutor Engº Jorge Nhambiu

Capitulo 9 Resolução de Exercícios

5. A nota final será a soma dos pontos (negativos e positivos) de todas as questões

CAPÍTULO 5 CIRCUITOS SEQUENCIAIS III: CONTADORES SÍNCRONOS

MATEMÁTICA FINANCEIRA

EQUAÇÕES DIFERENCIAIS LINEARES DE ORDEM N

Curso MIX. Matemática Financeira. Juros compostos com testes resolvidos. 1.1 Conceito. 1.2 Período de Capitalização

Probabilidades. José Viegas

INTRODUÇÃO A TEORIA DE CONJUNTOS

M = C (1 + i) n. Comparando o cálculo composto (exponencial) com o cálculo simples (linear), vemos no cálculo simples:

Análise de Projectos ESAPL / IPVC. Critérios de Valorização e Selecção de Investimentos. Métodos Estáticos

Duas Fases da Estatística

Problema de Fluxo de Custo Mínimo

Analise de Investimentos e Custos Prof. Adilson C. Bassan adilsonbassan@adilsonbassan.com

Tabela Price - verdades que incomodam Por Edson Rovina

PARECER SOBRE A PROVA DE MATEMATICA FINANCEIRA CAGE SEFAZ RS

PROBABILIDADES E ESTATÍSTICA

onde d, u, v são inteiros não nulos, com u v, mdc(u, v) = 1 e u e v de paridades distintas.

Estimadores de Momentos

CURTOSE. Teremos, portanto, no tocante às situações de Curtose de um conjunto, as seguintes possibilidades:

Neste capítulo, pretendemos ajustar retas ou polinômios a um conjunto de pontos experimentais.

a taxa de juros i está expressa na forma unitária; o período de tempo n e a taxa de juros i devem estar na mesma unidade de tempo.

Juros Simples e Compostos

Teorema do limite central e es/mação da proporção populacional p

O poço de potencial infinito

Otimização e complexidade de algoritmos: problematizando o cálculo do mínimo múltiplo comum

INE ESTATÍSTICA APLICADA I - TURMA GABARITO LISTA DE EXERCÍCIOS SOBRE AMOSTRAGEM E PLANEJAMENTO DA PESQUISA

Distribuições Amostrais

PUCRS FAMAT DEPTº DE ESTATÍSTICA Estimação e Teste de Hipótese- Prof. Sérgio Kato

Unesp Universidade Estadual Paulista FACULDADE DE ENGENHARIA

O oscilador harmônico

Notas de Aula do Curso PGE950: Probabilidade

Guia do Professor. Matemática e Saúde. Experimentos

FACULDADE DE ADMINISTRAÇÃO E NEGÓCIOS DE SERGIPE

M = 4320 CERTO. O montante será

ERROS ERRO DE ARREDONDAMENTO

Cap. 4 - Estimação por Intervalo

RESISTORES E RESISTÊNCIAS

Uma amostra aleatória simples de n elementos é selecionada a partir da população. Calcula-se o valor da média a partir da amostra

Probabilidade e Estatística. Probabilidade e Estatística

Capítulo 5- Introdução à Inferência estatística. (Versão: para o manual a partir de 2016/17)

Lista de Exercícios #4. in Noções de Probabilidade e Estatística (Marcos N. Magalhães et al, 4ª. edição), Capítulo 4, seção 4.4, páginas

Capítulo 5- Introdução à Inferência estatística.

Obtemos, então, uma amostra aleatória de tamanho n de X, que representamos por X 1, X 2,..., X n.

Profa. Regina Maria Sigolo Bernardinelli. Estatística. Gestão Financeira / Gestão de Recursos Humanos / Logística / Marketing

Objetivo. Estimar a média µ de uma variável aleatória X, que representa uma característica de interesse de uma população, a partir de uma amostra.

MATEMÁTICA APLICADA À GESTÃO I

Lista 2 - Introdução à Probabilidade e Estatística

Equação Diferencial. Uma equação diferencial é uma expressão que relaciona uma função desconhecida (incógnita) y com suas derivadas.

UNIVERSIDADE DA MADEIRA

A Inferência Estatística é um conjunto de técnicas que objetiva estudar a população através de evidências fornecidas por uma amostra.

Goiânia, 07 a 10 de outubro. Mini Curso. Tópicos em passeios aleatórios. Ms. Valdivino Vargas Júnior - Doutorando/IME/USP

Aplicação de geomarketing em uma cidade de médio porte

APOSTILA MATEMÁTICA FINANCEIRA PARA AVALIAÇÃO DE PROJETOS

Teste de Hipóteses VÍCTOR HUGO LACHOS DÁVILAD

Estatística. Estatística II - Administração. Prof. Dr. Marcelo Tavares. Distribuições de amostragem. Estatística Descritiva X Estatística Inferencial

PG Progressão Geométrica

Sistema Computacional para Medidas de Posição - FATEST

MATEMÁTICA FINANCEIRA

Exame MACS- Inferência-Intervalos.

INFERÊNCIA ESTATÍSTICA

n ) uma amostra aleatória da variável aleatória X.

Equações Diferenciais (ED) Resumo

Rejane Corrrea da Rocha. Matemática Financeira

Capítulo 1. Teoria da Amostragem

Cálculo das Probabilidades e Estatística I. Departamento de Estatistica

somente um valor da variável y para cada valor de variável x.

Portanto, os juros podem induzir o adiamento do consumo, permitindo a formação de uma poupança.

Estimar uma proporção p (desconhecida) de elementos em uma população, apresentando certa característica de interesse, a partir da informação

Transcrição:

José Paulo Careiro & Moacyr Alvim O erro da pesquisa é de 3% - o que sigifica isto? A Matemática das pesquisas eleitorais José Paulo Careiro & Moacyr Alvim Itrodução Sempre que se aproxima uma eleição, os meios de comuicação passam a publicar diariamete, ou quase, pesquisas por amostragem que estimam as proporções de votos dos diversos cadidatos, de acordo com as iteções dos eleitores aquele mometo Estas publicações são em geral acompahadas da iformação do tamaho da amostra ( foram etrevistados x eleitores ) e de uma frase do tipo: o erro da pesquisa é de 3%, para mais ou para meos essas ocasiões, os professores de Matemática são frequetemete pergutados pelos aluos e por familiares ou amigos curiosos, sobre o sigificado desta frase É o que pretedemos esclarecer o seu site, um cohecido istituto de pesquisa iforma que o seu cálculo de erro amostral é feito o cotexto de um modelo de amostragem aleatório simples (ver ao fial o Apêdice ) E os outros istitutos também costumam adotar o mesmo procedimeto Por isto aalisaremos este tipo de amostragem, para eteder estas frases Amostra aleatória simples Supoha que o uiverso a ser pesquisado teha uidades e que uma certa variável assuma, essas uidades, os valores,, Deseja-se selecioar uma amostra de tamaho (com ), de modo que ela seja aleatória simples (isto é, todas as uidades têm a mesma probabilidade / de serem selecioadas) e sem reposição, isto é, ehuma uidade pode ser selecioada mais de uma vez a mesma amostra O úmero de amostras possíveis é ( ) ( )! C!!( )! A média amostral Uma vez selecioada tal amostra (usado uma ura, ou uma tabela de úmeros aleatórios, ou outro processo válido), podemos estimar a média (aritmética) da variável, isto é: Para isto, tomamos a média aritmética x desta amostra como sedo um estimador da média da variável em questão

José Paulo Careiro & Moacyr Alvim Por exemplo, se { y,, y } y y sem repetição), etão x, esta amostra, assume o valor for tal amostra (ode os y i aturalmete são algus dos Vamos estudar agora a distribuição da média amostral, isto é, vamos ver o que podemos saber sobre como varia x ao logo de todas as amostras possíveis Já que todos os subcojutos do uiverso com elemetos têm a mesma probabilidade de serem selecioados, o valor esperado da média das amostras ao logo de todas as amostras possíveis será a média aritmética de todas as médias das amostras Este valor é represetado por E( x ) j, Para cocretizar, supoha que as amostras sejam { y,, y },,{ y,, y}, com médias, respectivamete: m y y,, m y y Etão: m m y y y y Ex ( y y ) ( ) y y ( ) a soma que está etre colchetes, todas as parcelas são valores de j Quatas vezes aparece esta soma? Tatas quatas sejam as amostras que cotêm, ou seja, C O mesmo se passa com os outros j C C Substituido, levado em cota que Portato, a soma etre colchetes é igual a: C, ficamos com: C Ex ( ) C Porém C ( )!! ( )!! C ( )!( )!!( )!!( )! Logo: E( x) Isto sigifica que o valor esperado do estimador x é a própria média da variável o uiverso Por isto, diz-se que este é um estimador ão tedecioso

José Paulo Careiro & Moacyr Alvim O desvio padrão amostral Com a mesma omeclatura do parágrafo aterior, a variâcia da variável é, por defiição, V( ), ou seja, a média dos desvios quadráticos de em relação a sua média O desvio padrão s ( ) da variável é a raiz quadrada da variâcia, isto é: s ( ) V ( ) Uma outra expressão útil da variâcia decorre do seguite desevolvimeto: V( ) ( ) A fórmula V( ) é usualmete verbalizada assim: a variâcia é igual à média dos quadrados meos o quadrado da média A variâcia amostral, isto é, a variâcia do estimador x ao logo de todas as amostras, é dada por V( x) m m, e o desvio padrão amostral é sx ( ) Vx ( ) O desvio padrão amostral é a pricipal medida do erro amostral, como veremos o Apêdice, deduz-se a seguite importate fórmula, que forece a variâcia amostral: V( ) V( x) Observe que o fator f tede a quado tede a ifiito Portato, para uma V( ) população ifiita, teríamos V( x) Por isto, f é chamado fator de correção para população fiita Além disto, f já é muito próximo de para valores grades de e valores razoáveis de Por exemplo, em uma pesquisa eleitoral, o uiverso é o total de eleitores, atualmete em cerca de 35 milhões este caso, para uma amostra de mil 3

José Paulo Careiro & Moacyr Alvim eleitores, f 0,999985, com 6 decimais Por este motivo, para pesquisas eleitorais, V( ) adota-se simplesmete a fórmula aproximada: V( x) Segue que o desvio padrão amostral é: s ( ) sx ( ) Esta fórmula é muito importate e tem vários sigificados e coseqüêcias Por exemplo: ) Para um tamaho fixo de amostra, o desvio padrão amostral é diretamete proporcioal ao desvio padrão (o uiverso) da variável a ser pesquisada Por exemplo, se a variável A é vezes mais dispersa (em termo de desvio padrão) do que a variável B, etão o desvio padrão amostral da variável A será o dobro do desvio padrão amostral da variável B ) Para uma mesma variável (portato s ( ) está fixo), o erro amostral é iversamete proporcioal à raiz quadrada do tamaho da amostra Por exemplo, se quadruplicarmos o tamaho da amostra, o erro se reduz à metade (e ão à quarta parte, como se poderia pesar) Isto mostra que aumetar demais o tamaho da amostra ão ecessariamete melhora tato a precisão da estimativa o etato, cabe pergutar: como calcular o erro amostral por esta fórmula, se ele depede do desvio padrão da variável o uiverso, o qual é descohecido? Há diversas maeiras de tetar cotorar este problema, sempre tetado usar algum cohecimeto sobre o uiverso Amostragem de proporções as pesquisas eleitorais, queremos saber, por exemplo, a proporção dos eleitores que têm iteção de votar um determiado cadidato Vamos ver que isto se reduz a estimar uma média Quado queremos estimar qual a proporção de uma população de tamaho, que possui uma certa característica, criamos uma variável, que vale quado o idivíduo tem esta característica, e vale 0, em caso cotrário este caso, a soma traduz o úmero de pessoas que possuem a característica, equato a média P é justamete a proporção (a ser estimada) de pessoas que possuem a característica em questão Já que P é a média da variável, podemos aplicar o que apredemos os parágrafos ateriores sobre médias Em uma amostra aleatória simples sem reposição, um estimador para P é a proporção p de pessoas da amostra que declaram seu voto em A (isto é, p é aqui o osso x ) Para estimar o erro amostral, vamos primeiro calcular a variâcia (o uiverso) de, que é: V( ) Já sabemos que P Por outro lado, como só 4

José Paulo Careiro & Moacyr Alvim assume os valores 0 e, etão j j, para cada j de a Portato: V( ) PP P( P) V( ) Fialmete, aplicado a fórmula V( x) (para tamahos grades de uiverso), P( P) vem que V( p) Logo, o desvio padrão amostral para proporções é: P( P) s( p) Por exemplo, para estimar uma proporção de 40% (o uiverso) com uma amostra aleatória simples de 000 pessoas, o desvio padrão amostral é de 0, 40,6 0, 055,55% 000 Desvio padrão máximo para proporções A expressão P( P) P P é uma forma quadrática Exercício: Mostre que o valor máximo que P( P) pode assumir é /4, o que ocorre quado P / 0,5 50% Coseqüêcia: Tomado a raiz quadrada, coclui-se que o desvio padrão amostral /4 máximo das proporções é, o qual ocorre para a proporção de 50% Os istitutos de pesquisa, em geral, forecem a sua iformação de erro amostral, tedo em vista o erro máximo (veja, ovamete, o Apêdice ) O papel da curva ormal Como foi sugerido pelo experimeto iicial do curso, uma amostra aleatória simples, desde que o tamaho do uiverso seja suficietemete grade (um coceito relativo em Matemática), a distribuição das médias de todas as possíveis amostras é aproximadamete igual à de uma curva ormal, com média e desvio padrão iguais, respectivamete, à média e ao desvio padrão amostrais Por outro lado, é sabido (da teoria da curva ormal) que, se uma variável aleatória for distribuída segudo uma distribuição ormal de média m e desvio padrão s, etão a probabilidade de que esta variável assuma valores etre m s e m s é de aproximadamete 68%, e a probabilidade de que esta variável assuma valores etre m s e m s é de aproximadamete 96% Também muito usado é o itervalo etre 5

José Paulo Careiro & Moacyr Alvim m, 96s e m, 96 s, que cobre aproximadamete 95% Sobre as propriedades da curva ormal, ver Apêdice 3 Exemplo aplicado às pesquisas eleitorais Supoha que um Istituto de Pesquisa teha realizado uma amostragem aleatória simples de âmbito acioal para estimar proporções de iteção de votos, com uma amostra de 000 eleitores Etão, o desvio padrão amostral máximo é s 0, 03,3% Como s,6%, etão o Istituto poderá dizer que o 500 erro da pesquisa é de,6% Com isto, cofiado o caráter ormal da distribuição amostral, ele espera garatir que somete em 4% de todas as amostras possíveis, uma proporção (o uiverso) de 50% poderia aparecer a amostra como mais de 5,3% ou meos do que 47,7% Uma iformação mais detalhada seria uma tabela do tipo: Proporção Erro amostral (%) (%) 0,5 0, 30,4 40,5 50,6 ode os valores da seguda colua correspodem a P( P) s ote que os valores da ª colua referem-se ao uiverso Cometário fial sobre as pesquisas eleitorais a prática, é iviável ecoomicamete fazer uma pesquisa eleitoral de âmbito acioal (e mesmo estadual ou muicipal, para muicípios grades) usado amostra aleatória simples O que se faz comumete é selecioar a amostra em dois estágios, selecioado primeiro uma amostra de muicípios (são cerca de 5700 o Brasil) esta amostra, os muicípios ão são selecioados com igual probabilidade, e sim com probabilidade proporcioal à sua população Detro de cada muicípio selecioado, a idéia é fazer 6

José Paulo Careiro & Moacyr Alvim uma amostragem estratificada, isto é o uiverso é dividido em estratos supostamete homogêeos em relação à variável pesquisada Este procedimeto tede a reduzir o desvio padrão amostral o caso das pesquisas eleitorais, a estratificação é feita por reda, gerado os estratos deomiados classe A, classe B, etc Uma maeira de fazer isto é usar iformações, por exemplo, do último Ceso Demográfico do IBGE Uma maeira muito mais barata, mas bem meos precisa, é a chamada amostragem por quotas esta, o istituto determia previamete quatos eleitores vão ser pesquisados em cada estrato e sai caçado os eleitores as ruas, coletado sua iteção de votos e também a sua iformação de reda A partir daí, completa as suas quotas este último sistema, é praticamete impossível calcular o erro amostral Uma amostra por estágios estratificada, se for bem feita, permite o cálculo do erro amostral, mas este seria bastate complexo Como se viu, a prática, os istitutos de pesquisa, para efeito de erro amostral, fazem de cota que a amostra é aleatória simples Ilustração prática Para ilustrar praticamete estes coceitos durate o curso, foi proposto primeiramete estimar a altura média dos participates do curso, que eram Além de calcular, uma plailha eletrôica, a média e o desvio padrão do uiverso, o tamaho pequeo do uiverso permitiu observar todas as amostras, a média amostral e o desvio padrão amostral a oportuidade, foi verificada a veracidade das fórmulas deduzidas Foram feitas também experiêcias fictícias com uiversos maiores Foi explorado o fato de que o aspecto dos histogramas se aproximava do aspecto de uma curva ormal (ver adiate) Também foi feito um experimeto com proporções (ver o parágrafo seguite) Tudo isto costa da plailha aexa, deomiada Experimetos Amostrais Apêdice Iformação dada o site do IBOPE - Acesso em 4/03/0 http://wwwibopecombr/caladraweb/bdarquivos/sobre_pesquisas/pesquisa_eleitoral html Margem de erro Por se tratar de estatísticas e ão úmeros absolutos, toda pesquisa apreseta uma margem de erro que depede do tamaho da amostra estudada e dos resultados obtidos Isso ocorre porque ão é etrevistado todo o uiverso da população, mas apeas uma parte represetativa deste Trabalhado dessa maeira, há sempre um erro amostral cohecido e calculado especificamete para cada pesquisa eleitoral Para uma mesma amostra, quato maior a homogeeidade da população pesquisada, meor será o erro amostral e vice-versa Por isso, ão existe um erro amostral úico e fechado para a pesquisa como um todo, pois em cada iformação forecida pela pesquisa há um erro correspodete 7

José Paulo Careiro & Moacyr Alvim o caso das pesquisas eleitorais, esses erros são geralmete desiguais para os diversos cadidatos em fução da distribuição geográfica do eleitorado de cada um deles A margem de erro comumete divulgada refere-se a uma estimativa de erro máximo, cosiderado-se um modelo de amostragem aleatório simples Dessa maeira, os resultados de uma pesquisa devem ser iterpretados detro de um itervalo que estabeleça limites à estimativa obtida: o chamado itervalo de cofiaça O itervalo de cofiaça é sempre pré-estabelecido ates do iício da pesquisa, de comum acordo etre o cliete e o IBOPE Geralmete, fica em toro de 95% Isso quer dizer que se uma pesquisa fosse realizada 00 vezes em 95 delas o resultado ficaria detro da margem de erro Apêdice Dedução da fórmula da variâcia amostral A variâcia amostral, isto é, a variâcia do estimador x ao logo de todas as amostras, é dada por V( x) m m que foi feito para V( ), verifica-se que Por um desevolvimeto aálogo ao m m V( x) Vamos calcular a soma m y y y y m ( y ) ( ) y y y A expressão etre colchetes será a soma dos quadrados mais a soma dos duplos produtos dos y s Mas os y s são os próprios que aparecem as amostras correspodetes Como cada j aparece em quadrados será igual a C j C amostras, etão a soma dos Por outro lado, o produto, por exemplo, aparecerá tatas vezes quatas forem as amostras que cotiverem e ao mesmo tempo, ou seja, C vezes O mesmo ocorrerá com qualquer outro duplo produto Logo, a soma dos duplos produtos será C Levado aida em cosideração que C, segue que: m m C C C 8

José Paulo Careiro & Moacyr Alvim Para simplificar, vamos fazer Q Levado em cota que C e C e que ( ) C C ( ) P, vem que: m m ( ) Q P Q P ( ) Logo: V( x) Q P Por outro lado: QP, dode segue que P Q Q E aida, como visto acima, V( ), dode segue que coseqüetemete, P V( ) ( ) V( ) Portato: ( ) Q P V ( ) V( ) Q V( ) e,, equato V( ) Q P V( ) ( ) V ( ) ( ) Fialmete: V( ) V( ) V( x) Apêdice 3 A curva ormal com média m e desvio padrão s tem expressão y = () e O gráfico desta curva com m =,75 e s = 0,05 é exibido a figura abaixo A curva ormal é sempre simétrica com relação à média m e a área total sob a curva é igual a Dizemos que uma variável aleatória tem distribuição ormal se a probabilidade do valor desta variável estar em um itervalo [a, b] for a área sob a curva ormal o itervalo [a,b] Por exemplo, supoha que a altura de certa população seja bem aproximada por uma distribuição ormal com média m =,75 metros e desvio padrão s = 0,05 metros Podemos etão estimar o percetual da população que tem altura etre [,70,80] calculado a área sob a curva y = (,), e, etre x=,80 e x=,90 este caso a área é 0,68 e, portato, 68% da população tem altura o itervalo [,70 e,80] 9

José Paulo Careiro & Moacyr Alvim = (,) 0,05, Área = 0,68 As áreas correspodetes a certos itervalos em toro da média são muito usadas: a área sob a curva o itervalo [m-s, m+s] é aproximadamete 68% da área total sob a curva (é o caso do exemplo acima) A área o itervalo [m-s, m+s] é aproximadamete 96% E o itervalo em toro da média que correspode a área de 95% é [m-,96s, m+,96s] A curva ormal é freqüetemete utilizada como modelo de distribuição de probabilidade de diversas medidas, de alturas de idivíduos até velocidades de moléculas de gás o osso cotexto, a curva ormal é importate por que fazemos uso do Teorema Cetral do Limite, segudo o qual, dada uma amostra aleatória simples, a média amostral tem distribuição de probabilidades bem aproximada pela curva ormal, quado é suficietemete grade Portato, usado amostras aleatórias simples, podemos usar a curva ormal para avaliar as marges de erro 0