Teorema central do limite e es/mação da proporção populacional p

Documentos relacionados
INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p

Teorema do limite central e es/mação da proporção populacional p

Estimador: combinação dos elementos da amostra, construída com a finalidade de representar, ou estimar, um parâmetro de interesse na população.

Introdução à Probabilidade e à Estatística II

Introdução à Inferência Estatística

Introdução à Inferência Estatística

Introdução à Inferência Estatística

Professora Ana Hermínia Andrade. Período

Introdução à Bioestatística Turma Nutrição

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL p

ESTIMAÇÃO DE PARÂMETROS

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva

Aula 9: Introdução à Inferência Estatística

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Estimadores de Momentos

Estimar uma proporção p (desconhecida) de elementos em uma população, apresentando certa característica de interesse, a partir da informação

Probabilidade e Estatística

Cap. 4 - Estimação por Intervalo

Distribuições Amostrais - Tamanho da Amostra

Distribuições Amostrais

Inferência Estatistica

Inferência Estatística:

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

Testes de Hipótese para uma única Amostra - parte II

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Exemplo 7.0 Numa linha de produção, os pesos de pacotes de pó de café embalados por uma máquina têm distribuição Normal, com média

Inferência Estatística

Distribuições Amostrais

Introdução a Estatística

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Distribuições por Amostragem

Intervalos de Confiança

Intervalos Estatísticos para uma única Amostra - parte I

Obtemos, então, uma amostra aleatória de tamanho n de X, que representamos por X 1, X 2,..., X n.

Prof. Eduardo Bezerra. 15 de setembro de 2017

Estatística II. Intervalo de Confiança Lista de Exercícios

Prof. Eduardo Bezerra. 6 de abril de 2018

Estimativas e Tamanhos de Amostras

Estatística Indutiva

AULA 4: DISTRIBUIÇÕES DE PROBABILIDADES AMOSTRAIS. Gleici Castro Perdoná

CE008 Introdução à Bioestatística INFERÊNCIA ESTATÍSTICA

3. Estimação pontual USP-ICMC-SME. USP-ICMC-SME () 3. Estimação pontual / 25

Universidade Federal de Lavras

Distribuições Amostrais e Estimação Pontual de Parâmetros

Erro e Tamanho Amostral

Amostragem e distribuições por amostragem

Distribuições Amostrais

Estimação de valores. Luiz Carlos Terra

Intervalos de Confiança

Inferência Estatística:

Cálculo das Probabilidades e Estatística I

Aula 9 Intervalo de confiança para a média da N(μ; σ 2 ), σ 2 desconhecida

Testes de Hipótese para uma única Amostra - parte II

Bioestatística INFERÊNCIA ESTATÍSTICA. Silvia Shimakura

1 Inferência Estatística - Teoria da Estimação

Notas de Aula. Estatística Elementar. by Mario F. Triola. Tradução: Denis Santos

Uma estatística é uma característica da amostra. Ou seja, se

Fernando de Pol Mayer

Estatística Aplicada II. } Estimação e Intervalos de Confiança

ESTIMAÇÃO PARA A MÉDIA

AULA 03 Estimativas e tamanhos amostrais

Princípios de Bioestatística Inferência e Intervalo de Confiança

x P(X = x) 0,1 0,7 0,2

Objetivo. Estimar a média µ de uma variável aleatória X, que representa uma característica de interesse de uma população, a partir de uma amostra.

Teoria da Estimação. Fabricio Goecking Avelar. junho Universidade Federal de Alfenas - Instituto de Ciências Exatas

Distribuições Amostrais e Estimação Pontual de Parâmetros

DISTRIBUIÇÃO AMOSTRAL DA

PE-MEEC 1S 09/ Capítulo 7 - Estimação por intervalos. 7.2 Intervalos de. confiança para. média de uma. normal 7.

Estatística (MAD231) Turma: IGA. Período: 2016/2

Métodos Quantitativos

Lucas Santana da Cunha 27 de setembro de 2017

MAE0229 Introdução à Probabilidade e Estatística II

Capítulo 4 Inferência Estatística

Intervalos de Confiança - Amostras Pequenas

Fernando de Pol Mayer

Inventário Florestal. Amostragem

x P(X = x) 0,1 0,7 0,2

Professora Ana Hermínia Andrade. Período

A Inferência Estatística é um conjunto de técnicas que objetiva estudar a população através de evidências fornecidas por uma amostra.

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Inferência Estatística. Teoria da Estimação

TÉCNICAS DE AMOSTRAGEM

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Intervalos de Confiança

Bioestatística e Computação I

Estatística Aplicada

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

Tópicos em Gestão da Informação II

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Probabilidade e Estatística

Distribuições derivadas da distribuição Normal. Distribuição Normal., x real.

1.1. Definições importantes

Inferência Estatística - Teoria da Estimação

Intervalos de confiança

Solução dos Exercícios - Capítulos 1 a 3

Universidade Federal Fluminense INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA

Questão 1. (questão extraída de Anderson et al. Estatística Aplicada à Administração e Economia)

Transcrição:

Teorema central do limite e es/mação da proporção populacional p 1

RESULTADO 1: Relembrando resultados importantes Seja uma amostra aleatória de tamanho n de uma variável aleatória X, com média µ e variância σ 2.Temos que: E(X ) = µ e Var (X ) = σ 2 X ~ N µ; σ 2 n RESULTADO 2: Se X ~ N(µ,σ 2 ), então, para uma amostra aleatória de tamanho n de X, n Se σ 2 é conhecido, Z = X µ σ / n ~ N 0;1 ( ) 2

RESULTADO 3: Nas condições do Resultado 2, ou seja, X ~ N(µ,σ 2 ), sendo σ 2 desconhecida, então, para uma amostra aleatória de tamanho n de X, em que, S 2 = i=1 n i ( X - X ) n -1 T = X - µ ~ t, n -1 S 2 2 n é a variância amostral e t n-1 representa a distribuicão t-student com n-1 graus de liberdade. 3

Teorema Central do Limite (TCL) RESULTADO 4 Seja X uma v. a. que tem média µ e variância σ 2. Para amostras X 1, X 2,..., X n, retiradas ao acaso e com reposição de X, a distribuição de probabilidade da média amostral X aproxima-se, para n grande, de uma distribuição normal, com média µ e variância σ 2 /n, ou seja, X ~ N µ; σ 2 n, para n grande, aproximadamente. Sugestão: Assistir ao vídeo no link https://www.youtube.com/watch?v=jvoxeymqhnm 4

Figura 2: Histogramas correspondentes às distribuições de X para amostras de algumas populações. 4ª 2002, 273 5

Esses gráficos mostram que, Quando n aumenta, independentemente da forma da distribuição de X, a distribuição de probabilidade da média amostral X se aproxima de uma distribuição normal. Conforme n aumenta, os valores de X tendem a se concentrar cada vez mais em torno da média µ, uma vez que a variância vai diminuindo; 6

Portanto se a variável X na população não tem distribuição normal, e n é grande, usando o TCL o intervalo de confiança aproximado para µ, com coeficiente de confiança γ, é para σ conhecido: X z σ n ; X + z σ n para σ desconhecido: X z S n ; X + z S n sendo z tal que γ = P(-z Z z), com Z ~ N(0, 1), σ o desvio padrão da população e S o desvio padrão amostral. 7

Exemplo 5: Não se conhece o consumo médio de combustível de automóveis da marca T. Sabe-se, no entanto, que o desvio padrão do consumo de combustível de automóveis dessa marca é 10 km/l. Na análise de 100 automóveis da marca T, obteve-se consumo médio de combustível de 8 km/l. Encontre um intervalo de confiança para o consumo médio de combustível dessa marca de carro. Adote um coeficiente de confiança igual a 95%. X: consumo de combustível de automóveis da marca T σ = 10 km/l Amostra: n = 100 x (média amostral) = 8 km/l γ = 0,95 z = 1,96 8

Pelo Teorema Central do Limite, o intervalo de confiança é dado, aproximadamente, por X z σ n ; X + z σ n = 8 1, 96 10 100 [ 8 1, 96;8+1, 96] = [ 6, 04;9, 96] ;8+1, 96 10 100 = Observe que o erro amostral ε é 1,96 km/l. 9

Exemplo 6: A quantidade de colesterol X no sangue das alunas de uma universidade tem uma distribuição com desvio padrão σ = 50 mg/dl e média µ desconhecida. Se desejamos estimar a quantidade média µ de colesterol com erro ε = 20 mg/dl e confiança de 90%, quantas alunas devem formar a amostra para realizar o exame de sangue? X: quantidade de colesterol no sangue das alunas da universidade σ = 50 mg/dl ε = 20 mg/dl γ = 0,90 z = 1,65 n =?? 10

Supondo que o tamanho da amostra a ser selecionada é suficientemente grande, pelo Teorema Central do Limite (TCL) temos: n = z 2 ε 1, 65 = 20 σ 2 2 = 206, 25 50 2 Assim, aproximadamente 207 alunas devem ser selecionadas para realizar o exame de sangue. 11

Exemplo 7: Para estimar a renda semanal média de garçons de restaurantes em uma grande cidade, é colhida uma amostra da renda semanal de 75 garçons. A média e o desvio padrão amostrais encontrados são R$ 227 e R$ 15, respectivamente. Determine um intervalo de confiança, com coeficiente de confiança de 90%, para a renda média semanal de garçons dessa cidade. X : renda semanal de garçons da cidade Amostra: n = 75 γ = 0,9 z = 1,65 x = 227 e s = 15 12

O intervalo de 90% de confiança é dado, aproximadamente, por X z S n ; X + z S n = 227 1, 65 15 75 ;227+1, 65 15 75 = [ 227 2,86;227+ 2,86] = [ 224,14;229,86] 13

Estimação da proporção

Objetivo Estimar uma proporção p (desconhecida) de elementos em uma população, apresentando certa característica de interesse, a partir da informação fornecida por uma amostra. 15

Exemplos: p: proporção de alunos da UFJF que foram ao teatro pelo menos uma vez no último mês; p: proporção de consumidores satisfeitos com os serviços prestados por uma empresa telefônica; p: proporção de eleitores da cidade de Juiz de Fora que votariam em um determinado candidato, caso a eleição para presidente se realizasse hoje; p: proporção de crianças de 2 a 6 anos, do estado de Minas Gerais, que não estão matriculadas em escola de educação infantil. 16

- Vamos observar n elementos, extraídos ao acaso da população, de forma independente; - Para cada elemento selecionado da população, verifica-se a presença ( sucesso ) ou não ( fracasso ) da característica de interesse. Nesse caso, temos uma amostra aleatória (a.a.) de tamanho n de X, sendo X uma v.a. com distribuiçao de Bernoulli, que representamos por X 1, X 2,..., X n, em que X i vale 1, se ocorre sucesso, ou 0, se ocorre fracasso para o i-ésimo elemento da amostra. 17

Estimador pontual O estimador pontual para p, também denominado proporção amostral, é definido como ˆp = X 1 +!+ X n n Note que: X 1 +... + X n é o número de elementos na amostra que apresentam a característica; ˆp = X; Se observamos k elementos na amostra com a característica, obtemos pˆ = k / n, que denominamos estimativa pontual para p. 18

Exemplo 1: Seja p a proporção de alunos da UFJF que foram ao teatro pelo menos uma vez no último mês. Suponha que foram entrevistados n = 500 estudantes, e que desses, k = 100 teriam afirmado que foram ao teatro pelo menos uma vez no último mês. A estimativa pontual (proporção amostral) para p é dada por: ˆp = k n = 100 = 0, 2; 500 ou seja, 20% dos estudantes entrevistados afirmaram que foram ao teatro pelo menos uma vez no último mês. Note que outra amostra de mesmo tamanho pode levar a uma outra estimativa pontual para p. 19

Intervalo de confiança para p Vimos que, para qualquer variável aleatória X, quando n é grande, usando o Resultado 4 (TCL), um intervalo de confiança para µ tem a forma X ε; X +ε, ε = z σ n, σ 2 = p(1 p) e ˆp = X, em que sendo σ o desvio padrão de X. Nesse caso, como X ~ Bernoulli(p), com a estimativa intervalar para p é dada por [ ˆp ε; ˆp +ε], com ε = z p(1 p) n, e z tal que γ = P( z Z z) e Z ~ N(0,1). 20

Intervalo de confiança para p Na prática, substituímos a proporção desconhecida p pela proporção amostral pˆ, obtendo o seguinte intervalo de confiança aproximado com coeficiente de confiança γ : IC(p;γ) = ˆp z ˆp(1 ˆp) ; ˆp + z n ˆp(1 ˆp). n 21

Exemplo 1: No exemplo da UFJF, temos n = 500 e ˆp = 0, 20; Construir um intervalo de confiança para p com coeficiente de confiança γ = 0,95. Como γ = 0,95 fornece z = 1,96, o intervalo é dado por: ˆp z ˆp(1 ˆp) ; ˆp + z n ˆp(1 ˆp) n = 0, 20 1, 96 0, 20 0,80 500 [ ] [ ] = 0, 20 0,35;0, 20 + 0,35 = 0,165;0, 235 ;0, 20 +1, 96 0, 20 0,80 500 22

Interpretação do IC com γ = 95%: Se sortearmos 100 amostras de tamanho n = 500 e construirmos os respectivos 100 intervalos de confiança, com coeficiente de confiança de 95%, esperamos que aproximadamente 95 desses intervalos contenham o verdadeiro valor de p. Comentários: Da expressão ε = z p(1 p), n pode-se concluir que: para γ fixado, o erro diminui com o aumento de n. para n fixado, o erro aumenta com o aumento de γ. 23

Dimensionamento da amostra Da relação ε = z p(1 p) n segue que o tamanho amostral n, dados γ e a margem de erro ε, será n = z 2 ε p(1 p), em que z é tal que γ = P( z Z z) e Z ~ N(0,1). Entretanto, nessa expressão, n depende de p(1 p) que é desconhecido. Como calcular o valor de n? 24

Gráfico da função p(1 p) para 0 p 1. Pela figura observamos que: a função p(1 p) é uma parábola simétrica em torno de p = 0,5; o máximo de p(1 p) é 0,25, alcançado quando p = 0,5. Assim, na prática, substituímos p(1 p) por seu valor máximo, obtendo n = z 2 ε 0, 25, que pode fornecer um valor de n maior do que o necessário. 25

Exemplo 1: No exemplo da UFJF, suponha que nenhuma amostra foi coletada. Quantos estudantes precisamos consultar de modo que a estimativa pontual esteja, no máximo, a 0,02 da proporção verdadeira p, com uma probabilidade de 0,95? Dados do problema: ε = 0,02 (erro da estimativa); γ = 0,95 z = 1,96. n = z 2 ε p(1 p) z 2 ε 0, 25 = 1, 96 0, 02 2 0, 25 = 2401 estudantes. 26

Pergunta: É possível reduzir o tamanho da amostra quando temos alguma informação a respeito de p? Por exemplo, sabemos que: p não é superior a 0,30, ou p é pelo menos 0,80, ou p está entre 0,30 e 0,60. Resposta: Depende do tipo de informação sobre p. Em alguns casos, podemos substituir a informação p(1 p) que aparece na expressão de n, por um valor menor que 0,25. 27

Redução do tamanho da amostra Vimos que, se nada sabemos sobre o valor de p, no cálculo de n, substituímos p(1 p) por seu valor máximo, e calculamos n = z 2 ε 0, 25. Se temos a informação de que p é no máximo 0,30 (p 0,30) então o valor máximo de p(1 p) será dado por 0,3x0,7 = 0,21. Logo, reduzimos o valor de n para n = z 2 ε 0, 21. 28

Agora, se p é pelo menos 0,80 (p 0,80), então o máximo valor de p(1 p) é 0,8 x 0,2 = 0,16, e temos n = z 2 ε 0,16. Mas, se 0,30 p 0,60 o máximo valor de p(1 p) é 0,5 x 0,5 = 0,25 e, neste caso, não há redução, ou seja, n = z 2 ε 0, 25. 29

Exemplo 1 (continuação): No exemplo da UFJF, suponha que temos a informação de que no máximo 30% dos alunos da UFJF foram ao teatro no último mês. Portanto, temos que p 0,30 de p(1 p) nesse caso é 0,21. e, como vimos, o valor máximo Assim, precisamos amostrar n = z 2 ε 0, 21= 1, 96 0, 02 2 0, 21= 2017 estudantes, conseguindo uma redução de 2401-2017 = 384 estudantes. 30

Exemplo 2: Por ocasião do centenário da imigração japonesa no Brasil, um Instituto de Pesquisa conduziu um estudo com a finalidade de conhecer alguns aspectos dessa população vivendo no país. Entre outras questões, desejou-se estimar a proporção p de japoneses e descendentes no Brasil, que pertenciam a alguma associação de cultura japonesa. Foram selecionados 610 japoneses e descendentes, com mais de 16 anos de idade. Na amostra aleatória selecionada, 195 declararam frequentar ou pertencer a alguma associação de cultura japonesa. - Estimativa por ponto para p: ˆp = 195 610 0,32; - Intervalo de confiança aproximado de 95% para p: 0,32 0, 68 0,32 0, 68 IC(p;0, 95) = 0,32 1, 96 ;0,32 +1, 96 610 610 [ ] = [ 0, 283;0,357] = 0,32 0, 037;0, 20 + 0, 037 31