Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

Documentos relacionados
Tamanho Amostral. Tiago Viana Flor de Santana

Distribuições Amostrais - Tamanho da Amostra

Introdução a Estatística

Professora Ana Hermínia Andrade. Período

Introdução à Probabilidade e à Estatística II

Introdução à Inferência Estatística

Cap. 4 - Estimação por Intervalo

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Cálculo das Probabilidades e Estatística I

AULA 03 Estimativas e tamanhos amostrais

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

Estimação: (A) Propriedades e Distribuições Amostrais

Inferência Estatistica

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Estatística e Modelos Probabilísticos - COE241

Teorema central do limite e es/mação da proporção populacional p

Intervalos de Confiança

Distribuições por Amostragem

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

ESTATÍSTICA. Lucas Santana da Cunha 18 de setembro de Universidade Estadual de Londrina

Universidade Federal de Lavras

Fernando de Pol Mayer

Teoria da Estimação. Fabricio Goecking Avelar. junho Universidade Federal de Alfenas - Instituto de Ciências Exatas

Distribuições Amostrais e Estimação Pontual de Parâmetros

Introdução à Inferência Estatística

Prof. Eduardo Bezerra. 6 de abril de 2018

Notas de Aula. Estatística Elementar. by Mario F. Triola. Tradução: Denis Santos

Introdução à Inferência Estatística

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

ESTIMAÇÃO DE PARÂMETROS

Amostragem e distribuições por amostragem

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Intervalos de Confiança

Distribuições amostrais

A Inferência Estatística é um conjunto de técnicas que objetiva estudar a população através de evidências fornecidas por uma amostra.

Fernando de Pol Mayer

Introdução à Bioestatística Turma Nutrição

Estimador: combinação dos elementos da amostra, construída com a finalidade de representar, ou estimar, um parâmetro de interesse na população.

CE008 Introdução à Bioestatística INFERÊNCIA ESTATÍSTICA

Inferência Estatística:

Estimativas e Tamanhos de Amostras

Bioestatística INFERÊNCIA ESTATÍSTICA. Silvia Shimakura

1 Inferência Estatística - Teoria da Estimação

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

x P(X = x) 0,1 0,7 0,2

Fernando de Pol Mayer

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

x P(X = x) 0,1 0,7 0,2

1 Probabilidade - Modelos Probabilísticos

Métodos Quantitativos

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Princípios de Bioestatística Inferência e Intervalo de Confiança

Lucas Santana da Cunha e 30 de julho de 2018 Londrina

Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM

Amostra Aleatória Simples

Distribuições Amostrais e Estimação Pontual de Parâmetros

Prof. Eduardo Bezerra. 15 de setembro de 2017

INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p

Estimação de valores. Luiz Carlos Terra

AULA 7 - Inferência em MQO: ICs e Testes de

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

Testes de Hipótese para uma única Amostra - parte II

Estatística Aplicada

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Introdução à probabilidade e estatística II

Inferência Estatística. Teoria da Estimação

Testes de Hipótese para uma única Amostra - parte II

Distribuição Amostral e Estimação Pontual de Parâmetros

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Probabilidade e Estatística

Distribuições derivadas da distribuição Normal. Distribuição Normal., x real.

Intervalos Estatísticos para uma única Amostra - parte I

Capítulo 4 Inferência Estatística

Inferência estatística

Aula 10 Estimação e Intervalo de Confiança

Exemplo 7.0 Numa linha de produção, os pesos de pacotes de pó de café embalados por uma máquina têm distribuição Normal, com média

Lucas Santana da Cunha 27 de setembro de 2017

Bioestatística e Computação I

Testes de Hipóteses II

Erro e Tamanho Amostral

Intervalos de confiança

Estatística (MAD231) Turma: IGA. Período: 2015/2

Inferência Estatística - Teoria da Estimação

Estatística aplicada a ensaios clínicos

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA

Probabilidade e Estatística

Introdução à probabilidade e estatística II

COS767 - Modelagem e Análise Aula 3 - Simulação

Inferência Estatística

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba

LEEC Probabilidades e Estatística 1 a Chamada 13/06/2005. Parte Prática C (C) M 1% 9% 10% (M) 4% 86% 90% 5% 95% 100%

DISTRIBUIÇÃO AMOSTRAL DA

Inferência para duas populações

Intervalos de Confiança

Universidade Federal Fluminense INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA

Transcrição:

Professora Ana Hermínia Andrade Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise Período 2017.1

Distribuições Amostrais O intuito de fazer uma amostragem é concluir sobre um parâmetro desconhecido da população, θ, baseados em uma estatística. Suponha que temos uma AAS de tamanho n sorteados da população. Nossa decisão será baseada na estatística T, que será uma função da amostra, ou seja, T = f (X 1,..., X n ). Coletada a amostra teremos observado um valor de T, digamos t 0, e baseados neste valor é que faremos a afirmação sobre θ, o parâmetro populacional.

Distribuições Amostrais Breve esquema uma população X com parâmetro de interesse θ todas as amostras retiradas da população, de acordo com certo procedimento para cada amostra calculamos o valor t da estatística T os valores t seguem uma distribuição amostral T

Distribuições Amostrais

Distribuição Amostral da Média Considere uma população X de média populacional µ = E(X ) e variância populacional σ 2 são supostamente conhecidos. Vamos retirar agora todas as AAS de tamanho n possíveis e para cada uma calculemos a média X. Teorema Seja X uma v.a. com média µ e variância σ 2 e seja (X 1, X 2,..., X n ) uma AAS de X. Então, E( X ) = µ e Var( X ) = σ2 n

Distribuição Amostral da Média Teorema Central do Limite (TCL) Para amostras aleatórias simples (X 1,..., X n ), retiradas de uma população com média µ e variância σ 2 finita, a distribuição amostral da média X aproxima-se, para n grande, de uma distribuição normal, com média µ e variância σ 2 /n. Observação Se a população tiver distribuição normal, então a distribuição de X é exata normal. Ou seja, ) Se X N(µ, σ 2 ), então X N (µ, σ2 n

Distribuição Amostral da Média

Distribuição Amostral da Média Corolário Se (X 1,..., X n ) for uma amostra aleatória simples da população X, com média µ e variância σ 2 finita, então Z = X µ σ/ n N(0, 1)

Distribuição Amostral da Média Exercício Um produto tem garantia média de 60 dias com desvio padrão de 40 dias. Um fornecedor vende para uma loja um lote de 100 unidades do produto e garante que a duração média desse lote será superior a 61 dias. a) Qual a probabilidade do fabricante estar certo? b) O fabricante decide modificar seu discurso e afirma agora que a média amostral do lote não se distanciará da verdadeira média populacional em mais do que 20% do desvio padrão populacional. Qual a probabilidade do fabricante estar certo?

Distribuição Amostral de uma Proporção Vamos considerar uma população em que a proporção de elementos portadores de certa característica é p. Logo, podemos definir uma v.a. X, da seguinte maneira: X = { 1, se o indivíduo for portador da característica 0, se o indivíduo não for portador da característica Logo, µ = E(X ) = p, σ 2 = Var(X ) = p(1 p). Retirada uma AAS dessa população, e indicado por Y n o total de indivíduos portadores da característica da amostra, já vimos que Y n b(n, p)

Distribuição Amostral de uma Proporção Vamos definir por ˆp a proporção de indivíduos portadores da característica na amostra, isto é, Então, ˆp = Y n n P(Y n = k) = P(Y n /n = k/n) = P(ˆp = k/n), Ou seja, a distribuição amostral de ˆp é obtida da distribuição de Y n. Sabemos que Y n = X 1 + X 2 + + X n, em que cad X i tem uma distribuição b(p). Podemos escrever Y n = n X

Distribuição Amostral de uma Proporção Pelo TCL, X tem distribuição aproximadamente normal: ( ) p(1 p) X N p, n Concluímos então que ( ˆp N p, ) p(1 p) n

Distribuição Amostral de uma Proporção Exemplo Suponha que 30% dos estudantes de uma escola sejam mulheres. Coletamos uma AAS de n = 10 estudantes e calculamos a proporção de mulheres da amostra. Qual a probabilidade de que ˆp difira de p em menos de 0, 01?

Distribuição Amostral de uma Proporção Exemplo Temos que essa probabilidade é dada por P( ˆp p < 0, 01) = P( 0, 01 < ˆp p < 0, 01) = P(p 0, 01 < ˆp < p+0, 01) Sabemos ( que ˆp N Logo, p, p(1 p) n ) e que p = 0, 3. Temos então: Var(ˆp) = p(1 p) n = (0, 3)(0, 7) 10 = 0, 021 ( ) p 0, 01 + p p 0, 01 + p P < Z < = P( 0, 07 < Z < 0, 07) = 0, 056 0, 021 0, 021

Distribuição amostral da variância Sabemos que N σ 2 i=1 = (x i µ) 2 n O estimador amostral de σ 2 é dado por S 2 = Segue o seguinte resultado: n i=1 (x i x) 2 n 1 em que χ 2 (n 1) liberdade (n 1)S 2 σ 2 χ 2 (n 1) é a distribuição qui-quadrado com (n-1) graus de

Um pouco sobre a distribuição χ 2 Uma v.a contínua Y, com valores positivos, tem uma distribuição qui-quadrado com ν graus de liberdade (denotada χ 2 ν), se sua densidade for dada por f (x; ν) = { 1 Γ(ν/2)2 ν/2 y ν/2 1 e y/2, se y > 0 0, se y < 0 E(Y ) = ν e Var(Y ) = 2ν

Um pouco sobre a distribuição χ 2 Exercício Seja uma v.a. Y χ 2 (10), calcule: P(Y > 2, 558) P(Y > 18, 307)

Exercício

Exercício

Distribuição amostral da diferença entre duas médias Seja X 1 N(µ 1, σ 2 1) e X 2 N(µ 2, σ 2 2) As distribuições amostrais da média de X 1 e X 2 são respectivamente: X 1 N(µ 1, σ 2 1/n 1 ) e X 2 N(µ 2, σ 2 2/n 2 ) A distribuição de X 1 X 2 será: ( ) ( X 1 X 2 ) N µ 1 µ 2, σ2 1 + σ2 2 n 1 n 2

Distribuição amostral da diferença entre duas proporções Seja Y 1 Bin(n 1, p 1 ) e Y 2 Bin(n 2, p 2 ) Pelo TCL temos que: ( ˆp 1 N p1, p ) 1(1 p 1 ) n1 ( e ˆp 2 N p2, p ) 2(1 p 2 ) n2 A distribuição de ˆp 1 ˆp 2 será: ( ˆp 1 ˆp 2 N p1 p2, p 1(1 p 1 ) + p ) 2(1 p 2 ) n1 n2

Exercício Suponha que de um grande lote de produção, 10% dos itens produzidos apresenta algum tipo de defeito. Em uma amostra aleatória de tamanho 60, obtida do lote para inspeção de qualidade, calcule a probabilidade de se ter mais de 15% dos itens selecionados com algum tipo de defeito.

Inferência Fazer inferência (ou inferir) = tirar conclusões; Inferência Estatística: conjunto de métodos de análise estatística que permitem tirar conclusões sobre uma população com base em somente uma parte dela (uma amostra); Em outras palavras, a inferência estatística trata de métodos que permitem a obtenção de conclusões sobre um ou mais parâmetros de uma ou mais populações através de quantidades (as estatísticas ou estimadores) calculadas apenas para a(s) amostra(s); Os métodos de inferência podem ser agrupados em duas categorias: Estimação: pontual ou intervalar Testes de Hipóteses

Inferência Suponha que desejamos saber qual a altura média dos brasileiros adultos. Como podemos obter essa informação? Medindo a altura de todos os brasileiros adultos. Nesse caso, não será necessário usar inferência estatística. Escolher adequadamente uma amostra X 1, X 2,..., X n da população de brasileiros adultos e, através dessa amostra, inferir sobre a altura média (e sobre outros parâmetros). Os resultados dependerão da qualidade da amostra, que tem que ser representativa (probabiĺıstica) da população.

Inferência Podemos estimar a altura média dos brasileiros adultos de duas formas: 1 Estimativa Pontual: calculando a média das alturas dos brasileiros adultos selecionados para fazer parte da amostra; 2 Estimativa Intervalar: através dos valores da amostra construir um intervalo de tal forma que a probabilidade de o verdadeiro valor da altura média dos brasileiros pertencer a este intervalo seja alta. Em uma outra situação, poderíamos estar interessados em testar se a afirmação os brasileiros têm, em média, 169 cm é verdadeira. Com base na amostra, podemos realizar um Teste de Hipóteses.

Lembrando População: conjunto de todos os indivíduos ou resultados sob investigação. Amostra: qualquer parte ou subconjunto (não vazio) da população. Variável Aleatória: característica da população sujeita a variação. Parâmetro: uma quantidade de interesse que só é observada na população. Estimador: uma função utilizada para medir algum aspecto de uma variável através de valores amostrais. Estimativa: um particular valor assumido por um estimador.

Inferência Em qualquer área do conhecimento nos deparamos com o problema de estimar alguma quantidade de interesse. Exemplo: estimar a proporção de indivíduos que apresentam determinada enfermidade. Podemos estimar quantidades de interesse de duas formas: 1 Estimação Pontual: um único valor e utilizado para inferir sobre um parâmetro de interesse. 2 Estimação Intervalar: uma faixa de valores ou intervalo é utilizado para inferir sobre um parâmetro de interesse, com algum grau de confiança. IC = (Estimativa pontual ± erro de estimação)

Exemplo Ou seja, ao invés de calcular uma estimativa pontual (um valor para o parâmetro), iremos cacular um intervalo. Por exemplo, suponha que queremos saber a altura média dos brasileiros. Retira-se uma amostra de 500 brasileiros e calcula-se a média das alturas encontrando-se 1, 66 m. Logo uma estimativa pontual para a verdadeira altura média (µ) é dada por X = 1, 66 m. Como foi dito anteriormente, também poderíamos cacular um intervalo para a altura média, como por exemplo [1, 58; 1, 68], que em 95% das vezes, incluiria µ (a verdadeira altura média dos brasileiros). Então, iremos aprender a calcular estes intervalos.

Revisão estimação pontual Na estimação pontual desejamos encontrar um único valor numérico que esteja bastante próximo do verdadeiro valor do parâmetro. Parâmetro Média (µ) Variância (σ 2 ) Desvio Padrão (σ) Proporção (p) Estimador n i=1 X = X i n n S 2 i=1 = (X i X ) 2 n 1 S = S 2 ˆp = X n onde X é o número de indivíduos que possuem a mesma característica de interesse

Exemplo Os preços de um determinado produto em 10 diferentes mercados em um determinado mês foram: 0.75 1.1 0.6 2 1.3 0.69 2.1 1.3 0.83 1 A estimativa pontual da média do preço do produto é dada por X = 0.75 + 1.1 + + 0.83 + 1 10 = 1.167 A estimativa pontual da proporção de preços menores que 1 real é dada por ˆp = 4 10 = 0.4

Estimação Pontual Estimação Intervalar Diferentes amostras levam a diferentes estimativas; Ou seja, como um estimador é uma função de uma amostra(aleatória), ele também é aleatório; Assim, estimar um parâmetro de interesse através de um único valor não parece ser uma boa estratégia, já que não estamos levando em conta a variabilidade; Dessa forma, utilizar um intervalo de valores parece ser mais vantajoso. Esse intervalo é denominado intervalo de confiança.

Estimação Intervalar Vimos que a estimativa pontual fornece apenas um valor (ou ponto) usado para aproximar um parâmetro populacional. Seria interessante que a estimativa pontual viesse acompanhada de alguma medida de erro. Então, a estimativa intervalar complementa a estimativa pontual. Assim, um intervalo de confiança (ou estimativa intervalar) representa uma amplitude de valores que tem alta probabilidade (grau de confiança) conter o verdadeiro valor do parâmetro. O grau de confiança (ou nível de confiança) é uma medida que representa a probabilidade do intervalo conter o parâmetro populacional. Tal probabilidade é chamada de 1 α. Logo, α será a probabilidade de erro ao se afirmar que o intervalo contém o verdadeiro valor do parâmetro.

Determinação do Tamanho da Amostra Suponha que estejando estimando a média popilacional µ e para tanto usaremos a média amostral X, baseada numa amostra de tamanho n. Suponha que se queira determinar o valor de n de tal modo que P( X µ ɛ) γ, em que 0 < γ < 1 e ɛ é o erro amostral máximo que possamos suportar.

Determinação do Tamanho da Amostra ( Sabemos que X N ) (, logo X µ N µ, σ2 n ( P(ɛ X nɛ µ ɛ) = P σ 0, σ2 n ) nɛ Z σ ). Portanto: finalmente nɛ σ = z (1 α 2 ), n = σ 2 z 2 (1 α 2 ) ɛ 2.

Determinação do Tamanho da Amostra Exemplo Suponha que uma pequena amostra piloto de n = 10, extraída de uma população, forneceu os valores X = 15 e S 2 = 16. Fixando-se ɛ = 0, 5 e γ = 0, 95, temos n = 16(1, 96)2 (0, 5) 2 246

Determinação do Tamanho da Amostra No caso de proporções, usando a aproximação normal para ˆp, é fácil ver que z(1 2 n = α )p(1 p) 2 ɛ 2. Como não conhecemos p, a verdadeira proporção populacional, podemos usar o fato de que p(1 p) 1 4 p, z(1 2 n α 2 ) 4ɛ 2. Por outro lado, se tivermols alguma informação sobre p ou pudermos estimá-lo usando uma amostra piloto, podemos utilizar esse valor para calcular o tamanho da amostra.

Determinação do Tamanho da Amostra Exemplo Suponha que numa pesquisa de mercado estima-se que no mínimo 60% das pessoas entrevistadas preferirão a marca A de um produto. Essa informação é baseada em pesquisas anteriores. Se quisermos que o erro amostral de ˆp seja menor de que ɛ = 0, 03, com probabilidade γ = 0, 95, teremos n (1, 96)2 (0, 6)(0, 4) (0, 03) 2 = 1.024.

Exercício Suponha que uma indústria farmacêutica deseja saber a quantos voluntários se deva aplicar uma vacina, de modo que a proporção de indivíduos imunizados na amostra difira menos de 2% da proporção verdadeira de imunizados na população, com probabilidade 90%. Qual o tamanho da amostra a escolher? No problema anterior, suponha que a indústria tenha a informação de que a proporção de imunizados pela vacina seja p 0, 80. Qual o novo tamanho de amostra a escolher? Houve redução?