Distribuições por Amostragem

Documentos relacionados
Amostragem e distribuições por amostragem

Distribuição Normal. Diz-se que uma variável aleatória X tem distribuição normal, se a sua função densidade de probabilidade for dada por:

Departamento de Matemática Escola Superior de Tecnologia de Viseu

Distribuições de probabilidade

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

Distribuições Amostrais

Intervalos de Confiança

Testes de Hipóteses Paramétricos

Introdução à Probabilidade e à Estatística II

Teoria da Estimação. Fabricio Goecking Avelar. junho Universidade Federal de Alfenas - Instituto de Ciências Exatas

LEEC Probabilidades e Estatística 1 a Chamada 13/06/2005. Parte Prática C (C) M 1% 9% 10% (M) 4% 86% 90% 5% 95% 100%

Inferência Estatistica

Processo de Amostragem

Catarina Marques. Estatística II Licenciatura em Gestão. Conceitos: População, Unidade Estatística e Amostra

Estatística Indutiva

Capítulo 4 Inferência Estatística

Probabilidade e Estatística

Amostragem. Cuidados a ter na amostragem Tipos de amostragem Distribuições de amostragem

Teorema central do limite e es/mação da proporção populacional p

Testes de Hipóteses Paramétricos

Distribuições de Probabilidade

Intervalos de Confiança

Estatística e Modelos Probabilísticos - COE241

Estimador: combinação dos elementos da amostra, construída com a finalidade de representar, ou estimar, um parâmetro de interesse na população.

Estatística Aplicada II. } Estimação e Intervalos de Confiança

Introdução à Inferência Estatística

Distribuição t de Student

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

A figura 5.1 ilustra a densidade da curva normal, que é simétrica em torno da média (µ).

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba

ESTIMAÇÃO DE PARÂMETROS

Prof. Eduardo Bezerra. 15 de setembro de 2017

Aula 9 Intervalo de confiança para a média da N(μ; σ 2 ), σ 2 desconhecida

Distribuições Amostrais - Tamanho da Amostra

6. Amostragem e estimação pontual

Cap. 4 - Estimação por Intervalo

Universidade Federal de Lavras

Distribuições derivadas da distribuição Normal. Distribuição Normal., x real.

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Princípios de Modelagem Matemática Aula 10

Distribuições Amostrais e Estimação Pontual de Parâmetros

IND 1115 Inferência Estatística Aula 7

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba

Introdução à probabilidade e estatística II

Distribuição Amostral e Estimação Pontual de Parâmetros

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva

Estimação e Testes de Hipóteses

Introdução à probabilidade e estatística II

Teorema do Limite Central

Testes de Hipótese para uma única Amostra - parte II

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

5 TORIA ELEMENTAR DA AMOSTRAGEM

Inferência para duas populações

Distribuições Amostrais

Intervalos de Confiança

Distribuições Amostrais

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Les Estatística Aplicada II AMOSTRA E POPULAÇÃO

Testes de Hipótese para uma única Amostra - parte II

Distribuições Amostrais e Estimação Pontual de Parâmetros

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Amostra Aleatória Simples

Inferência Estatística:

Solução dos Exercícios - Capítulos 1 a 3

Estatística Aplicada. Inferência estatística com desvio padrão populacional desconhecido Estimativa de proporção Capítulo 10 Itens 10.4 a 10.

3. Considere uma amostra aleatória de tamanho 7 de uma normal com média 18. Sejam X e S 2, a média e a variância amostral, respectivamente.

Estimação: (A) Propriedades e Distribuições Amostrais

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Distribuição Normal. Prof. Eduardo Bezerra. (CEFET/RJ) - BCC - Inferência Estatística. 25 de agosto de 2017

Princípios de Bioestatística Inferência e Intervalo de Confiança

Distribuições Amostrais e Estimação Pontual de Parâmetros

PE-MEEC 1S 09/ Capítulo 7 - Estimação por intervalos. 7.2 Intervalos de. confiança para. média de uma. normal 7.

Unidade IV Inferência estatística

Teorema do Limite Central

Probabilidades e Estatística

Estimação de valores. Luiz Carlos Terra

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA

Probabilidade e Estatística

Distribuição Amostral e Estimação Pontual de Parâmetros

Distribuições de probabilidade de variáveis aleatórias contínuas

BIOESTATÍSTICA. Parte 5 Testes de Hipóteses

Distribuições de Probabilidade

Universidade Federal Fluminense INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA

6- Probabilidade e amostras: A distribuição das médias amostrais

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Estatística e Probabilidade. Aula 11 Cap 06

Inferência Estatística

Testes de Hipóteses II

1 Probabilidade - Modelos Probabilísticos

Intervalos Estatísticos para uma única Amostra - parte I

Uma estatística é uma característica da amostra. Ou seja, se

Professora Ana Hermínia Andrade. Período

Análise Bayesiana de Dados - Aplicações 1 -

Transcrição:

Distribuições por Amostragem Departamento de Matemática Escola Superior de Tecnologia de Viseu (DepMAT ESTV) Distribuições por Amostragem 2007/2008 1 / 27 Introdução: População, amostra e inferência estatística População, amostra e inferência estatística Exemplo (1) OJoão é licenciado em Gestão pela ESTV e está a trabalhar para a fábrica VisaTexteis. A fábrica recebeu recentemente uma encomenda de 500 rolos de linhas de várias cores. O João tem de verificar se os rolos recebidos estão de acordo com as especificações feitas. Entre as especificações de qualidade, exigia-se que cada rolo tivesse pelo menos 500 metros de comprimento. Como deve o João proceder? Obviamente não é possível observar um a um, todos os 500 rolos que compõem esta população. Exemplo (2) Para elaborar uma notícia, um determinado jornal semanal pretende saber qual a opinião dos portugueses relativamente a um dado projecto governamental. Obviamente, o jornal não poderá inquirir todos os Portugueses. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 2 / 27

Introdução: População, amostra e inferência estatística População, amostra e inferência estatística Em situações como as ilustradas nos exemplos anteriores, o estudo é feito com base numa parte representativa da população, à qual se dá o nome de amostra. A informação obtida a partir da observação dos elementos de uma amostra, conduz-nos a certas conclusões que depois inferimos para toda a população. Estamos a fazer inferência estatística. Seja X: característica numérica em estudo numa dada população Na prática, em geral a distribuição de X não é conhecida ou sabe-se qual a forma geral da distribuição de X, mas não são conhecidos os parâmetros dessa distribuição, ditos parâmetros populacionais. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 3 / 27 Introdução: População, amostra e inferência estatística População, amostra e inferência estatística Como estimar o valor de uma média populacional µ X,deuma variância populacional σx 2 ou de uma proporção populacional p? Estimamos a média da população, µ X, através da média da amostra, x. Usamos o desvio padrão da amostra, s, para aproximar ou estimar o desvio padrão na população, σ X. Usamos a proporção encontrada na amostra, ˆp, para estimar a proporção populacional p. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 4 / 27

Amostra aleatória Amostra aleatória Para fazer inferência estatística, a amostra deve ser recolhida obedecendo a certos critérios, caso contrário, as conclusões decorrentes do estudo da amostra poderão não ser válidas para toda a população. Exemplo (2) Suponhamos que o director do jornal, por razões de comodidade, decide recolher opiniões numa amostra de pessoas residentes na cidade onde o jornal é editado. A amostra retirada naquela cidade não é representativa da população portuguesa e, portanto, as conclusões retiradas no estudo não se podem estender a toda a população portuguesa. Para obter uma amostra representativa da população portuguesa, parece razoável que se exija que cada português tenha a mesma probabilidade de vir a figurar na amostra. Temos então que escolher os portugueses para a nossa amostra perfeitamente ao acaso, i.e., aleatoriamente. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 5 / 27 Amostra aleatória Amostra aleatória Exemplo (1) João escolheu ao acaso seis rolos do lote recebido e observou o comprimento de cada um deles, tendo obtido os seguintes valores: 459m 455m 502m 501.5m 500.5m 456m Estes valores constituem uma amostra concreta de tamanho seis. Antes de seleccionar os rolos para a amostra, o João não é capaz de prever qual irá ser o comprimento do primeiro rolo, do segundo rolo, etc. O comprimento do i ésimo rolo seleccionado para a amostra é uma variável aleatória que representamos por X i. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 6 / 27

Amostra aleatória Tem-se: Amostra aleatória cada variável aleatória X i tem a mesma distribuição de X; as variáveis aleatórias X 1, X 2,..., X 6 são independentes (selecção aleatória dos rolos - a selecção de um rolo não tem influência na selecção de qualquer outro - o valor que uma das variáveis assume não tem qualquer efeito sobre o valor que outra qualquer assume) Definição Seja X uma variável aleatória que representa uma característica numérica em estudo numa determinada população. Chama-se amostra aleatória de tamanho n ao conjunto das variáveis aleatórias X 1, X 2,..., X n independentes e com a mesma distribuição de X. Os valores observados das variáveis aleatórias X 1, X 2,..., X n numa amostra concreta são representados por letras minúsculas:. x 1, x 2,..., x n (DepMAT ESTV) Distribuições por Amostragem 2007/2008 7 / 27 Amostra aleatória Amostra aleatória Quando a população é finita obtém-se uma amostra aleatória se a selecção dos elementos para a amostra é feita com reposição, pois neste caso as sucessivas extracções são independentes. Isto assegura que as variáveis aleatórias identicamente distribuídas X 1, X 2,..., X n sejam independentes. Muitas vezes, no entanto, a selecção dos elementos para uma amostra é feita sem reposição. Neste caso as variáveis aleatórias X 1, X 2,..., X n não serão independentes pois os valores que os primeiros elementos da amostra tomam condicionam os seguintes. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 8 / 27

Amostra aleatória Amostra aleatória Porém, se a amostra é pequena relativamente à população, a diferença entre reposição e não reposição é atenuada, já que a retirada de alguns elementos não altera drasticamente a composição da população e por isso a não reposição do item examinado terá efeito desprezível. Na prática, quando é feita amostragem sem reposição, é usual assumir a independência entre as variáveis aleatórias X 1, X 2,..., X n,se a amostra não exceder 5% do tamanho da população. Assim, se, ao contrário, a amostra exceder 5% do tamanho da população, deve-se fazer amostragem com reposição. Do que foi dito podemos concluir que quando a população é infinita é indiferente fazer ou não reposição; a amostra recolhida será sempre aleatória. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 9 / 27 Estatísticas, Estimadores e Estimativas Estatísticas, Estimadores e Estimativas Definição Sejam X 1, X 2,..., X n variáveis aleatórias que constituem uma amostra aleatória. Chama-se estatística a uma função das variáveis aleatórias X 1, X 2,..., X n que não contenha parâmetros desconhecidos. Uma estatística é, assim, uma nova variável aleatória (o valor assumido por ela é variável de amostra para amostra) e terá uma distribuição de probabilidade que é designada por distribuição por amostragem. Definição Chama-se estimador a qualquer estatística usada para estimar um parâmetro da população ou uma função desse parâmetro. Designa-se por estimativa o valor que um estimador assume para uma dada amostra concreta. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 10 / 27

Estatísticas, Estimadores e Estimativas Estatísticas, Estimadores e Estimativas Exemplos de Estatísticas e de Estimadores 1. X = 1 n n i=1 X i média amostral 2. SX 2 = 1 n n 1 i=1 (X i X) 2 variância amostral 3. T 1 = max(x 1, X 2,...,X n ) ou T 1 = min(x 1, X 2,...,X n ) 4. T 2 = X 1 + X 2 +...+ X n 5. T 3 = X 1 X 2... X n 6. T 4 = n n i=1 X i A função T 5 = ( n i=1 X i) ny não é uma estatística porque y não é conhecido, i.e., não é observável na amostra. X e SX 2,amédiaeavariância amostral, são exemplos de estimadores, usados para estimar, respectivamente, a média populacional µ X eavariância populacional σx 2. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 11 / 27 Teorema Limite Central Teorema Limite Central O teorema limite central é considerado um dos teoremas mais importantes na Estatística. Este pode ser enunciado da seguinte maneira: Teorema Limite Central Sejam X 1, X 2,..., X n variáveis aleatórias independentes e identicamente distribuídas com média µ e variância σ 2 (finita). Seja S n = X 1 + X 2 +...+ X n Então, S n E(S n ) Var (Sn ) = S n nµ nσ é uma v.a. cuja distribuição se aproxima da distribuição normal reduzida - N(0, 1), quando n tende para infinito. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 12 / 27

Teorema Limite Central Teorema Limite Central Isto é, S n E(S n ) Var (Sn ) = S n nµ N(0, 1) ou S n N (nµ, nσ 2) nσ Este teorema afirma que uma soma de variáveis aleatórias independentes e com a mesma distribuição (qualquer que ela seja) tem distribuição aproximadamente normal, desde que o número de parcelas, n, seja suficientemente grande. Na prática considera-se válida esta aproximação desde que n seja superior a 30. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 13 / 27 Distribuições amostrais Distribuição da média amostral Suponha que se extrai de uma população uma amostra aleatória, de tamanho n, com vista ao estudo de uma sua característica aleatória X, de média µ e variância σ 2. Já sabemos que a amostra aleatória é constituída por n variáveis aleatórias, X 1, X 2,..., X n, independentes e com a mesma distribuição de X. Qual é o valor esperado e a variância da média amostral? Valor esperado da média amostral ( ) 1 E(X) = E n (X 1 + X 2 +...+ X n ) = 1 ( ) E(X 1 )+E(X 2 )+...+ E(X n ) n = 1 (µ + µ +...+ µ) =µ n (DepMAT ESTV) Distribuições por Amostragem 2007/2008 14 / 27

Distribuições amostrais Distribuição da média amostral Variância da média amostral Var (X) = Var ( ) 1 n (X 1 + X 2 +...+ X n ) = 1 n 2 (Var (X 1)+Var (X 2 )+...+ Var (X n )) = 1 n 2 (σ2 + σ 2 +...+ σ 2 )= 1 n 2 nσ2 = σ2 n Então, µ X = µ e σ 2 X = σ2 n (DepMAT ESTV) Distribuições por Amostragem 2007/2008 15 / 27 Distribuições amostrais Distribuição da média amostral E quanto à distribuição de X? Se X N(µ, σ 2 ) então, pelo Teorema da Aditividade da Distribuição Normal, X = 1 n n i=1 X i N(µ, σ 2 /n) Z = X µ σ/ n N(0, 1) pois X 1,...,X n são independentes e têm distribuição normal. Se o tamanho da amostra n é suficientemente grande (n > 30), então pelo Teorema Limite Central X = 1 n n i=1 X i N(µ, σ 2 /n) Z = X µ σ/ n N(0, 1) pois X 1,...,X n são independentes e têm a mesma distribuição. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 16 / 27

Distribuição t de Student Distribuição t de Student Vimos que, se X N(µ, σ 2 ), então Z = X µ σ/ n N(0, 1) Suponhamos que a variância populacional σ 2 é desconhecida. Qual será a distribuição de Z se substituirmos a variância populacional σ 2 pelo seu estimador S 2? (DepMAT ESTV) Distribuições por Amostragem 2007/2008 17 / 27 Distribuição t de Student Distribuição t de Student Uma variável aleatória X tem distribuição t de Student com n graus de liberdade se a sua função densidade de probabilidade for dada por: f X (x) = Γ ( ) n+1 ( 2 1 + x 2 nπ Γ(n/2)) n onde Γ(n) = + 0 x n 1 e x dx ) n+1 2 Escreve-se abreviadamente X t n e tem-se, < x < + E(X) =0 e Var (X) = n n 2, para n > 2 (DepMAT ESTV) Distribuições por Amostragem 2007/2008 18 / 27

Distribuição t de Student Distribuição t de Student Ográfico da função densidade da distribuição t n é semelhante ao da distribuição normal reduzida - N(0, 1). Nomeadamente, a distribuição t n, tal como a distribuição N(0, 1), é simétrica em relação à recta x = 0. À medida que n tende para infinito a curva em sino da distribuição t n aproxima-se da curva da distribuição N(0, 1). (DepMAT ESTV) Distribuições por Amostragem 2007/2008 19 / 27 Distribuição t de Student Distribuição t de Student Se X N(µ, σ 2 ) eavariância populacional σ 2 é desconhecida, para amostras pequenas (n < 30), tem-se T = X µ S/ n t n 1 onde S é o desvio padrão amostral. Vamos usar esta estatística na construção de intervalos de confiança e nos testes de hipóteses, relativos à média µ de uma população normal. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 20 / 27

Distribuição do Qui-Quadrado Distribuição do Qui-Quadrado Uma variável aleatória X tem distribuição do Qui-Quadrado com n graus de liberdade (χ 2 n) se a sua função densidade de probabilidade for dada por: f X (x) = e x/2 x (n/2) 1 2 n/2 Γ(n/2), x > 0 onde Γ(n) = + 0 x n 1 e x dx Escreve-se abreviadamente X χ 2 n e tem-se E(X) =n e Var (X) =2n (DepMAT ESTV) Distribuições por Amostragem 2007/2008 21 / 27 Distribuição do Qui-Quadrado Distribuição do Qui-Quadrado A distribuição é não negativa e assimétrica positiva. Apesar disso, quando n tende para infinito a distribuição torna-se cada vez mais simétrica e aproxima-se da distribuição normal. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 22 / 27

Distribuição do Qui-Quadrado Se X 1, X 2,..., X n é uma amostra aleatória de uma população normal com média µ e variância σ 2, então (n 1)S 2 σ 2 χ 2 n 1 Iremos usar esta v. a. para construir intervalos de confiança para a variância e para testar hipóteses relativas a este parâmetro, quando a distribuição populacional é normal. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 23 / 27 Distribuição F-Snedcor Distribuição F-Snedcor A distribuição F-Snedcor pode ser definida como a razão entre duas variáveis aleatórias independentes e com distribuição do Qui-Quadrado, cada uma dividida pelos respectivos graus de liberdade. Sejam X 1 e X 2 variáveis aleatórias independentes, com distribuição do Qui-Quadrado com n 1 e n 2 graus de liberdade, respectivamente. A variável aleatória X = X 1/n 1 X 2 /n 2 segue uma distribuição que se designa por distribuição F-Snedcor com n 1 e n 2 graus de liberdade (n 1 são ditos os graus de liberdade do numerador e n 2 os graus de liberdade do denominador). Escreve-se abreviadamente X F n 2 n 1 ou X F n1,n 2 (DepMAT ESTV) Distribuições por Amostragem 2007/2008 24 / 27

Distribuição F-Snedcor Distribuição F-Snedcor A função densidade de probabilidade é dada por: f X (x) = Γ ( ) n 1 +n 2 2 Γ ( n 1 ) ( 2 Γ n2 2 ) ( ) n1 /2 n1 x n 1/2 1 n 2 ( 1 + n ) n 1 +n 2 2 1 x n 2, x > 0 onde Γ(n) = + 0 x n 1 e x dx (DepMAT ESTV) Distribuições por Amostragem 2007/2008 25 / 27 Distribuição F-Snedcor Distribuição F-Snedcor (DepMAT ESTV) Distribuições por Amostragem 2007/2008 26 / 27

Distribuição F-Snedcor Suponhamos que temos duas populações com distribuição normal e com variâncias σ 2 1 e σ2 2 respectivamente. Sejam S1 2 e S2 2 as variâncias amostrais baseadas em amostras independentes de tamanhos n 1 e n 2, respectivamente, dessas populações. Então, S 2 1 S 2 2 σ 2 2 σ 2 1 F n 1 1 n 2 1 Esta variável aleatória vai ser usada, mais adiante, na construção de intervalos de confiança e nos testes de hipóteses, relativos à comparação de variâncias de populações normais. (DepMAT ESTV) Distribuições por Amostragem 2007/2008 27 / 27