Amostras Aleatórias e Distribuições Amostrais. Probabilidade e Estatística: afinal, qual é a diferença?

Documentos relacionados
Probabilidade II Aula 9

n ) uma amostra aleatória da variável aleatória X.

Probabilidade II Aula 12

Lista de Exercícios #4 Assunto: Variáveis Aleatórias Contínuas

Avaliação de Desempenho de Sistemas Discretos

binomial seria quase simétrica. Nestas condições será também melhor a aproximação pela distribuição normal.

MQI 2003 ESTATÍSTICA PARA METROLOGIA - SEMESTRE Teste 2 07/07/2008 Nome: PROBLEMA 1 Sejam X e Y v.a. contínuas com densidade conjunta:

Lista de Exercícios #6 Assunto: Propriedade dos Estimadores e Métodos de Estimação

Estimadores de Momentos

Sumário. 2 Índice Remissivo 17

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

1 Distribuições Amostrais

Distribuições Amostrais

Cap. 4 - Estimação por Intervalo

6.1 Estimativa de uma média populacional: grandes amostras. Definição: Um estimador é uma característica amostral (como a média amostral

MAE Introdução à Probabilidade e Estatística II Resolução Lista 2

Obtemos, então, uma amostra aleatória de tamanho n de X, que representamos por X 1, X 2,..., X n.

Estatística para Economia e Gestão REVISÕES SOBRE VARIÁVEIS ALEATÓRIAS DISCRETAS E CONTÍNUAS

Sumário. 2 Índice Remissivo 11

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Estimação pontual e intervalar

CAPÍTULO 6 ESTIMATIVA DE PARÂMETROS PPGEP. Introdução. Introdução. Estimativa de Parâmetros UFRGS

Lista 9 - Introdução à Probabilidade e Estatística

ESTATÍSTICA EXPLORATÓRIA

ESTIMAÇÃO PARA A MÉDIA

Teorema do limite central e es/mação da proporção populacional p

DESIGUALDADES, LEIS LIMITE E TEOREMA DO LIMITE CENTRAL. todas as repetições). Então, para todo o número positivo ξ, teremos:

Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2004

Stela Adami Vayego DEST/UFPR

Distribuições de Estatísticas Amostrais e Teorema Central do Limite

Probabilidades e Estatística

Estimação da média populacional

Distribuições Amostrais

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Distribuições Amostrais

Estatística. Estatística II - Administração. Prof. Dr. Marcelo Tavares. Distribuições de amostragem. Estatística Descritiva X Estatística Inferencial

MAE Introdução à Probabilidade e Estatística II Resolução Lista 1

Estimativa de Parâmetros

Objetivo. Estimar a média µ de uma variável aleatória X, que representa uma característica de interesse de uma população, a partir de uma amostra.

Stela Adami Vayego Estatística II CE003/DEST/UFPR

ESTIMAÇÃO POR INTERVALO (INTERVALOS DE CONFIANÇA)

UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPTO. DE ESTATÍSTICA LISTA 4 PROBABILIDADE A (CE068) Prof. Benito Olivares Aguilera

Revisando... Distribuição Amostral da Média

Intervalos de Confiança

EPR 007 Controle Estatístico de Qualidade

CAPÍTULO 6 - ESTIMAÇÃO E TESTES DE HIPÓTESES

ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL p

ESTIMAÇÃO DE PARÂMETROS

d) A partir do item c) encontre um estimador não viciado para σ 2.

Estimação da média populacional

AMOSTRAGEM ALEATÓRIA DISTRIBUIÇÕES POR AMOSTRAGEM

Capítulo 5- Introdução à Inferência estatística. (Versão: para o manual a partir de 2016/17)

Instruções gerais sobre a Prova:

Capítulo 5- Introdução à Inferência estatística.

DISTRIBUIÇÕES DE PROBABILIDADE

NOTAS DE AULA: DISTRIBUIÇÃO AMOSTRAL E INTERVALOS DE CONFIANÇA

Aula 5. Aula de hoje. Aula passada. Limitante da união Método do primeiro momento Lei dos grandes números (fraca e forte) Erro e confiança

Propriedades: Notação: X ~ U(α, β). PRINCIPAIS MODELOS CONTÍNUOS

Comparação entre duas populações

Intervalos Estatísticos para uma única Amostra - parte II

CONHECIMENTOS ESPECÍFICOS

Stela Adami Vayego DEST/UFPR

Estimar uma proporção p (desconhecida) de elementos em uma população, apresentando certa característica de interesse, a partir da informação

Caderno de Exercício 2

b) Fabrico de peças cilíndricas Capítulo 5 - Distribuições conjuntas de probabilidades e complementos X - comprimento da peça Y - diâmetro da peça

DEPARTAMENTO DE ESTATÍSTICA - UFMG PROVA DE ESTATÍSTICA E PROBABILIDADE SELEÇÃO - MESTRADO/ UFMG /2016

Universidade Federal de Mato Grosso Probabilidade e Estatística - Curso: Engenharia Civil Introdução à Inferência Estatística - Prof a Eveliny

Análise de Algoritmos. Análise de Algoritmos. Análise de Algoritmos. Análise de Algoritmos. Análise de Algoritmos. Análise de Algoritmos

A DESIGUALDADE DE CHEBYCHEV

Teoria da Estimação 1

Estatística. 7 - Distribuições Amostrais

Distribuição Amostral da Média: Exemplos

PROVA DE ESTATÍSTICA SELEÇÃO MESTRADO/UFMG 2005

Objetivo. Estimar a média de uma variável aleatória X, que representa uma característica de interesse de uma população, a partir de uma amostra.

Probabilidade 2 - ME310 - Lista 5

INFERÊNCIA. Fazer inferência (ou inferir) = tirar conclusões

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Probabilidades e Estatística LEAN, LEGI, LEGM, LMAC, MEAer, MEAmbi, MEC

UNIVERSIDADE FEDERAL DO PARANÁ NOTAS DE AULA PROFa. SONIA MÜLLER

2.2. Séries de potências

CONCEITOS BÁSICOS E PRINCÍPIOS DE ESTATÍSTICA

Probabilidades e Estatística TODOS OS CURSOS

Secção 1. Introdução às equações diferenciais

1 Estimação de Parâmetros

S E Q U Ê N C I A S E L I M I T E S. Prof. Benito Frazão Pires. Uma sequência é uma lista ordenada de números

Como se decidir entre modelos

5 Teoria dos Valores Extremos

Mestrado Integrado em Engenharia Civil. Disciplina: TRANSPORTES. Sessão Prática 4: Amostragem

Objetivos. Testes não-paramétricos

Séquências e Séries Infinitas de Termos Constantes

1. Dados: Deve compreender-se a natureza dos dados que formam a base dos procedimentos

Universidade Federal de Lavras Departamento de Estatística Prof. Daniel Furtado Ferreira 1 a Aula Prática Técnicas de somatório

INFERÊNCIA ESTATÍSTICA

MATEMÁTICA II. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Virgílio A. F. Almeida DCC-UFMG 1/2005

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

5. ANÁLISE DE SISTEMAS DA CONFIABILIADE DE SISTEMAS SÉRIE-PARALELO

Objetivos. Os testes de hipóteses ser: Paramétricos e Não Paramétricos. Testes não-paramétricos. Testes paramétricos

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

Virgílio A. F. Almeida DCC-UFMG 2005

Transcrição:

Amostras Aleatórias e Distribuições Amostrais Probabilidade e Estatística: afial, qual é a difereça? Até agora o que fizemos foi desevolver modelos probabilísticos que se adequavam a situações reais. Por exemplo, idicamos quado os modelos Biomial, Poisso, Expoecial, Normal, Uiforme, etc... eram adequados. Todos estes modelos referem-se a distribuições de probabilidade que evolvem parâmetros, que até agora foram supostos cohecidos. Para que as probabilidades associadas a evetos sejam calculadas é ecessário cohecer o valor destes parâmetros. No estudo das probabilidades, o osso objetivo é calcular a probabilidade de evetos préespecificados. De agora em diate teremos um ovo objetivo. A partir de uma amostra de uma distribuição de probabilidade especificada pretedemos apreder alguma coisa sobre os parâmetros da distribuição, isto é, estaremos iteressados em estimar os parâmetros da distribuição de probabilidade. Esta é a grade difereça etre Probabilidade e Estatística. No estudo de Probabilidade estamos iteressados em defiir modelos que possam ser aplicados a situações reais. Estes modelos evolvem distribuições de probabilidade totalmete cohecidas, isto é, ão apeas a forma da desidade, mas também os seus parâmetros são cohecidos. No estudo da Estatística supõe-se que o modelo probabilístico é cohecido, isto é, sabe-se qual a distribuição de probabilidade que modela a situação real, mas os parâmetros desta distribuição são descohecidos, e devem ser estimados a partir dos dados. O osso objetivo em Estatística é descobrir alguma coisa sobre os parâmetros descohecidos de uma distribuição de probabilidade. Os mecaismos mais usuais para "iferir" alguma coisa sobre estes parâmetros são: ) Estimação potual - o objetivo é "chutar" os valores do parâmetro descohecido. ) Estimação por itervalos - o objetivo é ecotrar um itervalo que coteha o parâmetro de iteresse com uma probabilidade especificada. 3) Testes de hipóteses - o objetivo é criar cojecturas sobre os valores possíveis do parâmetro e verificar se estas cojecturas são muito ou pouco prováveis (isto é, testar as hipóteses). M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

Todos estes procedimetos são baseados a oção de amostra aleatória. Defiição (amostra, ou amostra aleatória) Uma amostra aleatória é um cojuto de variáveis aleatórias idepedetes e ideticamete distribuídas (iid). Notação : a.a. = amostra aleatória O que se faz a prática? Para gahar iformação sobre os parâmetros descohecidos de uma distribuição de probabilidade usamos um cojuto de variáveis aleatórias idepedetes e ideticamete distribuídas. Isto equivale a repetir a experiêcia aleatória que está sedo descrita pelo modelo em questão vezes, em codições idêticas e de maeira idepedete. A partir dos valores observados das variáveis X, X,..., X calcularemos fuções que os permitirão apreder sobre os parâmetros descohecidos do modelo. Estas fuções serão chamadas de "estatísticas". Defiição (estatística) Seja X, X,..., X uma a.a. de uma variável aleatória X. Sejam x, x,..., x os valores observados de X, X,..., X. Seja Y = h(x, X,..., X ) uma fução apeas das variáveis X, X,..., X. Y é chamado de "estatística". Note que uma estatística ão é fução de parâmetros descohecidos, ela só evolve as variáveis a amostra aleatória, ou seja, pode ser diretamete computada a partir dos valores observados uma amostra. Por defiição, qualquer estatística Y é uma variável aleatória, e tem uma distribuição de probabilidade que depede da distribuição de X, X,..., X. O osso problema etão é ecotrar estatísticas que sirvam como bos estimadores potuais de parâmetros descohecidos. Também é importate defiir critérios que os permitam dizer que uma estatística é "melhor" que outra para estimar um dado parâmetro. M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

3 De uma maeira geral, as estatísticas devem coter "toda" a iformação presete uma amostra. Se ão fosse assim, ão valeria a pea calcular uma estatística, a gete simplesmete usaria uma úica observação da amostra. Este acréscimo de iformação represetado pelo uso de uma estatística (ao ivés de uma úica observação) geralmete se traduz por uma cosiderável redução a variâcia. Por exemplo, a variâcia da média amostral é igual à variâcia de cada observação dividida pelo tamaho da amostra. Quato maior o tamaho da amostra, meor é a variâcia da média amostral, isto é, mais "precisa" é a média amostral. As estatísticas mais famosas Sejam X, X,..., X uma amostra aleatória de uma distribuição qualquer. As estatísticas mais comus, calculadas a partir desta amostra são: ) Média amostral X = X i i= ) Variâcia amostral S = Xi X i= 3) Desvio padrão amostral S= S = ( Xi X) i= 4) Míimo da amostra X () = mi X, X,..., X 5) Máximo da amostra X = max X, X,..., X 6) Amplitude da amostra A = X () - X () M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

4 7) k-ésima estatística de ordem É o k-ésimo elemeto da amostra ordeada. Por exemplo, X () é o segudo meor elemeto da amostra X, X,..., X. Um dos ossos objetivos aqui é desevolver as distribuições de estatísticas obtidas a partir de uma amostra aleatória da distribuição Normal. O próximo teorema refere-se à média amostral de uma amostra aleatória da desidade Normal. Sejam X, X,..., X uma amostra aleatória da distribuição N(µ, σ ). Seja X a média amostral. Etão: X N µ σ, A demostração do teorema é trivial, e segue das propriedades da fução geradora de mometos. Este teorema pode ser geeralizado para uma amostra aleatória de uma distribuição qualquer. Sejam X, X,..., X uma amostra aleatória de uma distribuição qualquer tal que E(X i ) = µ e VAR(X i ) = σ. Seja X a média amostral. Etão: ) E( X ) = µ ) VAR( X ) = σ / 3) Se é grade, pelo teorema cetral do limite podemos cocluir que:. X µ σ é aproximadamete N(0,). M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

5 Note que, este caso, ada é dito a respeito da distribuição de X. Apeas a sua média e variâcia são cohecidas, e são fuções da média e variâcia de cada X i. A pricípio a distribuição de X poderia ser uma coisa estraha, que ão tem ada a ver com a distribuição origial de cada X i. No etato, se o tamaho da amostra é grade podemos cocluir que a distribuição de X, devidamete escaloada, é aproximadamete N(0,). O próximo teorema refere-se à distribuição do máximo e do míimo de uma amostra. Sejam X, X,..., X uma amostra aleatória de uma distribuição cotíua qualquer com desidade f(.) e fução de distribuição F(.). Sejam X () e X () respectivamete, o míimo e o máximo da amostra. Etão as desidades de X () e X () são dadas por: ) Desidade do míimo g ( x) =. f( x). F( x) ) Desidade do máximo g ( x) =. f( x). F( x) Demostração Só faremos a demostração do segudo item (máximo da amostra). A demostração do outro item é semelhate. Note que se X () é o máximo da amostra, etão X () < k equivale a : todo X i < k, para qualquer úmero k. Logo, a fução de distribuição do máximo pode ser facilmete ecotrada, e é dada por: ( ) ( ) G ( k) = Pr X k = Pr X k, X k,..., X k Também, os X i 's são idepedetes, e esta última probabilidade pode ser escrita como o produto das probabilidades para cada X i. Etão: G ( k) = Pr X k, X k,..., X k = Pr X k.pr X k...pr X k M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

6 Como os X i são ideticamete distribuídos, estas probabilidades são as mesmas para todo X i e correspodem à fução de distribuição F(.) com argumeto k. ( ( )) G ( k) = Pr X k = F( k) A desidade de X () é ecotrada derivado-se a fução de distribuição com relação ao argumeto k, e lembrado que a derivada de F(.) é f(.), a desidade de cada X i. Etão : g dg ( k) df( k) ( k) = =. F( k). = dk dk fk..( Fk ) Exemplo Sejam X, X,..., X uma amostra aleatória da desidade Expoecial com parâmetro λ. Ecotre a desidade de X (), o míimo da amostra. Solução A desidade de cada X i é: λ f( x) = λ. e x A fução de distribuição é: t x Fx = Pr ( X x) = λ λ λ. e dt= e A desidade do míimo é, pelo teorema aterior: x 0 λy λy ( λ ) λy +. λ. y λ g ( y) =. F( y). f( y) =. + e.. e =. λ. e =.. e Ou seja, X () tem desidade Expoecial com parâmetro.λ. = Exemplo A duração de um compoete eletrôico é uma variável aleatória T com distribuição Expoecial com parâmetro λ = 0.00. Testou-se 00 compoetes e observou-se a duração de cada um deles, gerado uma amostra aleatória T, T,..., T 00. Calcule as seguites probabilidades: a) Pr ( 950 < T < 00) M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

7 b) Pr ( W > 700) ode W = máx( T, T,..., T 00 ) c) Pr ( V < 0) ode V = mí( T, T,..., T 00 ) Solução a) Note que, se T i ~ Expo( 0.00) para i =,,..., 00 etão : E(T i ) = / 0.00 = 000 e VAR(T i ) = /(0.00) = 0 6 Assim: E(T) = E(T i ) = 000 e VAR(T) = VAR(T i )/00 = 0 4 Pelo teorema cetral do limite: T 000 T 000 Z = = 4 0 00 tem aproximadamete a distribuição N(0,). Assim: 950 000 T 000 00 000 Pr( 950 T 00) = Pr = 00 00 00 ( Z ) Φ Φ = Pr 05. = 05. = 053. Ode estas últimas probabilidades foram obtidas da tabela N(0,). b) Pr ( W > 700) = Pr{ máx( T, T,..., T 00 ) > 700 } = = - Pr{ máx( T, T,..., T 00 ) 700 } Mas, se W = máx( T, T,..., T 00 ) 700 etão todos os T i são 700. ( W 700) ( T 700 T 700 T 700) Pr = Pr,,..., = 00 ( ( T )) ( e. ) (. e ) 00 0 00 700 00 7 00 00 = Pr 700 = = = 0. 9995 = 0. 98 c) Pr ( V < 0) ode V = mí( T, T,..., T 00 ) Pr ( V < 0) = - Pr( V 0) = - Pr(mí( T, T,..., T 00 ) 0) Mas, se mí( T, T,..., T 00 ) 0 etão todos os T i também são 0. Logo, Pr( V < 0) = - Pr(T 0, T 0,..., T 00 0) = [ ( )].. [ ] [ ] 00 0000 00 00 00 = Pr T 0 = e = e = e = 0. 63 M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

8 A distribuição Qui-Quadrado Defiição (desidade Qui-Quadrado com k graus de liberdade) Seja X uma variável aleatória cotíua e positiva com desidade dada por: k x / f ( x) =. x. e ode x > 0 k / k. Γ Etão X tem desidade Qui-Quadrado com k graus de liberdade, e escrevemos : X ~ χ k A desidade Qui-Quadrado com k graus de liberdade é apeas um caso particular da desidade Gama. Na verdade: χ k = Gama( α = k/, β = /) Desidades Qui-Quadrado com, 3, 4 e 8 Graus de Liberdade 0.50 0.45 0.40 0.35 0.30 0.5 0.0 0.5 0.0 0.05 0.00 0.00 0.5 0.50 0.75.00.5.50.75.00.5.50.75 3.00 3.5 3.50 3.75 4.00 4.5 4.50 4.75 5.00 5.5 5.50 5.75 6.00 6.5 6.50 6.75 7.00 7.5 7.50 7.75 8.00 Qui Quadrado() Qui Quadrado(3) Qui Quadrado(4) Qui Quadrado(8) Se X tem desidade Qui-Quadrado com k graus de liberdade etão sua média, variâcia e fução geradora de mometos são dadas por: M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

9 E(X) = k VAR(X) =.k Mt () = ( t) r/ Demostração Segue direto dos resultados correspodetes para a desidade Gama. A desidade Qui-Quadrado é tabelada. As tabelas desta desidade forecem os potos tais que a probabilidade da variável estar acima deles é especificada. Uma pequea porção de uma tabela da desidade Qui-Quadrado é mostrada a seguir. graus de 0.990 0.950 0.050 0.0 liberdade 0.00 0.00 5.99 9. 6 0.870.640.59 6.8 3.570 5.3.03 6. Por exemplo: Supodo que X seja uma variável aleatória com desidade Qui-Quadrado com 6 graus de liberdade, a probabilidade de X exceder 0.87 é 99%. Aalogamete, a probabilidade de X exceder.59 é 5% e a probabilidade de X estar acima de 6.8 é apeas %. Uma propriedade muito importate da desidade Qui-Quadrado é a preservação da mesma família de desidades quado somamos variáveis idepedetes. Ou seja, se X, X,..., X são variáveis idepedetes, cada uma com distribuição Qui-Quadrado, a soma de X, X,..., X também é uma variável aleatória Qui-Quadrado. (aditividade da desidade Qui-Quadrado) Sejam X, X,..., X variáveis aleatórias idepedetes, e supoha que X i tem desidade Qui-Quadrado com k i graus de liberdade. Seja Y = X + X +... + X. Etão Y tem também uma desidade Qui-Quadrado, mas com k = k + k +... + k graus de liberdade. O próximo teorema exibe a relação existete etre as desidades Normal padrão e Qui- Quadrado. M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

0 Seja Z ~ N(0,). Etão V = Z tem desidade Qui-Quadrado com grau de liberdade. Demostração A demostração é feita usado-se o método da fução de distribuição, já que a fução V = Z ão é ijetora, o que os impede de usar o método do jacobiao : G(v) = Pr( V v) = Pr( Z v) = Pr( - v Z + v ) = Φ(+ v ) - Φ(- v ) ode Φ(.) idica a fução de distribuição de uma variável aleatória N(0,). Derivado esta expressão em relação a v resulta a desidade de V, que é : ( v) ( v / ) / gv =.exp.. v.exp.. v = π π v =. v. exp v. = π π / / e v / Isto é : v/ g() v v. e v / = / = v. e π / Γ Substituido k = a defiição da desidade Qui-Quadrado resulta a expressão acima, o que prova o teorema. A combiação dos últimos teoremas leva a um resultado importate. Sejam Z, Z,..., Z variáveis aleatórias idepedetes e ideticamete distribuídas com desidade N(0,). Etão: i i= V = Z = Z + Z +... + Z tem desidade Qui-Quadrado com graus de liberdade. M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

Este resultado segue trivialmete dos dois últimos teoremas, se lembrarmos que cada Z i tem desidade Qui-Quadrado com grau de liberdade ( e são todos idepedetes). Por que a desidade Qui-Quadrado é importate? Esta desidade está relacioada com a distribuição da variâcia amostral obtida a partir de uma amostra aleatória Normal, como idicado o próximo teorema. Sejam X, X,..., X uma amostra aleatória da distribuição N(µ, σ ). Seja S a variâcia amostral, dada por: Etão: S = ( Xi X) i= ( Xi X) ( ) S i= = σ σ tem distribuição Qui-Quadrado com (-) graus de liberdade. A partir deste teorema podemos deduzir facilmete a média e variâcia de S. Sejam X, X,..., X uma amostra aleatória da distribuição N(µ, σ ). Seja S a variâcia amostral. Etão : ES = σ σ VAR( S ) = Demostração 4 Pelo teorema aterior e sabedo a média e variâcia de uma variável aleatória Qui- Quadrado temos: M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

( ) σ E S ( ) σ = E( S ) = = σ ( ) ( ) ( σ ) VAR S.. 4. σ =. ( ) VAR( S ) = = σ ( ) M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com