Amostras Aleatórias e Distribuições Amostrais. Probabilidade e Estatística: afinal, qual é a diferença?

Amostras Aleatórias e Distribuições Amostrais Probabilidade e Estatística: afial, qual é a difereça? Até agora o que fizemos foi desevolver modelos probabilísticos que se adequavam a situações reais. Por exemplo, idicamos quado os modelos Biomial, Poisso, Expoecial, Normal, Uiforme, etc... eram adequados. Todos estes modelos referem-se a distribuições de probabilidade que evolvem parâmetros, que até agora foram supostos cohecidos. Para que as probabilidades associadas a evetos sejam calculadas é ecessário cohecer o valor destes parâmetros. No estudo das probabilidades, o osso objetivo é calcular a probabilidade de evetos préespecificados. De agora em diate teremos um ovo objetivo. A partir de uma amostra de uma distribuição de probabilidade especificada pretedemos apreder alguma coisa sobre os parâmetros da distribuição, isto é, estaremos iteressados em estimar os parâmetros da distribuição de probabilidade. Esta é a grade difereça etre Probabilidade e Estatística. No estudo de Probabilidade estamos iteressados em defiir modelos que possam ser aplicados a situações reais. Estes modelos evolvem distribuições de probabilidade totalmete cohecidas, isto é, ão apeas a forma da desidade, mas também os seus parâmetros são cohecidos. No estudo da Estatística supõe-se que o modelo probabilístico é cohecido, isto é, sabe-se qual a distribuição de probabilidade que modela a situação real, mas os parâmetros desta distribuição são descohecidos, e devem ser estimados a partir dos dados. O osso objetivo em Estatística é descobrir alguma coisa sobre os parâmetros descohecidos de uma distribuição de probabilidade. Os mecaismos mais usuais para "iferir" alguma coisa sobre estes parâmetros são: ) Estimação potual - o objetivo é "chutar" os valores do parâmetro descohecido. ) Estimação por itervalos - o objetivo é ecotrar um itervalo que coteha o parâmetro de iteresse com uma probabilidade especificada. 3) Testes de hipóteses - o objetivo é criar cojecturas sobre os valores possíveis do parâmetro e verificar se estas cojecturas são muito ou pouco prováveis (isto é, testar as hipóteses). M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

Todos estes procedimetos são baseados a oção de amostra aleatória. Defiição (amostra, ou amostra aleatória) Uma amostra aleatória é um cojuto de variáveis aleatórias idepedetes e ideticamete distribuídas (iid). Notação : a.a. = amostra aleatória O que se faz a prática? Para gahar iformação sobre os parâmetros descohecidos de uma distribuição de probabilidade usamos um cojuto de variáveis aleatórias idepedetes e ideticamete distribuídas. Isto equivale a repetir a experiêcia aleatória que está sedo descrita pelo modelo em questão vezes, em codições idêticas e de maeira idepedete. A partir dos valores observados das variáveis X, X,..., X calcularemos fuções que os permitirão apreder sobre os parâmetros descohecidos do modelo. Estas fuções serão chamadas de "estatísticas". Defiição (estatística) Seja X, X,..., X uma a.a. de uma variável aleatória X. Sejam x, x,..., x os valores observados de X, X,..., X. Seja Y = h(x, X,..., X ) uma fução apeas das variáveis X, X,..., X. Y é chamado de "estatística". Note que uma estatística ão é fução de parâmetros descohecidos, ela só evolve as variáveis a amostra aleatória, ou seja, pode ser diretamete computada a partir dos valores observados uma amostra. Por defiição, qualquer estatística Y é uma variável aleatória, e tem uma distribuição de probabilidade que depede da distribuição de X, X,..., X. O osso problema etão é ecotrar estatísticas que sirvam como bos estimadores potuais de parâmetros descohecidos. Também é importate defiir critérios que os permitam dizer que uma estatística é "melhor" que outra para estimar um dado parâmetro. M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

3 De uma maeira geral, as estatísticas devem coter "toda" a iformação presete uma amostra. Se ão fosse assim, ão valeria a pea calcular uma estatística, a gete simplesmete usaria uma úica observação da amostra. Este acréscimo de iformação represetado pelo uso de uma estatística (ao ivés de uma úica observação) geralmete se traduz por uma cosiderável redução a variâcia. Por exemplo, a variâcia da média amostral é igual à variâcia de cada observação dividida pelo tamaho da amostra. Quato maior o tamaho da amostra, meor é a variâcia da média amostral, isto é, mais "precisa" é a média amostral. As estatísticas mais famosas Sejam X, X,..., X uma amostra aleatória de uma distribuição qualquer. As estatísticas mais comus, calculadas a partir desta amostra são: ) Média amostral X = X i i= ) Variâcia amostral S = Xi X i= 3) Desvio padrão amostral S= S = ( Xi X) i= 4) Míimo da amostra X () = mi X, X,..., X 5) Máximo da amostra X = max X, X,..., X 6) Amplitude da amostra A = X () - X () M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

4 7) k-ésima estatística de ordem É o k-ésimo elemeto da amostra ordeada. Por exemplo, X () é o segudo meor elemeto da amostra X, X,..., X. Um dos ossos objetivos aqui é desevolver as distribuições de estatísticas obtidas a partir de uma amostra aleatória da distribuição Normal. O próximo teorema refere-se à média amostral de uma amostra aleatória da desidade Normal. Sejam X, X,..., X uma amostra aleatória da distribuição N(µ, σ ). Seja X a média amostral. Etão: X N µ σ, A demostração do teorema é trivial, e segue das propriedades da fução geradora de mometos. Este teorema pode ser geeralizado para uma amostra aleatória de uma distribuição qualquer. Sejam X, X,..., X uma amostra aleatória de uma distribuição qualquer tal que E(X i ) = µ e VAR(X i ) = σ. Seja X a média amostral. Etão: ) E( X ) = µ ) VAR( X ) = σ / 3) Se é grade, pelo teorema cetral do limite podemos cocluir que:. X µ σ é aproximadamete N(0,). M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

5 Note que, este caso, ada é dito a respeito da distribuição de X. Apeas a sua média e variâcia são cohecidas, e são fuções da média e variâcia de cada X i. A pricípio a distribuição de X poderia ser uma coisa estraha, que ão tem ada a ver com a distribuição origial de cada X i. No etato, se o tamaho da amostra é grade podemos cocluir que a distribuição de X, devidamete escaloada, é aproximadamete N(0,). O próximo teorema refere-se à distribuição do máximo e do míimo de uma amostra. Sejam X, X,..., X uma amostra aleatória de uma distribuição cotíua qualquer com desidade f(.) e fução de distribuição F(.). Sejam X () e X () respectivamete, o míimo e o máximo da amostra. Etão as desidades de X () e X () são dadas por: ) Desidade do míimo g ( x) =. f( x). F( x) ) Desidade do máximo g ( x) =. f( x). F( x) Demostração Só faremos a demostração do segudo item (máximo da amostra). A demostração do outro item é semelhate. Note que se X () é o máximo da amostra, etão X () < k equivale a : todo X i < k, para qualquer úmero k. Logo, a fução de distribuição do máximo pode ser facilmete ecotrada, e é dada por: ( ) ( ) G ( k) = Pr X k = Pr X k, X k,..., X k Também, os X i 's são idepedetes, e esta última probabilidade pode ser escrita como o produto das probabilidades para cada X i. Etão: G ( k) = Pr X k, X k,..., X k = Pr X k.pr X k...pr X k M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

6 Como os X i são ideticamete distribuídos, estas probabilidades são as mesmas para todo X i e correspodem à fução de distribuição F(.) com argumeto k. ( ( )) G ( k) = Pr X k = F( k) A desidade de X () é ecotrada derivado-se a fução de distribuição com relação ao argumeto k, e lembrado que a derivada de F(.) é f(.), a desidade de cada X i. Etão : g dg ( k) df( k) ( k) = =. F( k). = dk dk fk..( Fk ) Exemplo Sejam X, X,..., X uma amostra aleatória da desidade Expoecial com parâmetro λ. Ecotre a desidade de X (), o míimo da amostra. Solução A desidade de cada X i é: λ f( x) = λ. e x A fução de distribuição é: t x Fx = Pr ( X x) = λ λ λ. e dt= e A desidade do míimo é, pelo teorema aterior: x 0 λy λy ( λ ) λy +. λ. y λ g ( y) =. F( y). f( y) =. + e.. e =. λ. e =.. e Ou seja, X () tem desidade Expoecial com parâmetro.λ. = Exemplo A duração de um compoete eletrôico é uma variável aleatória T com distribuição Expoecial com parâmetro λ = 0.00. Testou-se 00 compoetes e observou-se a duração de cada um deles, gerado uma amostra aleatória T, T,..., T 00. Calcule as seguites probabilidades: a) Pr ( 950 < T < 00) M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

7 b) Pr ( W > 700) ode W = máx( T, T,..., T 00 ) c) Pr ( V < 0) ode V = mí( T, T,..., T 00 ) Solução a) Note que, se T i ~ Expo( 0.00) para i =,,..., 00 etão : E(T i ) = / 0.00 = 000 e VAR(T i ) = /(0.00) = 0 6 Assim: E(T) = E(T i ) = 000 e VAR(T) = VAR(T i )/00 = 0 4 Pelo teorema cetral do limite: T 000 T 000 Z = = 4 0 00 tem aproximadamete a distribuição N(0,). Assim: 950 000 T 000 00 000 Pr( 950 T 00) = Pr = 00 00 00 ( Z ) Φ Φ = Pr 05. = 05. = 053. Ode estas últimas probabilidades foram obtidas da tabela N(0,). b) Pr ( W > 700) = Pr{ máx( T, T,..., T 00 ) > 700 } = = - Pr{ máx( T, T,..., T 00 ) 700 } Mas, se W = máx( T, T,..., T 00 ) 700 etão todos os T i são 700. ( W 700) ( T 700 T 700 T 700) Pr = Pr,,..., = 00 ( ( T )) ( e. ) (. e ) 00 0 00 700 00 7 00 00 = Pr 700 = = = 0. 9995 = 0. 98 c) Pr ( V < 0) ode V = mí( T, T,..., T 00 ) Pr ( V < 0) = - Pr( V 0) = - Pr(mí( T, T,..., T 00 ) 0) Mas, se mí( T, T,..., T 00 ) 0 etão todos os T i também são 0. Logo, Pr( V < 0) = - Pr(T 0, T 0,..., T 00 0) = [ ( )].. [ ] [ ] 00 0000 00 00 00 = Pr T 0 = e = e = e = 0. 63 M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

8 A distribuição Qui-Quadrado Defiição (desidade Qui-Quadrado com k graus de liberdade) Seja X uma variável aleatória cotíua e positiva com desidade dada por: k x / f ( x) =. x. e ode x > 0 k / k. Γ Etão X tem desidade Qui-Quadrado com k graus de liberdade, e escrevemos : X ~ χ k A desidade Qui-Quadrado com k graus de liberdade é apeas um caso particular da desidade Gama. Na verdade: χ k = Gama( α = k/, β = /) Desidades Qui-Quadrado com, 3, 4 e 8 Graus de Liberdade 0.50 0.45 0.40 0.35 0.30 0.5 0.0 0.5 0.0 0.05 0.00 0.00 0.5 0.50 0.75.00.5.50.75.00.5.50.75 3.00 3.5 3.50 3.75 4.00 4.5 4.50 4.75 5.00 5.5 5.50 5.75 6.00 6.5 6.50 6.75 7.00 7.5 7.50 7.75 8.00 Qui Quadrado() Qui Quadrado(3) Qui Quadrado(4) Qui Quadrado(8) Se X tem desidade Qui-Quadrado com k graus de liberdade etão sua média, variâcia e fução geradora de mometos são dadas por: M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

9 E(X) = k VAR(X) =.k Mt () = ( t) r/ Demostração Segue direto dos resultados correspodetes para a desidade Gama. A desidade Qui-Quadrado é tabelada. As tabelas desta desidade forecem os potos tais que a probabilidade da variável estar acima deles é especificada. Uma pequea porção de uma tabela da desidade Qui-Quadrado é mostrada a seguir. graus de 0.990 0.950 0.050 0.0 liberdade 0.00 0.00 5.99 9. 6 0.870.640.59 6.8 3.570 5.3.03 6. Por exemplo: Supodo que X seja uma variável aleatória com desidade Qui-Quadrado com 6 graus de liberdade, a probabilidade de X exceder 0.87 é 99%. Aalogamete, a probabilidade de X exceder.59 é 5% e a probabilidade de X estar acima de 6.8 é apeas %. Uma propriedade muito importate da desidade Qui-Quadrado é a preservação da mesma família de desidades quado somamos variáveis idepedetes. Ou seja, se X, X,..., X são variáveis idepedetes, cada uma com distribuição Qui-Quadrado, a soma de X, X,..., X também é uma variável aleatória Qui-Quadrado. (aditividade da desidade Qui-Quadrado) Sejam X, X,..., X variáveis aleatórias idepedetes, e supoha que X i tem desidade Qui-Quadrado com k i graus de liberdade. Seja Y = X + X +... + X. Etão Y tem também uma desidade Qui-Quadrado, mas com k = k + k +... + k graus de liberdade. O próximo teorema exibe a relação existete etre as desidades Normal padrão e Qui- Quadrado. M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

0 Seja Z ~ N(0,). Etão V = Z tem desidade Qui-Quadrado com grau de liberdade. Demostração A demostração é feita usado-se o método da fução de distribuição, já que a fução V = Z ão é ijetora, o que os impede de usar o método do jacobiao : G(v) = Pr( V v) = Pr( Z v) = Pr( - v Z + v ) = Φ(+ v ) - Φ(- v ) ode Φ(.) idica a fução de distribuição de uma variável aleatória N(0,). Derivado esta expressão em relação a v resulta a desidade de V, que é : ( v) ( v / ) / gv =.exp.. v.exp.. v = π π v =. v. exp v. = π π / / e v / Isto é : v/ g() v v. e v / = / = v. e π / Γ Substituido k = a defiição da desidade Qui-Quadrado resulta a expressão acima, o que prova o teorema. A combiação dos últimos teoremas leva a um resultado importate. Sejam Z, Z,..., Z variáveis aleatórias idepedetes e ideticamete distribuídas com desidade N(0,). Etão: i i= V = Z = Z + Z +... + Z tem desidade Qui-Quadrado com graus de liberdade. M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

Este resultado segue trivialmete dos dois últimos teoremas, se lembrarmos que cada Z i tem desidade Qui-Quadrado com grau de liberdade ( e são todos idepedetes). Por que a desidade Qui-Quadrado é importate? Esta desidade está relacioada com a distribuição da variâcia amostral obtida a partir de uma amostra aleatória Normal, como idicado o próximo teorema. Sejam X, X,..., X uma amostra aleatória da distribuição N(µ, σ ). Seja S a variâcia amostral, dada por: Etão: S = ( Xi X) i= ( Xi X) ( ) S i= = σ σ tem distribuição Qui-Quadrado com (-) graus de liberdade. A partir deste teorema podemos deduzir facilmete a média e variâcia de S. Sejam X, X,..., X uma amostra aleatória da distribuição N(µ, σ ). Seja S a variâcia amostral. Etão : ES = σ σ VAR( S ) = Demostração 4 Pelo teorema aterior e sabedo a média e variâcia de uma variável aleatória Qui- Quadrado temos: M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com

( ) σ E S ( ) σ = E( S ) = = σ ( ) ( ) ( σ ) VAR S.. 4. σ =. ( ) VAR( S ) = = σ ( ) M. Barros Cosultoria Ltda. e-mail: barrosm@alumi.utexas.et ifo@mbarros.com