CEDEPLAR - UFMG Nvelameto em Estatístca 3 Prof a Suel Moro Varáves aleatóras Varável aleatóra resultado ou produto de um epermeto aleatóro com um resultado úco. Varável resultado = Espaço amostral cojuto dos valores possíves do epermeto, ou de valores que a varável pode tomar represetados ormalmete por músculo. Eemplo : Epermeto jogar um dado vezes Espaço amostral, S todas as combações possíves de caras e coroas que podemos obter = Varável aleatóra, o de caras as vezes em que se joga o dado Se = 4 sso pode sgfcar um resultado de epermeto do tpo: Ca Ca Co Co Co Ca Co Co Co Ca Eemplo : Cosumo de famílas em fução da reda Espaço amostral, S todos os valores de cosumo possível por famla. = varável aleatóra cosumo = valores que o cosumo pode tomar para cada faa de reda. Podemos lmtar o espaço amostral para famílas com reda= por eemplo. Teorcamete podemos esperar qualquer resultado de cosumo para uma mesma faa de reda ou reda.
Reda Valores do Cosumo= 8 6 5 O resultado é certo e podemos mputar probabldades às varáves aleatóras Prob = E. Prob =8 Varáves aleatóras dscretas e cotuas Dscretas evolvem cotagem E. o de acdetes uma estrada, resultados do jogo de dados, votar ou ão em determado partdo, comprar ou ão um carro, o de meos ou meas que um casal pode ter, casar ou ão, etc. A cada um dos valores de uma varável dscreta pode ser assocada uma probabldade probabldade de poto Cotíuas podem assumr todos os valores um determado tervalo resultado ftamete dvsível. E. Altura de pessoas, pesos de pessoas, cosumo de famílas, etc. Com varáves aleatóras cotíuas ão podemos assumr probabldades a um poto, somete a um tervalo.
Observações: A classfcação/defção da varável é mportate em ecoometra o método de estmação é defdo em fução do tpo de varável. Y = β + β + β + e ão estocástcos Mímos Quadrados Ordáros, Máma Verossmlhaça. e/ou estocástcos e correlacoados com o vetor de varáves aleatóras, Varáves Istrumetas, GMM. Y dscreto varável depedete dscreta modelos Logt/Probt Dados de Cross-secto amostra mas fácl de compreeder a aleatoredade. Dados de Séres Temporas realzação a prátca ão se pode esperar qualquer valor. E. Dados do PIB, Ivestmeto e séres macro em geral. Varáves aleatóras e suas dstrbuções Varáves aleatóras dscretas seguem dstrbuções dscretas o fto de valores que pode tomar. E: seja um casal que plaeja ter 3 flhos e a varável aleatóra dscreta defda como: = o de meos =,, 3 a cada um desses valores esta assocada uma probabldade. = valores que pode tomar 3
Espaço Amostral Stodos os resultados possíves Probabldades p ⅛ ⅜ 3 ⅜ 4 3 ⅛ Observar que os valores ão são gualmete prováves. O cojuto de probabldades de cada poto de é chamado de dstrbução de probabldade de ou fução de probabldade de : f = prob = Dstrbução fução de probabldade de f 3/8 /8 3 4
Aomas da Probabldade:. Prob =. f Etão:. A soma das alturas tem que ser gual a. A seqüêca,, 3, 4 clu todos os valores que pode tomar. Os valores de esse caso específco ão são gualmete prováves 3. Para qualquer poto que ão é um dos possíves valores que pode tomar f = E: laçameto de dado: =,, 3, 4, 5, 6 =,,3,4,5,6 6 f 6 6... 6 f /6 /6 3 3 /6 4 4 /6 5 5 /6 6 6 /6 Obs: Nesse caso os evetos são gualmete prováves. 5
Dstrbuções Dscretas Dstrbuções de Beroull, Bomal e Posso. Beroull usada em ecoometra para modelos de escolha dscreta. Só dos resultados são possíves ou teressam. E. comprar ou ão uma casa, um carro, máqua produzr ou ão parafuso defetuoso, cara ou coroa o laçameto de uma moeda, partcpar ou ão a força de trabalho ou a PEA, votar ou ão um determado caddato, etc. se o eveto A ocorre c se o eveto A ocorre P A p c P A p Eemplo: probabldade de votar um determado caddato é ¼ ou 5%. f p votar p ão votar p Fução de probabldade da dstrbução de Beroull: p p q q p ou,5.,75 q,5,5.,75,75 Se repetrmos o epermeto ou a amostragem vezes, teremos varáves de Beroull. Supodo-se as varáves depedetes umas das outras e os mesmos parâmetros p e q, a varável que represeta o o de sucessos obtdos em cada amostra segue uma dstrbução Bomal. Dfereça etre Beroull e Bomal: Beroull os dos resultados os teressam, ou acotece ou ão Bomal estou teressada o o de sucessos, ou seja, uma característca partcular 6
Fução de Probabldade da Bomal Epermeto jogar uma moeda 5 vezes e obter 3 caras sucesso obter 3 caras e obvamete coroas Qual a mha probabldade de sucesso? Resultados possíves: Ca Ca Ca Ca Ca Ca Ca Ca Ca Co Ca Ca Ca Co Co resultado que me teressa... Ca : p = ½ Co : q ou - p = ½ Ca Ca Ca Co Co p p p - p - p = p 3 -p Obs: otar que todos os resultados desse eveto, ou seja, do meu sucesso, teram a mesma probabldade. Ca Co Ca Ca Co p - p p p - p = p 3 -p quatas vezes essa combação va ocorrer? Quatos resultados desse tpo podem acotecer quado fazemos epermetos de jogar uma moeda 5 vezes? probabldade de caras em laçametos o de combações possíves em que 3 caras e coroas ocorrem: 5 5 C ou multplcado pela probabldade de ocorrêca do eveto. 3 3 º passo: quatas vezes a combação 3 caras e coroas vas ocorrer? 5 C 5! 5.4.3... 5 3!3!!3! 3 7
º passo: va ocorrer vezes aquela combação com as probabldades p 3 -p P3 caras =. p 3 -p =. Caso Geral: 3... 8 4 3 5 6 P p q Eemplo: Supor que uma máqua produz um parafuso defetuoso com probabldade p =, ou % Probabldade de parafuso ão defetuoso: q = - p =,9 Selecoamos aleatoramete 6 parafusos produzdos pela máqua. Cada parafuso va ser defetuoso ou ão evetos depedetes. A probabldade de se obter qualquer seqüêca de parafusos defetuosos ou ão é o produto das probabldades de cada parafuso. Questão qual a probabldade de se obter parafusos defetuosos? N D N 3 N 4 D 5 N 6 q p q q p q p. q 4 º passo quatas dessas combações serão produzdas? C 6 6! 6.5.4.3... 6!! 4!! º passo qual a probabldade de defetuosos? P C 6 4 p q. p. q 4 =.,.,9 4 =,78,8 8
Dstrbução de Posso Se aplca a acotecmetos raros: ocorrêca de gêmeos a população, destegração atômca pouquíssmos átomos por segudo em relação ao total do elemeto radatvo, o dáro de desastres uma estrada em relação ao o de carros que passam, lgações erradas um crcuto telefôco, etc. Semelhate a bomal porque só temos duas opções, mas o o de tetatvas N é maor. Pode surgr da bomal quado N tede ao fto. Fução de probabldade P = méda da dstrbução= N.p e Eemplo dos parafusos defetuosos. Um parafuso defetuoso pode também ser cosderado um eveto raro e quado N é muto grade podemos supor que segue uma dstrbução de Posso. p =, q =,9 Usado a dstrbução de Posso, qual a probabldade de se obter eatamete dos parafusos em 6 escolhdos arbtraramete = N.p = 6., =,6! P e,6.,6!,6,78.,6!,98 A apromação é melhor quado p, e =N.p 5 9
E. eemplo acma com N= e p=.5 = N.p =.,5 = 5 P e 5!.5,84 Varáves aleatóras cotíuas e suas dstrbuções Dstrbuções cotíuas a probabldade para um poto específco é zero. Só este probabldade para um tervalo. Fução desdade de probabldade fdp Em estatístca epermetal é comum que os resultados de um epermeto sejam perfetamete represetados por uma dstrbução específca de probabldade, mas em ecooma costuma-se ajustar ou modelar a dstrbução que mas se aproma do feômeo observado. A ormal é a dstrbução mas usada pelos ecoomstas para modelar/aalsar feômeos ecoômcos. Apesar dsso, outras dstrbuções podem ser usadas quado se aalsa feômeos mas específcos, mas raros, que a evolução da ecoometra já permte aalsar. Uma fdp precsa satsfazer a 3 requstos:. f é defda sempre dessa maera, etão pode ser maor do que, uma vez que é uma desdade de probabldade e ão uma probabldade. Prob a b = b a f d ou seja, tegra-se o tervalo 3. f d f é a fução que detfca, ou está assocada à varável. Se os dados têm uma dstrbução ormal, f será a ormal. Normalmete o tervalo ão é fto, etão sub-etede-se que fora do tervalo específco da varável, f = Obs: Uma vez que cada poto tem Prob = tato faz:
Prob a b = Prob a < b = Prob a < b = Prob a < < b Eemplo: se f = k - calcular a probabldade de termos <,. para <, determar o valor de k e Valor de k: k k d d 3 4 k c 3 4 k k Probabldade: Prob,, d 3 4 Prob, c 3 4,,7,7% Fução de probabldade cumulatva Probabldade de a Varável dscreta F f Prob Varável cotíua F f t dt Para se obter a fução ão cumulatva f : df f d
A fução cumulatva, F, precsa satsfazer as segutes propredades caso dscreto e cotíuo:. F. se > y, F Fy 3. F ; F 4. Prob a < b = Fb Fa A dstrbução ormal Tem orgem a bomal. Quado o úmero de observações,, a bomal aumeta, para um p fo, a bomal tede à ormal. A curva ormal ou gaussaa é completamete determada por dos parâmetros, a méda,, e a varâca,. Nem toda dstrbução em forma de so é ormal. A ormal é somete aquela em que a área sob a curva é dstrbuída de maera específca. A assmetra, ou tercero mometo em relação à méda, da ormal é gual a zero e a curtose, quarto mometo, é gual a três. Etretato, a ormal é uma boa apromação para qualquer dstrbução quado é um resultado do Teorema do Lmte Cetral.
De Movre mostrou que quado o tamaho da amostra aumetava ftamete, a bomal teda à ormal as freqüêcas fusoavam umas as outras. E: o de peças defetuosas a produção de uma máqua: N= peças, p =,5 5% q =,95 95% P P p q 99 p q P 3 3,95% P 4 7,8% 98!,5,95 99!!! 98!!,5 99,95 *,5*,634,3 3,% 98,8 8,% P 5 8% com maor freqüêca teríamos 5 peças defetuosase=.p=*,5=5 P 6 5% 5 5 3 4 5 3
Se eu tvesse 5 ou peças E=.p=5*,5=5 a varável se torara mas cotíua. Outra maera de mostrar: Se subtrarmos a méda ver méda e var das dstrbuções de uma varável bomal de cada valor que ela pode tomar ou seja, ou, temos uma ova varável: W = - p EW = E[ - p] = E Ep = p p = EW = depedetemete do valor de ou p! VarW = Var[ - p] = Var Varp = Var = p p VarW = p p var da bomal observar que a méda é zero mas a var é a mesma Se dvdrmos W pelo desvo padrão da bomal e de W, teremos uma ova varável: z W p p Fazedo c p p Ez EcW cew p p p Varz Var cw c VarW p p p p z varável bomal padrozada Teorema de De-Movre-Laplace: Para quasquer úmeros z < z e um valor p fo etre e, < p <, se aumetarmos defdamete, a probabldade que a varável bomal satsfaça a desgualdade Pr p z ob z z tede ao lmte z p p e z dz ormal cumulatva Obs: se uma varável tem dstrbução bomal com méda p e varâca p-p a probabldade que esteja etre dos valores z > z é o lmte acma, 4
ou seja, a probabldade é o tervalo etre z e z. Ou seja, agora ão há mas probabldade de poto varável dscreta e sm de tervalo varável cotíua. A equação acma é a da dstrbução ormal e o teorema de De-Movre-Laplace smplesmete afrma que: lm Prob z p z p p z ode F z e Obs: z dz F z F z é a fução cumulatva Esse teorema se aplca a grades, mas se p ão é muto próma de ou, = 4 já forece uma boa apromação. Se p =,5 a ormal já é uma boa apromação com =! Desdade de Probabldade da Normal 5
6 A ormal uvarada: e f,, Ode: = varâca de = méda de Normalmete trabalhamos com a fução a forma logarítmca: l,, l f A dervada prmera do l da fução produz: f l A dervada seguda é egatva, etão = é um poto de mámo. Se gualarmos a dervada seguda a zero, temos dos potos de fleão:
7 Uma vez que a ormal é completamete determada pela méda e varâca, este uma fdade de curvas ormas. A ormal padrozada, com méda zero e varâca utára, é represetada por: e Z z f Ode z Prova: ] [ E E E E z E Var Var Var Var Var z Var Seja {, =,...} amostras depedetes retradas da dstrbução acma. As amostras são..d depedetes e detcamete dstrbuídas. A fução desdade para essas amostras é represetada por: e f /,, Fução a forma logarítmca: f l,, l
8 f l Estmador de Máma Verossmlhaça para a méda! A Normal Cumulatva d F e [ Se uma varável cotíua tem dstrbução ormal com méda e varâca dz-se que: N,. A probabldade que esteja etre dos valores > é dada por:
prob = F - F estem tabelas para sso. Obs: A fução cumulatva é defda da mesma maera, ão mporta se a varável é dscreta, cotua ou msta dscreta e cotíua. Dstrbuções mstas são comus em modelos ecoométrcos e chamam-se dstrbuções trucadas. E. reda pode ser amostrada abao de 3. reas por ao, por eemplo. Valores acma de 3. reas cotam como 3.. 3. cotua problema da amostra vés de seleção 3. dscreta Obs: estem tabelas um pouco dferetes para a ormal. Ateção para o tpo de tabela que se tem em mãos! º tpo: 9
Eemplo: Em um eame fal de matemátca, a méda fo 7 e o desvo padrão, 7,6. = otas em matemátca = 4, 57, 6,7,8, 85, 87,93 E = = 7 Desvo padrão = = 7,6 Calcular a probabldade de um estudate trar uma ota etre: a 7 e 8; b 57 e 7; º passo padrozar: a etre 7 e 8 7 7 7,6 8 7,45 7,6 passo achar a probabldade a tabela Prob =,736 b etre 57 e 7 57 7,85 a 7,6 68 7,3 b 7,6 prob [ < z <,85 < z <,3] =,33-,9 =.3 tpo:
a 7 e 8; 7 7 7,6 8 7,45 7,6 Prob[Z > Z >,45 =,5-,364 =,736 b etre 57 e 7 57 7,85 a 7,6 68 7,3 b 7,6 prob [z <,3 z <,85] =,49-,977 =.3 3º tpo: tabela da Normal Cumulatva
a Prob[- < Z <,45 - < Z < =,6736 -,5 =,736 b Prob[- < Z <,85 - < Z <,3 =,83 -,59 =,3 Cálculo de probabldades em fuções descotíuas
F Z 3 Z Z Z 3 4 Eemplos: Prob < = z z = Prob > = - z 3 Prob < 3 = Prob 3 Prob = z 3 z Obs: quado este uma descotudade a fução cumulatva: Prob Prob < No eemplo acma: Prob = = Prob Prob < = z z Prob = 3 = Prob 3 Prob < 3 = z 3 z Prob = = Prob Prob < = z z = Prob = 4 = = Teoremas relacoados a ormal Se as varáves aleatóras,... são depedetes e se tem uma dstrbução ormal com méda e varâca =...k, etão a soma +...+ tem uma dstrbução ormal com méda +...+ e varâca +...+. Ou seja, a soma de varáves ormalmete dstrbuídas tem dstrbução ormal; a méda da soma é a soma das médas e a varâca é a soma das varâcas. Isso acotece também com as varáves padrozadas com méda zero e varâca. Nesse caso a méda da soma é zero e a varâca é a soma das varâcas. 3
Se a varável aleatóra N,, etão, a + b N[a+b,b ]. Ou seja, trasformações leares de varáves ormalmete dstrbuídas são também ormalmete dstrbuídas. 3 Se as varáves aleatóras,... formam uma amostra aleatóra de uma dstrbução ormal com méda e varâca, etão a méda da amostra, deomada tem uma dstrbução ormal com méda e varâca N,....... Cada observação é uma varável aleatóra temos varáves. todos os valores que pode tomar quado se retra a ª observação Etão pode ser vsto como uma combação de varáves ormalmete dstrbuídas, uma vez que é ormal. E[ E[ ] E ] E esperaça da soma de varáves depedetes é gual a soma das esperaças. E[ ] E [ E E... E ] mas,... tem a mesma méda e varâca. Etão: E [ ] [... ] Var [ ] Var Var varâca da soma de varáves aleatóras depedetes é gual a soma das varâcas. Var[ ] [ Var Var..... Var ] [... ] 4
Coclusão: se N,, etão N, /. E quado ão se sabe a dstrbução de orgem? Supor que tem uma outra dstrbução qualquer com méda e varâca e,... são varáves aleatóras etraídas dessa dstrbução. Etão: E[ ] E [ E E... E ] [... ] Var[ ] [ Var Var..... Var ] [... ] Daí o teorema: Se é uma varável com méda e varâca, etão qualquer que seja a dstrbução de, a dstrbução da méda amostral,, tem a mesma méda de,, e varâca gual a /. Outra característca mportate de que é depedete da dstrbução de orgem: Teorema do Lmte Cetral Se tem qualquer dstrbução com méda e varâca, etão a dstrbução da méda amostral, se aproma da ormal com méda, e varâca / quado o tamaho da amostra,, aumeta. Obs: população ão ormal mas smétrca ormal é uma boa apromação pequeas amostras e dstrbuções assmétrcas ão é acoselhável apromar com uma ormal. Esperaça Matemátca E = valor esperado de, esperaça de 5