7 DISTRIBUIÇÃO HIPERGEOMÉTRICA Cosdere-se uma população fta costtuída por N elemetos dstrbuídos por duas categoras eclusvas e eaustvas de dmesões M e N M, respectvamete. Os elemetos da prmera categora podem ser caracterzados, por eemplo, pela estêca de um determado atrbuto ou qualdade que os da outra categora ão possuem (por eemplo, peças defetuosas e ãodefetuosas). Abrevadamete dz-se que a população é costtuída por dvíduos de tpo A e de tpo A. Nestas codções a proporção de elemetos de cada uma das M N M categoras é respectvamete, p e q. N N Admta-se agora que desta população se retra uma amostra de elemetos sem reposção (trar sucessvamete os elemetos é equvalete a trar em bloco). Se, quado se seleccoa um elemeto, ele for do tpo A dz-se que houve sucesso. Seja uma v.a. X, defda como o úmero de elemetos do tpo A cluídos a amostra de elemetos. Obvamete X só poderá tomar valores teros ão-egatvos até ao lmte defdo pelo meor dos segutes valores: e M. NOTA: Poderíamos assocar a v.a. X à cotagem do º de elemetos do tpo A cluídos a amostra. Nesse caso
o lmte superor para o valor de X sera defdo pelo meor dos valores: ou N M. A dfereça fudametal etre esta dstrbução e a bomal, é que agora as eperêcas ão são de Beroull. Efectvamete, como os elemetos da amostra são retrados sem reposção de uma população fta, a probabldade de ocorrêca de cada um dos resultados possíves ão se matêm costate de eperêca para eperêca e os resultados sucessvos deam de ser depedetes. 72 Em resumo, dz-se que a v.a. dscreta X defda como: X úmero de sucessos ocorrdos em etracções sem reposção tem dstrbução hpergeométrca e escreve-se: X ~ h (N,,p) se a sua fução de probabldade for dada por: p X ( ) N p N 0 N q 0,, 2,...,m outros valores (, N p)
É claro que N p M, represeta o úmero de elemetos do tpo A (que cosderámos sucesso) a população. O º de elemetos da população e da amostra são represetados respectvamete por N e. O valor esperado e a varâca para esta dstrbução são respectvamete: E ( X) p 73 Var ( X) p q N N Estas epressões podem ser obtdas pela defção. RELAÇÃO ENTRE A DISTRIBUIÇÃO BINOMIAL E A HIPERGEOMÉTRICA Sejam X e Y duas v.al. com dstrbuções respectvamete, b~(,p) e h~(n,,p). Etão: E ( X ) E( Y ) p Var ( Y ) Var( X ) N N Quado N >>, o facto de ão haver reposção dos elemetos retrados da população ão afecta substacalmete quer as probabldades assocadas aos resultados das eperêcas quer a depedêca de tas resultados. Podemos pos afrmar que, se:
74 N N >> N e Var( Y ) Var( X ) TEOREMA: A dstrbução hpergeométrca (N,,p) tede para a dstrbução bomal (,p) quado N. A apromação da dstrbução hpergeométrca pela bomal é útl, uma vez que o cálculo da fução de probabldade é mas smples o segudo caso, estdo também tabelas já costruídas, de fácl cosulta e que rapdamete forecem o valor das probabldades procuradas. Como regra prátca cosdera-se que X~h(N,,p) pode ser apromada por X~b(,p) quado N 0. Nestas codções, a apromação é acetável apeas globalmete, verfcadose dfereças cosderáves para os valores das probabldades correspodetes às caudas das duas dstrbuções. DISTRIBUIÇÃO DE POISSON A dstrbução de Posso permte descrever um vasto cojuto de feómeos aleatóros em que os acotecmetos se repetem o tempo ou o espaço. Algus eemplos de stuações que se adequam a uma dstrbução de posso são: Número de chamadas telefócas que chegam, em certo período de tempo, a uma cetral telefóca.
75 Número de avaras que ocorrem uma determada máqua, um certo tervalo de tempo. Número de partículas defetuosas um certo volume de líqudo. Número de defetos um dado comprmeto de fo produzdo por uma determada máqua. Em todos os eemplos apresetados verfca-se que há uma característca comum: podem ser descrtos por uma v.a. dscreta que assuma valores teros ão egatvos. Porém esta característca ão é a úca egível. Cosdere-se etão um feómeo aleatóro cujas ocorrêcas se repetem ao logo do tempo. Image-se que o tempo se ecotra dvddo uma partção de tervalos de pequea ampltude t. Ocorrêcas t t + t tempo A varável dscreta úmero de ocorrêcas por udade de tempo segurá uma dstrbução de Posso quado se verfcarem as quatro codções segutes: ) O úmero de ocorrêcas regstadas os tervalos da partção, são depedetes etre s.
76 ) A dstrbução do úmero de ocorrêcas em cada tervalo é a mesma para todos os tervalos (a probabldade de um certo úmero de ocorrêcas se verfcar é a mesma para todos os tervalos). ) A probabldade de se regstar uma ocorrêca um tervalo qualquer de dmesão t, é pratcamete proporcoal à dmesão do tervalo, sto é: P λ. t ( λ: costate postva) No lmte, quado t 0, admte-se que: lm t 0 P t d P d t λ v) A probabldade de se verfcarem duas ou mas ocorrêcas um tervalo qualquer de dmesão t, é desprezável quado comparada com a probabldade de se verfcar apeas uma ocorrêca ( P desprezável face a P, para 2). No lmte, admte-se que: lm t 0 P t d P d t 0 ( 2 )
A partr destas codções e defdo a v.a. X como o úmero de ocorrêcas o tervalo [0, t], pode determarse a probabldade de X, a partr de: 77 p X ( t ) e λ t ( λ t )! Esta epressão defe a fução de probabldade de uma v.a. X ( X 0,,2,... ) com dstrbução de Posso de parâmetro λ.t. O parâmetro λ.t represeta o valor esperado, ( t ) µ X, do úmero de ocorrêcas um tervalo qualquer de dmesão t. Etão: µ ( t ) λ X t correspode ao úmero médo de ocorrêcas por udade de tempo, ou seja, correspode à taa méda de ocorrêcas. Atededo ao sgfcado de λ, a fução de probabldade da v.a. X pode escrever-se sob outra forma, epressado-a para um tervalo de tempo ou de espaço de dmesão utára (este caso t ). Em resumo, dz-se que a v.a. dscreta X defda como: X úmero de ocorrêcas um dado tervalo de dmesão t tem dstrbução de Posso e escreve-se: X ~ p (λ) se a sua fução de probabldade for dada por:
78 p X ( ) e λ λ! 0 0,, 2,... outros valores O parâmetro que caracterza esta dstrbução é λ ( λ > 0 ) e correspode ao úmero médo de ocorrêcas o respectvo tervalo de tempo. O valor esperado e a varâca para esta dstrbução são respectvamete: E ( X) λ Var ( X) λ Estas epressões podem ser obtdas pela defção ou G X t : recorredo à fução geradora de mometos, ( ) G X t ( t ) E( e ) 0 e t e λ λ! e λ e λ e t e λ e t
79 RELAÇÃO ENTRE A DISTRIBUIÇÃO DE POISSON E A DISTRIBUIÇÃO BINOMIAL TEOREMA: Seja X~b(,p). Admta-se que, mas que o úmero médo de sucessos se mateha costate p λ sto é, quado, p 0, de modo que p λ. Nestas codções teremos: lm P ( X ) p ( p ) lm e λ λ! demostração: P ( X ) p ( p ) ( ) ( 2 )... ( + )! p ( p ) fazedo p λ vem que ateror resulta: p λ. Substtudo a epressão P ( X ) ( )... ( + )! λ λ λ!... quado λ λ quado e λ quado
80 e portato: lm P ( X ) e λ λ! sto é, o lmte obtém-se a dstrbução a dstrbução de Posso de parâmetro λ p : lm ( pλ) b (,p) p( λ ) O teorema ateror mostra que, se X~b(,p), pode obter-se uma apromação das respectvas probabldades através da dstrbução de Posso, desde que seja grade e p pequeo. A apromação será tato melhor quato maor for e meor for p. Como regra prátca, a apromação cosdera-se já satsfatóra desde que 20 e p 0,05. Como a dstrbução bomal só aparece tabelada para valores de 20, utlzar-se-á a apromação à dstrbução de Posso quado > 20 desde que p 0,05. Nota: Como será referdo mas adate, se a dstrbução bomal for smétrca ou quase ( p 7), é mas prátco apromar a v.a. bomal (dscreta) por uma v.a. ormal (cotíua). A tabela segute compara os valores das probabldades quatro v.a. bomas em que. p, com os valores obtdos para uma v.a. de Posso com parâmetro λ.
8 DISTRIBUIIÇÕES BINOMIAIS 0 20 30 00 p /0 p /20 p /300p /00 POISSON λ 0 0,3487 0,3585 0,3642 0,3660 0,3679 0,3874 0,3774 0,376 0,3697 0,3679 2 0,937 0,887 0,858 0,849 0,839 3 0,0574 0,0596 0,0607 0,060 0,063 4 0,02 0,033 0,045 0,049 0,053 5 0,005 0,0022 0,0027 0,0029 0,003 6 0,000 0,0003 0,0004 0,0005 0,0005 7 0,0000 0,0000 0,000 0,000 0,000 8 0,0000 0,0000 0,0000 0,0000 0,0000.................................... DISTRIBUIÇÃO MULTINOMIAL A dstrbução multomal represeta uma geeralzação da dstrbução bomal, quado uma sucessão de provas depedetes há, em cada prova mas de dos resultados possíves. As hpóteses subjacetes à dstrbução multomal são aálogas às cosderadas o caso da dstrbução bomal. Cosderem-se etão provas (eperêcas aleatóras) em que: Em cada eperêca aleatóra, estem k resultados possíves A (,2,...,k ), mutuamete eclusvos.
82 As probabldades assocadas a cada um dos A que represetaremos por p (,2,...,k ), matêm-se costates de prova para prova, verfcado-se: k p As eperêcas aleatóras são depedetes. Admtdo como váldas as hpóteses apresetadas, defamse k v.a. do segute modo: etão: X - úmero de vezes, em, em que ocorre A (,2,...,k) ( X,X,...,X ) p p 2... k P 2 2 k k 2 pk!2!... k!! com: 0 + 2 +... + k p + p +... + p 2 k NOTA: Apeas (k - ) varáves são depedetes pos a k- ésma é defda à custa das restates, sto é: k e p k k k p
Em resumo, dz-se que a v.a. dscreta multdmesoal X,X,...,, em que: ( ) 2 Xk X - úmero de vezes, em, em que ocorre A (,2,...,k) tem dstrbução multomal e escreve-se: (,X,..., ) X ~ M(, p, p 2,..., p k ) 2 Xk se a sua fução de probabldade cojuta for dada por: ( X,X,...,X ) p p 2... k P 2 2 k k 2 pk!2!... k!! 83 ( 0) Os parâmetros que caracterzam esta dstrbução são e p (,2,...,k ) e correspodem respectvamete ao úmero de vezes que a eperêca aleatóra é repetda e à probabldade de ocorrêca de um dado A (,2,...,k ). O parâmetro é um tero postvo e 0 < p <., O valor esperado, a varâca e a covarâca para as dferetes varáves evolvdas são respectvamete: E ( X ) p Var Cov (,2,...,k ) ( X ) p ( p ) (,2,...,k ) ( X,X j ) p p j ( j )
84 DISTRIBUIÇÃO HIPERGEOMÉTRICA GENERALIZADA Esta dstrbução correspode, tal como o ome dca, a uma geeralzação da dstrbução hpergeométrca. Cosdere-se etão uma população fta costtuída por N elemetos dstrbuídos por k categoras eclusvas e eaustvas de dmesão N (,2,...,k). Nestas codções a proporção de elemetos de cada uma das categoras é dada por: N p N verfcado-se que: k N N e portato, p k Admta-se agora que desta população se retra uma amostra de elemetos sem reposção e defam-se k v.a. do segute modo: X - úmero de elemetos a amostra pertecetes à categora (,2,...,k) etão: P ( X,X,...,X ) com: 2 2 0 + 2 +... + k p + p +... + p k 2 k k N N2... 2 N N k k
Os parâmetros que caracterzam esta dstrbução são N, e p (,2,...,k) e correspodem respectvamete à dmesão da população, à dmesão da amostra e à proporção de elemetos de cada uma das categoras (,2,...,k) a população ( N p N ). Os parâmetros N e são teros postvos e 0 < p <,. Para cada uma das v.a. X, o seu valor mímo é 0 e o valor mámo será o m (, N ). 85 O valor esperado, a varâca e a covarâca para as dferetes varáves evolvdas são respectvamete: E ( X ) p Var Cov (,2,...,k ) N (,2,...,k ) N ( X ) p ( p ) ( X,X ) j N p p j ( j ) N Para N elevado ( N ) e se a dmesão da amostra for pequea face à dmesão da população ( << N ), podemos apromar a dstrbução hpergeométrca geeralzada por uma dstrbução multomal. Este procedmero é aálogo ao que fo sugerdo o caso udmesoal, para apromar a dstrbução hpergeométrca pela dstrbução bomal.