48 4 Teoria da Probabilidade Apresetam-se este capítulo coceitos de probabilidade e de estimação de fuções desidade de probabilidade ecessários ao desevolvimeto e compreesão do modelo proposto (capítulo 5). A probabilidade é uma medida de icerteza associada ao resultado futuro de um sorteio aleatório. É importate perceber que, uma vez ocorrido o sorteio, do poto de vista probabilístico ão há mais dúvida sobre o resultado e, portato, o valor da probabilidade tem um valor preciso [25]. Por exemplo, quado uma moeda é laçada, devido ao cohecimeto parcial sobre sua estrutura física e suas codições iiciais, ão é possível prever com exatidão se o resultado será cara ou coroa. Porém, uma vez pousada, ão há mais dúvida quato ao resultado: ou é cara ou é coroa. 4.. Defiição Seja o uiverso Ω de todos os possíveis evetos elemetares; por defiição, a probabilidade P de um eveto E, deotada por P(E), deve seguir os 3 axiomas de Kolmogorov [26]: i) Para qualquer eveto E, tem-se P ( E) 0. Isto é, a probabilidade de um eveto é um úmero real ão egativo. ii) P ( Ω) : a probabilidade de todos os evetos possíveis é um; ou mais iii) especificamete, ão há eveto elemetar fora do uiverso Ω. Todo cojuto de evetos icompatíveis eumeráveis E, E2,..., satisfaz a P E E K ) P( E ). Ou seja, a probabilidade de um cojuto de ( 2 i evetos formado a partir da uião de evetos disjutos é a soma das probabilidades destes evetos. Este axioma também é cohecido como a propriedade da aditividade.
49 A partir destes axiomas, são euciadas as seguites propriedades: Para qualquer eveto E, tem-se 0 P ( E). Ou seja, a probabilidade é um úmero etre 0 e. Para qualquer eveto E, defie-se o eveto cotrário, E, por P( E ) P( E). P ( ) 0. Para quaisquer dois evetos A e B, tem-se P( A B) P( A) + P( B) P( A B). 4.2. Distribuição de probabilidade Uma fução distribuição de probabilidade é uma fução que associa probabilidades a evetos e pode ser classificada em discreta ou cotíua. No primeiro caso, a fução é defiida para um cojuto discreto e cotável, tal como um subcojuto dos úmeros iteiros; o segudo caso, a distribuição possui uma fução defiida para um cojuto cotíuo, como, por exemplo, um subcojuto dos úmeros reais. Uma forma de defiir uma fução distribuição de probabilidade, F(, é por meio de uma fução desidade de probabilidade (pdf), f(, coforme o exemplo da equação (4.) para o caso cotíuo: x [ X x] F ( Pr f ( X ) dx (4.) A partir da fução desidade de probabilidade, também é possível expressar a probabilidade de obter um valor o itervalo [c, d]: d c P [ c, d] f ( dx (4.2) 4.2.. A Distribuição Normal Etre as diversas distribuições de probabilidade cotíuas, a distribuição Normal se destaca por modelar vários feômeos aturais, etre os quais a icerteza de medição [3]. A distribuição Normal é defiida para < x < + por sua pdf:
50 2 ( x µ ) f ( exp 2 (4.3) σ 2π 2σ ode µ represeta a média e σ 2 a variâcia. 4.2.2. Itervalo de Cofiaça No caso da icerteza de medição, é comum que ela seja dada, simplesmete, como um itervalo em toro do resultado de uma medição, com o qual se espera abrager uma grade fração da distribuição de valores, que poderiam razoavelmete ser atribuídos ao mesurado [3]. Sedo assim, a icerteza de medição ão é, ecessariamete, dada como um múltiplo de um desvio padrão. Para uma gradeza z descrita por uma distribuição ormal, com média µ z e desvio padrão σ, o fator de abragêcia p forece o itervalo µ z p ± σ que correspode ao itervalo de cofiaça com um ível de cofiaça p. Valores típicos para íveis de cofiaça são 90, 95 e 99 por ceto, com fatores de abragêcia,64;,96 e 2,58; respectivamete [3]. É comum que o ível de cofiaça seja expresso pelo valor ( - α) (ode este valor é um úmero fixo, positivo e meor do que ), correspodete à probabilidade associada com um itervalo de cofiaça. 4.3. Métodos de Estimação de Probabilidade Quado a fução desidade de uma quatidade aleatória x ão é cohecida, uma estimativa desta desidade pode ser obtida utilizado-se amostras proveietes de observações x, K, x } de x. Os métodos de estimação podem ser classificados como { paramétricos ou ão-paramétricos: o primeiro caso, um vetor de parâmetros de uma fução é estimado, equato que, o segudo caso, a fução p( é estimada sem que ehum modelo específico seja adotado. A Figura 4 apreseta a taxoomia dos métodos de estimação de fuções de desidade de probabilidade. A estimação da desidade de probabilidade através de métodos paramétricos supõe que as formas das fuções de desidade de probabilidade estudadas são cohecidas.
5 Cotudo, as fórmulas paramétricas usuais em sempre se ajustam as desidades ecotradas a prática. Além disso, a maioria das desidades paramétricas clássicas é uimodal (têm um úico máximo), equato que muitos dos problemas práticos evolvem desidades multimodais. Por outro lado, métodos ão-paramétricos podem ser utilizados com distribuições arbitrárias e sem a suposição que as formas das desidades estudadas sejam cohecidas. observações {x,..., x } de x Estimação ão-paramétrica Estimação paramétrica Não supõe ehum modelo específico Supõe um modelo para a pdf e estima seus parâmetros Utiliza os dados como estão Discretização dos dados em itervalos p ˆ( V p ˆ( x ) V Jaela com largura e posição fixas Histograma Jaela fixa variável Jaela de Parze Jaela variável fixo -vizihos mais próximos Figura 4 - Classificação dos métodos de estimação de desidade de probabilidade 4.4. Métodos de Estimação Não-Paramétricos 4.4.. Defiição As técicas ão-paramétricas fudametais se baseiam o fato de que a probabilidade P de que um vetor x perteça à região R é dada pela equação:
52 P p( dx (4.4) R Coseqüetemete P é uma versão suavizada da fução de desidade p( e assim é possível estimar este valor suavizado de p através da estimação da probabilidade P. Sejam amostras D x, K, x } idepedetes e ideticamete distribuídas de { acordo com a distribuição p(. A probabilidade de que das amostras caiam a região R é dada pela lei biomial: P P ) ( P (4.5) cujo valor esperado de é E [ ] P e a melhor estimativa para P é P ˆ. Cosiderado que p( é cotíua e que a região R é suficietemete pequea de modo que p( ão varia muito detro dela, pode-se escrever: p( dx p( V (4.6) R ode x é um poto detro de R e V é o volume da região R. Combiado as equações (4.4), (4.5) e (4.6), a estimativa para p( é: p(x ) (4.7) V 4.4.2. Histograma O histograma é o estimador de desidade mais atigo e mais utilizado para represetar e observar dados uidimesioais. A costrução de um histograma cosiste em dividir um itervalo de referêcia Ω x mi, x ] em K células (ou compartimetos) C e [ max cotar o úmero a de observações pertecetes a cada célula C. O úmero a é o acumulador associado à célula C. Seja χ C a fução característica de C :
53 a i χ ( x ) C i Quado todas as células do histograma têm a mesma largura, é dito que o histograma é uiforme ou regular. A largura de cada célula,, mais comum é: x max K x mi Uma probabilidade empírica P(C ) pode ser associada a cada célula C : P( C ) a Tomado-se como hipótese que a probabilidade é uiforme em cada célula, uma estimativa p ˆ( da fução de desidade de probabilidade estudada, p(, para qualquer valor real do itervalo Ω, pode ser avaliada por: pˆ ( a χ a χ ( (4.8) K K C ( C que correspode à equação (4.7), ode represeta o volume V e o úmero de amostras em cada célula é K a χ (. C Cotudo, esta estimativa possui algumas fraquezas que fazem com que ela seja raramete utilizada como uma ferrameta estatística. Primeiramete, a aproximação p ˆ(, defiida a equação (4.8), é uma fução ão-cotíua cuja estimação é limitada pela dualidade precisão/cofiaça. Esta dualidade reside o fato de que, quato meor for a distâcia desejada etre p ˆ( e p(, meor deve ser a largura ; porém, como é um úmero fiito, também meor será o valor do acumulador de cada célula e coseqüetemete meor será a covergêcia local de p ˆ( em p(. Por outro lado, quato maior for a largura da célula, meor é a habilidade da desidade estimada de respoder apropriadamete a variações de p(.
54 Além da dificuldade a escolha apropriada da largura da célula, a escolha do itervalo de referêcia Ω também pode iflueciar o resultado ecotrado. A Figura 5 ilustra o efeito da traslação do itervalo de referêcia a forma dos histogramas costruídos a partir de 00 amostras obtidas de uma desidade ormal N(0, ). 25 25 20 20 5 5 0 0 5 5 0-3 -2-0 2 3 0-3 -2-0 2 3 Figura 5 - Depedêcia da forma do histograma em fução da escolha da origem das células. Outro proto fraco dos histogramas é a ecessidade de um alto úmero de amostras. Esta deficiêcia fica aida mais em evidêcia em problemas com espaços em alta dimesão, já que o úmero de células aumeta e coseqüetemete muitas observações são ecessárias para evitar que a estimativa seja ula em uma grade região. 4.4.3. Métodos de Kerel Os métodos de erel tetam solucioar o problema da escolha da posição iicial das células e ao mesmo tempo obter uma fução cotíua. Para isso, diferetemete dos histogramas que utilizam células com volumes fixos (com largura ) e posições prédetermiadas, o volume V das células varia em fução do úmero de amostras e cada célula é cetrada em cada amostra. Re-escrevedo a estimativa dada pelas eqs. (4.6) e (4.7), ota-se que ela também correspode a uma média espacial de p(:
55 P V R p( dx dx R (4.9) Para obter uma estimativa para p(, e ão de valores médios, V deve se aproximar de zero. No etato, se o úmero de amostras é fixo e V tede a zero, o volume da região pode evetualmete ficar pequeo demais e assim pode ão coter ehuma amostra, levado a estimativa p ( 0 a ser iútil. Do poto de vista prático, o úmero de amostras é sempre fiito e será ecessário cosiderar algum ível de suavização a estimativa de p( e aceitar alguma variâcia a razão. Do poto de vista teórico, pode-se cosiderar um úmero ifiito de amostras. Para estimar a desidade p( em x, costrói-se a seqüêcia de regiões R, R 2,..., cotedo x, ode a primeira região cotém uma amostra, a seguda duas, e assim adiate. Seja V o volume da região R que cotém amostras, e seja p ( a -ésima estimativa para p( dada por: p ( (4.0) V Pode-se provar que p ( coverge para p(, ou seja lim ( p(, se as três codições abaixo forem satisfeitas [27]: i) lim V 0 p ii) iii) lim lim 0 A primeira codição assegura que a média espacial P V coverge para p(. A seguda garate que a razão de freqüêcia (em probabilidade) coverge para a probabilidade P. A terceira codição afirma que o úmero de amostras caido a região
56 R é sempre uma pequea parcela desprezível do úmero total de amostras. Ela é ecessária para que p ( defiida pela eq. (4.0) covirja. Um dos camihos para se obter seqüêcias de regiões que satisfazem estas codições é, a partir de um volume iicial, ecolhê-lo à medida que aumeta; por exemplo: V. É em seguida ecessário mostrar que e têm comportameto apropriado para que p ( p(. Este é basicamete o método cohecido como Jaela de Parze [27], que será examiado a seguir. 4.4.4. Jaela de Parze Supodo que a região R é um hipercubo d-dimesioal com lado igual a h, o seu volume é dado por d V h. Seja a fução que assume para os potos detro do hipercubo uitário cetrado a origem e 0 para os potos exteros; esta fução é chamada de fução de jaela e é defiida por: u j 2 j, K, d ϕ ( u) (4.) 0 caso cotrário Coseqüetemete, ϕ (( x x i ) / h ) será igual a se x i estiver detro do hipercubo de volume V cetrado em x, e zero caso cotrário. Portato, o úmero de amostras detro deste hipercubo é dado por: i x xi ϕ (4.2) h Substituido a eq. (4.0), obtém-se: x xi p ( ϕ (4.3) V i V h A estimativa p ( defiida acima é uma média de fuções (de jaela). Tipicamete a fução de jaela tem seu máximo a origem e seus valores caem à medida
57 que se distaciam da origem. Desta forma, cada amostra está cotribuido com a estimativa coforme sua distâcia de x. Para que a estimativa p ( seja uma fução de desidade legítima, isto é, que seja ão-egativa e itegre em, as três codições abaixo devem ser atedidas: i) ϕ ( u) 0 (4.4) ii) ϕ ( u) du (4.5) iii) d V h (4.6) Uma escolha comum para a fução de jaela é a Normal de média x i e variâcia h : T ϕ ( u) exp[ 0,5u u] d 2 (2π ) que produz a estimativa: p ( 2 x xi exp 2 d 2 2 (2π h ) 2h i (4.7) É importate observar que, se h for muito grade, potos muito afastados da amostra x i serão afetados de maeira importate pela jaela. Assim a estimativa será composta pela superposição de fuções letas, ficado suave demais e com uma visão fora de foco da desidade de probabilidade. Por outro lado, se h for muito pequeo, apeas os potos muitos próximos a x i serão afetados de maeira importate pela jaela. Neste caso a estimativa será uma superposição de picos agudos cetrados as amostras e p ( será muito ruidosa. Na prática, deve ser procurada uma cocessão aceitável, já que o úmero de amostras é sempre limitado. É comum escolher um valor para h e defiir h h. Ifelizmete, a escolha do valor de h pode ser problemática. A Figura 6 ilustra 3 estimativas, com jaelas de Parze com diferetes larguras, a partir de 00 amostras geradas através de uma mistura de duas distribuições do tipo
58 Normal. Percebe-se claramete a ifluêcia da largura da jaela a estimação: para h, a jaela é estreita demais e a estimativa é muito ruidosa, apresetado vários picos; para h 6, a jaela é larga demais e praticamete ão são otados os dois picos da distribuição origial; e h 4 parece ser um valor adequado, sem grades ruídos em suavizado em excesso, sedo a qualidade de sua estimação comprometida pelo baixo úmero de amostras. 0.35 0.3 h h 4 h 6 dist. origial 0.25 p( 0.2 0.5 0. 0.05 0-6 -4-2 0 2 4 6 8 0 2 x Figura 6 Ifluêcia da largura da jaela a estimativa por Jaela de Parze