4 Teoria da Probabilidade

Documentos relacionados
6.1 Estimativa de uma média populacional: grandes amostras. Definição: Um estimador é uma característica amostral (como a média amostral

Aula 5. Aula de hoje. Aula passada. Limitante da união Método do primeiro momento Lei dos grandes números (fraca e forte) Erro e confiança

binomial seria quase simétrica. Nestas condições será também melhor a aproximação pela distribuição normal.

Lista de Exercícios #4 Assunto: Variáveis Aleatórias Contínuas

n ) uma amostra aleatória da variável aleatória X.

Cap. 4 - Estimação por Intervalo

Avaliação de Desempenho de Sistemas Discretos

Lista de Exercícios #6 Assunto: Propriedade dos Estimadores e Métodos de Estimação

Cap. VI Histogramas e Curvas de Distribuição

DESIGUALDADES, LEIS LIMITE E TEOREMA DO LIMITE CENTRAL. todas as repetições). Então, para todo o número positivo ξ, teremos:

Distribuições de Estatísticas Amostrais e Teorema Central do Limite

Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2004

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

5 Teoria dos Valores Extremos

Amostras Aleatórias e Distribuições Amostrais. Probabilidade e Estatística: afinal, qual é a diferença?

CONHECIMENTOS ESPECÍFICOS

Mestrado Integrado em Engenharia Civil. Disciplina: TRANSPORTES. Sessão Prática 4: Amostragem

Sequências Reais e Seus Limites

A Inferência Estatística é um conjunto de técnicas que objetiva estudar a população através de evidências fornecidas por uma amostra.

Sumário. 2 Índice Remissivo 11

MAE Introdução à Probabilidade e Estatística II Resolução Lista 1

Estacionariedade e correlação temporal em dados financeiros

Comparação entre duas populações

Fundamentos de Análise Matemática Profª Ana Paula. Sequência Infinitas

Estimação da média populacional

Probabilidade II Aula 12

A DESIGUALDADE DE CHEBYCHEV

Estimação da média populacional

CONCEITOS BÁSICOS E PRINCÍPIOS DE ESTATÍSTICA

Stela Adami Vayego DEST/UFPR

AMOSTRAGEM ALEATÓRIA DISTRIBUIÇÕES POR AMOSTRAGEM

Stela Adami Vayego DEST/UFPR

Teoria da Estimação 1

ESTIMAÇÃO DE PARÂMETROS

MAE Introdução à Probabilidade e Estatística II Resolução Lista 2

Instruções gerais sobre a Prova:

UNIVERSIDADE FEDERAL DO PARANÁ NOTAS DE AULA PROFa. SONIA MÜLLER

Capítulo VII: Soluções Numéricas de Equações Diferenciais Ordinárias

Teorema do limite central e es/mação da proporção populacional p

ESTIMAÇÃO POR INTERVALO (INTERVALOS DE CONFIANÇA)

Probabilidade II Aula 9

AULA Subespaço, Base e Dimensão Subespaço.

ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL p

Intervalos de Confiança

Estimar uma proporção p (desconhecida) de elementos em uma população, apresentando certa característica de interesse, a partir da informação

Sumário. 2 Índice Remissivo 17

1. Definição e conceitos básicos de equações diferenciais

Notas do Curso Inferência em Processos Estocásticos. 1 Estimação de máxima verossimilhança para cadeias de Markov de ordem k

TRANSPORTES. Sessão Prática 4 Amostragem de escalares

BÁRBARA DENICOL DO AMARAL RODRIGUEZ CINTHYA MARIA SCHNEIDER MENEGHETTI CRISTIANA ANDRADE POFFAL SEQUÊNCIAS NUMÉRICAS. 1 a Edição

Distribuições Amostrais

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Teste de Hipótese

Estimadores de Momentos

; 2N 2N.! " j %.(1 & q)2 N & j.q j. j!(2n & j)!

Distribuições Amostrais

Teste de Hipóteses Paramétricos

CAPÍTULO 6 ESTIMATIVA DE PARÂMETROS PPGEP. Introdução. Introdução. Estimativa de Parâmetros UFRGS

Estimativa de Parâmetros

1 Distribuições Amostrais

A finalidade de uma equação de regressão seria estimar valores de uma variável, com base em valores conhecidos da outra.

Lista 9 - Introdução à Probabilidade e Estatística

Notas de aula de Probabilidade Avançada

Capítulo 5- Introdução à Inferência estatística. (Versão: para o manual a partir de 2016/17)

CAPÍTULO 6 - ESTIMAÇÃO E TESTES DE HIPÓTESES

Aprendizagem de Máquina

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Teoria da amostragem

ESTATÍSTICA NÃO-PARAMÉTRICA

NOTAS DE AULA: DISTRIBUIÇÃO AMOSTRAL E INTERVALOS DE CONFIANÇA

CAPÍTULO IV DESENVOLVIMENTOS EM SÉRIE

Fundamentos de Análise Matemática Profª Ana Paula. Números reais

Variáveis Aleatórias e Distribuições de Probabilidade

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

Alguns autores também denotam uma sequência usando parêntesis:

Preliminares 1. 1 lim sup, lim inf. Medida e Integração. Departamento de Física e Matemática. USP-RP. Prof. Rafael A. Rosales. 8 de março de 2009.

Capítulo 5. CASO 5: EQUAÇÃO DE POISSON 5.1 MODELO MATEMÁTICO E SOLUÇÃO ANALÍTICA

Métodos de Classificação dos Objetos Segmentados(IAR) Vizinho Próximo Lógica Fuzzy

MQI 2003 ESTATÍSTICA PARA METROLOGIA - SEMESTRE Teste 2 07/07/2008 Nome: PROBLEMA 1 Sejam X e Y v.a. contínuas com densidade conjunta:

Capítulo 5- Introdução à Inferência estatística.

Sumário. 2 Índice Remissivo 19

ESTIMAÇÃO DE PARÂMETROS

Material Teórico - Módulo de ESTATÍSTICA. As Diferentes Médias. Primeiro Ano do Ensino Médio

Secção 1. Introdução às equações diferenciais

objetivo Exercícios Meta da aula Pré-requisitos

Estatística para Economia e Gestão REVISÕES SOBRE VARIÁVEIS ALEATÓRIAS DISCRETAS E CONTÍNUAS

Stela Adami Vayego DEST/UFPR

AUTO AVALIAÇÃO CAPÍTULO I. 1. Assinale com V as proposições que considere verdadeiras e com F as que considere

2. COMBINAÇÃO LINEAR E DEPENDÊNCIA LINEAR DE VETORES

ENGENHARIA DA QUALIDADE A ENG AULA 6 CARTAS DE CONTROLE PARA ATRIBUTOS

Prova Escrita de MATEMÁTICA A - 12o Ano a Fase

Ap A r p e r n e d n i d z i a z ge g m e m Es E t s a t tí t s í t s i t c i a c de d e Dado d s Francisco Carvalho

Alguns autores também denotam uma sequência usando parêntesis:

6. Testes de Hipóteses Conceitos Gerais

Obtemos, então, uma amostra aleatória de tamanho n de X, que representamos por X 1, X 2,..., X n.

CONHECIMENTOS ESPECÍFICOS

Séquências e Séries Infinitas de Termos Constantes

Probabilidade 2 - ME310 - Lista 5

S E Q U Ê N C I A S E L I M I T E S. Prof. Benito Frazão Pires. Uma sequência é uma lista ordenada de números

Conjuntos Infinitos. Teorema (Cantor) Se A é conjunto qualquer, #A #P(A). Mais precisamente, qualquer

EPR 007 Controle Estatístico de Qualidade

Transcrição:

48 4 Teoria da Probabilidade Apresetam-se este capítulo coceitos de probabilidade e de estimação de fuções desidade de probabilidade ecessários ao desevolvimeto e compreesão do modelo proposto (capítulo 5). A probabilidade é uma medida de icerteza associada ao resultado futuro de um sorteio aleatório. É importate perceber que, uma vez ocorrido o sorteio, do poto de vista probabilístico ão há mais dúvida sobre o resultado e, portato, o valor da probabilidade tem um valor preciso [25]. Por exemplo, quado uma moeda é laçada, devido ao cohecimeto parcial sobre sua estrutura física e suas codições iiciais, ão é possível prever com exatidão se o resultado será cara ou coroa. Porém, uma vez pousada, ão há mais dúvida quato ao resultado: ou é cara ou é coroa. 4.. Defiição Seja o uiverso Ω de todos os possíveis evetos elemetares; por defiição, a probabilidade P de um eveto E, deotada por P(E), deve seguir os 3 axiomas de Kolmogorov [26]: i) Para qualquer eveto E, tem-se P ( E) 0. Isto é, a probabilidade de um eveto é um úmero real ão egativo. ii) P ( Ω) : a probabilidade de todos os evetos possíveis é um; ou mais iii) especificamete, ão há eveto elemetar fora do uiverso Ω. Todo cojuto de evetos icompatíveis eumeráveis E, E2,..., satisfaz a P E E K ) P( E ). Ou seja, a probabilidade de um cojuto de ( 2 i evetos formado a partir da uião de evetos disjutos é a soma das probabilidades destes evetos. Este axioma também é cohecido como a propriedade da aditividade.

49 A partir destes axiomas, são euciadas as seguites propriedades: Para qualquer eveto E, tem-se 0 P ( E). Ou seja, a probabilidade é um úmero etre 0 e. Para qualquer eveto E, defie-se o eveto cotrário, E, por P( E ) P( E). P ( ) 0. Para quaisquer dois evetos A e B, tem-se P( A B) P( A) + P( B) P( A B). 4.2. Distribuição de probabilidade Uma fução distribuição de probabilidade é uma fução que associa probabilidades a evetos e pode ser classificada em discreta ou cotíua. No primeiro caso, a fução é defiida para um cojuto discreto e cotável, tal como um subcojuto dos úmeros iteiros; o segudo caso, a distribuição possui uma fução defiida para um cojuto cotíuo, como, por exemplo, um subcojuto dos úmeros reais. Uma forma de defiir uma fução distribuição de probabilidade, F(, é por meio de uma fução desidade de probabilidade (pdf), f(, coforme o exemplo da equação (4.) para o caso cotíuo: x [ X x] F ( Pr f ( X ) dx (4.) A partir da fução desidade de probabilidade, também é possível expressar a probabilidade de obter um valor o itervalo [c, d]: d c P [ c, d] f ( dx (4.2) 4.2.. A Distribuição Normal Etre as diversas distribuições de probabilidade cotíuas, a distribuição Normal se destaca por modelar vários feômeos aturais, etre os quais a icerteza de medição [3]. A distribuição Normal é defiida para < x < + por sua pdf:

50 2 ( x µ ) f ( exp 2 (4.3) σ 2π 2σ ode µ represeta a média e σ 2 a variâcia. 4.2.2. Itervalo de Cofiaça No caso da icerteza de medição, é comum que ela seja dada, simplesmete, como um itervalo em toro do resultado de uma medição, com o qual se espera abrager uma grade fração da distribuição de valores, que poderiam razoavelmete ser atribuídos ao mesurado [3]. Sedo assim, a icerteza de medição ão é, ecessariamete, dada como um múltiplo de um desvio padrão. Para uma gradeza z descrita por uma distribuição ormal, com média µ z e desvio padrão σ, o fator de abragêcia p forece o itervalo µ z p ± σ que correspode ao itervalo de cofiaça com um ível de cofiaça p. Valores típicos para íveis de cofiaça são 90, 95 e 99 por ceto, com fatores de abragêcia,64;,96 e 2,58; respectivamete [3]. É comum que o ível de cofiaça seja expresso pelo valor ( - α) (ode este valor é um úmero fixo, positivo e meor do que ), correspodete à probabilidade associada com um itervalo de cofiaça. 4.3. Métodos de Estimação de Probabilidade Quado a fução desidade de uma quatidade aleatória x ão é cohecida, uma estimativa desta desidade pode ser obtida utilizado-se amostras proveietes de observações x, K, x } de x. Os métodos de estimação podem ser classificados como { paramétricos ou ão-paramétricos: o primeiro caso, um vetor de parâmetros de uma fução é estimado, equato que, o segudo caso, a fução p( é estimada sem que ehum modelo específico seja adotado. A Figura 4 apreseta a taxoomia dos métodos de estimação de fuções de desidade de probabilidade. A estimação da desidade de probabilidade através de métodos paramétricos supõe que as formas das fuções de desidade de probabilidade estudadas são cohecidas.

5 Cotudo, as fórmulas paramétricas usuais em sempre se ajustam as desidades ecotradas a prática. Além disso, a maioria das desidades paramétricas clássicas é uimodal (têm um úico máximo), equato que muitos dos problemas práticos evolvem desidades multimodais. Por outro lado, métodos ão-paramétricos podem ser utilizados com distribuições arbitrárias e sem a suposição que as formas das desidades estudadas sejam cohecidas. observações {x,..., x } de x Estimação ão-paramétrica Estimação paramétrica Não supõe ehum modelo específico Supõe um modelo para a pdf e estima seus parâmetros Utiliza os dados como estão Discretização dos dados em itervalos p ˆ( V p ˆ( x ) V Jaela com largura e posição fixas Histograma Jaela fixa variável Jaela de Parze Jaela variável fixo -vizihos mais próximos Figura 4 - Classificação dos métodos de estimação de desidade de probabilidade 4.4. Métodos de Estimação Não-Paramétricos 4.4.. Defiição As técicas ão-paramétricas fudametais se baseiam o fato de que a probabilidade P de que um vetor x perteça à região R é dada pela equação:

52 P p( dx (4.4) R Coseqüetemete P é uma versão suavizada da fução de desidade p( e assim é possível estimar este valor suavizado de p através da estimação da probabilidade P. Sejam amostras D x, K, x } idepedetes e ideticamete distribuídas de { acordo com a distribuição p(. A probabilidade de que das amostras caiam a região R é dada pela lei biomial: P P ) ( P (4.5) cujo valor esperado de é E [ ] P e a melhor estimativa para P é P ˆ. Cosiderado que p( é cotíua e que a região R é suficietemete pequea de modo que p( ão varia muito detro dela, pode-se escrever: p( dx p( V (4.6) R ode x é um poto detro de R e V é o volume da região R. Combiado as equações (4.4), (4.5) e (4.6), a estimativa para p( é: p(x ) (4.7) V 4.4.2. Histograma O histograma é o estimador de desidade mais atigo e mais utilizado para represetar e observar dados uidimesioais. A costrução de um histograma cosiste em dividir um itervalo de referêcia Ω x mi, x ] em K células (ou compartimetos) C e [ max cotar o úmero a de observações pertecetes a cada célula C. O úmero a é o acumulador associado à célula C. Seja χ C a fução característica de C :

53 a i χ ( x ) C i Quado todas as células do histograma têm a mesma largura, é dito que o histograma é uiforme ou regular. A largura de cada célula,, mais comum é: x max K x mi Uma probabilidade empírica P(C ) pode ser associada a cada célula C : P( C ) a Tomado-se como hipótese que a probabilidade é uiforme em cada célula, uma estimativa p ˆ( da fução de desidade de probabilidade estudada, p(, para qualquer valor real do itervalo Ω, pode ser avaliada por: pˆ ( a χ a χ ( (4.8) K K C ( C que correspode à equação (4.7), ode represeta o volume V e o úmero de amostras em cada célula é K a χ (. C Cotudo, esta estimativa possui algumas fraquezas que fazem com que ela seja raramete utilizada como uma ferrameta estatística. Primeiramete, a aproximação p ˆ(, defiida a equação (4.8), é uma fução ão-cotíua cuja estimação é limitada pela dualidade precisão/cofiaça. Esta dualidade reside o fato de que, quato meor for a distâcia desejada etre p ˆ( e p(, meor deve ser a largura ; porém, como é um úmero fiito, também meor será o valor do acumulador de cada célula e coseqüetemete meor será a covergêcia local de p ˆ( em p(. Por outro lado, quato maior for a largura da célula, meor é a habilidade da desidade estimada de respoder apropriadamete a variações de p(.

54 Além da dificuldade a escolha apropriada da largura da célula, a escolha do itervalo de referêcia Ω também pode iflueciar o resultado ecotrado. A Figura 5 ilustra o efeito da traslação do itervalo de referêcia a forma dos histogramas costruídos a partir de 00 amostras obtidas de uma desidade ormal N(0, ). 25 25 20 20 5 5 0 0 5 5 0-3 -2-0 2 3 0-3 -2-0 2 3 Figura 5 - Depedêcia da forma do histograma em fução da escolha da origem das células. Outro proto fraco dos histogramas é a ecessidade de um alto úmero de amostras. Esta deficiêcia fica aida mais em evidêcia em problemas com espaços em alta dimesão, já que o úmero de células aumeta e coseqüetemete muitas observações são ecessárias para evitar que a estimativa seja ula em uma grade região. 4.4.3. Métodos de Kerel Os métodos de erel tetam solucioar o problema da escolha da posição iicial das células e ao mesmo tempo obter uma fução cotíua. Para isso, diferetemete dos histogramas que utilizam células com volumes fixos (com largura ) e posições prédetermiadas, o volume V das células varia em fução do úmero de amostras e cada célula é cetrada em cada amostra. Re-escrevedo a estimativa dada pelas eqs. (4.6) e (4.7), ota-se que ela também correspode a uma média espacial de p(:

55 P V R p( dx dx R (4.9) Para obter uma estimativa para p(, e ão de valores médios, V deve se aproximar de zero. No etato, se o úmero de amostras é fixo e V tede a zero, o volume da região pode evetualmete ficar pequeo demais e assim pode ão coter ehuma amostra, levado a estimativa p ( 0 a ser iútil. Do poto de vista prático, o úmero de amostras é sempre fiito e será ecessário cosiderar algum ível de suavização a estimativa de p( e aceitar alguma variâcia a razão. Do poto de vista teórico, pode-se cosiderar um úmero ifiito de amostras. Para estimar a desidade p( em x, costrói-se a seqüêcia de regiões R, R 2,..., cotedo x, ode a primeira região cotém uma amostra, a seguda duas, e assim adiate. Seja V o volume da região R que cotém amostras, e seja p ( a -ésima estimativa para p( dada por: p ( (4.0) V Pode-se provar que p ( coverge para p(, ou seja lim ( p(, se as três codições abaixo forem satisfeitas [27]: i) lim V 0 p ii) iii) lim lim 0 A primeira codição assegura que a média espacial P V coverge para p(. A seguda garate que a razão de freqüêcia (em probabilidade) coverge para a probabilidade P. A terceira codição afirma que o úmero de amostras caido a região

56 R é sempre uma pequea parcela desprezível do úmero total de amostras. Ela é ecessária para que p ( defiida pela eq. (4.0) covirja. Um dos camihos para se obter seqüêcias de regiões que satisfazem estas codições é, a partir de um volume iicial, ecolhê-lo à medida que aumeta; por exemplo: V. É em seguida ecessário mostrar que e têm comportameto apropriado para que p ( p(. Este é basicamete o método cohecido como Jaela de Parze [27], que será examiado a seguir. 4.4.4. Jaela de Parze Supodo que a região R é um hipercubo d-dimesioal com lado igual a h, o seu volume é dado por d V h. Seja a fução que assume para os potos detro do hipercubo uitário cetrado a origem e 0 para os potos exteros; esta fução é chamada de fução de jaela e é defiida por: u j 2 j, K, d ϕ ( u) (4.) 0 caso cotrário Coseqüetemete, ϕ (( x x i ) / h ) será igual a se x i estiver detro do hipercubo de volume V cetrado em x, e zero caso cotrário. Portato, o úmero de amostras detro deste hipercubo é dado por: i x xi ϕ (4.2) h Substituido a eq. (4.0), obtém-se: x xi p ( ϕ (4.3) V i V h A estimativa p ( defiida acima é uma média de fuções (de jaela). Tipicamete a fução de jaela tem seu máximo a origem e seus valores caem à medida

57 que se distaciam da origem. Desta forma, cada amostra está cotribuido com a estimativa coforme sua distâcia de x. Para que a estimativa p ( seja uma fução de desidade legítima, isto é, que seja ão-egativa e itegre em, as três codições abaixo devem ser atedidas: i) ϕ ( u) 0 (4.4) ii) ϕ ( u) du (4.5) iii) d V h (4.6) Uma escolha comum para a fução de jaela é a Normal de média x i e variâcia h : T ϕ ( u) exp[ 0,5u u] d 2 (2π ) que produz a estimativa: p ( 2 x xi exp 2 d 2 2 (2π h ) 2h i (4.7) É importate observar que, se h for muito grade, potos muito afastados da amostra x i serão afetados de maeira importate pela jaela. Assim a estimativa será composta pela superposição de fuções letas, ficado suave demais e com uma visão fora de foco da desidade de probabilidade. Por outro lado, se h for muito pequeo, apeas os potos muitos próximos a x i serão afetados de maeira importate pela jaela. Neste caso a estimativa será uma superposição de picos agudos cetrados as amostras e p ( será muito ruidosa. Na prática, deve ser procurada uma cocessão aceitável, já que o úmero de amostras é sempre limitado. É comum escolher um valor para h e defiir h h. Ifelizmete, a escolha do valor de h pode ser problemática. A Figura 6 ilustra 3 estimativas, com jaelas de Parze com diferetes larguras, a partir de 00 amostras geradas através de uma mistura de duas distribuições do tipo

58 Normal. Percebe-se claramete a ifluêcia da largura da jaela a estimação: para h, a jaela é estreita demais e a estimativa é muito ruidosa, apresetado vários picos; para h 6, a jaela é larga demais e praticamete ão são otados os dois picos da distribuição origial; e h 4 parece ser um valor adequado, sem grades ruídos em suavizado em excesso, sedo a qualidade de sua estimação comprometida pelo baixo úmero de amostras. 0.35 0.3 h h 4 h 6 dist. origial 0.25 p( 0.2 0.5 0. 0.05 0-6 -4-2 0 2 4 6 8 0 2 x Figura 6 Ifluêcia da largura da jaela a estimativa por Jaela de Parze