Distribuições Binomiais Negativas, Geométricas e Hipergeométricas



Documentos relacionados
Variáveis Discretas e Distribuições de Probabilidade. Distribuição Binomial

Variáveis Aleatórias Discretas e Distribuição de Probabilidade

Modelo Uniforme. como eu e meu colega temos 5 bilhetes, temos a mesma probabilidade de ganhar a rifa:

Probabilidade. Distribuição Binomial

Aproximação normal para as distribuições binomial e Poisson

Avaliação e Desempenho Aula 1 - Simulação

IND 1115 Inferência Estatística Aula 8

Capítulo 4 Inferência Estatística

Modelos de Probabilidade e Inferência Estatística

Então, a distribuição de converge para a distribuição normal com média nμ e variância nσ 2

Distribuições de Probabilidade Conjuntas

Inspeção de Qualidade

é 4. Portanto, o desvio padrão é 2. Neste caso 100% dos valores da população estão a um desvio padrão da média.

Probabilidade III. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período

Progressão aritmética ( PA )

Processos Estocásticos

Probabilidade e Estatística 2011/2

Prova Escrita de MATEMÁTICA A - 12o Ano a Fase

AULA 04 Estimativas e Tamanhos Amostrais

3 Modelos de Simulação

ESCOLA SUPERIOR DE TECNOLOGIA

Aula de Exercícios - Variáveis Aleatórias Discretas

Teorema do Limite Central e Intervalo de Confiança

Aula 8 Intervalos de confiança para proporções amostras grandes

Estimação. Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança

Medidas de Tendência Central

Aula 12 Teste de hipótese sobre proporções amostras grandes

Aula 1 Assimetria e Curtose

AMOSTRAGEM: DIMENSIONAMENTO DE AMOSTRAS. SELEÇÃO DOS ELEMENTOS DE UMA AMOSTRA. ESTIMATIVA DA CARACTERÍSTICA TOTAL DA POPULAÇÃO INVESTIGADA

Aula 6 Medidas de Tendência Central

Universidade Federal do Amazonas Instituto de Ciências Exatas Departamento de Estatística

Testes Qui-Quadrado - Teste de Aderência

Distribuição Binomial e Normal

Estatística AMOSTRAGEM

Engenharia Econômica

Probabilidade e Estatística, 2009/2

NORMA TÉCNICA PARA RECEBIMENTO DE BENS DE INFORMÁTICA PELA METODOLOGIA DE INSPEÇÃO POR ATRIBUTOS. Referência: NT-AI Data: 17/04/2.

Probabilidade e Estatística - EST0003 Intervalos Estatísticos para uma única Amostra

Vamos denotar por C o evento balancete de custo e por O o evento balancete de orçamento. Temos: #O = 4 #C = 3 # = 7 Logo, Pr(O) =4/7 Pr(C) =2/7

Teste de Hipótese e Intervalo de Confiança. Parte 2

MAE116 - Noções de Estatística

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

Estatística - exestatmedposic.doc 25/02/09

AULAS 08 E 09 Distribuição de Probabilidade Normal

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba. Prof. Tarciana Liberal (UFPB) Aula Distribuição Uniforme 11/13 1 / 19

Análise estatística. Aula de Bioestatística. 17/9/2008 (2.ª Parte) Paulo Nogueira

Técnicas estatísticas para análise de dados e de resultados de modelos de simulação

Prova Escrita de MATEMÁTICA A - 12o Ano a Fase

AULA DO CPOG. Progressão Aritmética

Plano de Ensino PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA - CCE0292

Variáveis Aleatórias Discretas e Distribuição de Probabilidade

Estruturas de Repetição

AGRUPAMENTO DE ESCOLAS DA SÉ GUARDA. MATEMÁTICA B Curso de Artes Visuais

População e Amostra POPULAÇÃO AMOSTRA AMOSTRAGEM TIPOS DE AMOSTRAGEM I. Amostra probabilística: II. Amostra não-probabilística

Variáveis Aleatórias Discretas e Distribuições de 3Probabilidade

Unidade 5.2. Teste de hipóteses. Hipótese estatística. (uma população) Formulando as hipóteses. Teste de Hipóteses X Intervalo de Confiança

Séries Numéricas. S Chama-se série numérica a uma expressão do tipo. S Designam-se por somas parciais da série. S Chama-se a soma parcial de ordem n a

Distribuição Normal de Probabilidade

CONHECIMENTOS ESPECÍFICOS

Aula 1 Variáveis aleatórias contínuas

Apresentação de Dados

Matemática Aplicada às Ciências Sociais

Para cada um dos experimentos abaixo, descreva o espaço amostral e dê o número de seus elementos.

F (x) = P (X x) = Σ xi xp(x i ) E(X) = x i p(x i ).

Coeficiente de Assimetria e Curtose. Rinaldo Artes. Padronização., tem as seguintes propriedades: Momentos

AULA 07 Distribuições Discretas de Probabilidade

Medida de Tendência Central

O QUE SÃO E QUAIS SÃO AS PRINCIPAIS MEDIDAS DE TENDÊNCIA CENTRAL EM ESTATÍSTICA PARTE I

ANÁLISE DE FALHAS DE COMPUTADORES

Seqüências. George Darmiton da Cunha Cavalcanti CIn - UFPE

Introdução à Aritmética Modular. George Darmiton da Cunha Cavalcanti CIn - UFPE

1 Introdução. 1.1 Importância da Utilização da Amostragem

Exercícios Selecionados de Estatística Avançada. Sumário

Aula 8. Teste Binomial a uma proporção p

PUC-Rio Desafio em Matemática 23 de outubro de 2010

Intervalos Estatísticos para Uma Única Amostra

n Xi = X1 + X2 + X Xn i = 1 n Xi, deve ser lida soma dos valores xi, para i variando de 1 até n. i = 1

Variáveis Frequências Gráficos Medidas de Posição Medidas de Dispersão Medidas Complementares Inferência

Arquitetura de Computadores I

Erros e Incertezas. Rafael Alves Batista Instituto de Física Gleb Wataghin Universidade Estadual de Campinas (Dated: 10 de Julho de 2011.

3 Distribuições Teóricas Contínuas

II-6 Análise de ruído e capacidade de canal

x = xi n x = xifi fi 1. MÉDIA Exercício: Quando a distribuição é simétrica, a média e a mediana coincidem.

Lista de Exercícios 2º Ensino médio manhã

3ª Aula. Desenvolvimento do Tema: Custos

Conjuntos Finitos e Infinitos

Um pouco da História dos Logaritmos

II Olimpíada de Matemática do Grande ABC Primeira Fase Nível 4 ( 3 Série EM e Concluintes )

ESTATÍSTICA PARTE 1 OBJETIVO DA DISCIPLINA

Soluções de Questões de Matemática - BNDES

Probabilidade e Estatística EST /2

rede de fibra óptica com alto fluxo de dados

Módulos Combinatórios

CIRCULAR TÉCNICA N o 171 NOVEMBRO 1989 TABELAS PARA CLASSIFICAÇÃO DO COEFICIENTE DE VARIAÇÃO

I COLIFORMES E ph MÉDIAS ARITMÉTICAS, MÉDIAS GEOMÉTRICAS E MEDIANAS

Testes de variância e Análise de Variância (ANOVA)

PLANO DE ENSINO CONTEÚDO PROGRAMÁTICO. Unidade 1: MEDIDAS E GRANDEZAS Introdução Padrões usados para avaliar grandezas físicas

Arte e Matemática. Série Matemática na Escola

AVALIAÇÃO DA APRENDIZAGEM EM PROCESSO. Matemática

MEDIDAS DE DISPERSÃO. o grau de variabilidade, ou dispersão, dos valores em torno da média.

Transcrição:

Distribuições Binomiais Negativas, Geométricas e Hipergeométricas Distribuição geométrica Suponhamos que temos uma série de amostragens de Bernoulli (amostragens independentes com probabilidade constante p de sucesso cada uma). Agora, em vez de usarmos um número fixo de amostragens, elas serão realizadas até que o sucesso seja obtido. X número de amostragens até que o sucesso seja obtido.

Exemplo. A probabilidade de que um bit transmitido através de um canal de transmissão digital seja recebido com erro é 0.1. Suponha que as transmissões são eventos independentes. X número de bits transmitidos até o primeiro erro P X 4 ( = 5) = P( OOOOE) = (0.9) (0.1) = 0.06 Em geral, P X x f x p p x 1 ( = ) = ( ) = (1 ) Variável aleatória geométrica

Se X é uma variável aleatória geométrica com parâmetro p, µ = E( x) = 1/ p σ 2 = V ( x) = 1 p 2 p

Distribuição Binomial Negativa Generalização da distribuição geométrica onde a variável aleatória é o número de amostragens de Bernoulli necessárias para obter r sucessos. Exemplo. Suponha que a probabilidade de que um bit transmitido através de um canal digital de comunicação seja recebido com erro é 0.1. Suponha que as transmissões são eventos independentes. X quantidade de bits transmitidos até o quarto erro. P(X=10) - probabilidade de que exatamente três erros ocorram nas primeiras nove amostragens e então a amostragem 10 resulta no quarto erro.

Probabilidade de que exatamente três erros ocorram nas primeiras nove amostragens : distribuição binomial 9 (0.1) 3 (0.9) 6 = 0.04464 3 Probabilidade de que a décima amostragem resulte num bit com erro: 0.1 Resultado: 9 9 = = 3 3 3 6 3 6 (0.1) (0.9) (0.1) (0.1) (0.9) (0.1) 0.004464

Definição Em uma série de amostragens de Bernoulli, seja X o número de amostragens até que r sucessos ocorram. Então X é uma variável aleatória binomial negativa, com parâmetros 0 < p < 1, r= 1,2,3,..., e x 1 r f ( x) = ( p) (1 p) r 1 x r x = r, r + 1, r + 2,...

Série binomial negativa é uma soma de séries geométricas Série binomial: número de amostragens é pré-determinado, número de sucessos é aleatório. Série binomial negativa: número de sucessos é pré-determinado, número de amostragens é aleatório.

> restart: > with(statistics):with(plots): > r:=5:p:=0.1:n:=120: > for x from r to r+n do P[x]:=binomial(x-1,r-1)*p^r*(1-p)^(x-r); od: > xdata:=[seq(i,i=r..r+n)]: > ydata:=[seq(p[k],k=r..r+n)]: > PL:=PointPlot(ydata,xcoords=xdata, color=blue, symbol=circle): > display([pl]); > sum(p[k],k=r..r+n): 0.9961414048

R=5, p=0.1

r = 5 p = 0.2 r = 5 p = 0.1

r = 5 p = 0.1 r = 7 p = 0.1

Se X é uma variável aleatória binomial negativa, então r µ = E( x) = 2 σ p = V ( X ) = r(1 p) 2 p

Exemplo. Um site da web possui três idênticos servidores. Um é utilizado para operar o site e os outros dois são reservas que devem ser ativados no caso do sistema falhar. A probabilidade de falha do computador principal (ou reserva) na requisição de um serviço é 0.0005. Supondo que cada requisição representa uma amostragem independente, qual é o número médio de requisições até que acontece uma falha dos três servidores? X : número de requisições até que os três servidores falhem. X = X1 + X 2 + X 3 falha no servidor 1 p = 0.5 r = 3 r 3 µ = E( x) = = = 6000 p 0.0005

Qual é a probabilidade de que os três servidores falhem em cinco requisições? x 1 r P( X = x) = f ( x) = ( p) (1 p) r 1 x r P( X 5) = P( X = 3) + P( X = 4) + P( X = 5) 5 x 1 P( X 5) = (0.0005) (1 0.0005) x= 3 3 1 = 0.1249062688 10-8 3 x 3 > p:=0.0005: r:=3: > P(X<=5):=sum(binomial(x-1,2)*p^r*(1-p)^(x-r),x=3..5);

Distribuição Hipergeométrica Exemplo: Uma linha de produção produz 50 partes defeituosas para cada lote de 850 partes. Duas partes são selecionadas aleatoriamente sem substituição e analisadas. X número de partes defeituosas 800 799 P( X = 0) = P( OO) = = 0.886 850 849 P( X = 1) = P( DO) + P( OD) 50 800 800 50 = + = 0.111 850 849 850 849 50 49 P( X = 2) = P( DD) = = 0.003 850 849

Definição. Um conjunto de N objetos contém K objetos classificados como sucessos N-K objetos classificados como falhas Uma amostra de n objetos é selecionada aleatoriamente, sem substituição dos N objetos K N n N X variável aleatória que denota o número de sucessos - variável aleatória hipergeométrica f ( x) = K N K x n x N n x = max{0, n + K N}..min{ K, n}

f f f 50 850 50 0 2 0 (0) = P( X = 0) = = 0.886 850 2 50 850 50 1 2 1 (1) = P( X = 1) = = 0.111 850 2 50 850 50 2 2 2 (2) = P( X = 2) = = 0.003 850 2

> restart: > K:=100: N:=400:n:=10: > with(statistics):with(plots): > xmin:=max(0,n+k-n):xmax:=min(k,n): > for x from xmin to xmax do P[x]:=binomial(K,x)*binomial(N-K,n-x)/binomial(N,n); od: > xdata:=[seq(i,i=xmin..xmax)]: > ydata:=[seq(p[k],k=xmin..xmax)]: > PL1:=PointPlot(ydata,xcoords=xdata, color=blue, symbol=circle):

K = 100 N = 400 n = 10

K = 150 N = 400 n = 20

Exemplo. Um lote contém 100 partes de um fornecedor brasileiro e 200 partes de um fornecedor chinês. Se quatro partes são selecionadas aleatoriamente, sem substituição, qual é a probabilidade de que sejam todas elas de um fornecedor brasileiro? X: número de partes de um fornecedor brasileiro. 100 200 4 4 4 P( X = 4) = = 0.0119 300 4

Qual é a probabilidade de que duas ou mais partes na amostra sejam de um fornecedor brasileiro? P( X 2) = P( X = 2) + P( X = 3) + P( X = 4) 100 200 100 200 100 200 2 4 2 3 4 3 4 4 4 = + + 300 300 300 4 4 4 = 0.408

Qual a probabilidade de que pelo menos uma parte seja de um fornecedor brasileiro? P( X 1) = 1 P( X = 0) 100 200 0 4 0 = 1 = 0.804 300 4

Se X é uma variável aleatória geométrica com parâmetros N, K e n, então µ = E( X ) = np Fator de correção de população finita σ 2 N n = V ( X ) = np(1 p) N 1 p = K N Proporção de sucessos no conjunto de N objetos

Se n é pequeno relativamente a N, a correção é pequena e a distribuição hipergeométrica é similar à binomial. Neste caso, a distribuição binomial pode ser usada como aproximação. Exemplo. Uma lista de clientes em uma corporação contém 1000 nomes. Destes, 700 compraram pelo menos um produto da corporação nos últimos 3 meses. Para avaliar o design de um produto, 50 clientes são escolhidos aleatoriamente desta lista. Qual é a probabilidade de que mais do que 45 clientes selecionados tenham feito compras na corporação nos últimos 3 meses? A amostragem é feita sem substituição. No entanto, como o tamanho da amostra (50) é pequeno relativamente ao número total de clientes (1000), a probabilidade de cada seleção é aproximadamente constante.

X variável aleatória hipergeométrica com parâmetros: N = 1000, n = 50, K = 700 Com p = K/N = 0.7, usando a distribuição binomial temos n x P( X = x) = f ( x) = p (1 p) x 50 50 x P( X > 45) = 0.7 (1 0.7) x= 45 x n x 50 x

> p:=0.7:n:=50: > P[X>45]:=sum(binomial(n,x)*p^x*(1-p)^(n-x),x=46..50); P 45 < X := 0.0001719273855 Usando a distribuição hipergeométrica, temos K N K x n x P( X = x) = f ( x) = N n 700 1000 700 50 x 50 x P( X 45) = x= 45 1000 50

Note que o resultado obtido aqui é algo diferente daquele da distribuição binomial: > N := 1000.: n := 50.: K := 700.: > xmin:=max(0,n+k-n):xmax:=min(k,n): > P:=sum(binomial(K,x)*binomial(N-K,n-x)/binomial(N,n),x=46..xmax); P := 0.0001275856944 Observe que os termos numéricos que aparecem na fórmula são muito grandes para uma calculadora, por exemplo, > binomial(1000,50); 94604610175852178460637222777280449187296940016686540647935693213432526\ 97198115263280 mas são facilmente manipulados pela aritmética de ponto flutuante (software precisão arbitrária) do Maple.

> restart: > N := 50: n := 5: K := 25:p:=K/N; > fhg:=x->evalf(binomial(k,x)*binomial(n-k,n-x)/binomial(n,n)); > fb:=x->evalf(binomial(n,x)*p^x*(1-p)^(n-x)); > with(statistics):with(plots): > xdata:=[seq(x,x=0..n)]; > ydata_hg:=[seq(fhg(x),x=0..n)]; > ydata_b:=[seq(fb(x),x=0..n)]; > PL_hg:=PointPlot(ydata_hg,xcoords=xdata, color=blue, symbol=circle): > PL_b:=PointPlot(ydata_b,xcoords=xdata, color=red, symbol=circle): > display([pl_hg,pl_b]);

binomial hipergeométrica N = 50 n = 5 K= 25 p = K/N

N = 500 n = 5 K = 250 p = K/N

N = 1000 n = 50 K = 250 p = K/N

N = 1000 n = 50 K = 250 p = K/N > sum(fhg(x),x=46..50); 0.0001275856944 > sum(fb(x),x=46..50); 0.0001719273855

N = 120 n = 3 K = 22 p = K/N

> sum(fhg(x),x=1..3); 0.4584247258 > sum(fb(x),x=1..3); 0.4553287036 > 1-fhg(0); 0.4584247258 > 1-fb(0); 0.4553287037