Modelo de distribuição de probabilidade para o número de bolas chamadas até que alguém bata em um bingo Convencional



Documentos relacionados
UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo

2. Método de Monte Carlo

Um Estudo Sobre a Chance de Repetição de Sorteios na Mega-Sena

Cláudio Tadeu Cristino 1. Julho, 2014

O método de Monte Carlo: algumas aplicações na Escola Básica

Vetores Aleatórios, correlação e conjuntas

Probabilidade. Definições e Conceitos

Soluções de Questões de Matemática do Centro Federal de Educação Tecnológica Celso Suckow da Fonseca CEFET/RJ

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

6 Construção de Cenários

4 Avaliação Econômica

Atividade 4 - Acerte no alvo

Métodos Matemáticos para Gestão da Informação

GUIA MEGA DA VIRADA 2013 MINI CURSO

DISTRIBUIÇÃO DE WEIBULL CONCEITOS BÁSICOS APLICAÇÕES

29/9/2011 MANUAL

LOTOFACIL MAIS FÁCIL

Probabilidade. Distribuição Normal

Modelagens e Gerenciamento de riscos (Simulação Monte Carlo)

Aula 11 Esperança e variância de variáveis aleatórias discretas

Sistema de avaliação da tarefa 47 da fase 5

Distribuições de Probabilidade Distribuição Normal

O conceito de probabilidade

Primeira Lista de Exercícios de Estatística

BRINCANDO COM GRÁFICOS E MEDINDO A SORTE

COMO AVALIAR O RISCO DE UM PROJETO ATRAVÉS DA METODOLOGIA DE MONTE CARLO

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE

CAP5: Amostragem e Distribuição Amostral

Simulação Estocástica

AV2 - MA (a) De quantos modos diferentes posso empilhá-los de modo que todos os CDs de rock fiquem juntos?

LISTA DE EXEMPLOS - PROBABILIDADE

Eventos independentes

4/5/2009 CONTROLSOFT CONTROLGAS CONTROLE DE VALE GÁS. Manual de Operação

Conteúdo. 1 Introdução. MINUTA Histograma do 1o Sorteio da NF Salvador xxx/ º Sorteio Eletrônico da Nota Fiscal Salvador

MAT 461 Tópicos de Matemática II Aula 3: Resumo de Probabilidade


CURSO ON-LINE PROFESSOR GUILHERME NEVES

C Curso destinado à preparação para Concursos Públicos e Aprimoramento Profissional via INTERNET RACIOCÍNIO LÓGICO AULA 7

Variáveis Aleatórias Discretas e Distribuições de Probabilidade

O BOXPLOT. Ana Maria Lima de Farias Departamento de Estatística (GET/UFF)

3 Classificação Resumo do algoritmo proposto

PROBABILIDADE. Aula 5

A4 Projeto Integrador e Lista de Jogos

Curso: Logística e Transportes Disciplina: Estatística Profa. Eliane Cabariti. Distribuição Normal

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014

A MATEMÁTICA NO ENSINO SUPERIOR POLICIAL 1

Experimento. O experimento. Apostas no relógio. Secretaria de Educação a Distância. Ministério da Ciência e Tecnologia. Ministério da Educação

TEORIA DO RISCO. LUIZ SANTOS / MAICKEL BATISTA economia.prof.luiz@hotmail.com maickel_ewerson@hotmail.com

Resoluções comentadas de Raciocínio Lógico e Estatística - SEPLAG EPPGG

Exercícios resolvidos sobre Definição de Probabilidade

Estimativas de Software Fundamentos, Técnicas e Modelos... e o principal, integrando isso tudo!

Métodos Estatísticos II 1 o. Semestre de 2010 ExercíciosProgramados1e2 VersãoparaoTutor Profa. Ana Maria Farias (UFF)

Aula 04 Método de Monte Carlo aplicado a análise de incertezas. Aula 04 Prof. Valner Brusamarello

Estatística Aplicada ao Serviço Social

νµθωερτψυιοπασδφγηϕκλζξχϖβνµθωερτ ψυιοπασδφγηϕκλζξχϖβνµθωερτψυιοπα σδφγηϕκλζξχϖβνµθωερτψυιοπασδφγηϕκ χϖβνµθωερτψυιοπασδφγηϕκλζξχϖβνµθ

(a 1 + a 100 ) + (a 2 + a 99 ) + (a 3 + a 98 ) (a 50 + a 51 ).

Soluções Nível 1 5 a e 6 a séries (6º e 7º anos) do Ensino Fundamental

Geração de Números Aleatórios e Simulação

GUIA DE REDAÇÃO PARA TRABALHO DE EM974

Estatística e Probabilidade. Aula 4 Cap 03. Probabilidade

Avanços na transparência

NOME COMPLETO DA SUA INSTITUIÇÃO. Nome completo do integrante A Nome completo do integrante B Nome completo do integrante C

Gerenciamento de Riscos em Projetos. Msc. Fernando Simon AFS SOLUTIONS

9. Derivadas de ordem superior

Regra do Evento Raro p/ Inferência Estatística:

Dadas a base e a altura de um triangulo, determinar sua área.

Vamos Jogar no Totoloto?

Análise bioestatística em fumantes dinamarqueses associado

CAPÍTULO 9 Exercícios Resolvidos

Nome: N.º: endereço: data: telefone: PARA QUEM CURSA O 8 Ọ ANO EM Disciplina: matemática

MODELAGEM E SIMULAÇÃO

Revisão de combinatória

Universidade Federal de Alfenas Programa de Pós-graduação em Estatística Aplicada e Biometria Prova de Conhecimentos Específicos

Qual é o risco real do Private Equity?

Professor Mauricio Lutz PROBABILIDADE

Módulo VIII. Probabilidade: Espaço Amostral e Evento

ORIENTAÇÕES PARA ELABORAÇÃO DO PROJETO DE PESQUISA

Value at Risk (VaR) Introdução. Introdução. Prf. José Fajardo FGV-EBAPE

1. ROTEIRO DE USO DO CORISCO Para usar o CoRisco, e gerar os seus próprios modelos de risco, você deve seguir o roteiro:

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Revisão de Probabilidade e Estatística

MANUAL LOTOFÁCIL. Por Cláudio luis

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

O degrau de potencial. Caso II: energia maior que o degrau

Introdução à genética quantitativa usando os recursos do R

ARQUITETURA DE COMPUTADORES. Sistemas de Numeração. 1 Arquitetura de Computadores

Material Teórico - Módulo de Divisibilidade. MDC e MMC - Parte 1. Sexto Ano. Prof. Angelo Papa Neto

Projeto Supervisionado

'DGRVGH(QWUDGD SDUD D6LPXODomR

2 Modelo Clássico de Cramér-Lundberg

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE II

DISTRIBUIÇÕES DE PROBABILIDADE

Exercícios Resolvidos sobre probabilidade total e Teorema de Bayes

REGULAMENTO DA PROMOÇÃO ESTE NOTEBOOK PODE SER SEU!

- Analisar e compreender a importância e a natureza da estatística no cotidiano;

Solução da prova da 1 a fase OBMEP 2015 Nível 1. QUESTÃO 1 ALTERNATIVA E Como 2 x 100,00 126,80 = 200,00 126,80 = 73,20, o troco foi de R$ 73,20.

3 Caracterização do Repositório Experimental

Manual Geral do OASIS

SIMULAÇÃO DE GESTÃO EMPRESARIAL

Aula 4 Estatística Conceitos básicos

Este material traz a teoria necessária à resolução das questões propostas.

Transcrição:

Modelo de distribuição de probabilidade para o número de bolas chamadas até que alguém bata em um bingo Convencional Pedro Ferreira de Lima 1 Cícero Carlos Felix de Oliveira 2 Dr. Cláudio Tadeu Cristiano 3 1 Introdução Considere em um bingo convencional o problema de se avaliar o número esperado de bolas chamadas até que alguém tenha todos os números de sua cartela sorteados, sendo que neste caso é comum dizer que esta pessoa bate o jogo. O primeiro passo é definir a variável aleatória X = Número de bolas chamadas até que alguém bata em um bingo convencional Cada cartela é formada por vinte e quatro números distribuídos em cinco colunas, conforme o exemplo na Figura 1, a seguir: Figura 1: Cartela típica de um bingo. Na primeira coluna são colocados números de 1 até 15, na segunda de 16 á 30, na terceira de 31 á 45, na quarta de 46 á 60 e na última de 61 á 75. Devemos observar que na terceira coluna só podemos colocar quatro números. 1 Doutorando pelo Programa de Pós-Graduação em Biometria e Estatística Aplicada - UFRPE, professor de estatística da URCA - CE, e e-mail: limapf@yahoo.com.br 2 Doutorando pelo Programa de Pós-Graduação em Biometria e Estatística Aplicada - UFRPE, professor de estatística do IFCE - Campus Crato, e e-mail: cicerofelixoliveira@bol.com.br 3 Professor do Programa de Pós-Graduação em Biometria e Estatística Aplicada, Universidade Federal Rural de Pernambuco - e-mail: ctcristino@gmail.com 1

É importante observar que o número de cartelas que podem ser produzidas é de: ( 15 C 5 ) 4 15 C 4 = 111.007.923.832.370.565, em que n C k representa o número de combinações k a k de um conjunto com n elementos. Admitindo a possibilidade de que em algum desses sorteios fossem produzidas todas as cartelas possíveis e estimando o peso da cada cartela em 2,5 gramas, ainda seriam necessários cerca de 277.519.809.500 toneladas de papel para produzi-las. É difícil até de imaginar o tamanho da montanha de papel que seria acumulada no final da produção. 2 Resultados e Discussões O número mínimo de bolas sorteadas para que alguém possa bater é de: 24, que é o total de números constantes em cada cartela. Mas para se ter a certeza que alguém baterá ao sortear o vigésima quarta bola, é necessário que todas as cartelas sejam produzidas e mais algumas que não obedecem aos critérios de regularidades na produção das cartelas. Isto porque os sorteios não obedecem a esses critérios. Os 24 primeiros números podem ser sorteados de 75 C 24 = 25.778.699.578.994.555.700 de modos. Se a cartela que contém os primeiros 24 números sorteados foi produzida e vendida, então alguém baterá nesse momento. Considerando que os sorteios são completamente casuais, e que a cartela possa ter sido produzida, então a probabilidade de uma dessas cartelas ser a premiada é de: P(X = 24) = 24 C 24 = 1 Até esse momento apenas uma combinação 24 C 24 foi chamada de um total de: 75 C 24. Se ninguém bateu é porque ou a cartela não foi produzida ou, no caso de ter sido produzida, não foi vendida. Devemos então excluí-la do nosso espaço amostral. Após este procedimento inda restarão: 75 C 24 24 C 24. A probabilidade de bater ao sortear 25 números é de: P(X = 25) = 75 C 24 24 C 24 25 C 24 24 C 24 24 C 24 = 25 C 24 24 C 24 Devemos observar que nesse momento podem existir até 25 C 24 24 C 24 = 24 combinações de 24 números com possibilidades de serem premiadas. Mas pode ocorrer de nenhuma dessas 24 combinações ser viável para a produção de cartelas, mesmo ha hipótese de viabilidade e produção, pode não ter sido vendida. Isto ocorrendo será necessário o sorteio de mais um 2

número. Daí: P(X = 26) = 75 C 24 24 C 24 75 C 24 25 C 24 24 C 24 26 C 24 25 C 24 25 C 24 = 26 C 24 25 C 24 Seguindo de maneira análoga obteremos: P(X = k) = 75 C 24 24 C 24 75 C 24 25 C 24 24 C 24 75 C 24 26 C 24 25 C 24 k C 24 (k 1) C 24 (k 1) C 24 = k C 24 (k 1) C 24 A função de distribuição acumulada F X pode ser resumida como na Tabela 1 a seguir: Tabela 1: Função de probabilidade para o número de bolas chamadas até a batida. X x 63 64 65 66 67 68 69 P(X x) < 0, 01 0,01 0,02 0,02 0,04 0,06 0,09 X x 70 71 72 73 74 75 P(X x) 0,14 0,21 0,31 0,46 0,68 1,00 Utilizando o software R calculamos E(X) = 72,96. Uma simples consulta à função F X nos permite concluir que Moda X = 75 e Mediana X 73,5. Com a finalidade de testar o modelo apresentado, simulamos duzentos bingos, nos quais apenas uma cartela esteve em jogo. Os resultados obtidos estão resumidos na Tabela 2, a seguir: Tabela 2: Medidas de resumo (localização) para as 200 simulações realizadas de sorteios com uma única cartela. Mínimo Q 1 Mediana Média Q 3 Máximo 63 71 74 72,53 75 75 A distribuição de frequências de bolas chamadas até a batida nas simulações é dada na Tabela 3, abaixo: Tabela 3: Frequências de bolas chamadas até a batida nas simulações realizadas. Bolas chamadas até a batida 63 64 65 66 67 68 69 70 71 72 73 74 75 Ocorrências 1 1 2 5 6 8 10 9 13 19 24 41 61 Da Tabela 3, podemos concluir facilmente que a moda é igual a 75, concordando com o valor encontrado teoricamente. 3

Como bingo com apenas uma cartela não é o mais comum, também simulamos jogos para os seguintes números de cartelas: n = 200, n = 1000, n = 2000, n = 5000 e n = 10000. Na Tabela 4, apresentamos os resumos dessas simulações: Tabela 4: Resumo dos dados obtidos nas simulações n Mínimo Q 1 Mediana Moda Média Q 3 Máximo 200 54 61 62 64 62,19 64 67 1000 50 58 59 59 59,03 61 63 2000 50 56 58 58 57,31 59 63 5000 46 54 56 57 55,86 58 61 10000 49 54 55 55 54,94 56 59 Em cada uma das simulações realizadas, geramos aleatoriamente n cartelas, obedecendo aos mesmos critérios de regularidades impostos na produção das cartelas. Este procedimento foi repetido duzentas vezes, simulando igual número de repetições do jogo nos mesmos moldes. Apresentamos um resumo dos resultados nos histogramas dados na Figura 2 a seguir: Figura 2: Os Histogramas das distribuições empíricas. Para encontrarmos a distribuição de probabilidade da vairiável aleatória: número de bolas 4

chamadas até que alguém bata num bingo com n cartelas, ou seja, número de bolas chamadas até que alguma dessas cartelas seja completamente preenchida, consideramos as n variáveis aleatórias independentes X i com i = 1,...n, onde cada X i indica o número de bolas que precisam ser chamadas até que a cartela i ser completamente preenchida. Assim nosso interesse é estudar a distribuição de probabilidade da variável aleatória X = mínimo(x 1,X 2,...,X n ). Devido a isto, faz sentido testarmos, para cada n, a hipótese de que a distribuição de X (ver [1]) é dada por: H 0 : F X (x) = 1 [1 F X (x)] n, x Nas Tabelas 5 e 6, dadas a seguir, apresentamos as distribuições empíricas F 0 e as teóricas F X para os valores de n anteriormente mencionados. Tabela 5: Distribuições empíricas e teóricas para n igual a 1, 200 e 1000 cartelas n = 1 n = 200 n = 1000 i x i F X (x i ) F 0 (x i ) x i F X (x i ) F 0 (x i ) x i F X (x i ) F 0 (x i ) 1 63 0,005 0,006 54 0,005 0,011 50 0,005 0,005 2 64 0,010 0,010 55 0,015 0,019 51 0,005 0,009 3 65 0,020 0,015 56 0,035 0,033 52 0,005 0,016 4 66 0,045 0,024 57 0,045 0,057 53 0,010 0,030 5 67 0,075 0,038 58 0,070 0,095 54 0,030 0,053 6 68 0,115 0,058 59 0,125 0,155 55 0,080 0,092 7 69 0,165 0,089 60 0,235 0,244 56 0,125 0,155 8 70 0,210 0,136 61 0,360 0,370 57 0,235 0,253 9 71 0,275 0,206 62 0,515 0,529 58 0,370 0,392 10 72 0,370 0,308 63 0,655 0,705 59 0,545 0,568 11 73 0,490 0,459 64 0,830 0,858 60 0,715 0,753 12 74 0,695 0,680 65 0,935 0,955 51 0,875 0,901 13 75 1,000 1,000 66 0,985 0,993 62 0,970 0,977 14 67 1,000 1,000 63 1,000 0,998 15 64 1,000 1,000 d 0 = 0,076 d 0 = 0,050 d 0 = 0,038 Ao realizarmos testes de Kolmogorov-Smirnov com n = 200, já que em cada caso repetimos o jogo esse número de vezes. Com α = 5%, de acordo com [2], devemos observar que em todos os casos, temos d 0 < D c. Onde: ( ) ln 0,05 2 D c = 0,096 2 200 Em palavras isto quer dizer que os dados não refutam as hipóteses, ou seja, que o mínimo modela bem o problema. Podemos observar que em todos os casos, veja a tabela 7, as diferenças absolutas são bem pequenas, implicando numa diferença relativa inferior a 0,5%. Este fato, reforça a ideia do bom ajuste do modelo proposto. 5

Tabela 6: Distribuições empíricas e teóricas para diversos números de cartelas n = 2000 n = 5000 n = 10000 i x i F X (x i ) F 0 (x i ) x i F X (x i ) F 0 (x i ) x i F X (x i ) F 0 (x i ) 1 50 0,005 0,009 46 0,005 0,002 49 0,020 0,024 2 51 0,025 0,018 47 0,010 0,003 50 0,035 0,046 3 52 0,055 0,033 48 0,010 0,006 51 0,070 0,085 4 53 0,085 0,059 49 0,015 0,012 52 0,130 0,152 5 54 0,140 0,103 50 0,030 0,023 53 0,225 0,261 6 55 0,210 0,176 51 0,050 0,044 54 0,350 0,420 7 56 0,340 0,287 52 0,100 0,079 55 0,570 0,619 8 57 0,470 0,442 53 0,160 0,140 56 0,785 0,815 9 58 0,650 0,631 54 0,260 0,238 57 0,910 0,946 10 59 0,810 0,813 55 0,385 0,383 58 0,965 0,993 11 60 0,920 0,939 56 0,535 0,570 59 1,000 1,000 12 61 0,985 0,990 57 0,730 0,768 13 62 0,995 0,999 58 0,880 0,917 14 63 1,000 1,000 59 0,970 0,985 15 60 0,995 0,999 16 61 1,000 1,000 d 0 = 0,053 d 0 = 0,038 d 0 = 0,070 Tabela 7: As diferenças entre as principais medidas de tendência de centro, empíricas e teóricas. Número de Média Moda Mediana cartelas Teórica Empírica Dif. Teórica Empírica Dif. Teórica Empírica Dif. n = 1 72,96 72,53 0,43 75 75 0 73,0 74-1,0 n = 200 61,96 62,19-0,23 63 64-1 61,5 62-0,5 n = 1000 58,79 59,03-0,24 60 59 1 58,5 59-0,5 n = 2000 57,49 57,31 0,18 58 58 0 57,5 58-0,5 n = 5000 55,83 55,86-0,03 57 57 0 55,5 56-0,5 n = 10000 54,61 54,94-0,33 56 55 1 54,5 55-0,5 6

3 Conclusões O modelo que desenvolvemos e testamos, assim como os resultados obtidos pelas simulações, mostram que a medida que o número de cartelas cresce, diminuem os valores das medidas de posições, como as de tendência de centro e as separatrizes, veja Tabela 4. Os testes realizados com os dados simulados, reforçam a ideia de que o modelo está coerente. Considerando a hipótese de perfeição do modelo e na produção e distribuição de todas cartelas, mesmo aquelas que não obedecem as leis de produção, ou seja, todas as combinações possíveis de 24 números tomados dentre 75 possíveis. Considerando esta hipótese, ao chamar a vigésima quarta bola, alguém deveria bater, ou seja F X (x) seria igual a zero, para x < 24 e 1, para x 24. A partir dos cálculos, obtemos que se X = min(x 1,...,X 75 C 24 ), então F X é igual a zero, para x < 27 e 1, para o caso contrário, discordando um pouco do que deveria ocorrer. As simulações não detectam este problema porque as cartelas são geradas de forma independentes, permitindo, por exemplo, que mesmo ao produzir um total 75 C 24 cartelas, alguma combinação possívelmente tenha ficado de fora na produção, certamente porque alguma cartela foi produzida mais de uma vez. Excluindo casos extremos, como o discutido no parágrafo anterior, o modelo descreve bem a natureza do jogo e pode ser usando para se ter uma ideia do tempo esperado até alguém bater, usando o número esperado de bolas a chamar até que alguém bata, de acordo com o número de cartelas que serão distribuídas. Os autores esperam encontrar outras aplicações para o modelo na área de riscos competitivos, que indicaria um excelente potencial para o modelo proposto. Referências [1] Magalhães, M. Nascimento, Probabilidade e Variável Aleatória, 2 a ed., Editora: EDUSP, São Paulo, 2006. [2] Bussab, Wilton de O. & Morettin, Pedro A., Estatística Básica 5 a edição, Editora Saraiva, São Paulo, 2006. 7