Capítulo 4. Contagem, Probabilidade e Estatística

Documentos relacionados

Eventos independentes

O problema do jogo dos discos 1

MAT 461 Tópicos de Matemática II Aula 3: Resumo de Probabilidade

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE

O conceito de probabilidade

Exercícios Teóricos Resolvidos

Módulo VIII. Probabilidade: Espaço Amostral e Evento

Unidade 11 - Probabilidade. Probabilidade Empírica Probabilidade Teórica

Cálculo das Probabilidades e Estatística I

I. Experimentos Aleatórios

A probabilidade representa o resultado obtido através do cálculo da intensidade de ocorrência de um determinado evento.

Aula 11 Esperança e variância de variáveis aleatórias discretas

Capítulo 7 Medidas de dispersão

AV2 - MA (a) De quantos modos diferentes posso empilhá-los de modo que todos os CDs de rock fiquem juntos?

Professor Mauricio Lutz PROBABILIDADE

Princípio da Casa dos Pombos I

5 Equacionando os problemas

Aplicações de Combinatória e Geometria na Teoria dos Números

Aula 4 Estatística Conceitos básicos

Probabilidade - Conceitos Básicos. Anderson Castro Soares de Oliveira

PROBABILIDADE Prof. Adriano Mendonça Souza, Dr.

Objetivos. Apresentar as superfícies regradas e superfícies de revolução. Analisar as propriedades que caracterizam as superfícies regradas e

x0 = 1 x n = 3x n 1 x k x k 1 Quantas são as sequências com n letras, cada uma igual a a, b ou c, de modo que não há duas letras a seguidas?

Simulado OBM Nível 2

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

INSTITUTO DE APLICAÇÃO FERNANDO RODRIGUES DA SILVEIRA (CAp/UERJ) MATEMÁTICA ENSINO MÉDIO - PROF. ILYDIO SÁ CÁLCULO DE PROBABILIDADES PARTE 1

Exercícios Resolvidos sobre probabilidade total e Teorema de Bayes

Correlação e Regressão Linear

Soluções Nível 1 5 a e 6 a séries (6º e 7º anos) do Ensino Fundamental

REVISÃO E AVALIAÇÃO DA MATEMÁTICA

Por que o quadrado de terminados em 5 e ta o fa cil? Ex.: 15²=225, 75²=5625,...

Matemática em Toda Parte II

Hoje estou elétrico!

Material Teórico - Módulo de Métodos sofisticados de contagem. Princípio das Casas dos Pombos. Segundo Ano do Ensino Médio

Fração como porcentagem. Sexto Ano do Ensino Fundamental. Autor: Prof. Francisco Bruno Holanda Revisor: Prof. Antonio Caminha M.

INE 5111 Gabarito da Lista de Exercícios de Probabilidade INE 5111 LISTA DE EXERCÍCIOS DE PROBABILIDADE

C Curso destinado à preparação para Concursos Públicos e Aprimoramento Profissional via INTERNET RACIOCÍNIO LÓGICO AULA 7

Canguru sem fronteiras 2007

Material Teórico - Módulo de Divisibilidade. MDC e MMC - Parte 1. Sexto Ano. Prof. Angelo Papa Neto

Departamento de Matemática - UEL Ulysses Sodré. Arquivo: minimaxi.tex - Londrina-PR, 29 de Junho de 2010.

(a 1 + a 100 ) + (a 2 + a 99 ) + (a 3 + a 98 ) (a 50 + a 51 ).

Só Matemática O seu portal matemático FUNÇÕES

PROBABILIDADE PROFESSOR: ANDRÉ LUIS

Espaço Amostral ( ): conjunto de todos os

Estatística e Probabilidade. Aula 4 Cap 03. Probabilidade

O B. Podemos decompor a pirâmide ABCDE em quatro tetraedros congruentes ao tetraedro BCEO. ABCDE tem volume igual a V = a2.oe

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

Solução da prova da 1 a fase OBMEP 2015 Nível 1. QUESTÃO 1 ALTERNATIVA E Como 2 x 100,00 126,80 = 200,00 126,80 = 73,20, o troco foi de R$ 73,20.

Dois eventos são disjuntos ou mutuamente exclusivos quando não tem elementos em comum. Isto é, A B = Φ

Qual é Mesmo a Definição de Polígono Convexo?

16 Comprimento e área do círculo

BRINCANDO COM GRÁFICOS E MEDINDO A SORTE

Exercícios resolvidos sobre Definição de Probabilidade

O Problema do Troco Principio da Casa dos Pombos. > Princípios de Contagem e Enumeração Computacional 0/48

Matemática Financeira II

APLICAÇÕES DA DERIVADA

Conceitos e fórmulas

Equações do segundo grau

ANALISE COMBINATORIA Um pouco de probabilidade

Calculando probabilidades

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo

quociente razão. mesma área a partes de um tablete de chocolate

FUNÇÃO REAL DE UMA VARIÁVEL REAL

CAPÍTULO 9 Exercícios Resolvidos

O ESPAÇO NULO DE A: RESOLVENDO AX = 0 3.2

CURSO ON-LINE PROFESSOR: VÍTOR MENEZES

7- Probabilidade da união de dois eventos

SUMÁRIO 1. AULA 6 ENDEREÇAMENTO IP:... 2

Solução da prova da 1 a fase OBMEP 2008 Nível 1

QUADRADO MÁGICO - ORDEM 4

QUESTÃO 1 ALTERNATIVA B

RESOLUÇÃO DAS QUESTÕES DE RACIOCÍNIO LÓGICO-MATEMÁTICO

Atividade 4 - Acerte no alvo

Lista 2 - Probabilidade. Probabilidade. 1. Uma letra é escolhida entre as letras da palavra PROBABILIDADE

ATENÇÃO: Escreva a resolução COMPLETA de cada questão no espaço reservado para a mesma.

Integrais Duplas e Coordenadas Polares. 3.1 Coordenadas Polares: Revisão

Contagem II. Neste material vamos aprender novas técnicas relacionadas a problemas de contagem. 1. Separando em casos

Este material traz a teoria necessária à resolução das questões propostas.

Contagem I. Figura 1: Abrindo uma Porta.

Batalha Naval Algoritmos de Busca. Correlações curriculares Matemática: Números: maior que, menor que, iguais a.

Estatística II Antonio Roque Aula 9. Testes de Hipóteses

4 Segmentação Algoritmo proposto

3 0 0 A 120 incorreto A 130 incorreto A 200 incorreto 5 A 100 correto B 110 incorreto B 111 correto C 200 correto D 300 incorreto

Geometria Área de Quadriláteros

Introdução à Probabilidade e Estatística

IBM1018 Física Básica II FFCLRP USP Prof. Antônio Roque Aula 6. O trabalho feito pela força para deslocar o corpo de a para b é dado por: = =

casa. Será uma casa simples, situada em terreno plano, com sala, dois quartos, cozinha, banheiro e área de serviço.

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ

Ivan Guilhon Mitoso Rocha. As grandezas fundamentais que serão adotadas por nós daqui em frente:

Canguru Matemático sem Fronteiras 2014

CAPÍTULO 04 NOÇÕES DE PROBABILIDADE

RESUMO TEÓRICO. n(a) P(A) = n(u) 0 P(A) 1

Regra do Evento Raro p/ Inferência Estatística:

Jogos. Redes Sociais e Econômicas. Prof. André Vignatti

Lógica Indutiva. Aula 4. Prof. André Martins

Resoluções comentadas de Raciocínio Lógico e Estatística - SEPLAG EPPGG

É possível que cada pacote tenha: ( ) 2 ( ) 3 ( ) 4 ( ) 5 ( ) 6 ( ) 7 ( ) 9 ( ) Circule as frações equivalentes: 03- Escreva:

LISTA DE EXEMPLOS - PROBABILIDADE

Fundamentos da Matemática

Transcrição:

Capítulo 4 Contagem, Probabilidade e Estatística 145

146

O problema dos discos Adaptado do artigo de Roberto Ribeiro Paterlini Temos aplicado o problema do jogo dos discos em classes de estudantes de Licenciatura em Matemática e temos acompanhado colegas professores que o tem aplicado no ensino médio e fundamental. O problema tem feito muito sucesso. O problema do jogo dos discos Uma escola estava preparando uma Feira de Ciências e foi pedido aos estudantes que bolassem um jogo que servisse para arrecadar fundos. Os estudantes observaram que no salão da Feira o piso era feito com quadrados de 30 cm de lado, desses quadrados de Paviflex. Pensaram então em construir discos de papelão de um certo diâmetro d que seriam comprados pelos visitantes por R$ 1,00 cada um. O visitante jogaria o disco aleatoriamente no piso. Se o disco, depois de pousar no piso, tocasse um lado de um quadrado, ele perderia para a escola o que tinha pago. Se, ao contrário, acertasse o disco inteiramente dentro de um quadrado, ele receberia R$ 2,00 (R$ 1,00 como devolução e mais R$ 1,00 como prêmio). 147

O problema dos estudantes consistia em determinar o diâmetro d dos discos de modo que o jogo resultasse favorável à escola. Observaram que quanto menor d, melhor para o jogador, e quanto maior d, melhor para a escola. O favorecimento para a escola não deveria ser exagerado, pois, se o jogo fosse muito desfavorável para o jogador, ninguém iria querer jogar. Resolveram que uma probabilidade de 60% favorável à escola seria adequada. Pergunta 1 Como determinar o valor de d que resulta em uma probabilidade de 40% favorável ao jogador e de 60% à escola? Pergunta 2 Qual será, em média, o ganho da escola se 500 discos forem vendidos na feira? Resposta da Pergunta 1 Sob condições ideais podemos supor que lançar o disco aleatoriamente no piso é o mesmo que lançar seu centro aleatoriamente. Assim, a probabilidade p de o jogador ganhar (no nosso caso 40%) é a mesma probabilidade de um ponto, lançado aleatoriamente dentro do quadrado de lado 30, cair dentro do quadrado de lado 30 d. Da definição de probabilidade geométrica temos ou Como queremos p = 40% = 0,4, obtemos No caso geral de um quadrado de lado l e probabilidade p do jogador ganhar, uma solução análoga fornece e portanto, 148

Apresentamos o gráfico de com Observe que é um zero duplo de As duas linhas pontilhadas na figura acima mostram como se obtém graficamente o valor de d tal que Resposta da Pergunta 2 Se 500 discos forem vendidos na feira, a arrecadação bruta será R$ 500,00. Supondo que em 40% das jogadas (200 jogadas) os jogadores ganhem, a escola pagará R$ 400,00. Sobrará R$ 100,00 para a escola. Comentários sobre o uso do jogo dos discos em sala de aula Participando de um projeto dos Departamentos de Matemática e Física da UFSCar tivemos a oportunidade de orientar um grupo de professores que aplicaram o problema do jogo dos discos em suas escolas. Para resolver o problema por experimentação foram construídos discos de madeirit ou de borracha com diâmetros 4, 6, 8, 10, 12 e 14 cm. Os professores observaram que devem ser feitos pelo menos 200 lançamentos para cada diâmetro e para facilitar a experiência foram feitos 10 discos de cada diâmetro. 149

d p 4 75,5% 6 68,5% 8 62% 10 50% 12 38% 14 32% Os resultados obtidos em uma classe estão dispostos na tabela acima, sendo d o diâmetro dos discos, em cm, e p a probabilidade de o jogador ganhar. No gráfico estão dispostos os pontos obtidos. Os estudantes, usando uma folha de papel quadriculado e uma régua, desenharam a curva que lhes pareceu ser a que melhor se aproximava dos pontos dados e obtiveram a solução (ligeiramente diferente do que obtivemos no gráfico). Ao fazer nosso gráfico (acima), usamos o aplicativo computacional Maple V para obter a função quadrática que mais se aproxima dos pontos dados. Acrescentamos na lista dos estudantes os pontos e A função obtida foi Resolvendo a equação em d, temos 150

Fazendo conexões No problema do jogo dos discos podemos considerar pavimentações de outros tipos para o piso onde serão lançados os discos, fazendo conexões com outras áreas da Matemática. Consideremos as pavimentações chamadas mosaicos regulares do plano, constituídas por polígonos regulares de um único tipo e satisfazendo as condições: (a) quando dois polígonos se intersectam, essa interseção é um lado ou um vértice comum; (b) a distribuição dos polígonos ao redor de cada vértice é sempre a mesma. Os únicos mosaicos regulares do plano são os constituídos por triângulos equiláteros, quadrados ou hexágonos regulares (que se reduz aos triângulos). Vamos aplicar nosso jogo dos discos a esses tipos de pavimentação. O caso de mosaicos formados por quadrados já foi estudado acima. Suponhamos que o piso do jogo dos discos seja pavimentado com peças na forma de triângulos equiláteros de lado l. Lembrando que o apótema do triângulo equilátero (raio da circunferência inscrita) vale os discos podem ter diâmetro d tal que 0 < d < 2a, ou seja, No interior do triângulo equilátero de lado l dispomos um triângulo equilátero de lado t, com lados paralelos ao triângulo maior, de modo que a distância entre o lado do triângulo maior ao lado paralelo do triângulo menor seja 151

Podemos verificar que a relação entre l e t é Lembrando que a razão entre as áreas de duas figuras semelhantes é igual à razão entre os quadrados dos lados, a probabilidade de um disco de diâmetro d, lançado aleatoriamente no piso, cair inteiramente dentro do triângulo de lado l é Resolvendo a equação P(d) = p em d, temos Como, temos Essa é a solução do jogo dos discos para o caso de o piso ser pavimentado com triângulos equiláteros. Nota histórica sobre Buffon e o problema dos ladrilhos Georges Louis Leclerc, Conde de Buffon, nasceu em 7 de setembro de 1707, em Montbard, na França, e morreu em 16 de abril de 1788, em Paris. Nascido na aristocracia, estudou Medicina e Direito. Mostrou interesse pela Matemática, tendo descoberto sozinho a Fórmula do Binômio e mantido correspondência com Cramer sobre Mecânica, Geometria, Probabilidade, Teoria dos Números e Cálculo Diferencial e Integral. Mas era a Natureza a sua paixão. Dedicou-se principalmente à História Natural, tendo sido o maior responsável pelo crescimento do interesse pela História Natural na Europa, no século XVIII. No século XVIII acreditava-se que Deus havia criado as espécies separadamente, isto é, de modo independente umas das outras, e que a idade da Terra seria de no máximo 6 000 anos. Em sua História Natural, uma enciclopédia que continha todo o conhecimento da época sobre a natureza, Buffon apontava, 100 anos antes de Darwin, as semelhanças entre homens e macacos e até mesmo sugeria a existência de 152

um ancestral comum. Em As Épocas da Natureza (1788), sugeria que a idade da Terra era muito maior que os 6 000 anos até então a ela atribuídos. O 4 o volume do Suplemento à História Natural, publicado em 1777, tem 3 de suas 35 seções dedicadas ao Cálculo de Probabilidades. Uma delas é Sur le jeu de franc-carreau (Sobre o jogo do ladrilho), na qual Buffon discute o jogo do ladrilho e apresenta o Problema da Agulha. Foi o primeiro escrito sobre o que hoje se conhece por Probabilidade Geométrica. O jogo do ladrilho Era bastante jogado pelas crianças francesas no século XVIII. Uma pequena moeda de raio R é lançada ao acaso em um chão coberto por ladrilhos quadrados de lado l (l > 2r). As crianças apostavam que a moeda cairia inteiramente dentro de um ladrilho ou que a moeda cairia atravessando o lado de algum ladrilho. Buffon notou que a probabilidade de a moeda cair inteiramente dentro de um ladrilho era a probabilidade de o centro da moeda cair dentro de um quadrado de lado l 2r. Essa probabilidade é a razão entre as áreas do quadrado e do ladrilho, pois a probabilidade de o centro da moeda cair em uma região é proporcional à área dessa região. Portanto, a probabilidade de a moeda cair inteiramente dentro de um ladrilho é 153

Intuição e probabilidade Adaptado do artigo de Raul F. W. Agostino De tudo que ensinamos aos nossos alunos, os assuntos que despertam mais interesse são os que envolvem situações do cotidiano. Nestes tempos de AIDS, o problema a seguir tem servido de boa fonte de motivação e participação, em sala de aula. Num país, 10% da população é portadora de um vírus. Um teste para detectar ou não a presença do vírus dá 90% de acertos quando aplicado a portadores e dá 80% de acertos quando aplicado a não portadores. Qual o percentual de pessoas realmente portadoras do vírus, dentre aquelas que o teste classificou como portadoras? Vejamos uma solução que pode ser dada sem citar teoremas de Probabilidade ou Estatística. Considere que o teste foi aplicado aos I habitantes do país. O número de testes que indicou a presença do vírus foi: 0,9 14243 0,1 I + 0, 14243 2 0,9 I = 0, 09I + 0,18I = 0, 27 I. 90% dos que realmente 20% dos não portadores são portadores 154

Destas, são portadoras 0,09I. Assim, são realmente portadoras do vírus 0,09I/0,27I = 1/3 33,3% das pessoas que o teste classificou como portadoras. Esse número é no mínimo curioso e mostra que uma pessoa que fez o teste e foi classificada como portadora tem grande possibilidade de ser um falso-positivo (normalmente, quando uma pessoa faz um teste desse tipo e o resultado é positivo, os médicos recomendam um novo teste). No entanto, o número de testes que indicaram a ausência do vírus foi 0,73I e, dentre esses, 0,72I não são portadores, o que dá 0,72I / 0,73I = 98,6% de não portadores dentre os classificados como não portadores. Algumas variações nos dados também originam resultados interessantes. Por exemplo: Se 0,5% da população é portadora e o teste acerta em 98% dos casos, então somente 20% das pessoas que o teste classificou como portadoras são realmente portadoras. Dependendo dos objetivos, pode-se a partir daí enunciar o conceito de probabilidade condicional ou mesmo desenvolver tópicos em Estatística; no entanto, a grande qualidade desse problema é apresentar uma situação de real interesse dos nossos alunos, com uma abordagem bastante intuitiva. Nota Esperamos que nenhum leitor use este artigo como justificativa para não se submeter a testes e exames clínicos solicitados por seu médico. O que o exemplo permite concluir é que, como todo teste está sujeito a erros, dificilmente se justifica a sua aplicação indiscriminada a toda uma população. É importante observar, no entanto, que, quando o médico pede exames, ele tem razões para suspeitar que exista algo errado com o paciente e, portanto, a probabilidade condicional de que ele esteja doente é, em geral, bem maior do que a incidência da doença na população toda. 155

Média e média das médias Adaptado do artigo de Adilson Simonis Cláudio Possani Os Parâmetros Curriculares Nacionais (PCNs) preconizam que se aborde, desde o ensino fundamental, noções básicas de Estatística. Pretende-se que o estudante seja confrontado com situações concretas de análise de dados através de gráficos ou tabelas, introduzindo conceitos fundamentais para a compreensão dos fenômenos do dia-a-dia. Entre esses conceitos, um de vital importância é a média de uma seqüência de valores numéricos. Nosso objetivo neste artigo é pontuar alguns aspectos desse conceito que possam ser úteis ao professor de Matemática. Existem várias noções de média aritmética, geométrica, harmônica, simétrica, etc. Vamos nos ocupar, neste artigo, da média aritmética, que passamos a denominar apenas média. Dados os números (não necessariamente distintos), a média desses valores é definida como sendo Uma dúvida muito freqüente acerca das médias é a seguinte: se temos duas seqüências de números A 1 e A 2 com médias μ 1 e μ 2, respectivamente, e 156

queremos obter a média da união dessas seqüências, é correto fazer (μ 1 + μ 2 )/2 ou devemos somar todos os números e dividir pelo número total de valores? Esses dois procedimentos levam ao mesmo resultado? Vejamos através de um exemplo que os resultados podem ser diferentes. Suponha que um professor peça a cada um de seus alunos que calcule a idade média de sua própria família, e imaginemos a seguinte situação: Aluno A Aluno B Pai: 40 anos Pai: 39 anos Mãe: 37 anos Mãe: 40 anos A: 13 anos B: 12 anos Irmão: 10 anos Irmã: 9 anos A idade média da família de A é μ 1 = (40 + 37 + 13)/3 = 30 anos, e da família de B é μ 2 = (39 + 40 + 12 + 10 + 9)/5 = 22 anos. Observemos agora os valores: (μ 1 + μ 2 )/2 = 26 e μ 3 = (40 + 37 + 13 + 39 + 40 + 12 + 10 + 9)/8 = 25. Primeiramente salientamos que não cabe dizer que um procedimento é mais correto que o outro. Cada um deles tem um significado diferente e é correto no contexto adequado. O valor 26 é a média das idades médias das famílias. Assim, se estivermos interessados em saber se as famílias de uma cidade ou do Brasil são famílias jovens ou não, esse é o tipo de valor que devemos calcular. Por outro lado, se calculamos a soma total dividida pelo número total de pessoas (μ 3 ), obtemos a idade média do total de pessoas (e não de famílias). É o que fazemos para obter a idade média da população de uma cidade ou país. Um outro exemplo no qual os dois procedimentos apresentam resultados diferentes é: 157

Seqüência 1 de dados: 10, 10, 10, 10, 10, 10, 10, 10. μ 1 = 10. Seqüência 2 de dados: 5, 5. μ 2 = 5. (μ 1 + μ 2 )/2 = (10 +5)/2 = 7,5 e μ 3 = 9. Ao calcular 7,5, os dois valores, 10 e 5, aparecem com o mesmo peso, enquanto o cálculo de μ 3 reflete o fato de o valor 10 aparecer mais vezes na primeira seqüência do que o valor 5 aparece na segunda. É fácil ver que, se duas seqüências numéricas, A 1 e A 2, têm o mesmo número de elementos, então os dois procedimentos descritos anteriormente fornecem valores iguais. De fato, sejam A 1 = {x 1,..., x n } e A 2 = {y 1,..., y n }. Então Vamos mostrar agora como se procede para avaliar a média quando não são conhecidos todos os elementos da seqüência numérica. Em um determinado conjunto ou seqüência de valores numéricos, dois parâmetros são de especial interesse. Ambos são médias e podem surpreender pela quantidade de informação que podemos obter a partir deles sobre a totalidade dos valores numéricos que temos. O primeiro é a média, e o segundo a variância, definida como sendo a média dos quadrados das diferenças entre cada valor e a média. Vamos exemplificar esses dois conceitos. Considere a seguinte seqüência numérica que denotamos por : = {2, 3, 3, 10, 12}. A média é dada pelo valor 6. Essa quantidade expressa um certo centro de gravidade da seqüência, mas certamente nos informa muito pouco sobre como a seqüência é formada. Se você sabe que a seqüência numérica não é constante, pode apostar que existem valores menores e maiores, centrados em 6, mas não pode dizer muito mais do que isso, embora 158

saber que a média dos salários dos políticos brasileiros é alta possa ajudar a entender por que existem tantos candidatos a determinado cargo público. Se a seqüência representa o salário (em salários mínimos) de 5 professores de Matemática, e considerando que dois ou três salários mínimos não representam um bom salário, você tem que 3 dentre os 5 ganham mal e abaixo da média. Como tentar incorporar essa variabilidade em relação ao valor médio? É o conceito de variância, denotada por σ 2, que tenta expressar a dispersão dos valores em torno da média. O valor 2 (do professor com o salário mais modesto) tem uma distância a μ, ao quadrado, dada por (2 6) 2 = 16, enquanto o valor 12 (o marajá do grupo) tem a distância ao quadrado de μ dada por (12 6) 2 = 36. Fazendo a média de todas as distâncias ao quadrado, encontramos Como essa distância média fornece os valores dos quadrados dos salários, é usual retornar ao velho, estável e bom salário mínimo tomando a raiz quadrada, e teremos então o valor conhecido como desvio padrão. O que significa o desvio padrão dado no exemplo por? A resposta informal que daremos aqui ficará interessante se imaginarmos um conjunto com centenas de valores (os salários dos professores de Matemática no Brasil, por exemplo) e não apenas os cinco do nosso exemplo. Temos que o valor médio das diferenças, em módulo, entre os valores e sua média é dado por O desvio padrão σ possui uma interpretação muito próxima do valor obtido acima (4) e expressa a idéia de concentração ou não em torno da média. A escolha de σ tem vantagens computacionais em relação à média dos módulos e talvez por isso o seu uso seja muito difundido... 159

O intervalo (μ σ; μ + σ) = (6 4,15; 6 + 4,15) = (1,85; 10,15), que no nosso exemplo exclui apenas o marajá, é amplamente utilizado em estatística aplicada quando o conjunto de valores é grande, e podemos argumentar que nesse caso contempla aproximadamente 70% das observações, enquanto o intervalo (μ + 3σ, μ 3σ) contempla aproximadamente 99% das observações. Podemos considerar o desvio padrão discutido como uma medida de dispersão dos dados, isto é, quanto menor σ 2, mais concentrados em torno da média estão as observações. Quando os jornais afirmam que a distribuição de renda dos trabalhadores brasileiros (e não apenas dos professores) é injusta, no fundo, afirmam que a variância é grande. Muitos pobres (professores?) e poucos ricos (políticos?). Por outro lado, se σ 2 = 0, teríamos todos os valores iguais e, como disse Nélson Rodrigues, a unanimidade é burra. 160

Número de regiões: um problema de contagem Adaptado do artigo de Antônio C. Patrocínio Muitos problemas em Matemática envolvem processos adequados de contagem que, freqüentemente, conduzem a fórmulas gerais extremamente úteis; por exemplo, para contar de quantas maneiras distintas podemos combinar n objetos em grupos de r desses objetos, usamos a conhecida fórmula que dá o número de combinações de n objetos tomados r a r, a saber: Vamos analisar um problema de contagem do número de regiões no plano que pode ser resolvido de maneira direta, simples e interessante. Trata-se do seguinte: Considere 100 pontos distribuídos sobre uma circunferência, de tal modo que o segmento ligando dois quaisquer desses pontos não passe pelo ponto de intersecção de outros dois segmentos. Calcular o número R de regiões obtidas no círculo quando todos os 100 pontos estiverem ligados. 161

Inicialmente, tentamos resolver o problema com um número menor de pontos. Examinando os casos 2, 3, 4 e 5 pontos, temos: Figura 1 Observamos que: com 2 pontos temos 2 1 regiões; com 3 pontos temos 2 2 regiões; com 4 pontos temos 2 3 regiões; com 5 pontos temos 2 4 regiões. Os resultados levam a acreditar que 6 pontos fornerceriam 2 5 = 32 regiões, logo 100 pontos forneceriam 2 99 regiões, e, por analogia (incorreta, como veremos) n pontos determinariam 2 n-1 regiões! Mas, ao verificar diretamente o que acontece com 6 pontos, vemos que ficam determinadas 31 regiões, e não 32. Logo, a generalização pretendida não é verdadeira. Figura 2 Como determinar uma fórmula que forneça o número de regiões obtidas com 100 (ou um outro número qualquer) pontos? 162

Solução 1 Os segmentos ligando dois a dois os 100 pontos serão chamados diagonais ; como para cada dois pontos temos uma diagonal, o número delas é, e o número de pontos de intersecção das diagonais é, visto que cada 4 pontos determinam duas diagonais, as quais têm um ponto em comum. Vamos descrever um processo que nos permite obter o número de regiões pela eliminação sucessiva de diagonais. Ao retirarmos uma das diagonais, o número de regiões vai diminuir, visto que duas regiões que têm em comum um segmento da diagonal retirada fundem-se em uma única região. Por exemplo, na figura 2, a retirada da diagonal D 12, que liga os pontos 1 e 2, faz com que as regiões A e B se transformem em uma única região; a retirada da diagonal D 35 transforma em quatro as oito regiões que têm partes dessa diagonal como arestas. Podemos observar que, ao retirarmos uma diagonal, o número de regiões decresce conforme o número de pontos de intersecção dessa diagonal com aquelas que ainda não foram removidas, mais um. Com efeito, esse é o número de segmentos nos quais os referidos pontos de intersecção dividem a diagonal, e a remoção de cada um desses segmentos transforma duas regiões em uma. Assim, a remoção da diagonal D 12, que não tem ponto de intersecção com as demais, produz um decréscimo de apenas um no número total de regiões; já a retirada da diagonal D 35, que tem 3 pontos de intersecção com as demais diagonais, produz um decréscimo de 4 regiões. Notemos que, no processo de retirada sucessiva das diagonais, considera-se o número de pontos de intersecção de cada diagonal com aquelas que ainda não foram retiradas; no final do processo, ao serem retiradas, sucessivamente, todas as diagonais, tal número é igual ao número total de pontos de intersecção de todas as diagonais, ou 163

seja ; ao mesmo tempo, o número de regiões decresce até reduzir-se a uma única região, quando todas as diagonais tiverem sido eliminadas. Podemos então concluir que o número de regiões eliminadas no processo de retirada sucessiva de todas as diagonais é dado pelo número total de pontos de intersecção de todas as diagonais, ou seja,, acrescido de tantas parcelas iguais a 1 quantas são as diagonais, ou seja,. Portanto, o número inicial de regiões, que é igual ao número de regiões eliminadas mais uma, a que restou no final do processo, é dado por Observe que, para n pontos, temos a mesma expressão, apenas trocando o 100 por n. E, para 6 pontos, a fórmula obtida fornece, como havíamos verificado! Solução 2 Em Geometria, uma das fórmulas mais notáveis é a chamada fórmula de Euler, que estabelece uma relação entre o número de vértices, arestas e faces de um poliedro: V A + F = 2. Mostraremos, em seguida, como a fórmula que fornece o número de regiões determinadas por n pontos pode ser obtida a partir da fórmula de Euler; o que era de se esperar, pois a demonstração mais conhecida da fórmula de Euler, devida a Cauchy, começa removendo uma face do poliedro e deformando a parte restante em uma região plana que é um polígono subdividido pelas arestas do poliedro. 164

Para poliedros planos, como o da figura 2, obtidos pela interligação de n pontos na circunferência, a fórmula de Euler se reduz a V A + F = 1. (1) Vamos calcular, separadamente, V, A e F em função de n e substituílos na fórmula (2) para obter R n. Cálculo do número de vértices Para cada 4 vértices na circunferência existem dois, e apenas dois, segmentos que se cruzam, e portanto determinam um vértice interno, de modo que o número desses vértices é, ou seja: Cálculo do número de arestas Cada vértice externo contribui com (n 1) arestas, e cada vértice interno com 4 arestas, de modo que: (2) e, portanto, (3) Cálculo do número de regiões O número R n é obtido acrescentando-se a F o número n de regiões compreendidas entre o poliedro plano e a circunferência, de modo que F = R n n. (4) Basta agora substituir (2), ( 3) e (4) na fórmula (1) para se obter o valor de R n, na mesma expressão da solução 1. 165

Probabilidade geométrica e o problema do macarrão Adaptado do artigo de Eduardo Wagner No ensino médio, o ensino de probabilidades se restringe ao caso finito, e os problemas são basicamente de contagem de casos favoráveis e casos possíveis. Existem, entretanto, problemas muito simples e interessantes de probabilidades em que o espaço amostral possui a situação do seguinte exemplo: um atirador, com os olhos vendados, procura atingir um alvo circular com 50 cm de raio, tendo no centro um disco de 10 cm de raio. Se em certo momento temos a informação de que o atirador acertou o alvo, perguntamos qual deve ser a probabilidade de que tenha atingido o disco central. Tenho sugerido esse problema a alunos do ensino médio e freqüentemente obtenho deles respostas corretas, baseadas unicamente na intuição. Como obviamente não se pode contar casos favoráveis e possíveis, e como para o atirador cego não há pontos privilegiados do alvo, a probabilidade de acertar o disco central deve ser a razão entre as áreas do disco e do alvo. Um cálculo elementar leva à resposta correta: 4%. 166

Esse é um exemplo do que se chama probabilidade geométrica. Nesta, se tivermos uma região B do plano contida em uma região A, admitimos que a probabilidade de um ponto de A também pertencer a B é proporcional à área de B e não depende da posição que B ocupa em A. Portanto, selecionado ao acaso um ponto de A, a probabilidade de que ele pertença a B será: Em diversos problemas, entretanto, precisaremos escolher um ponto de uma determinada linha. Se X e Y são pontos de uma linha de extremos A e B, admitimos que a probabilidade de que um ponto da linha AB pertença à linha XY (contida em AB) é proporcional ao comprimento de XY e não depende da posição dos pontos X e Y sobre AB. Portanto, selecionado um ponto de AB, a probabilidade de que ele pertença a XY será Vamos descrever neste artigo um problema em probabilidade geométrica, conhecido hoje como o problema do macarrão. Antes de abordá-lo, vamos falar alguma coisa sobre freqüência e probabilidade. Freqüência e probabilidade Na prática, existem inúmeros problemas em que precisamos estimar a probabilidade de um evento, mas não podemos calculá-la. Qual é a probabilidade de um avião cair? Qual é a probabilidade de que um carro seja roubado? Qual é a probabilidade de que um estudante, entrando numa universidade, termine seu curso? Respostas para esses problemas têm imensa importância e, como não podemos calcular essas probabilidades, tudo o que podemos fazer é observar com que freqüência 167

esses fatos ocorrem. Com um grande número de observações, dividindo o número de vezes que determinado fato ocorreu pelo número de observações feitas, obtemos uma estimativa da probabilidade desse evento. Nos casos em que procuramos estimar probabilidades por meio de experiências, dúvidas certamente surgem. Não estamos sendo de alguma forma tendenciosos? Os experimentos foram realizados em condições idênticas? Eles podem ser considerados como independentes? Vamos mostrar um caso no qual o valor estimado e o valor teórico foram bastante diferentes. O problema do macarrão Durante um curso de aperfeiçoamento de professores de Matemática do ensino médio, promovido pelo IMPA, RJ, fiz uma interessante experiência, que passo a relatar. Em uma aula com 60 professores, distribuí um espaguete a cada um deles. Sem que eles soubessem o que iria ocorrer, pedi a cada um que partisse o espaguete, ao acaso, em três pedaços. Em seguida, pedi que cada um verificasse se conseguiam formar um triângulo com os seus três pedaços. Dos 60 professores, 41 conseguiram formar um triângulo com os três pedaços do espaguete. Escrevi no quadro um problema: Dividindo aleatoriamente um segmento em três partes, qual é a probabilidade de que esses novos segmentos formem um triângulo? Ninguém imaginava na ocasião como esse problema poderia ser resolvido, mas a experiência feita com o macarrão indicava que essa probabilidade deveria ser estimada em 41/60 0,68. É claro que 60 experiências é pouco para que se possa confiar no resultado, mas era opinião geral que a resposta correta não deveria ser muito distante 1 x y. 168

Uma solução do problema Tomemos um segmento de reta AB de comprimento 1. Vamos dividilo em três partes: uma, AP, de comprimento x, outra PQ, de comprimento y e a terceira, QB, naturalmente com comprimento. Cada forma de dividir o segmento unitário fica então associada ao par ordenado (x, y) onde x > 0, y > 0 e x + y < 1. Isso corresponde, no plano cartesiano, à região triangular que mostramos ao lado. Portanto, cada forma de dividir um segmento em três partes está agora representada por um ponto interior ao triângulo da figura. Entretanto, não são todas as divisões que formam triângulos. Um triângulo existe se, e somente se, cada lado for menor que a soma dos outros dois. Isso é equivalente a dizer que, em um triângulo, cada lado é menor que o seu semiperímetro, que no nosso caso é igual a 1/2. Temos, portanto, A última condição é naturalmente equivalente a e, reunindo as três, temos que a região favorável é o interior do triângulo formado pelos pontos médios dos lados do triângulo inicial. 169

Ora, o triângulo formado pelos pontos médios tem área igual a 1/4 da área do triângulo grande, o que nos leva a concluir que a probabilidade de que os três segmentos formem um triângulo é 0,25. Esse resultado causou espanto na platéia. Por que a experiência forneceu um resultado tão distante? A resposta está na própria realização da experiência. Quando pedi aos professores que dividissem o espaguete ao acaso, em três partes, isso não foi feito aleatoriamente. Ninguém fez uma parte muito pequena em relação às outras, ou seja, a maioria partiu seu espaguete em pedaços de comprimentos próximos. Por isso, o resultado da experiência ficou muito distante do esperado. 170

O jogo de pôquer e o cálculo de probabilidades Adaptado do artigo de Flávio Wagner Rodrigues O jogo de pôquer é uma fonte bastante rica em exemplos e problemas interessantes, que podem ser utilizados para ilustrar aulas de Análise Combinatória e Probabilidade no ensino médio. Neste artigo serão apresentados alguns exemplos que servirão para mostrar como a hierarquia dos valores dos jogos no pôquer pode ser afetada pelo número de cartas utilizadas no jogo. Em benefício dos leitores que desconhecem totalmente o assunto (e que tiveram curiosidade suficiente para iniciar a leitura), daremos uma breve descrição das regras e dos objetivos do jogo. Essa descrição limitar-se-á a considerar a forma clássica do jogo, o assim chamado pôquer fechado de 5 cartas. No Brasil, o jogo utiliza um baralho comum de 52 cartas ou apenas uma parte dele, dependendo do número de parceiros envolvidos. Assim, por exemplo, quando o número de participantes é igual ou inferior a quatro, são eliminadas do baralho todas as cartas, cujos valores são 2, 3, 4, 5 e 6, restando as trinta e duas cartas cujos valores vão do 7 171

até o Ás. Na medida em que o número de participantes vai aumentando, as cartas de valor 6, 5, 4 etc., vão sendo introduzidas, até que com oito participantes, o baralho todo é utilizado. Na formação de seqüências, o Ás tem um duplo papel, funcionando como a carta mais alta e também como a carta de menor valor. Assim, por exemplo, se a menor carta em jogo é o 7, numa seqüência o Ás poderá valer 6. O objetivo do jogo é combinar as cartas de modo a formar o melhor jogo possível, segundo uma hierarquia estabelecida pelas regras. Na primeira etapa do jogo cada participante recebe cinco cartas, seguindo-se uma rodada de apostas, que obedece a um conjunto de regras que não interessam aos objetivos deste artigo. A seguir é facultado a cada jogador desfazerse de até no máximo três de suas cartas, recebendo novas, dentre aquelas que restaram no baralho. É a chamada fase das pedidas. Após uma nova rodada de apostas, os participantes que permaneceram no jogo, isto é, que pagaram todas as apostas feitas, mostram suas cartas, e o dinheiro arrecadado vai para aquele que tiver o maior jogo. Do ponto de vista do cálculo de probabilidades, existem, portanto, dois problemas distintos a serem considerados. O primeiro deles envolve as probabilidades de que determinadas combinações de cartas sejam obtidas de mão, isto é, estejam contidas nas cinco cartas recebidas na primeira fase do jogo. O segundo, bem mais complexo, envolve as probabilidades de se melhorar o jogo na fase das pedidas, o que não será tratado neste artigo. A seguir daremos uma descrição dos jogos em ordem decrescente de seus valores. Alguns nomes foram mantidos em inglês, por já estarem consagrados pelo uso e também por não conhecermos uma tradução adequada. 1) Royal Straight Flush É uma seqüência formada por um 10, um valete, uma dama, um rei e um Ás, todos de um mesmo naipe. Existem apenas quatro royal straight 172

flushes no jogo, sendo um de cada naipe. Utilizando 36 cartas, a chance de recebermos um royal de mão é de apenas uma em 94248. Para aqueles que acharem essa probabilidade muito pequena, é importante notar que ela é cerca de três vezes maior do que a de acertarmos a quina da Loto, com um jogo de 10 dezenas. 2) Straight Flush É qualquer seqüência de cartas de um mesmo naipe que não seja um royal. Com 36 cartas, o Ás pode ocupar o lugar do 5, o que nos dará um total de 20 straight flushes. Com o baralho todo, o número de jogos deste tipo é igual a 36. 3) Quadra É o jogo formado por quatro cartas de mesmo valor e de uma quinta carta qualquer. Assim, por exemplo, uma quadra de reis poderia ser formada pelos 4 reis e por uma dama. 4) Flush É um conjunto de cartas de um mesmo naipe que não estão em seqüência. Assim, por exemplo, um flush de espadas poderia ser formado pelo 7, 9, Valete, Dama, Ás, todos de espadas. 5) Fullhand É o jogo composto por uma trinca (três cartas de mesmo valor) e um par (duas cartas de mesmo valor). Assim, por exemplo, um fullhand de dama com valete é formado por três damas e dois valetes. É um jogo distinto do fullhand de valete com dama, que é composto por três valetes e duas damas. 6) Seguida É o jogo composto por 5 cartas em seqüência, nem todas do mesmo naipe. Exemplo: 9 de ouros, 10 de paus, valete de copas, dama de ouros, rei de paus. 173

7) Trinca É o jogo composto por três cartas de mesmo valor (por exemplo, três reis) e duas outras cartas quaisquer, que não formam par e que tenham valores distintos das cartas que compõem a trinca. Exemplos: 1) 9, 9, 9, D, R; 2) V, V, V, 7, 10. 8) Dois pares Como o próprio nome indica, é o jogo composto por dois pares e por uma quinta carta de valor distinto daquelas que compõem os dois pares. Exemplo: A, A, R, R, 8. 9) Um par É o jogo composto por um único par e por três outras cartas de valores distintos entre si e distintos daquelas que compõem o par. Exemplo: 7, 7, 8, V, D. 10) Nada de interesse São todos os jogos pertencentes ao complementar da união dos jogos descritos acima. Se você receber um jogo deste tipo não se julgue um infeliz perseguido pelos deuses. A probabilidade de que isso ocorra é bastante alta, indo de cerca de 25%, com 32 cartas, até mais de 50% quando todo o baralho é utilizado. Na descrição acima foram apresentados alguns resultados de contagens de totais de jogos de um determinado tipo e foram feitas afirmações sobre as probabilidades de obtenção de outros jogos. Nos exemplos seguintes procuraremos mostrar como são feitos esses cálculos. Em todos eles suporemos que estão sendo usadas 32 cartas, das quais um particular jogador receberá cinco escolhidas ao acaso, através do embaralhamento. Em outras palavras, estamos admitindo que os jogos possíveis têm todos a mesma probabilidade. 174

Exemplo 1 Contagem do número de fullhands Vamos iniciar com um problema mais simples, contando o número de fullhands de rei com dama, isto é, o número de jogos formados por três reis e duas damas. Observe que os três reis podem ser escolhidos de maneiras diferentes, enquanto as duas damas podem ser escolhidas de maneiras diferentes. Como cada uma das quatro trincas pode ser combinada com qualquer um dos seis pares para formar um fullhand de rei com dama, segue-se que existem 4 x 6 = 24 jogos distintos deste tipo. A próxima etapa será calcularmos quantos tipos distintos de fullhands existem. Para isto, vamos observar que dentre os oito grupos de cartas de mesmo valor, nós teremos que escolher um, no qual será selecionada a trinca, e um outro, do qual sairá o par. Para a primeira escolha existem 8 possibilidades e para a segunda, apenas 7, o que nos dá 8 x 7 = 56 tipos distintos de fullhands. Como cada um deles admite 24 jogos diferentes, segue-se que o total de fullhands é igual a 1344. A probabilidade de recebermos um fullhand de mão será portanto dada por: 1344/201376 0,67%. Exemplo 2 Contagem do número de flushes Vamos considerar inicialmente flushes de ouros. Existem oito cartas de ouros, dentre as quais podemos selecionar conjuntos distintos de cinco cartas. Como o mesmo raciocínio pode ser feito para os outros três naipes, teríamos aparentemente 56 4 = 224 flushes. No entanto, é fácil ver que neste total estão incluídos os quatros royal straight flushes e os 16 straight flushes. Segue-se portanto que, com 32 cartas, existirão 204 flushes puros. 175

Exemplo 3 Contagem do número de trincas Esse cálculo pode ser feito diretamente, de maneira análoga à que foi utilizada para contar o número de fullhands. No entanto, como este número já foi obtido, podemos utilizá-lo para contar o número de trincas de um modo indireto e mais rápido. Vamos escolher uma das quatro trincas de reis e combiná-la com duas cartas quaisquer escolhidas entre as 28 que restam, quando excluímos os quatro reis. Isto nos dará um total de jogos. Levando em consideração as demais trincas, teríamos 8 1512 = 12096 jogos. Neste total não existem quadras, pois o grupo que fornece a trinca é todo ele excluído na seleção seguinte. No entanto, é claro que nele estarão incluídos todos os fullhands. Subtraindo 1344 de 12096 encontraremos para o total de trincas o valor 10752, o que nos dará para a probabilidade de obtenção de uma trinca de mão, o valor aproximado de 5,4%. O leitor que comparar o ranking dos jogos encontrado na Enciclopédia Britância com o nosso verá que há uma inversão de posições entre o fullhand e o flush. Isto se deve ao fato de que lá a descrição está baseada na utilização do baralho completo, o que torna o flush mais fácil de ser obtido de mão do que o fullhand. É interessante observar ainda que com 32 cartas o flush é mais difícil de ser obtido de mão do que uma quadra. Essa mudança no valor relativo dos jogos, que será mostrada nos exemplos seguintes, deve-se ao fato de que os jogos não têm todos a mesma natureza. É claro que nenhuma mudança no número de cartas poderia fazer com que uma quadra ficasse mais fácil de ser obtida do que uma trinca. Jogos como a quadra, o fullhand e a trinca dependem de seleções feitas nos conjuntos de cartas de mesmo valor, enquanto um jogo como o flush depende de escolhas feitas nos conjuntos de cartas de mesmo naipe. É razoável portanto que uma mudança no número de cartas faça com que as probabilidades 176

variem num mesmo sentido, mas não necessariamente com a mesma intensidade. Exemplo 4 Cálculo do número de quadras Utilizando 32 cartas, uma quadra de reis é um jogo formado pelos quatro reis e por uma quinta carta escolhida dentre as 28 restantes. Existem portanto 28 jogos que contêm uma quadra de reis. O mesmo raciocínio aplicado às demais cartas nos permite concluir que com 32 cartas teremos um total de 8 x 28 = 224 quadras. Vimos no Exemplo 2 que o número de flushes puros é de apenas 204, o que justifica a nossa observação de que, com 32 cartas, o flush é mais difícil de ser obtido de mão do que a quadra. Observação A situação se inverte quando passamos a usar 36 cartas. Adaptando os cálculos feitos nos exemplos 2 a 4 para essa situação, vemos que o número de quadros passa a ser 288, enquanto que o número de flushes será igual a 480. Exemplo 5 Número de flushes e fullhands com 52 cartas (a) Quando o baralho todo é utilizado, o número de cartas de ouros é igual a 13, existindo portanto conjuntos distintos de cinco cartas de ouros. Considerando os demais naipes, teríamos um total de 4 1287 = 5148 jogos. Subtraindo deste total os 4 royal straight flushes e os 36 straight flushes, teremos um total de 5108 flushes puros. (b) É fácil ver que para cada tipo de fullhand continuaremos a ter 24 jogos possíveis. Agora, no entanto, dispomos de 13 grupos de cartas de mesmo valor, o que nos dará 13 12 = 156 tipos diferentes de fullhands. Portanto o número total de fullhands será 24 156 = 3744. 177

Como pode ser visto nos exemplos acima, o flush desempenha um papel curioso na hierarquia dos jogos do pôquer. Ele, que com 32 cartas é o terceiro jogo mais difícil de ser obtido, cede essa posição para a quadra a partir das 36 cartas e finalmente termina na quinta posição, cedendo a quarta para o fullhand, quando o baralho todo é utilizado. Esperamos que a discussão feita até aqui sirva de motivação e estímulo para que o leitor faça as contagens correspondentes aos demais jogos do pôquer. Um problema teórico interessante, que poderia ser proposto a estudantes curiosos, seria a análise de que outra mudanças poderiam ocorrer se o número de cartas não fosse limitado em 52. Para isto, poderíamos imaginar um baralho com quatro naipes e 4n cartas numeradas de 1 a n, com o 1 representando o duplo papel que cabe ao Ás no baralho comum. Será que existe algum valor de n a partir do qual o flush fica mais fácil de ser obtido do que uma trinca? Será que as seguidas permaneceriam sempre na mesma posição? Para concluir, vamos fazer um breve comentário sobre as probabilidades envolvidas na segunda fase do jogo, isto é, na fase das pedidas. Vamos supor que você seja o primeiro a pedir cartas num jogo com 4 participantes e que portanto restam no baralho 12 cartas. Você recebeu quatro cartas de ouros e uma de espadas (que você descartou). Qual é a probabilidade de que você consiga fechar um flush de ouros? Como a carta que você vai receber é a vigésima-primeira, o que se deseja é a probabilidade de que num conjunto de 32 cartas, bem embaralhadas, a vigésima-primeira seja uma carta de ouros. Se você não tivesse olhado suas cartas, isto é, não dispusesse de nenhuma informação adicional, a resposta a essa pergunta seria obviamente 1/4. No entanto, como você olhou suas cartas, o que precisamos é da probabilidade condicional de que a vigésima-primeira carta seja de ouros dado que entre as 20 primeiras cartas existiam pelo menos quatro cartas de ouros e pelo menos uma de espadas. 178

Eventos independentes Adaptado do artigo de Flávio Wagner Rodrigues Neste artigo são discutidos alguns aspectos ligados à noção de independência de dois eventos na Teoria das Probabilidades. Os objetivos principais são analisar o conceito formal, relacionando-o com a idéia intuitiva, que as pessoas geralmente têm sobre as relações entre os fenômenos que elas observam na sua vida diária. Vamos, inicialmente, recordar alguns conceitos básicos da Teoria da Probabilidade. A teoria tem por objetivo fornecer um modelo matemático para experimentos aleatórios, isto é, para experimentos que, repetidos em idênticas condições, produzem, geralmente, resultados distintos. A todo experimento aleatório está associado o conjunto S, chamado espaço amostral, composto por todos os resultados possíveis do experimento. Assim, considerando o lançamento de um dado, o espaço amostral naturalmente associado a este experimento é S = {1, 2, 3, 4, 5, 6}. 179

Se S é um espaço amostral finito chamamos evento a qualquer subconjunto de S e diremos que ocorreu o evento A S, quando o resultado do experimento for um elemento de A. No caso do lançamento de um lado, o evento: o resultado é par é o subconjunto A = {2, 4, 6} S, e se, ao lançarmos o dado, obtivermos 4, diremos que o evento A ocorreu. Cada subconjunto unitário de S chama-se evento elementar, isto é, se S = {x 1, x 2,..., x n } então, {x 1 }, {x 2 },... são eventos elementares. Uma probabilidade é uma função que associa a cada evento elementar {x i } um número p i, 0 p i 1, de tal modo que p 1 + p 2 +... + p n = 1. A probabilidade de um evento qualquer A S será, por definição, a soma das probabilidades dos eventos elementares contidos em A e indicaremos por P (A). Retomando o exemplo do dado e supondo agora que o lançamento seja o de um dado honesto, a cada evento elementar {1}, {2}, {3}, {4}, {5}, {6}, é associada a probabilidade 1/6. Nessas condições, se A é o evento o resultado é par, Começaremos com a definição formal de independência. À primeira vista, os exemplos poderão parecer contrários à noção intuitiva de independência. Com a introdução do conceito de probabilidade condicional e a análise de mais exemplos, esperamos deixar claro o que sejam eventos independentes, conciliando, assim, a definição formal com intuição. Definição Dois eventos, A e B, de um mesmo espaço amostral (isto é, dois eventos associados ao mesmo experimento aleatório), são independentes quando a probabilidade de que eles ocorram 180

simultaneamente for igual ao produto de suas probabilidades individuais. Em símbolos, A e B serão independentes quando: P(A B) = P(A).P(B) Exemplo 1 Considere o lançamento de um dado honesto. O espaço amostral associado e esse experimento é o conjunto formado pelos números 1, 2, 3, 4, 5, 6, e a cada um dos quais é atribuída probabilidade 1/6. Vamos considerar os eventos: A o resultado é par ; B o resultado é maior do que 4 ; C o resultado é um múltiplo de 3. Os subconjuntos do espaço amostral associados a esses eventos são respectivamente: {2, 4, 6}, {5, 6} e {3, 6}. Segue-se então que: P(A) = 1/2 e P(B) = P(C) = 1/3. Os eventos A e B (e também os eventos B e C) ocorrerão simultaneamente quando o resultado do lançamento for um 6. Segue-se que P(A Β) = P(B C) = 1/6. A comparação desses valores com os produtos das probabilidades individuais mostra que A e B são independentes enquanto que B e C são dependentes. É claro que o fato de dois eventos serem ou não independentes é determinado pelo espaço amostral e pela probabilidade definida nesse espaço. O exemplo seguinte mostra como a probabilidade escolhida afeta as relações de dependência ou independência entre eventos. Exemplo 2 Vamos considerar o lançamento de um dado ao qual está associada a seguinte distribuição de probabilidades: Resultado 1 2 3 4 5 6 Probabilidade 1/12 1/12 1/4 1/12 1/4 1/4 181

Com essa distribuição, as probabilidades dos eventos considerados no exemplo 1 terão agora os seguintes valores: É fácil ver que estamos diante da situação inversa daquela que ocorreu no Exemplo 1. Os eventos B e C são independentes, enquanto que A e B são dependentes. Observação O leitor poderá argumentar, com razão, que não é fácil transmitir a uma classe iniciante a idéia de um dado que se comporte da maneira acima. Vale lembrar, no entanto, que na realidade dos cassinos e das casas de jogos, o dado honesto do exemplo 1 talvez seja até mais fantasioso do que aquele que estamos considerando aqui. Além disso, é possível realizar esse experimento numa sala de aula, com o auxílio de uma urna e de 12 bolas numeradas com os algarismos 1, 2, 3, 4, 5 e 6, nas proporções indicadas pela distribuição de probabilidades. A retirada de uma bola dessa urna é equivalente, em termos probabilísticos, a um lançamento do nosso dado hipotético. Vamos apresentar mais um exemplo, tirado do livro Uma Introdução à Teoria das Probabilidades e suas Aplicações, de W. Feller, que mostra como a estrutura do espaço amostral afeta as relações de dependência. 182

Exemplo 3 Vamos considerar famílias com n crianças e admitir que todas as distribuições do sexo dessas crianças são igualmente prováveis. Seja A o evento: existem crianças de ambos os sexos e B o evento: existe no máximo uma menina. Pode-se verificar que no conjunto das famílias com 3 crianças, A e B são eventos independentes o que não ocorre no conjunto das famílias com 4 crianças. O leitor interessado no cálculo dessas probabilidades pode consultar a referência citada anteriormente. Com um pouco mais de trabalho, é possível mostrar ainda que A e B só serão independentes no caso n = 3. Na vida real, a independência entre dois fenômenos está associada à idéia intuitiva de que eles nada têm a ver um com o outro, não existindo entre eles nenhum tipo de relação. É natural que a descoberta da existência de algum tipo de relação entre dois fenômenos (isto é, a verificação de que eles não são independentes) seja mais importante do ponto de vista prático. Nenhum jornal abriria manchetes para afirmar, por exemplo, que a ingestão de açúcar nada tem a ver com câncer de pele. No entanto, os meios de comunicação estão sempre discutindo, entre outras, as prováveis relações entre consumo de açúcar e cárie dental e entre o excesso de exposição à luz solar e o câncer de pele. Essa idéia intuitiva explica porque os estudantes freqüentemente confundem eventos independentes com eventos mutuamente exclusivos. De fato, a eventos mutuamente exclusivos correspondem subconjuntos disjuntos do espaço amostral. A associação entre a ausência de pontos comuns e a idéia intuitiva de independência, embora falsa, chega a ser compreensível. Quando se utiliza a definição, vê-se facilmente que, a não ser em casos muitos particulares (quando ao menos um dos eventos tem probabilidade zero), eventos mutuamente exclusivos nunca são independentes. Do ponto de vista do ensino, a questão que se coloca é como apresentar num curso elementar a idéia de independência, de modo a conciliar a definição formal com as idéias intuitivas que os estudantes certamente têm 183

sobre o assunto. O caminho natural para atingirmos esse objetivo começa necessariamente pelo conceito de probabilidade condicional, que procuramos ilustrar no exemplo seguinte. Exemplo 4 Numa rifa são vendidos 100 bilhetes numerados de 00 à 99. Um único prêmio será entregue ao portador do bilhete que for escolhido por sorteio. Esse sorteio será realizado em duas etapas, utilizando-se uma urna com dez bolas numeradas de 0 a 9. Na primeira etapa, uma bola é escolhida ao acaso, obtendo-se assim o algarismo das unidades do número premiado; em seguida, essa bola é devolvida à urna, e repete-se o processo para que seja obtido o algarismo das dezenas. Vamos analisar a situação de dois indivíduos, João e Paulo, cujos bilhetes têm os números 25 e 47, respectivamente. Antes de ser iniciado o sorteio (e supondo-se que ele seja honesto), os dois têm a mesma probabilidade de sucesso, igual a 1/100. Supondo-se que a primeira bola sorteada tenha o número 7, o conjunto dos resultados possíveis do sorteio se reduz a um conjunto com dez elementos, a saber: {07, 17,..., 97}. João já pode rasgar o seu bilhete pois, suas chances de vitória se reduziram de 1/100 para 0. Por outro lado, Paulo viu sua chance multiplicada por 10, passando de 1/100 para 1/10. Seja A o evento Paulo ganha o prêmio, B o evento João ganha o prêmio e C o evento o número sorteado termina em 7. Antes da realização da primeira etapa, tínhamos: P(A) = P(B) = 1/100 e P(C) = 1/10. As probabilidades, 0 e 1/10, calculadas após a realização da primeira etapa, são denominadas probabilidades condicionais de B e A, respectivamente, dado que ocorreu o evento C. No exemplo acima, as probabilidades condicionais foram calculadas por meio da redução do espaço amostral ao conjunto C, que passou a ser o espaço associado à segunda etapa do sorteio. Probabilidades condicionais podem também ser calculadas em termos das probabilidades do espaço original, como veremos na definição abaixo. 184