Departmento de Matemática, Faculdade de Ciências e Tecnologia, Universidade Nova de Lisboa, 2829-516, Caparica, Portugal

Documentos relacionados
Capítulo 3 Modelos Estatísticos

Aula 1: Introdução à Probabilidade

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

Eventos independentes

Noções de Probabilidade

Dois eventos são disjuntos ou mutuamente exclusivos quando não tem elementos em comum. Isto é, A B = Φ

CAP5: Amostragem e Distribuição Amostral

ORGANIZAÇÃO E TRATAMENTO DE DADOS Nome: N.º Turma / /201

O comportamento conjunto de duas variáveis quantitativas pode ser observado por meio de um gráfico, denominado diagrama de dispersão.

Aula 4 Estatística Conceitos básicos

Afinal o que são e como se calculam os quartis? Universidade do Algarve Departamento de Matemática

Probabilidade - Conceitos Básicos. Anderson Castro Soares de Oliveira

Estatística descritiva. Também designada Análise exploratória de dados ou Análise preliminar de dados

PROBABILIDADE Prof. Adriano Mendonça Souza, Dr.

Apresentação de Dados em Tabelas e Gráficos

Estatística II Antonio Roque Aula 9. Testes de Hipóteses

MÉDIA ARITMÉTICA MÉDIA PONDERADA MODA MEDIANA

Probabilidade - aula I

Probabilidade. Definições, Notação, Regra da Adição

Exercícios Teóricos Resolvidos

4Distribuição de. freqüência

MÓDULO 1. I - Estatística Básica

CAPÍTULO I - ELEMENTOS DE PROBABILIDADE

Análise de Regressão Linear Simples e Múltipla

ANALISE COMBINATORIA Um pouco de probabilidade

Notas sobre a Fórmula de Taylor e o estudo de extremos

Matemática Ficha de Trabalho/Apoio Tratamento de Dados

INSTITUTO TECNOLÓGICO

ActivALEA. active e actualize a sua literacia

CONCEITOS. Evento: qualquer subconjunto do espaço amostral. Uma primeira idéia do cálculo de probabilidade. Eventos Teoria de conjuntos

Matemática Aplicada às Ciências Sociais

Probabilidades: Função massa de probabilidades ou função distribuição de probabilidade ou modelo de probabilidade:

Material Teórico - Aplicações das Técnicas Desenvolvidas. Exercícios e Tópicos Relacionados a Combinatória. Segundo Ano do Ensino Médio

Revisão: Noções básicas de estatística aplicada a avaliações de imóveis

PROBABILIDADES E ESTATÍSTICA

1. Os métodos Não-Paramétricos podem ser aplicados a uma ampla diversidade de situações, porque não exigem populações distribuídas normalmente.

Unidade 11 - Probabilidade. Probabilidade Empírica Probabilidade Teórica

PROBABILIDADE. Aula 5

Experimentos Aleatórios e Espaços Amostrais

Disponibilizo a íntegra das 8 questões elaboradas para o Simulado, no qual foram aproveitadas 4 questões, com as respectivas resoluções comentadas.

Numa turma de 26 alunos, o número de raparigas excede em 4 o número de rapazes. Quantos rapazes há nesta turma?

Lógica e Raciocínio. Decisão sob Risco Probabilidade. Universidade da Madeira.

Faculdade Sagrada Família

Análise de regressão linear simples. Departamento de Matemática Escola Superior de Tecnologia de Viseu

MÓDULO 4 DISTRIBUIÇÃO DE FREQÜÊNCIAS

INE5403 FUNDAMENTOS DE MATEMÁTICA DISCRETA

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Revisão de Probabilidade e Estatística

Estatística Descritiva I

Resoluções comentadas de Raciocínio Lógico e Estatística SEFAZ - Analista em Finanças Públicas Prova realizada em 04/12/2011 pelo CEPERJ

Aula 5 Distribuição amostral da média

UNIDADE 3 MEDIDAS DE POSIÇÃO E DISPERSÃO OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM

ActivALEA. active e actualize a sua literacia

Preparação para o teste intermédio de Matemática 8º ano

Tipos de Modelos. Exemplos. Modelo determinístico. Exemplos. Modelo probabilístico. Causas Efeito. Determinístico. Sistema Real.

Exemplos de Testes de Hipóteses para Médias Populacionais

Teoria das Probabilidades

Lista 2 - Probabilidade. Probabilidade. 1. Uma letra é escolhida entre as letras da palavra PROBABILIDADE

NOÇÕES DE PROBABILIDADE

Instituto Politécnico de Viseu Escola Superior de Tecnologia

Exercícios resolvidos sobre Função de probabilidade e densidade de probabilidade

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE

Cálculo das Probabilidades e Estatística I

3. Características amostrais. Medidas de localização e dispersão

MAT 461 Tópicos de Matemática II Aula 3: Resumo de Probabilidade

Capítulo 5: Aplicações da Derivada

Capítulo 8 - Testes de hipóteses. 8.1 Introdução

A Estatística, um ramo da Matemática, é aplicada em diferentes áreas, como Administração, Engenharia, Medicina, Psicologia, Ciências Sociais etc.

Espaço Amostral ( ): conjunto de todos os

Survey de Satisfação de Clientes 2009

INTRODUÇÃO À ESTATÍSTICA

I. Experimentos Aleatórios

Resoluções comentadas de Raciocínio Lógico e Estatística - SEPLAG APO

A finalidade dos testes de hipóteses paramétrico é avaliar afirmações sobre os valores dos parâmetros populacionais.

Introdução ao estudo de equações diferenciais

Testes (Não) Paramétricos

Avaliação e Desempenho Aula 4

FERRAMENTAS DA QUALIDADE

UNITAU APOSTILA PROBABILIDADES PROF. CARLINHOS

MODELOS PROBABILÍSTICOS MAIS COMUNS VARIÁVEIS ALEATÓRIAS DISCRETAS

elementos. Caso teremos: elementos. Também pode ocorrer o seguinte fato:. Falsa. Justificativa: Caso, elementos.

Matemática SSA 2 REVISÃO GERAL 1

MATEMÁTICA. Recenseamento/Sondagem ESTATÍSTICA

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

Atividade à Distância Avaliativa - Probabilidade. 1 Probabilidade - Operações e Propriedades

Aulas de Estatística / Prof. Jones Garcia da Mata / Sumário

Material Teórico - Módulo de Métodos sofisticados de contagem. Princípio das Casas dos Pombos. Segundo Ano do Ensino Médio

MATEMÁTICA A - 12o Ano Probabilidades - Noções gerais Propostas de resolução

Unidade de Ensino Descentralizada de Colatina Coordenadoria de Informática Disciplina: Probabilidade e Estatística Prof. Leandro Melo de Sá

Prova Escrita de Matemática Aplicada às Ciências Sociais

Barómetro Regional da Qualidade Avaliação da Satisfação dos Utentes dos Serviços de Saúde

Índice de Exercícios. Exercício 1.

Índice. Como aceder ao serviço de Certificação PME? Como efectuar uma operação de renovação da certificação?

A Matemática do ENEM em Bizus

CURSO ON-LINE PROFESSOR GUILHERME NEVES 1

Cálculo em Computadores trajectórias 1. Trajectórias Planas. 1 Trajectórias. 4.3 exercícios Coordenadas polares 5

Escola Secundária Gabriel Pereira Évora Matemática A 10º ano. Planificação da Unidade Geometria

UNIVERSIDADE DOS AÇORES CURSO DE SOCIOLOGIA E SERVIÇO SOCIAL ESTATÍSTICA I Ficha de Exercícios nº 2- Probabilidades

Exercícios Resolvidos sobre probabilidade total e Teorema de Bayes


Transcrição:

PROBABILIDADES E ESTATÍSTICA ISABEL NATÁRIO Departmento de Matemática, Faculdade de Ciências e Tecnologia, Universidade Nova de Lisboa, 89-516, Caparica, Portugal Especial agradecimento à Prof a Fátima Miguéns por contribuições várias Notas produzidas no âmbito da disciplina de Probabilidades e Estatística para os cursos de Engenharia Qualquer gralha ou incorrecção encontrada agradece-se que seja reportada à autora icn@fct.unl.pt de Julho de 01

Conteúdo 1 Estatística Descritiva 4 1.1 Introdução........................................... 4 1. Distribuições de frequência e representação gráfica de dados............... 5 1.3 Medidas descritivas...................................... 8 1.3.1 Medidas de localização................................ 8 1.3. Medidas de dispersão................................ 10 1.3.3 Medidas de forma.................................. 10 1.4 Diagrama de caixa-e-bigodes................................ 1 1.5 Exercícios Propostos..................................... 13 Teoria das Probabilidades 16.1 Introdução........................................... 16. Espaço amostral....................................... 17.3 Axiomática das probabilidades............................... 18.4 Técnicas de contagem para espaços amostrais finitos....................5 Probabilidade condicionada e Teorema de Bayes..................... 3.6 Independência entre acontecimentos............................ 6.7 Exercícios Propostos..................................... 6 3 Variáveis aleatórias 34 3.1 Definição........................................... 34 3. Função distribuição...................................... 35 3.3 Variáveis aleatórias discretas................................ 36 3.4 Variáveis aleatórias contínuas................................ 37 3.5 Exercícios Propostos..................................... 38 4 Momentos e outros parâmetros de uma distribuição de probabilidade 4 4.1 Momentos de uma distribuição............................... 4 4. Parâmetros descritivos das distribuições.......................... 45 4.3 Exercícios Propostos..................................... 47 5 Vectores aleatórios 51 5.1 Par aleatório discreto..................................... 51 5. Par aleatório contínuo.................................... 55 5.3 Independência entre variáveis aleatórias.......................... 56 5.4 Momentos de vectores aleatórios.............................. 58 5.5 Exercícios Propostos..................................... 60 1

Probabilidades e Estatística Isabel Natário 6 Distribuições especiais 68 6.1 Algumas distribuições discretas............................... 68 6.1.1 Distribuição Uniforme Discreta........................... 68 6.1. Distribuição de Bernoulli.............................. 69 6.1.3 Distribuição Binomial................................ 70 6.1.4 Distribuição Hipergeométrica............................ 73 6.1.5 Distribuição Geométrica............................... 74 6.1.6 Distribuição Poisson................................. 76 6. Algumas distribuições contínuas............................... 78 6..1 Distribuição Uniforme Contínua.......................... 78 6.. Distribuição Exponencial.............................. 80 6..3 Distribuição Normal................................. 8 6..4 Distribuição Qui-quadrado............................. 84 6..5 Distribuição T de Student.............................. 86 6.3 Exercícios Propostos..................................... 87 7 Teorema Limite Central 96 7.1 Teorema Limite Central................................... 96 7. Exercícios Propostos..................................... 99 8 Inferência Estatística. Estimação Pontual. Distribuições por Amostragem. 101 8.1 Populações, amostras aleatórias e estatísticas....................... 101 8. Estimação pontual...................................... 103 8.3 Métodos de Obtenção de Estimadores........................... 104 8.3.1 Métodos dos Momentos............................... 105 8.3. Método da Máxima Verosimilhança........................ 105 8.4 Algumas Propriedades dos Estimadores.......................... 107 8.5 Distribuições por amostragem................................ 110 8.5.1 Distribuições por amostragem da média amostral, X............... 111 8.5. Distribuição por amostragem para a diferença de médias amostrais, X1 X. 11 8.5.3 Distribuição por amostragem da proporção, P.................. 11 8.5.4 Distribuição por amostragem da variância amostral, S............. 113 8.6 Exercícios Propostos..................................... 113 9 Intervalos de Confiança 117 9.1 Intervalos de Confiança................................... 117 9. Intervalos de Confiança para a média populacional, µ................... 10 9..1 População Normal com variância conhecida.................... 10 9.. População Normal com variância desconhecida.................. 11 9..3 População Normal com variância desconhecida e n > 30............. 11 9..4 População desconhecida com variância conhecida e n > 30............ 1 9..5 População desconhecida com variância desconhecida e n > 30.......... 13 9.3 Intervalo de Confiança para a diferença de médias populacionais, µ 1 µ....... 13 9.4 Intervalo de Confiança para proporção populacional, p.................. 14 9.5 Intervalo de Confiança para a variância populacional, σ, e para o desvio padrão populacional, σ.......................................... 15 9.6 Exercícios Propostos..................................... 17

Probabilidades e Estatística Isabel Natário 3 10 Testes de Hipóteses 131 10.1 Testes de Hipóteses...................................... 131 10. Testes de hipóteses para a média populacional, µ..................... 133 10..1 População Normal(µ,σ ), σ conhecido...................... 133 10.. População Normal(µ,σ ), σ desconhecido..................... 139 10..3 População Normal(µ,σ ), σ desconhecido, n > 30................ 141 10..4 População desconhecida com σ conhecido e n > 30............... 144 10..5 População desconhecida com σ desconhecido e n > 30.............. 146 10.3 Teste de hipóteses para a igualdade entre médias populacionais, µ 1 = µ, de populações Normais com variâncias conhecidas............................. 149 10.4 Testes de hipóteses para a proporção p de uma população................ 151 10.5 Testes dehipóteses paraavariânciaσ deumapopulaçãonormalcom médiadesconhecida155 10.6 Testes de hipóteses para o pressuposto da normalidade de uma população....... 159 10.7 Exercícios Propostos..................................... 163 11 Regressão Linear Simples 169 11.1 Regressão Linear Simples.................................. 169 11. Estimadores dos Mínimos Quadrados dos Parâmetros de Regressão........... 170 11.3 Qualidade do Ajuste e Estimação de σ.......................... 171 11.4 Distribuição dos Estimadores ˆβ 0 e ˆβ 1............................ 17 11.4.1 Distribuição de ˆβ 1.................................. 17 11.4. Distribuição de ˆβ 0.................................. 173 11.5 Intervalos de Confiança e Testes de Hipóteses para os Parâmetros de Regressão.... 174 11.5.1 Intervalos de Confiança e Testes de Hipóteses para β 1.............. 175 11.5. Intervalos de Confiança e Testes de Hipóteses para β 0.............. 176 11.6 Intervalos de Confiança e Testes de Hipóteses para a Recta de Regressão ou Resposta Média............................................. 177 11.7 Predição............................................ 178 11.8 Um exemplo.......................................... 178 11.9 Exercícios Propostos..................................... 181 1 Exercícios variados 186 13 Soluções dos exercícios propostos 198 14 Formulário 31 15 Tabelas 33 16 Bibliografia sugerida (ordem alfabética) 36

Capítulo 1 Estatística Descritiva 1.1 Introdução Neste capítulo começamos por rever conceitos de estatística descritiva. A estatística descritiva tem por objectivo descrever, resumir e representar a informação contida num conjunto de dados, através da construção de tabelas e gráficos ou através da determinação de medidas numéricas que adequadamente sintetizem os dados. A dificuldade do Homem em interpretar grandes conjuntos de dados é aqui ultrapassada pela distribuição dos dados em classes e pelo no cálculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados depende, em primeira instância, da sua natureza. Os dados numéricos podem ser discretos, quando se referem a contagens ou números inteiros, ou contínuos, quando podem tomar qualquer valor dentro de um determinado intervalo de números. Para além disso os dados estatísticos são ainda classificados de acordo com a sua escala de medição. Assim temos dados qualitativos e quantitativos. Os primeiros dizem respeito a dados cujos atributos de interesse são categorias e dividem-se em dados nominais e ordinais. Os dados nominais não são na verdade dados numéricos, mas apenas etiquetas ou valores atribuídos que designam uma classe, não havendo uma relação de ordem entre as classes. Por exemplo, a situação em que os dados se referem à cor dos olhos de um conjunto de indivíduos (1=preto, =castanho, 3=azul, 4=verde, 5=cinzento). Os dados ordinais referem-se a dados do tipo dos nominais, com a diferença que para estes se estabelece uma relação de ordem entre as classes. Por exemplo, as classificações de cada aluno num determinado teste dadas por Mau, Suficiente e Muito Bom. Os dados quantitativos são aqueles em que a sua característica de interesse é intrinsecamente numérica. Dividem-se em dados com escala intervalar ou com escala absoluta, residindo a distinção no facto de estes últimos terem a si associado uma origem definida. Para decidir se determinado tipo de dados está em qual das escalas pergunte a si próprio se o dobro do valor do que está a estudar corresponde ao dobro de intensidade. Por exemplo, 0 o C é duas vezes mais quente que 10 o C? A resposta é não e, por isso, dados deste tipo são de escala intervalar. Agora um campo com 4 hectares é o dobro de outro com hectares? Sim, por isso temos agora dados de escala absoluta. Notamos que as técnicas estatísticas não fazem distinção entre estes dois tipos de dados. É exclusivamente sobre esta última classe de dados, os quantitativos, que vamos trabalhar. 4

Probabilidades e Estatística Isabel Natário 5 1. Distribuições de frequência e representação gráfica de dados Quando lidamos com grandes conjuntos de dados podemos obter uma boa ideia global dos mesmos se os agruparmos em classes ou intervalos disjuntos. Ao procedermos assim perdemos informação mas esta perda é largamente compensada pelo conhecimento que ganhamos acerca da forma dos dados. Assuma que estamos a tratar com dados contínuos. No caso discreto os valores observados definem eles próprios as classes a considerar. Para escolher o número de classes k a usar é usual aplicar-se a regra de Sturges: k 1+ logn log, onde n é a dimensão do conjunto de dados. Sabendo k e a amplitude total do conjunto de dados, L, dada por: L = máximo{dados} mínimo{dados}, obtém-se a amplitude de cada classe, l, como: l = L k. Podemos então definir os limites de cada classe e contar o número de observações que caiem dentro de cada uma delas, obtendo assim as frequências absolutas de cada classe - f i para a classe i, i = 1,...,k. Este procedimento vem facilitado se ordenarmos os dados. Notamos que: k i=1 f i = n O conjunto das frequências absolutas de todas as classes, eventualmente colocadas numa tabela, chama-se distribuição de frequências. Para o conjunto das frequências absolutas obtêm-se as chamadas frequências absolutas acumuladas de cada classe, F i, como a soma das frequências absolutas dessa classe e de todas as outras que a precedem: F i = i j=1 f j Repare que F k = n. Ao conjunto das {F i, i = 1,...,k} chama-se distribuição de frequências absolutas. Obervamos que é usual identificar cada classe pelo seu ponto médio, calculado como a metade da soma dos seus extremos, e denotado aqui como PM i para a classe i, i = 1,...,k. Definem-se ainda as chamadas frequências relativas de cada classe, aqui designadas por f i, como: f i = f i n Observe-se que estas frequências se encontram em [0, 1] e que: k i=1 f i = 1

Probabilidades e Estatística Isabel Natário 6 Associadas a f i encontram-se as correspondentes frequências relativas acumuladas: F i = i j=1 f j Temos que Fk = 1. Ao conjunto das frequências relativas chama-se distribuição de frequências relativas e ao conjunto das frequências relativas acumuladas chama-se distribuição de frequências relativas acumuladas. Nota: Se depois de seleccionadas as classes se verificar que, por existirem observações muito extremas, surgem nas pontas classes com apenas 1 ou 0 observações, é usual agregá-las, obtendo as classes abertas menor que e maior que. Essas observações que se destacam por serem muito extremas, muito distantes das restantes, designam-se por outliers. Uma vez tendo as distribuições de frequências podemos construir vários dispositivos gráficos para as representar, já que uma imagem vale 1000 palavras... Assim podemos ter histogramas, polígonos de frequência, polígonos de frequências acumuladas representando graficamente a distribuição de frequência dos dados, ou ainda diagramas de caixa-e-bigodes, que apresentaremos mais tarde no texto. O histograma é um gráfico de barras que se constrói escolhendo para abcissas os limites de cada uma das classes e para ordenadas, resultando na altura de cada uma das barras que o constitui, a frequência (absoluta ou relativa) dos dados na classe correspondente. O polígono de frequências é obtido unindo os pontos de ordenada correspondente à altura de cada barra e abcissa dada pelo respectivo ponto médio da classe. Os polígonos de frequências são usualmente melhores que os histogramas para comparar a forma de duas ou mais distribuições de frequências. O polígono de frequências acumuladas obtém-se unindo os pontos formados por ordenadas dadas pela altura das barras do histograma e respectivas abcissas que são um dos limites da classe que lhe corresponde - caso seja o superior fala-se de distribuição acumulada acima de ; se for o inferior temos distribuição acumulada abaixo de. A curva aqui resultante toma o nome de ogiva. É uma curva importante quando estamos interessados em determinar que percentagem dos dados está abaixo de um certo valor. Exemplo 1.1 Seguem-se as percentagens de gordura de manteiga fornecidas por 10 vacas Ayrshire, de 3 anos de idade, seleccionadas ao acaso de um livro de registos de gado canadiano: 4.3 4.4 4.9 4.00 3.96 4.48 3.89 4.0 3.74 4.4 4.0 3.87 4.10 4.00 4.33 3.81 4.33 4.16 3.88 4.81 4.3 4.67 3.74 4.5 4.8 4.03 4.4 4.09 4.15 4.9 4.7 4.38 4.49 4.05 3.97 4.3 4.67 4.11 4.4 5.00 4.60 4.38 3.7 3.99 4.00 4.46 4.8 3.91 4.71 3.96 3.66 4.10 4.38 4.16 3.77 4.40 4.06 4.08 3.66 4.70 3.97 3.97 4.0 4.41 4.31 3.70 3.83 4.4 4.30 4.17 3.97 4.0 4.51 3.86 4.36 4.18 4.4 4.05 4.05 3.56 3.94 3.89 4.58 3.99 4.17 3.8 3.70 4.33 4.06 3.89 4.07 3.58 3.93 4.0 3.89 4.60 4.38 4.14 4.66 3.97 4. 3.47 3.9 4.91 3.95 4.38 4.1 4.5 4.35 3.91 4.10 4.09 4.09 4.34 4.09 4.88 4.8 3.98 3.86 4.58 De Sokal & Rohlf (1995).

Probabilidades e Estatística Isabel Natário 7 Olhando para este conjunto de 10 números é difícil retirar algo de útil daqui, ao contrário do que acontece se os dispusermos num gráfico. Para tal começamos por determinar o número de classes a usar para agrupar os dados, através da regra de Sturges: k 1+ logn log = 1+ log10 log 1+6.907 = 7.907 8 classes. Notando agora que o máximo do conjunto de dados é 5.00 e o mínimo é 3.47, temos que a amplitude dos dados vale L = 5.00 3.47 = 1.53 e, portanto, a amplitude de cada classe deve ser de l = L k = 1.53 8 = 0.1915 0.. Obtemos então as seguintes distribuições de frequências (absoluta, absoluta acumulada, relativa e relativa acumulada): Frequência Freq. absoluta Frequência Freq. relativa Classe absoluta, acumulada relativa, acumulada i i f i F i fi Fi 1 ]3.4 ; 3.6] 3 3 0.05 0.05 ]3.6 ; 3.8] 8 11 0.067 0.09 3 ]3.8 ; 4.0] 30 41 0.50 0.34 4 ]4.0 ; 4.] 9 70 0.4 0.583 5 ]4. ; 4.4] 8 98 0.33 0.817 6 ]4.4 ; 4.6] 1 110 0.100 0.917 7 ]4.6 ; 4.8] 5 115 0.04 0.958 8 ]4.8 ; 5.0] 5 10 0.04 1.000 Usando agora as frequências absolutas, por exemplo, pode construir-se o seu histograma e desenhar o correspondente polígono de frequências (a vermelho): Frequência absoluta, fi 0 5 10 15 0 5 30 3.4 3.6 3.8 4.0 4. 4.4 4.6 4.8 5.0 Percentagem de manteiga

Probabilidades e Estatística Isabel Natário 8 Daqui facilmente verificamos que a grande maioria destas vacas produz percentagens de manteiga entre 3.8 e 4.4, havendo aproximadamente o mesmo número de vacas melhores e piores produtoras em termos de manteiga - simetria na distribuição das frequências. Repare ainda nos valores das frequências relativas acumuladas de onde se pode verificar que mais de 50% das observações correspondem a uma percentagem de manteiga inferior a 4.%. 1.3 Medidas descritivas Anteriormente vimos como resumir um conjunto de dados num gráfico. Adicionalmente pode ser útil reduzir esses mesmos dados a um ou mais números que os representem, como por exemplo a uma média. Estes números vão tomar o nome de medidas descritivas. As medidas descritivas dividem-se em 3 tipos: medidas de localização, medidas de dispersão e medidas de forma. Servem, respectivamente, para responder a questões do tipo: 1. Onde é o meio dos dados? Que dado ocorre mais vezes? Como se posiciona o meu valor comparado com todos os outros?. Quão espalhados se encontram os dados? 3. São os meus dados simétricos? 1.3.1 Medidas de localização As medidas de localização servem para determinar o meio dos dados ou o seu valor mais típico ou ainda para determinar como determinado valor se posiciona em relação aos restantes. As medidas mais usuais são a média, a mediana, moda, os quartis e os percentis. Dado um conjunto de dados D = {x 1,...,x n } temos as seguintes definições: Média amostral: x = 1 n n i=1 x i Mediana: ( n+1 )ésimo valor do conjunto D ordenado, M e = Média dos valores centrais do conjunto D ordenado, n é ímpar n é par Moda: M o = Valor em D que ocorre mais vezes Percentil de ordem p: q p = n p 100 ésimo valor do conjunto D ordenado, p [0,100]

Probabilidades e Estatística Isabel Natário 9 1 o Quartil: 3 o Quartil: Q 1 = 0.5n ésimo valor do conjunto D ordenado Q 3 = 0.75n ésimo valor do conjunto D ordenado Note-se que os quartis não são mais do que percentis - o 1 o quartil é o percentil 5 e o 3 o quartil é o percentil 75. O o quartil não é mais do que o percentil 50, que por sua vez não é mais do que a mediana. Quando os dados se encontram agrupados, as medidas anteriores não podem assim ser determinadas, tendo de se recorrer a uma interpolação linear. Notamos que a moda deverá encontrar-se contida na classe com maior frequência absoluta - dita classe modal - e a mediana deverá estar contida na primeira classe cuja correspondente frequência relativa acumulada ultrapasse 0.5 - dita classe mediana. Denotando Li e Ls os limites inferior e superior, respectivamente, das classes onde se encontram as medidas de localização a serem determinadas, PM i o ponto médio da classe i, me o número da classe mediana, mo o número da classe modal, mq1 o número da classe do 1 o quartil, mq3 o número da classe do 3 o quartil, mpp o número da classe do percentil p e l a amplitude das classes, temos que: Média amostral: Mediana: Moda: 1 o Quartil: 3 o Quartil: Percentil de ordem p: x = 1 n k i=1 f ipm i M e = Li+ n+1 F me 1 F me+1 F me 1 l M o = Li+ f mo+1 f mo 1 + f mo+1 l Q 1 = Li+ n+1 4 F mq1 1 F mq1+1 F mq1 1 l Q 3 = Li+ 3(n+1) 4 F mq3 1 F mq3+1 F mq3 1 l q p = Li+ p(n+1) 100 F mpp 1 F mpp+1 F mpp 1 l

Probabilidades e Estatística Isabel Natário 10 Notas: Quando tratamos com dados susceptíveis de conter outliers a mediana verifica-se ser uma medida de localização melhor que a média, uma vez que é menos sensível a esse tipo de valores extremos. Notamos ainda que a moda não tem de ser única. 1.3. Medidas de dispersão A dispersão é a tendência dos dados se espalharem em torno da média. As medidas mais habituais são a amplitude dos dados, a variância, o desvio padrão e o coeficiente de variação, que se passam a definir, relativamente ao conjunto de dados D = {x 1,...,x n }. Amplitude: L = maxd mind Variância amostral: Desvio padrão amostral: Coeficiente de variação: s = 1 n n 1 i=1 (x i x) = 1 ( n n 1 i=1 x i n x) s = s = 1 n n 1 i=1 (x i x) cv = s x 100 Note-se que o coeficiente de variação representa a percentagem da média amostral a que corresponde o desvio padrão amostral. No caso de dados agrupados devemos reformular as nossas definições. Sendo PM i o ponto médio da classe i e f i a correspondente frequência absoluta: Variância amostral: Desvio padrão amostral: s = 1 k n 1 i=1 f i(pm i x) s = s = 1 n 1 k i=1 f i(pm i x) 1.3.3 Medidas de forma Servem para estudar a simetria dos dados. Vamos aqui apenas considerar o coeficiente de enviesamento de Pearson: Coeficiente de enviesamento de Pearson: Sk = 3( x Me) s

Probabilidades e Estatística Isabel Natário 11 Os valores de Sk variam entre 3 e 3. Se os dados forem perfeitamente simétricos então Sk = 0, já que a mediana e a média dos dados coincidem. Se Sk > 0 (respectivamente, Sk < 0) tal significa que a média é maior (respectivamente menor) que a mediana, sendo os dados enviesados para a direita (respectivamente, enviesados para a esquerda). Exemplo 1. Retomemos o exemplo 1.1. Uma vez que dispomos dos dados desagregados podemos calcular: Média amostral: x = 1 n n i=1 x i = 1 10 n i=1 x i = 4.166; Mediana: como n=10 é par, M e=média dos valores centrais do conjunto ordenado de dados, {3.47, 3.56, 3.58, 3.66, 3.66, 3.70, 3.70, 3.7, 3.74, 3.74, 3.77, 3.81, 3.8, 3.83, 3.86, 3.86, 3.87, 3.88, 3.89, 3.89, 3.89, 3.89, 3.91, 3.91, 3.9, 3.93, 3.94, 3.95, 3.96, 3.96, 3.97, 3.97, 3.97, 3.97, 3.97, 3.98, 3.99, 3.99, 4.00, 4.00, 4.00, 4.0, 4.03, 4.05, 4.05, 4.05, 4.06, 4.06, 4.07, 4.08, 4.09, 4.09, 4.09, 4.09, 4.10, 4.10, 4.10, 4.11, 4.1, 4.14, 4.15, 4.16, 4.16, 4.17, 4.17, 4.18, 4.0, 4.0, 4.0, 4.0, 4., 4.3, 4.4, 4.4, 4.4, 4.4, 4.5, 4.7, 4.8, 4.8, 4.9, 4.9, 4.30, 4.31, 4.3, 4.3, 4.33, 4.33, 4.33, 4.34, 4.35, 4.36, 4.38, 4.38, 4.38, 4.38, 4.38, 4.40, 4.41, 4.4, 4.4, 4.46, 4.48, 4.49, 4.51, 4.5, 4.58, 4.58, 4.60, 4.60, 4.66, 4.67, 4.67, 4.70, 4.71, 4.81, 4.8, 4.88, 4.91, 5.00} Logo, Me = 4.14+4.15 = 4.145. Moda: M o = Valor que ocorre mais vezes = 3.97 e 4.38 (aparecem ambos 5 vezes, modas). 1 o Quartil: Q 1 = 0.5n = 0.5 10 = 30ésimo valor do conjunto de dados ordenado =3.96 3 o Quartil: Q 3 = 0.75n = 0.75 10 = 90ésimo valor do conjunto dados ordenado =4.34 Amplitude: L=5.00-3.47=1.53 Variância amostral: s = 1 n 1 n i=1 (x i x) = 0.091 1 Desvio padrão amostral: s = n n 1 i=1 (x i x) = 0.30 Coeficiente de variação: cv = s x 100 = 7.58% Coeficiente de enviesamento de Pearson: Sk = 3( x Me) s = 0.09. Confirma ligeiro enviesamento direito verificado no histograma. A distribuição é pois apenas ligeiramente assimétrica, o que é corroborado pelo facto de a média amostral, a mediana e a moda estarem relativamente próximas. Apesar de neste exemplo concreto termos os dados desagregados, vamos usar as classes definidas no exemplo 1.1 para calcular algumas das medidas atrás e comparar resultados. Assim: Média amostral: x = 1 n k i=1 f ipm i = 3 3.5+8 3.7+... 10 = 4.153;

Probabilidades e Estatística Isabel Natário 1 Mediana: A classe 4, ]4.0; 4.], é a primeira cuja frequência relativa acumulada ultrapassa os 50% dos dados, pelo que é esta a classe mediana. M e = Li+ n+1 F me 1 F me+1 F me 1 l = 4.0+ 10+1 41 98 41 0. = 4.068 Moda: A classe modal é a classe 3, ]3.8;4.0], já que é aquela a que corresponde maior frequência absoluta. Assim: M o = Li+ f mo+1 f mo 1 + f mo+1 l = 3.8+ 9 8 + 9 0. = 3.957 1 o Quartil: A classe 3, ]3.8;4.0], é a primeira cuja frequência relativa acumulada ultrapassa os 5% dos dados, pelo que é esta a classe do 1 o quartil: Q 1 = Li+ n+1 F 4 mq1 1 F mq1+1 F mq1 1 l = 3.8+ 10+1 11 4 70 11 0. = 3.865 3 o Quartil: A classe 5, ]4.;4.4], é a primeira cuja frequência relativa acumulada ultrapassa os 75% dos dados, pelo que é esta a classe do 3 o quartil: Q 3 = Li+ 3(n+1) F 4 mq3 1 F mq3+1 F mq3 1 l = 4.+ 3(10+1) 70 4 110 70 0. = 4.304 Naturalmente que tanto a mediana, como os quartis e a moda devem estar contidos nas respectivas classes, o que constitui uma forma de confirmarmos se os nossos cálculos estão correctos. Variância amostral: s = 1 k n 1 i=1 f i(pm i x) = 3 (3.5 4.153) +8 (3.7 4.153) +... 119 = 0.095 Desvio padrão amostral: s = s = 0.308 Coeficiente de variação: cv = s x 100 = 7.406% Vemos pois que as aproximações obtidas a partir dos dados agrupados estão próximas dos verdadeiros valores. Quanto mais distantes estiverem os verdadeiros valores dos obtidos através dos dados agrupados, maior é a perda de informação devida ao agrupamento. 1.4 Diagrama de caixa-e-bigodes Apresentamos por último um outro dispositivo gráfico bastante útil, o chamado diagrama de caixae-bigodes. Para construir este diagrama temos de conhecer quanto valem os máximo e mínimo dos dados, a sua mediana e os 1 o e 3 o quartis. Com estes desenha-se uma caixa rectangular em que o topo inferior é dado pelo 1 o quartil e o superior pelo 3 o quartil. A caixa é dividida em duas partes pelo valor da mediana dos dados. Acrescentam-se-lhe então bigodes que partem, respectivamente, um do extremo inferior da caixa até ao mínimo dos dados e o outro do extremo superior para o máximo - ver exemplo 1.3. Este diagrama é muito útil para identificar assimetrias nos dados, caso a caixa esteja partida em dois pedaços muito diferentes, e para identificar outliers, no caso de os bigodes serem, relativamente à caixa, muito grandes.

Probabilidades e Estatística Isabel Natário 13 Exemplo 1.3 Construamos o diagrama de caixa-e-bigodes para dos dados do exemplo 1.1, lembrando que Me = 4.145, Q1 = 3.96, Q3 = 4.34, mínimo dos dados é 3.47 e máximo dos dados é 5.00: 3.5 4.0 4.5 5.0 Confirma-se ligeira assimetria direita dos dados. 1.5 Exercícios Propostos 1.1 No âmbito dos inquéritos que são efectuados por determinado organismo de obtenção de dados, é importante ter noção dos erros de digitação que os entrevistadores cometem ao anotarem informaticamente as respostas dos seus entrevistados. Assim, para um inquérito de 50 questões registaram-se, para 90 entrevistas, os seguintes números de erros: N o de erros Frequência 0 5 1 17 9 3 3 4 11 5 5 (a) Determine as frequências relativas e as frequências relativas acumuladas. Coloque-as em gráfico. (b) Que percentagem de entrevistas tiveram menos de 3 erros? Que número de erros é mais comum? (c) Determine a média do número de erros, o seu desvio padrão e o coeficiente de variação. 1. Suponha que os dados seguintes se referem ao número de palavras que constituem o vocabulário de crianças de 5 anos: 05, 377, 9, 300, 179, 40, 300, 190, 680, 50, 180, 170, 11, 66, 303, 350, 375, 88, 360, 5

Probabilidades e Estatística Isabel Natário 14 (a) Estes dados são de natureza discreta ou contínua? Construa uma sua distribuição de frequências absoluta, absoluta acumulada, relativa e relativa acumulada. Esboce o histograma das frequências relativas e o correspondente polígono de frequências. Construa uma ogiva. (b) Existe algum outlier presente nos dados? (c) Determine amédia, amediana, amoda, eos 1 o e3 o quartisdosdados. Construaodiagrama de caixa-e-bigodes dos dados. (d) Determine o desvio padrão e o coeficiente de variação dos dados. (e) O que pode dizer quanto à simetria dos dados? Justifique. 1.3 Os chamados movimentos rápidos dos olhos durante o sono (REM - rapid eye movement) estão associados a períodos de sonho. A duração da actividade REM foi registada para 18 indivíduos (em segundos): 7.00, 7.75, 9.50, 11.60, 10.55, 7.75, 1.00, 10.75, 1.51, 10.91, 8.30, 9.71, 10.50, 11.60, 6.5, 11.75, 9.75, 10.00 (a) Construa uma distribuição de frequência dos dados usando uma amplitude de classe l de 1 segundo. Represente-a graficamente. Esboce uma ogiva. (b) Determine a média, a mediana e os 1 o e 3 o quartis dos dados. (c) Determine o desvio padrão e o coeficiente de variação dos dados. 1.4 Segue-se a distribuição por faixas etárias da população de uma certa cidade, com idades entre 5 e 40 anos, relativas ao ano de 1987: Idade Número [5 10[ 30116 [10 15[ 14633 [15 0[ 944 [0 5[ 40146 [5 30[ 944 [30 35[ 44555 [35 40] 40100 (a) Construa um histograma de frequências. O que indica a sua forma? (b) Se o histograma tivesse sido calculado com base nas frequências relativas a sua forma diferiria do histograma desenhado na alínea anterior? Se não tiver a certeza construa-o para comparação. (c) Determine duas medidas de localização dos dados e duas medidas de dispersão. 1.5 Os dados que se seguem dizem respeito aos salários mensais líquidos (Euro) de um conjunto de 36 pessoas de determinada cidade entrevistadas na rua ao acaso: 1195, 660, 870, 1150, 15, 465, 1100, 480, 1300, 330, 00, 1540, 685, 867, 1000, 1470, 1085, 1060, 1790, 690, 1535, 3995, 1615, 130, 670, 590, 1100, 1040, 400, 1030, 1165, 330, 160, 1790, 740, 1490

Probabilidades e Estatística Isabel Natário 15 (a) Construa uma distribuição de frequências relativas e ponha-a em gráfico. Construa ainda uma ogiva. (b) Qual a percentagem de pessoas que ganha menos que 1100e líquidos? (c) Determine a média, a mediana, a moda, os 1 o e 3 o quartis e o desvio padrão dos dados. (d) Comente a simetria da distribuição com base no coeficiente de enviesamento de Pearson e com base no diagrama de caixa-e-bigodes. 1.6 Inserido num estudo antropólogo procura-se determinar algumas características fisiológicas de uma população. Os números seguintes representam os níveis de colesterol no sangue encontrado em 5 membros de uma tribo Africana, medido em miligramas de colesterol por decilitro de sangue: 00, 41, 3, 177, 07, 181, 195, 18, 181, 33, 176, 170, 17, 164, 188, 164, 11, 04, 160, 17, 1, 186, 160, 03, 191 (a) Construa as distribuições de frequências absolutas e relativas correspondentes. (b) Construa o histograma e o polígono de frequências das frequências relativas. Comente. (c) Determine a média, a mediana e a moda dos dados. Comente. (d) Determine o coeficiente de variação dos dados. 1.7 Um psicólogo desenvolveu uma técnica para ajudar as pessoas a melhorarem a sua memória. Certo material é dado a 30 pessoas para o memorizarem antes de aprenderem a técnica e semelhante material é dado às mesmas pessoas para o memorizarem depois de apreendida a referida técnica. A diferença de tempo que as pessoas demoraram a memorizar os materiais antes e depois de aprendida a técnica seguem-se (minutos): 5, 40, 45, 11, 13, 0, 14, 5, 3, 18, 17, 4, 4, 5, 9, 18, 15, 1, 4, 16,, 15, 19, 30, 4, 1, 14, 18, 6, 40 (a) Construa uma distribuição de frequências, o seu histograma e o seu polígono de frequências. (b) Tome uma classe e escreva por palavras exactamente o que ela lhe diz. (c) Calcule 3 medidas de localização dos dados e discuta a simetria da distribuição dos dados, construindo um diagrama de caixa-e-bigodes. 1.8 Prove que a área total dos rectângulos de um histograma é igual à área limitada pelo polígono de frequência correspondente e pelo eixo dos XX. Considere, para facilitar, o caso concreto de um histograma constituído, por exemplo, por 3 classes da mesma amplitude.

Capítulo Teoria das Probabilidades.1 Introdução Apesar da estatística descritiva ser um ramo importante da estatística, muito frequentemente a informação que dispomos existe apenas para um subgrupo de um grande conjunto de items de interesse (uma amostra), significando a necessidade de generalizações para além dos dados. O objectivo da inferência estatística prende-se precisamente com estas generalizações. Neste processo estão sempre presentes incertezas, quer porque a informação não é completa ou porque é apenas parte de um todo ou ainda porque é de natureza indirecta. Estas incertezas são quantificadas através da teoria das probabilidades. A teoria das probabilidades tem assim como objectivo a formulação de modelos de fenómenos naturais em que intervém o acaso. As suas origens remontam aos chamados jogos de azar, como sendo a roleta do casino ou os jogos de cartas ou de dados! Definição.1 Uma experiência aleatória é uma experiência na qual: - todos os possíveis resultados da experiência são conhecidos à partida; - para qualquer realização da experiência não se sabe, antes desta ocorrer, qual dos seus possíveis resultados vai acontecer; - a experiência pode sempre ser repetida sob idênticas condições. Vários são os exemplos do nosso dia-a-dia de experiências aleatórias - lançamento de uma moeda ao ar (assumindo que não aterra de lado!), lançamento de um dado, a extracção do totoloto, o tempo de vida de duração de uma lâmpada, o tempo que se demora na fila de espera dos correios, o sorteio dos turnos práticos de Probabilidades e Estatística!... O nosso objectivo é então estudar a incerteza associada a estas experiências aleatórias, se possível quantificá-la. Laplace, em 181, forneceu a primeira definição de probabilidade, dita definição clássica de probabilidade ou Lei de Laplace: Definição. Se uma experiência aleatória tem a si associado um número finito N de resultados mutuamente exclusivos e igualmente prováveis e se, desses resultados, N A têm um certo atributo A, então a probabilidade de A, P (A), é dada por: 16

Probabilidades e Estatística Isabel Natário 17 P (A) = N A N = no de resultados favoráveis n o de resultados possíveis Esta definição é no entanto restritiva e inadequada em muitas situações, por exemplo se os resultados da experiência aleatória não forem equiprováveis. Surge então o conceito frequencista de probabilidade: Definição.3 A probabilidade de um acontecimento A é avaliada através de informação existente sobre A, sendo dada pela proporção de vezes em que se observou o resultado A, n A, num número n suficientemente grande de realizações da experiência aleatória: P (A) = lim n n A n Este é o conceito de probabilidade que trataremos neste curso. Notamos que esta interpretação não é única. No entanto, a matemática das probabilidades que vamos aprender de seguida é desenvolvida numa base inteiramente axiomática, independente da referida interpretação. Deve-se a Kolmogorov, que a apresentou em 1933. De acordo com o desenvolvimento de Kolmogorov os acontecimentos aleatórios são representados por conjuntos e a probabilidade é uma medida normada definida sobre estes conjuntos.. Espaço amostral Definição.4 O espaço amostral de uma experiência aleatória é um par (Ω, S) onde: 1. Ω é o conjunto de todos os possíveis resultados da experiência (espaço de resultados ou universo);. S é uma σ álgebra, i.e.: (i) S; (ii) Se A S então Ā S, onde Ā é o conjunto complementar de A; (iii) Se A 1,A,...,A n,... S então i=1 A i S. Observações: 1. Os pontos em Ω designam-se por pontos amostrais.. Muito frequentemente S é o conjunto de todos os subconjuntos de Ω, S P(Ω). Este conjunto é sempre uma σ álgebra. 3. QualquerconjuntoA S é chamadoumacontecimento. Aéumconjuntodepontosamostrais. 4. Qualquer acontecimento A diz-se ter ocorrido se algum ponto de A corresponder ao resultado de uma experiência aleatória. 5. Cada conjunto formado por apenas um ponto amostral é dito um acontecimento simples ou elementar.

Probabilidades e Estatística Isabel Natário 18 6. Ao conjunto Ω chamamos acontecimento certo. 7. Ao conjunto chamamos acontecimento impossível. 8. A álgebra assim construída, também designada por álgebra de acontecimentos, é parecida com a álgebra de conjuntos, herdando propriedades desta. Assim salientamos: (i) A é subacontecimento de B, e escreve-se A B, se e só se a realização de A implica a realização de B; (ii) Dado o acontecimento A, chama-se acontecimento complementar de A e escreve-se A, ao acontecimento constituído pelos elementos de Ω que não estão em A; (iii) Dados os acontecimentos A e B, dá-se o nome de união de A com B ao acontecimento que consiste na realização de pelo menos um deles e representa-se por A B; (iv) Intersecção de A com Béoacontecimentoqueserealizaseesóserealizamemsimultâneo os acontecimentos A e B. Representa-se por A B; (v) A união de acontecimentos disjuntos A e B representa-se por A+B. (vi) Chama-se diferença dos acontecimentos A e B ao acontecimento A B = A B, ou seja, ao acontecimento que se realiza se e só se A se realiza mas não se realiza B. 9. Dois acontecimentos A e B dizem-se mutuamente exclusivos se não têm elementos em comum, ou seja se A B =. 10. Se Ω contiver apenas um número finito de elementos dizemos que (Ω,S) é um espaço amostral finito. Se Ω for no máximo um conjunto numerável de pontos dizemos que (Ω,S) é um espaço amostral discreto. Se os pontos em Ω não forem contáveis dizemos que (Ω,S) é um espaço amostral não contável. Em particular, se Ω = R k, dizemos que temos um espaço amostral contínuo. Exemplo.1 Considere-se a experiência aleatória simples do lançamento ao ar de uma moeda equilibrada. Representando Ca o resultado sair cara e Co o resultado sair coroa, temos que Ω = {Ca,Co}. Escolhemos então a seguinte σ álgebra, S = P(Ω) = {,{Ca},{Co},{Ca,Co}}, formando o espaço amostral (Ω, S). Consideremos agora a experiência aleatória do lançamento ao ar de duas moedas equilibradas. Temos que Ω = {(Ca,Ca),(Ca,Co),(Co,Ca),(Co,Co)} e podemos escolher S = P(Ω) = {,{(Ca,Ca)}, {(Ca,Co)},{(Co,Ca)},{(Co,Co)},{(Ca,Ca),(Ca,Co)},{(Ca,Ca),(Co,Ca)},{(Ca,Ca),(Co,Co)}, {(Ca,Co),(Co,Ca)},{(Ca,Co),(Co,Co)},{(Co,Ca),(Co,Co)},{(Ca,Ca),(Ca,Co),(Co,Ca)}, {(Ca,Ca),(Ca,Co),(Co,Co)},{(Ca,Ca),(Co,Ca),(Co,Co)},{(Ca,Co),(Co,Ca),(Co,Co)},Ω}, formando o espaço amostral (Ω, S)..3 Axiomática das probabilidades Definição.5 Seja (Ω,S) um espaço amostral. Uma função P : S [0,1] diz-se uma probabilidade se satisfaz as seguintes condições ou axiomas: 1. P(A) 0, A S;

Probabilidades e Estatística Isabel Natário 19. P(Ω) = 1; 3. Sejam {A i, i = 1,,...}, A i S, uma sucessão de conjuntos disjuntos (A j A k =, j k). Então: ( ) P A i = P(A i ) Aditividade contável i=1 i=1 Nota: Como caso particular do 3 o axioma temos a chamada aditividade finita, para Ω finito: Sejam A,B S : A B =. Então P (A B) = P(A)+P(B). Definição.6 Chama-se espaço de probabilidades ao triplo (Ω, S, P). Exemplo. Relativamente ao exemplo.1, onde Ω = {Ca,Co} e S = P(Ω), podemos definir a função P em S como P( ) = 0, P({Ca}) = 1, P({Co}) = 1 e P(Ω) = 1. Facilmente se verifica que esta função satisfaz os axiomas acima sendo, por isso, uma probabilidade. Já se Ω = {(Ca,Ca),(Ca,Co),(Co,Ca),(Co,Co)} e S = P(Ω), podemos definir a função P por: P( ) = 0 P({(Ca,Ca)}) = P({(Ca,Co)}) = P({(Co,Ca)}) = P({(Co,Co)} = 1 4 P({(Ca,Ca),(Ca,Co)}) = P({(Ca,Ca),(Co,Ca)}) = P({(Ca,Ca),(Co,Co)}) = = P({(Ca,Co),(Co,Ca)}) = P({(Ca,Co),(Co,Co)}) = P({(Co,Ca),(Co,Co)}) = 1 P({(Ca,Ca),(Ca,Co),(Co,Ca)}) = P({(Ca,Ca),(Ca,Co),(Co,Co)}) = = P({(Ca,Ca),(Co,Ca),(Co,Co)}) = P({(Ca,Co),(Co,Ca),(Co,Co)}) = 3 4 P(Ω) = 1 Também esta função satisfaz os axiomas acima enunciados sendo, por isso, uma probabilidade. Notemos que em ambas as situações anteriores, ao definirmos os valores que a função P deve tomar para os acontecimentos elementares, estes necessariamente implicam os valores que P deve assumir para os restantes acontecimentos, de forma a que P seja de facto uma probabilidade. Passam-se a enumerar de seguida algumas consequências da axiomática das probabilidades acima definida, esboçando as suas demonstrações, sem grande detalhe. Proposição.1 P( ) = 0. Demonstração: Ω =. Logo e Ω são conjuntos disjuntos. Então, pela aditividade e porque Ω = Ω, P( Ω) = P( )+P(Ω) P(Ω) = P( )+P(Ω) 1 = P( )+1 P( ) = 0 (pelo o axioma)

Probabilidades e Estatística Isabel Natário 0 Teorema.1 Se A, B S e A B então: - P(A) P(B) - P(B A) = P(B) P(A). Demonstração: Se A B, B = (A B) (B A) = A (B A). Assim, sendo A e (B A) disjuntos, temos pelo axioma da aditividade que: P(B) = P(A+(B A)) = P(A)+P(B A) (.3.1) P(B A) = P(B) P(A) Note-se que de (9.5.1), P(B) P(A), já que P(B A) 0, pelo 1 o axioma. Corolário.1.1 A S, 0 P(A) 1. Demonstração: Como A S, A Ω e como, pelo axioma, P(Ω) = 1, segue o pretendido como consequência do primeiro ponto do teorema anterior. Corolário.1. A,B S, P(A B) = P(A) P(A B). Demonstração: P(A B) = P(A (A B)) = (Pelo o ponto do teorema anterior e porque (A B) A) = P(A) P(A B) Teorema. (Regra da adição) Para A,B S, P(A B) = P(A)+P(B) P(A B). Demonstração: 1. A B = (A B)+(B A)+(A B);. A = (A B)+(A B) (A B) = A (A B) 3. B = (A B)+(B A) (B A) = B (A B) Assim, pelo axioma da aditividade: P(A B) = P(A B)+P(B A)+P(A B) = = P(A (A B))+P(B (A B))+P(A B) = (Pelo corolário (.1.)) = P(A) P(A B)+P(B) P(A B))+P(A B) = = P(A)+P(B) P(A B))

Probabilidades e Estatística Isabel Natário 1 Corolário..1 A S, P(Ā) = 1 P(A). Demonstração: Tome-se na regra da adição anteriormente enunciada B = Ā: P(A Ā) = P(A)+P(Ā) P(A Ā) P(Ω) = P(A)+P(Ā)+P( ) (Pelo o axioma e prop. (.1)) 1 = P(A)+P(Ā)+0 P(Ā) = 1 P(A) Corolário (.. Para A i S, i = 1,...,n, n ) n P A i = P (A i A j )+ ( n ) P (A i A j A k )...+( 1) n 1 P A i i=1 i=1 P (A i ) i j i j k i=1 Observações: 1. Dois acontecimentos A e B dizem-se incompatíveis se P (A B) = 0.. Se temos um acontecimento A Ω mas tal que P(A) = 1 dizemos que A é um acontecimento quase certo. 3. Se temos um acontecimento B mas tal que P(B) = 0 dizemos que B é um acontecimento quase impossível. Exemplo.3 Relativamente ao exemplo.1, continuado em., relativamente à experiência aleatória do lançamento de moedas equilibradas, definamos os seguintes acontecimentos: A- Sair pelo menos uma cara B- Sair pelo menos uma coroa Temos que: A = {(Ca,Co),(Co,Ca),(Ca,Ca)} P(A) = 3 4 B = {(Ca,Co),(Co,Ca),(Co,Co)} P(B) = 3 4 A partir daqui consideremos os seguintes acontecimentos: Ocorrerem os dois acontecimentos simultaneamente: A B = {(Ca,Co),(Co,Ca)} P(A B) = 1

Probabilidades e Estatística Isabel Natário Ocorrer A mas não B: A B = {(Ca,Ca)} P(A B) = P(A) P(A B) = 3 4 1 = 1 4 Ocorrer pelo menos um dos acontecimentos: A B = Ω P(A B) = P(A)+P(B) P(A B) = 3 4 + 3 4 1 = 1 Não ocorrer B: B = {(Ca,Ca)} P( B) = 1 P(B) = 1 3 4 = 1 4.4 Técnicas de contagem para espaços amostrais finitos Em espaços amostrais finitos é frequente termos situações em que todos os acontecimentos elementares têm igual probabilidade. Nestes casos a determinação das probabilidades de acontecimentos reduz-se a problemas de contagem combinatória. Enumeramos seguidamente algumas regras de contagem necessárias a essa determinação. 1. Multiplicação de escolhas: O número de formas diferentes em que podemos escolher um elemento de cada um de dois grupos - um com n elementos e outro com m - é dado por: n m. Consideremos um conjunto de n elementos dos quais estamos interessados em extrair p (p n) elementos, anotando a ordem pela qual eles saem. (i) Se a extracção for efectuada sem reposição, no caso de extrairmos todos os n elementos (p = n), o número de formas diferentes de o fazer é permutações de n, Recordemos que por convenção 0! = 1. P n = n! = n (n 1)... 1 Caso p < n, o número de conjuntos diferentes de p elementos que podemos formar a partir dos n elementos à escolha é dado por arranjos de n elementos p a p, A n p = n! (n p)! (ii) Se a extracção for efectuada com reposição, o número de conjuntos diferentes de p elementos que podemos formar a partir dos n elementos à escolha é n p. A este número chama-se arranjos com repetição e designa-se por: A n p = n p

Probabilidades e Estatística Isabel Natário 3 3. Finalmente podemos estar interessados em determinar quantos subconjuntos de p elementos conseguimos formar a partir de um conjunto de n elementos, não interessando a ordem pela qual eles saem. Tal número é dados pelas combinações de n elementos p a p: C n p = n! (n p)!p! Repare-se que as combinações são obtidas a partir dos arranjos descontando-lhes as diferentes ordenações do conjunto formado pelos p elementos. Usamos arranjos quando os elementos que escolhemos são distinguíveis entre si e combinações quando não são. Notamos ainda que as combinações podem também ser denotadas por ( n p ) = n C p = C n p e que C n p = C n n p. Exemplo.4 Consideremos as seguintes situações: O número de toilettes possíveis ao combinar 3 gravatas diferentes com 4 camisas são 3 4 = 1. Num teste de escolha múltipla de 10 questões com 3 opções cada, o número de diferentes conjuntos de respostas é 3 10. Num parque de estacionamento com 10 lugares o número de formas distintas em que se aí podem arrumar 6 carros diferentes é de A 10 6 = 151.00. No totoloto, onde de 49 números se tenta acertar num conjunto de 6 números sorteados ao acaso, o número de possíveis chaves é dado por C 49 6 = 13.983.816!.5 Probabilidade condicionada e Teorema de Bayes O cálculo de probabilidades de acontecimentos associados a uma experiência aleatória pode ser alterado quando existe informação disponível para além do espaço amostral da experiência em questão. Vejamos o seguinte exemplo: Exemplo.5 Em determinada aldeia apareceu um surto de cólera, que se pensa estar associado ao consumo de água de um determinado poço. São conhecidas as seguintes proporções relativas à quantidade de pessoas que desenvolveram a doença (representando esse acontecimento pela letra D) e às pessoas que beberam água do referido poço (representando esse acontecimento pela letra B): B B Total D 0.18 0.0 0.0 D 0.01 0.79 0.80 Total 0.19 0.81 1.00

Probabilidades e Estatística Isabel Natário 4 Qual a probabilidade de uma pessoa escolhida ao acaso na população da aldeia ter contraído cólera? P(D) = 0. De entre as pessoas que beberam água do poço, qual a probabilidade de se escolher ao acaso uma pessoa que contraiu cólera? Agora só estamos interessados no universo das pessoas que beberam água do poço, B, pelo que a probabilidade pretendida é: 0.18 0.19 0.95 Repare-se que por sabermos que a pessoa bebeu água do poço tal altera o valor da probabilidade do acontecimento contrair cólera de 0. para 0.95! O espaço de resultados foi encolhido de toda a população da aldeia, Ω, para apenas os que consumiram água do tal poço, B. Isto reflecte-se na forma como o novo acontecimento contrair cólera sabendo (ou condicionado a que) que bebeu água do poço passa a ser designado: D B. A sua probabilidade é dada por: P(D B) = P (D B) P (B) Definição.7 Seja (Ω,S,P) um espaço de probabilidades e seja B S : P(B) > 0. Para A S definimos a probabilidade condicionada de A dado B por: P(A B) = P(A B) P(B) Exercício.1 Provar que se B é um acontecimento tal que P (B) > 0, então P ( B) é uma probabilidade sobre Ω. Teorema.3 (Teorema da probabilidade composta) Seja(Ω, S, P) um espaço de probabilidades e sejam A,B S : P(A) > 0, P(B) > 0. Então, P (A B) = P (A B)P (B) = P (B A)P (A) Nota: Este teorema é facilmente generalizável a mais de dois acontecimentos. Teorema.4 (Teorema da probabilidade total) Seja (Ω, S, P) um espaço de probabilidades e formem {E 1,...,E n } uma partição do espaço de resultados Ω 1, com P (E i ) > 0, i. Dado um qualquer acontecimento A S, tem-se P (A) = P (A E 1 )P (E 1 )+...+P (A E n )P (E n ) Demonstração: Se {E 1...,E n } é uma partição de Ω, então E 1... E n = Ω e E i E j =, i j. Por outro lado, A = (A E 1 )... (A E n ). 1 Ou seja, E 1... E n = Ω e E i E j =, i j.

Probabilidades e Estatística Isabel Natário 5 Como os acontecimentos (A E 1 ),...(A E n ) são disjuntos, pelo axioma da aditividade, P (A) = P (A E 1 )+...+P (A E n ) O que se pretende demonstrar sai finalmente notando que, pelo teorema da probabilidade composta, P (A E i ) = P (A E i )P (E i ), i = 1,,...,n. Teorema.5 (Teorema de Bayes) Seja (Ω,S,P) um espaço de probabilidades e {E 1,...,E n } uma partição do espaço de resultados Ω, com P (E i ) > 0, i. Dado um qualquer acontecimento A S, com P (A) > 0, tem-se P (E i A) = P (A E i )P (E i ) n i=1 P (A E i)p (E i ). Demonstração: Pelos teoremas da probabilidade total e da probabilidade composta e pela definição de probabilidade condicional, P (E i A) = P (E i A) P (A) = P (A E i )P (E i ) n i=1 P (A E i)p (E i ) Exemplo.6 Suponha que existe um teste para diagnosticar uma certa doença, mas que esse teste é falível. Assim sabe-se que, para um indivíduo portador da doença (D), a probabilidade de o teste dar positivo (T) é de 0.98 e que, para um indivíduo são (D), a probabilidade de o teste dar negativo (T) é 0.99. Sabe-se ainda que na população 10% são portadores da doença. Assim: P(T D) = 0.98 P(T D) = 0.99 P(D) = 0.10 A probabilidade de um indivíduo não ter a doença sabendo que o teste deu positivo é de: P(D T) = P(T D)P(D) P(T D)P(D)+P(T D)P(D) = 0.01 0.90 0.98 0.10+(1 0.99) (1 0.10) 0.084 e a probabilidade de um indivíduo ter a doença se o teste deu negativo é de: P(D T) = P(T D)P(D) P(T D)P(D)+P(T D)P(D) = 0.0 0.10 (1 0.98) 0.10+0.99 (1 0.10) 0.00

Probabilidades e Estatística Isabel Natário 6.6 Independência entre acontecimentos Definição.8 Dois acontecimentos A e B dizem-se independentes se e só se P (A B) = P (A)P (B) Teorema.6 Se A e B são acontecimentos independentes, então: P(A B) = P(A) se P(B) > 0 e P(B A) = P(B) se P(A) > 0. Portanto, se dois acontecimentos são independentes, o conhecimento de um deles em nada influencia a probabilidade de ocorrência do outro. Teorema.7 Se A e B são acontecimentos independentes, também o são A e B, A e B e ainda A e B. Exemplo.7 A probabilidade de um atirador acertar no alvo, em cada tiro, é de 0.6, independentemente do tiro. Qual a probabilidade de: a) Serem necessários exactamente 10 tiros para acertar uma vez? 0.4 9 0.6. b) Em três tiros acertar uma vez? C 3 1 0.4 0.6. c) Acertar pela terceira vez ao quinto tiro? C 4 0.4 0.6 3. d) Necessitar de pelo menos 4 tiros para acertar duas vezes? 1 0.6 C 3 1 0.41 0.6..7 Exercícios Propostos.1 Considere a experiência aleatória de lançar simultaneamente dados equilibrados de 4 faces cada, variando estas de 1 a 4 pintas. (a) Descreva o espaço de resultados e o espaço amostral associados a esta experiência. (b) Quais são os elementos de S que descrevem, respectivamente, os acontecimentos sair um único 4, sair pelo menos um 4, sair no máximo um 4?. Num concurso de escultura participam 15 candidatos. De quantas formas diferentes pode o júri atribuir os 1 o, o e 3 o lugares?.3 Quatro casais compraram 8 lugares para o teatro na mesma fila de cadeiras. De quantas formas diferentes se podem sentar se: (a) Os elementos de cada casal se sentarem junto do respectivo par. (b) Todos os homens se sentarem juntos e as mulheres também.