Distribuição de probabilidades



Documentos relacionados
PROBABILIDADE. Aula 5

Exercícios - Distribuição Normal (Gauss)

Distribuição Gaussiana. Modelo Probabilístico para Variáveis Contínuas

Estatística II Antonio Roque Aula 9. Testes de Hipóteses

O comportamento conjunto de duas variáveis quantitativas pode ser observado por meio de um gráfico, denominado diagrama de dispersão.

4Distribuição de. freqüência

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

Elaborado por Eduardo Rebouças Carvalho Hermano Alexandre Lima Rocha DISTRIBUIÇÃO NORMAL

Estatística e Probabilidade. Aula 8 Cap 05. Distribuição normal de probabilidade

Resoluções comentadas de Raciocínio Lógico e Estatística SEFAZ - Analista em Finanças Públicas Prova realizada em 04/12/2011 pelo CEPERJ

Exemplos de Testes de Hipóteses para Médias Populacionais

Eventos independentes

Resoluções comentadas de Raciocínio Lógico e Estatística - SEPLAG APO

Processos Estocásticos

MÉDIA ARITMÉTICA MÉDIA PONDERADA MODA MEDIANA

Faculdade Sagrada Família

MÓDULO 1. I - Estatística Básica

Cotagem de dimensões básicas

Aula 5 Distribuição amostral da média

Aula 4 Estatística Conceitos básicos

Padronização e Escores z. Transformação z Percentis

[ \ x Recordemos o caso mais simples de um VLVWHPD de duas HTXDo}HVOLQHDUHV nas duas LQFyJQLWDV [ e \.

4 Sistemas de Equações Lineares

AV1 - MA (b) Se o comprador preferir efetuar o pagamento à vista, qual deverá ser o valor desse pagamento único? 1 1, , , 980

Seu pé direito nas melhores faculdades

Capítulo 5: Aplicações da Derivada

CAPÍTULO 5 - Exercícios

Os gráficos estão na vida

Variáveis aleatórias contínuas e distribuiçao Normal. Henrique Dantas Neder

CURSO E COLÉGIO APOIO. Professor: Ronaldo Correa

Potenciação no Conjunto dos Números Inteiros - Z

Resolvendo problemas com logaritmos

Disponibilizo a íntegra das 8 questões elaboradas para o Simulado, no qual foram aproveitadas 4 questões, com as respectivas resoluções comentadas.

Apresentação de Dados em Tabelas e Gráficos

2ª fase. 19 de Julho de 2010

3º Ano do Ensino Médio. Aula nº10 Prof. Daniel Szente

Dinâmica de um Sistema de Partículas Faculdade de Engenharia, Arquiteturas e Urbanismo FEAU

Nome: N.º: endereço: data: Telefone: PARA QUEM CURSA O 9 Ọ ANO EM Disciplina: MaTeMÁTiCa

MODELOS PROBABILÍSTICOS MAIS COMUNS VARIÁVEIS ALEATÓRIAS DISCRETAS

Material Teórico - Aplicações das Técnicas Desenvolvidas. Exercícios e Tópicos Relacionados a Combinatória. Segundo Ano do Ensino Médio

Curvas em coordenadas polares

Notas de Cálculo Numérico

1. Os métodos Não-Paramétricos podem ser aplicados a uma ampla diversidade de situações, porque não exigem populações distribuídas normalmente.

Além do Modelo de Bohr

Capítulo 3 Modelos Estatísticos

Exercícios Teóricos Resolvidos

Matemática SSA 2 REVISÃO GERAL 1

MATEMÁTICA. Recenseamento/Sondagem ESTATÍSTICA

Unidade 11 - Probabilidade. Probabilidade Empírica Probabilidade Teórica

Resolução dos Exercícios sobre Derivadas

Análise de Arredondamento em Ponto Flutuante

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo

Cálculo Numérico Faculdade de Engenharia, Arquiteturas e Urbanismo FEAU

Calculando RPM. O s conjuntos formados por polias e correias

Fração como porcentagem. Sexto Ano do Ensino Fundamental. Autor: Prof. Francisco Bruno Holanda Revisor: Prof. Antonio Caminha M.

Material Teórico - Módulo de Métodos sofisticados de contagem. Princípio das Casas dos Pombos. Segundo Ano do Ensino Médio

Trabalho 7 Fila de prioridade usando heap para simulação de atendimento

LISTA 10. = ax + b onde f é uma função decrescente. Podemos afirmar que o valor exato de g(a) é igual a: a) 1 b) 2 c) 3 d) 4

TÉCNICAS DE ANÁLISE DE ORÇAMENTO DE CAPITAL

Aritmética de Ponto Flutuante

Seção Técnica de Ensino 2/8

Um estudo sobre funções contínuas que não são diferenciáveis em nenhum ponto

Exercícios resolvidos sobre Função de probabilidade e densidade de probabilidade

Unidade 5: Sistemas de Representação

Aula 2 Sistemas de Numeração (Revisão)

Probabilidade e Estatística I Antonio Roque Aula 11 Probabilidade Elementar: Novos Conceitos

INE 5111 Gabarito da Lista de Exercícios de Probabilidade INE 5111 LISTA DE EXERCÍCIOS DE PROBABILIDADE

O teste de McNemar. A tabela 2x2. Depois

9 é MATEMÁTICA. 26. O algarismo das unidades de (A) 0. (B) 1. (C) 3. (D) 6. (E) 9.

DETERMINAÇÃO DO TAMANHO DE UMA AMOSTRA

CCI-22 CCI-22. 2) Erros de arredondamento. Matemática Computacional

Sistemas Lineares. Módulo 3 Unidade 10. Para início de conversa... Matemática e suas Tecnologias Matemática

Estatística Descritiva I

Lista de Exercícios - Potenciação

Aula 2 - Cálculo Numérico

QUESTÃO 16 Na figura, temos os gráficos das funções f e g, de em. O valor de gof(4) + fog(1) é:

CURSO: ADMINISTRAÇÃO Prof Dra. Deiby Santos Gouveia Disciplina: Matemática Aplicada OFERTA DE MERCADO

Instruções para a Prova de MATEMÁTICA APLICADA:

Rebites I. Um mecânico tem duas tarefas: consertar

MD Sequências e Indução Matemática 1

MÓDULO 4 DISTRIBUIÇÃO DE FREQÜÊNCIAS

Velocidade Média Velocidade Instantânea Unidade de Grandeza Aceleração vetorial Aceleração tangencial Unidade de aceleração Aceleração centrípeta

UNIVERSIDADE DOS AÇORES Cursos de Sociologia e de Serviço Social Estatística I 1º Semestre 2006/2007

b) a 0 e 0 d) a 0 e 0

Refração da Luz Índice de refração absoluto Índice de refração relativo Leis da refração Reflexão total da luz Lentes Esféricas Vergência de uma lente

ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORES SISTEMAS DE NUMERAÇÃO: REPRESENTAÇÃO EM PONTO FLUTUANTE. Prof. Dr. Daniel Caetano

A finalidade dos testes de hipóteses paramétrico é avaliar afirmações sobre os valores dos parâmetros populacionais.

A Matemática do ENEM em Bizus

Frações. Números Racionais

Laboratório de Física I - EAD- UESC 2011

7 AULA. Curvas Polares LIVRO. META Estudar as curvas planas em coordenadas polares (Curvas Polares).

REPRESENTAÇÃO DE DADOS EM SISTEMAS DE COMPUTAÇÃO AULA 03 Arquitetura de Computadores Gil Eduardo de Andrade

36ª Olimpíada Brasileira de Matemática GABARITO Segunda Fase

Gráficos estatísticos: histograma. Série Software ferramenta

Ajuste de Curvas. Ajuste de Curvas

Análise de regressão linear simples. Departamento de Matemática Escola Superior de Tecnologia de Viseu

Energia Eólica. Atividade de Aprendizagem 3. Eixo(s) temático(s) Ciência e tecnologia / vida e ambiente

Realizando cálculos para o aparelho divisor (I)

Equações Diferenciais

N1Q1 Solução. a) Há várias formas de se cobrir o tabuleiro usando somente peças do tipo A; a figura mostra duas delas.

Transcrição:

Luiz Carlos Terra Para que você possa compreender a parte da estatística que trata de estimação de valores, é necessário que tenha uma boa noção sobre o conceito de distribuição de probabilidades e curva normal. (Luiz Carlos Terra) 1

Objetivos Para que você possa compreender a parte da estatística que trata de estimação de valores, é necessário que tenha uma boa noção sobre o conceito de distribuição de probabilidades e curva normal. Tópicos 1- Variável aleatória discreta e contínua. 2- Distribuição discreta de probabilidades. 3- Distribuição contínua de probabilidades. 4- Curva normal gráfico. 5- Saiba mais. 6- Bibliografia. 1 - Variável aleatória discreta e contínua No trecho sobre Fundamentos da Estatística, você teve conhecimento do conceito de variável aleatória, que podemos recordar como uma variável cujo valor depende do acaso. As variáveis aleatórias são discretas ou contínuas? Uma variável aleatória é considerada discreta se seus valores podem ser contados. Ex.: número de vendedores de uma empresa, número de sapatos vendidos, número de livros numa estante etc.. Exemplo: O espaço amostral representado pelo lançamento de uma moeda é S = {(C a, C a ), (C a, C o ), (C o, C a ), (C o, C o )}. Se a variável aleatória X representa o número de caras que aparecem a cada ponto amostral, um número X pode ser associado de acordo com a tabela abaixo: PONTO AMOSTRAL (C a, C a ), (C a, C o ), (C o, C a ), (C o, C o ), X (variável aleatória = número de caras) 2 1 1 0 2

Uma variável aleatória é considerada contínua quando seu valor não é um número inteiro e existe entre um número inteiro e outro uma indeterminada quantidade de valores. Por exemplo, a altura das pessoas é uma variável contínua assim como outras unidades de medição. A distinção entre variáveis aleatórias discretas e contínuas se faz necessária porque a utilização de diferentes modelos (distribuições) de probabilidade depende do tipo de variável aleatória considerada. 2 - Distribuição discreta de probabilidades Uma distribuição de probabilidades é uma distribuição de freqüências relativas para os resultados de um espaço amostral e indica a proporção de vezes em que a variável aleatória assume cada um dos diversos valores. Por exemplo, vamos analisar a tabela abaixo, em que está registrada a demanda diária de locação de vans para turismo durante o período de 50 dias. X- número de vans alugadas em um dia. 3 4 5 6 7 8 Número de dias em que o mesmo nº de vans foram alugadas. 3 7 12 14 4 50 Probabilidade P(X)(ou freqüência relativa). 0,06 3/50 0,14-7/50 0,24-12/50 0,28 14/50 0,20 10/50 0,08 4/50 1,00 A variável x número de vans alugadas por dia assume os valores 3, 4, 5, 6, 7, 8. Para cada valor de x i há pontos do espaço amostral correspondentes (número de dias em que o mesmo número de vans foi alugado), ou seja, 3, 7, 12, 14, 10, 4,. Associamos, então, a cada valor x i, a probabilidade P i de ocorrência de tais pontos no espaço amostral. Assim, temos que a soma de todas as probabilidades (freqüências relativas) é igual a 100% ou 1. Pi = 100% = (6% + 14% + 24% + 28% + 20% + 8%) Os valores de x i e seus correspondentes P i definem uma distribuição de probabilidade. 3

As freqüências relativas observadas foram convertidas, na última coluna da tabela, em probabilidades para um período de 50 dias. Podemos, então, observar que a probabilidade de serem solicitadas, exatamente, sete vans em um dia, aleatoriamente escolhidas no período, é de 20% e a probabilidade de serem solicitadas seis ou mais é de 56% ( 28% + 20% + 8%). Todos esses valores determinam a distribuição de probabilidade da variável aleatória X. 3 - Distribuição contínua de probabilidades Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é a distribuição normal. Nas observações diárias, notamos que alguns eventos ocorrem com mais freqüência que outros. Uma pessoa muito alta ou muito baixa se destaca, porque a maioria das pessoas está na faixa de 1,60 a 1,80 m. O mesmo acontece com o peso das pessoas, quociente de inteligência e muitos outros fenômenos. Ao colocarmos a distribuição de probabilidades dessas variáveis em um gráfico, observaremos que ela gerará uma curva em que a maioria dos valores se concentrará próximo à média e poucos valores cairão muito acima ou muito abaixo dela. Essa curva tem o nome de curva normal e é também conhecida como CURVA DE GAUSS, estudioso do assunto do século XIX. Ela é caracterizada por dois parâmetros - a média e o desvio padrão - e tem as seguintes propriedades: O ponto máximo da distribuição ocorre no valor médio, situado no centro da curva. A curva é simétrica em torno da média, ou seja, a probabilidade de valores abaixo ou acima do valor médio é de 50%. A forma da curva depende da magnitude do desvio padrão dos dados. Se o valor do desvio padrão for pequeno, indicando pouca dispersão, a curva se apresenta mais alta e estreita, o que indicará maior concentração de valores próximos à média. A área total sob a curva normal é igual à unidade e representa probabilidade integral de 100%. A área sob a curva normal, que mede a probabilidade, também é definida em função do número de desvios padrão dos valores em torno da média. A probabilidade de valores entre a média com um desvio padrão para cima e a média com um desvio padrão para baixo é de aproximadamente 68,3 %. A probabilidade de valores entre a média com dois desvios padrão para cima e a média com dois desvios padrão para baixo é de aproximadamente 95,5%. A probabilidade de valores entre a média com três desvios padrão para cima e a média com três desvios padrão para baixo é de aproximadamente 99,7%. 4

4 - Curva normal- gráfico 4 A área sob a curva representa a probabilidade de obtenção de determinados valores, que se distribuem normalmente. Observe, na coluna vertical do gráfico, que a maioria dos valores da variável observada, aproximadamente 25, encontra-se com valores iguais à média e que poucos valores (abaixo de 5) estão muito distantes da média (m), tanto para cima como para baixo. Quando se trabalha com distâncias contadas a partir da média, que são números inteiros de desvios padrão (ou seja, 1, 2 ou 3), desvios acima ou abaixo da média, a probabilidade, como já vimos acima, é de respectivamente 68,3 %; 95,5 % e 99,7 %. Como se calcularia a probabilidade de valores que estão situados em intervalos não expressos em números inteiros de desvios padrão? Exemplo: se estabelecermos um valor para a probabilidade que gere 1,30 de desvio padrão da média, saberíamos que esse é superior à probabilidade de 34,13 % (correspondente à distância de um desvio padrão) e menor que 47,72% (correspondente à distância de dois desvios padrão). O cálculo dessa probabilidade é difícil, pois envolve um cálculo matemático bastante complexo. Entretanto, esse problema desaparece ao utilizarmos uma tabela estatística em que todas as probabilidades já estão calculadas. Para isso, basta fazer uma transformação de valores, em que se calcula a distância do valor desejado em relação à média da distribuição em número de desvios padrão. 5

Esse processo produz um valor chamado escore Z distribuição normal reduzida ou, ainda, escore padronizado, que indica, em unidades de desvios padrão, o sentido e o grau com que um dado valor bruto afasta-se da média da distribuição à qual pertence. O cálculo seria assim realizado Z = X - m s onde x = qualquer valor da variável x m = média da distribuição s = desvio padrão da população Z = escore padronizado, ou seja, número de desvios padrão entre o valor de probabilidade que se quer calcular e a média da distribuição. Em SAIBA MAIS, você aprenderá a usar a tabela com a variável Z padronizada. O mais importante para que você entenda com mais facilidade o assunto de estimação de valores, é que deixe registrado que, em distribuições normais de probabilidades de variáveis aleatórias contínuas, os valores são distribuídos em torno da média e as probabilidades são calculadas em função da distância representada em números de desvios padrão do valor desejado até a média. Simplificando, se as alturas de um grupo de 100 pessoas forem levantadas e se, ao calcularmos média e desvio padrão, obtivermos 1,70 para o valor de média e 10 cm para desvio padrão, podemos afirmar o seguinte: - a probabilidade de uma pessoa, escolhida aleatoriamente, medir em 1,60 m e 1,80 m é de aproximadamente 68 % calculado da seguinte forma: média = 1,70 + 1 desvio padrão = 10 cm = 1,80m. média = 1,60 1 desvio padrão = 10 cm = 1,60 m - a probabilidade de uma pessoa, escolhida aleatoriamente, medir entre 1,50 e 1,90 m é de aproximadamente 95,5% - calculado da seguinte forma: Média + 2 desvios padrão = 1,70 + 2(0,10) = 1,90 m - 2 desvios padrão = 1,70 2(0,10) = 1,70 m média - a probabilidade de uma pessoa escolhida aleatoriamente medir entre 1,40 e 2.00 m é de aproximadamente 99,7% (não é exatamente 100%, pois a curva vai de menos infinito à mais infinito) - calculado da seguinte forma: 1,70 + 3(0,10) = 2,00 m 1,70 3(0,10) = 1,40 m 6

Na aula de Estimação de Valores, o entendimento da determinação de probabilidade pela curva normal é necessário, pois o conceito de intervalo de confiança deriva dessa situação de normalidade e, como 68,3%, 95,5% e 99,7% é a probabilidade de se encontrar valores que estejam respectivamente entre 1, 2 ou 3 desvios padrão distantes da média (para mais e para menos), quando se quer estimar um intervalo de valores em torno da média de 95%, o número de desvios padrão em torno da média fica bem próximo de 2, ou seja, 1,96 desvios padrão. Para ilustrar a utilidade da tabela de valores padronizados em cálculo de probabilidade sob a curva normal, analisemos o seguinte exemplo: Exemplo Consideremos X a variável aleatória que representa os diâmetros de parafusos produzidos por certa máquina. Vamos supor que essa variável tenha distribuição normal com média m= 2 cm e desvio padrão s = 0,04 cm. Pode haver interesse em conhecer a probabilidade de um parafuso ter diâmetro com valor entre 2 e 2,05 cm. É fácil notar que essa probabilidade, indicada por P(2 < X < 2,05), corresponde à área da figura, exposta abaixo, entre 2,0 e 2,5 cm. saiba mais Se X é uma variável aleatória com distribuição normal, cuja média é m e o desvio padrão é s, temos a variável Z, que corresponde à variável padronizada e indica o número de desvios padrão em torno da média assim calculada: z = X µ σ 7

saiba mais Onde: z = número de desvios padrão a contar da média; X = valor arbitrário; m = a média da distribuição normal; s = o desvio padrão. Notemos que Z tem sinal negativo para valores de x que forem inferiores à média e sinal positivo para valores superiores à média. Queremos calcular P(2 < X < 2,05). Para obter essa probabilidade, precisamos, em primeiro lugar, calcular o valor de Z: Z = = = = 1,25 Donde: P (2 < X < 2,05) = P (0 < Z < 1,25) Procuremos na tabela de distribuições normal Z = 1,25: Na primeira coluna, encontramos o valor 1,2. Em seguida, encontramos, na primeira linha, o valor 5, que corresponde ao último algarismo do número 1,25. Na intersecção da linha e coluna correspondentes, encontramos o valor 0,3944, o que nos permite escrever: P(0 < Z < 1,25) = 0,3944 Assim, a probabilidade de um parafuso fabricado por essa máquina apresentar um diâmetro entre a média m = 2 e o valor x = 2,05 é 0,3944 = 39,44%. A tabela sempre registra a porcentagem da área que vai de m até um dado z (e nunca a % associada a um Z particular ou à área situada além dele). Se subtrairmos 39,44% de 50%, verificamos que pouco mais de 10% (10,56%) correspondem a 2,05 cm ou além desse valor, ou seja, 10% de parafusos possuem diâmetros igual ou maior que 2,05 cm. 8

saiba mais 9

Anotações: bibliografia Básica SPIEGEL, Murray R. Estatística McGraw- Hill. Stevenson, William Estatística Aplicada â Administração Ed. Harbra. Complementar Kasmier, Leonard J. Estatística Aplicada à Economia e Administração ed. Makron Books. 10