Princípios de Modelagem Matemática Aula 09

Documentos relacionados
Princípios de Modelagem Matemática Aula 10

Lucas Santana da Cunha de junho de 2017

Prof. Dr. Lucas Santana da Cunha de maio de 2018 Londrina

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Variáveis Aleatórias

Variáveis Aleatórias

1 Noções de Probabilidade

1 Probabilidade: Axiomas e Propriedades

Inferência Estatística:

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva

LCE Introdução à Bioestatística Florestal 3. Variáveis aleatórias

Segunda Lista de Exercícios Cálculo de Probabilidades II Prof. Michel H. Montoril

Variáveis Aleatórias Discretas 1/1

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Variáveis Aleatórias

Unidade I ESTATÍSTICA APLICADA. Prof. Mauricio Fanno

UNIVERSIDADE FEDERAL DA PARAÍBA. Variáveis Aleatórias. Departamento de Estatística Luiz Medeiros

Variáveis Aleatórias. Probabilidade e Estatística. Prof. Dr. Narciso Gonçalves da Silva

Introdução à probabilidade e à estatística II. Prof. Alexandre G Patriota Sala: 298A Site:

PROBABILIDADE. Curso: Logística e Transportes Disciplina: Estatística Profa. Eliane Cabariti

DA PARAÍBA. Variáveis Aleatórias. Departamento de Estatística Luiz Medeiros

Estatística (MAD231) Turma: IGA. Período: 2018/2

MOQ-12: PROBABILIDADES E PROCESSOS ESTOCÁSTICOS. VA s e Distribuições

Variáveis Aleatórias. Prof. Tarciana Liberal Departamento de Estatística - UFPB

Cálculo das Probabilidades e Estatística I

Lucas Santana da Cunha 23 de maio de 2018 Londrina

Cursos de Licenciatura em Ensino de Matemática e de EGI Teoria de Probabilidade

Parte 4 Variáveis aleatórias

Aproximação da Distribuição Binomial pela Distribuição Normal

Noções de Probabilidade parte I

Física Geral. Incertezas em Medidas Diretas

MAT 461 Tópicos de Matemática II Aula 5: Resumo de Probabilidade

Prof. Eduardo Bezerra. 6 de abril de 2018

Estatística e Probabilidade Aula 05 Distribuições de Probabilidades. Prof. Gabriel Bádue

Uma estatística é uma característica da amostra. Ou seja, se

Teoria das Filas aplicadas a Sistemas Computacionais. Aula 08

Estatística Aplicada

Intervalos de Confiança

Probabilidade I. Departamento de Estatística. Universidade Federal da Paraíba. Prof. Tarciana Liberal (UFPB) Aula 3 03/14 1 / 20

i. f Y (y, θ) = 1/θ... 0 y θ 0... y < 0 ou y > θ Se a amostra selecionada foi ( ), qual será a estimativa para θ?

Bioestatística F. Modelo Binomial. Enrico A. Colosimo

Probabilidade. Variáveis Aleatórias Distribuição de Probabilidade

Aula 2. ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos

Estatística Aplicada II. } Revisão: Probabilidade } Propriedades da Média Amostral

2. EXERCÍCIOS PROPOSTOS SOBRE V.A. E DISTRIB.PROBAB.

Probabilidades. Wagner H. Bonat Elias T. Krainski Fernando P. Mayer

Inferência Estatística

a) o time ganhe 25 jogos ou mais; b) o time ganhe mais jogos contra times da classe A do que da classe B.

Variáveis Aleatórias. Prof. Luiz Medeiros Departamento de Estatística - UFPB

Métodos Estatísticos

Variável Aleatória. Gilson Barbosa Dourado 6 de agosto de 2008

Física Geral - Laboratório 2016/2. Estimativas e erros em medidas diretas (II) Níveis de confiança, compatibilidade e combinação

ANÁLISE DE RESULTADOS

NOÇÕES RÁPIDAS DE ESTATÍSTICA E TRATAMENTO DE DADOS

Probabilidade I. Departamento de Estatística. Universidade Federal da Paraíba. Prof. Tarciana Liberal (UFPB) Aula 1 04/14 1 / 35

Variáveis Aleatórias. Prof. Tarciana Liberal Departamento de Estatística - UFPB

Modelos de Distribuição PARA COMPUTAÇÃO

Cap. 4 - Estimação por Intervalo

Probabilidade. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Probabilidade I. Departamento de Estatística. Universidade Federal da Paraíba. Prof. Tarciana Liberal (UFPB) Aula Distribuição Geométrica 08/14 1 / 13

Estatística (MAD231) Turma: IGA. Período: 2017/2

Avaliação e Desempenho Aula 5

AULA 3. Probabilidade

VARIÁVEIS ALEATÓRIAS 1

Estatística. O que é Estatística? Estatística pode ser: Estatística Descritiva. Ivonete Melo de Carvalho. Conteúdo

Variáveis Aleatórias. Henrique Dantas Neder. April 26, Instituto de Economia - Universidade Federal de Uberlândia

Probabilidade I. Departamento de Estatística. Universidade Federal da Paraíba. Prof. Tarciana Liberal (UFPB) Aula Probabilidade I 07/16 1 / 23

1 Distribuições Discretas de Probabilidade

1 Variáveis Aleatórias

Variáveis Aleatórias Discretas

CAPÍTULO 3 POPULAÇÃO E AMOSTRA

Introdução à Inferência Estatística

Estatística Básica. Variáveis Aleatórias Contínuas. Renato Dourado Maia. Instituto de Ciências Agrárias. Universidade Federal de Minas Gerais

Estatística. Probabilidade. Conteúdo. Objetivos. Definições. Probabilidade: regras e aplicações. Distribuição Discreta e Distribuição Normal.

Confiabilidade de sistemas. Uma importante aplicação de probabilidade nas engenharias é no estudo da confiabilidade de sistemas.

VARIÁVEIS ALEATÓRIAS

AST203-CVR 4-1 AST203-CVR. Observação eletromagnética. Processamento de sinais importante em várias áreas, além da astronomia telecomunicações

Variável aleatória. O resultado de um experimento aleatório é designado variável aleatória (X)

Probabilidade. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

ESTATÍSTICA EXPLORATÓRIA

14/03/2014. Tratamento de Incertezas TIC Aula 1. Conteúdo Espaços Amostrais e Probabilidade. Revisão de conjuntos. Modelos Probabilísticos

Efeito. Causas. Determinístico. Sistema Real. Probabilístico. Experiência para o qual o. modelo probabilístico é adequado.

Probabilidades. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Métodos Quantitativos para Ciência da Computação Experimental

Métodos Computacionais em Física

Teoria das Filas aplicadas a Sistemas Computacionais. Aula 09

AULA 3 - Modelos probabiĺısticos, axiomas da probabilidade, espaços amostrais

Instituto Universitário de Lisboa (ISCTE-IUL) Licenciaturas em Gestão e Finanças & Contabilidade. Estatística I - Exame de 1ª época

Distribuições Estatísticas

PEDRO A. BARBETTA Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.

Notas de Aula. Copyright 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.

Inferência Estatística

Capítulo 4 Inferência Estatística

PARTE TEÓRICA Perguntas de escolha múltipla

PROBABILIDADES PROBABILIDADE DE UM EVENTO EM UM ESPAÇO AMOSTRAL FINITO

VARIÁVEIS ALEATÓRIAS 1

Tratamento de Incertezas TIC MINTER-IFMT

Distribuições Amostrais e Estimação Pontual de Parâmetros

Universidade Federal de Goiás Instituto de Matemática e Estatística

3. Estimação pontual USP-ICMC-SME. USP-ICMC-SME () 3. Estimação pontual / 25

INTRODUÇÃO À PROBABILIDADE

Transcrição:

Princípios de Modelagem Matemática Aula 09 Prof. José Geraldo DFM CEFET/MG 12 de maio de 2014

1 Modelos estatísticos e estimação de parâmetros

A verificação de um modelo matemático demanda a realização de experimentos (observação experimental/simulação computacional). Experimentos bem planejados devem ser passíveis de serem reproduzidos, i.e., conduzidos por diferentes pesquisadores e em diferentes laboratórios; passíveis de serem repetidos, i.e., conduzidos pelo mesmo pesquisador, no mesmo laboratório, com os mesmos instrumentos.

A precisão e a acurácia de um processo de medição são avaliadas pela repetição das medidas sob as mesmas condições experimentais: quanto mais próximos entre si forem os resultados medidos, mais precisa é a medida desvio padrão dos resultados; quanto mais próxima a média dos resultados estiver de um valor de referência, mais acurada é a medida.

Acurácia ρ(x) x R x Precisão x Figura: Significado estatístico de acurácia e precisão. O gráfico acima representa a distribuição de probabilidades ρ (x) na medida de uma grandeza x. A acurácia de um processo de medição é determinada pela diferença entre a média dos valores obtidos x e um valor de referência estabelecido x R. A precisão é determinada pela largura da distribuição de probabilidades e quantifica o quanto os resultados individuais divergem entre si.

Muitos fenômenos na natureza e na sociedade não são determinísticos aleatoriedade está presente. Em muitas situações, a complexidade é fonte de aleatoriedade, como no lançamento de uma moeda: o movimento é governado pelas leis de Newton (determinísticas) mas o resultado final é imprevisível pois depende sensivelmente de fatores e variáveis sobre os quais não se tem acesso ignorância. Fenômenos aleatórios ou estocásticos são passíveis de modelamento matemático uso de métodos e técnicas não-determinísticas (teoria da probabilidade, processos estocásticos, estatística).

Um modelo estatístico é caracterizado pela presença de uma ou mais variáveis estocásticas. Uma variável estocástica é uma função X : Ω R que toma valores no espaço amostral Ω e assume valores reais com dada probabilidade. Por exemplo, podemos associar o resultado de se obter "cara" (K) no lançamento de uma moeda o valor 1 e ao resultado "coroa" (C) o valor 1. Esta associação é descrita pela variável aleatória X : {K, C} { 1, 1}, onde X (K) = 1 e X (C) = 1. Se a moeda é honesta, X assume os valores +1 e 1 com probabilidade 1/2.

Modelos estatísticos podem associar a variáveis estocásticas distribuições de probabilidade. Por exemplo, no caso de uma moeda honesta, a distribuição de probabilidades é discreta Pr (K) = Pr (C) = 1/2.

Em muitas situações, a forma geral da distribuição é conjecturada, mas seus parâmetros não são conhecidos para o fenômeno estudado ou para uma realização particular do modelo. Por exemplo, para se modelar o resultado obtido ao se lançar uma moeda, sem conhecer ou assumir qualquer propriedade dela, deve-se conjecturar que a distribuição de probabilidades de seus possíveis resultados é Pr (K) = 1 Pr (C) = p, onde p é o parâmetro da distribuição a ser determinado. A determinação (na verdade, estimação) deste parâmetro é realizada por uma série de experimentos (o lançamento da moeda), cujos resultados aleatórios formam uma base estatística a partir da qual se extrai o parâmetro p. Os métodos mais difundidos para estimação de parâmetros de uma distribuição se valem de dois princípios: princípio da máxima verossimilhança (PMV); princípio da máxima entropia (MaxEnt).

A análise estatística de experimentos pode não envolver toda a população de objetos em estudo, pois a população é muito numerosa; alguns experimentos são destrutivos. Nestes casos, seleciona-se uma amostra da população de interesse, i.e., seleciona-se uma parte representativa de uma dada população aleatoriamente. Se uma amostra é escolhida de maneira adequada, espera-se que sua estatística reflita a estatística de toda a população.

Amostragem mal feita pode levar a resultados, conclusões e interpretações inconsistentes. Populações, em geral, são compostas por indivíduos heterogêneos a amostragem deve refletir esta heterogeneidade. O número de indivíduos escolhidos na população para formar a amostra deve ser suficientemente grande para garantir que a estatística amostral melhor se aproxime da estatística da população. A amostragem deve ser aleatória, para evitar tendência.

Exercícios Os exercícios a seguir foram retirados de exemplos do livro D. Kahneman, Rápido e Devagar: Duas Formas de Pensar (Objetiva, Rio de Janeiro, 2012). 1. A sequência de meninos e meninas nascidos em uma determinada maternidade é aleatória; a probabilidade de nascimento de menino é aproximadamente igual à probabilidade de nascimento de menina; cada nascimento é independente do outro e o número de meninos e meninas que nasceram nas últimas horas não determina o sexo do bebê que nascerá a seguir. Qual das seguintes sequências de seis nascimentos é a mais provável? Justifique. 1 2 3

Exercícios 2. Pessoas que têm doutorado têm maior probabilidade de assinar o jornal Folha de São Paulo. Você encontra uma pessoa lendo a Folha de São Paulo no metrô. Se você tivesse que apostar em uma descrição desta pessoa, qual das seguintes você escolheria? Justifique. 1 Ela tem doutorado. 2 Ela não tem diploma universitário.

Exercícios 3. Na maternidade A nascem, por dia, cerca de 45 crianças e na maternidade B, cerca de 15 crianças. Ao longo de um ano, 50% dos bebês nascidos em ambas maternidades são meninos. Esta percentagem, entretanto, pode variar de um dia para o outro. Em determinados dias, pode ser maior que 50%, em outros pode ser menor. Durante o período de um ano, cada maternidade registra os dias em que mais de 60% dos bebês eram meninos. Qual hospital provavelmente registrou o maior número de dias desses? 1 O hospital A. 2 O hospital B. 3 Ambos hospitais registraram o mesmo número de dias.

A estatística de uma dada população é descrita por uma distribuição de probabilidades. Digamos que a grandeza de interesse é representada pela variável aleatória X : Ω R. Uma distribuição de probabilidades associa uma determinada probabilidade a um valor ou conjunto de valores assumido por X.

Se o espaço amostral Ω é enumerável, dizemos que X é uma variável aleatória discreta e a distribuição de probabilidades associada é representada por p (x). Exemplos de espaços amostrais discretos: resultado obtido no lançamento de uma moeda: Ω = {K, C}; resultado obtido no lançamento de um dado: Ω = {1, 2, 3, 4, 5, 6}; resultado de um sorteio da Mega-Sena: Ω = {(1, 2, 3, 4, 5, 6), (1, 2, 3, 4, 5, 7),..., (55, 56, 57, 58, 59, 60)}.

No caso de um dado de seis faces honesto, a distribuição de probabilidades associada é p (1) = p (2) =... = p (6) = 1/6. Se X é uma variável aleatória discreta que assume valores no conjunto {x 1, x 2,...} então p (x i ) = p i, com 0 p i 1 e p i = 1. i

Se o espaço amostral Ω é não-enumerável, dizemos que X é uma variável aleatória contínua e a distribuição de probabilidades associada é representada por ρ (x). Exemplos de espaços amostrais contínuos: peso de um indivíduo, em quilogramas; diâmetro de um parafuso, em milímetros; tempo de espera de uma determinada linha de ônibus, em segundos. Para este caso, ρ (x) também é conhecida como densidade de probabilidade.

Suponha que X represente o peso, em quilogramas, de uma criança americana do sexo masculino com idade entre 0 e 2 anos. A densidade de probabilidade associada é ρ (x). A probabilidade de que o peso de uma criança americana do sexo masculino com idade entre 0 e 2 anos esteja na faixa 4 kg X 5 kg é dada por Pr (4 kg X 5 kg) = ˆ 5 4 ρ (x) dx. Se X é uma variável aleatória contínua que assume valores no conjunto I R, então ˆ Pr (x S) = ρ (x) dx, com 0 Pr (x S) 1 e S ˆ I ρ (x) dx = 1. Aqui, S é algumprof. subconjunto José Geraldo de Princípios I. de Modelagem Matemática Aula 09

Média e desvio padrão Como vimos, a estatística da amostra e a estatística da população podem diferir (é o caso mais frequente) uma boa amostragem deve produzir uma estatística próxima da estatística da população. É conveniente distinguirmos as diferentes quantidades associadas à amostra e à população.

Média e desvio padrão Seja {x i } i=1...n o conjunto amostral de medidas tomadas da grandeza X. A média amostral é definida por x = 1 N x i. (1) N O desvio padrão amostral é dado por [ ] 1 N 1 2 s = (x i x) 2. (2) N 1 i=1 Esta quantidade está diretamente associada à variância ou ao desvio quadrático médio da amostra, dado por s 2 = 1 N 1 i=1 N (x i x) 2. (3) i=1

Média e desvio padrão A média ou valor esperado de uma determinada grandeza X que obedece à distribuição de probabilidades discreta (resp. contínua) p (x) (resp. ρ (x)) é dada por x = µ (X ) = i p (x i ) x i (4) ou ˆ x = µ (X ) = xρ (x) dx (5) I

Média e desvio padrão O desvio padrão de uma determinada grandeza X que obedece à distribuição de probabilidades discreta (resp. contínua) p (x) (resp. ρ (x)) com média µ é dada por σ (X ) = p (x i ) (x i µ) 2 (6) i ou ˆ σ (X ) = I (x µ) 2 ρ (x) dx (7)

Exercício 1 O desvio padrão de uma variável aleatória X que obedece a uma dada distribuição de probabilidades é definido como σ (X ) = E (X E (X )) 2, onde E (Y ) indica valor esperado da variável aleatória Y. Verifique que a expressão acima é equivalente a σ (X ) = E (X 2 ) E 2 (X ).