Princípios de Modelagem Matemática Aula 09

Princípios de Modelagem Matemática Aula 09 Prof. José Geraldo DFM CEFET/MG 12 de maio de 2014

1 Modelos estatísticos e estimação de parâmetros

A verificação de um modelo matemático demanda a realização de experimentos (observação experimental/simulação computacional). Experimentos bem planejados devem ser passíveis de serem reproduzidos, i.e., conduzidos por diferentes pesquisadores e em diferentes laboratórios; passíveis de serem repetidos, i.e., conduzidos pelo mesmo pesquisador, no mesmo laboratório, com os mesmos instrumentos.

A precisão e a acurácia de um processo de medição são avaliadas pela repetição das medidas sob as mesmas condições experimentais: quanto mais próximos entre si forem os resultados medidos, mais precisa é a medida desvio padrão dos resultados; quanto mais próxima a média dos resultados estiver de um valor de referência, mais acurada é a medida.

Acurácia ρ(x) x R x Precisão x Figura: Significado estatístico de acurácia e precisão. O gráfico acima representa a distribuição de probabilidades ρ (x) na medida de uma grandeza x. A acurácia de um processo de medição é determinada pela diferença entre a média dos valores obtidos x e um valor de referência estabelecido x R. A precisão é determinada pela largura da distribuição de probabilidades e quantifica o quanto os resultados individuais divergem entre si.

Muitos fenômenos na natureza e na sociedade não são determinísticos aleatoriedade está presente. Em muitas situações, a complexidade é fonte de aleatoriedade, como no lançamento de uma moeda: o movimento é governado pelas leis de Newton (determinísticas) mas o resultado final é imprevisível pois depende sensivelmente de fatores e variáveis sobre os quais não se tem acesso ignorância. Fenômenos aleatórios ou estocásticos são passíveis de modelamento matemático uso de métodos e técnicas não-determinísticas (teoria da probabilidade, processos estocásticos, estatística).

Um modelo estatístico é caracterizado pela presença de uma ou mais variáveis estocásticas. Uma variável estocástica é uma função X : Ω R que toma valores no espaço amostral Ω e assume valores reais com dada probabilidade. Por exemplo, podemos associar o resultado de se obter "cara" (K) no lançamento de uma moeda o valor 1 e ao resultado "coroa" (C) o valor 1. Esta associação é descrita pela variável aleatória X : {K, C} { 1, 1}, onde X (K) = 1 e X (C) = 1. Se a moeda é honesta, X assume os valores +1 e 1 com probabilidade 1/2.

Modelos estatísticos podem associar a variáveis estocásticas distribuições de probabilidade. Por exemplo, no caso de uma moeda honesta, a distribuição de probabilidades é discreta Pr (K) = Pr (C) = 1/2.

Em muitas situações, a forma geral da distribuição é conjecturada, mas seus parâmetros não são conhecidos para o fenômeno estudado ou para uma realização particular do modelo. Por exemplo, para se modelar o resultado obtido ao se lançar uma moeda, sem conhecer ou assumir qualquer propriedade dela, deve-se conjecturar que a distribuição de probabilidades de seus possíveis resultados é Pr (K) = 1 Pr (C) = p, onde p é o parâmetro da distribuição a ser determinado. A determinação (na verdade, estimação) deste parâmetro é realizada por uma série de experimentos (o lançamento da moeda), cujos resultados aleatórios formam uma base estatística a partir da qual se extrai o parâmetro p. Os métodos mais difundidos para estimação de parâmetros de uma distribuição se valem de dois princípios: princípio da máxima verossimilhança (PMV); princípio da máxima entropia (MaxEnt).

A análise estatística de experimentos pode não envolver toda a população de objetos em estudo, pois a população é muito numerosa; alguns experimentos são destrutivos. Nestes casos, seleciona-se uma amostra da população de interesse, i.e., seleciona-se uma parte representativa de uma dada população aleatoriamente. Se uma amostra é escolhida de maneira adequada, espera-se que sua estatística reflita a estatística de toda a população.

Amostragem mal feita pode levar a resultados, conclusões e interpretações inconsistentes. Populações, em geral, são compostas por indivíduos heterogêneos a amostragem deve refletir esta heterogeneidade. O número de indivíduos escolhidos na população para formar a amostra deve ser suficientemente grande para garantir que a estatística amostral melhor se aproxime da estatística da população. A amostragem deve ser aleatória, para evitar tendência.

Exercícios Os exercícios a seguir foram retirados de exemplos do livro D. Kahneman, Rápido e Devagar: Duas Formas de Pensar (Objetiva, Rio de Janeiro, 2012). 1. A sequência de meninos e meninas nascidos em uma determinada maternidade é aleatória; a probabilidade de nascimento de menino é aproximadamente igual à probabilidade de nascimento de menina; cada nascimento é independente do outro e o número de meninos e meninas que nasceram nas últimas horas não determina o sexo do bebê que nascerá a seguir. Qual das seguintes sequências de seis nascimentos é a mais provável? Justifique. 1 2 3

Exercícios 2. Pessoas que têm doutorado têm maior probabilidade de assinar o jornal Folha de São Paulo. Você encontra uma pessoa lendo a Folha de São Paulo no metrô. Se você tivesse que apostar em uma descrição desta pessoa, qual das seguintes você escolheria? Justifique. 1 Ela tem doutorado. 2 Ela não tem diploma universitário.

Exercícios 3. Na maternidade A nascem, por dia, cerca de 45 crianças e na maternidade B, cerca de 15 crianças. Ao longo de um ano, 50% dos bebês nascidos em ambas maternidades são meninos. Esta percentagem, entretanto, pode variar de um dia para o outro. Em determinados dias, pode ser maior que 50%, em outros pode ser menor. Durante o período de um ano, cada maternidade registra os dias em que mais de 60% dos bebês eram meninos. Qual hospital provavelmente registrou o maior número de dias desses? 1 O hospital A. 2 O hospital B. 3 Ambos hospitais registraram o mesmo número de dias.

A estatística de uma dada população é descrita por uma distribuição de probabilidades. Digamos que a grandeza de interesse é representada pela variável aleatória X : Ω R. Uma distribuição de probabilidades associa uma determinada probabilidade a um valor ou conjunto de valores assumido por X.

Se o espaço amostral Ω é enumerável, dizemos que X é uma variável aleatória discreta e a distribuição de probabilidades associada é representada por p (x). Exemplos de espaços amostrais discretos: resultado obtido no lançamento de uma moeda: Ω = {K, C}; resultado obtido no lançamento de um dado: Ω = {1, 2, 3, 4, 5, 6}; resultado de um sorteio da Mega-Sena: Ω = {(1, 2, 3, 4, 5, 6), (1, 2, 3, 4, 5, 7),..., (55, 56, 57, 58, 59, 60)}.

No caso de um dado de seis faces honesto, a distribuição de probabilidades associada é p (1) = p (2) =... = p (6) = 1/6. Se X é uma variável aleatória discreta que assume valores no conjunto {x 1, x 2,...} então p (x i ) = p i, com 0 p i 1 e p i = 1. i

Se o espaço amostral Ω é não-enumerável, dizemos que X é uma variável aleatória contínua e a distribuição de probabilidades associada é representada por ρ (x). Exemplos de espaços amostrais contínuos: peso de um indivíduo, em quilogramas; diâmetro de um parafuso, em milímetros; tempo de espera de uma determinada linha de ônibus, em segundos. Para este caso, ρ (x) também é conhecida como densidade de probabilidade.

Suponha que X represente o peso, em quilogramas, de uma criança americana do sexo masculino com idade entre 0 e 2 anos. A densidade de probabilidade associada é ρ (x). A probabilidade de que o peso de uma criança americana do sexo masculino com idade entre 0 e 2 anos esteja na faixa 4 kg X 5 kg é dada por Pr (4 kg X 5 kg) = ˆ 5 4 ρ (x) dx. Se X é uma variável aleatória contínua que assume valores no conjunto I R, então ˆ Pr (x S) = ρ (x) dx, com 0 Pr (x S) 1 e S ˆ I ρ (x) dx = 1. Aqui, S é algumprof. subconjunto José Geraldo de Princípios I. de Modelagem Matemática Aula 09

Média e desvio padrão Como vimos, a estatística da amostra e a estatística da população podem diferir (é o caso mais frequente) uma boa amostragem deve produzir uma estatística próxima da estatística da população. É conveniente distinguirmos as diferentes quantidades associadas à amostra e à população.

Média e desvio padrão Seja {x i } i=1...n o conjunto amostral de medidas tomadas da grandeza X. A média amostral é definida por x = 1 N x i. (1) N O desvio padrão amostral é dado por [ ] 1 N 1 2 s = (x i x) 2. (2) N 1 i=1 Esta quantidade está diretamente associada à variância ou ao desvio quadrático médio da amostra, dado por s 2 = 1 N 1 i=1 N (x i x) 2. (3) i=1

Média e desvio padrão A média ou valor esperado de uma determinada grandeza X que obedece à distribuição de probabilidades discreta (resp. contínua) p (x) (resp. ρ (x)) é dada por x = µ (X ) = i p (x i ) x i (4) ou ˆ x = µ (X ) = xρ (x) dx (5) I

Média e desvio padrão O desvio padrão de uma determinada grandeza X que obedece à distribuição de probabilidades discreta (resp. contínua) p (x) (resp. ρ (x)) com média µ é dada por σ (X ) = p (x i ) (x i µ) 2 (6) i ou ˆ σ (X ) = I (x µ) 2 ρ (x) dx (7)

Exercício 1 O desvio padrão de uma variável aleatória X que obedece a uma dada distribuição de probabilidades é definido como σ (X ) = E (X E (X )) 2, onde E (Y ) indica valor esperado da variável aleatória Y. Verifique que a expressão acima é equivalente a σ (X ) = E (X 2 ) E 2 (X ).