GE-814: Introdução à Avaliação Operacional
Mentiras, mentiras deslavadas e estatísticas O título acima é uma referência a uma. frase comumente atribuída a um ex primeiro-ministro britânico chamado Benjamin Disraeli.
Mentiras estatísticas 33% do acidentes de trânsito envolvem pessoas embriagadas. Portanto 67% estão completamente sóbrias, a conclusão é que devemos dirigir totalmente bêbados.
Mentiras estatísticas Surpreendente! Finalmente a solução para os seus problemas capilares: de todos os compradores do tónico capilar JUBA DE LEÃO, apenas 3% ficaram insatisfeitos e pediram o reembolso do dinheiro.
Objetivo Que a audiência revise os principais tópicos de estatística concernentes à Avaliação Operacional
população probabilidade (dedução) inferência estatística (indução) amostra 7/47
Definições Um experimento é qualquer processo que permite ao pesquisador fazer observações Um evento é uma coleção de resultados de um experimento O espaço amostral de um experimento consiste de todos os eventos possíveis 8/47
Exemplo experimento: lançamento de dois dados evento: soma dos valores é par espaço amostral: S = { (1,1), (1,3), (1,5), (2,2), (2,4), (2,6), (3,1), (3,3), (3,5), (4,2), (4,4), (4,6), (5,1), (5,3), (5,5), (6,2), (6,4), (6,6) } 9/47
Definição clássica Suponha que um experimento tenha n eventos simples diferentes, cada um dos quais com a mesma chance de ocorrer. Se o evento A pode ocorrer em s dentre as n maneiras, então: P(A) = = nº de maneiras como A pode ocorrer s nº de eventos simples n 10/47
Aproximação da probabilidade pela freqüência relativa Realize (ou observe) um experimento um grande número de vezes e conte quantas vezes o evento A ocorre efetivamente. Então P(A) é estimada como segue: P(A) = nº de ocorrências de A nº de repetições do experimento 11/47
Lei dos grandes números Se se repete um experimento um grande número de vezes a probabilidade pela freqüência relativa de um evento tende para a probabilidade teórica. 12/47
Estatística A Estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi-los, analisá-los, interpretá-los e deles extrair conclusões. Um aspecto importante da Estatística é sua aplicabilidade óbvia a situações reais e relevantes.
Problemas da AVAOP relacionados com estatística O sistema novo é significativamente melhor que o velho? Quais sistemas competidores são significativamente melhores que os demais? O teste foi bom? Existiu tendência nos dados? Houve muita variabilidade nos dados? Os dados foram suficientes? Quão seguro você está nas suas conclusões sobre os dados?
Descritiva x Inferência Estatística Descritiva: são os métodos que envolvem a coleta, a apresentação e caracterização de um conjunto de dados de modo a descrever apropriadamente as várias características deste conjunto. Inferência Estatística ou Estimação: são métodos que tornam possível a estimativa de uma característica de uma população ou a tomada de uma decisão referente à população com base somente em resultados amostrais.
Definições POPULAÇÃO (UNIVERSO) - é uma coleção completa de todos os elementos (valores, pessoas, medidas etc.) a serem estudados. CENSO é uma coleção de dados relativos a todos os elementos da população. AMOSTRA é uma subcoleção de elementos extraídos da população. PARÂMETRO é uma medida numérica que descreve uma característica da população. ESTATÍSTICA uma medida numérica que descreve uma característica de uma amostra.
Medidas de Tendência Central Média aritmética valor obtido somando-se todos eles e dividindo-se o total pelo número de valores. Essa medida particular de tendência central será utilizada freqüentemente designada simplesmente como média. Mediana valor do meio desse conjunto, quando os valores estão dispostos em ordem crescente (ou decrescente). A mediana é representada ~ geralmente por x. Moda valor que ocorre com maior freqüência. Quando dois valores ocorrem com a mesma freqüência máxima, cada um deles é uma moda, e o conjunto de diz bimodal. Se mais de dois valores ocorrem com a mesma freqüência máxima, cada um deles é uma moda e o conjunto é multimodal. Costuma-se denotar a moda por M. Ponto médio valor que está a meio caminho entre o maior valor e o menor valor. Para obtê-lo, somamos esses valores extremos e dividimos o resultado por 2.
Exemplo Bi-modal Média: 3,2
Média e mediana
Distribuição Normal A distribuição normal ocorre naturalmente: Altura das pessoas Peso das pessoas Performance de atiradores Miss distances Através de amostragem de qualquer outra distribuição!
Distribuição Normal
Notações s denota o desvio-padrão (SD) de um conjunto de dados amostrais denota o desvio-padrão de um conjunto de dados populacionais s 2 é a variância (Var) de um conjunto de dados amostrais 2 é a variância de um conjunto de dados populacionais
Desvio-Padrão Desvio-padrão de um conjunto de dados populacionais ( x ) 2 N Desvio-padrão de uma amostra s 2 2 ( x ) n 1 n( n 1) 2 n x x i x
Teorema do Limite Central Se uma variável randômica X tem uma média populacional µ e um desvio padrão σ, então a distribuição das médias das amostras tende a ser normalmente distribuída com média µ e um desvio padrão, quando n se torna grande. n INDEPENDENTEMENTE DA DISTRIBUIÇÃO DA POPULAÇÃO
Exemplo do TLC 9990 números aleatórios entre 10 e 15 divididos em 333 grupos de 30 1200 Histograma dos 9990 números Histogram (Spreadsheet1 10v*9990c) 1000 800 No of obs 600 400 200 0 9,5 10,0 10,5 11,0 11,5 12,0 12,5 13,0 13,5 14,0 14,5 15,0 15,5 Var2
Exemplo do TLC Histograma das médias dos 333 grupos de 30 números Histogram (Design: 1 factors, 1 Blocks, 5000 Runs (Spreadsheet1) 6v*168c) 35 Var2 = 168*0,1186*normal(x; 12,4827; 0,267) 1200 1000 Histogram (Spreadsheet1 10v*9990c) 30 25 No of obs 800 600 No of obs 20 15 400 10 200 0 9,5 10,0 10,5 11,0 11,5 12,0 12,5 13,0 13,5 14,0 14,5 15,0 15,5 Var2 5 0 11,8439 12,0812 12,3185 12,5558 12,7930 13,0303 11,9626 12,1998 12,4371 12,6744 12,9117 13,1490 Var2
Outras distribuições t de Student F n< 30 Aproxima distribuição normal com n próximo de 30. Usada para garantia da performance e testes de comparações quando n é pequeno. Razão entre duas variâncias. Usada pela ANOVA Binomial Usada em testes seqüenciais e confiabilidade
Distribuição t de Student
Distribuição F
Distribuição Binomial
Distribuição Normal 2 testes de normalidade Histograma Medida de percentil cumulativo (gráfico de probabilidade normal)
Distribuição Normal Exemplo do comportamento de uma distribuição Gama no teste de normalidade
Testes de normalidade considerados bons pelo livro do Montgomery outlier
Testes de normalidade pelo livro do Montgomery Ruim Bom (após transformação y*=ln y)
Objetivo Que a audiência revise os principais tópicos de estatística concernentes à Avaliação Operacional
GE-814: Introdução à Avaliação Operacional