Probabilidade e Estatística CCT - UDESC Apresentação de Dados Departamento de Matemática CCT-UDESC 1
Média amostral Variância amostral 2
Média populacional 3 3
Variância amostral 4
Fórmula eficiente para cálculo da variância amostral 5
Variância Populacional 6
Amostragem aleatória 7 7
Amostragem aleatória População: totalidade das observações de interesse 7 7
Amostragem aleatória População: totalidade das observações de interesse Distribuição de probabilidade: modelo para uma população 7 7
Amostragem aleatória População: totalidade das observações de interesse Distribuição de probabilidade: modelo para uma população Amostra: subconjunto de observações selecionadas de uma população 7 7
Amostragem aleatória População: totalidade das observações de interesse Distribuição de probabilidade: modelo para uma população Amostra: subconjunto de observações selecionadas de uma população Amostra aleatória: resultado de algum mecanismo de chance. 7 7
8 8
8 8
As variáveis aleatórias 8 8
As variáveis aleatórias são uma amostragem aleatória de tamanho n se: 8 8
As variáveis aleatórias são uma amostragem aleatória de tamanho n se: 1. Todos os 8 8
As variáveis aleatórias são uma amostragem aleatória de tamanho n se: 1. Todos os X i 8 8
As variáveis aleatórias são uma amostragem aleatória de tamanho n se: 1. Todos os X i são variáveis aleatórias independentes 8 8
As variáveis aleatórias são uma amostragem aleatória de tamanho n se: 1. Todos os X i são variáveis aleatórias independentes 2. Todos os 8 8
As variáveis aleatórias são uma amostragem aleatória de tamanho n se: 1. Todos os X i são variáveis aleatórias independentes 2. Todos os X i 8 8
As variáveis aleatórias são uma amostragem aleatória de tamanho n se: 1. Todos os X i são variáveis aleatórias independentes 2. Todos os X i têm a mesma distribuição de probabilidade. 8 8
As variáveis aleatórias são uma amostragem aleatória de tamanho n se: 1. Todos os X i são variáveis aleatórias independentes 2. Todos os X i têm a mesma distribuição de probabilidade. EstaDsEca: qualquer função das observações de uma amostragem aleatória 8 8
Diagramas Ramo e Folha (Stem- and- leaf) Capacidade compressiva (psi) de 80 elementos de liga alumínimo- líeo 9 9
Pergunta: qual é a porcentagem de elementos correspondentes a valores menores que 120 psi? 10 10
Construção de um diagrama Ramo- e- Folha Divida cada número x i em duas partes: (a) uma folha (a) um ramo consisendo de um ramo com dois ou mais dígitos iniciais ; (b) uma folha consisendo dos dígitos remanescentes. 11 11
Ramo Folha Frequência 12 12
Tamanho dos ramos Poucos ramos: pouca informação 13 13
Número adequado de ramos 14 14
Número excessivo de ramos 15 15
hvp://www.shodor.org/interaczvate/aczvizes/stemandleafplover/ 16 16
Distribuições de frequência e histogramas Distribução de frequência Domínio de dados deve ser dividido em intervalos Preferencialmente os intervalos devem ser de igual largura para facilitar a visualização 5 a 20 intervalos é bom número onde n é o número de observações, é razoável 17 17
Histograma: apresentação visual da distribuição de frequências Passos para a construção de um histograma com intervalos iguais: 1. Marque os limites dos intervalos na escala horizontal. 2. Marque as frequências ou frequências relaevas na escala verecal. 3. Acima de cada intervalo desenhe um retângulo onde a altura é igual à frequência (ou frequência relaeva) correspondente a este intervalo. 18 18
19 19
Histogramas no Maple 20 20
21 21
22 22
23 23
24 24
Esta opção especifica quanto plots de frequência são usados para computar a média O default é 1. 25 25
Um plot de frequência deslocada média é obtido calculando m plots de frequência com o mesmo tamanho de intervalo, deslocando-os por w/m, e tomando a média. Plots de frequência deslocada média são mais suaves que plots de frequência ordinários e são menos dependentes da escolha da origem. 26 26
Box Plots Histogramas e diagramas stem- and- leaf: impressões visuais gerais Média e variância: informação sobre somente uma caracteríseca dos dados Box plot: display gráfico que descreve simultaneamente várias caracterísecas importantes de um conjuntos de dados tais como centro, dispersão, afastamento da simetria e ideneficação de observações não- usuais (outliers) 27 27
Primeiro quarel ( Segundo quarel ( Q 1 ) : corta 25% dos dados inferiores ) : corta dados na metade Terceiro quarel ( ) : corta 75% dos dados inferiores Q 3 Q 2 28 28
Box plot para capacidade compressiva 29 29
Box Plot no Maple 30 30
Comparação de conjuntos de dados 31 31
Gráficos de séries temporais Observações são registradas na ordem em que elas ocorrem + 32 32
Maple: 33 33
30 observações horárias da concentração do produto de saída de um processo químico as primeiras 20 observações produziram concentrações acima de 85g/l Depois da observação 20 a concentração média começou a baixar. 34 34
Plots de Probabilidade Como saber se uma dada distribuição de probabilidade é um modelo razoável para os dados? A forma da distribuição pode fornecer um insight sobre o mecanismo fsico básico que gera os dados. Por exemplo, ao verificar que os dados de tempo até uma falha são provenientes de uma distribuição exponencial idenefica o mecanismo de falha: taxa de falhas é constante relaevamente ao tempo. Plots de probabilidade são mais confiáveis do que histogramas para dados de tamanho pequeno a moderado. 35 35
Geração de gráficos de probabilidade: Escolha o papel de probabilidade adequado à hipotéeca distribuição. Essencialmente estamos interessando em saber se a distribuição é normal. Observações são ordenadas em forma crescente de valores. As observações ordenadas são plotadas contra suas observadas frequências relaevas (i 0.5) / n no papel apropriado. Se a suposta distribuição descreve adequadamente os dados, os pontos plotados descreverão aproximadamente uma linha reta. 36 36
Exemplo 1 37 37
Exemplo 2 Os dados relaevos a cargas de falha sobre amostras de um Epo de aço fornecem os seguintes resultados (megapascal): 19.8, 10.1, 14.9, 7.5, 15.4,15.4, 15.4, 18.5, 7.9, 12.7,11.9, 11.4, 11.4, 14.1, 17.6, 16.7, 15.8, 19.5, 8.8, 13.6, 11.9, 11.4,13.8,14.7,11.2. Verifique se os dados descrevem uma distribuição normal. 38 38
Solução em Maple 39 39
Normal plot em Excel 40 40