Aula 3 Cap 02 Estatística Descritiva
Nesta aula... estudaremos medidas de tendência central, medidas de variação e medidas de posição.
Medidas de tendência central Uma medida de tendência central é um valor que representa uma entrada típica, ou central, de um conjunto de dados. Os três tipos de medidas de tendência central mais usadas são: Média Mediana Moda
Média A média de um conjunto de dados é a soma de toda as entradas de dados dividida pelo números de entradas. Dica de estudo Símbolo Descrição Em uma população: Em uma amostra: Σ x N n μ x Indica uma soma de valores Variável que representa uma entrada de dados Número de entradas em uma população Número de entradas em uma amostra Média de uma população Média de uma amostra
Mediana A Mediana de um conjunto de dados é o dado que fica no meio quando as entradas são colocadas em ordem crescente ou decrescente. Moda A Moda de um conjunto de dados é o dado que ocorre com maior freqüência. Se nenhuma entrada é repetida, o conjunto de dados não possui moda. Se duas entradas ocorrem com freqüência elevada dados são bimodais
Exemplo... Um instrutor registra a média de faltas de seus alunos em determinado semestre. Em uma amostra aleatória, os dados são: 2 4 2 0 40 2 4 3 6 Calcule a média, a mediana e a moda. Média: Mediana: Ordene os dados. 0 2 2 2 3 4 4 6 40 O valor que fica no meio é 3, logo a mediana é 3. Moda: A moda é 2, pois esse é o valor que ocorre mais vezes.
Exemplo... Em um debate político pediu-se que uma amostra dos membros do público citasse o partido a qual eles pertenciam. As respostas estão na Tabela abaixo: Partido Político PT PSDB PMDB Outros frequência 34 56 21 9 Qual é a moda das respostas? A moda é a única medida de tendência central que pode ser utilizada para descrever dados no nível nominal de medida.
Média Ponderada Uma média ponderada é a média de um conjunto de dados cujas entradas tem pesos variáveis. Uma média ponderada é dada por: x = ( x. w) w Onde w é o peso de cada entrada
Exemplo... Você está fazendo uma disciplina na qual sua nota final é composta por: Fonte notas,x Pesos, w xw Média dos testes Exame no meio do semestre Exame final Laboratório de computação Trabalho extra-classe 8,6 9,6 8,2 9,8 10,0 0,5 0,15 0,2 0,1 0,05 Σw=1 Assim, sua média ponderada para a disciplina é de 88,6 4,3 1,44 1,64 0,98 0,5 Σ(xw)=8,86
Média de uma distribuição de freqüência A média de uma distribuição de freqüências de uma amostra é aproximada por: ( x. f ) x = n n = f Onde x e f são os pontos médios e freqüências, respectivamente.
Aspecto das distribuições de freqüência As distribuições de frequência freqüência podem ser: Simétricas: Quando pudermos traçar uma linha vertical pelo ponto médio do gráfico e as duas metades forem iguais. Uniforme: Quando todas as entradas, ou classes na distribuição tiverem freqüências iguais
Assimétricas à direita: Se a cauda do gráfico se prolongar mais para a direita, a distribuição é chamada de assimétrica à direita. Assimétricas à esquerda: Se a cauda do gráfico se prolongar mais para a esquerda, a distribuição é chamada de assimétrica à esquerda. Média > Mediana Média < Mediana
Medidas de variação Desvio, Variância e Desvio padrão
Desvio populacional O desvio de uma entrada x em um conjunto de dados de uma população ou amostra é a diferença entre a entrada e a média (μ ou x ) do conjunto de dados Em uma população, o desvio de cada valor x é: Em uma amostra, o desvio de cada valor x é: Como a soma dos desvios de todas as entradas é igual a zero, não faz sentido determinar a média dos desvios. Desta maneira, você pode elevar ao quadrado cada desvio e obter a média...
Variância populacional É a média da soma dos quadrados dos desvios de um conjunto de dados de uma população com N entradas, ou seja σ = ( x ) 2 μ 2 Desvio Padrão populacional Éa raiz quadrada da variância populacional: N σ = σ = ( x ) 2 μ 2 N
Variância amostral A média dos quadrados dos desvios padrão é chamada de variância amostral. Para um conjunto de dados de uma amostra com n entradas é: s 2 ( x x) = n 1 Uma desvantagem da variância consiste no fato de suas unidades normalmente não terem sentido (como dólares ao quadrado, por exemplo). Assim, pode-se retornar a unidade original dos dados tomando sua raiz quadrada. 2 Desvio Padrão amostral Éa raiz quadrada da variância amostral: s 2 = s = ( x x) n 1 2
Resumindo... Para obter a variância e o desvio padrão 1. Obtenha a média do conjunto de dados 2. Obtenha o desvio de cada entrada 3. Eleve ao quadrado cada desvio 4. Some os resultados para obter a soma dos quadrados 5. Divida por (n 1) para obter a variância 6. Determine a raiz quadrada da variância para obter o desvio padrão x x s 2 = n = x x ( x x) 2 x ( x x) 2 ( x x) = n 1 2 ( x x) 2 s = s = n 1 2
Existe ainda... Desvio Padrão para dados agrupados Grandes conjuntos de dados são normalmente mais bem representados por uma distribuição de freqüência. A fórmula para o desvio padrão da amostra de uma distribuição de freqüência é s ( x x) = n 1 na qual n=σf é o número de entradas no conjunto de dados. 2 f
Medidas de Posição São utilizadas para identificar a posição de uma entrada dentro de um conjunto de dados. Quartis, por exemplo, são números que dividem em partes iguais um conjunto de dados ordenados. Definição: Os três quartis Q 1, Q 2 e Q 3 dividem aproximadamente um conjunto ordenado de dados em quatro partes. 1/4 dos dados ficam dentro ou abaixo do primeiro quartil metade dos dados ficam dentro ou abaixo do segundo quartil (é igual a mediana do conjunto de dados) ¾ dos dados ficam dentro ou abaixo de terceiro quartil
Exemplo: A pontuação nos testes de 15 empregados envolvidos em um curso de treinamento estão dispostos abaixo. Obtenha Q 1, Q 2 e Q 3. 13 9 18 15 14 21 7 10 11 20 5 18 37 16 17 Metade inferior Metade superior 5 7 9 10 11 13 14 15 16 17 18 18 20 21 37 Q1 = Mediana dos dados abaixo de Q2 Q 1 Q 2 Q 3 Q2 = Mediana Q3 = Mediana dos dados acima de Q2
Amplitude interquartil (AIQ) A amplitude interquartil (AIQ) de um conjunto de dados é a diferença entre o primeiro e o terceiro quartis. Amplitude interquartil (AIQ)= Q3 Q1 A AIQ é uma medida da variação que fornece uma idéia de quanto os 50% médios dos dados variam. (AIQ)= Q3 Q1 = 18-10 = 8 (as pontuações no teste na metade do conjunto de dados varia em 8 pontos) A AIQ também serve para identificar dados estranhos (discrepantes). Qualquer valor acima de 1,5 AIQ à esquerda de Q1 ou a direita de Q3 éestranho. No exemplo anterior, 37 é um dado estranho as pontuações.
Outras medidas de posição... Decis Divide o conjunto de dados em dez partes iguais (D 1, D 2, D 3...D 9 ) Percis Divide o conjunto de dados em cem partes iguais (P 1, P 2, P 3...P 99 )