Módulo III Medidas de Tendência Central ESTATÍSTICA
Objetivos do Módulo III Determinar a média, mediana e moda de uma população e de uma amostra Determinar a média ponderada de um conjunto de dados e a média de uma distribuição de frequência Descrever a forma da distribuição como simétrica, uniforme ou assimétrica e comparar a média e a mediana de cada uma
Medidas de Tendência Central (ou localização) Valor numérico utilizado para resumir a informação contida em todo o conjunto de dados, valor típico da variável. Mostram a tendência dos pontos se concentrarem em torno de um determinado valor. Medidas mais comuns: Média Mediana Moda
Média Aritmética A soma de todas as entradas de dados divididas pelo número de entradas Média populacional = x N Média amostral = x x n Notação sigma: Σx = somatório de todas as entradas (x) no conjunto de dados
Média Aritmética Exemplo: suponha que os valores abaixo representam as vendas por dia (em mil reais) de uma loja de calçados. Qual a média de venda desta semana? 2,o 3,3 2,5 5,6 5,0 4,3 3,2 x n x 2,0 3,3 2,5 5,6 5,0 4,3 3,2 7 25,9 7 3,7 A média de vendas desta semana é 3,7 mil reais. Este valor pode ser comparado com a média de outras semanas.
Mediana O valor que está no meio dos dados quando o conjunto dos dados é ordenado. Mede o centro de um conjunto de dados ordenado dividindo-o em duas partes iguais. Se o conjunto de dados possui um número de entradas: ímpar: o mediano é o elemento do meio par: o mediano será a média dos dois elementos centrais
Mediana Exemplo: suponha que os valores abaixo representam as vendas por dia (em mil reais) de uma loja de calçados. Qual a mediana? 2,o 3,3 2,5 5,6 5,0 4,3 3,2 Dados ordenados 2,0 2,5 3,2 3,3 4,3 5,0 5,6 Como existem 7 entradas (ímpar), a mediana é o nº central do conjunto de dados.
Mediana Exemplo: Suponha que a loja agora abra aos domingos também. Qual o novo valor da mediana das vendas listadas? 2,o 3,3 2,5 5,6 5,0 4,3 3,2 2,1 Dados ordenados 2,0 2,1 2,5 3,2 3,3 4,3 5,0 5,6 ~ 3,2 3,3 x 2 Como agora há 8 (oito) entradas, a mediana é o valor médio das duas entradas centrais
Moda A entrada de dados ocorre com a maior frequência Se não houver entradas repetidas, o conjunto de dados não tem moda Se duas entradas ocorrem com a mesma e mais alta frequência, cada entrada é um moda (bimodal)
Moda Exemplo: Distribuição de frequência para uso do computador (em horas/semana) classes frequência 5 -- 10 1 10 -- 15 4 15 -- 20 10 20 -- 25 13 25 -- 30 5 30 -- 35 3 35 --40 4 Total 40 A moda dos alunos frente ao computador é de 20 a 25 horas por semana, pois é o valor de maior frequência.
Comparação média, mediana, moda Todas as três medidas descrevem uma entrada típica de um conjunto de dados A média tem a vantagem de ser uma medida confiável porque leva em conta cada entrada do conjunto de dados Em compensação a média é muito afetada por valores discrepantes (uma entrada que é muito distante das outras entradas no conjunto de dados), o que já não acontece com a mediana
Comparação média, media e moda Encontre a média, a mediana e a moda da amostra das idades de alunos de uma classe do ensino fundamental. Qual medida de tendência central descreve melhor uma entrada típica desse conjunto de dados? Existe algum valor discrepante? Idades em uma classe 20 20 20 20 20 20 21 21 21 21 22 22 22 23 23 23 23 24 24 65
Comparação média, mediana e moda Idades em uma classe 20 20 20 20 20 20 21 21 21 21 22 22 22 23 23 23 23 24 24 65 Média = x n x 20 20 20... 24 24 65 20 23,8 anos Mediana = 21 22 2 21,5 anos Moda = 20 anos (valor que mais se repete)
Comparação média, mediana e moda No caso estudado a mediana parece ser a melhor escolha para representar o conjunto das idades dos alunos, pois não é influenciada pelo valor discrepante 65.
Média Ponderada A média de um conjunto de dados cujas entradas possuem pesos variantes. x ( x. p) p Neste caso p é o valor do peso dado a cada entrada de x
Média Ponderada Exemplo: Você está frequentando uma aula na qual sua nota é determinada com base em 5 fontes: 50% da média de seu exame, 15% do seu exame bimestral, 20% de seu exame final, 10% de seu trabalho no laboratório de informática e 5% de seus deveres de casa. Suas notas são: 86 (média do exame), 96 (exame bimestral), 82 (exame final), 98 (laboratório) e 100 (dever de casa). Qual é a média ponderada de suas notas? Se a média mínima para um A é 90, você obteve uma nota A? (Larson Faber Estatística Aplicada 4ª edição, Pearson, 2010)
Média Ponderada Fonte Notas, x Peso, p x p Média do exame 86 0,50 86(0,50)= 43,0 Exame bimestral 96 0,15 96(0,15) = 14,4 Exame final 82 0,20 82(0,20) = 16,4 Laboratório 98 0,10 98(0,10) = 9,8 Dever de casa 100 0,05 100(0,05) = 5,0 Σp = 1 Σ(x p) = 88,6 x x. p p 88,6 1 88,6
Média de dados agrupados Média de uma distribuição de frequência x n xi. f n f em que xi e f são, respectivamente, os pontos médios e as frequências de cada classe
Média de dados agrupados Distribuição de frequência para uso do computador (em horas/semana) classes Ponto médio frequência (x i.f) 5 -- 10 7,5 1 7,5. 1 = 7,5 10 -- 15 12,5 4 12,5. 4 = 50 15 -- 20 17,5 10 17,5. 10 = 175 20 -- 25 22,5 13 22,5. 13 = 292,5 25 -- 30 27,5 5 27,5. 5 = 137,5 30 -- 35 32,5 3 32,5. 3 = 97,5 35 --40 37,5 4 37,5. 4 = 150 total 40 (x i. f) = 910 x xi. f n 910 40 22,75 Em média, os alunos ficam 22,75 horas por semana em frente ao computador
Tipos de distribuição (probabilidade) dos dados A distribuição de probabilidade são caracterizadas por três parâmetros: forma, localização (tendência central) e dispersão (variabilidade)
Tipos de distribuição (probabilidade) dos dados Simétrica Características de qualidade do tipo nominal-é-melhor (por exemplo, características dimensionais) tendem a apresentar uma distribuição de probabilidade aproximadamente simétrica, pois as causas de variabilidade geram valores que podem se afastar tanto para cima como para baixo do alvo.
Tipos de distribuição (probabilidade) dos dados Assimétrica a Esquerda Características de qualidade do tipo maior-é-melhor (por exemplo, resistência mecânica) tendem a apresentar uma distribuição de probabilidade assimétrica à esquerda, pois que muitas causas de variabilidade podem gerar valores baixos.
Tipos de distribuição (probabilidade) dos dados Assimétrica a Direita Características de qualidade do tipo menor-é-melhor (por exemplo, nível de ruído) tendem a apresentar uma distribuição de probabilidade assimétrica à direita, pois que muitas causas de variabilidade podem gerar valores altos.
Relação Média, Mediana e Moda Para distribuições simétricas a média, a mediana e a moda coincidem aproximadamente. Para distribuições assimétricas observa-se o seguinte: