MEDIDAS DE TENDÊNCIA CENTRAL Professor Jair Wyzykowski Universidade Estadual de Santa Catarina
Média aritmética INTRODUÇÃO A concentração de dados em torno de um valor pode ser usada para representar todos os dados. Os valores em torno dos quais estão os dados são chamados medidas de tendência central ou de posição. O termo medida de posição é utilizado para indicar, ao longo de uma escala de medidas, onde a amostra ou população está locada Exemplos: Média, mediana, moda.
Média aritmética Média Aritmética Cada valor da população será referenciado por X i (Leia-se X índice i) (X 1, X 2,..., X n ). Média da população: µ = N X i i=1 N
Média aritmética Média Aritmética O mais eficiente, não viesado e consistente estimador da média populacional é a média amostral X = n X i i=1 Para dados agrupados em uma distribuição de freqüência a média é dada por: n X = k F i Xi i=1 n
Média aritmética Média Aritmética: Cálculo Tabela 1. Dados elaborados da produção de grãos em g/planta obtidos numa amostra de n = 20 plantas de feijão da geração F 2 do cruzamento das cultivares Flor de Maio e Carioca. 1,38 4,14 6,23 12,13 17,12 3,65 4,54 6,79 12,56 19,68 3,78 5,64 8,21 13,19 21,26 3,87 5,67 9,79 15,60 24,57
Média aritmética Média Aritmética: Cálculo Tabela 2. Distribuição de frequência da produção de grãos em g/planta obtidos numa amostra de n = 20 plantas de feijão da geração F2 do cruzamento das cultivares Flor de Maio e Carioca. Classes de pesos X F i F ri F pi % -2,49 5,25 1,38 6 0,30 30 5,25 12,98 9,11 8 0,40 40 12,98 20,71 16,84 4 0,20 20 20,71 28,44 24,57 2 0,10 10 Total 1,0 100
Média aritmética Média Aritmética: Cálculo Por que a diferença? Qual é a estimativa mais precisa? n X i i=1 X = = n k F i Xi i=1 X = = n 197, 66 = 20 1, 38 +... + 24, 57 20 = 199, 8 20 1, 38 6 +... + 24, 57 2 20 = 9, 883 = 9, 99
Média aritmética Média Aritmética: propriedades e características 1) A soma dos desvios em relação a média é igual a zero para qualquer amostra; n (X i X) = 0 i=1 2) A soma dos quadrados dos desvios com relação a uma constante arbitrária A qualquer, será um valor mínimo se A = X;
Média aritmética Média Aritmética: propriedades e características 3) A soma ou subtração de uma constante (k) aos dados altera a média de tal forma que a nova média fica adicionada ou subtraída pela constante; 4) A multiplicação ou divisão por uma constante (k) aos dados altera a média de tal forma que a nova média fica multiplicada ou dividida pela constante; 5) A média é influenciada por valores extremos.
Mediana Mediana A mediana é definida em um conjunto de dados ordenados como o valor central, ou seja, o valor para o qual há tantas mensurações que o superam, quanto os que são superados por ele. A mediana amostral (md) é o melhor estimador da mediana populacional (µd) Para estimação da mediana é necessário ordenar os dados (dados elaborados).
Mediana Mediana Se n for impar: Se n for par: m d = X n+1 2 m d = X n 2 + X n+2 2 2
Mediana Mediana: cálculo a partir da tabela de distribuição de frequência 1) Definir a classe mediana: a posição da mediana é encontrada acumulando-se as frequências das classes até um valor que seja igual ou imediatamente superior a n/2.
Mediana Mediana: cálculo a partir da tabela de distribuição de frequência 2) Encontrar a mediana interpolando os dados: m d = LI md + 0, 5n F c F md c md em que LI md, F md e c md referem-se ao limite inferior, frequencia e amplitude de classe da classe mediana. F c é a frequência acumulada das classes anteriores à classe mediana.
Mediana Mediana: cálculo a partir da tabela de distribuição de frequência Para os dados da tabela 2 1) Verifica-se que n = 20 e a posição da mediana n/2 = 10. Então a classe mediana é a segunda. 2) Cálculo m d =LI md + 0, 5n F c =5, 25 + F md c md 0, 5 20 6 8 7, 73 = 9, 115
Mediana Mediana: propriedades e características 1) A soma dos módulos dos desvios em relação a uma constante arbitrária A qualquer, será um valor mínimo de A = m d. D = n X i A = minimo i=1 2) A soma ou subtração de uma constante (k) aos dados altera a mediana de tal forma que a nova mediana fica adicionada ou subtraída pela constante;
Mediana Mediana: propriedades e características 3) A multiplicação dos dados ou divisão por uma constante (k) altera a mediana de tal forma que a nova mediana fica multiplicada ou dividida pela constante; 4) A mediana não é influenciada por valores extremos.
Moda Moda Conjunto de dados com valor mais frequente. A m o é o melhor estimador da moda populacional µ o. para dados qualitativos nominais ou ordinais e para dados quantitativos discretos a definição de moda, valor mais frequente na amostra é usada para estimação da moda populacional. Podemos ter mais de uma moda ou não ter moda se nenhum dado se repete. Para dados quantitativos contínuos a definição de moda como valor mais frequente é inadequada.
Moda Cálculo da moda para dados quantitativos contínuos em uma tabela de distribuição de frequência 1) Localizar a classe modal: classe em que a moda está inserida, ou seja, classe onde há a ocorrência da maior frequência. Se duas classes apresentarem frequencias iguais então a distribuição é bimodal e assim por diante.
Moda Cálculo da moda para dados quantitativos contínuos em uma tabela de distribuição de frequência 2) Cálculo: m o = LI mo + 1 1 + 2 c mo em que LI mo e c mo são o limite inferior e a amplitude da classe modal, 1 e 2 são as diferenças entre as frequências da classe modal e da imediatamente inferior e da classe modal e da imediatamente posterior respectivamente.
Moda Cálculo da moda para dados quantitativos contínuos em uma tabela de distribuição de frequência Para os dados da tabela 2 1) 2) 1 = 8 6 = 2 2 = 8 4 = 4 m o =LI mo + 1 1 + 2 c mo =5, 25 + 2 7, 73 = 7, 8267 2 + 4
Moda Moda: propriedades e características 1) A soma ou subtração de uma constante (k) aos dados altera a moda de tal forma que a nova moda fica adicionada ou subtraída pela constante. 2) A multiplicação dos dados ou divisão por uma constante (k) altera a moda de tal forma que a nova moda fica multiplicada ou dividida pela constante.
Percentil e quartil Quartil Quando se divide um conjunto ordenado de dados em quatro partes iguais, os pontos da divisão são conhecidos como quartil. o primeiro quartil, Q1; é o valor que divide aproximadamente, a quarta parte (25%) das observações abaixo dele, e os 75% restantes, acima dele. O segundo quartil é exatamente a mediana (Md). O terceiro quartil ou quartil inferior, Q3, tem aproximadamente os três quartos (75%) das observações debaixo dele.
Percentil e quartil Quartil Exemplo. A seguir são apresentadas 20 observações do tempo de falha, em horas de um equipamento: 204 228 252 300 324 444 624 720 816 912 1176 1296 1392 1488 1512 2520 2856 3192 3528 3710 A mediana, já que n = 20 é par é: Md = Q2 = 912 + 1176 2 = 1044
Percentil e quartil Quartil Primeiro quartil O primeiro quartil deve ter 25% dos dados abaixo dele ou, nesse exemplo, pelo menos 5 observações abaixo dele, e 75% dos dados acima dele ou menos de 15 de observações de seu valor acima dele. A quinta e sexta observação satisfazem essa definição de modo que Q 1 é definido como a média dessas observações Q1 = 324 + 444 2 = 384
Percentil e quartil Quartil Terceiro quartil Deve ter 75% dos dados abaixo dele ou pelo menos 15 observações abaixo de seu valor, e 25% dos dados acima ou pelo menos 5 observações acima dele. As observações 15 e 16 satisfazem essa definição. Portanto, Q3 = 1512 + 2520 2 = 2016
Percentil e quartil Percentil O percentil P p, é um valor que divide um conjunto de observações ordenados de forma crescente (ou decrescente) em duas partes, o 100 p % dessas observações com valores inferiores (superiores) a P p, e o 100 (1 p) % com valores superiores Q1 = P 0,25 Q3 = P 0,75
Percentil e quartil Percentil O percentil P p para dados quantitativos contínuos agrupados em TDF é obtido da seguinte forma: Pp = LI i + np F i 1 f i c, 0 < p < 1 onde i: classe percentil, a classe percentil é o intervalo de classe onde se supera por primeira vez o (np) dos dados, isto é, Fi > np ou Fri > p LI i : limite inferior da classe percentil. F i 1 : freqüência acumulada absoluta da classe anterior à classe percentil. f i freqüência absoluta da classe percentil c amplitude da classe
Média geométrica Média geométrica Apropriada para calcular médias de razões, taxas de variações, índices econômicos e taxa de crescimento de microorganismos A média geométrica X G é definida como sendo a raiz n-ésima do produto dos n dados amostrais X G = n X 1 X 2...X n = n n X i X i > 0, i=1 i = 1, 2,..., n
Média geométrica Média geométrica A média geométrica X G para dados agupados é definida como: { n } i=1 X G = exp F ilnx i X i > 0, n i = 1, 2,..., k
Média harmônica Média harmônica É usada para obter médias de razões e em algumas técnicas da estatística Cálculo da média harmônica X H = 1 1 n = 1 n 1=1 X i Para dados agrupados 1 X H = 1 n F i = n 1=1 X i n n 1=1 n k 1=1 ; X 1 i > 0, i = 1, 2,..., n X i ; X F i > 0, i = 1, 2,..., k i X i
Assimetria Distribuição simétrica X = M o = M d
Assimetria Distribuição Assimétrica à Esquerda, ou de Assimetria Negativa X < M d < M o
Assimetria Distribuição Assimétrica à Direita, ou de Assimetria Positiva M o < M d < X
Assimetria Que outras observações podemos fazer acerca destes três gráficos conclusivos? Quando a distribuição for assimétrica, a Mediana estará sempre entre a Média e a Moda; Só será necessário conhecermos os valores de duas medidas de tendência central para sabermos se a distribuição é assimétrica positiva ou negativa.
Assimetria Medida de Assimetria Coeficiente de Assimetria de Pearson As = X Mo s a) Se As < 0 a distribuição será Assimétrica Negativa ; b) Se As > 0 a distribuição será Assimétrica Positiva; c) Se As = 0 a distribuição será Simétrica.
Assimetria Medida de Assimetria Quando não tivermos condições de calcularmos o desvio padrão As = Q 3 + Q 1 2Md Q 3 Q 1 a) Se As < 0 a distribuição será Assimétrica Negativa ; b) Se As > 0 a distribuição será Assimétrica Positiva; c) Se As = 0 a distribuição será Simétrica.
Assimetria Medida de Assimetria Coeficiente momento de assimetria (α 3 ) α 3 = M 3 s 3 a) α 3 < 0, 2 simetria; b) 0, 2 < α 3 < 1, 0 assimetria fraca; c) α 3 > 1, 0 assimetria forte.
Curtose Curtose Mostra até que ponto a curva representativa de uma distribuição é a mais aguda ou a mais achatada do que uma curva normal 1 Curva Mesocúrtica (Normal): É considerada a curva padrão. 2 Curva Leptocúrtica: Mais alta do que a normal. Apresenta o topo relativamente alto. Os valores se acham mais agrupados em torno da moda. 3 Curva Platicúrtica: Mais baixa do que a normal. Apresenta o topo achatado, significando que várias classes apresentam freqüências quase iguais.
Curtose Curtose a) Leptocúrtica. b) Mesocúrtica. c) Platicúrtica.