MEDIDAS DE TENDÊNCIA CENTRAL Introdução Neste tópico, vamos aprender sobre o cálculo de medidas que possibilitem representar um conjunto de dados relativos à observação de determinado fenômeno de forma resumida. Medidas de tendência central representam os fenômenos estudados pêlos seus valores médios, em torno dos quais tendem a se concentrar os dados. Antes de estudar essas medidas, vamos estudar o símbolo do somatório (Notação Sigma) => => Para indicar um conjunto de N dados X1, X2, X3,... Xn, é usual usarmos Xi, onde i, é denominado índice, representando quaisquer dos números 1, 2, 3,..., N e indica o número de ordem dos diferentes valores. Exemplo: se tivermos os números: 8, 12, 20, 35, 50, a notação X3 representa o terceiro número deste grupo, isto é, X3 = 20. Para representar a soma dos Xi valores, ou seja, X1 + X2 + X3 +...+. Xn podemos utilizar a letra grega, que é utilizada para representar as operações de adição entre as parcelas. Por denição temos: A expressão: n Xi = X1 + X2 + X3 +...+. Xn i = 1 n Xi, deve ser lida soma dos valores xi, para i variando de 1 até n. i = 1 Média Aritmética: Existem quatro tipos de médias: aritmética, geométrica, harmônica e quadrática. Porém, vamos estudar apenas as médias aritmética simples e ponderada. Média Aritmética Simples: É a mais utilizada, e é simplesmente chamada de média, pode ser usada para calcular dados agrupados ou não agrupados (dados brutos). Representa o ponto de equilíbrio de um conjunto de dados; é a média dos valores. Média Aritmética para dados isolados: Designaremos por X ou μ (lê-se mi) a média aritmética de uma serie de n valores X1, X2, X3,... Xn, como sendo, o quociente entre 23
a soma desses valores e o numero total deles, ou seja: Ex: Calcular a média aritmética dos números: Em resumo temos a fórmula: 4, 5, 6, 7, 8 => X = 4 + 5 + 6 + 7 + 8 = 30 / 5 = 6 xi x = n Média Aritmética Ponderada: É a média aritmética afetada por pesos (variável discreta e variável contínua), freqüentemente precisamos calcular a média aritmética atribuindo pesos diferentes aos valores da série de números. Ex: Um professor faz exercícios e prova para avaliar os seus alunos, normalmente atribui-se peso diferente a esses trabalhos. Podemos denir média aritmética ponderada como sendo o quociente entre a soma dos produtos de cada valor pelo seu respectivo peso e a soma dos n elementos. O que designamos por peso, é comumente chamado de freqüência absoluta, assim a fórmula é usualmente escrita como: xi. x = Exemplo: Ache a média aritmética ponderada dos dados da tabela abaixo: Xi Xi 4 2 (4 x 2) = 8 6 4 (6 x 4) = 24 8 3 (8 x 3) = 24 5 2 (5 x 2) = 10 9 1 (9 x 1) = 9 Total 12 75 Solução: A tabela original contém apenas as duas primeiras colunas. Para calcularmos a média aritmética ponderada destes dados, calcula-se a 3ª coluna e usa-se a fórmula obtendo-se: xi. x = => 75 / 12 = 6,25 Cálculo da média numa distribuição de freqüências: 24
Quando precisamos calcular a média aritmética de dados agrupados numa distribuição de freqüências, as classes onde os valores são agrupados, não nos revela como estes dados estão distribuídos, temos a informação somente de suas quantidades através da freqüência absoluta. Por esta razão vamos admitir para o cálculo das medidas estatísticas, que todos os valores pertencentes a uma classe sejam representados pelo seu ponto médio (Pm), que é a média aritmética simples dos valores extremos da classe, ou seja: Pm = Ls Li / 2 Portanto, se todos os valores ( Xi ) de uma classe de freqüências podem ser representados pelo seu ponto médio ( Pm ), então, basta substituir Xi por Pm na fórmula e a fórmula para o cálculo da média aritmética numa distribuição de freqüências passa a ser:. Pm x = Esta é a fórmula utilizada comumente. Na tabela abaixo, vamos reproduzir o cálculo da média aritmética: Tabela 15 - Notas da disciplina X, por classes de notas Classes de Notas Pm.Pm 30 40 4 35 35. 4 = 140 40 50 6 45 45. 6 = 270 50 60 8 55 55. 8 = 440 60 70 13 65 65. 13 = 845 70 80 9 75 75. 9 = 675 80 90 7 85 85. 7 = 595 90 100 3 95 95. 3 = 285 Total 50 3.250 Fonte: Elaboração própria, 2004 Nesta tabela aparece o termo. Pm, precisamos criar uma coluna para o ponto médio das classes (Pm). O passo seguinte é criar uma outra coluna indicada por.pm para colocarmos os resultados do produto de freqüência de cada classe pelo seu respectivo ponto médio. Finalmente, observe que a última linha da distribuição de freqüências deve ser destinada para a soma das colunas das freqüências absolutas e do produto das freqüências pelo ponto médio. Então utilizando a fórmula, obtém-se:. Pm x = => 3.250 / 50 = 65 que é a nota média desse grupo de estudantes. 25
Moda Cálculo da moda para dados isolados. Dene-se a moda (Mo) de uma série de n valores X1, X2, X3,... Xn como sendo o valor de maior freqüência de um conjunto de dados. Isto signica que numa série de valores isolados a moda pode ser localizada com facilidade por exame dos dados do que por cálculos. Ex: 2, 3, 4, 2, 1, 2, 5, 1 a moda é 2, uma vez que este ocorre com maior freqüência no conjunto de dados (aparece 3 vezes). De acordo com o comportamento de uma série, com dados isolados, podemos ter: a) série amodal não existe moda pois todos os valores da série ocorrem com a mesma freqüência; b) série modal ou unimodal existe uma única moda, como no exemplo acima; c) série plurimodal existem duas ou mais modas numa mesma série. Cálculo da moda em uma distribuição de freqüências Denomina-se classe modal, a classe que possui a maior freqüência absoluta, ou seja, é a classe que contém a moda. Dene-se a moda bruta como sendo o ponto médio da classe modal, isto é, o ponto médio da classe que possui a moda. Na distribuição de freqüências dada na tabela 16, a classe modal é a 4ª classe (60 -- 70) e a moda bruta é 65 que é o seu ponto médio. Tabela 16 - Notas da disciplina X, distribuídas em classes Classes de Notas 30 40 4 40 50 6 50 60 8 60 70 13 70 80 9 80 90 7 90 100 3 Total 50 Fonte: Elaboração própria, 2004 Para o cálculo convencional da moda, existem dois métodos conhecidos como: método das freqüências absolutas e método das diferenças. 26
Método das freqüências absolutas: este método é baseado nas freqüências absolutas das classes, anterior e posterior à classe modal e sua fórmula é dada pela expressão: Mo = Li + f f anterior posterior + f posterior. h Onde: Li = é o limite inferior da classe modal; Fposterior = freqüência absoluta da classe posterior à classe modal; Fanteriorr = freqüência absoluta da classe anterior à classe modal, e h = amplitude da classe modal Ex: Calcule a moda pelo processo das freqüências dos valores dispostos na tabela nº 16. Solução: Em primeiro lugar devemos identicar a classe modal, isto é, a classe que contém a maior freqüência absoluta. É a classe 60 -- 70. O limite inferior desta classe é Li = 60. a seguir, identica-se a freqüência absoluta posterior à classe modal, fpos = 9 e a freqüência absoluta anterior à classe modal, fant = 8 e nalmente identicamos o valor da amplitude da classe modal, h = 10. Substituindo esses valores encontrados na fórmula, temos: 9 9 90 Mo = 60 + 10 = 60 + 10 Mo = 60 + = 60 + 5,29 = 65, 29 8+ 9 17 17 Assim, a moda calculada é 65,3, arredondando-se. Método das diferenças: este método é baseado nas diferenças entre a classe modal e as classes vizinhas, anterior e posterior à classe modal, e sua fórmula é dada pela expressão: d1 Mo = Li + h d1+ d2 Onde: Li = é o limite inferior da classe modal; d1 = é a diferença entre a freqüência absoluta da classe modal e a freqüência 27
da classe vizinha anterior à classe modal; d2 = é a diferença entre a freqüência absoluta da classe modal e a freqüência da classe vizinha posterior à classe nodal. h = amplitude da classe modal Ex: Calcule a moda pelo processo das diferenças dos valores dispostos na tabela nº 16. (13 8) 5 Mo = 60 + 10 = 60 + 10 = (13 8) + (13 9) 5 + 4 50 Mo = 60 + = 60 + 5,56 = 65,56 9 Portanto a moda pelo processo das diferenças é 65,6. Mediana Cálculo da mediana para dados isolados: A Mediana (Md) de uma série de n ternos, X1, X2, X3,... Xn, colocados em ordem crescente ou decrescente de valor é o termo cuja posição (P) central da série deixa a mesma quantidade de elementos à sua esquerda e à sua direita. Para um conjunto de dados isolados (não agrupados em uma classe de freqüências), a posição da mediana pode ser achada nas seguintes situações: Se o nº de elementos da série for ímpar, o Rol admite apenas um termo central e a posição da mediana será dada por: P = n +1 2 Ex: Calcular a mediana da série: 3, 15, 7, 6, 4, 1 e 12. Solução: Em primeiro, ordena-se os dados da série de forma crescente ou decrescente: 1, 3, 4, 6, 7, 12, 15 => temos n = 7 (ímpar), utilizando a fórmula temos: = n +1 7 + 1 P = = 4 Portanto, a mediana será o quarto termo, contado da esquerda para a 2 2 direita. Md = 6 28
Se o nº de elementos da série for par, o Rol admite dois termos centrais que ocupam as posições: n n P1 = e P2 = + 1 2 2 Neste caso, a mediana é convencionada como sendo a média dos valores que ocupam estas duas posições centrais. Tomando-se a série de dados ordenados do exemplo anterior e adicionando o nº 9 obtemos: 1, 3, 4, 6, 7, 9, 12, 15 => n = 8 é par a mediana será a média aritmética dos termos centrais, 6 e 7, cujas posições são: n 8 n 8 P1 = = = 4 ep2 = + 1 = + 1= 5 2 2 2 2 6 + 7 13 Md = = = 6,5 2 2 Efetuando a média aritmética do 4º e 5º termos da série, respectivamente 6 e 7 temos: Cálculo da Mediana em uma distribuição de freqüências A Mediana (Md) corresponde ao termo que divide a série em duas partes iguais, isto é, é o valor que deixa 50% dos dados de cada lado, ou seja, n/2. (n dividido por dois). Em uma distribuição de freqüências chama-se classe mediana a classe que contém a mediana, e sua fórmula é dada pela expressão: n ' fac Md = Li + 2 h Onde: Li = é o limite inferior da classe que contém a mediana; n/2 = é a posição (P) da mediana na distribuição de freqüências, seja n (soma das freqüências absolutas) par ou impar; fac = é a freqüência acumulada da classe vizinha anterior à classe mediana; = é a freqüência absoluta da classe mediana e, 29
h = amplitude da classe mediana Ex: Calcular a mediana da distribuição de notas dadas na tabela 17. Tabela 17 - Notas da disciplina X, distribuídas em classes Classes de Notas fac 30 40 4 4 40 50 6 10 50 60 8 18 60 70 13 31 25º 70 80 9 40 80 90 7 47 90 100 3 50 Total 50 Fonte: Elaboração própria, 2004 Solução: Apenas as duas primeiras colunas da tabela fazem parte do enunciado do problema. A terceira coluna fac (freqüências absolutas acumuladas) foi construída porque a fórmula do cálculo refere-se à posição da mediana, que é calculada através de n / 2, e pode ser observada na coluna que corresponde às freqüências acumuladas. O próximo passo, é calcularmos a posição da mediana, ou seja, a mediana é o vigésimo quinto termo da série. n 50 P =, dada por P = = 25, 2 2 Depois de identicar a classe que contém a mediana, podemos aplicar a fórmula da mediana, obtendo: 50 18 2 25 18 70 Md = 60 + 10 = 60 + 10 = 60 + = 60 + 5,38 = 65,38 13 13 13 A nota mediana de 65,4 revela que este valor coloca a mesma quantidade de alunos com notas superiores e inferiores a 65,4. Ou de outra maneira, podemos dizer que 50% dos valores da série são menores ou iguais a 65,4 e que 50% dos valores são maiores ou iguais a 65,4. Concluindo: Devemos optar pela média, quando houver forte concentração de dados na área central da série; 30
Devemos optar pela mediana, quando houver forte concentração de dados no início ou no nal da série; A moda deve ser opção como medida de tendência central apenas em séries que apresentam um elemento típico, isto é, um valor cuja freqüência é muito superior à freqüência dos outros elementos da série. (Estatística - Ermes M. da Silva e outros.pág 84 Ed. Atlas 3ª edição 1999). Separatrizes Separatriz de um conjunto ordenados Rol (de forma crescente ou decrescente) X1, X2, X3,... Xn, é o termo da série que a divide em partes iguais. As principais separatrizes são a mediana, os quartis, os decis e os percentis. Os quartis, os decis e os percentis são separatrizes que dividem o conjunto de dados em quatro, dez e cem partes iguais respectivamente. O estudo das separatrizes é muito importante nas ciências sociais, uma vez que permite padronizar determinada nota em relação ao grupo estudado. Exemplo: Vamos supor que um aluno obteve 8,0 na prova de Estatística e deseja-se saber com exatidão o seu desempenho em relação aos demais colegas que zeram a mesma prova. Neste caso estamos interessados em saber que o posto percentil que representa a nota 8,0. Se, por exemplo, a nota 8,0 corresponde o posto percentil 75, então 75% dos alunos obtiveram notas inferiores a 8,0, enquanto que os restantes 25% obtiveram notas superiores a 8,0. Quartis Representados por Q1, Q2 e Q3, e chamados, respectivamente, de primeiro, segundo e terceiro quartil. São escores que dividem um conjunto de dados em quatro partes iguais. 31
0% 25% 50% 75% 100% Q1 Q2 Q3 O primeiro quartil Q1 de uma série ordenada de modo crescente é o termo do conjunto de dados que é precedido por 25% (n/4) dos termos da série, enquanto que os outros 75% (3n/4) cam à direita deste quartil.(de outro modo, pode-se dizer que este quartil deixa 25% dos elementos à sua esquerda.). O segundo quartil Q2 coincide com a mediana, (Q2 = Md), divide a série em duas partes iguais (n/2). O terceiro quartil Q3 é o termo da série que é precedido por 75% (3n/4) dos termos e seguido pelos restantes 25% (n/4). Decis Os decis são representados por D1, D2, D3,... D9, chamados respectivamente de, primeiro, segundo, terceiro,..., nono decil, são escores que dividem uma série de dados em 10 partes iguais: 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% D1 D2 D3 D4 D5 D6 D1 D1 D9 O primeiro decil D1 - de uma série ordenada de modo crescente é o termo da série que é precedido pó 1% (n/10) dos termos e seguido pelos restantes 90% (9n/10) de modo análogo o oitavo decil (D8) é precedido por 80% (8n/10) e seguido pêlos restantes 20% (2n/10). De forma semelhante denimos os decis restantes. Observa-se que o quinto decil (D5) é igual a mediana. ( D5 = Md ). 32
Percentis Os percentis são representados por P1, P2, P3,..., P99, são chamados, primeiro, segundo, terceiro,... nonagésimo nono percentil. São as medidas que dividem um conjunto em 100 partes iguais. 1% 50% 99% P1 P50 P99 O primeiro percentil (P1) de um conjunto de dados ordenados de modo crescente é o termo da série que é precedido de 1% (n/100) e seguido pêlos restantes 99% (99n/100). O décimo quinto percentil (P15) é precedido por 15% (15n/100) dos termos e seguido pelos restantes 85% (85n/100). De forma análoga denimos os demais percentis. Observa-se que o qüinquagésimo percentil (P50) é igual a mediana. ( P50 = Md ). Cálculo das separatrizes em uma distribuição de freqüências: A fórmula para calcular uma separatriz é semelhante à fórmula da mediana. Substitui-se o termo n/2 (posição da mediana) pela letra P que indicará a posição da separatriz (quartil, decil ou percentil), e sua fórmula é dada pela expressão: P( S) ' fac S = Li + h Onde: S = Separatriz desejada (quartil, decil ou percentil); Li = é o limite inferior da classe que contém a separatriz; P(S) = é a posição da separatriz; fac = é a freqüência acumulada da classe vizinha anterior à classe que 33
contém a separatriz; = é a freqüência absoluta da classe que contém a separatriz e, h = amplitude da classe que contém a separatriz. Observando a fórmula, P(S), nos dá a posição da separatriz. De modo semelhante ao utilizado para a mediana, localizamos a classe que contém a separatriz através da sua posição no conjunto de dados e da coluna que contém as freqüências acumuladas. A posição de uma separatriz (quartil, decil ou percentil) é dada pelas seguintes expressões: i n P( Q) = => onde, i = 1,2,3 4 i n P( D) = => onde, i = 1,2,3...,9 10 i n P( P) = => onde, i = 1,2,3...,99 100 A tabela 18 apresenta o resultado de Quociente de Inteligência (Q.I.) obtidos junto a um grupo de 50 pessoas de uma determinada escola. Calcular e interpretar as seguintes separatrizes: a) o primeiro quartil Q1; b) o segundo decil D2; c) o septuagésimo oitavo percentil P78. Tabela 18 - Quociente de Inteligência (Q.I.) de 50 pessoas Classes de Q.I. fac 80 90 2 2 90 100 3 5 P(D2) 100 110 5 10 10º elemento P(Q1) 110 120 12 22 12,5º elemento 120 130 10 32 P(P78) 130 140 15 47 39º elemento 140 150 3 50 Total 50 Fonte: Elaboração própria, 2004 34
Solução: Para o cálculo destas três separatrizes, devemos em primeiro lugar, achar a posição de cada uma delas e em seguida localizar, com o auxilio da coluna das freqüências acumuladas, a posição de cada classe que contém a separatriz desejada e depois aplicar a fórmula. Primeiro: Calcular o Primeiro quartil (Q1), então i = 1 e como n = 50 podemos encontrar a posição dessa separatriz como segue: 1 50 P( Q1) = i n = = 12,5 4 4 A posição encontrada é entre o 12º e o 13º elementos da série. Observando a terceira coluna da tabela 18, verica-se que este elemento está na 4ª classe, onde o limite inferior da classe é 110. Aplicando-se a fórmula temos: i n / 4 ' fac 12,5 10 25 Q1 = Li + h = 110 + 10 = 110 + = 112,08 12 12 Este resultado signica que 25% dos alunos têm Q.I. inferior a 112,08 enquanto que os outros 75% restantes possuem Q.I. superior a 112,08. Segundo: Calcular o segundo decil (D2), então i = 2 e como n = 50 podemos encontrar a posição dessa separatriz como segue: 2 50 100 P( D2) = i n = = = 10 10 10 10 Encontramos que o segundo decil é o 10º elemento da série de dados. Observando a tabela 18, verica-se que o 10º elemento está na terceira classe, cujo limite inferior da classe é 100. Aplicando-se a fórmula temos: i n /10 ' fac 10 5 50 D2 = Li + h = 100 + 10 = 100 + = 110 5 5 Signicando que 20% dos alunos possuem Q.I. abaixo de 110, enquanto os 80% restantes possuem Q.I. acima de 110. 35
Terceiro: Calcular o septuagésimo oitavo percentil (P78), então i = 78 e como n = 50 podemos encontrar a posição dessa separatriz como segue: i n 78 50 3900 P( P78) = = = = 39 100 100 10 Encontramos que o septuagésimo oitavo percentil é o 39º elemento da série ordenada. Verica-se que este elemento pertence à sexta classe de freqüências, cujo limite inferior é 130. Aplicando-se a fórmula temos: i n /100 ' fac 39 32 7 P78 = Li + h = 130 + 10 = 130 + = 130 = 4,67 = 134,67 15 15 Signicando que 78% dos alunos têm Q.I. abaixo de 134,7, enquanto os 22% restantes possuem Q.I. acima de 134,7. Exercícios Propostos: Livro Estatística Básica Autor: Djalma Agra páginas: 93 a 99. 36
37