CRITÉRIOS PARA A DETERMINAÇÃO DOS INTERVALOS DE CLASSE Número de classes a considerar (k): a) Tabela de Truman L. Kelley n 5 10 25 50 100 200 500 1000 k 2 4 6 8 10 12 15 15 b) k=5 para n 25 e para n >25. c) Fórmula de Sturges: +,, em que n é a dimensão da amostra. Etapas para a construção de tabelas de frequência (dados contínuos ou discretos com valores muito distintos): 1) Definição das classes a) Determinar a amplitude da amostra (máximo - mínimo) b) Dividir esta amplitude pelo número de classes, k. c) Tomar para amplitude de classe, h, um valor aproximado por excesso do valor obtido em b). d) Construir as classes de modo a que tenham todas a mesma amplitude e cuja união contenha todos os elementos da amostra. 2) Contagem do número de elementos de cada classe. Exemplo: Consideremos a amostra constituída pelas notas obtidas num ponto de Geografia, de uma determinada turma: 12.1 8.9 16.2 8.2 15.1 14.5 13.4 14.7 7.5 8.8 12.4 16.1 15.2 13.5 13.8 14.6 15.5 7.8 12.5 13.2 11.0 10.5 9.8 1
Tabela de frequências da distribuição das notas de Geografia Classes Frequência Frequência Absoluta relativa [7.5, 9.3[ 5 0.218 [9.3, 11.1[ 3 0.130 [11.1, 12.9[ 3 0.130 [12.9, 14.7[ 6 0.261 [14.7, 16.5[ 6 0.261 Total 23 1 2
MEDIDAS DE TENDÊNCIA CENTRAL A) Média Aritmética Caso de Dados não agrupados = 1 Caso de Dados agrupados = 1 = Obs. :, com i=1, 2,, n representa todos os valores observados, pelo que alguns deles podem ser iguais., com i=1, 2,, m representa todos os valores diferentes observados, pelo que alguns deles podem ser iguais. F i frequência absoluta para f i frequência relativa para No caso de dados agrupados em classes considera-se para valores os valores médios desses intervalos ( é o representante da classe). 3
B) Mediana Sendo,,, n valores ordenados (por ordem crescente ou decrescente) de uma variável quantitativa, mediana é o elemento que ocupa a posição central. Caso de variável discreta Se n for ímpar, a mediana será o elemento central (de ordem ). Caso n seja par, a mediana será a média entre os elementos centrais (de ordem e +1). Caso de variável contínua 1º- Calcula-se a ordem 2º - Pela F ac identifica-se a classe que contém a mediana (classe Md). 3º - Utiliza-se a fórmula: Em que: l - limite inferior da classe Md = l + 2.h n - dimensão da amostra f - soma das frequências anteriores à classe Md h - amplitude da classe Md F Md - frequência da classe Md 4
C) Moda Caso de variável discreta Determinar a moda num conjunto de dados deste tipo, não é mais do que verificar o valor que se apresentou mais vezes. Caso de variável contínua Fórmula de Czuber 1º - Identifica-se a classe modal 2º- Aplica-se a fórmula: Em que: = l + + h l - limite inferior da classe modal 1 - diferença entre a frequência da classe modal e a anterior 2 - diferença entre a frequência da classe modal e a posterior h - amplitude da classe. 5
QUANTIS, DECIS E PERCENTIS A) Quartis Os quartis dividem um conjunto de dados em 4 partes iguais. Assim: O primeiro quartil, Q1, é o valor que divide a sequência em duas partes, de tal modo que pelo menos ou 25% das observações sejam iguais ou inferiores a esse valor e ou 75% das observações sejam superiores ou iguais a esse valor; O terceiro quartil, Q3, é o valor que divide a sequência em duas partes, de tal modo que pelo menos ou 75% das observações sejam iguais ou inferiores a esse valor e ou 25% das observações sejam superiores ou iguais a esse valor. Caso de variável discreta Localização de Q1 n par +2 4 n ímpar +1 4 Localização de Q3 3+2 4 3 +1 4 Caso de variável contínua Determinação de Q 1 1º- Calcula-se a ordem 2º -Pela F ac identifica-se a classe que contém Q 1 3º- Utiliza-se a fórmula: = l + 4.h 6
Determinação de Q 3 1º- Calcula-se a ordem 2º -Pela F ac identifica-se a classe que contém Q 3 3º- Utiliza-se a fórmula: = l + 3 4.h 7
B) Decis São os valores que dividem a série em 10 partes iguais 1º- Calcula-se a ordem., em que i=1, 2, 3, 4, 5, 6, 7, 8, 9 2º -Pela F ac identifica-se a classe que contém D i 3º- Utiliza-se a fórmula: Em que: = l +. 10.h l - limite inferior da classe D i, i=1, 2, 3,, 9 n - dimensão da amostra f - soma das frequências anteriores à classe D i h - amplitude da classe F Di - frequência da classe D i 8
C) Percentis São as medidas que dividem a amostra em 100 partes iguais 1º- Calcula-se a ordem., em que i=1, 2, 3,, 99 2º - Pela F ac identifica-se a classe que contém P i 3º- Utiliza-se a fórmula: Em que: = l +. 100.h l limite inferior da classe P i, i=1, 2, 3,, 99 n - dimensão da amostra f - soma das frequências anteriores à classe P i h - amplitude da classe F Pi - frequência da classe P i 9
MEDIDAS DE DISPERSÃO A) Amplitude Total É a diferença entre o maior e o menor valor da série estatística. B) Desvio Médio É a média dos valores absolutos dos desvios. Dados não agrupados = 1 Dados agrupados = 1 Sendo: m - número de classes F i - frequência absoluta x i - representante da classe n - dimensão da amostra 10
C) Desvio Padrão Dados não agrupados = 1 Dados agrupados = 1 Sendo: m- número de classes F i frequência absoluta x i representante da classe n dimensão da amostra Obs. Para valores reduzidos de n é usual utilizar o desvio padrão corrigido da amostra (dados não agrupados): = 1 1 11
D) Variância O quadrado de S é designado por variância da amostra Dados não agrupados = 1 Dados agrupados = 1 Sendo: m- número de classes F i frequência absoluta x i representante da classe n dimensão da amostra Obs. Para valores reduzidos de n é usual utilizar a variância corrigida da amostra (dados não agrupados): = 1 1 E) Coeficiente de Variação = X 12