CAD. 8 SETOR A AULAS 45-48 48 ESTATÍSTICA STICA Prof. Suzart ESTATÍSTICA Elabora métodos para coleta, organização, descrição, análise e intepretação de dados. Experimentos não-determinísticos. Determinação de tendências para tomada de decisões.
POPULAÇÃO ESTATÍSTICA É o conjunto de elementos sobre o qual se realiza o estudo. Exemplo: saber em quem vai votar numa eleição. População estatística: eleitores. Exemplo: saber para qual time os alunos do colégio torcem. População estatística: alunos. AMOSTRA Subconjunto da população estatística. Exemplo: saber em quem vai votar numa eleição. População estatística: eleitores. Amostra: eleitores da região sul ou eleitores com mais de 45 anos. Exemplo: saber para qual time os alunos do colégio torcem. População estatística: alunos. Amostra: alunos do ensino médio.
VARIÁVEL Característica de um indivíduo ou objeto. Variável Qualitativa: Nominal Esporte favorito (futebol, tênis, etc), cor do cabelo (loiro, castanho, preto, etc). Ordinal Grau de instrução (fundamental, médio, superior). Variável Quantitativa: Discreta números inteiros (idade, número de filhos). Contínua intervalos de números reais (altura, massa). ROL É toda sequência de números em que cada termo, a partir do segundo, é maior ou igual ao termo anterior; ou então, menor ou igual ao termo anterior. Exemplo: idades de sete alunos obtidas em um colégio como amostra 15, 16, 15, 14, 17, 15 e 17. Rol: (14,15,15,15,16,17,17) (17,17,16,15,15,15,14)
AMPLITUDE DE UM ROL (H) Diferença entre o maior e o menor valor do rol. Da sequência anterior: (14,15,15,15,16,17,17) H=17-14=3 H=3 CLASSE Temperaturas, em graus celsius, de 25 cidades de um mesmo estado coletadas por um metereologista em um mesmo horários: 21,8 18,5 23,4 25,8 27,4 24,8 18,7 27,5 23,1 28,0 19,5 24,2 25,3 28,5 21,0 25,3 22,4 22,7 21,2 22,7 27,5 25,0 21,6 24,4 22,7
CLASSE ROL (Crescente): (18,5; 18,7; 19,5; 21,0; 21,2; 21,6; 21,8; 22,4; 22,7; 22,7; 22,7; 23,1; 23,4; 24,2; 24,4; 24,8; 25,0; 25,3; 25,3; 25,8; 27,4; 27,5; 27,5; 28,0; 28,5). CLASSE CLASSE: todo intervalo que contém um conjunto formado por termos consecutivos de um rol. EXEMPLO: [19,22[ é uma classe que contém o conjunto: (19,5; 21,0; 21,2; 21,6; 21,8). Limite inferior: 19 Limite superior: 22 Amplitude da classe h = 22-19=3.
FREQUÊNCIA DE UMA CLASSE (f) Ou frequência absoluta: número de termos do rol que pertencem a uma determinada classe. No caso anterior: A classe [19,22[ éformada por: (19,5; 21,0; 21,2; 21,6; 21,8). Sua frequência: f = 5. FREQUÊNCIA RELATIVA (f r ) Quociente da frequência de uma classe pelo número de elementos do rol (n). f r f f = ou em porcentagem fr =.100% n n
DISTRIBUIÇÃO DE FREQUÊNCIA Considere o rol anterior: (18,5; 18,7; 19,5; 21,0; 21,2; 21,6; 21,8; 22,4; 22,7; 22,7; 22,7; 23,1; 23,4; 24,2; 24,4; 24,8; 25,0; 25,3; 25,3; 25,8; 27,4; 27,5; 27,5; 28,0; 28,5) Agrupa-se esse rol em 4 classes de mesma amplitude h. DISTRIBUIÇÃO DE FREQUÊNCIA Assim: 4h= H 4h = 28,5 18,5 4h= 10 h= 2,5 Partindo do primeiro elemento do rol:
DISTRIBUIÇÃO DE FREQUÊNCIA Classe 1: [18,5;18,5+2,5[ [18,5;21,0[ Classe 2: [21,0;21,0+2,5[ [21,0;23,5[ Classe 3: [23,5;23,5+2,5[ [23,5;26,0[ Classe 4: [26,0;26,0+2,5[ [26,0;28,5] DISTRIBUIÇÃO DE FREQUÊNCIA A frequência das classes é: f 1 =3 f 2 =10 f 3 =7 f 4 =5
TABELA DE DISTRIBUIÇÃO TEMPERATURA (GRAUS CELSIUS) [18,5;21,0[ [21,0;23,5[ [23,5;26,0[ [26,0;28,5] FREQUÊNCIA (NÚMERO DE CIDADES) 3 10 7 5 TOTAL= 25 FREQUÊNCIA ACUMULADA(f a ) É a soma das frequências absolutas anteriores. TEMPERATURA (GRAUS CELSIUS) [18,5;21,0[ FREQUÊNCIA (NÚMERO DE CIDADES) 3 FREQUÊNCIA ACUMULADA 3 [21,0;23,5[ [23,5;26,0[ [26,0;28,5] 10 7 5 3+10=13 3+10+7=20 3+10+7+5=25
PONTO MÉDIO DE UMA CLASSE Média aritmética dos valores extremos de uma classe. Exemplo: a classe [18,5;21,0[ tem como ponto médio: pm 18,5 + 21,0 = = 19,75 2 REPRESENTAÇÕES GRÁFICAS Histograma:
REPRESENTAÇÕES GRÁFICAS Diagrama de barras: REPRESENTAÇÕES GRÁFICAS Gráfico de Setores:
MEDIDAS DE TENDÊNCIA CENTRAL Média aritmética: somam-se os n valores e divide-se o resultado por n; só pode ser usada para dados quantitativos; pode ser sempre calculada e é única; é sensível a todos os valores do conjunto; representa um ponto de equilíbrio/centro de gravidade: a soma dos desvios dos números, a contar da média é 0. Média aritmética: Exemplo: (3, 4, 7, 8, 8). 3+ 4+ 7+ 8+ 8 30 MA = x = = = 6 5 5 Média aritmética ponderada: Amostras tem pesos diferentes. Peso = número de repetições de cada amostra. Exemplo: Concurso, com provas de Português, Matemática, Biologia e História, de pesos 3, 3, 2 e 2, respectivamente. Sendo as notas 8,0 em Português, 7,5 em Matemática, 5,0 em Biologia e 4,0 em História, qual é a média? 8, 0 3 + 7,5 3 + 5, 0 2 + 4, 0 2 64,5 MP = = = 6, 45 3+ 3+ 2+ 2 10
MEDIDAS DE TENDÊNCIA CENTRAL Mediana: divide um conjunto ordenado de dados em dois grupos de igual quantidade: de um lado, valores maiores, de outro, menores; pode ser sempre calculada e é única; é insensível aos valores extremos do conjunto; para número par de dados a mediana é a média entre os dois valores centrais. Exemplo: No rol: (18,5; 18,7; 19,5; 21,0; 21,2; 21,6; 21,8; 22,4; 22,7; 22,7; 22,7; 23,1; 23,4; 24,2; 24,4; 24,8; 25,0; 25,3; 25,3; 25,8; 27,4; 27,5; 27,5; 28,0; 28,5), a mediana é 23,4. MEDIDAS DE TENDÊNCIA CENTRAL Moda: é o valor de maior frequência, o que mais se repete; existem distribuições bimodais, trimodais, etc.; quando todos os valores ocorrem com frequências semelhantes, a moda nada acrescenta à descrição; Exemplo: No rol: (18,5; 18,7; 19,5; 21,0; 21,2; 21,6; 21,8; 22,4; 22,7; 22,7; 22,7; 23,1; 23,4; 24,2; 24,4; 24,8; 25,0; 25,3; 25,3; 25,8; 27,4; 27,5; 27,5; 28,0; 28,5), a moda é 22,7.
MEDIDAS DE DISPERSÃO Verificação da flutuação dos valores em torno da média aritmética. Variância(Var): média dos quadrados dos afastamentos entre as os valores da variável e sua média aritmética; dispersão do conjunto que se estuda; n ( xi x) Var = n i= 1 2 MEDIDAS DE DISPERSÃO - Variância Exemplo: (3, 4, 7, 8, 8). 2 2 2 2 2 (3 6) + (4 6) + (7 6) + (8 6) + (8 6) Var = = 5 9+ 4+ 1+ 4+ 4 22 = = = 4, 4 5 5
MEDIDAS DE DISPERSÃO Desvio Padrão (DP) DP Var Raiz quadrada da variância: quanto maior o desvio padrão mais heterogênea é a distribuição, significa que os valores são mais dispersos em torno da média. Do exemplo anterior: DP = 4, 4 2,1 =