Estatística e Probabilidade Aula 2 Cap 02 Estatística Descritiva
Neste capítulo... estudaremos formas de organizar e descrever conjuntos de dados. O objetivo é tornar os dados mais compreensíveis de modo a enxergar neles tendências, médias e variações.
Dados etários da população de Akhiok-Alasca 0 1 1 1 2 2 2 3 3 4 4 4 6 6 6 6 7 7 8 8 9 10 10 10 11 11 11 12 12 13 1 16 16 17 17 21 21 22 23 24 2 2 26 27 27 28 28 29 30 31 31 32 32 33 33 34 36 39 41 42 4 46 47 48 49 0 0 1 2 3 4 6 63 Sem uma maneira de organizar estes dados é difícil enxergar padrões.
Distribuição de freqüência e seus gráficos Distribuição de freqüências é uma tabela que mostra classes ou intervalo de entrada de dados com um número total de entradas em cada classe. A freqüência f de uma classe é o número de entrada de dados na classe. Classe 1-6-10 11-1 16-20 21-2 26-30 Frequência, f 8 6 8 4 As classes possuem amplitudes iguais e cada classe possui um limite inferior da classe, que é menor número que pode pertencer à classe, e o limite superior que é o maior número que pode pertencer a classe.
Amplitude das classes: Distância entre os limites inferiores (ou superiores) de classes consecutivas. Amplitude total: Diferença entre o máximo e o mínimo das entradas. Classe 1-6-10 11-1 16-20 21-2 26-30 Frequência,f 8 6 8 4 Amplitude das classes: 6-1 = Amplitude total: 30-1 = 29 O número de classes deve estar entre e 20.
Exemplo: Minutos/mês gastos na internet para 30 assinantes 102 124 108 86 103 82 71 104 112 118 87 9 103 116 8 122 87 100 10 97 107 67 78 12 109 99 10 99 101 92 Faça uma tabela de distribuição de freqüência com classes. Valores-chave: Valor mínimo = Valor máximo = 67 12
Como construir uma distribuição de frequências 1. Decida o número de classes, que deve ficar entre e 20. (Para este problema use.) 2. Calcule a amplitude das classes. Primeiro calcule: amplitude total = valor máximo mínimo. Em seguida, divida o resultado pelo número de classes. Por fim, arredonde até o próximo número conveniente. (12 67)/ = 11,6 (arredondado para 12) 3. Calcule os limites das classes. O limite inferior da classe é o valor mais baixo que pertence a ela e o limite superior é o mais alto. Use o valor mínimo (67) como limite inferior da primeira classe. 4. Marque um risco em cada entrada de dado na classe apropriada. Quando todos os valores estiverem marcados, conte os riscos em cada classe para determinar a freqüência dessa classe.
Mínimo = 67, Máximo = 12 Número de classes = Amplitude de classe = 12 Classe 67-78 79-90 91-102 103-113 11-126 Riscos Freqüência 3 8 9 Dica: Faça primeiro todos os limites inferiores.
Definições importantes Ponto médio de uma classe: é a caracteristica de uma classe. É a metade da soma entre os limites inferior e superior da classe (limite inferior + limite superior) / 2 Freqüência relativa de uma classe: é a porção ou porcentagem dos dados que entra nessa classe. f rel = (freqüência da classe) / (tamanho da amostra n) Freqüência cumulativa de uma classe: é a soma da frequencia daquela classe com a de todas as classes anteriores. A frequencia cumulativa da última classe é igual ao tamanho da amostra n.
Definições importantes Tabela: possibilidade de identificar padrões Classe f Ponto médio (67 + 78)/2 Freqüência relativa ( f / n) Freqüência cumulativa 67-78 3 72, (3 / 30) = 0,10 3 79-90 84, ( / 30) = 0,17 8 91-102 8 96, 0,27 16 103-113 9 108 0,30 2 11-126 120, 0,17 30
Estatística e Probabilidade Gráficos das distribuições de freqüência
Histograma de freqüência é um gráfico de barras que representa a distribuição de freqüência de um conjunto de dados. Um histograma possui as seguintes propriedades: 1 A escala horizontal é quantitativa 2 A escala vertical mede as freqüências das classes 3 Barras consecutivas devem estar encostadas umas as outras Como as barras de freqüência devem se encostar elas começam e terminam na fronteira das classes, e não nos limites das classes. Fronteira das classes são os números que separam as classes sem deixar uma falha entre elas.
Para determinar a fronteira de classe encontre a média do valor entre o limite inferior da segunda classe e o limite superior da primeira classe. Subtraia este valor da fronteira inferior da primeira classe e some ao valor superior da primeira classe e assim sucessivamente para as outras classes. (79 78) / 2 = 0, Classe f 67-78 3 79-90 91-102 8 103-113 9 11-126 Fronteiras 66, 78, 78, 90, 90, 102, 102, 114, 114, 126, 9 8 7 6 4 3 2 1 0 3 66, Tempo na internet 78, 8 90, 102, 114, 126, minutos 9
Polígono de freqüência é um gráfico em forma de linha que enfatiza a mudança contínua nas freqüências. Para traçar um polígono de freqüência marque o ponto médio no topo de cada barra. Conecte os pontos médios consecutivos. Estenda o polígono até os eixos. 9 8 7 6 4 3 2 1 0 3 8 72, 84, 96, 108, 120, minutos 9 Tempo na internet
Histograma de freqüência relativa Apresenta em sua escala vertical as freqüências relativas. Freqüência relativa 0,30 0,20 0,10 0 Tempo na internet 0,27 0,30 0,17 0,17 0,10 66, 78, 90, 102, 114, 126, minutos
Gráfico de freqüência cumulativa Um gráfico de freqüência cumulativa (ou ogiva) mostra o número de valores, em um conjunto de dados, que são iguais ou inferiores a um dado valor x. Freqüência cumulativa 30 20 10 0 0 Tempo na internet 30 2 16 8 3 66, 78, 90, 102, 114, 126, minutos
Mais gráficos e representações
Diagrama de tronco e folhas é similar ao histograma, mas com a vantagem de que o gráfico ainda contém os valores dos dados originais. 102 124 108 86 103 82 71 104 112 118 87 9 103 116 8 122 87 100 10 97 107 67 78 12 109 99 10 99 101 92 Se o valor mais baixo é 67 e o mais alto é 12, o tronco vai de 6 a 12.
Diagrama de tronco e folhas 102 124 108 82 103 8 71 104 112 118 86 9 103 116 87 122 87 100 10 97 107 67 78 12 109 99 10 99 101 92 6 7 7 1 8 8 2 6 7 7 9 2 7 9 9 tronco 10 0 1 2 3 3 4 7 8 9 11 2 6 8 12 2 4 Chave: 6 7 significa 67 folhas
Diagrama de tronco e folhas 2 linhas/tronco Chave: 6 7 significa 67 Dígitos da 1 a linha 0 1 2 3 4 Dígitos da 2 a linha 6 7 8 9 Dígitos da 1 a linha 0 1 2 3 4 Dígitos da 2 a linha 6 7 8 9 6 6 7 7 1 7 8 8 2 8 6 7 7 9 2 9 7 9 9 10 0 1 2 3 3 4 10 7 8 9 11 2 11 6 8 12 2 4 12
Plote de pontos Em um plote de pontos cada entrada é desenhada, usando um ponto sobre um eixo horizontal. minutos/mês na Internet 66 76 86 96 106 116 126 minutos Um plote de pontos permite que se veja como os dados estão distribuídos e se determinem entradas específicas de dados.
Diagrama de Pizza tem a forma de um círculo que mostra as relações das partes como um todo. Para encontrar o angulo central para uma entrada de dados multiplique 360 0 pela frequência relativa da entrada de dados. Exemplo O orçamento da Nasa (em bilhões de dólares) dividido em três categorias Bilhões de US$ Vôo espacial humano,7 Tecnologia,9 Apoio às missões 2,7 Construa um diagrama de pizza para esses dados.
Total Bilhões de US$ Vôo espacial humano,7 Tecnologia,9 Apoio às missões 2,7 Apoio às missões 19% 14,3,7 14,3 Graus 143 149 68 360,9 Tecnologia 41% Vôo espacial humano 40% 14,3 Orçamento da Nasa (em bilhões de dólares)
Diagrama de Pareto é um gráfico de dados qualitativos no qual a altura de cada barra representa a freqüência ou a freqüência relativa. É frequentemente usado no contexto de negócios. Exemplo: Recentemente uma industria varejista perdeu 4 milhões de dólares de seus ativos. Os dados das perdas são mostrados na tabela abaixo: Se você fosse o varejista qual causa escolheria para atacar primeiro? Causas administrativas furtos de funcionários assaltos a lojas fraudes nas vendas Valores (em milhões) 7,8 1,6 14,7 2,9 Milhões de dólares 18 16 14 12 10 8 6 4 2 0 administrativas furtos de funcionários assaltos a lojas fraudes nas vendas Causas
Gráficos de conjuntos de dados emparelhados Se dois conjuntos de dados têm o mesmo número de entradas e cada entrada do primeiro corresponde a uma entrada do segundo, eles são chamados de conjuntos de dados emparelhados. Uma maneira de fazer o gráfico de dados emparelhados é usar um mapa de dispersão.
Mapa de Dispersão é um plote dos pares (x,y) de dados sendo a horizontal o eixo x e a vertical o eixo y. Exemplo: Na tabela abaixo temos a duração do vínculo empregatício e o salário anual correspondente de dez trabalhadores Permanência no emprego (anos) Salário (R$) 4000 4 8 4 2 10 7 6 3922 9 3 28000 32000 3200 40000 2730 2000 43000 4160 4100 salario (em reais) 40000 3000 30000 2000 2 4 6 8 10 Permanência no emprego (anos)
Gráfico da série temporal é um plote de um conjunto de entradas de dados tomadas a intervalos regulares durante um período de tempo. Exemplo: Na tabela ao lado, número de assinantes de telefones celulares em milhões e o valor médio da conta mensal local. Assinantes (em milhoes) 100 80 60 40 20 0 1987 1988 1989 1990 1991 1992 1993 1994 199 1996 1997 1998 1999 2000 Anos Ano 1987 1988 1989 1990 1991 1992 1993 1994 199 1996 1997 1998 1999 Assinantes (em milhões) 1.2 2.1 3..3 7.6 11 16 24.1 33.8 44.3 69.2 86 Conta média (em reais) 96.83 98.02 89.3 80.9 72.74 68.68 61.48 6.21 1 47.7 42.78 39.43 41.24