5. Medidas de Posição
|
|
|
- Marcela di Castro Barros
- 9 Há anos
- Visualizações:
Transcrição
1 5. Medidas de Posição Depois de se fazer a coleta e a representação dos dados de uma pesquisa, é comum analisarmos as tendências que essa pesquisa revela. Assim se a pesquisa envolve muitos dados, convêm sintetizarmos todas essas informações a um mínimo de parâmetros que possam caracterizá-la. Esses parâmetros podem ser de: centralização: média aritmética, mediana e moda. separatrizes: mediana, quartis e percentis. dispersão: intervalo de variação, desvio médio, variância e desvio padrão. 1. Média Aritmética ( x ou µ) A média caracteriza o centro da distribuição de freqüências, sendo, por isso uma medida de posição. Podemos definir vários tipos de médias de um conjunto de dados, temos a média aritmética, a média geométrica, a média harmônica, etc. Aqui, trabalharemos exclusivamente com a média aritmética (simples ou ponderada). É comum distinguirmos, em termos de notação, a média amostral e a média populacional, embora o cálculo de ambas seja o mesmo e apresente, portanto, o mesmo resultado: x (lê-se: xis barra ) média amostral µ (lê-se: mi ) média populacional Há três formas para calcular a média. Isse depende de como está o nosso conjunto de dados: não agrupados, agrupados sem classes ou agrupados com classes. Importante: nunca devemos arredondar o valor da média, mesmo que esse número não faça, aparentemente, sentido. Por exemplo: se calculamos que o número médio de filhos é 1,8, não devemos arredondar para. Embora não faça sentido falarmos em 1,8 filhos por família, pense em 18 filhos (em média) a cada 10 famílias, ou, ainda, 180 filhos, em média, a cada 100 famílias. Agora, o número médio passa a ter um sentido prático. Caso I: Dados não agrupados Para uma seqüência numérica X: x 1, x,, x n, a média aritmética simples, que designamos por x ou µ é definida por: x=µ x i = n Exemplo 1: calcular a média da série X :, 0, 5, 3: x = =,5 4 77
2 Caso II: Dados agrupados sem intervalos de classe Se os dados estão apresentados na forma de uma variável discreta faremos a média aritmética ponderada considerando as freqüências simples de f i como sendo as ponderações dos elementos x i correspondentes: Assim a fórmula para o cálculo da média é: xifi x = µ = ou f i x = µ = x f n i i Exemplo : Considerando a distribuição: x i f i total 6 n x ifi X = n = = = 4 Caso III: Dados agrupados com intervalos de classe Quando os dados estão agrupados com intervalos de classes, ou seja, quando se trata de uma variável contínua, se aceita, por convenção, que as freqüências se distribuem uniformemente ao longo da classe e que, portanto, o ponto médio da classe é o valor representativo do conjunto. Neste caso a média será calculada fazendo a média aritmética ponderada considerando as freqüências simples de f i como sendo as ponderações dos elementos xi correspondentes, onde x i é o ponto médio do intervalo. Assim, a fórmula para o cálculo da média é a mesma que a do caso II: xifi x = µ = ou f i x = µ = x f n i i Relembrando: Ponto médio de uma classe (x i ) corresponde à soma do limite inferior com o limite superior dessa classe, dividindo o resultado por. Ou seja: Ponto médio = LI x = i classe + LS classe 78
3 Exemplo 3: Considere a distribuição: classe f i x i total = = 10 n xifi x = = = =, 50 n Moda (Mo) A moda de uma série de valores é o valor de maior freqüência absoluta,ou seja, o valor que aparece o maior número de vezes na distribuição. Fique atento: moda é um valor, ou seja, x i. Moda NÃO é a freqüência (f i )! Assim como no caso da média, vamos considerar três casos para obtermos a moda. Caso I: Dados não agrupados Exemplos: 1) Dada a série:, 0, 0, 5, 3, observamos que o valor 0 ocorreu duas vezes. Logo, Mo = 0. ) Seja o ROL: 1,, 5, 7, 1,18, notamos que não existe um valor que apareça mais vezes. Neste caso, dizemos que a série de dados é amodal (não há moda). 3) Dada a série: 1, 1,,,, 3, 3, 3, 4, 5, 5, 6, vemos que os valores e 3 ocorreram três vezes cada um. Neste caso, temos dois valores modais, ou seja, Mo = e 3. A série é dita bimodal. Caso II: Dados agrupados sem intervalos de classe Exemplo 4: Considerando a distribuição: x i f i total 6 A maior freqüência é 3, que corresponde ao valor 4. Logo, Mo = 4. 79
4 Caso III: Dados agrupados com intervalos de classe Neste caso, a classe que apresenta a maior freqüência é denominada classe modal. No caso de distribuição de freqüências em classes de mesma amplitude, a moda corresponde a um ponto pertencente à classe modal dado pela fórmula de Czuber: Mo = L Mo D1 + D1 + D.h com D 1 = f mo f ant D = f mo f post onde: L Mo = limite inferior da classe modal f Mo = freqüência absoluta da classe modal f ant = freqüência absoluta da classe imediatamente anterior à classe modal f post = freqüência absoluta da classe imediatamente posterior à classe modal h = amplitude da classe modal Exemplo 5: Considere a distribuição: classe modal classe f i x i total Inicialmente, devemos localizar a CLASSE MODAL, ou seja, a classe que conterá a moda. Ela corresponde ao intervalo que possui maior freqüência. No caso, Feito isso, basta aplicarmos a fórmula de Czuber: L Mo = 00 f Mo = 18 f ant = 4 f post = 10 h = 0-00 = 0 Logo: D 1 = 18 4 = 14 D = = 8 A moda será: 80
5 14 14 M o = = = 1, Mediana (Md) A mediana de um conjunto de valores, colocados em rol, é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos (elemento que ocupa a posição central). Em outras palavras, tendo-se um conjunto de dados ordenados de maneira crescente (ROL), a mediana é o valor que separa os 50% dos menores dados dos 50% maiores. Caso I: Dados não agrupados Exemplo 6: CASO ÍMPAR: sejam os resultados de 5 lançamentos de um dado:, 4, 4, 5, 6. A mediana corresponde ao valor 4, visto que ele é o valor central, deixando dados à sua esquerda e à sua direita. Assim, Md = 4. Note que n=5 (ímpar). A posição ocupada pela mediana é a 3ª. Essa posição poderia ser obtida da seguinte forma: n 5 + 0,5 = + 0,5 = 3 ª posição que corresponde ao valor Md=4. Exemplo 7: CASO ÍMPAR: sejam as idades de 9 pessoas: 37, 8, 40, 41, 45, 37, 37, 41, 44. Colocando os dados em rol temos: 8, 37, 37, 37, 40, 41, 41, 44, 45. A mediana corresponde ao valor 40 (ou seja, idade), pois há quatro valores à esquerda de 40 e quatro valores à direita de 40. Assim, Md=40. Perceba que a posição ocupada pela mediana é a 5ª. Utilizando o mesmo raciocínio do exemplo anterior, podemos obter essa posição através do seguinte cálculo: n 9 + 0,5 = + 0,5 = 5 ª posição que corresponde ao valor Md=40. Exemplo 8: CASO PAR: considere o número de filhos de 6 famílias: 0, 0, 1,, 3, 3. Perceba que a mediana não poderia ser 1, pois deixaria dois valores à esquerda e três à direita. Da mesma forma, a mediana não poderia ser, pois deixaria três valores à esquerda e dois valores à direita. Dessa forma, a mediana será a média aritmética dos dois valores centrais: 1+ Md = = 1,5 (nunca arredondar!) Observe que a mediana corresponde à média dos valores que ocupam a 3ª e 4ª posições. Essas posições podem ser obtidas da seguinte forma: n 6 n 6 = = 3 ª posição e + 1= + 1= 3 + 1= 4 ª posição. 81
6 Novamente, vamos ressaltar: a 3ª posição é ocupada pelo valor 1; a 4ª posição é ocupada pelo valor. A mediana é, portanto, o valor 1,5. Exemplo 9: CASO PAR: sejam as idades de 8 pessoas: 1, 4, 8, 31, 34, 35, 38, 38 A mediana corresponde a média aritmética dos dois valores centrais, que são 31 e 34. Assim: Md = = 3,5 anos. Note que o valor 31 anos está na 4ª posição e o valor 34 anos ocupa a 5ª posição. Vamos obter essas posições utilizando a mesma fórmula do exemplo anterior: n 8 n 8 = = 4 ª posição e + 1= + 1= 4 + 1= 5 ª posição Logo, a mediana corresponderá a média dos valores que ocupam as posições calculadas. A mediana não precisa ser um dos valores da distribuição e nem deve ser arredondada! Caso II: Dados agrupados sem intervalos de classe Para determinarmos à mediana de uma distribuição de dados discreta, vamos trabalhar com as situações de n par ou n ímpar que citamos nos exemplos do caso I. Para facilitar a localização da posição da mediana, utilizaremos a freqüência acumulada. Exemplo 10: n ÍMPAR Considerando a distribuição: Inicialmente, calculamos a posição ocupada pela mediana utilizando a regra de n ímpar: 1 + 0,5 = 10,5 + 0,5 = 11ª posição. idades f i F i Significado de F i (posições) ª a 3ª ª a 8ª ª a 14ª ª a 16ª ª a 1ª total
7 Na tabela, localizamos a linha que contém a 11ª posição, que no caso é a terceira linha. Verificamos o valor que está nessa linha, que no caso é a idade 15. Assim, Md = 15 anos. Exemplo 11: n PAR Considere a distribuição: Significado de idades f i F i F i (posições) 0 1ª a ª ª a 7ª ª a 14ª total Calculando a posição da mediana, utilizando a regra de n PAR: 14 = 7 ª posição e a seguinte, ou seja, 8ª posição. Ou seja, os valores centrais da distribuição ocupam a 7ª e 8ª posições. Na tabela, vemos que a 7ª posição é ocupada pelo valor (idade) 1 anos, enquanto que a 8ª posição é ocupada pelo valor anos. A mediana da distribuição será: 1+ Md = = 1,5 anos. Mais uma vez, perceba que a mediana é um valor. As posições são calculadas apenas para que cheguemos a esse valor, que no caso é Md=1,5. Caso III: Dados agrupados com intervalos de classe Quando estamos trabalhando com variáveis contínuas, ou seja, quando os dados estão agrupados em classes, determinamos a classe na qual se encontra a mediana, que chamaremos de classe mediana. Neste caso, não nos preocuparemos se estamos trabalhando com uma quantidade de dados par ou ímpar, visto que apenas precisamos determinar a classe que contém a mediana. Em seguida, calculamos o valor da mediana através da fórmula: Md = L Md n F + fmd ant. h em que: L Md é o limite inferior da classe mediana; F ant é a freqüência acumulada da classe anterior à classe mediana; h é a amplitude do intervalo da classe mediana; f Md é a freqüência simples (ou absoluta) da classe mediana. 83
8 Exemplo 1: considere a distribuição: classe mediana classe f i F i Significado de F i (posições) ª a 4ª ª a ª ª a 3ª ª a 37ª ª a 40ª total Vamos verificar qual a classe que contém a mediana. Para isto, vamos calcular a posição ocupada pela mediana: 40 = 0ª posição. Note que essa posição corresponde à classe Esta é a classe mediana. Utilizando a fórmula apresentada: L i = 00 F ant = 4 h= 0 00 = 0 f Md = Md = = ,78 Md = 17,78 18 Exemplo 13: considerando a distribuição: classe mediana Alturas (cm) f i Fi Significado de F i (posições) ª a 4ª ª a 13ª ª a 4ª ª a 3ª ª a 37ª ª a 41ª total Cálculo da classe mediana: 41 = 0,5 ª posição. Vamos arredondar para a 1ª posição. Na tabela, identificamos que essa posição se encontra na classe Usando a fórmula: 84
9 Li = 158 F ant = 13 h = = 4 f Md = Md = = 158 +,54 Md = 160,54 cm Exemplos Vamos obter a média, a moda e a mediana para os casos a seguir. Exemplo 14: considere as notas obtidas por 5 alunos, numa avaliação de Estatística, distribuídas na tabela abaixo. Determine a média, a mediana e a moda. Nota f i F i , , Total fi.x i , , ,5 Média: µ = x = = = = 7, 7. n 5 5 Moda: é o valor com maior freqüência. Na tabela, vemos que a maior freqüência é 8 e corresponde à nota 8,5. Logo, Mo = 8,5. Mediana: inicialmente, calculamos a posição da mediana usando a regra do n ÍMPAR: 5 + 0,5 = 1,5 + 0,5 = 13 ª posição. Utilizando a coluna da freqüência acumulada, percebemos que o valor que ocupa a 13ª posição é a nota 8,5. Assim, Md = 8,5. Resumindo: a nota média obtida na prova feita pelos 5 alunos é 7,7, sendo que a nota 8,5 ocorreu com a maior freqüência (moda) e 8,5 é a nota que separa as 50% menores notas obtidas das 50% maiores (mediana). 85
10 Exemplo 15: a tabela abaixo indica o aluguel de um grupo de casas. Classe Aluguel (R$) Nº de casas F i x i (ponto médio) total classe modal e classe mediana Média: para o cálculo da média, construímos, na tabela, a coluna do ponto médio, que corresponderá ao nosso x i. Aplicando a fórmula: µ = x = = = 335 reais Moda: observando as freqüências absolutas, percebemos que a segunda classe é aquela que possui a maior freqüência, ou seja, a classe modal é Calculamos as diferenças: D 1 = f Mo f ant = 5 30 = D = f Mo f post = 5 8 = 4 Aplicando a fórmula de Czuber: D1 Mo LMo.h D1 D = + = = = ,7 = 95,7 reais. 46 Mediana: inicialmente, calculamos a posição da mediana para, em seguida, determinar a classe mediana. 10 = 60 ª posição Esta posição está na segunda classe, ou seja, na classe (classe mediana). Logo: L Md = 00 F ant = 30 h= = 00 f Md = 5 Aplicando a fórmula: n 10 Fant 30 Md = L Md +. h = = ,4 = 315,4 reais fmd 5 86
11 Resumindo: o aluguel médio das casas pesquisadas é R$ 335,00, sendo que o valor que mais ocorre é R$ 95,70 e o valor mediano encontrado foi R$ 315,40, ou seja, metade dos alugueis cobrados tem valor superior ao mediano e a outra metade possui valor inferior a R$ 315, A média é representativa? A média é uma medida que representa bem o conjunto de dados? Consideremos os conjuntos de valores, por exemplo, de 5 provas feitas por um aluno A e um outro B: A: 5, 5, 5, 5, 5 B: 0, 0, 5, 10, 10 Note que a média das provas de ambos alunos é a mesma, ou seja, µa = µb = 5. Porém, é nítido que os alunos não tiveram o mesmo desempenho ao longo das provas. Enquanto A se manteve constante, B foi muito mal no começo mas muito bem no final. Assim, só a média não é capaz de traduzir o conjunto de dados. Dessa forma, com a utilização da moda e da mediana, passamos a ter uma visão melhor de como se comportam os dados em nosso conjunto (no caso que não temos acesso ao conjunto de dados brutos). Assim, vejamos uma tabela comparativa: Grupo A B Média 5 5 Moda 5 0 e 10 Mediana 5 5 Observando esses resultados, percebemos que o conjunto A possui uma variabilidade de notas maior que o do conjunto B, dando indícios que as notas em A foram mais homogêneas que as notas em B. Mesmo assim, para termos certeza disso, devemos calcular outras medidas estatísticas, chamadas de medidas de dispersão que estudaremos mais adiante. 6. Exercícios 1. Calcule a moda, a mediana e a média das seguintes séries: i. 46, 44, 49, 45, 44, 48, 50, 4, 47 ii. 1, 1, 3,, 3, 5, 4, 5, 3, 3,,, 1, 1. Calcule a mediana e a média do conjunto de dados apresentados pela seguinte distribuição de freqüências: x i f i
12 3. Determine a média, a moda e a mediana em cada caso: a) Em uma casa de repouso, as pessoas internadas têm as seguintes idades: idade Nº de pessoas total 40 b) Considere a tabela, que representa a distribuição das áreas cultivadas, em hectares, de uma determinada região. Dados: x i : área em hectares, f i : número de áreas cultivadas. x i f i [0; [ 30 [; 4[ 35 [4; 6[ 60 [6; 8[ 35 [8; 10[ 15 [10; 1[ 8 [1; 14[ 4. A tabela abaixo indica os Custos, de uma determinada empresa, com encargos salariais: Custos f i [450; 550[ 8 [550; 650[ 10 [650; 750[ 11 [750; 850[ 16 [850; 950[ 13 [950; 1.050[ 5 [1.050; 1.150] 1 Determine: a) a classe modal; b) a moda da distribuição; c) a classe mediana; d) a mediana da distribuição; e) construa o histograma e o polígono de freqüências da distribuição. f) a média salarial. 88
13 5. A tabela seguinte fornece o número de erros gráficos por página de certo livro. número de erros número de páginas Calcular: a) o número médio de erros por página b) o número mediano c) qual é a moda da distribuição? 6. Numa pesquisa entre 50 famílias de certa cidade constataram-se os seguintes dados: nº de filhos nº de famílias Para a distribuição do número de filhos, calcular a média, a mediana e a moda. 7. Se os dados do problema anterior estivessem computados como segue: nº de filhos mais do que 4 nº de famílias qual das três medidas nós teríamos dificuldades para calcular? 8. Os dados seguintes referem-se ao tempo de vida (durabilidade) de 150 lâmpadas elétricas de certa fabricação, em centenas de horas. Duração nº de lâmpadas a) Qual é a moda? b) Calcular a vida média das lâmpadas. c) Qual é a mediana? 9. A média dos salários dos funcionários de uma determinada empresa é 5 salários mínimos (5 SM), enquanto que a mediana é 4 SM. Sorteando-se ao acaso um dos funcionários, o que é mais provável: que ele ganhe mais ou que ele ganhe menos do que a média dos salários? 10. Uma prova foi aplicada a três classes, de 40, 48 e 46 alunos, e as médias de cada classe foram 6,0, 6,6 e 5,8, respectivamente. Qual é a média para os 134 alunos que fizeram a prova? 11. Quando a medida de posição deve ser o valor mais típico da distribuição utilizamos: a) a média b) a mediana c) a moda d) a moda ou a média 89
14 1. Quando desejamos o ponto médio exato de uma distribuição de freqüência, basta calcular: a) a média b) a moda c) a mediana d) as três 13. Considere uma série estatística com 351 elementos. A posição da mediana é representada pelo: a) 1175º elemento b) 1176º elemento c) ponto médio entre o 1175º e o 1176º elemento d) 1174º elemento 14. Um professor, após verificar que toda a classe obteve nota baixa, eliminou as questões que não foram respondidas pelos alunos. Com isso, as notas de todos os alunos foram aumentadas de 3 pontos. Então: a) a média aritmética ficou alterada, assim como a mediana. b) apenas a média aritmética ficou alterada. c) apenas a mediana ficou alterada. d) não houve alteração nem na média nem na mediana. e) nada podemos afirmar sem conhecer o número total de alunos. 15. Calcule o número médio, mediano e modal de acidentes por dia em uma determinada esquina. Números de acidentes por dia (x i ) Números de dias (f i ) Total O gráfico abaixo mostra a distribuição de freqüências das notas obtidas pelos alunos, da ª série do ensino médio, numa prova de Geografia. Determine: i. a mediana dessa distribuição; ii. a moda dessa distribuição iii. a média das notas. 90
15 17. As notas de um candidato em seis provas de um concurso foram: 8,4 ; 9,1 ; 7, ; 6,8 ; 8,7 ; 7, Determine: a) a nota média; b) a nota mediana; c) a nota modal. 18. Os salários-hora de cinco funcionários de uma companhia são: R$ 75 ; R$ 90 ; R$ 83 ; R$ 14 ; R$ 88 a) qual o salário médio? b) qual o salário mediano? 19. Considere as notas obtidas pelos alunos de uma classe em uma determinada prova: Calcule: a) a nota média; b) a nota mediana; c) a nota modal. Notas Nº de alunos A partir de uma amostra de 70 pessoas obteve-se a tabela a seguir com as estaturas dos entrevistados: Determine, para essa distribuição: a) a média; b) a mediana; c) a moda; Estaturas frequência (cm)
16 1. Os pesos de 40 pessoas que estavam fazendo um tratamento de emagrecimento numa determinada clínica de São Paulo foram agrupados na tabela a seguir: Determine, para essa distribuição: a) a média; b) a mediana; c) a moda; Pesos f i (kg) Considerando a distribuição abaixo, determine: a) a média; b) a mediana; c) a moda. x i f i O histograma abaixo apresenta a distribuição de freqüência das faixas salariais numa pequena empresa. Com os dados disponíveis, calcule a média, a moda e a mediana desses salários. 9
17 4. Obtenha a mediana nos casos a seguir: a) 1, 15, 10, 13, 11, 19 b) 7, 7, 5, 4, 3, 5, 5,, 3 c) idade Frequencia total 6 d) idade Frequencia total 33 e) Salários (R$) Frequencia total 45 Respostas 1) a) x =46,1 Mo = 44 Md = 46 b) x =,6 Mo = 3 Md =,5 ) x =13,9 Mo = 16 Md = 16 3)a) x =75,3 Mo = 75 Md = 74,5 b) x =5,0 Mo=5 Md = 4,9 4) a) [750; 850[ b) 81,5 c) [750; 850[ d) 768,8 93
18 e) Histograma frequência custos f) 754,7 5) a) 0,45 b) 0 c) 0 6) x =,18 Mo = 3 Md = 7) média 8) a) 1,7 b) 14,53 c) 13,85 9) menos 10) 6,15 11) c 1) c 13) b 14) a 15) média = 0,45 ; moda = 0; mediana = 0 16) a) 6,6 b) 7 c) 7 17) a) 7,9 b) 7,8 c) 7, 18) a) R$ 95,6 b) R$ 88 19) a) 5,9 b) 6 c) 6 0) a) 17,4 b) 174 c) 176,6 1) a) 159,4 b) 157,8 c) 150,5 ) a) 5,4 b) 5 c) 5 3) x =708,33 Mo = 91,67 Md = 48,57 4) a) R$ 1,5 b) R$ 5 c) R$ 1 d) R$ 14 e) R$ 19,17 94
19 6. Separatrizes 1. Conceitos Um exemplo de separatrizes que vimos anteriormente é a mediana. Ou seja, separatrizes são números reais que dividem a seqüência ordenada de dados (rol) em partes que contêm determinada quantidade de elementos da série. Desta forma, a mediana que divide a seqüência ordenada em dois grupos, cada um deles contendo 50% dos valores da seqüência. Além da mediana, as outras medidas separatrizes que veremos são: quartis, decis e percentis.. Quartis Os quartis dividem uma distribuição de freqüência em quatro partes iguais. mín Q1 5% Q 50% Q3 75% máx Para determinarmos a classe que contém o quartil, devemos calcular a posição do elemento correspondente ao quartil desejado. Essa posição é dada por: n 4 o para o Q 1 e 3n 4 o para Q 3. A fórmula para o cálculo dos i-ésimo quartil (i=1,,3) é: Q i = L Q + i.n F 4 f Q ant.h onde: L Q = limite inferior da classe que contém o quartil i = número do quartil a ser calculado (1, ou 3) n = tamanho da amostra F ant = frequência acumulada anterior à classe que contém o quartil f Q = frequência simples (ou absoluta) da classe que contém o quartil h = amplitude da classe que contém o quartil 95
20 3. Decis Os decis dividem uma distribuição de freqüência em dez partes iguais. D1(10%), D(0%), D(30%),...,D9(90%) Para determinarmos a classe que contém o i-ésimo decil, devemos calcular a posição do elemento correspondente ao decil desejado. Essa posição é dada por: A fórmula para o cálculo dos i-ésimo decil (i=1,,...,9) é: i.n 10 o D i = L D + i.n F 10 f D ant.h onde: L D = limite inferior da classe que contém o decil i = número do decil a ser calculado (1,,...,9) n = tamanho da amostra F ant = frequência acumulada anterior à classe que contém o decil f D = frequência simples (ou absoluta) da classe que contém o decil h = amplitude da classe que contém o decil 4. Percentis Os percentis dividem uma distribuição de freqüência em cem partes iguais. P1(1%), P(%), P3(3%),..., P99(99%) Para determinarmos a classe que contém o i-ésimo percentil, devemos calcular a posição do elemento correspondente ao percentil desejado. Essa posição é dada por: i.n 100 A fórmula para o cálculo dos i-ésimo percentil (i=1,,...,99) é: o onde: P i = L P + i.n F 100 f P ant.h 96
21 L P = limite inferior da classe que contém o percentil i = número do percentil a ser calculado (1,,..., 99) n = tamanho da amostra F ant = frequência acumulada anterior à classe que contém o percentil f P = frequência simples (ou absoluta) da classe que contém o percentil h = amplitude da classe que contém o percentil Importante: se observarmos que os quartis, decis e percentis são múltiplos dos percentis, então basta estabelecer a fórmula de cálculo dos percentis. Todas as outras medidas podem ser identificadas como percentis. A fórmula utilizada é a mesma usada para o cálculo da mediana. Desta forma: Q 1 = P 5 Q = P 50 = Md Q 3 = P 75 D 1 = P 10 D = P 0 D 3 = P 30 D 4 = P 40 D 5 = P 50 = Md D 6 = P 60 D 7 = P 70 D 8 = P 80 D 9 = P Exemplo Considere uma tabela de custos: Custos R$ Freqüência f i posições ª a 8ª ª a 19ª ª a 9ª ª a 45ª ª a 58ª ª a 63ª ª Total F i Calcule: a) Q 1 64 A posição ocupada pelo primeiro quartil é = 16 ª posição, que corresponde a classe Aplicando a fórmula: Q = = reais. 97
22 b) Q A posição ocupada pelo terceiro quartil é = 48 ª posição, que corresponde a classe Aplicando a fórmula: Q = 873,08 13 = reais. c) D A posição ocupada pelo nono decil é = 57, 6 ~ 58ª posição, que corresponde a 10 classe Aplicando a fórmula: D = 946,9 13 = reais. d) P A posição ocupada pelo 38º percentil é = 4, 3 ~ 4ª posição, que corresponde a 100 classe Aplicando a fórmula: P = 707,45 11 = reais. e) P 5 Lembre-se que o 5º percentil corresponde ao primeiro quartil, que calculamos anteriormente. Assim: P 5 = Q 1 = 630 reais. 6. Exercícios 1) Em uma série ordenada, qual é o percentual de elementos que ficam à esquerda de cada uma das medidas separatrizes: a) D 1 b) Q 1 98
23 c) D d) Q 3 e) Q f) D 8 g) P 70 ) Em uma série ordenada, qual é o percentual de elementos que ficam à direita de cada uma das medidas separatrizes: a) D 4 b) P 80 c) Q 3 d) P e) P 0 f) D 5 g) Q 1 3) Qual é o percentual de elementos de uma série ordenada que se situam entre: a) Q 1 e Q 3 b) P 10 e P 90 c) D e D 6 d) Q 1 e D 3 e) D 3 e P 45 f) Q e D 8 g) D 3 e Q 3 4) Se uma série ordenada possui 180 elementos, dê o número aproximado de elementos que se situam: a) acima do P 0 b) acima do Q 3 c) entre o P 10 e o P 80 d) entre o Q 3 e P 80 e) abaixo do P 90 f) entre o Q 1 e Q 3 g) entre o P 90 e P 9 5) A distribuição de freqüência abaixo representa a idade de 50 alunos de uma classe de primeiro ano de uma Faculdade: Calcule: a) Q 1 b) D 1 c) Q 3 d) P 95 Idade (anos) Nº de alunos Total 50 99
24 6) A distribuição de freqüência abaixo representa o consumo por nota de 54 notas fiscais emitidas durante um dia em uma loja de departamentos. Calcule: Classe Valor da nota Nº de notas R$ Total 54 a) Q 1 b) D 3 c) Q 3 d) D 7 e) P 98 f) O gerente desta loja de departamentos decidiu premiar a nível promocional com um brinde, 10% dos fregueses que mais consumirem. A partir de qual valor de consumo da nota fiscal os clientes seriam premiados? g) O mesmo gerente, decide enviar uma mala direta aos % consumidores que menos gastaram nessa loja. Devem receber a mala-direta os clientes que consumiram até qual valor? Respostas 1) a) 10% b) 5% c) 0% d) 75% e) 50% f) 80% g) 70% ) a) 60% b) 0% c) 5% d) 98% e) 80% f) 50% g) 75% 3) a) 50% b) 80% c) 40% d) 5% e) 15% f) 30% g) 45% 4) a) 144 b) 45 c) 16 d) 9 e) 16 f) 90 g) 3,6 ~ 4 5) a) 18 b) 18 c) 19 d) 1 6) a) 56,5 b) 61,07 c) 110,4 d) 99,64 e) 46,00 f) D 90 = 144,17 g) P = 53,36 100
25 7. Gráfico Box Plot 1. Amplitude Interquartílica A amplitude interquartílica também pode ser chamada de intervalo interquartílico ou amplitude interquartil. É definida como sendo a diferença entre o terceiro e o primeiro quartil, ou seja: IQ = Q 3 Q 1. Interpretação: o IQ representa a variação correspondente aos 50% dos valores centrais da distribuição. O IQ é uma medida de variação que fornece uma idéia de quanto 50% dos dados varia. Também pode ser usado para identificar valores discrepantes. Qualquer valor de dado que seja maior que 1,5 IQs à esquerda de Q 1 ou à direita de Q 3 é um valor discrepante.. Box plot É um tipo de gráfico que também é conhecido como caixa e bigodes. Uma aplicação importante dos quartis é representar conjuntos de dados usando o gráfico box plot ou caixa-e-bigodes. Um gráfico box plot é uma ferramenta de análise de dados exploratória que enfatiza as características mais importantes de um conjunto de dados. Para representar graficamente um gráfico caixa-e-bigodes, você deve saber os valores a seguir. 1. A entrada mínima.. O primeiro quartil Q A mediana Q ou Md. 4. O terceiro quartil Q A entrada máxima. Esses cinco números são chamados de Regra dos cinco itens de um conjunto de dados. Desenhando um gráfico box plot: 1. Encontre a regra dos cinco itens do conjunto de dados.. Construa uma escala horizontal que transpasse a amplitude dos dados. 3. Represente os cinco números sobre a escala horizontal. 4. Desenhe uma caixa acima da escala horizontal a partir de Q 1 para Q 3 e desenhe uma linha vertical na caixa em Q (= mediana). 5. Desenhe os bigodes a partir da caixa para as entradas mínimas e máximas. O gráfico fica com o seguinte aspecto: 101
26 3. Detectando assimetrias através do box-plot A figura, a seguir, demonstra a relação entre o box-plot e o polígono para quatro diferentes tipos de distribuição. (Observação: A área abaixo de cada polígono está dividida em quartis, correspondendo ao resumo de cinco números para o box-plot.) Os painéis A e D da figura são simétricos. Nessas distribuições, a média aritmética e a mediana são iguais. Além disso, o comprimento do bigode esquerdo é igual ao comprimento do bigode direito, e a linha mediana divide a caixa pela metade. O Painel B é assimétrico à esquerda. Os poucos valores baixos distorcem a média aritmética em direção à cauda esquerda. Para essa distribuição assimétrica à esquerda, a assimetria indica que existe uma forte concentração de valores no ponto mais alto da escala (ou seja, o lado direito); 75% de todos os valores se encontram entre a extremidade direita da caixa (Q 1 ) e o final do bigode direito. Por conseguinte, o longo bigode à esquerda contém somente os 5% valores mais baixos, demonstrando a distorção da simetria nesse conjunto de dados. O Painel C é assimétrico à direita. A concentração de valores está na extremidade inferior da escala (ou seja, no lado esquerdo do box-plot). Nesse caso, 75% de todos os valores de dados são encontrados entre o início do bigode esquerdo (X menor ) e a extremidade direita da caixa, Q 3, enquanto os 5% de observações restantes estão dispersos ao longo do extenso bigode à direita, na extremidade superior da escala. 10
27 4. Exemplos Exemplo 1: as notas dos testes de 15 funcionários matriculados em um curso de treinamento de CPR são listadas a seguir: a) Encontre o primeiro, o segundo e o terceiro quartis das notas dos testes. b) Calcule o intervalo interquartílico e verifique se há valores discrepantes. c) Construa o box-plot e interprete. Resolução a) Primeiro, ordene o conjunto de dados e encontre a mediana Md=Q. Depois de encontrar Q, divida o conjunto de dados em duas metades. O primeiro e o terceiro quartil são as medianas das metades inferior e superior do conjunto de dados. 103
28 b) IQ = = 8. Então, 1,5 IQS à direita de Q 3 é Q 3 + 1,5. 8 = = 30. Como 37 > 30, então 37 é um valor discrepante. c) O box plot é: Você pode tirar diversas conclusões com o gráfico. Uma delas é que aproximadamente metade das notas está entre 10 e 18. Olhando para o comprimento do bigode direito, podemos concluir também que a nota 37 é um possível valor discrepante (o que foi, de fato, constatado no item anterior). Exemplo : suponha que um produtor de laranjas costuma guardar as frutas em caixas e está interessado em estudar o número de laranjas por caixa. Após um dia de colheita, 0 caixas foram contadas. Os resultados foram: 48, 35, 37, 5, 43, 9, 61, 33, 44, 55, 69, 43,, 35, 38, 57, 53, 67, 6 e 48. Construa um box plot para esse conjunto de dados. Para os dados apresentados, temos que Md = 46, Q 1 = 36,5 e Q 3 = 55,5. Também temos que o número mínimo de laranjas em uma caixa é e o número máximo, 69. O boxplot correspondente é apresentado na figura seguinte: 104
29 Exemplo 3: a representação gráfica através do box-plot é bastante rica no sentido de informar, entre outras coisas, a variabilidade e simetria dos dados. Note que na figura anterior, os dados apresentam simetria acentuada (a distância da mediana para os quartis é a mesma), o mesmo podendo ser observado a respeito da distância dos pontos de mínimo e máximo em relação à mediana. Em contraste, temos na figura seguinte o box-plot para a variável peso, que apresenta uma pequena assimetria: Gráficos tipo box-plot também são úteis para detectar, descritivamente, diferenças nos comportamentos de grupos de variáveis. Por exemplo, podemos considerar gráficos da variável peso para cada sexo. O resultado é apresentado na figura seguinte, em que podemos notar que os homens apresentam peso mediano superior ao das mulheres, além de uma maior variabilidade. 105
30 5. Exercícios 1) A partir dos box plots a seguir, identifique: o valor mínimo, o valor máximo, o primeiro quartil, a mediana, o terceiro quartil e o intervalo interquartílico. a) b) c) ) Verifique se a distribuição apresentada é simétrica, assimétrica à esquerda, assimétrica à direita ou nenhuma das alternativas. a) 106
31 b) c) d) 3) Um grupo de estudantes do Ensino Médio foi submetido a um teste de matemática resultando em: Obtenha um box plot para esses dados. nota frequência ) Um estudo pretende verificar se o problema da desnutrição em adultos medida pelo peso, em quilos, em uma região agrícola (denotada por Região A), é maior do que em uma região industria (denotada por Região B). Para tanto, uma amostra foi tomada em cada região, fornecendo as tabelas de freqüências a seguir: 107
32 Região A Peso Freqüência < total 8 Região B Peso Freqüência < total 319 Construa os box plots para cada região, em um mesmo par de eixos, e discuta se há evidências de que o grau de desnutrição seja diferente nas duas regiões. Respostas 1) a) Mín=10 Máx=0 Q 1 =13 Md = 15 Q 3 =17 IQ=4 b) Mín=900 Máx=100 Q 1 =150 Md = 1500 Q 3 =1950 IQ=700 c) Mín= 1,9 Máx=,1 Q 1 = 0,5 Md = 0,1 Q 3 =0,7 IQ=1, ) a) nenhum b) assimétrica à direita c) assimétrica à esquerda d) simétrica 3) Mín=0 Máx=10 Q 1 =,48 Md = 4,00 Q 3 =5,56 4) Região A: Mín=0 Máx=90 Q 1 =11,63 Md = 43,40 Q 3 =56,79 Região B: Mín=400 Máx=110 Q 1 =73,7 Md = 80,57 Q 3 =87,76 A Região B tem medidas superiores às da Região A. 108
33 8. Medidas de Dispersão 1. Introdução Conforme dissemos anteriormente, as medidas de tendência central não são suficientes para caracterizar totalmente uma seqüência numérica.se observarmos as seqüências: X: 10, 1, 18, 0, 35, 3, 7, 15, 11, 10. Y: 1, 13, 13, 14, 1, 14, 1, 14, 13, 13. Z: 13, 13, 13, 13, 13, 13, 13, 13, 13, 13. concluiremos que todas possuem a mesma média 13. No entanto, são seqüências completamente distintas do ponto de vista da variabilidade de dados. Na seqüência Z não há variabilidade de dados, visto que todos os valores coincidem com a média. Na seqüência Y, a média 13 representa bem a série, mas existem elementos da série levemente diferenciados da média 13, ou seja, há baixa variabilidade. Na seqüência X existem muitos elementos bastante diferenciados da média 13, indicando uma alta variabilidade ao redor da média. Para avaliar o grau de variabilidade dos dados em torno da média, medidas de dispersão: desvio médio, variância e desvio padrão. usaremos as. Desvio Médio O conceito estatístico de desvio corresponde ao conceito matemático de distância. A dispersão dos dados em relação à média de uma seqüência pode ser avaliada através dos desvios de cada elemento da seqüência em relação à média da seqüência. O desvio médio é definido como sendo uma média aritmética dos desvios de cada elemento da série para a média da série, ou seja, fi. x DM = n i x Exemplo 1: Considere as notas, 8, 5, 6 obtidas por 4 alunos, numa avaliação de Biologia. Determine o desvio médio. Inicialmente, calcularemos a média: x = = 5,5 4 Agora, calculamos o desvio médio, lembrando que f i = 1, visto que cada um dos quatro valores apareceu uma única vez. 109
34 fi. x DM = n i x = 5, , , ,5 3,5 +,75 +,05 + 0,75 = = = 4 4 3,5 +,75 + 0,5 + 0,75 7 = = = 1, Interpretação: Em média, cada elemento da seqüência está afastado do valor 5,5 por 1,75 unidades. 3. Variância (s ou σ ) e Desvio padrão (s ou σ) Pelo exemplo anterior, observamos que a dificuldade em se operar o DM se deve à presença do módulo, para que as diferenças x i x possam se interpretadas como distâncias. Outra forma de se conseguir que as diferenças x i x se tornem sempre positivas ou nulas é considerar o quadrado destas diferenças, isto é, (x i x ). Se substituirmos, na fórmula do DM a expressão x i x por (x i x ), obteremos nova medida de dispersão chamada variância. A variância populacional é representada por σ (sigma ao quadrado), enquanto que a variância amostral é representada por s. O símbolo σ é a letra grega minúscula sigma. A fórmula geral da variância populacional e da variância amostral são, respectivamente: ( x ) fi. i µ σ = e n s ( x x) f. i i = n 1 O desvio padrão é a raiz quadrada da variância, ou seja σ = σ ou s = s. De modo mais simples, podemos generalizar: DP = Var. Quando estamos trabalhando com uma amostra, sem conhecermos o verdadeiro valor da média ou do desvio padrão, admitimos que a média da amostra ( x ) esteja próxima do valor da média populacional, e que a variância da amostra (variância amostral) esteja próxima da variância populacional. A raiz quadrada da variância amostral é chamada desvio padrão amostral. 110
35 4. Desvio-padrão Variância É natural a pergunta: qual das duas medidas é melhor? Na verdade, não há uma melhor que a outra, visto que são idênticas (basta extrair a raiz de uma ou elevar a outra ao quadrado). Porém, o desvio-padrão é muito melhor no sentido de facilitar a interpretação. Por exemplo, se calcularmos a variância de uma variável X que representa a idade em um conjunto de dados obtendo Var(X) = 5 anos, teríamos dificuldades de interpretar o resultado. Afinal, qual o significado de anos? Porém, o desvio-padrão nos daria DP(X) = 5 anos, que possui uma interpretação concreta. Isso ocorre porque no cálculo da variância, quando elevamos ao quadrado a diferença (x i x ) ou (x i µ ), a unidade de medida da série fica também elevada ao quadrado. Portanto, a variância é dada sempre no quadrado da unidade de medida da série. Se os dados são expressos em metros, a variância é expressa em metros quadrados. Em algumas situações, a unidade de medida da variância nem faz sentido. É o caso, por exemplo, em que os dados são expressos em litros. A variância será expressa em litros quadrados. Portanto, o valor da variância não pode ser comparado diretamente com os dados da série, ou seja: variância não tem interpretação. Exatamente para suprir esta deficiência da variância é que se utiliza o desvio padrão. Como o desvio padrão é a raiz quadrada da variância, o desvio padrão terá sempre a mesma unidade de medida da série e, portanto admite interpretação. 5. Exemplos Exemplo : Considere as notas obtidas por 4 alunos, numa avaliação de Biologia, distribuídas na tabela abaixo. Calcule o desvio padrão considerando-se uma população Cálculo da média: µ = = 5, 5. 4 Cálculo da variância populacional: ( 5,5) + (8 5,5) + (5 5,5) σ = 4 + (6 5,5) = 18,75 4 = 4,6875. O desvio padrão corresponde à raiz quadrada da variância: σ = 4,6875 =,17. Assim, os dados estão, em média, afastados de 5,5 por,17 unidades. 111
36 Exemplo 3: Calcule o desvio padrão da série abaixo, considerando-se uma população Total Cálculo da média: µ = = 3, x i f i Cálculo da variância populacional: 3.( 3,65) + 5.(3 3,65) + 8.(4 3,65) σ = (5 3,65) = 18,55 0 = 0,975. O desvio padrão corresponde à raiz quadrada da variância: σ = 0,975 = 0,96. Assim, os dados variam, em média, 0,96 unidades ao redor da média 3,65. Exemplo 4: Calcule o desvio padrão da série abaixo, representativa de uma amostra. Classe Int. classe f i x i Total Lembre-se que quando estamos trabalhando com classes, x i corresponde ao PONTO MÉDIO de cada classe. Assim, se a classe é a + b a b, teremos x i = Cálculo da média: µ = = 8, Cálculo da variância amostral: 1.( 8,4) + 3.(6 8,4) + 5.(10 8,4) s = (14 8,4) = 9,8 9 = 10,3111. O desvio padrão amostral corresponde à raiz quadrada da variância amostral: s = 10,3111 = 3,. Assim, os dados variam, em média, 3, unidades ao redor da média 8,4. 11
37 4. Coeficiente de variação (CV) Vamos imaginar duas pessoas A e B. O indivíduo A possui R$ 10 na sua carteira e, desse valor, ele perde R$. O indivíduo B possui R$ 100 e perde R$ 5. Podemos fazer duas perguntas: 1) Qual das pessoas perdeu mais dinheiro? ) Qual das pessoas perdeu, proporcionalmente, mais dinheiro? Para a primeira questão, fica evidente que foi o indivíduo B, visto que R$ 5 é maior que R$. Porém, quando analisamos relativamente, a resposta da questão passa a ser o indivíduo A, pois, percentualmente, A perdeu /10 = 0, ou 0% do que possuía na carteira enquanto que B perdeu 5/100 = 0,05 ou 5% do que possuía. Esse conceito de relatividade é exatamente o que propõe o coeficiente de variação. Transformando o problema anterior em termos estatísticos, se uma série X apresenta x =10 e σ x = e uma série Y apresenta y = 100 e σ y = 5, do ponto de vista da dispersão absoluta, a série Y apresenta maior dispersão que a série X. No entanto, se levarmos em consideração as médias das séries, o desvio padrão de Y que é 5 em relação a 100 é um valor menos significativo que o desvio padrão de X que é em relação a 10. O coeficiente de variação é indicado por σ = µ CV ou s CV =. x Calculando, então, o coeficiente de variação das séries citadas tem: CV x = = 0, ou 0% 10 5 CV y = = 0,05 ou 5% 100 Comparando os valores destes dois coeficientes concluímos que a série X admite maior dispersão relativa. Como a medida de dispersão relativa leva em consideração a medida de dispersão absoluta e a média da série, é uma medida mais completa que a medida de dispersão absoluta. 5. O uso do desvio padrão O desvio padrão é a mais importante das medidas de dispersão. Quando temos um conjunto de de dados cuja distribuição é Normal, o formato de seu histograma se assemelha a de um sino, é uma curva simétrica e, ainda, a média a moda e a mediana possuem exatamente o mesmo valor (ou são, no caso de uma amostra, muito próximos), conforme vemos na figura abaixo. 113
38 Sob a suposição de Normalidade, podemos afirmar que o intervalo [µ - σ,µ + σ ] contém aproximadamente 68% dos valores da série. 68% - S x + S Zona de normalidade (S) O intervalo [µ - σ, µ + σ] contém aproximadamente 95% dos valores da série. O intervalo [µ - 3 σ, µ + 3 σ] contém aproximadamente 99% dos valores da série. Esses percentuais 68%, 95% e 99% citados na interpretação serão comprovadas, com maior precisão, no estudo da distribuição normal de probabilidades. Quando a distribuição não é perfeitamente simétrica estes percentuais apresentam pequenas variações para mais ou para menos, segundo o caso. Se um conjunto tiver média µ = 100 e desvio padrão σ = 5, podemos interpretar estes valores da seguinte forma: a) Os valores da série estão concentrados em torno de 100. b) O intervalo [95, 105] contém aproximadamente, 68% dos valores da série. c) O intervalo [90, 110] contém aproximadamente, 95% dos valores da série. d) O intervalo [85, 115] contém aproximadamente, 99% dos valores da série. É importante perceber que, ao aumentar o tamanho do intervalo, aumenta-se o percentual de elementos contido no intervalo. Exemplo 5: foi observado que as contas de luz para uma área municipal, no mês de junho, são normalmente distribuídas. Se a média das contas for $ 4,00 e o desvio padrão populacional foi $ 1,00, entre que intervalo de valores estão 68% das contas? E 95% das contas? µ σ = 4,00 1,00 = 30,00 µ + σ = 4,00 + 1,00 = 54,00 68% das contas estão entre os valores de $ 30,00 e $ 54,00 µ σ = 4,00. 1,00 = 4,00 4,00 = 18,00 µ + σ = 4, ,00 = 4,00 + 4,00 = 66,00 95% das contas estão entre os valores de $ 18,00 e $ 66,00 114
39 6. Exercícios 1) Calcule o desvio padrão da distribuição populacional: Classes f i ) Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio padrão, 0,80. Em Estatística, entretanto, o grau médio final foi 7,3 e o desvio padrão, 0,76. Em que disciplina foi maior a dispersão? 3) Medidas as estaturas de 1017 indivíduos, obtivemos x = 16, cm e s = 8,01 cm. O peso médio desses mesmos indivíduos é 5 kg, com um desvio padrão de,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso? 4) Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 5,97 cm. Outro grupo de 15 moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo? 5) Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo? 6) Uma distribuição apresenta as seguintes estatísticas: σ = 1,5 e CV =,9%. Determine a média da distribuição. 7) Numa fábrica de rolamentos, retirou-se da produção de um determinado dia uma amostra de 10 rolamentos, dos quais se mediu o diâmetro externo, em mm, obtendo-se: 0, 1,4 0,8 19,6,1 1,7 0,4,0 0,5 19,3 Calcular a média e o desvio padrão desta amostra. 8) Calcular a média e o desvio padrão da seguinte distribuição amostral de uma variável X. faixas de observações freqüência Total
40 9) Em 10 experimentos, onde cada um consiste em lançar 3 moedas e contar o número de caras, obtivemos os seguintes resultados: Nº de caras Nº de experimentos Calcular a média, a variância e o desvio padrão do número de caras observado nos experimentos. 10) Uma amostra de 900 lâmpadas foi testada para se determinar a durabilidade. Os dados foram: Durabilidade em horas freqüência Total 900 Na amostra testada a) qual é a porcentagem de lâmpadas que duraram menos de 1800 horas? b) qual é a durabilidade média? c) qual é o desvio padrão? 11) A tabela representa as estaturas de 35 crianças nascidas numa mesma maternidade numa certa semana. estatura (cm) n o de crianças Determinar a média e o desvio-padrão das estaturas destas crianças ao nascerem. 1) Um restaurante cobra o almoço de cada cliente através do peso (por quilo) da quantidade de alimento consumida. Foi observado, durante um mês, que as quantidades de alimento consumidas são normalmente distribuídas. Se a média consumida for 550 g e o desvio padrão 00 g, calcular: a) a amplitude dos 95% centrais. b) a amplitude dos 99% centrais. 116
41 13) Os pratos produzidos por uma indústria têm diâmetro médio de 19 cm e desvio padrão de 0, cm. Dois pratos A e B cujos diâmetros medem respectivamente 19,8 cm e 18,3cm serão testados pelo Controle Estatístico de Qualidade, que admite uma tolerância de três desvios acima e três abaixo da média. Assinale a alternativa correta: a) O prato A será aprovado b) Ambos os pratos serão reprovados c) o prato A será reprovado e o prato B aprovado d) o prato B será reprovado. 14) O desvio padrão de um conjunto de dados é 16. A variância será: a)16 b) 64 c) 56 d) 4 15) A variância de um conjunto de dados é 16. O desvio padrão será: a) 4 b) 56 c) 36 d) 16) Calcule o desvio padrão das seguintes populações: a) X:, 3, 7, 9, 11, 13. b) Y: 5, 1, 4, 0, 13, ) Calcule o desvio padrão das seguintes amostras: a) Z: 15, 16, 17, 0, 1. b) T: 6, 5, 10, 1, ) Uma fábrica corta bambus para a confecção de cercas. Cada corte deve ter um comprimento médio de 180cm e apresenta um desvio-padrão de 1,5cm. Após cortados, os bambus passam por um controle de qualidade que rejeita cortes que estejam com desvios-padrão acima ou abaixo da média especificada. Seis bambus, A, B, C D, E e F foram medidos pelo controle de qualidade e os valores obtidos são apresentados na tabela a seguir. Quais deles o controle deve aprovar e quais deve rejeitar? bambu comprimento A 178,5cm B 183,4cm C 176,cm D 175,8cm E 18,7cm F 180,0 cm 117
42 19) Considere a tabela seguinte que mostra o número de unidades vendidas por dia de certo produto numa loja: Nº de unid. vendidas por dia Nº de dias Total Determine: a) o desvio padrão amostral; b) o coeficiente de variação; c) o desvio médio. 0) Seja a amostra: Determine: a) a média; b) a variância; c) o desvio-padrão; d) o coeficiente de variação; e) o desvio médio. idade Freqüência absoluta Total 0 1) Dados: CV=7,3% e x =5, calcule o desvio padrão amostral. ) Dados CV=1% e s=36, calcule a média amostral. 3) Uma máquina empacota café com média 500g e desvio padrão 1g. O controle de qualidade da empresa rejeita pacotes cujo peso ultrapasse desvios padrão da média. Qual dos pacotes a seguir serão rejeitados pelo controle de qualidade? A = 515 g B = 490 g C = 470 g D = 55 g E = 477 g F = 500 g G = 53 g 4) Os tempos despendidos por 1 alunos, elementos de uma população, em segundos para percorrer certo trajeto foram 16, 17, 16, 0, 18, 16, 17, 19, 1,, 16 e 3. Sem agrupar os dados, calcule: a) a moda; b) a mediana; c) a média; 118
43 d) a variância; e) o desvio padrão; f) o coeficiente de variação. Respostas 1) σ =4,45 ) CV(Mat)=0,103 ; CV (Estat)=0,104. Logo a maior dispersão foi na Estatística. 3) CV (altura)=0,0493 ; CV(peso)=0,044. Maior variabilidade na altura. 4) CV 85 = 0,03717 CV 15 = 0,0371 grupo de 15 pessoas é mais homogêneo 5) 5,4054 6) 51,7 7) x =0,8 ; s = 0,9556 ; s=0,9775 8) x =4 ; s =19,648 ; s=11,39 9) x =1,475 ; s =0,7660 ; s=0,875 10) a) 50% b) 1733,3 h c) 98,3 h 11) x =48,5 ; s=1,40 1) a) [150 ; 950] b) [0 ; 1150] 13) B 14) C 15) A 16) a) σ =3,99 b) σ =5,81 17) a) s=,59 b) s=5,59 18) Aprovados: A, E, F ; Reprovados: B, C, D 19) a) s=1,5 b) 0,88 ou 88% c) 1,0704 0) a) 1,5 b) 55,563 c) 7,45 d) 34,7% e) 6,5 1) 1,85 ) 300 3) Rejeitados: C, D, G. 4) a) 16 s b) 17,5 s c) 18,4 s d) 5,9097 s e),43 s f) 0,
44 9. Assimetria e Curtose 1. Simetria e Assimetria Uma distribuição de freqüência é simétrica quando a linha vertical pode ser desenhada do meio do gráfico da distribuição e as metades resultantes são aproximadamente imagens espelhadas. Uma distribuição de freqüência é uniforme (ou retangular) quando todas as entradas, ou classes, na distribuição têm freqüências iguais ou aproximadamente iguais. Uma distribuição uniforme também é simétrica. Uma distribuição de freqüências é assimétrica se a "cauda" do gráfico se alonga mais em um dos lados. Uma distribuição é assimétrica à esquerda (negativamente assimétrica) se a cauda se estende à esquerda, e assimétrica à direita (positivamente assimétrica) se a cauda se estende à direita. Quando a distribuição for simétrica e unimodal, a média, a mediana e a moda são iguais. Se a distribuição for assimétrica à esquerda, a média é menos que a mediana e a mediana é igualmente menor que a moda. Se a distribuição for assimétrica à direita, a média é maior que a mediana e igualmente maior que a moda. Exemplos dessas distribuições comuns são mostrados na figura a seguir. Resumidamente: Distribuição Moda, mediana e média Exemplo de distribuição Simétrica Mo =Md = x Normal, t Student Assimétrica à esquerda Mo > Md > x Assimétrica à direita Mo < Md < x Qui quadrado, F Snedecor Fique atento que há muitas formas diferentes de distribuição. Em alguns casos, a forma pode não ser classificada como simétrica, uniforme ou assimétrica. Uma distribuição pode ter várias lacunas causadas por valores discrepantes ou por agrupamento nos dados. Os agrupamentos podem ocorrer quando diversos tipos de dados são incluídos em um conjunto de dados. 10
45 Note que a média sempre irá na direção em que a distribuição for assimétrica. Por exemplo, quando a distribuição é assimétrica à esquerda, a média está à esquerda da mediana.. Curva de Densidade A idéia básica da curva de densidade está nos histogramas. Imagine um histograma oriundo a partir de um determinado conjunto de dados. À medida em que formos construindo novos histogramas, a cada vez com um número maior de classes (ou seja, as classes vão ficando cada vez menores), passamos a perceber que os topos de cada coluna do histograma formam uma curva. Se conseguirmos um número suficientemente grande de classes (cada classe com amplitude cada vez menor) e, ainda, se esse histograma for construído utilizando uma população, teremos a curva da função densidade da distribuição. Essa é apenas uma idéia geral de como obtemos, na prática, uma função densidade, o que está esquematizado na figura seguinte. 11
46 Mediana e Média de uma Curva de Densidade A mediana de uma curva de densidade é o ponto de áreas iguais, ou seja, o ponto que divide ao meio a área sob a curva. A média de uma curva de densidade é o ponto de equilíbrio, no qual a curva se equilibraria se fosse feita de material sólido. A mediana e a média coincidem em uma curva simétrica de densidade. Situam-se ambas no centro da curva. A média de uma curva assimétrica é afastada da mediana na direção da cauda longa. A média de uma curva de densidade é o ponto em que ela se equilibraria. As formas das distribuições, quando observamos as curvas de densidade são: 1
47 Distribuição simétrica: Distribuição assimétrica à esquerda: Distribuição assimétrica à direita: 13
48 3. Coeficiente de Assimetria Além do método gráfico de análise, podemos trabalhar com o cálculo de um coeficiente de assimetria que nos dá informações de qual tipo de distribuição estamos tratando. Basicamente, há duas fórmulas mais utilizadas: Primeiro coeficiente de assimetria de Pearson AS = x Mo σ onde: x é a média da distribuição; Mo é a moda da distribuição; σ é o desvio padrão da distribuição. Segundo coeficiente de assimetria de Pearson É uma alternativa à fórmula anterior que utiliza o valor da mediana. onde: x é a média da distribuição; Md é a mediana da distribuição; σ é o desvio padrão da distribuição. 3 AS = ( x Md) O primeiro coeficiente de Assimetria de Pearson tem o inconveniente de requerer a determinação prévia da moda. Assim, quando as distribuições não se apresentarem com forte assimetria, deve-se dar preferência ao Segundo Coeficiente de Assimetria de Pearson. Nos dois casos, quando: AS = 0 a distribuição é simétrica; AS > 0 a distribuição é assimétrica à direita; AS < 0 a distribuição é assimétrica à esquerda. É claro que, na prática, raramente encontraremos AS=0, e, sim, muito próximo de zero. Dessa forma, temos a seguinte classificação: se AS < 0,15 então a distribuição é simétrica; se 0,15 AS < 1,0 então a distribuição é assimétrica moderada; se AS 1,0 então a distribuição é assimétrica forte. σ 14
49 4. Curtose Curtose é o grau de achatamento da distribuição quando comparada a uma distribuição simétrica bastante conhecida chamada Normal. Ou seja, a curtose mede o quanto uma curva de freqüência será achatada em relação a uma curva Normal de referência. O coeficiente de curtose (k) ou coeficiente percentílico de curtose é dado por: Q k =. onde: Q 3 e Q 1 são o terceiro e primeiro quartis; P 90 e P 10 são o 90 e o 10 percentis. Quanto à curtose a distribuição pode ser: 3 ( P P ) 90 Q 1) Mesocúrtica (ou Normal): ela não é nem achatada, nem alongada. (k = 0,63) ) Platicúrtica: mais achatada que a Normal. (k > 0,63). 3) Leptocúrtica: mais alongada que a Normal. (k < 0,63). 15
50 5. Exemplos Exemplo 1: (AFRF-00.1 adaptado) Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram examinados 00 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüência abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. Classes frequência Total 00 Entende-se por curtose de uma distribuição seu grau de achatamento em geral medido em relação à distribuição normal. Uma medida de curtose é dada pelo quociente k = Q / (P 90 P 10 ), onde Q é a metade da distância interquartílica e P 90 e P 10 representam os percentis de 90% e 10%, respectivamente. Assinale a opção que dá o valor da curtose k para a distribuição de X. a) 0,63 b) 0,50 c) 0,300 d) 0,4 e) 0,000 Resolução Inicialmente, devemos calcular os quartis e percentis necessários para o cálculo da curtose. Verifique que: Q 1 = 118,0 Q 3 = 156,6 P 10 = 100,0 P 90 = 180,0 Logo, a curtose é: Q3 Q1 156,6 118,0 38,6 k = = = = 0,415. Logo, a resposta do teste é a. ( P90 P10 ).(180,0 100,0) 160,0 alternativa D. 16
51 Exemplo : analisando as curvas abaixo marque a resposta correta. (I) (II) (III) a) a curva I é simétrica: x > med > mo ; b) a curva II é assimétrica positiva: mo > σ > x ; c) a curva I é simétrica: x =med= mo ; d) a curva III é simétrica positiva: x = med = mo. Resolução A partir das figuras, vemos que: a curva I é simétrica, ou seja, x = Md = Mo; a curva II é assimétrica à esquerda ou assimétrica negativa, pois Mo > Md > x. a curva III é assimétrica à direita ou assimétrica positiva, pois Mo < Md < x. Logo, a resposta é a alternativa C. Exemplo 3: para as distribuições abaixo foram calculados: Distrib. I Distrib. II Distrib. III Classes Fi Classes Fi Classes Fi x =1Kg Med =1Kg Mo =1Kg S = 4,4Kg x =1,9Kg Med =13,5Kg Mo =16Kg S = 4,0Kg Marque a alternativa correta: a) a distribuição I é assimétrica negativa; b) a distribuição II é assimétrica positiva; c) a distribuição III é assimétrica negativa moderada. d) a distribuição I é simétrica; x =11,1Kg Med =10,5Kg Mo = 8Kg S = 4,0Kg 17
52 Resolução Vemos que, na distribuição I, temos que x = Md = Mo. Logo, ela é simétrica. Na distribuição II, Mo > Md > x, ou seja, é uma distribuição assimétrica à esquerda ou assimétrica negativa. Já na distribuição III, temos que Mo < Md < x, ou seja, é assimétrica à direita ou assimétrica positiva. Portanto, a resposta correta é a alternativa D. 6. Exercícios 1) Sabendo-se que uma distribuição apresenta as seguintes medidas: Q 1 = 4,4 cm, Q 3 = 41, cm, P 10 =0, cm e P 90 =49,4 cm, determine o coeficiente de curtose e classifique a curva com relação à forma. ) Uma maternidade está analisando a idade das mulheres que tiveram o seu primeiro filho. Os dados obtidos são: Considerando os dados como amostrais, calcule a média, a mediana, a moda e o desvio padrão desses dados. Classifique os dados em relação à assimetria. Média = 3,9 Mediana = 3 Moda = 3, Desvio Padrão = 6 distribuição é assimétrica positiva moderada. 3) Considere os seguintes resultados relativos a três distribuições de freqüências e determine o tipo de assimetria de cada uma delas. Distribuições Média Moda A 5 5 B C ) Uma distribuição de freqüência apresenta as seguintes medidas: x =48,1, Md=47,5 e s=,1. Calcule o coeficiente de assimetria. 5) Observou-se o número dos 100 sapatos vendidos em uma loja de calçados. Os resultados obtidos estão em forma de tabela, a seguir: N de sapatos f i Calcule a média, a moda, a mediana, o desvio padrão e classifique a assimetria e a curtose desses dados. 18
53 6) Considere as seguintes medidas, relativas a três distribuições de freqüência: Distribuições Q 1 Q 3 P 10 P 90 A B 63,7 80,3 55,0 86,6 C 8,8 45,6 0,5 49,8 a) Calcule os respectivos graus de curtose. b) Classifique cada uma das distribuições em relação à curva normal. 7) Determine o grau de curtose e classifique a distribuição em relação à curva normal: Pesos (kg) N de operários Respostas 1) k=0,87. Platicúrtica. ) Média = 3,9 Mediana = 3 Moda = 3, Desvio Padrão = 6 distribuição é assimétrica positiva moderada. 3) A = 5 5 = 0, logo, distribuição simétrica B = = - 5, logo, assimetria negativa C = =, logo, assimetria positiva 4) AS=0,85 5) Média = 36,10; Mediana = 35,9; Moda = 35,5; Desvio Padrão = 4,; AS = 0,143; Curtose = 0,3. A distribuição é simétrica e a curva é leptocúrtica. (Q1 = 33,5 Q3 = 38,8 P10 = 30,7 P90 = 4,1). 6) a) Distribuição A: k = 0,5 Distribuição B: k = 0,63 Distribuição C: k = 0,87. b) A: curva leptocúrtica; B: curva mesocúrtica; C: curva platicúrtica. 7) Q 1 = 66; Q 3 = 8,5; P 10 = 58; P 90 = 90; k = 0,58 a curva é leptocúrtica. 19
54 FORMULÁRIO - ESTATÍSTICA n k n k Binomial: P(X = k) =.p.(1 p) Geométrica: P(X=k) = p.(1 p) k 1 k k = 1+ 3,3.log n amplitude total h = Média: k x = xi.fi n Mediana: M d = L Md n F + fmd ant. h Moda: Mo = L mo D + 1 h, onde D D D mo 1 = f mo f ant e D = f mo f post 1 + Quartil: Q i i i.n Fant.n Fant = L 4 Q +. h Decil: D 10 i = LD +. h fq fd Percentil: P i = L P + i.n F 100 f P ant. h Variância amostral: Variância populacional: s ( x x) fi. i = n 1 ( x x) f. i i σ = n Desvio-padrão: σ = σ ou s = s Desvio-médio: fi.xi x DM = n Coeficiente de variação: CV Assimetria: x Mo = σ σ x = ou s CV = x 3( x Md) AS ou = AS Curtose: σ Q k =. 3 ( P P ) 90 Q
Medidas de Dispersão 1
Curso: Logística e Transportes Disciplina: Estatística Profa. Eliane Cabariti Medidas de Dispersão 1 Introdução Uma breve reflexão sobre as medidas de tendência central permite-nos concluir que elas não
Aula 6 Medidas de Tendência Central
1 Estatística e Probabilidade Aula 6 Medidas de Tendência Central Professor Luciano Nóbrega Somatório Quando queremos representar uma soma de valores que obedecem à uma sequência, podemos codificá-la através
x = xi n x = xifi fi 1. MÉDIA Exercício: Quando a distribuição é simétrica, a média e a mediana coincidem.
1. MÉDIA Exercício: Quando a distribuição é simétrica, a média e a mediana coincidem. Determine a média aritmética da distribuição: A mediana não é tão sensível, como a média, às observações que são muito
Variáveis Frequências Gráficos Medidas de Posição Medidas de Dispersão Medidas Complementares Inferência
Tipos de Variáveis Problema Motivador: Um pesquisador está interessado em fazer um levantamento sobre aspectos sócio-econômicos dos empregados da seção de orçamentos de uma companhia (vide tabela). Algumas
Medidas de Tendência Central. Introdução Média Aritmética Moda Mediana
Medidas de Tendência Central Introdução Média Aritmética Moda Mediana Introdução A maioria dos dados apresenta uma tendência de se concentrar em torno de um ponto central Portanto, é possível selecionar
Medida de Tendência Central
Medida de Tendência Central um valor no centro ou no meio de um conjunto de dados 1 Definições Média (Média Aritmética) o número obtido somando-se todos os valores de um conjunto de dados, dividindo-se
Estatística - exestatmedposic.doc 25/02/09
Medidas de Posição Introdução Vimos anteriormente que, através de uma distribuição de freqüências se estabelece um sistema de classificação que descreve o padrão de variação de um determinado fenômeno
Aula 1 Assimetria e Curtose
2º Bimestre 1 Estatística e Probabilidade Aula 1 Assimetria e Curtose Professor Luciano Nóbrega Medidas de assimetria As medidas de assimetria e curtose (esta última veremos na próxima aula) são as que
n Xi = X1 + X2 + X3 +...+. Xn i = 1 n Xi, deve ser lida soma dos valores xi, para i variando de 1 até n. i = 1
MEDIDAS DE TENDÊNCIA CENTRAL Introdução Neste tópico, vamos aprender sobre o cálculo de medidas que possibilitem representar um conjunto de dados relativos à observação de determinado fenômeno de forma
Medidas de dispersão e assimetria
Metodologia de Diagnóstico e Elaboração de Relatório FASHT Medidas de dispersão e assimetria Profª Cesaltina Pires [email protected] Plano da Apresentação Medidas de dispersão Variância Desvio padrão Erro
ANÁLISE EXPLORATÓRIA DE DADOS
ANÁLISE EXPLORATÓRIA DE DADOS 1.0 Conceitos A estatística descritiva tem o objetivo de organizar, resumir e apresentar de forma adequada os dados, para que estes se tornem informativos. A análise exploratória
Medidas de Localização
MATEMÁTICA APLICADA ÀS CIÊNCIAS SOCIAIS RESUMO Estatística 2 Medidas de Localização e Dispersão 10º ano Cláudia Henriques Medidas de Localização Estatísticas Medidas que se calculam a partir dos dados
Estatística. Slide 0. Ana M. Abreu - 2006/07
Estatística Slide 0 Capítulo 1 Estatística Descritiva Slide 1 I-1 Introdução à organização e ao processamento de dados. I-2 Amostra e população; cuidados a ter na recolha da amostra. I-3 Ordenação dos
MEDIDAS DE DISPERSÃO. o grau de variabilidade, ou dispersão, dos valores em torno da média.
UNIVERSIDADE FEDERAL DA PARAÍBA MEDIDAS DESCRITIVAS Departamento de Estatística Tarciana Liberal As medidas de posição apresentadas fornecem a informação dos dados apenas a nível pontual, sem ilustrar
A vida sem reflexão não merece ser vivida Sócrates Disciplina: ESTATÍSTICA e PROBABILIDADE
Notas de aula 07 1 A vida sem reflexão não merece ser vivida Sócrates Disciplina: ESTATÍSTICA e PROBABILIDADE 1. Medidas de Forma: Assimetria e Curtose. A medida de assimetria indica o grau de distorção
MEDIDAS DE TENDÊNCIA CENTRAL II
MEDIDAS DE TENDÊNCIA CENTRAL II 8. MÉDIA, MEDIANA E MODA 8. Mediana 8 7 A mediana divide um conjunto de dados pré-ordenados em duas porções iguais, ou seja, duas partes de 50% cada. Nesta divisão, 50%
BIOESTATÍSTICA. Parte 1 - Estatística descritiva e análise exploratória dos dados
BIOESTATÍSTICA Parte 1 - Estatística descritiva e análise exploratória dos dados Aulas Teóricas de 17/02/2011 a 03/03/2011 1.1. População, amostra e dados estatísticos. Dados qualitativos e quantitativos
ESTATÍSTICA DESCRITIVA:
UNIVERSIDADE FEDERAL DE MATO GROSSO Campus Universitário de Sinop(CUS) ESTATÍSTICA DESCRITIVA: Medidas de forma: Assimetria e Curtose Profº Evaldo Martins Pires SINOP -MT TEMAS TRABALHADOS ATÉ AGORA Aula
Lição 5 Medidas Descritivas Medidas de Dispersão
99 Lição 5 Medidas Descritivas Medidas de Dispersão Após concluir o estudo desta lição, esperamos que você possa: identifi car o objetivo das medidas de dispersão; identifi car o conceito de variância;
Unidade 5 5.1 Medidas de Posição ou de Tendência Central
Unidade 5 5.1 Medidas de Posição ou de Tendência Central 1- Introdução Se estivermos numa parada de ônibus urbano e nos pedirem alguma informação sobre a demora em passar um determinado ônibus, que diremos?
Escola Secundária com 3º CEB de Lousada. Ficha de Trabalho de Matemática do 8º ano N.º 29 Assunto: Estatística
Escola Secundária com 3º CEB de Lousada Ficha de Trabalho de Matemática do 8º ano N.º 29 Assunto: Estatística Lições nº e Data /05/2011 Estatística A Estatística é um ramo da Matemática que tem por objectivo:
Estimação. Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança
Estimação Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança Motivação A partir da média de uma a amostra em uma colheita recente, o conselho de qualidade
Medidas de Tendência Central
Média, Mediana e Moda 1 Coletando Dados A coleta de dados produz um conjunto de escores de uma ou mais variáveis Para chegar à distribuição dos escores, estes têm de ser arrumados / ordenados do menor
Coeficiente de Assimetria e Curtose. Rinaldo Artes. Padronização., tem as seguintes propriedades: Momentos
Coeficiente de Assimetria e Curtose Rinaldo Artes 2014 Padronização Seja X uma variável aleatória com E(X)=µ e Var(X)=σ 2. Então a variável aleatória Z, definida como =, tem as seguintes propriedades:
Relatório das Provas da 2ª. Fase - Vestibular 2016
Relatório das Provas da 2ª. Fase - Vestibular 2016 Resumo Executivo O presente relatório apresenta os resultados da segunda fase do Vestibular UNICAMP 2016 constituída por três provas. Esta etapa do vestibular
PROBABILIDADE E ESTATISTICA. Unidade III Medidas de Posição
PROBABILIDADE E ESTATISTICA Unidade III Medidas de Posição 0 1 MEDIDAS DE POSIÇÃO As medidas de posições mais importantes são as medidas de tendência central e as medidas separatrizes. As medidas de tendência
Teorema do Limite Central e Intervalo de Confiança
Probabilidade e Estatística Teorema do Limite Central e Intervalo de Confiança Teorema do Limite Central Teorema do Limite Central Um variável aleatória pode ter uma distribuição qualquer (normal, uniforme,...),
A medida psicométrica
A medida psicométrica Comportamento x Traço latente A teoria Clássica dos Testes concepção monista materialista A Teoria de Resposta ao Item concepção dualista interacionista Psíquico: traço latente (teta);
DISTRIBUIÇÃO DE FREQUÊNCIA DE VARIÁVEIS QUALITATIVAS E QUANTITATIVAS DISCRETAS (TABELAS E GRÁFICOS)
DISTRIBUIÇÃO DE FREQUÊNCIA DE VARIÁVEIS QUALITATIVAS E QUANTITATIVAS DISCRETAS (TABELAS E GRÁFICOS) O QUE É ESTATÍSTICA Estatística é a ciência de obter conclusões a partir de dados. Envolve métodos para
Modelos de Probabilidade e Inferência Estatística
Modelos de Probabilidade e Inferência Estatística Departamento de Estatística Universidade Federal da Paraíba Prof. Tarciana Liberal (UFPB) Aula Distribuições Qui-quadrado, t-student e F de Snedecor 04/14
Aula 4 Gráficos e Distribuição de Frequências
1 REDES Aula 4 Gráficos e Distribuição de Frequências Professor Luciano Nóbrega Gráficos A representação gráfica fornece uma visão mais rápida que a observação direta de dados numéricos ou de tabelas.
Os dados quantitativos também podem ser de natureza discreta ou contínua.
Natureza dos Dados Às informações obtidas acerca das características de um conjunto dá-se o nome de dado estatístico. Os dados estatísticos podem ser de dois tipos: qualitativos ou quantitativos. Dado
PROBABILIDADE E ESTATÍSTICA I 1º SEMESTRE DE 2015 Docente: Anderson H.R. Ferreira 2º LISTA DE EXERCÍCIOS
1 PROBABILIDADE E ESTATÍSTICA I 1º SEMESTRE DE 2015 Docente: Anderson H.R. Ferreira 2º LISTA DE EXERCÍCIOS Instruções: Tenha sempre em mãos uma Calculadora Científica, pois a mesma será utilizada exaustivamente
1. Estatística Descritiva
Introdução à Estatística Estatística Descritiva 1 1. Estatística Descritiva Suponhamos que dispomos de um conjunto de dados (sem nos preocuparmos como foram obtidos) e pretendemos desenvolver processos
Análise de Regressão. Notas de Aula
Análise de Regressão Notas de Aula 2 Modelos de Regressão Modelos de regressão são modelos matemáticos que relacionam o comportamento de uma variável Y com outra X. Quando a função f que relaciona duas
Distribuição Binomial e Normal
Distribuição Binomial e Normal O que se pretende, neste módulo, é apresentar dois modelos teóricos de distribuição de probabilidade, aos quais um experimento aleatório estudado possa ser adaptado, o que
MAE116 - Noções de Estatística
MAE116 - Noções de Estatística Grupo A - 1 semestre de 2015 Gabarito da Lista de exercícios 10 - Introdução à Estatística Descritiva - CASA Exercício 1. (2 pontos) Sabe-se que, historicamente, 18% dos
[ORGANIZAÇÃO DE DADOS: TABELAS DE FREQUENCIAS & GRÁFICOS]
FATEC GT/ FATEC SJC [LISTA 1] [ORGANIZAÇÃO DE DADOS: TABELAS DE FREQUENCIAS & GRÁFICOS] Prof. Herivelto Tiago Marcondes dos Santos [Fevereiro de 2009] Organização de dados: [Tabelas de freqüências, histogramas
Estatística. Conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos ou de massa.
Faculdade de Tecnologia Senac Pelotas Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas Matemática Aplicada Prof. Edécio Fernando Iepsen Estatística Variáveis Qualitativas, Quantitativas
Teste de Hipótese e Intervalo de Confiança. Parte 2
Teste de Hipótese e Intervalo de Confiança Parte 2 Questões para discutirmos em sala: O que é uma hipótese estatística? O que é um teste de hipótese? Quem são as hipóteses nula e alternativa? Quando devemos
As outras medidas de posição são as separatrizes, que englobam: a própria mediana, os decis, os quartis e os percentis.
RESUMO Medidas de Posição são as estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência As medidas
Sobre o Boxplot no GeoGebra
Sobre o Boxplot no GeoGebra Boxplot in GeoGebra PÉRICLES CÉSAR DE ARAUJO 1 CELINA APARECIDA ALMEIDA PEREIRA ABAR 2 Resumo O objetivo deste trabalho é apresentar o resultado do uso da ferramenta para construção
2) Escreva um algoritmo que leia um conjunto de 10 notas, armazene-as em uma variável composta chamada NOTA e calcule e imprima a sua média.
1) Inicializar um vetor de inteiros com números de 0 a 99 2) Escreva um algoritmo que leia um conjunto de 10 notas, armazene-as em uma variável composta chamada NOTA e calcule e imprima a sua média 3)
Capítulo 4 Inferência Estatística
Capítulo 4 Inferência Estatística Slide 1 Resenha Intervalo de Confiança para uma proporção Intervalo de Confiança para o valor médio de uma variável aleatória Intervalo de Confiança para a variância de
SOLUÇÕES N2 2015. item a) O maior dos quatro retângulos tem lados de medida 30 4 = 26 cm e 20 7 = 13 cm. Logo, sua área é 26 x 13= 338 cm 2.
Solução da prova da 1 a fase OBMEP 2015 Nível 1 1 SOLUÇÕES N2 2015 N2Q1 Solução O maior dos quatro retângulos tem lados de medida 30 4 = 26 cm e 20 7 = 13 cm. Logo, sua área é 26 x 13= 338 cm 2. Com um
APRENDENDO ESTATÍSTICA
PARTE II 2 APRENDENDO ESTATÍSTICA 4. Coleta de Dados Toda e qualquer ação estatística deve estar centrada em objetivos claros. O primeiro passo para um procedimento estatístico é o trabalho que envolve
Probabilidade e Estatística. Medidas de Tendência Central. Cláudio Henrique Albuquerque Rodrigues, M. Sc.
Probabilidade e Estatística Medidas de Tendência Central Cláudio Henrique Albuquerque Rodrigues, M. Sc. Introdução No estudo de uma série estatística é conveniente o cálculo de algumas medidas que a caracterizam
Aula 1 Variáveis aleatórias contínuas
Aula 1 Variáveis aleatórias contínuas Objetivos: Nesta aula iremos estudar as variáveis aleatórias contínuas e você aprenderá os seguintes conceitos: função de densidade de probabilidade; função de distribuição
CONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS» PROBABILIDADE E ESTATÍSTICA «21. Uma fábrica, que produz pequenas peças utilizadas em materiais eletrônicos, armazena essa mercadoria em lotes com 1000 unidades. Inspecionada
Matemática. A probabilidade pedida é p =
a) Uma urna contém 5 bolinhas numeradas de a 5. Uma bolinha é sorteada, tem observado seu número, e é recolocada na urna. Em seguida, uma segunda bolinha é sorteada e tem observado seu número. Qual a probabilidade
Estatística e Probabilidade
Estatística e Probabilidade Administração e Ciências Contábeis 3º Semestre LISTA DE EXERCÍCIOS GRÁFICOS ESTATÍSTICOS, DISTRIBUIÇÃO DE FREQUÊNCIA Módulo 2 1. Classifique os gráficos abaixo, de acordo com
O QUE SÃO E QUAIS SÃO AS PRINCIPAIS MEDIDAS DE TENDÊNCIA CENTRAL EM ESTATÍSTICA PARTE I
O QUE SÃO E QUAIS SÃO AS PRINCIPAIS MEDIDAS DE TENDÊNCIA CENTRAL EM ESTATÍSTICA PARTE I O que são medidas de tendência central? Média Aritmética Simples Média Aritmética Ponderada Media Geométrica e Harmônica
1ª LISTA DE EXERCÍCIOS. Estatística Administração Integral e Noturno. Estatística Descritiva
1ª LISTA DE EXERCÍCIOS Estatística Administração Integral e Noturno Estatística Descritiva 1. Classifique as variáveis (qualitativa nominal, qualitativa ordinal, quantitativa discreta, quantitativa contínua):
Desvio Padrão ou Erro Padrão
NOTAS METODOLÓGICAS ISSN 0871-3413 ArquiMed, 2006 Desvio Padrão ou Erro Padrão Nuno Lunet, Milton Severo, Henrique Barros Serviço de Higiene e Epidemiologia da Faculdade de Medicina da Universidade do
Aula 1 Estatística e Probabilidade
Aula 1 Estatística e Probabilidade Anamaria Teodora Coelho Rios da Silva Aula 1 Plano de ensino Planejamento das aulas Referências Bibliográficas Atividades de Aprendizagem Orientadas Sistema de Avaliação
INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva [email protected]
INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA Prof. Anderson Rodrigo da Silva [email protected] Tipos de Pesquisa Censo: é o levantamento de toda população. Aqui não se faz inferência e sim uma descrição
ÁLGEBRA. Aula 1 _ Função Polinomial do 2º Grau Professor Luciano Nóbrega. Maria Auxiliadora
1 ÁLGEBRA Aula 1 _ Função Polinomial do 2º Grau Professor Luciano Nóbrega Maria Auxiliadora FUNÇÃO POLINOMIAL DO 2º GRAU 2 Uma função polinomial do 2º grau (ou simplesmente, função do 2º grau) é uma relação
Aula 12 Teste de hipótese sobre proporções amostras grandes
Aula 12 Teste de hipótese sobre proporções amostras grandes Objetivos Na aula anterior, você aprendeu a construir testes de hipóteses sobre a média de uma população normal com variância σ 2 conhecida.
I-094 - COLIFORMES E ph MÉDIAS ARITMÉTICAS, MÉDIAS GEOMÉTRICAS E MEDIANAS
I-9 - COLIFORMES E ph MÉDIAS ARITMÉTICAS, MÉDIAS GEOMÉTRICAS E MEDIANAS Marcos von Sperling ( 1 ) Engenheiro Civil (UFMG). Doutor em Engenharia Ambiental (Imperial College, Universidade de Londres Inglaterra).
CIRCULAR TÉCNICA N o 171 NOVEMBRO 1989 TABELAS PARA CLASSIFICAÇÃO DO COEFICIENTE DE VARIAÇÃO
IPEF: FILOSOFIA DE TRABALHO DE UMA ELITE DE EMPRESAS FLORESTAIS BRASILEIRAS ISSN 0100-3453 CIRCULAR TÉCNICA N o 171 NOVEMBRO 1989 TABELAS PARA CLASSIFICAÇÃO DO COEFICIENTE DE VARIAÇÃO INTRODUÇAO Carlos
Plano de Ensino PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA - CCE0292
Plano de Ensino PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA - CCE0292 Título PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA Código da disciplina SIA CCE0292 16 Número de semanas de aula 4 Número
Stela Adami Vayego DEST/UFPR
Resumo 5 - Análise Bivariada (Bidimensional) 5.1. Introdução O principal objetivo das análises nessa situação é explorar relações (similaridades) entre duas variáveis. A distribuição conjunta das freqüências
Análise estatística. Aula de Bioestatística. 17/9/2008 (2.ª Parte) Paulo Nogueira
Análise estatística Aula de Bioestatística 17/9/2008 (2.ª Parte) Paulo Nogueira Testes de Hipóteses Hipótese Estatística de teste Distribuição da estatística de teste Decisão H 0 : Não existe efeito vs.
cuja distribuição é t de Student com n 1 graus de liberdade.
Aula 13 Teste de hipótese sobre a média de uma população normal σ 2 desconhecida Objetivos: Nesta aula você completará seu estudo básico sobre testes de hipóteses, analisando a situação relativa a uma
DISCIPLINA DE ESTATÍSTICA
UNIC UNIVERSIDADE DE CUIABÁ DISCIPLINA DE ESTATÍSTICA REPRESENTANDO DADOS Dados Qualitativos Quantitativos Métodos Gráficos Métodos Tabulares Métodos Gráficos Métodos Tabulares Barras Tabelas de Freqüência
é 4. Portanto, o desvio padrão é 2. Neste caso 100% dos valores da população estão a um desvio padrão da média.
Desvio Padrão From Wikipedia, the free encyclopedia probabilidade e estatística, o desvio padrão de uma distribuição de probabilidade, de uma variável aleatória, ou população é uma medida do espalhamento
IND 1115 Inferência Estatística Aula 8
Conteúdo IND 5 Inferência Estatística Aula 8 Setembro 4 Mônica Barros O - aproximação da Binomial pela Este teorema é apenas um caso particular do teorema central do limite, pois uma variável aleatória
Métodos Quantitativos Aplicados a Gestão
Métodos Quantitativos Aplicados a Gestão Cálculos estatísticos para análise e tomada de decisão Responsável pelo Conteúdo: Prof. Carlos Henrique e Prof. Douglas Mandaji Revisão Textual: Profa. Ms. Alessandra
TECNÓLOGO EM CONSTRUÇÃO CIVIL. Aula 6 _ Função Polinomial do 2º Grau Professor Luciano Nóbrega
1 TECNÓLOGO EM CONSTRUÇÃO CIVIL Aula 6 _ Função Polinomial do 2º Grau Professor Luciano Nóbrega FUNÇÃO POLINOMIAL DO 2º GRAU 2 Uma função polinomial do 2º grau (ou simplesmente, função do 2º grau) é uma
Lista de Exercícios 04 Estruturas de Dados Homogêneas - Vetores
Instituto de Ciências Eatas e Biológicas ICEB Lista de Eercícios 04 Estruturas de Dados Homogêneas - Vetores 1) Escreva um programa que armazene em um vetor todos os números inteiros de 0 a 50. Após isso,
Aula 6 Propagação de erros
Aula 6 Propagação de erros Conteúdo da aula: Como estimar incertezas de uma medida indireta Como realizar propagação de erros? Exemplo: medimos A e B e suas incertezas. Com calcular a incerteza de C, se
AMOSTRAGEM: DIMENSIONAMENTO DE AMOSTRAS. SELEÇÃO DOS ELEMENTOS DE UMA AMOSTRA. ESTIMATIVA DA CARACTERÍSTICA TOTAL DA POPULAÇÃO INVESTIGADA
AMOSTRAGEM: DIMENSIONAMENTO DE AMOSTRAS. SELEÇÃO DOS ELEMENTOS DE UMA AMOSTRA. ESTIMATIVA DA CARACTERÍSTICA TOTAL DA POPULAÇÃO INVESTIGADA META Dimensionar o tamanho ideal de amostra para cada população.
AULAS 08 E 09 Distribuição de Probabilidade Normal
1 AULAS 08 E 09 Distribuição de Probabilidade Normal Ernesto F. L. Amaral 02 e 09 de setembro de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed.
PLANO DE AULA I. Escrito por Eliani Pereira de Souza Nascimento. Supervisionado por Rosana Silva Bonfim
PLANO DE AULA I Escrito por Eliani Pereira de Souza Nascimento Funções no Geogebra 1 º Série do Ensino Médio (Matemática) Compreender a construção do gráfico de funções de 1o - grau, sabendo caracterizar
Distribuição de frequências:
Distribuição de frequências: Uma distribuição de frequências é uma tabela que reúne o conjunto de dados conforme as frequências ou as repetições de seus valores. Esta tabela pode representar os dados em
Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira INEP Ministério da Educação MEC. Cálculo do Conceito ENADE
Instituto acional de Estudos e Pesquisas Educacionais Anísio Teixeira IEP Ministério da Educação ME álculo do onceito EADE Para descrever o cálculo do onceito Enade, primeiramente é importante definir
Aula 11 Teste de hipótese sobre a média de uma população normal - σ 2 conhecida
Aula 11 Teste de hipótese sobre a média de uma população normal - σ 2 conhecida Objetivo: Nesta aula, iremos aplicar os conceitos básicos sobre a teoria de teste de hipótese a uma situação específica.
Medidas de Tendência Central
Capítulo 3 Medidas de Tendência Central Desenvolvimento: 3.1 Introdução 3.2 Média Aritmética 3.3 Mediana 3.4 Moda 3.5 Média Geométrica 3.6 Média harmônica 3.7 Relação entre as médias 3.8 Separatrizes 3.1
PROVA DE MATEMÁTICA CONCURSO DE ADMISSÃO 2013/2014 1º ANO DO ENSINO MÉDIO
CONCURSO DE ADMISSÃO 2013/2014 PROVA DE MATEMÁTICA 1º ANO DO ENSINO MÉDIO CONFERÊNCIA: Membro da CEOCP (Mat / 1º EM) Presidente da CEI Dir Ens CPOR / CMBH PÁGINA 1 RESPONDA AS QUESTÕES DE 1 A 20 E TRANSCREVA
FATEC GT/FATEC SJC. Prof. MSc. Herivelto Tiago Marcondes dos Santos [ESTATÍSTICA I]
Prof. MSc. Herivelto Tiago Marcondes dos Santos [ESTATÍSTICA I] 1 Introdução a análise exploratória de dados A necessidade de evidenciar alguns fenômenos constantes no dia-a-dia do ser humano permitiu
AULA 2 UNIDADE 1 DISTRIBUIÇÃO DE FREQUÊNCIAS 1.1 INTRODUÇÃO
AULA UNIDADE 1 DISTRIBUIÇÃO DE FREQUÊNCIAS 1.1 INTRODUÇÃO As tabelas estatísticas, geralmente, condensam informações de fenômenos que necessitam da coleta de grande quantidade de dados numéricos. No caso
AULA 04 Estimativas e Tamanhos Amostrais
1 AULA 04 Estimativas e Tamanhos Amostrais Ernesto F. L. Amaral 27 de agosto de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario
Somando os termos de uma progressão aritmética
A UA UL LA Somando os termos de uma progressão aritmética Introdução Um pouco de História Na aula passada, mostramos como calcular qualquer termo de uma progressão aritmética se conhecemos um de seus termos
Controle Estátistico de Processo.
Relatório de estudo dos fios. Controle Estátistico de Processo. Indice Item Assunto. Pág. Análise estatística C.E.P. 04 1 Introdução. 04 2 Controle estatístico do processo. 04 2.1 Definição. 04 2.3 Objetivo
Unidade MEDIDAS E POSIÇÕES. Unidade I:
Unidade I: 0 MEDIDAS DE POSIÇÃO As medidas de posições mais importantes são as de tendência central e as medidas separatrizes. As medidas de tendência central recebem este nome por posicionar-se no centro
Escola Básica e Secundária de Velas Planificação Anual
Escola Básica e Secundária de Velas Planificação Anual MATEMÁTICA 10º ANO (CURSO PROFISSIONAL) ANO LETIVO 201/2014 Módulo I: Estatística Nº de Aulas Previstas (90 m): 18 Conteúdos Objetivos Estratégias/
Aula 12: Correlação e Regressão
Aula 12: Correlação e Regressão Sumário Aula 12: Correlação e Regressão... 1 12.l Correlação... 2 12.2 Diagrama de dispersão... 2 12.3 Correlação linear... 3 12.3.1 Coeficiente de correlação linear...
Aula 4 Função do 2º Grau
1 Tecnólogo em Construção de Edifícios Aula 4 Função do 2º Grau Professor Luciano Nóbrega GABARITO 46) f(x) = x 2 + x + 1 www.professorlucianonobrega.wordpress.com 2 FUNÇÃO POLINOMIAL DO 2º GRAU Uma função
ANOVA. (Analysis of Variance) Prof. Dr. Guanis de Barros Vilela Junior
ANOVA (Analysis of Variance) Prof. Dr. Guanis de Barros Vilela Junior Para que serve a ANOVA? Para comparar três ou mais variáveis ou amostras. Por exemplo, queremos testar os efeitos cardiorrespiratórios
FUNDAÇÃO GETULIO VARGAS Programa de Certificação de Qualidade Curso de Graduação em Administração
FUNDAÇÃO GETULIO VARGAS Programa de Certificação de Qualidade Curso de Graduação em Administração PROVA DE ESTATÍSTICA I 2º Semestre / 2010 - P2 - TIPO 1 DADOS DO ALUNO: Nome: Assinatura INSTRUÇÕES: Você
Aula 00. Raciocínio Lógico Quantitativo para IBGE. Raciocínio Lógico Quantitativo Professor: Guilherme Neves
Aula 00 Raciocínio Lógico Quantitativo Professor: Guilherme Neves www.pontodosconcursos.com.br 1 Aula 00 Aula Demonstrativa Raciocínio Lógico Quantitativo Apresentação... 3 Modelos de questões resolvidas
Aula 8 Intervalos de confiança para proporções amostras grandes
Aula 8 Intervalos de confiança para proporções amostras grandes Objetivos Na aula anterior, foram apresentadas as idéias básicas da estimação por intervalos de confiança. Para ilustrar o princípio utilizado
Exercícios - Lista 1
PROFESSOR: E-Mail: [email protected] DISCIPLINA: CURSO: TURMA: Exercícios - Lista 1 1. A ISO - International Organization for Standardization (Organização Internacional para Normalização), em Genebra,
Faculdades Integradas de Ariquemes (FIAR) Pós-Graduação Lato Sensu
Faculdades Integradas de Ariquemes (FIAR) Pós-Graduação Lato Sensu em Educação Matemática com ênfase em Matemática Financeira Componente Curricular: Estatística Professora: Carma Maria Martini Identificação
Lista de Exercícios Campo Elétrico
Considere k o = 9,0. 10 9 N. m 2 /C 2 Lista de Exercícios Campo Elétrico 1. Uma partícula de carga q = 2,5. 10-8 C e massa m = 5,0. 10-4 kg, colocada num determinado ponto P de uma região onde existe um
ESTATÍSTICA. PROF. RANILDO LOPES U.E PROF EDGAR TITO
ESTATÍSTICA PROF. RANILDO LOPES http://ueedgartito.wordpress.com U.E PROF EDGAR TITO 1 ESTATÍSTICA MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE DISPERSÃO 2 Estatística ELEMENTOS TÍPICOS DE UMA DISTRIBUIÇÃO:
Inferência sobre duas proporções
Teste para duas populações duas populações Amostra :,,,, alor comum para delta 0 Amostra 2:,,,, Tamanho Tamanho Média amostral x Média amostral x Desvio-padrão Desvio-padrão Teste para duas populações
Medidas de Tendência Central
ESTATÍSTICA DESCRITIVA Medidas de Tendência Central 3 MEDIDAS DE TENDÊNCIA CENTRAL 3.1 Média Aritmética Uma das mais importantes medidas estatísticas utilizadas é a média. Ela é, por exemplo, utilizada
FUNÇÃO QUADRÁTICA. Resumo
01 / 08 / 12 FUNÇÃO QUADRÁTICA 1. Definição Resumo Função do 2º grau ou função quadrática é a função f: R R definida por f(x) = ax² + bx + c, com a, b, c reais e a 0. Em que a é o coeficiente de x²; b
