Universidade da Beira Interior Departamento de Matemática ESTATÍSTICA Ano lectivo: 2007/2008 Curso: Ciências do Desporto Ficha de exercícios nº1: Análise Exploratória de dados: Redução e Representação de Dados; Características Amostrais 1. Pretende-se fazer um estudo sobre o número de membros do agregado familiar, numa cidade. Para isso efectuou-se um inquérito ao qual responderam 50 famílias. Indique: a) A população em estudo; b) A amostra escolhida; c) A variável em estudo e classifique-a. 2. Indique a população e a unidade estatística (indivíduos) em que o atributo é: a) O curso frequentado pelos alunos da UBI; b) A duração, em horas, das pilhas produzidas por uma fábrica durante um dia; c) A nacionalidade dos turistas que Portugal recebeu em 1991. 3. Dê dois exemplos de estudos estatísticos onde seja utilizada uma amostra e, para cada um, indique: a) A população; b) A unidade estatística; c) A amostra; d) A variável estatística e classifique-a. 4. Numa sondagem a 40 pessoas, em que se inquiria sobre quantos anos serão necessários para que a população mundial duplique, se aumentar na mesma proporção que se tem vindo a verificar, registaram-se os seguintes dados: Desenhe um gráfico de barras, agrupando os dados nas classes 1 a 20, 21 a 40, 41 a 60, etc 5. Numa fábrica fez-se um teste a 150 lâmpadas e registou-se a seguinte informação: n i a) Utilize um quadro de frequências para representar esta informação. b) Construa um histograma adequado e represente o polígono de frequências. c) Esboce o histograma integral e o polígono de frequências acumuladas. d) Qual a percentagem de lâmpadas com duração de vida inferior a 900 horas? ESTATÍSTICA Ficha de exercícios 1 2007/2008 1
e) Qual a percentagem de lâmpadas com duração de vida inferior a 900 horas? f) Qual é o valor da duração das lâmpadas em relação ao qual 20% das lâmpadas duram no máximo esse valor? 6. Dadas as seguintes observações referentes aos números de encomendas conseguidos num mês pelos 103 representantes de uma empresa: a) Construa a tabela de frequências que resume os dados fornecidos b) Represente graficamente as distribuições obtidas. 7. O gráfico circular seguinte mostra a distribuição do tempo durante um dia de uma dona de casa. Dia de uma dona de casa emprego dormir outras actividades a) Atendendo às condições da figura, sabendo que passa 8h no emprego e o sector de outras actividades tem amplitude 110º, determine o tempo gasto a dormir. b) A partir da representação gráfica dada, construa a amostra que lhe deu origem. 8. Num seminário estavam presentes 80 pessoas, das quais 32 eram sociólogos, 20 eram professores, 12 economistas e 16 psicólogos. a) Elabore a tabela de frequências correspondente. b) Ilustre a tabela anterior através de um gráfico de barras. c) Esboce um gráfico circular para representar a distribuição percentual dos participantes no seminário por profissão. ESTATÍSTICA Ficha de exercícios 1 2007/2008 2
9. Numa sondagem efectuada telefonicamente sobre as audiências da televisão, 2350 espectadores responderam que estavam a ver televisão às 22h e 150 disseram que não. Segundo os entrevistados, 598 viam a RTP1, 212 a RTP2, 350 a SIC, 480 sintonizavam a TVI e os restantes viam outro canal de televisão. a) Represente a informação anterior através de uma tabela de frequências. b) Ilustre graficamente os dados obtidos na alínea anterior. 10. Na tabela seguinte, cada elemento representa a classificação obtida por certo aluno numa dada disciplina: 43 62 52 48 46 65 43 48 52 51 57 48 48 38 42 44 46 43 35 42 45 45 44 46 40 40 47 52 38 51 45 38 51 40 46 45 54 55 61 50 59 42 39 56 44 43 47 51 43 50 34 40 53 42 31 44 51 43 48 41 43 48 41 55 Elabore: a) A tabela de frequências correspondente. b) O polígono de frequências e o respectivo histograma c) O polígono de frequências acumuladas. 11. Um jovem e polivalente treinador tem a oportunidade de representar um de dois desportistas (A e B) do seu clube nos próximos Jogos Olímpicos, sendo ambos especialistas nas suas respectivas modalidades: natação (A) e salto à vara (B). Durante uma semana de testes, o treinador registou os records diários em relação aos tempos de 100 metros bruços (em segundos) e altura da barra transposta (em metros): Desportista A Desportista B Dia da semana 100m bruços (s) Dia da semana altura (m) 2ª feira 34.1 2ª feira 5.5 3ª feira 39.6 3ª feira 5.6 4ª feira 32 4ª feira 4.8 5ª feira 31.3 5ª feira 5.7 6ª feira 36.7 6ª feira 4.9 Sábado 32.4 Sábado 5.5 Domingo 33.3 Domingo 5.1 a) Agrupe adequadamente os valores obtidos por A, apresentando os dados na forma de uma tabela de frequências (sugestão: Arredonde o valor da amplitude de classe para as décimas). b) Represente graficamente os dados relativos ao desportista A e determine o valor da moda.. c) Considerando ainda o indivíduo A, indique o tempo (em segundos) em relação ao qual 75% dos elementos da amostra são inferiores ou iguais a esse valor. d) Determine qual dos desportistas o treinador deverá optar por representar. Justifique a sua resposta. ESTATÍSTICA Ficha de exercícios 1 2007/2008 3
12. Um desportista de alta competição efectua um treino intensivo de preparação para uma prova internacional. Todos os dias, no final dos trabalhos e antes de entrar em período de repouso, é medida a sua concentração de lactato no sangue (m mol/l). Obtiveram-se, assim, os seguintes dados: Dia da semana Concentração de lactato (m mol/l) 1 3.2 2 2.9 3 3.6 4 3.7 5 3.5 6 3.4 7 3.2 8 3.3 9 2.9 10 2.6 a) Agrupe adequadamente os valores relativos à concentração de lactato no sangue do desportista, apresentando os dados na forma de uma tabela de frequências (sugestão: arredonde o valor da amplitude de classe às centésimas). b) Represente graficamente os dados obtidos. c) Qual a percentagem de valores da amostra inferiores ou iguais a 3,4? d) Qual a percentagem de valores da amostra inferiores ou iguais a 3,0? e) Indique o valor da concentração de lactato em relação ao qual 50% dos elementos da amostra são inferiores ou iguais a esse valor. f) Localize graficamente a mediana e determine o seu valor; g) Calcule, a partir da informação obtida quando agrupou os dados, a média, mediana e o desvio padrão da concentração de lactato no sangue do desportista; h) Volte a calcular as mesmas medidas tendo por base os valores da amostra em bruto ; i) Como explica, se existirem, as diferenças existentes entre as duas alíneas anteriores? j) Como atribuiria pesos às observações do desportista, caso pretendesse penalizar concentrações de lactato pouco desejáveis, no cálculo de uma média ponderada? k) Indique o valor da concentração de lactato em relação ao qual 95% dos elementos da amostra são superiores a esse valor; l) Esboce a Box-plot relativa aos valores em estudo. ESTATÍSTICA Ficha de exercícios 1 2007/2008 4
13. O clube Les-Coqs-Sportives decidiu avaliar o estado de forma dos seus desportistas de uma certa modalidade. Para tal, e considerando apenas a fase inicial da avaliação, foi medida a frequência cardíaca (expressa em batimentos/minuto) dos desportistas em estado basal. Recolhidos os dados, obteve-se a seguinte representação gráfica: 7 6 5 4 3 frequências absolutas 2 1 0 [58, 61[ [61, 64[ [64, 67[ [67, 70[ [70, 73[ [73, 76[ batimentos por minuto a) Resuma os dados obtidos na forma de uma tabela de frequências, a partir do histograma anterior. b) Qual a percentagem de desportistas com uma frequência cardíaca inferior a 65 batimentos/minuto? c) Determine os valores das seguintes medidas de localização: média, mediana e moda; d) Classifique, justificando, a distribuição dos valores da frequência cardíaca dos desportistas quanto à assimetria; e) Indique o valor da frequência cardíaca em relação ao qual 60% dos elementos da amostra são superiores a esse valor; 14. Uma empresa organiza actividades desportivas para outras empresas e particulares. Os gestores desta empresa recentemente implantada no mercado realizaram, ao fim de 2 anos de exercício, um balanço das receitas obtidas em cada mês (em milhares de euros). Obtiveram, assim, a seguinte representação gráfica: 9 8 7 6 5 4 3 frequências absolutas 2 1 0 [8,9[ [9,10[ [10,11[ [11,12[ [12,13[ [13,14[ milhares de euros a) Resuma os dados obtidos na forma de uma tabela de frequências, a partir do histograma anterior. b) Qual a percentagem de meses em que os lucros da empresa foram inferiores a 10500 euros? ESTATÍSTICA Ficha de exercícios 1 2007/2008 5
c) Determine os seguintes valores: 1) Média aritmética; 2) Mediana; 3) Moda; 4) Q 0,25, Q 0,75 e Q; 5) Q 0,9 ; 6) Amplitude total; 7) DAM; 8) Variância e desvio padrão; 9) C P, C Y e b 2, e esboce o polígono de frequências subjacente aos dados da amostra supondo que o histograma não é dado. Classifique, justificando, a distribuição dos valores das receitas mensais quanto à assimetria. d) Qual o valor da receita obtida em relação ao qual 75% dos elementos da amostra são inferiores ou iguais a esse valor? e) Indique o valor da receita mensal em relação ao qual existem 18 meses em que os rendimentos são superiores a esse valor. f) Indique uma forma possível de penalização de receitas mensais indesejáveis no cálculo de uma média ponderada desses valores. 15. Usaram-se duas balanças diferentes para efectuar cinco pesagens de uma mesma pessoa, tendo-se obtido os seguintes resultados, em kg: Balança A 71,82 71,86 71,89 71,85 71,84 Balança B 71,85 71,86 71,84 71,85 71,83 a) Calcule a média, o DAM e o desvio padrão para cada um dos grupos de dados; b) Escolha, justificando, das duas balanças aquela que é mais fiável. 16. Num inquérito a famílias portuguesas, referente ao número de filhos a cargo de cada família, obtiveram-se os seguintes resultados: Número de filhos 0 1 2 3 4 5 6 7 8 Número de famílias 7 18 27 33 40 65 29 18 13 a) Indique a variável estatística e classifique-a; b) Calcule a média, mediana e moda do número de filhos a cargo de cada família; c) Determine a variância e o desvio padrão; d) Esboce a Box-plot referente aos valores observados. ESTATÍSTICA Ficha de exercícios 1 2007/2008 6
i 17. Um nadador pretende atingir os mínimos necessários para participar nos J.O. de Atenas, na modalidade de 100m mariposa. Para tal, nos últimos meses tem efectuado um treino intensivo, durante os quais o seu treinador registou o record diário (em segundos) obtido pelo desportista. São conhecidos os valores relativos à última semana de treino: record diário dia (seg.) 1 34.3 2 29.6 3 32,1 4 31.3 5 29.7 6 30.4 7 33.3 a) Agrupe adequadamente os valores obtidos pelo desportista, apresentando os dados na forma de um quadro de frequências (sugestão: arredonde o valor da amplitude de classe para as décimas). b) Represente através de um histograma simples os dados obtidos. c) Em média, qual o tempo que o desportista leva a concluir 100m mariposa? Calcule também a mediana dos valores atingidos pelo desportista. d) Indique o valor do tempo obtido pelo nadador, em relação ao qual 85% dos elementos da amostra são superiores a esse valor. e) Esboce a Box-plot relativa aos dados em estudo. f) Determine as seguintes medidas de dispersão dos valores conhecidos: desvio absoluto médio e desvio padrão. g) O empresário do treinador aconselhou-o a treinar outro desportista: um maratonista, em relação ao qual se sabe que, na última semana, percorreu uma média de 10,2km, com um desvio padrão de 1km. Qual dos desportistas o treinador deverá optar por representar? 18. Uma empresa que promove actividades desportivas registou, em cada mês do último ano fiscal, a quantidade de quilómetros percorrida (necessária à organização dos eventos a seu cargo). O histograma seguinte resume os dados obtidos: 5 4 3 n 2 1 0 [0,700[ [700, 1400[ [1400, 2100[ [2100, 2800[ [2800, 3500[ Km's percorridos a) A partir do histograma anterior, resuma os dados obtidos na forma de um quadro de frequências. b) Determine os valores das seguintes medidas relativas à quantidade de quilómetros percorrida mensalmente: média, mediana, moda e desvio-padrão. ESTATÍSTICA Ficha de exercícios 1 2007/2008 7
c) Indique o valor da distância mensal percorrida, em relação ao qual existem 9 meses em que os rendimentos são superiores a esse valor. d) Esboce a Box-plot relativa aos dados em estudo. 19. Durante a corrente pré-época as equipas da Super Liga preparam alguns índices físicos intensamente. O histograma seguinte representa as medições efectuadas a 30 futebolistas de uma dessas equipas, relativamente à concentração de lactato no sangue (CLS) após um dia de treino específico de início de época: 0,4 0,3 i f 0,167 0,067 0 [6, 9[ [9, 12[ [12, 15[ [15, 18[ [18, 21[ concentração de lactato no sangue (m mol/l) a) A partir do histograma anterior, resuma os dados obtidos na forma de um quadro de frequências. b) Determine os valores das seguintes medidas relativas à CLS dos jogadores: média, mediana, moda e desvio-padrão. c) Indique uma forma possível de penalização de CLS s indesejáveis no cálculo de uma média ponderada desses valores. d) Indique o valor da CLS, em relação ao qual existem 9 desportistas com CLS superior a esse valor. 20. Um desportista de alta competição encontra-se sob observação. Diariamente efectua diversos testes, que determinam um índice de condição física (ICF) variável entre 0 e 10. Organizou-se a informação obtida durante os últimos dias na seguinte tabela de frequências: ICF n i N i f i F i [2, 4[ 3 N 1 f 1 F 1 [4, 6[ n 2 15 0,6 F 2 [6, 8[ n 3 N 3 f 3 1 n 1 a) Complete a tabela de frequências, determinando os valores de N 1, f 1, F 1, n 2, F 2, n 3,N 3, f 3 e n. b) Determine a média aritmética e o desvio padrão dos valores do ICF que o desportista obteve. c) Indique o valor do ICF obtido pelo desportista, em relação ao qual um terço dos elementos da amostra são superiores a esse valor. ESTATÍSTICA Ficha de exercícios 1 2007/2008 8
Considerando os ficheiros dados_cd.xls e/ou dados_cd.sav, resolva os exercícios que se seguem utilizando o Excel e/ou SPSS. 21. Classifique as variáveis em estudo. 22. Elabore a tabela de frequências de cada uma das seguintes variáveis: cond_fis, prat_d salario. 23. Represente graficamente os valores observados de cada uma das variáveis indicadas na pergunta anterior. 24. Suponha que uma empresa pretende classificar os indivíduos acima ou abaixo de um limiar de «pobreza» de 800 /mês (inclusive). Assim, com base na variável salario", construiu-se uma nova variável limiar que assume dois valores possíveis: abaixo ou acima, conforme o salário dos indivíduos relativamente ao valor de referência de 800. As frequências absolutas são de 38 e 54, respectivamente, e os valores omissos são os mesmos da variável salario. Represente a informação anterior através de uma tabela de frequências considerando apenas os casos válidos. 25. Encontre os valores das medidas de localização, dispersão, assimetria e achatamento dos valores observados de cada uma de todas as variáveis possíveis. Considerando os ficheiros dados_trabalho_cd_0607.xls e/ou dados_trabalho_cd_0607.sav, resolva os exercícios que se seguem utilizando o Excel e/ou SPSS. As variáveis em estudo são: Idade (anos); sexo (F ou M); altura (cm, arredondamento às décimas); peso (Kg, arredondamento às décimas); imc índice de massa corporal (Kg/m 2, arredondamento às décimas); vo2max volume de oxigénio máximo por minuto e por quilo (ml/min/kg, arredondamento às décimas); apd ambiente de prática desportiva (não pratica, ginásio, ar livre ou ambos); fumador (S, sim, ou N, não); neaf número de elementos do agregado familiar; rmaf rendimento mensal do agregado familiar (, arredondamento às unidades); ncaf número de computadores do agregado familiar; distrito capital de distrito onde reside. 26. Com base nos dados fornecidos, construa uma amostra de 50 indivíduos através de um método de amostragem adequado. ESTATÍSTICA Ficha de exercícios 1 2007/2008 9
Nota importante: todas as alíneas seguintes deverão ser feitas considerando a amostra obtida na questão 26. 27. Seleccionando três variáveis de diferentes tipos, construa as tabelas de frequências respectivas. 28. Apresente graficamente os valores observados das variáveis seleccionadas na questão anterior, na(s) forma(s) que achar mais conveniente(s) e/ou representativa(s). 30. Encontre e interprete os valores das medidas de localização, dispersão, assimetria e achatamento dos valores observados de cada uma das variáveis seleccionadas na questão 27. ESTATÍSTICA Ficha de exercícios 1 2007/2008 10