Licenciatura em GRH Tratamento de informação 2010-2011 TI-GRH : Exercícios de Estatística Descritiva II Docente: Margarida Cardoso ESTATÍSTICA DESCRITIVA BIVARIADA 1. um estudo sobre transportes, recolheu-se uma amostra de 68 residentes de duas freguesias da cidade de Lisboa e aplicou-se um inquérito por questionário. Uma das questões incidia sobre a implementação de medidas restritivas, em determinadas zonas da cidade de Lisboa, ao nível do transporte individual. Da análise dos resultados, relacionou-se a variável sexo e a opinião manifestada acerca de uma dessas medidas, obtendo-se o seguinte output do SPSS: sexo * opinião Crosstabulation Opinião sexo Masculino Discorda Indeciso Concorda Total 17 12 8 37 45,9% 32,4% 21,6% 100,0% 58,6% 50,0% 53,3% 54,4% Feminino 12 12 7 31 38,7% a) 22,6% 100,0% 41,4% 50,0% 46,7% 45,6% Total 29 24 15 68 42,6% 35,3% 22,1% 100,0% 100,0% 100,0% 100,0% 100,0% a) Interprete os valores assinalados no quadro e calcule e interprete a). b) Comente a afirmação: 11,8% dos inquiridos concordam com a medida e são do sexo masculino. c) Indique o tipo e o nível de medida das duas variáveis em questão. Justifique. d) O gráfico nº1 representa o cruzamento das duas variáveis. Interprete-o e diga se o considera adequado? Justifique. 1
% Gráfico 1 - Sexo por opinião 100% Sexo dos inquiridos Masculino Feminino 75% 50% 25% 0% Discorda Indeciso Concorda e) Com base no output apresentado no quadro nº2, o que pode dizer acerca da intensidade da relação entre as variáveis? Justifique. Quadro nº 2 Symmetric Measures ominal by ominal of Valid Cases a. Phi Cramer's V Valor,077,077 68 2. O quadro seguinte sintetiza a informação relativa à importância de dominar o tratamento informático dos dados (numa escala de 1 a 5 em que 1 = nada importante a 5 = muito importante ) para os formandos segundo a sua formação anterior (já frequentou ou não algum curso de Excel): Dominar tratamento informático dos dados Já frequentou algum curso de Excel Média Desviopadrão Mediana Skewnes s Sim 88 2,91,967 3,00,185 ão 12 3,58,996 4,00 -,274 Total 100 2,99,990 3,00,148 a) Analise as medidas apresentadas no quadro procurando evidenciar as diferenças de opinião entre os formandos com e sem formação em Excel. b) Comente a afirmação: a dispersão nas opiniões é mais acentuada nos formandos que não frequentaram cursos de Excel. 2
c) Se pretendesse representar graficamente a relação existente entre ter curso de Excel e a importância do tratamento informático de dados qual o gráfico que escolheria? Justifique. d) Analise o quadro seguinte (output do SPSS) identificando as variáveis e a medida de associação e interpretando o(s) valor(s) apresentado(s). Diga se considera a medida de associação adequada para avaliar a relação entre as duas variáveis. Justifique. Measures of Association Dominar tratamento informático dos dados * Curso Excel Eta Eta Squared,222,049 3. O gráfico seguinte representa a relação entre as classificações obtidas pelos alunos de duas turmas do 1º ano de PSO, do ISCTE, no trabalho de grupo e na frequência de Estatística I. 20 18 16 14 12 10 8 6 8 10 12 14 16 18 20 a) Identifique o gráfico e tire as conclusões que lhe parecerem pertinentes acerca da relação entre as duas variáveis, justificando a sua resposta. b) Com o objectivo de medir a intensidade da relação entre a e a ota da frequência, pediram-se as duas análises seguintes, identificadas com Opção A e Opção B. Diga, justificando, qual delas lhe parece a mais adequada e interprete o resultado obtido. Opção A Correlations Spearman's rho Correlation Coefficient Correlation Coefficient **. Correlation is significant at the 0.01 level (2-tailed). ota do ota da trabalho frequência 1,000,727**.,000 28 27,727** 1,000,000. 27 27 Opção B 3
Correlations Pearson Correlation Pearson Correlation **. Correlation is significant at the 0.01 level (2-tailed). ota do ota da trabalho frequência 1,796**.,000 28 27,796** 1,000. 27 27 4. Uma empresa de formação está a avaliar o impacto de um curso na classificação dos seus formandos em provas públicas. Como comentaria a afirmação o curso em questão não desenvolve as capacidades dos formandos - tendo em conta os dados seguintes: Formandos lugar na classificação antes de formação lugar na classificação depois de formação 1 12 12 2 10 5 3 9 6 4 14 9 5 8 8 6 11 4 7 13 7 5. Um banco está a analisar a relação entre o rendimento familiar anual (X) e o valor dos imóveis (Y) num conjunto de operações de crédito à habitação. Em 6 dessas operações registou os dados seguintes: Rendimento familiar (u.m.) Valor do imóvel (u.m.) 6,2 25,6 6,3 29,0 8,5 77,2 9,1 89,2 10 85,0 12 82,5 Sabendo que x i =52,1, y i =388,5, x 2 i =477,19, y 2 i=29444,09 a) Determine o valor da covariância e do coeficiente de correlação linear entre X e Y. b) Escreva a equação da recta de regressão linear de Y sobre X, correspondente aos dados disponíveis. c) Utilizando o modelo em b) determine uma estimativa do valor do imóvel para uma família com um rendimento de 7 u.m. 4
6. O número de pontos ganhos ao concluir um certo jogo (Y) depende da experiência do jogador, medida em horas de jogo (X). Usando um modelo de regressão linear aponte uma previsão do número de pontos ganho por um indivíduo que tem uma experiência de 11h de jogo dispondo dos dados da seguinte amostra de 5 indivíduos (ote que se tem y i =121, x i =38, y 2 i = 3555 e x 2 i =350) úmero de pontos Horas de jogo 32 10 15 3 25 9 40 12 9 4 7. a análise de vendas de lojas de acessórios pretende-se analisar se as vendas dependem das lojas consideradas, nomeadamente para a loja A. Os dados disponíveis apresentam-se a seguir: loja A outra Jan 15 10 Fev 14 12 Mar 16 11 Abr 13 10 Mai 10 9 Jun 15 13 Jul 8 Ago 7 Set 8 Out 9 ov 10 Dez 6 a) Interprete o resultado seguinte (output SPSS) vendas * loja_a Measures of Association Eta Eta Squared,732,535 b) Estime um modelo de regressão simples entre as vendas e as lojas e interprete os resultados obtidos. Que precisão antecipa para o referido modelo? 5