ANÁLISE DE DADOS: DÉCIMA LISTA DE EXERCÍCIOS

Documentos relacionados
Seção 2.3 Uma Variável Quantitativa: Medidas de Dispersão

TRATAMENTO DA INFORMAÇÃO/ANÁLISE DE DADOS AULA 10. Universidade Federal Fluminense

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Notas de Aula. Estatística Elementar. by Mario F. Triola. Tradução: Denis Santos

Capítulo 3 Estatísticas para Descrição, Exploração e Comparação de Dados. Seção 3-1 Visão Geral. Visão Geral. Estatísticas Descritivas

Medidas de dispersão. 23 de agosto de 2018

Introdução à Bioestatística

Descrevendo Distribuições com Números TADI

Estatística Descritiva

ESTATÍSTICA BÁSICA. 01 A tabela abaixo representa os salários pagos a 150 operários da empresa P&E Ltda. Nº de salários mínimos

Estatística Descritiva. Objetivos de Aprendizagem. 6.1 Sumário de Dados. Cap. 6 - Estatística Descritiva 1. UFMG-ICEx-EST. Média da amostra: Exemplo:

Estatística Descritiva

Estatística Descritiva

Bioestatística CE001 Prof. Fernando de Pol Mayer Departamento de Estatística DEST Exercícios: medidas resumo Nome: GABARITO

CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte

Mas, para começar a aplicar métodos estatísticos, é preciso conhecer alguns conceitos básicos.

Para caracterizar um conjunto de dados é importante não só a média, mas também a dispersão dos valores em torno da média

Estatística Descritiva

Estatísticas Descritivas. Estatística

Matemática. Quartis. Professor Dudan.

Universidade Federal de Lavras Departamento de Estatística Prof. Daniel Furtado Ferreira 4 a Aula Prática Medidas de Dispersão

(a) Use cinco intervalos e construa um histograma e o polígono de frequência. (b) Determine uma medida de posição central e uma medida de dispersão.

1. Registou-se o número de assoalhadas de 100 apartamentos vendidos num bairro residencial

Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM

Estatística Descritiva

ASSUNTO: ESTATÍSTICA COM DADOS AGRUPADOS

UNIDADE III ESTUDO DIRIGIDO

Excel INTERMEDIÁRIO Estatística. Prof. Cassiano Isler Turma 3

Profa. Janaina Fracaro Engenharia Mecânica 2015

PARTE 2- MEDIDAS DE TENDÊNCIA CENTRAL VERSÃO: MARÇO DE 2017

Lista de exercicios 1 Prof.: Marcus Guimaraes Disciplina: Introdução a Estatística Econômica

AULA DO CPOG. Estatística básica

Estatística

Universidade Federal de Lavras Departamento de Ciências Exatas Prof. Daniel Furtado Ferreira 4 a Aula Prática Medidas de Dispersão

TADI Tratamento e Análise de Dados/Informações Prof. Camilo Rodrigues Neto

Estatística Aplicada a Negócios

ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

ESTATÍSTICA. Estatística é o conjunto de métodos para a obtenção, organização, resumo, análise e interpretação dos dados.

DISCIPLINA: ESTATÍSTICA I (CÓD. ENEC60015) PERÍODO: 3º PERÍODO

SCC0173 Mineração de Dados Biológicos

2 - Gráfico de Caixa - BoxPlot

Fernando de Pol Mayer

Distribuição de frequências:

Introdução à Probabilidade e Estatística I

Unidade III Medidas Descritivas

Capítulo 5 Distribuições de probabilidade normal Pearson Prentice Hall. Todos os direitos reservados.

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

Matemática Ensino Médio Anotações de aula Estatística Marco Polo

Estatística I Aula 3. Prof.: Patricia Maria Bortolon, D. Sc.

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

Aula 03: Dados Profa. Ms. Rosângela da Silva Nunes

Medidas de Variação ou Dispersão

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

Medidas de Tendência Central

GET00116 Fundamentos de Estatística Aplicada Turma C1 Lista de Exercícios 1/2018 Profa. Ana Maria Farias

Bioestatística. Luiz Ricardo Nakamura Cristiane Mariana Rodrigues da Silva. Ciências biológicas a USP ESALQ. Estatística

Estatística. O que é: Conceitos: Divisão da estatística: 2. Estatística indutiva

Elementos de Estatística

ESTATÍSTICA. PROF. RANILDO LOPES U.E PROF EDGAR TITO

12/06/14. Estatística Descritiva. Estatística Descritiva. Medidas de tendência central. Medidas de dispersão. Separatrizes. Resumindo numericamente

Amostragem Aleatória e Descrição de Dados - parte I

Métodos Quantitativos Aplicados a Gestão

Lista de Exercícios de estatística

Medidas de Tendência Central

MAE Introdução à Probabilidade e Estatística I 2 o semestre de 2017 Gabarito da Lista de Exercícios 2 - Estatística Descritiva II - CASA

Revisão de estatística descritiva

PARTE 3- MEDIDAS DE DISPERSÃO VERSÃO: MARÇO DE 2017

Estatística Aplicada. UNIVERSIDADE ESTÁCIO DE SÁ-RECIFE 2013 Prof: Wildson Cruz

GRÁFICOS ESTATÍSTICOS

um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de

Ficha de Trabalho nº 11 Matemática 7º ano Maio / 2011 INTRODUÇÃO AO ESTUDO DA ESTATÍSTICA

Prof. Dr. Lucas Santana da Cunha de abril de 2018 Londrina

Universidade Federal Fluminense INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA

Lista de Exercícios Cap. 2

Métodos Estatísticos Básicos

AGRUPAMENTO DE ESCOLAS DE VILA VIÇOSA GRUPO DE MATEMÁTICA ANO LECTIVO 2018 / 2019 MATEMÁTICA APLICADA ÀS CIÊNCIAS SOCIAIS 10º ANO

Tutorial para o desenvolvimento das Oficinas

Medidas de tendência central,dispersão, posição, associação e boxplot

AMEI Escolar Matemática 8º Ano Estatística: Organização e Tratamento de Dados

Medidas de Dispersão. Prof.: Joni Fusinato

1 Estatística Descritiva

Prof. Dr. Engenharia Ambiental, UNESP

Seção 2.1. Distribuições de freqüência e seus gráficos

Revisão de estatística descritiva

Distribuição Normal. Prof a Dr a Alcione Miranda dos Santos. Abril, 2011

Medidas de Centralização

SME0123 Estatistica ICMC-USP Ricardo Ehlers Lista 1

PLANIFICAÇÃO. 2007/2008 Matemática Aplicada às Ciências Sociais 1º ano. Blocos previstos

Introdução à Bioestatística Turma Nutrição Aula 3 Análise Descritiva: Medidas de Tendência Central Medidas de Variabilidade

SME0320 Estatistica ICMC-USP Ricardo Ehlers Lista 1

3 Estatística p/ Descrição, Exploração e Comparação de Dados (Triola 10 a ed.)

CC-226 Introdução à Análise de Padrões

Medidas Estatísticas NILO FERNANDES VARELA

Conceito de Estatística

PLANO DE ENSINO E APRENDIZAGEM

IND 1115 Inferência Estatística Aula 7

Transcrição:

ANÁLISE DE DADOS: DÉCIMA LISTA DE EXERCÍCIOS Humberto José Bortolossi AMPLITUDES E AMPLITUDES INTERQUARTÍLICAS [47] Para o conjunto de dados (3, 5, 7, 4, 8, 2, 8, 3, 6), (a) calcule sua amplitude e (b) calcule sua amplitude interquartílica (veja o Exercício [33]). [48] Para o conjunto de dados ( 3.8, 7.3, 4.5, 8.3, 8.3, 9.1, 3.8, 13.2), (a) calcule sua amplitude e (b) calcule sua amplitude interquartílica (veja o Exercício [34]). [49] Uma companhia imobiliária vendeu N = 341 casas no último ano. O resumo dos cinco números para os preços de venda é dado por Min = US$97.000,00, Q 1 = US$ 115.000,00, M = US$143.000,00, Q 3 = US$156.000,00 e Max = US$249.000,00. (a) Calcule a amplitude interquartílica para os preços de venda. (b) Quantas casas foram vendidas por um preço entre US$115.000,00 e US$156.000,00 (inclusive)? Nota: se você acredita que não existem dados suficientes para dar uma resposta exata, dê sua resposta na forma pelo menos... ou no máximo.... [50] Este exercício se refere aos salários iniciais dos formandos em agronomia e engenharia da Universidade Estadual da Tasmânia discutidos nos Exercícios [45] e [46]. (a) Estime a amplitude dos salários iniciais dos formandos em agronomia e engenharia. (b) Estime a amplitude interquartílica dos salários iniciais em agronomia e engenharia. (c) Existem 612 formandos em engenharia. Determine quantos salários iniciais dos formandos em engenharia estavam entre Q 1 = US$35.000,00 e Q 3 = US$43.500,00 (inclusive). Nota: se você acredita que não existem dados suficientes para dar uma resposta exata, dê sua resposta na forma pelo menos... ou no máximo.... Para os Exercícios [51] e [54], você deve usar a seguinte definição de um outlier: um outlier é qualquer dado cujo valor está acima do terceiro quartil por mais de 1,5 vezes o IQR (outlier > Q 3 + 1,5 IQR) ou abaixo do primeiro quartil mais do que 1.5 vezes o IQR (outlier < Q 1 1,5 IQR). Nota: não existe uma definição universalmente aceita para um outlier: esta é uma entre as várias definições (critério de Chauvenet, critério de Peirce, teste de Grubbs, teste Q de Dixon, ASTM) usadas por estatísticos. [51] Suponha que a definição precedente de outlier seja aplicada aos conjuntos de dados do Exemplo 14.16. (a) Complete corretamente o espaço em branco: qualquer pontuação maior do que ou igual a é um outlier. (b) Complete corretamente o espaço em branco: qualquer pontuação menor do que ou igual a é um outlier. (c) Calcule os outliers (se é que eles existem) do conjunto de dados do Exemplo 14.16. [52] Usando a definição precedente, calcular os outliers (se é que eles existem) dos dados da distribuição das idades dos bombeiros da cidade de Cleansburg (Exercícios [30] e [37]). Dica: faça o Exercício [37] primeiro. [53] A distribuição das alturas (em polegadas) dos homens norte-americanos com 18 anos tem primeiro quartil Q 1 = 67 polegadas e terceiro quartil Q 3 = 71 polegadas. Usando a definição precedente, determine quais alturas correspondem a outliers. [54] A distribuição das alturas (em polegadas) das mulheres norte-americanas com 18 anos tem primeiro quartil Q 1 = 62,5 polegadas e terceiro quartil Q 3 = 66 polegadas. Usando a definição precedente, determine quais alturas correspondem a outliers. 1

DESVIOS PADRÕES O propósito dos Exercícios [55] a [58] é praticar o cálculo dos desvios padrões usando a definição. Certamente o cálculo dos desvios padrões com lápis e papel não é a maneira como ele é normalmente feito na prática: uma boa calculadora ou um software pode fazer este cálculo mais rapidamente e com mais precisão. O ponto aqui é que calcular alguns desvios padrões com lápis e papel irá lhe ajudar a entender o conceito um pouco melhor. Se você usar uma calculadora ou um computador para responder a estes exercícios, então você estará se desviando do propósito. [55] Calcule o desvio padrão de cada um dos seguintes conjuntos de dados. (a) (5, 5,5, 5). (b) (0, 5, 5, 10). (c) (0, 10, 10, 20). [56] Calcule o desvio padrão de cada um dos seguintes conjuntos de dados. (a) (3, 3, 3, 3). (b) (0, 6, 6, 8). (c) ( 6, 0, 0, 18). [57] Calcule o desvio padrão de cada um dos seguintes conjuntos de dados. (a) (0, 1, 2, 3, 4, 5, 6, 7, 8, 9). (b) (1, 2, 3, 4, 5, 6, 7, 8, 9, 10). (c) (6, 7, 8, 9, 10, 11, 12, 13, 14, 15). [58] Calcule o desvio padrão de cada um dos seguintes conjuntos de dados. (a) ( 3, 2, 1, 0, 1, 2, 3). (b) ( 2, 1, 0, 1, 2, 3, 4). (c) (0, 1, 2, 3, 4, 5, 6, 7). OUTROS EXERCÍCIOS A moda. A moda de um conjunto de dados é o dado que ocorre com maios frequência. Quando existem vários dados (ou categorias de dados) com a mesma maior frequência, cada um deles é uma moda. Por outro lado, se todos os dados possuem a mesma frequência, ao invés de dizer que cada dado é uma moda, é usual dizer que o conjunto de dados não possui moda (ou que ele é amodal). Nos Exercícios [59] a [64] você deve calcular a moda ou modas dos conjuntos de dados apresentados. Se não existe moda, sua resposta [59] Calcula a moda do conjunto de dados na Tabela 14-13 (Exercícios [05] e [06]). [60] Calcule a moda do conjunto de dados na Tabela 14-19 (Exercício [30]). [61] Calcule a moda do conjunto de dados apresentado na Figura 14-20. Se não existe moda, sua resposta Figura 14-20 [62] Calcule a moda do conjunto de dados apresentado na Figura 14-21. Se não existe moda, sua resposta 2

Figura 14-21 [63] Calcule a moda do conjunto de dados apresentado na Figura 14-22. Se não existe moda, sua resposta Figura 14-22 [64] Calcule a moda do conjunto de dados apresentado na Figura 14-23. Se não existe moda, sua resposta Figura 14-22 EXERCÍCIOS INTERMEDIÁRIOS [65] A média de Mike nos primeiros cinco exames de economia foi igual a 88. Qual deve ser a nota de Mike no próximo exame para que sua média seja igual a 90? [66] A média de Sarah em física foi de 93 pontos. Sua média foi calculada a partir de quatro exames, cada um com peso 1 valendo 100 pontos e um exame final com peso 2 valendo 200 pontos. Qual é a menor pontuação possível que Sarah poderia ter obtido no primeiro exame? 3

[67] Em 2006, a mediana dos resultados do teste SAT foi a média entre d 732.872 e d 732.873, onde d 1 d 2... d N representam os resultados do teste ordenados da menor para a maior pontuação. Determine o número N de estudantes que fizeram o teste SAT em 2006. [68] Em 2004, o terceiro quartil dos resultados do teste SAT foi d 1.064.256, onde d 1 d 2... d N representam os resultados do teste ordenados da menor para a maior pontuação. Determine o número N de estudantes que fizeram o teste SAT em 2004. [69] (a) Dê um exemplo de 10 números cuja média seja menor do que a mediana. (b) Dê um exemplo de 10 números cuja mediana seja menor do que a média. (c) Dê um exemplo de 10 números cuja média seja menor do que o primeiro quartil. (d) Dê um exemplo de 10 números cuja média seja maior do que o terceiro quartil. [70] Suponha que a média de 10 números seja igual a 7,5 e que o menor deles seja igual a Min = 3. (a) Qual é o menor valor possível de Max? (b) Qual é o maior valor possível de Max? [71] Este exercício se refere à folha de pagamento dos times da Primeira Divisão da Liga de Beisebol em 2008, conforme a Figura 14-24 (Este é a Figura 14-18 nos Exercícios [21] e [22]). Usando as informações da figura, pode-se determinar que a mediana da folha de pagamento de 2008 está entre US$70.000.000,00 e US$80.000.000,00. Explique como. [72] Um conjunto de dados é denominado constante se todos os dados são iguais. Explique por que qualquer conjunto de dados com desvio padrão igual a zero deve ser constante. Os Exercícios [73] e [74] referem-se a histogramas com intervalos de classe de tamanhos diferentes. Ao desenhar tais histogramas, as colunas devem ser desenhadas de modo que as frequências ou percentagens são proporcionais às áreas da coluna. A Figura 14-25 ilustra isto. 4

Se a coluna sobre o intervalo de classe 1 representa 10% da população, então a coluna sobre o intervalo de classe 2, também representando 10% da população, deve ter um terço da altura, uma vez que o seu intervalo de classe é três vezes mais largo (Figura 14-25). [73] Se a altura da coluna sobre o intervalo de classe 20 30 é igual a uma unidade e se esta coluna representa 25% da população, então (a) Qual deve ser a altura da coluna sobre o intervalo de classe 30 35 se 50% da população está neste intervalo de classe? (b) Qual deve ser a altura da coluna sobre o intervalo de classe 35 45 se 10% da população está neste intervalo de classe? (c) Qual deve ser a altura da coluna sobre o intervalo de classe 45 60 se 15% da população está neste intervalo de classe? [74] Duzentos cidadãos fizeram um teste de aptidão física e eles foram classificados de acordo com o tempo que levaram para caminhar uma milha. Estas classificações e as frequências associadas estão descritas na Tabela 14-22. Desenhe um histograma para estes dados com base nas categorias definidas pelas classificações na tabela. [75] (Paradoxo de Simpson) A mídia acusou a Universidade Estadual da Tasmânia de discriminar mulheres no seu processo de admissão para os programas de pós-graduação em arquitetura e engenharia. O Jornal da Tasmânia afirma que 68% de todos os homens que se inscreveram nos programas de pós-graduação em arquitetura ou engenharia foram admitidos, enquanto que apenas 51% das mulheres que se inscreveram para os mesmos programas foram admitidas. Os dados estão indicados na Tabela 14-23. (a) Qual é a percentagem de homens que se inscreveram em arquitetura que foram admitidos? Qual é a percentagem de mulheres que se inscreveram na mesma escola que foram admitidas? (b) Qual é a percentagem de homens que se inscreveram em engenharia que foram admitidos? Qual é a percentagem de mulheres que se inscreveram na mesma escola que foram admitidas? (c) Como o Jornal da Tasmânia obteve os números que apresentou em sua reportagem? (d) Explique como é possível que os resultados em (a) e (b) e a afirmação do Jornal da Tasmânia estejam todos corretos. [76] O que acontecerá com o resumo dos cinco números para o conjunto de dados do Exemplo 14.16 se (a) dois pontos forem acrescentados a cada pontuação? (b) 10% for acrescentado a cada pontuação (isto é, cada pontuação é multiplicada por 1,1)? [77] Seja A a média do conjunto de dados (x 1, x 2, x 3,..., x N ). (a) Calcule a média do conjunto de dados (x 1 + c, x 2 + c, x 3 + c,..., x N + c). (b) Use os resultados do Item (a) para explicar por que a média de (x 1 A, x 2 A, x 3 A,..., x N A) é zero. Nota: o conjunto de dados (x 1 A, x 2 A, x 3 A,..., x N A) representa o conjunto de desvios em relação a média. [78] Seja M a mediana do conjunto de dados (x 1, x 2, x 3,..., x N ). Calcule a mediana do conjunto de dados (x 1 + c, x 2 + c, x 3 + c,..., x N + c). Explique sua resposta. 5

[79] Explique por que os conjuntos de dados (x 1, x 2, x 3,..., x N ) e (x 1 + c, x 2 + c, x 3 + c,..., x N + c) possuem (a) a mesma amplitude e (b) o mesmo desvio padrão. Dica: tente resolver os Exercícios [57] e [58] primeiro. EXERCÍCIOS AVANÇADOS [80] Considere um conjunto de dados de 10 números com Min = 2, Max = 12 e média A = 7. Seja σ o desvio padrão deste conjunto. (a) Qual é o menor valor possível para σ? (b) Qual é o maior valor possível para σ? [81] Mostre que o desvio padrão de qualquer conjunto de números é sempre menor do que ou igual à amplitude estes números. [82] Mostre que se (x 1, x 2, x 3,..., x N ) é um conjunto de dados com média A e desvio padrão σ, então σ N 1/2 x i A para todo i. (b) Use o Item (a) para mostrar que todo dado é maior do que ou igual a A σ N 1/2 e é menor do que ou igual a A + σ N 1/2, isto é, todo dado x é tal que A σ N 1/2 x A + σ N 1/2. [83] (a) Dados dois números A e σ > 0, encontre dois outros números (expressos em termos de A e σ) cuja média é A e cujo desvio padrão é σ. (b) Encontre três números igualmente espaçados cuja média é A e cujo desvio padrão é σ. (c) Generalize o resultado anterior encontrando N números igualmente espaçados cuja média é A e cujo desvio padrão é σ. Dica: considere os casos em que N é par e N é ímpar separadamente. [84] Mostre que se A é média e M é a mediana do conjunto de dados (1, 2, 3,..., N), então A = M para todos os valores de N. [85] Mostre que se A é média e M é a mediana de um conjunto de dados consistindo dos primeiros N termos de uma progressão aritmética, então A = M. [86] Suponha que a média dos números x 1, x 2, x 3,..., x N seja igual a A e que a variância desses mesmos números seja igual a V. Suponha também que a média dos números (x 1 ) 2, (x 2 ) 2, (x 3 ) 2,..., (x N ) 2 seja igual a B. Mostre que V = B A 2. Em outras palavras, para qualquer conjunto de dados, se calcularmos a média dos valores dos dados ao quadrado e subtrairmos o quadrado da média dos valores, obtemos a variância. [87] Suponha que o desvio padrão do conjunto de dados (x 1, x 2, x 3,..., x N ) seja igual a σ. Explique por que o desvio padrão do conjunto de dados (a x 1, a x 2, a x 3,..., a x N ) é igual a a σ, onde a é uma constante positiva. [88] Usando que 1 2 + 2 2 + 3 2 +... + N 2 = N (N + 1) (2 N + 1)/6, (a) calcule o desvio padrão do conjunto de dados (1, 2, 3,..., 98, 99) (dica: use o Exercício [85]), (b) calcule o desvio padrão do conjunto de dados (1, 2, 3,..., N). [89] (a) Calcule o desvio padrão do conjunto de dados (315, 316,..., 412, 413). Dica: use os Exercícios [79] (b) e [88]. (b) Calcule o desvio padrão do conjunto de dados (k + 1, k + 2,..., k + N). [90] Teorema de Chebyshev. O matemático russo P. L. Chebyshev (1821-1894) mostrou que para qualquer conjunto de dados e para qualquer constante k maior do que 1, pelo menos 1 (1/k 2 ) dos dados deve estar entre k desvios padrões em cada lado da média A. Por exemplo, quando k = 2, o teorema nos diz que 1 1/4 = 3/4 (isto é, 75%) dos dados deve estar entre dois desvios padrões de cada lado de A (isto é, entre A 2 σ e A + 2 σ). (a) Usando o teorema de Chebyshev, qual é a percentagem de dados que deve estar entre três desvios padrões de cada lado da média? (b) Quantos desvios padrões em cada lado da média devemos considerar a fim de garantir a inclusão de 99% dos dados? (c) Suponha que a média de um conjunto de dados seja igual a A. Explique por que não existe um número k de desvios padrões para o qual podemos ter certeza de que 100% dos dados estão entre k desvios padrões em cada lado da média A. ATIVIDADE ELETRÔNICA (OBRIGATÓRIA) [01] Preencha os campos da Aula 10 da planilha eletrônica Análise de Livros Didáticos do Google Drive, informando: (a) A coleção que você analisou define o que é uma moda em Estatística? Em caso afirmativo, qual é a definição dada? (b) A coleção que você analisou discute outliers? Em caso afirmativo, qual é a definição dada? A coleção apresenta exemplos? 6