Aula 6 - Questões Comentadas e Resolvidas

Documentos relacionados
André Arruda e Rafael Medeiros

CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte

Estatística Descritiva

Medidas de Tendência Central

AULA 2 UNIDADE 1 DISTRIBUIÇÃO DE FREQUÊNCIAS 1.1 INTRODUÇÃO

Fernando de Pol Mayer

ESTATÍSTICA COMPUTACIONAL AULA 5 ASSIMETRIA E CURTOSE

Bioestatística. October 28, UFOP October 28, / 57

ESTATÍSTICA. Estatística é o conjunto de métodos para a obtenção, organização, resumo, análise e interpretação dos dados.

Elementos de Estatística

Distribuição de frequências:

Métodos Quantitativos Aplicados a Gestão

Estatística Aplicada

Estatística Computacional Profª Karine Sato da Silva

Probabilidade e Estatística. Medidas de Tendência Central. Cláudio Henrique Albuquerque Rodrigues, M. Sc.

Sumário. Estatistica.indb 11 16/08/ :47:41

Estatística. 1 Medidas de Tendência Central 2 Medidas de Posição 3 Medidas de Dispersão. Renata Souza

Medidas de Tendência Central. Introdução Média Aritmética Moda Mediana Análise de Assimetria Separatrizes

AULA 5 MEDIDAS DESCRITIVAS DOCENTE: CIRA SOUZA PITOMBO

As outras medidas de posição são as separatrizes, que englobam: a própria mediana, os decis, os quartis e os percentis.

n = 25) e o elemento (pois = 19) e terá o valor 8. Verifique que antes e depois do 19 o elemento, teremos 18 elementos.

Estatística Descritiva

Métodos Estatísticos Básicos

Estatística I Aula 3. Prof.: Patricia Maria Bortolon, D. Sc.

ESTATÍSTICA Medidas de Síntese

PARTE 2- MEDIDAS DE TENDÊNCIA CENTRAL VERSÃO: JANEIRO DE 2017

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

Bioestatística. Luiz Ricardo Nakamura Cristiane Mariana Rodrigues da Silva. Ciências biológicas a USP ESALQ. Estatística

Medidas de Posição ou Tendência Central

Estatística

Medidas resumo numéricas

Estatística Descritiva. Objetivos de Aprendizagem. 6.1 Sumário de Dados. Cap. 6 - Estatística Descritiva 1. UFMG-ICEx-EST. Média da amostra: Exemplo:

Estatística Descritiva

Introdução à probabilidade e estatística I

Medidas Estatísticas de Posição

CV de VT - Um assunto recorrente em provas da ESAF

MEDIDAS DE TENDÊNCIA CENTRAL

2. Estatística Descritiva

Estatística Descritiva


Estatística Descritiva

PROBABILIDADE E ESTATISTICA. Unidade III Medidas de Posição

Unidade I ESTATÍSTICA APLICADA. Prof. Luiz Felix

PROBABILIDADE E ESTATÍSTICA ESTATÍSTICA DESCRITIVA

Aula 4: Medidas Resumo

Vimos que é possível sintetizar os dados sob a forma de distribuições de frequência e gráficos. Pode ser de interesse apresentar esses dados através d

Aula 00 Aula Demonstrativa

Importantes propriedades da Média, da Variância e do Desvio Padrão:

Introdução à Probabilidade e Estatística I

Introdução à Bioestatística Turma Nutrição Aula 3 Análise Descritiva: Medidas de Tendência Central Medidas de Variabilidade

Métodos Experimentais em Ciências Mecânicas

CE001 Bioestatística. Prof. Cesar Augusto Taconeli. Curitiba-PR 2015

Medidas de Dispersão ou variabilidade

Estatística Descritiva

Prof. Dr. Engenharia Ambiental, UNESP

Medidas de tendência central,dispersão, posição, associação e boxplot

PARTE 2- MEDIDAS DE TENDÊNCIA CENTRAL VERSÃO: MARÇO DE 2017

MAIS SOBRE MEDIDAS RESUMO. * é muito influenciada por valor atípico

MAIS SOBRE MEDIDAS RESUMO. * é muito influenciada por valor atípico

Dados de identificação do Acadêmico: Nome: Login: CA: Cidade: UF Assinatura: CARTÃO RESPOSTA

ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Coeficiente de Assimetria

ESTATÍSTICA PROFESSOR: ALEXSANDRO DE SOUSA

Estatísticas Descritivas. Estatística

Medidas de Dispersão Prof. Walter Sousa

Estatística descritiva básica: Medidas de tendência central

GRÁFICOS ESTATÍSTICOS

Medidas de Tendência Central

Aula 2 MEDIDAS DE TENDÊNCIA CENTRAL E MEDIDAS DE POSIÇÃO

Química e Estatística

NOTAS DE AULA. Medidas Descritivas. Prof.: Idemauro Antonio Rodrigues de Lara

Análise Exploratória e Estimação PARA COMPUTAÇÃO

Universidade Federal de Lavras Departamento de Estatística Prof. Daniel Furtado Ferreira 4 a Aula Prática Medidas de Dispersão

Métodos Quantitativos

Amostragem Aleatória e Descrição de Dados - parte I

INTRODUÇÃO À ESTATÍSTICA

ESTATÍSTICA. PROF. RANILDO LOPES U.E PROF EDGAR TITO

Notas de Aula. Estatística Elementar. by Mario F. Triola. Tradução: Denis Santos

MEDIDAS DE POSIÇÃO. Lucas Santana da Cunha Universidade Estadual de Londrina. 26 de abril de 2017

CAP1: Estatística Descritiva para análise da variabilidade uma amostra de dados quantitativos

Estatística Descritiva

Capítulo 3 Estatísticas para Descrição, Exploração e Comparação de Dados. Seção 3-1 Visão Geral. Visão Geral. Estatísticas Descritivas

Representação de dados

x n 3.3. Medidas descritiva de variáveis quantitativas: Medidas de Posição: Considere uma amostra com n observações: x 1, x 2,..., x n.

Medidas Estatísticas NILO FERNANDES VARELA

Medidas de Centralidade

BIOESTATÍSTICA. Unidade III - Medidas de Tendência Central e de Dispersão

Estatística Descritiva

25/08/2016. Estatística. Estatística. Medidas Estatísticas Medidas de Posição. Mariele Bernardes. Mariele Bernardes

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Medidas de dispersão. 23 de agosto de 2018

3.1 - Medidas de Posição Medidas de Dispersão Quantis Empiricos Box-plots Graficos de simetria 3.

CONCEITOS BASICOS, ORGANIZAÇÃO E APRESENTAÇÃO DOS RESULTADOS, DISTRIBUIÇÃO DE FREQUÊNCIA

Métodos Quantitativos II

Estatística Descritiva

Universidade Federal de Lavras Departamento de Ciências Exatas Prof. Daniel Furtado Ferreira 4 a Aula Prática Medidas de Dispersão

ESTATÍSTICA. PROF. RANILDO LOPES U.E PROF EDGAR TITO

Unidade III Medidas Descritivas

Conceito de Estatística

CURSO DE SPSS AULA 2 MEDIDAS DESCRITIVAS. UFBA/FACED José Albertino Lordello Sheila Regina Pereira

Transcrição:

Aula 6 - Questões Comentadas e Resolvidas Estatística Descritiva. Gráficos, tabelas, séries, tipos de variáveis, distribuições de freqüência, medidas de posição (média, mediana e moda), medidas de dispersão (desvio padrão etc.), medidas de assimetria, medidas de curtose, diagramas de caixa (box plots) e diagrama de ramo-e-folhas. Olá, tudo bem? Esperamos que você esteja aproveitando bastante as nossas aulas de raciocínio lógico-quantitativo. Hoje inicia-se uma nova etapa deste curso, em que aprenderemos, juntos, probabilidade, estatística e análise combinatória, ou simplesmente "estatística", como alguns preferem. Reconhecemos que o assunto não é de fácil compreensão. Um bom aproveitamento desta nova matéria requererá muita dedicação e esforço, o que significará, na prática, que você deverá treinar exaustivamente por meio da resolução dos exercícios. Garantimos que se você treinar, treinar e treinar, o bom desempenho na prova de raciocínio lógico-quantitativo será mera consequência do treinamento. Por outro lado, a tarefa dos professores consistirá em apresentar os elementos sensíveis do assunto, numa ordem sugestiva e com uma distribuição adequada do conteúdo. Nós o incentivamos a perguntar via forum web sempre que tiver dúvidas. Acreditamos que o segredo para ser aprovado em qualquer concurso reside na capacidade de abstrair, que consiste, a rigor, em apreender o essencial e ignorar o incidental, ver o que é significativo e pôr de lado o irrelevante, reconhecer o importante como importante e o negligenciável como negligenciável. Portanto, o importante é que você chegue ao final deste módulo com uma compreensão razoável das ideias fundamentais da estatística que será cobrada na prova. Não tente aprender tudo o que será ensinado de uma só vez. Há que digerir os conceitos. A nossa experiência mostra que quem tenta aprender tudo de uma só tacada não aprende nada. Voltemos ao curso. Aprenderemos estatística através de exercícios até a aula 13 (11/11). É uma longa caminhada (mas valerá a pena, pode estar certo(a) disso!). Não obstante, continuaremos a propor exercícios para revisar os assuntos que foram ensinados até a aula 5 (matemática básica, matemática e raciocínio lógico). Esses exercícios serão propostos ao final da aula, na seção intitulada "Exercícios de Revisão". Na aula 7 (próxima aula) serão propostos exercícios de revisão dos conceitos vistos até a aula 6, e assim sucessivamente. Com esta metodologia, esperamos que você mantenha o treinamento nos tópicos vistos até a aula atual. Vamos começar? Julgue os itens a seguir. 13

1. A estatística descritiva usa os dados de uma amostra para fazer estimativas e testar hipóteses a respeito das características de uma população. O item dá a definição de Inferência Estatística. Aproveitaremos a oportunidade para enunciar os conceitos de população e amostra. POPULAÇÃO Uma população é o conjunto de todos os elementos de interesse em determinado estudo. AMOSTRA Uma amostra é um subconjunto de uma população. GABARITO: Errado 2. A inferência estatística aborda a organização e a descrição dos dados experimentais. O item define a Estatística Descritiva. Detalhemos um pouco mais a definição. A maioria das informações estatísticas publicadas no jornais, revistas, relatórios de empresas, etc., consiste em dados sumariados e apresentados de forma fácil de entender para o leitor. Esses sumários de dados, que podem ser tabulares, gráficos ou numéricos, são conhecidos como Estatística Descritiva. GABARITO: Errado 3. Uma variável estatística será qualitativa quando resultar de uma classificação por tipos ou atributos. A variável será qualitativa quando resultar de uma classificação por tipos ou atributos, como, por exemplo: a) População: moradores de uma cidade. Variável: sexo (masculino ou feminino). b) População: peças produzidas por uma máquina. Variável: qualidade (perfeita ou defeituosa). GABARITO: Certo Profs. Alexandre Lima e.moraes Junior 51

4. Uma variável estatística será quantitativa quando seus valores forem expressos em números. Item certo. As variáveis quantitativas podem ser discretas ou contínuas. Uma variável contínua é aquela cujos possíveis valores pertencem a um intervalo de números reais e que resulta de uma mensuração, como, por exemplo, a estatura de um indivíduo. Uma variável discreta é aquela cujos possíveis valores formam um conjunto finito ou enumerável de números, e que resultam, freqüentemente, de uma contagem. Exemplos de variáveis discretas: a) População: casais residentes em um distrito de uma cidade. Variável: número de filhos. b) População: carros produzidos em uma linha de montagem. Variável: número de defeitos por unidade. Exemplos de variáveis contínuas: a) População: detergentes de uma certa marca e tipo. Variável: peso líquido. b) População: peças produzidas por uma máquina. Variável: diâmetro externo. GABARITO: Certo 5. O rol é um arranjo dos dados brutos. Um rol é um arranjo dos dados em ordem crescente ou decrescente. Assim, {10, 8, 20, 12, 15, 3, 2, 4} são dados brutos e {2, 3, 4, 8, 10, 12, 15, 20} constituem o rol. GABARITO: Errado 6. Série estatística é toda tabela que apresenta um conjunto de dados estatísticos distribuídos em função da época, do local ou da espécie. Profs. Alexandre Lima e.moraes Junior 51

A definição é correta. As séries estatísticas podem ser classificadas em históricas; geográficas; específicas; e distribuição de frequências. Exemplos: 1) Série histórica: Índice Nacional de Preços ao Consumidor Amplo (IPCA) IPCA (%) Jun/2011 0,15 Mai/2011 0,47 Abr/2011 0,77 Mar/2011 0,79 Fev/2011 0,80 Jan/2011 0,83 Dez/2010 0,63 Nov/2010 0,83 Out/2010 0,75 Set/2010 0,45 Ago/2010 0,04 Jul/2010 0,01 Jun/2010 0,00 Fonte: IBGE 2) Série geográfica: os 10 maiores PIB do mundo PIB 2010 País US$ (bilhões) EUA 14.582 China 5.878 Japão 5.497 Alemanha 3.309 França 2.560 Reino Unido 2.246 Brasil 2.087 Itália 2.051 Canadá 1.574 Fonte: Banco Mundial 13

3) Série específica: número de formandos por curso de graduação de uma universidade 4) Distribuição de frequências: NÚMERO DE ALUNOS EGRESSOS - 2010 Cursos N o de egressos Engenharia 100 Direito 250 Administração 150 Economia 50 Contabilidade 50 (*) Valores hipotéticos Altura dos alunos de uma academia ginástica Alturas (m) N o de alunos 1,50 -- 1,60 25 1,60 -- 1,70 45 1,70 -- 1,80 80 1,80 -- 1,90 15 1,90 -- 2,00 5 2,00 -- 2,10 1 (*) Valores hipotéticos A frequência de um dado valor de uma variável (qualitativa ou quantitativa) é definida como o número de vezes que esse valor foi observado. Seja f a frequência do i-ésimo valor observado. Se o número total de elementos observados é n, então vale a relação em que k denota o número de diferentes valores existentes da variável. A associação das respectivas frequências a todos os diferentes valores observados define a distribuição de frequências do conjunto de valores observados. Também podemos trabalhar com a noção de frequência relativa de um valor observado, definida como Profs. Alexandre Lima e.moraes Junior 51

Observe que A distribuição de frequências é o tipo de série mais importante para a prova. Exemplo. Considere a variável comprimento de peças produzidas em uma fábrica, dada em centímetros: 10,4 10,5 10,8 10,2 10,6 10,6 10,2 10,7 10,4 10,5 10,3 10,5 10,4 10,7 10,4 10,9 10,5 10,3 10,6 10,5 10,4 10,5 10,6 10,9 10,7 Na Tabela abaixo, temos os dados acima organizados em termos de frequências e de frequências relativas, simples e acumuladas. x i fi Fi pi Pi 10,2 2 2 0,08 0,08 10,3 2 4 0,08 0,16 10,4 5 9 0,20 0,36 10,5 6 15 0,24 0,60 10,6 4 19 0,16 0,76 10,7 3 22 0,12 0,88 10,8 1 23 0,04 0,92 10,9 2 25 0,08 1,00 25 1,00 A próxima figura é uma representação gráfica das duas primeiras colunas da Tabela acima. É importante que você aprenda a interpretar corretamente o gráfico da figura a seguir. Por exemplo, a frequência 2 associada ao valor 10,3 quer dizer, na verdade, que temos dois valores compreendidos entre os limites 10,25 e 10,35, que foram aproximados, no processo de medição, para 10,3. Portanto, uma representação gráfica correta deverá associar a frequência 2 ao intervalo 10,25-10,35. Isto é feito por meio de uma figura formada com retângulos cujas áreas representam as frequências dos diversos intervalos existentes. Tal figura é denominada histograma. 13

No caso das variáveis contínuas, as frequências sempre serão associadas a intervalos de variação da variável e não a valores individuais. Tais intervalos são chamados de classes de frequências. Estas classes são usualmente representadas pelos seus pontos médios. GABARITO: Certo 7. A média dos números 3, 4, 8, 11 e 13 é maior que 7. Média = Generalizando o resultado obtido, temos que a média aritmética, ou média, de um conjunto de n números x l3 x 2,...,x n é definida por (leia-se "x barra") GABARITO: Certo 8. Se 4, 7, 5, 2 ocorrerem com as frequências 3, 2, 4 e 1, respectivamente, a média aritmética será um número entre 5 e 6. 13

Em geral, se k valores distintos observados x l3 x 2,...,x k ocorrerem com as frequências f 1, f 2,..., f k, respectivamente, a média será em que pj denota a j-ésima frequência relativa. INTERPRETAÇÃO DA MÉDIA A média caracteriza o centro da distribuição de frequências; fazendo uma analogia com a mecânica, poderíamos interpretar a média como sendo o "centro de gravidade" de uma distribuição de frequências. PROPRIEDADES DA MÉDIA a) multiplicando-se todos os valores de uma variável por uma constante, a média do conjunto fica multiplicada por essa constante. Seja x a variável de interesse, c um valor constante e y = cx. Então b) somando-se ou subtraindo-se uma constante a todos os valores de uma variável, a média do conjunto fica acrescida ou diminuída dessa constante. Seja x a variável de interesse, c um valor constante e GABARITO: Errado 9. Seja a distribuição em classes de frequência dada na tabela abaixo. Classe (limites reais) fi x i (ponto médio do intervallo) xifi 40,0-45,0 6 42,5 255 45,0-50,0 16 47,5 760 50,0-55,0 32 52,5 1.680 55,0-60,0 24 57,5 1.380 60,0-65,0 14 62,5 875 65,0-70,0 6 67,5 405 70,0-75,0 2 72,5 145 Então a média da distribuição é inferior a 60. Profs. Alexandre Lima e.moraes Junior 51

O cálculo acima mostra que todos os valores incluídos num certo intervalo de classe devem ser considerados coincidentes com o ponto médio do intervalo quando os dados são apresentados em uma distribuição de frequências. GABARITO: Certo 10. As médias geométrica e harmônica dos números 2, 4 e 8 são, em valores aproximados, iguais a 3,43 e 4, respectivamente. MÉDIA GEOMÉTRICA MÉDIA HARMÔNICA Generalização das fórmulas das médias geométrica e harmônica: GABARITO: Errado 11. O desempenho em um curso de graduação é avaliado por meio das notas obtidas nas provas bimestrais P1 e P2 e pela nota de Atividades (A). Sabendose que a P2 tem peso 5, que a P1 tem peso 2 e que A tem peso 3, então a média final do aluno que obteve as notas (em uma escala de 0 a 10) P1 = 5,0, P2 = 4,5 e A=8,5 é maior que 5,0. MÉDIA PONDERADA Profs. Alexandre Lima e.moraes Junior 51

Generalização da fórmula da média ponderada: denotam os fatores de ponderação ou pesos. Nota: a média geométrica de um conjunto de números positivos menor do que ou igual a sua média aritmética, mas é maior do que ou igual a sua média harmônica: GABARITO: Certo 12. (Analista da SUSEP/2006/ESAF) Para um conjunto determinado de números positivos temos: como a média aritmética, G como a média geométrica e H como a média harmônica, podemos afirmar que A média geométrica (G) de um conjunto de números positivos menor ou igual a média aritmética harmônica: mas é maior ou igual a média A igualdade entre as médias ocorre quando todos os números iguais. GABARITO: D 13. (ATM-Recife/2003/ESAF) Em uma amostra para obter-se informações sobre a distribuição salarial de homens e mulheres, encontrou-se que o salário médio vale R$ 1.200,00. O salário médio observado para homens foi de R$ 1.300,00 e para as mulheres foi de R$ 1.100,00. Assinale a opção correta: Profs. Alexandre Lima e.moraes Junior 51

A) O número de homens na amostra é igual ao número de mulheres. B) O número de homens na amostra é o dobro do número de mulheres. C) O número de homens na amostra é o triplo do número de mulheres. D) O número de mulheres na amostra é o dobro do número de homens. E) O número de homens na amostra é o quádruplo do número de mulheres. Dados fornecidos: - média salarial dos homens: - média salarial das Mulheres: - salário médio (média combinada) Variáveis incógnitas: - N H : número de homens; - N M : número de mulheres. O que esta questão está cobrando? O que está por detrás das alternativas? Diríamos que a pergunta a ser respondida é a seguinte: Qual é a relação existente entre as variáveis Os dados fornecidos pela banca sugerem que a questão poderá ser resolvida através da aplicação da fórmula da média combinada, a qual corresponde à média ponderada das médias salariais Não custa nada tentar, certo? Então vamos lá. 1.300 Nh + 1.100 NM = 1.200 NH + 1.200 NM A nossa tentativa deu certo. Concluímos que o número de homens na amostra é igual ao número de mulheres (alternativa "A"). GABARITO: A Profs. Alexandre Lima e.moraes Junior 51

Julgue os itens a seguir. 14. A mediana da série ordenada {12, 14, 15, 19, 20, 22, 26, 27, 30} é 20. A mediana de um conjunto de n valores ordenados, sendo n ímpar, é definida como o valor de ordem (n+1)/2 desse conjunto. Na questão, n = 9 e (n+1)/2 = (9+1)/2 = 10/2 = 5, ou seja, a mediana é o quinto valor da série: {12, 14, 15, 19, 20, 22, 26, 27, 30}. mediana = 20 Se n for par, consideraremos a mediana como o valor médio entre os valores de ordem n/2 e (n/2) + 1 do conjunto de dados. Exemplo: A mediana dos oito valores já ordenados, 12 14 15 19 20 26 27 30 é igual a (19+20)/2 = 19,5. A mediana caracteriza o centro de uma distribuição de frequências com base na ordem dos valores que formam o conjunto de dados. A mediana é o valor que ocupa a posição central dos dados ordenados. A mediana é o valor que divide a distribuição ao meio, deixando os 50% menores valores de um lado e os 50% maiores valores do outro lado. GABARITO: Certo 15. Considere os dados da tabela a seguir. A mediana dessa distribuição é menor que 50. Classe frequência 40,0-45,0 6 45,0-50,0 16 50,0-55,0 32 55,0-60,0 24 60,0-65,0 14 65,0-70,0 6 70,0-75,0 2 Soma: 100 Profs. Alexandre Lima e.moraes Junior 51

Você não precisa decorar nenhuma fórmula para saber determinar o valor da mediana, haja vista que ela pode ser obtida através da aplicação de uma mera regra de três. Então como é que a gente calcula a mediana? Vamos lá. A princípio não sabemos o valor exato da mediana. Mas isso não nos impede de determinar a sua classe (esse é o "pulo do gato"!). A tabela mostra que a primeira classe tem frequência 6%, a segunda tem frequência 16% e a terceira tem frequência 32%. Note que 6% + 16% = 22%, sendo este o valor da frequência acumulada até a segunda classe. A frequência acumulada da terceira classe é 22% + 32% = 54%. Agora precisamos dar uma parada. Repare que a frequência acumulada da terceira classe é 54% > 50%. Logo, a terceira classe contém a mediana (e é por isso que o item é errado). Deve-se montar a seguinte regra de três: a amplitude da classe da mediana (55,0-50,0 = 5,0) está para a frequência da classe da mediana (32), assim como a amplitude da classe até a mediana (X) está para a frequência acumulada até a mediana subtraída da frequência acumulada até a classe inferior à classe da mediana (50% - 22% = 28%): Portanto, mediana = 50,0 + X = 54,375. O procedimento de cálculo da mediana descrito acima pode ser generalizado por meio da fórmula em que L é o limite inferior da classe que contém a mediana, n é o número de elementos do conjunto de dados, anteriores à que contém a mediana, acima supõe que os valores observados da variável tenham se distribuído homogeneamente dentro das diversas classes. COMENTÁRIOS é a soma das frequências das classes é a frequência da classe que contém a é a amplitude da classe que contém a mediana. A expressão Em certos casos práticos, como aqueles que envolvem distribuições de frequência com valores extremos, é mais conveniente usar a mediana como medida de tendência central, pois a média sofre influência de valores 13

extremos. Neste caso, a mediana fornecerá uma melhor idéia do centro da distribuição de frequências da variável sob análise. A mediana de uma distribuição em classes de frequências pode ser geometricamente interpretada como o ponto tal que uma vertical por ela traçada divide a área sob o histograma em duas partes iguais. A mediana e a média são coincidentes quando a distribuição é simétrica. Em distribuições assimétricas, a média tende a deslocar-se para o lado da cauda mais longa (vide figura abaixo). Distribuição simétrica Distribuição assimétrica média = mediana A mediana divide o conjunto ordenado de dados em dois subconjuntos com igual número de elementos. Há outras maneiras de se dividir os dados ordenados. Os quartis (Q 1, Q 2, Q 3 ) dividem o conjunto ordenado de valores em quatro subconjuntos com igual número de elementos. O primeiro quartil (Q1) ou quartil inferior (Q) delimita os 25% menores valores; o segundo quartil é a própria mediana e o terceiro quartil (Q3) ou quartil superior (Qs) é o valor que separa os 25% maiores valores (veja a próxima figura). Além dos quartis, podemos definir os decis (D 1, D 2,..., D 9 ), que são os valores que dividem os dados ordenados em dez partes iguais (note que a mediana corresponde ao quinto decil D 5 ) e os percentis, que são os valores que dividem os dados ordenados em 100 partes iguais, sendo representados por P 1, P2,..., P 99 (a mediana é o percentil P 50 ). De maneira geral, os quartis, decis e percentis e outros valores obtidos mediante subdivisões dos dados em partes iguais são denominados quantis. Profs. Alexandre Lima e.moraes Junior 51

GABARITO: Errado 16. Considere os dados do item anterior. O valor aproximado da moda da distribuição é 53,3. A moda de uma distribuição é dada pelo valor mais freqüente ou de máxima frequência. Assim, a classe modal da distribuição é 50,0 55,0, pois esta classe possui a maior frequência, cujo valor é 32. A moda de uma distribuição pode ser calculada pelo método de Czuber ou pelo método de King. Caso a questão da prova não especifique o método, assuma que o cálculo deve ser feito pela fórmula de Czuber. FÓRMULA DE CZUBER em que L é o limite inferior da classe modal, d 1 é a diferença entre a frequência da classe modal e a da classe imediatamente anterior, d 2 é a diferença entre a frequência da classe modal e a da classe imediatamente seguinte e h é a amplitude das classes. 13

INFORMAÇÕES ADICIONAIS Método de King: em que L denota o limite inferior da classe modal, classe posterior a classe modal, classe modal e h é a amplitude da classe modal. é a frequência da classe anterior a Se todas as realizações do conjunto de valores observados ocorrem com a mesma frequência, diz-se que a série estatística é amodal, ou seja, não tem valor modal. Exemplo. Seja a série estatística {2, 1, 9, 4, 5, 20, 8, 7, 11, 19}. Essa série é amodal, pois não há repetição de valores (todos ocorrem o mesmo número de vezes). Pode haver mais de uma moda em um conjunto de valores. Se houver apenas uma moda, a distribuição é dita unimodal. Se houver duas, é bimodal, se possuir três é trimodal e assim sucessivamente. A figura a seguir ilustra as posições relativas da moda, mediana e média para uma distribuição de frequência (levemente) inclinada para a direita. GABARITO: Certo Profs. Alexandre Lima e.moraes Junior 51

(Agente Fiscal de Rendas SP/2009/FCC/Adaptada) Para resolver as próximas duas questões, considere a tabela de frequências relativas abaixo, que mostra a distribuição dos valores arrecadados, em 2008, sobre determinado tributo, referente a um ramo de atividade escolhido para análise. Sabe-se que: I - As frequências absolutas correspondem às quantidades de recolhimentos, sendo as frequências relativas do segundo e terceiro intervalos de classe iguais a x e y, respectivamente. II - A média aritmética da distribuição, valor arrecadado por recolhimento, é igual a R$ 3.350,00 (valor encontrado considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio desse intervalo). Valores Arrecadados (R$) Frequências Relativas 1.000,00 2.000,00 0,10 2.000,00 3.000,00 x 3.000,00 4.000,00 y 4.000,00 5.000,00 0,20 5.000,00 6.000,00 0,10 Total 1,00 17. A porcentagem de recolhimentos com valores arrecadados maiores ou iguais a R$ 3.000,00 é A) 70% B) 65% C) 55% D) 45% E) 40% Seja a tabela abaixo, em que xdenota o ponto médio da classe i, prepresenta a frequência relativa da classe i e P i é a frequência acumulada da classe i. Classes (em R$ mil) x i Pi Pi 1,0 --- 2,0 1,5 0,10 0,10 2,0 --- 3,0 2,5 x 0,10 + x 3,0 --- 4,0 3,5 y 0,10 + x + y 4,0 --- 5,0 4,5 0,20 0,30 + x + y 5,0 --- 6,0 5,5 0,10 0,40 + x + y Total 1,00 Temos duas frequências relativas incógnitas: x e y. Logo, precisaremos montar um sistema de duas equações a duas incógnitas para resolver x e y. Profs. Alexandre Lima e.moraes Junior 51

O enunciado diz que Por outro lado, sabemos que Chegamos então ao sistema Podemos resolver o sistema da seguinte forma: multiplique a equação (2) por -2,5 e some-a com a equação (1): -2,5x - 2,5y +2,5x + 3,5y = 1,75-1,50 0x + 1,0y = 0,25 Substituindo o valor de y em (2), tem-se que Então a solução é: = 0,60-0,25 = 0,35. A versão final da tabela é: Classes (em R$ mil) x i Pi Pi 1,0 --- 2,0 1,5 0,10 0,10 2,0 --- 3,0 2,5 0,35 0,45 3,0 --- 4,0 3,5 0,25 0,70 4,0 --- 5,0 4,5 0,20 0,90 5,0 --- 6,0 5,5 0,10 1,00 Total 1,00 E a porcentagem de recolhimentos com valores arrecadados maiores ou iguais a R$ 3.000,00 é: 0,25 + 0,20 + 0,10 = 0,55 = 55%. GABARITO: C 13

18. Utilizando o método da interpolação linear, tem-se que o valor da respectiva mediana é A) R$ 3,120,00 B) R$ 3,200,00 C) R$ 3,400,00 D) R$ 3,600,00 E) R$ 3,800,00 Classes (em R$ mil) x i Pi Pi 1,0 --- 2,0 1,5 0,10 0,10 2,0 --- 3,0 2,5 0,35 0,45 3,0 --- 4,0 (classe da mediana) 3,5 0,25 0,70 4,0 --- 5,0 4,5 0,20 0,90 5,0 --- 6,0 5,5 0,10 1,00 Total 1,00 A mediana é o valor que divide a distribuição ao meio, deixando os 50% menores valores de um lado e os 50% maiores valores do outro lado. Fazendo a interpolação linear (regra de três), temos que: (4,0-3,0) = 1,0 (amplitude da classe da mediana) está para X (amplitude na classe da mediana correspondente à mediana) assim como (70% - 45%) está (50% - 45%): Logo: md = 3,0 + 0,2 = R$ 3,2 mil. GABARITO: B 19. (APOFP-SP/2009/ESAF) Determine a mediana das seguintes observações: 17, 12, 9, 23, 14, 6, 3, 18, 42, 25, 18, 12, 34, 5, 17, 20, 7, 8, 21, 13, 31, 24, 9 A) 13,5 B) 17 C) 14,5 D) 15,5 E) 14 Profs. Alexandre Lima e.moraes Junior 51

A mediana de um conjunto de n valores ordenados, sendo n ímpar, é definida como o valor de ordem (n+1)/2 desse conjunto. Se n for par, a mediana poderia ser definida como qualquer valor situado entre o de ordem n/2 e o de ordem (n/2) + 1. Por simplificação, para n par, consideraremos a mediana como o valor médio entre os valores de ordem n/2 e (n/2) + 1 do conjunto de dados Total de elementos do conjunto = n = 23 (ímpar) Mediana (número ímpar de elementos) => Posição = (n+1)/2 = 24/4 = 12 Vamos colocar os elementos do conjunto em ordem crescente: 3, 5, 6, 7, 8, 9, 9, 12, 12, 13, 14, 17, 17, 18, 18, 20, 21, 23, 24, 25, 31, 34, 42 Elemento na Posição 12 = 17 GABARITO: B 20. (ICMS-SP/2006/FCC) O histograma de frequências absolutas, abaixo, demonstra o comportamento dos valores arrecadados de um determinado tributo, no ano de 2005, em uma região a ser analisada: Observação: Considere que todos os intervalos de classe de histograma são fechados à esquerda e abertos à direita. Utilizando-se as informações contidas neste histograma, calculou-se a média aritmética destes valores arrecadados, considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo. Também calculou-se a mediana de tais valores pelo método da 13

interpolação linear. Então, o módulo da diferença entre a média aritmética e a mediana é igual a A) R$ 100,00 B) R$ 400,00 C) R$ 800,00 D) R$ 900,00 E) R$ 1.000,00 Quando os dados são apresentados em uma distribuição de freqüências, todos os valores incluídos num certo intervalo de classe são considerados coincidentes com o ponto médio do intervalo. Seja a tabela para o cálculo da média aritmética: Então, Aprendemos que a mediana é o valor que divide a distribuição ao meio, deixando os 50% menores valores de um lado e os 50% maiores valores do outro lado. Considere a tabela abaixo (cálculo da mediana): Profs. Alexandre Lima e.moraes Junior 51

Fazendo a interpolação linear (regra de três), temos que: (4,0-3,0) = 1,0 (amplitude da classe da mediana) está para X (amplitude na classe da mediana correspondente a mediana) assim como (55% - 30%) está (50% - 30%): Então, md = 3,0 + 0,8 = 3,8 (em R$ mil). GABARITO: A 21. A amplitude do conjunto 3, 3, 4, 5, 5, 6, 7, 7, 7, 10 é A) 6 B) 13 C) 10 D) 3 E) 7 A amplitude é a diferença entre o maior valor e o menor valor do conjunto de dados: Então R = 10-3 = 7. GABARITO: E 22. Considere o conjunto de dados {2, 5, 8, 11, 14}. Então a variância desse conjunto é A) 8 B) 20,25 C) 18 D) 24 E) 22 Profs. Alexandre Lima e.moraes Junior 51

Fórmula "maceteada" da variância: VARIÂNCIA = Média dos Quadrados - Quadrado da Média Média (aritmética) do conjunto: Quadrado da média: Média (aritmética) dos quadrados: Variância = 82-64 = 18. COMENTÁRIOS A variância tem, entre outras, as seguintes propriedades: a) Se multiplicarmos todos os valores de uma série por uma constante, então a variância da nova série ficará multiplicada pelo quadrado dessa constante. Por exemplo, multiplique a série desta questão por 2. Você obterá a nova série {4, 10, 16, 22, 28}, cuja variância será 2 2 x 18 = 4 x 18 = 72. A prova desta propriedade será dada em outro exercício, mais adiante. b) Somando-se ou subtraindo-se uma constante a todos os valores de uma série, a variância não se altera. Por exemplo, some 2 a todos os valores da série desta questão. Obteremos a nova série {4, 7, 10, 13, 16}, que possui a mesma variância (confira!). Fórmula para cálculo da variância GABARITO: C 13

23. (Adm. Jr./REFAP/2007/CESGRANRIO) O setor de recursos humanos de uma empresa tem o hábito de divulgar separadamente a média e a variância das notas das avaliações dos funcionários do sexo feminino e do masculino. Na última avaliação, os resultados obtidos foram: Feminino Masculino Número de funcionários 20 30 Média 6 7 Variância 3,4 4 A média e a variância das notas dos funcionários dessa empresa, respectivamente, valem: A) 6,5 e 3,7 B) 6,6 e 3,4 C) 6,6 e 4,0 D) 7,5 e 3,7 E) 13,0 e 7,5 Considere o conjunto de dados A com N A elementos, o conjunto B com N B elementos, média Pode-se demonstrar que a variância da população conjunta A+B, também denominada variância combinada, é dada por = 4 (conjunto masculino). A média combinada corresponde à média ponderada das médias dos conjuntos: Profs. Alexandre Lima e.moraes Junior 51 24

O resultado acima já nos permite eliminar as opções A, D e E. Restaram as alternativas B e C. A variância combinada é dada por Calcularemos a variância combinada se soubermos os valores das somatórias (soma dos quadrados de B). A média do conjunto A é 6 (soma de A = 120). A média do conjunto B é 7 (soma de B = 210), A variância de A é 3,4. Então, A variância de B é 4,0. Logo, Finalmente, temos que variância combinada = 4,0. COMENTÁRIO Se as médias dos conjuntos A e B forem iguais, ou seja, se variância combinada pode ser calculada por meio da fórmula simplificada Profs. Alexandre Lima e.moraes Junior 51

em que N = N A + N B. Repare que trata-se de uma média ponderada das variâncias individuais. Atenção: a fórmula acima é um caso particular da fórmula geral da variância combinada. Você só poderá aplicá-la quando as médias dos conjuntos A e B forem iguais! GABARITO: C 24. Sejam os conjuntos de números {2, 5, 8, 11, 14} e {2, 8, 14}. Assinale a opção com a variância dos conjuntos combinados ou reunidos. A) 8 B) 20,25 C) 18 D) 24 E) 22 Temos a série estatística A = {2, 5, 8, 11, 14} com média e a série B = {2, 8, 14} com média Como as médias são iguais, podemos aplicar a fórmula simplificada Variância do 1 conjunto: Variância do 2 conjunto: Variância combinada: GABARITO: B Profs. Alexandre Lima e.moraes Junior 51

25. (Agente Fiscal de Rendas SP/2006/FCC) Considerando as respectivas definições e propriedades relacionadas às medidas de posição e de variabilidade, é correto afirmar: A) Concedendo-se um reajuste de 10% em todos os salários de uma empresa, tem-se também que a respectiva variância fica multiplicada por 1,10. B) Definindo-se coeficiente de variação (CV) como sendo o quociente da divisão do desvio padrão pela respectiva média aritmética (diferente de zero) de uma sequência de valores, tem-se então que CV também poderá ser obtido dividindo a correspondente variância pelo quadrado da média aritmética. C) Subtraindo um valor fixo de cada salário dos funcionários de uma empresa, tem-se que o respectivo desvio padrão dos novos valores é igual ao valor do desvio padrão dos valores anteriores. D) Dividindo todos os valores de uma sequência de números estritamente positivos por 4, tem-se que o respectivo desvio padrão fica dividido por 2. E) Em qualquer distribuição de valores em estudo, a diferença entre a mediana e a moda é sempre diferente de zero. Análise das alternativas: de um conjunto de dados é dada pela fórmula Média dos Quadrados - Quadrado da Média. Se multiplicarmos todos os salários por 1,1 (reajuste de 10%), então a variância da nova série ficará multiplicada por 1,1 2 = 1,21 (a demonstração é PROVA: a variável x representa o salário de um empregado. Se é concedido um reajuste de 10% em todos os salários (então o salário reajustado passará tem-se que a nova ou seja, a nova variância ficará multiplicada pelo quadrado da constante. B) O Coeficiente de Variação (CV) é definido como o quociente entre o desvio padrão (que por sua vez é dado pela raiz quadrada positiva da variância) e a média, sendo frequentemente expresso em porcentagem: www.pontodosconcursos.com.br 27

alternativa é VERDADEIRA. D) Quando todos os valores de uma série são multiplicados por uma constante, a variância do conjunto fica multiplicada pelo quadrado dessa constante. Logo, se dividirmos todos os valores de uma série por 4, tem-se que o desvio padrão também ficará dividido por 4 ^ FALSA. E) Esta afirmação é verdadeira somente para distribuições assimétricas ^ FALSA. GABARITO: C 26. (ICMS-RJ/2009/FGV) Para comparar as rendas de dois grupos de pessoas, A e B, foram preparados diagramas de caixas (box-plots) com os valores observados dos salários, representados na figura a seguir: Grupo A Grupo B A respeito desses diagramas, considere as seguintes afirmativas: I. O salário médio dos dois grupos é o mesmo. II. A distribuição dos salários no grupo A é assimétrica à direita. III. Há mais pessoas no grupo A do que no grupo B. Assinale: A) se somente a afirmativa I for verdadeira. B) se somente a afirmativa II for verdadeira. C) se somente a afirmativa III for verdadeira. D) se somente as afirmativas I e II forem verdadeiras. E) se somente as afirmativas II e III forem verdadeiras. 13

PRELIMINARES O desvio interquartílico (InterQuartile Range - IQR), definido por em que dq denota o desvio interquartílico, Q s é o quartil superior (ou terceiro quartil Q 3 ) e Qo quartil inferior (ou primeiro quartil Q 1 ), pode ser usado como uma medida de dispersão. Em distribuições mais dispersas, os valores dos quartis ficam mais distantes. Em distribuições simétricas, a distância entre o quartil inferior e a mediana é igual à distância entre a mediana e o quartil superior, enquanto que em distribuições assimétricas essas distâncias são diferentes. Exemplo. O primeiro e o terceiro quartis da distribuição das alturas dos estudantes da Universidade de São Paulo são 165,56 cm e 178,59 cm, respectivamente. Calcule o desvio interquartílico dessa distribuição. diagrama (veja a próxima figura), consideramos um retângulo onde estão representados a mediana, o primeiro quartil (Q1) e o terceiro quartil (Q3). A partir do retângulo, para cima, segue uma linha até o ponto mais remoto que não pode exceder LS = Q 3 + 1,5.IQR, chamado limite superior. De modo análogo, a partir do retângulo, para baixo, segue uma linha até o ponto mais remoto que não seja menor que LS = Q 1-1,5.IQR, chamado limite inferior. Os valores compreendidos entre esses dois limites são chamandos valores adjacentes. As observações que estiverem acima do limite superior ou abaixo do limite inferior serão denominadas pontos exteriores. Essas observações são destoantes das demais e podem ou não ser o que chamamos de outliers ou valores atípicos 1,2. Um outlier pode ser produto de um erro de observação ou de arredondamento. Contudo, as denominações pontos exteriores e outliers são frequentemente usadas com o mesmo significado por alguns autores 3 : observações fora de lugar, discrepantes ou atípicas. O box plot nos dá uma noção da posição, dispersão, assimetria, caudas e dados discrepantes da distribuição. A posição central é dada pela mediana e a dispersão por IQR. As posições relativas de Q1, Q2 e Q3 nos dão uma idéia da 1 BUSSAB, Wilton de O.; MORETTIN, Pedro Alberto. Estatística Básica. São Paulo: Ed. Saraiva, 2010. 2 A média aritmética é sensível a outliers. Um único valor "ruim" do conjunto de dados pode distorcer a média, ou seja, pode mover a média para longe do centro da distribuição de frequências. As médias geométrica e harmônica, assim como a aritmética, também não são robustas a outliers. Elas são úteis quando os dados são bem modelados pela distribuição log-normal ou quando a distribuição é fortemente assimétrica. 3 MONTGOMERY, Douglas C.; RUNGER, George C. Estatística Aplicada e Probabilidade para Engenheiros. Rio de Janeiro: LTC, 2008. 13

assimetria da distribuição. Os comprimentos das caudas são dados pelas linhas que vão do retângulo aos valores remotos e pelos valores atípicos. Os comprimentos das caudas são dados pelas linhas que vão do retângulo aos valores remotos e pelos valores atípicos. Exemplo. Considere um conjunto de dados com os seguintes percentis: 0% 25% 50% 75% 100% 1,7524 4,6901 5,7004 6,1768 7,3658 A próxima figura é um box plot do conjunto de dados que gerou a tabela de percentis acima. A cauda inferior é longa e isto indica que a distribuição é assimétrica. Note também a presença de outliers na parte inferior do box plot (são os pontos vermelhos). Profs. Alexandre Lima e.moraes Junior 51

A figura abaixo mostra o histograma associado ao box plot do exemplo. ANÁLISE DAS AFIRMATIVAS I- Os diagramas de caixas indicam que as medianas dois grupos A e B são iguais e não as suas respectivas médias ^ FALSA. II- A distribuição dos salários no grupo A é assimétrica à direita porque a distância entre o terceiro quartil (Q3) e a mediana (md), ou seja, Q3 md, é maior do que a distância entre a mediana e o primeiro quartil, dada por md Q1. ^ VERDADEIRA. III- O número de pessoas nos dois grupos é igual, haja vista que as distâncias entre os extremos superior e inferior nas distribuições dois dois grupos é aproximadamente 2.500 (3.100 600 = 2.500 para o grupo A e 2.900 400). ^ FALSA. GABARITO: B 13

27. (ICMS-RJ/2008/FGV) Uma companhia utiliza um sistema de avaliação de desempenho de seus funcionários por meio de dois indicadores de performance: Qualidade das tarefas e a Tempestividade com que as tarefas são realizadas. Os funcionários receberam, na última avaliação, as medidas indicadas na tabela a seguir: Indicador Medidas Qualidade Tempestividade Média 50 25 Desvio-Padrão 10,0 6,0 Coeficiente de Variação (%) 20 24 Com base na tabela, é correto afirmar que: A) a média aritmética não é uma boa medida para representar a performance dos funcionários em face do elevado nível de dispersão das avaliações. B) as avaliações da Qualidade foram mais dispersas do que as avaliações da Tempestividade. C) as avaliações da Qualidade foram mais homogêneas do que as da Tempestividade. D)os funcionários demoram mais para realizar as tarefas, mas a qualidade das tarefas, mas a qualidade das tarefas é melhor. E) nada se pode afirmar sem o conhecimento do tamanho da amostra. Análise das afirmativas: A) A média aritmética é uma medida de posição de uma distribuição de frequências. Logo, é uma medida válida ("boa") para caracterizar o desempenho dos funcionários. Além disso, não se pode afirmar que a média não seja uma medida "boa" devido ao elevado nível de dispersão da distribuição. Posição e dispersão são características distintas de uma distribuição de frequências ^ ERRADA. B) As medidas de coeficiente de variação ou seja, as avaliações da Tempestividade foram mais dispersas do que as Profs. Alexandre Lima e.moraes Junior 51

C) As avaliações da Qualidade foram mais homogêneas, ou seja, menos dispersas, do que as da Tempestividade, haja vista que cv(qualidade) = 20 < 24 = cv(tempestividade) ^ CERTA. D) Qualidade e Tempestividade são variáveis distintas; logo, essa comparação não faz sentido (não podemos comparar "banana" com "laranja"). A qualidade das tarefas é melhor em relação a quê? Os funcionários demoram mais para realizar as tarefas em relação a qual métrica de comparação? ^ ERRADA. E) Está implícito que a companhia avaliou todos os seus funcionários. Logo, as medidas referem-se à população dos funcionários. As medidas tabeladas não são estimativas de parâmetros da população, mas sim os verdadeiros valores de média, desvio-padrão e coeficiente de variação das variáveis Qualidade e Tempestividade ^ ERRADA. GABARITO: C 28. (Assessor Especializado/IPEA/2004/FCC) Numa distribuição de frequências com assimetria negativa mais de 50% dos dados situam-se A) sobre a média B) acima da média C) entre a média e a moda D) entre a média e a mediana E) acima da mediana PRELIMINARES Assimetria é o grau de desvio, ou afastamento da simetria, de uma distribuição. As distribuições alongadas à direita são ditas positivamente assimétricas, e as alongadas à esquerda, negativamente assimétricas. Uma medida conveniente de assimetria, por ser adimensional, é dada pelo coeficiente de assimetria (A), definido como: em que s3 denota o desvio padrão elevado ao cubo e Profs. Alexandre Lima e.moraes Junior 51

é o momento centrado de terceira ordem. O coeficiente de assimetria indica o sentido da assimetria e pode ser usado para comparar vários casos porque é adimensional. O sinal do coeficiente de assimetria será positivo ou negativo se a distribuição for assimétrica à direita ou à esquerda, respectivamente. A assimetria também pode ser medida pelo primeiro coeficiente de assimetria de Pearson: em que x é a média e mo denota a moda. Para evitar o emprego da moda, pode-se adotar a fórmula empírica (média - moda) = 3(média - mediana), de forma que a fórmula do primeiro coeficiente de assimetria de Pearson pode ser reescrita como conhecida como segundo coeficiente de assimetria de Pearson. Uma outra medida de assimetria, denominada coeficiente quartílico de assimetria (A q ), é definida pela fórmula Voltando à resolução da questão... Assimetria Negativa ou à Esquerda: Média < Mediana < Moda Profs. Alexandre Lima e.moraes Junior 51

Assimetria Negativa (você puxa a seta com a mão esquerda): 1) A seta puxa a média 2) A moda está no topo 3) A mediana está no meio Note que uma distribuição de frequências com assimetria negativa é alongada à esquerda. A mediana é o valor que divide a distribuição ao meio, deixando os 50% menores valores de um lado e os 50% maiores valores do outro lado. Logo, numa distribuição de frequências com assimetria negativa, mais de 50% dos dados estão acima da média (pois a média é menor do que a mediana). Assimetria Positiva ou à Direita: Média > Mediana > Moda ou Moda < Mediana < Média 13

Assimetria Positiva ou à Direita (você puxa a seta com a mão direita): 1) A seta puxa a média 2) A moda está no topo 3) A mediana está no meio GABARITO: B 29. (ICMS-RJ/2007/FGV) Considere as informações contidas no Box Plot abaixo, referente aos salários dos engenheiros de uma empresa, por sexo. 13

É correto afirmar que: A) o salário médio dos homens é igual ao das mulheres. B) a distribuição dos salários das mulheres é assimétrica negativa. C) o desvio interquartílico dos salários das mulheres é maior do que o dos homens. D) a distribuição dos salários dos homens é atípica. E) o salário mediano das mulheres é superior ao dos homens. Análise das afirmativas: A) Os diagramas de caixa indicam que as medianas dos salários, e não os salários médios, são iguais, com um valor aproximado de R$ 3.700 ^ ERRADA. B) A distribuição dos salários das mulheres é assimétrica positiva, pois é alongada à direita (a distância entre o quartil superior e a mediana é maior do que distância entre o quartil inferior e a mediana) ^ ERRADA. C) O desvio interquartílico dos salários das mulheres é aproximadamente igual a 4.400 3.400 = 1.000. O desvio interquartílico dos salários dos homens é aproximadamente igual a 3.900 3.300 = 600. Logo a afirmativa está CERTA. D) O enunciado não fornece dados para se fazer este tipo de conclusão. Qual seria a distribuição dos salários dos homens típica? ^ ERRADA. E) O salário mediano das mulheres é igual ao dos homens ^ ERRADA. GABARITO: C 30. (Analista IRB/2004/ESAF) O desenho esquemático (diagrama de caixa) apresentado abaixo representa o resumo de cinco números {51,00;54,75;69,50;78,00;95,00} para um conjunto de observações amostrais do atributo Y. Assinale a opção que dá o valor do coeficiente de assimetria de Pearson para a amostra em apreço. Profs. Alexandre Lima e.moraes Junior 51

A) -0,269 B) -0,500 C) 0,000 D) 0,294 E) -0,294 Temos cinco números: {51,00;54,75;69,50;78,00;95,00}. É razoável admitir que eles representem as seguintes medidas: - Valor Mínimo = 51,00 - Q1 = 54,75 - Mediana (md) = 69,50 - Q3 = 78,00 - Valor Máximo = 95,00 Note que o diagrama de caixa apresentado não representa de forma fidedigna as cinco medidas do atributo Y. Paciência! Não vale a pena brigar com a banca. O objetivo é ser aprovado no concurso! Vimos que o primeiro coeficiente de assimetria de Pearson é dado pela fórmula Entretanto, não é possível calcular o coeficiente de assimetria de Pearson com os dados da questão (quais são os valores da média e da moda?). O que está acontecendo nesta questão? Calma... pode ser que a banca tenha alguma outra medida de assimetria em mente. Que tal calcular o coeficiente quartílico de assimetria? Não custa nada. Então vamos lá! Coeficiente quartílico de assimetria = -0,269 GABARITO: A 13

31. (AFRF/2001/ESAF) Numa amostra de tamanho 20 de uma população de contas a receber, representadas genericamente por X, foram determinadas a média amostral M = 100 e o desvio-padrão s = 13 da variável transformada (X 200)/5. Assinale a opção que dá o coeficiente de variação amostral de X: A) 3,0% B) 9,3% C) 17,0% D) 17,3% E) 10,0% Y = (X - 200)/5 => X = 5Y + 200 s = sy = 13 Logo, sx = 5sy = 5 x 13 = 65 + 200 = 5 x 100 + 200 = 700 GABARITO: B (AFRF/2002/ESAF) Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. As questões de 32 a 37 referem-se a esses ensaios. Classes P (%) 70-90 5 90-110 15 110-130 40 130-150 70 150-170 85 170-190 95 190-210 100 32. Assinale a opção que dá o valor médio amostral de X. Profs. Alexandre Lima e.moraes Junior 51

A) 140,10 B) 115,50 C) 120,00 D) 140,00 E) 138,00 Se k valores distintos observados ocorrerem com as freqüências respectivamente, a média será em que pj denota a j-ésima frequência relativa. Quando os dados são apresentados em uma distribuição de freqüências, todos os valores incluídos num certo intervalo de classe são considerados coincidentes com o ponto médio do intervalo. As fórmula acima será válida para esses dados agrupados quando se interpretar como o ponto médio e como a frequência relativa conforme a tabela acima. GABARITO: E 13

33. Assinale a opção que corresponde à estimativa do quinto decil da distribuição de X. A) 138,00 B) 140,00 C) 136,67 D) 139,01 E) 140,66 A mediana é o quinto decil. A mediana (md) de uma distribuição em classes de freqüências é dada pela expressão em que L l é o limite inferior da classe que contém a mediana, n é o número de elementos do conjunto de dados, é a soma das frequências das classes anteriores à que contém a mediana, é a frequência da classe que contém a é a amplitude da classe que contém a mediana. Seja a Tabela das freqüências freqüências acumuladas Classe Pj fj Fj (limites reais) 70 90 0,05 200 x 0,05 = 10 10 90 110 0,10 200 x 0,10 = 20 10 + 20 = 30 110 130 0,25 200 x 0,25 = 50 30 + 50 = 80 130 150 0,30 200 x 0,30 = 60 80 + 60 = 140 150 170 0,15 200 x 0,15 = 30 140 + 30 = 170 170 190 0,10 200 x 0,10 = 20 170 + 20 = 190 190 210 0,05 200 x 0,05 = 10 190 + 20 = 200 Soma 1,00 200 = n GABARITO: C Profs. Alexandre Lima e.moraes Junior 51

34. Seja S o desvio padrão do atributo X. Assinale a opção que corresponde à medida de assimetria de X como definida pelo primeiro coeficiente de Pearson. A) 3/S B) 4/S C) 5/S D) 6/S E) 0 A questão aborda o cálculo do índice de assimetria de Pearson, dado por Inicialmente, temos que calcular a moda mo. Como a questão não especificou o método de cálculo, se de Czuber ou de King, devemos usar a fórmula de Czuber: em que: - L é o limite inferior da classe modal, - d é a diferença entre a freqüência da classe modal e a da classe imediatamente anterior, - d 2 é a diferença entre a freqüência da classe modal e a da classe imediatamente seguinte e - h é a amplitude das classes. Seja a Tabela das freqüências (f) abaixo (a classe modal está destaca em negrito): Profs. Alexandre Lima e.moraes Junior Classe fj (limites reais) 70-90 10 90-110 20 110-130 50 130-150 60 150-170 30 170-190 20 190-210 10 Soma 200 = n 51

GABARITO: A 35. Assinale a opção que corresponde à estimativa da freqüência relativa de observações de X menores ou iguais a 145. A) 62,5% B) 70,0% C) 50,0% D) 45,0% E) 53,4% Número de elemento abaixo de 145 = 10 + 20 + 50 + 45 = 125 Total de elementos = 200 Freqüência Relativa = 125/200 = 0,625 = 62,5% GABARITO: A Profs. Alexandre Lima e.moraes Junior 51

36. Considere a transformação Z = (X-140)/10. Para o atributo Z encontrou-se é a freqüência simples da classe i e Zo ponto médio de transformado. Assinale a opção que dá a variância amostral do atributo A) 720,00 B) 840,20 C) 900,10 D) 1200,15 E) 560,30 e Além disso, variância de Z. Seja a Tabela abaixo: fórmula que facilita o cálculo da GABARITO: B Profs. Alexandre Lima e.moraes Junior 51

37. Entende-se por curtose de uma distribuição seu grau de achatamento em geral medido em relação à distribuição normal. Uma medida de curtose é dada pelo quociente onde Q é a metade da distância interquartílica e P 90 e P 10 representam os percentis de 90% e 10%, respectivamente. Assinale a opção que dá o valor da curtose k para a distribuição de X. A) 0,263 B) 0,250 C) 0,300 D) 0,242 E) 0,000 em que D9 denota o nono decil e D1 representa o primeiro Profs. Alexandre Lima e.moraes Junior 51

A fórmula pode ser generalizada para os quantis, como a seguir Logo, GABARITO: D 38. (Analista do BACEN/2006/FCC) A média aritmética dos valores das vendas diárias realizadas pelas 50 empresas do Setor A é de R$ 1.000,00, com desvio padrão de R$ 100,00. Sabe-se ainda que a média aritmética dos valores das vendas diárias realizadas pelas 200 empresas do Setor B é de R$ 2.000,00, com desvio padrão de R$ 200,00. A variância em (R$) 2 dos valores das vendas diárias realizadas pelos dois setores reunidos é A) 34.000,00 B) 50.000,00 C) 194.000,00 D) 207.500,00 E) 288.000,00 13

A banca pediu para o candidato calcular a n variância em (R$) 2 dos valores das vendas diárias realizadas pelos dois setores reunidos". O que ela quis dizer com isso? Considere que os valores das vendas diárias realizadas pelas 50 empresas do Setor A constituem a população A em que N 1 = 50, e que os valores das vendas diárias realizadas pelas 200 empresas do Setor B constituem a população B em que N 2 = 200. A banca pediu para o candidato determinar a variância da população conjunta A fórmula da variância da população conjunta A+B é em que N = N1 + N2 = 50 + 200 = 250. A variância vez conhecidos os valores dos somatórios somatórios serão calculados em função das médias aritméticas A respectivamente. Os somatórios serão determinados em função de respectivamente. A fim de facilitar as contas, cortaremos três zeros dos dados fornecidos: 13

Para dar a resposta final, devemos multiplicar a variância (= quadrado do desvio-padrão) obtida acima por (1.000) 2, haja vista que dividimos as médias e desvios-padrão por 1.000: GABARITO: C 39. (ICMS-RJ/2010/FGV) A média, a mediana e a variância das idades de um grupo de vinte pessoas são, hoje, iguais, respectivamente, a 34, 35 e 24. Daqui a dez anos, os valores da média, da mediana e da variância das idades dessas pessoas serão, respectivamente: A) 44, 35 e 34 B) 44, 45 e 12 C) 44, 45 e 24 D) 34, 35 e 12 E) 44, 45 e 124 Está implícito que todas as pessoas do grupo estarão vivas daqui a dez anos. A dispersão da distribuição de frequências (das idades) não mudará com o envelhecimento das pessoas do grupo (ou seja, a forma da distribuição se mantém ao longo do tempo). Logo, a variância daqui a dez anos ainda será igual a 24. A única opção com este valor é a C. 13

Daqui a dez anos, a média e a mediana serão acrescidas de 10 unidades (anos), haja vista que a distribuição de frequências sofrerá um deslocamento para a direita de 10 unidades. Assim, a média e a mediana serão iguais a 44 e 45, respectivamente. GABARITO: C 40. (AFPS/2002/ESAF) O diagrama de ramos e folhas abaixo corresponde às observações (82,..., 158) do atributo X. Assinale a opção que dá o valor mediano de X A) 105 B) 110 C) 104 D) 107 E) 115 Não existe uma regra fixa para construir o diagrama de ramo-e-folhas, mas a idéia básica é dividir cada observação em duas partes: a primeira (o ramo) é colocada à esquerda de uma linha vertical, a segunda (a folha) é colocada à direita. Assim, para os valores 90 e 93, o 9 é o ramo e 0 e 3 são as folhas. Profs. Alexandre Lima e.moraes Junior 51