MAE0219 Introdução à Probabilidade e Estatística I

Documentos relacionados
Variável Salário: Quantitativa contínua. Para construir os histogramas solicitados temos,

Lista 2. Considere os dados abaixo sobre distribuição de salário (em reais) num grupo de 1000 individuos.

Grupo A - 1 semestre de 2012 Lista de exercícios 2 - Estatística Descritiva II C A S A (gabarito)

Lista de Exercícios Cap. 2

Bioestatística CE001 Prof. Fernando de Pol Mayer Departamento de Estatística DEST Exercícios: medidas resumo Nome: GABARITO

CAP1: Estatística Descritiva para análise da variabilidade uma amostra de dados quantitativos

MAE116 Noções de Estatística

Revisão de estatística descritiva

Estatística Descritiva

DISCIPLINA: ESTATÍSTICA I (CÓD. ENEC60015) PERÍODO: 3º PERÍODO

1. Registou-se o número de assoalhadas de 100 apartamentos vendidos num bairro residencial

Elementos de Estatística

Fernando de Pol Mayer

AULA 5 MEDIDAS DESCRITIVAS DOCENTE: CIRA SOUZA PITOMBO

Unidade III Medidas Descritivas

Universidade Federal Fluminense INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA

Princípios de Bioestatística Estatística Descritiva/Exploratória

3.1 - Medidas de Posição Medidas de Dispersão Quantis Empiricos Box-plots Graficos de simetria 3.

(a) Classifique cada uma das variáveis.

PROBABILIDADE E ESTATÍSTICA ESTATÍSTICA DESCRITIVA

Capítulo 1. Análise Exploratória de Dados

Probabilidade e Estatística. Prof. Dr. Jhames Sampaio

Universidade Federal de Lavras Departamento de Ciências Exatas Prof. Daniel Furtado Ferreira 4 a Aula Prática Medidas de Dispersão

Descrevendo Distribuições com Números TADI

Aula 2 Planejamento e Análise de Experimentos

ESTATÍSTICA Medidas de Síntese

ANÁLISE EXPLORATÓRIA DE DADOS 2ª PARTE

1 a Lista de PE. Universidade de Brasília Departamento de Estatística

Estatística

MEDIDAS DE TENDÊNCIA CENTRAL

Vimos que é possível sintetizar os dados sob a forma de distribuições de frequência e gráficos. Pode ser de interesse apresentar esses dados através d

SCC0173 Mineração de Dados Biológicos


Introdução à Bioestatística Turma Nutrição Aula 3 Análise Descritiva: Medidas de Tendência Central Medidas de Variabilidade

Estatística 1 - Lista de Exercícios Extra Professor José Carlos Fogo

Medidas de Tendência Central. Introdução Média Aritmética Moda Mediana Análise de Assimetria Separatrizes

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Técnicas Computacionais em Probabilidade e Estatística I. Aula I

LISTA DE EXERCÍCIOS 1 INE PROF. MARCELO MENEZES REIS ANÁLISE EXPLORATÓRIA DE DADOS GABARITO

Distribuição de Frequência de Variáveis Quantitativas Contínuas (Tabelas e Gráficos)

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Conceito de Estatística

Cap. 5 Dados quantitativos

(em dias) Agrupados Isolados 58 a a a TOTAL

ESTATÍSTICA DESCRITIVA

Distribuição de frequências:

Lista 1 Estatística Aplicada à Gestão Prof. Herivelto Marcondes

Resumo de Dados. Tipos de Variáveis

Amostragem Aleatória e Descrição de Dados - parte II

ESTATÍSTICA DESCRITIVA

N o. Grau de Instrução 2 0 grau. No de filhos -

Estatística Descritiva

2009 FATEC GT/FATEC SJC

Introdução à Estatística Estatística Descritiva 22

Distribuição Gaussiana. Verificação da Suposição de Normalidade dos Dados

Curso de Especialização em Fisioterapia Traumato-Ortopédica / 2010 NOÇÕES DE STICA

n = 25) e o elemento (pois = 19) e terá o valor 8. Verifique que antes e depois do 19 o elemento, teremos 18 elementos.

Cálculo das Probabilidades e Estatística I

Mas, para começar a aplicar métodos estatísticos, é preciso conhecer alguns conceitos básicos.

MEDIDAS DE POSIÇÃO. Lucas Santana da Cunha Universidade Estadual de Londrina. 26 de abril de 2017

Coeficiente de Assimetria

TADI Tratamento e Análise de Dados/Informações Prof. Camilo Rodrigues Neto

Estatística 1. Resumo Teórico

Autores: Fernando Sebastião e Helena Silva

Coleta e Modelagem dos Dados de Entrada

No erros páginas ) Lançou-se um dado 100 vezes, obtendo-se os seguintes resultados:

25/08/2016. Estatística. Estatística. Medidas Estatísticas Medidas de Posição. Mariele Bernardes. Mariele Bernardes

ESTATÍSTICA. na Contabilidade Parte 6. Medidas Estatísticas

Estatística Descritiva (I)

Métodos Experimentais em Ciências Mecânicas

Prof. Lorí Viali, Dr.

Apresentação Caule e Folha. Exemplo. Ramo e Folha. Análise Exploratória de Dados

Percentis e Boxplots

Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16)

Estatística Descritiva

Estatística I Aula 3. Prof.: Patricia Maria Bortolon, D. Sc.

( ) Referem-se aos dados coletados e podem ser

Medidas de Posição ou Tendência Central

Figura 1: Gráfico de pontos.

Universidade da Beira Interior - Departamento de Matemática ESTATÍSTICA APLICADA À PSICOLOGIA I

Amostragem Aleatória e Descrição de Dados - parte I

Distribuição Normal. Prof a Dr a Alcione Miranda dos Santos. Abril, 2011

Para caracterizar um conjunto de dados é importante não só a média, mas também a dispersão dos valores em torno da média

Profa. Lidia Rodella UFPE-CAA

Unidade III Medidas Descritivas

Dados de identificação do Acadêmico: Nome: Login: CA: Cidade: UF Assinatura: CARTÃO RESPOSTA

AULA 2 UNIDADE 1 DISTRIBUIÇÃO DE FREQUÊNCIAS 1.1 INTRODUÇÃO

Estatística e Probabilidade

Excel INTERMEDIÁRIO Estatística. Prof. Cassiano Isler Turma 3

Transcrição:

Exercício 1 Considere os dados abaixo sobre distribuição de salário (em reais) num grupo de 1000 individuos. Tabela 1: Distribuição de frequências da variável salário Classe de Salário n i f i 500-1000 400 0,40 1000-1500 200 0,20 1500-2000 150 0,15 2000-3000 150 0,15 3000-5000 100 0,10 Classifique a variável Classe de Salário. Construa os histogramas pelos métodos de frequência e densidade. Qual deve ser utilizado? Justifique. Calcule aproximadamente do histograma apropriado a média, o desvio padrão, a mediana salarial e os percentis 10 e 90 para essa amostra Solução Variável Salário: Quantitativa contínua Para construir os histogramas solicitados temos, Tabela 2: Distribuição de frequências da variável salário Classe de Salário n i f i Amplitude i Densidade f i / i 500-1000 400 0,40 500 0, 8 10 3 1000-1500 200 0,20 500 0, 4 10 3 1500-2000 150 0,15 500 0, 3 10 3 2000-3000 150 0,15 1000 0, 15 10 3 3000-5000 100 0,10 2000 0, 05 10 3 O gráfico que deve ser utilizado é o histograma obtido pelo método de densidade, visto que as classes apresentam tamanhos diferentes. Média aproximada, x = 0.4 750 + 1250 0.2 + 1750 0.15 + 2500 0.15400 0.1 = 1587.5 Variância aproximada, Portanto, s 2 = 0.4 (750 1587.5) 2 + (1250 1587.5) 2 0.2 + (1750 1587.5) 2 0.15 +(2500 1587.5) 2 0.15 + (4000 1587.5) 2 0.1 = 1014219 s = 1014219 = 1007.084. Página 1 de 8

Histograma Frequência 0 100 200 300 400 0 1000 2000 3000 4000 5000 Classe de salários Figura 1: Histogramas para a variável salário usando métodos de densidade e frequência respectivamente. A mediana encontra-se na segunda classe (de mil a mil e quinhentos reais) uma vez que as duas primeiras classes acumulam sessenta por cento das observações. E temos, md obs 1000 0.10 = 1500 1000 0.200 md obs = 1250. O percentis 10 encontra-se na primeira classe (de quinhentos e mil reais) uma vez que a primeira classe acumula quarenta por cento das observações. Então, temos P (10)obs 500 0.10 = 1000 500 0.400 P (10)obs = 650. O percentis 90 encontra-se na penultima classe (de dois mil e três mil reais) uma vez que nas quatro primeiras classes acumulam noventa por cento das observações. Então, temos P (90)obs 2000 0.15 = 3000 2000 0.15 P (90)obs = 3000. Página 2 de 8

Exercício 2 Os dados descritos a seguir referem-se a despesas fixas e despesas com pessoal (incluindo encargos) dos departamentos de contabilidade e pessoal de uma empresa durante 15 meses. Os valores estão em mil reais. Tabela 3: Valores Ordenados das despesas fixas e pessoais em cada departamento. Depto. Contabilidade Depto. Pessoal D. Fixas D. Pessoal D. Fixas D Pessoal 1 0.91 14.00 1.30 13.63 2 1.80 15.82 1.64 14.12 3 2.31 18.10 2.26 15.07 4 2.36 18.35 2.26 15.37 5 3.00 18.37 2.38 15.38 6 3.44 18.47 2.39 15.39 7 3.46 20.95 2.42 17.18 8 3.54 21.20 2.57 17.70 9 3.60 21.93 2.70 17.78 10 3.68 22.00 3.04 17.78 11 3.75 24.11 3.08 18.00 12 3.88 24.95 3.18 18.54 13 3.89 28.08 3.65 22.47 14 4.00 28.90 4.03 22.56 15 4.45 29.43 4.10 24.61 Construa, num mesmo gráfico, os boxplots das despesas fixas e num outro gráfico os boxplots das depesas com pessoal para os dois departamentos. Comente sobre a dispersão, pontos extremos, mediana e simetria dos dados, para cada departamento. Recomendado uso de computador. Solução Para a construção dos box-plots precisamos determinar os quartis, os limites superiores e inferiores. Como para cada variável em cada grupo temos n = 15 observações segue que, Posição de Q 1 =0,25(15+1)=4. Posição de Q 2 (mediana)=0,5(15+1)=8. Posição de Q 3 =0,75(15+1)=12. Olhando para a Tabela 3 podemos determinar facilmente estes valores em cada caso. Temos que, LI=Q1-1,5(Q3-Q1), de modo que Para as despesas fixas do departamento de contabilidade, LI=2,36-1,5(3,88-2,36)=0.08. Para as despesas pessoais do departamento de contabilidade LI=18,35-1,5(24,95-18,35)=8.45. Para as despesas fixas do departamento pessoal é LI=2,26-1,5(3,18-2,26)=0.88 Página 3 de 8

Tabela 4: Quartis de cada variável em cada departamento Depto. Contabilidade Depto. Pessoal D. Fixas D. Pessoal D. Fixas D Pessoal Q 1 2.36 18.35 2.26 15.37 Q 2 3.54 21.20 2.57 17.70 Q 3 3.88 24.95 3.18 18.54 Para as despesas pessoais do departamento pessoal LI=15,37-1,5(18,54-15,37)=10,615 Temos que, LS=Q3+1,5(Q3-Q1), de modo que Para as despesas fixas do departamento de contabilidade, LS=3,88+1,5(3,88-2,36)= 6.16. Para as despesas pessoais do departamento de contabilidade LS=24,95+1,5(24,95-18,35)=34.85. Para as despesas fixas do departamento pessoal é LS=3,18+1,5(3,18-2,26)=4.56 Para as despesas pessoais do departamento pessoal LS=18,54+1,5(18,54-15,37)=23.295 Tabela 5: Valores máximos e mínimos do box plot Depto. Contabilidade Depto. Pessoal D. Fixas D. Pessoal D. Fixas D Pessoal Mínimo 0.91 14.00 1.30 13.63 Máximo 4.45 29.43 4.10 22.56 Figura 2: Boxplots das despesas fixas para os departamentos de contabilidade e pessoal No que se refere as despesas fixas temos, Os dados do departamento de contabilidade são claramente assimétricos, observe que a mediana está bem mais próxima do terceiro quartil do que do primeiro o que indica assimetria a esquerda. Já no departamento pessoal a mediana está bem mais próxima Página 4 de 8

Figura 3: Boxplots das despesas pessoais para os departamentos de contabilidade e pessoal do primeiro quartil do que do terceiro o que indica assimetria a direita. Em ambos os departamentos não foram detectados pontos discrepantes (outliers). Comparando os boxplots das despesas fixas vemos que a distribuição de valores (medidas de posição) é bem diferente em cada departamento. Há evidência que o departamento de contabilidade tem mais valores altos de despesas fixas durante os quinze meses em estudo do que o departamento pessoal. No que se refere as despesas pessoais temos, O departamento de contabilidade no que refere a despesas pessoais parece apresentar dados mais simétricos (levemente simétrico). Já no departamento pessoal constatamos agora assimetria a esquerda. Podemos visualizar a presença de uma observação discrepante no departamento pessoal (consideravelmente mais alta que os demais valores). Comparando os boxplots das despesas pessoais temos que a distribuição de valores (medidas de posição) é bem diferente em cada departamento. Agora podemos constatar que o departamento de contabilidade apresenta no geral valores mais altos de despesas pessoais durante os quinze meses em estudo do que o departamento pessoal. Observe inclusive que o primeiro quartil do departamento de contabilidade é realmente próximo do terceiro quartil das observações do departamento pessoal o que colabora com a conclusão que os gastos no departamento de contabilidade são mais elevados. É válido salientar ainda que o gasto de 24,61 (mil reais) é considerado discrepante no departamento pessoal, enquanto que no departamento de contabilidade cerca de 25% dos gastos são mais elevados do que isso. Observação Podemos obter os gráficos no software estatístico R. Os comandos utilizados neste caso são: despesas<-read.table( D:/MAE219/despesas.txt,head=T) despesasfixas<-matrix(c(despesas$fixas.c,despesas$fixas.p), nrow = 15, Página 5 de 8

ncol = 2, byrow = FALSE, dimnames = list(c(),c("depto de Contabilidade", "Depto Pessoal"))) boxplot(as.data.frame(despesasfixas)) despesaspessoal<-matrix(c(despesas$pessoal.c,despesas$pessoal.p), nrow = 15, ncol = 2, byrow = FALSE, dimnames = list(c(),c("depto de Contabilidade", "Depto Pessoal"))) boxplot(as.data.frame(despesaspessoal)) 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 Depto de Contabilidade Depto Pessoal Figura 4: Boxplots das despesas fixas para os departamentos de contabilidade e pessoal obtidos no R 15 20 25 30 Depto de Contabilidade Depto Pessoal Figura 5: Boxplots das despesas pessoais para os departamentos de contabilidade e pessoal obtidos no R. Página 6 de 8

Exercício 3 Numa pesquisa sobre rotatividade de mão-de-obra, para uma amostra de 40 pessoas foram observadas duas variáveis: número de empregos nos últimos dois anos (X) e salário mais recente, em número de salários mínimos (Y). Os resultados são descritos abaixo. X 1 3 2 3 2 2 3 1 2 3 2 3 1 2 3 4 1 2 2 2 Y 6 2 4 1 4 1 3 5 2 2 5 2 6 6 2 2 5 5 1 1 X 2 3 4 1 2 3 4 1 4 3 2 1 1 2 4 3 1 3 2 2 Y 6 2 1 5 4 2 1 5 4 3 2 1 1 6 2 1 4 2 3 5 Responda aos itens abaixo: a) Usando a mediana, classifique os indivíduos em dois níveis, alto e baixo, para cada uma das variáveis, e construa a distribuição de frequências conjunta das duas classificações. b) Qual a porcentagem das pessoas com baixa rotatividade e ganhando pouco? c) Qual a porcentagem das pessoas que ganham pouco? d) Entre as pessoas com baixa rotatividade, qual a porcentagem das que ganham pouco? e) A informação adicional dada em (d) mudou muito a porcentagem observada em (c)? O que isso significa? Solução a) Como temos 40 observações a mediana é o valor que está na posição 40+1 2 = 20, 5. Os valores da variável X ordenados são: 1 1 1 1 1 1 1 1 1 2 20 2 2 2 2 2 2 2 2 2 2 21 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 Portanto, Md X = 2 + 2 2 = 2. Por outro lado os valores ordenados de Y são, Página 7 de 8

1 1 1 1 1 1 1 1 1 2 20 2 2 2 2 2 2 2 2 2 2 21 3 3 3 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 e portanto, Md Y = 2 + 3 2 = 2, 5. De modo que definimos como uma pessoa com baixa rotatividade aquela que possui dois empregos ou menos nos últimos dois anos, isto é X 2, e com alta rotatividade quando X> 2. E definimos como uma pessoa ganhando pouco quando Y 2,5, e ganhando muito quando Y> 2,5. Tabela 6: Distribuição conjunta das duas classificações baixa rotatividade alta rotatividade total ganha pouco 7 13 20 ganha muito 17 3 20 total 24 16 b) A porcentagem de pessoas com baixa rotatividade e ganhando pouco é dada por, 7 100 = 17, 5%. 40 c) A porcentagem de pessoas que ganham pouco é dada por, 20 100 = 50%. 40 d) Entre as pessoas com baixa rotatividade, a porcentagem das que ganham pouco é, 7 100 = 29, 1667%. 24 e) Note que quando restringimos ao grupo de pessoas com baixa rotatividade a porcentagem de pessoas que ganham pouco reduz consideravelmente. Isto significa que as duas variáveis, X e Y são dependentes e que a porcentagem de pessoas que ganham pouco é menor entre aquelas com baixa rotatividade do que entre as com alta rotatividade. Página 8 de 8