Análise Exploratória de Dados

Documentos relacionados
Universidade Federal Fluminense INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA

Lista 8 - Introdução à Probabilidade e Estatística

Lista de Exercícios II - Probabilidade e Estatística

UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPTO. DE ESTATÍSTICA LISTA 1-BIOESTATÍSTICA II (CE020)

SÉRIE: Estatística Básica Texto: ANÁLISE BIDIMENSIONAL SUMÁRIO 3. EXERCÍCIOS APÊNDICE REFERÊNCIAS...21

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016.

INE 7001 Estatística para Administradores I Turma Prática 1 15/08/2016 GRUPO:

Estatística 1 - Lista de Exercícios 4-21/06/ Professor José Carlos Fogo

Lista de exercicios 1 Prof.: Marcus Guimaraes Disciplina: Introdução a Estatística Econômica

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

Estatística 1 - Lista de Exercícios 4 Professore José Carlos Fogo

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

Métodos Quantitativos II

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

1. Registou-se o número de assoalhadas de 100 apartamentos vendidos num bairro residencial

UNIVERSIDADE DE SÃO PAULO ESCOLA SUPERIOR DE AGRICULTURA LUIZ DE QUEIROZ DEPARTAMENTO DE CIÊNCIAS EXATAS

3. Repita o Exercício 1, supondo que os desvios padrões dados se refiram a amostras e não a populações.

Bioestatística CE001 Prof. Fernando de Pol Mayer Departamento de Estatística DEST Exercícios: medidas resumo Nome: GABARITO

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência

Grupo A - 1 semestre de 2012 Lista de exercícios 2 - Estatística Descritiva II C A S A (gabarito)

PLANO DE CONTEÚDO MÍNIMO (PCM) - UNIDADE UNIVERSITÁRIA DE COMPUTAÇÃO. Professora Rosana da Paz Ferreira CCB1052 (2018.2)

PLANO DE CONTEÚDO MÍNIMO (PCM) - UNIDADE UNIVERSITÁRIA DE COMPUTAÇÃO. Professora Rosana da Paz Ferreira CCB1052 (2018.2)

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

UNIVERSIDADE FEDERAL DE RONDÔNIA CAMPUS DE JI-PARANÁ DEPARTAMENTO 3 ENGENHARIA AMBIENTAL LISTA DE EXERCÍCIOS 4

Lista de Exercícios Cap. 2

Descrevendo Distribuições com Números TADI

Aula IV. Representação gráfica e regressão linear. Prof. Paulo Vitor de Morais

Hoje vamos analisar duas variáveis quantitativas conjuntamente com o objetivo de verificar se existe alguma relação entre elas.

ESQUEMA FATORIAL: DESDOBRAMENTO

SME0320 Estatistica ICMC-USP Ricardo Ehlers Lista 1

SME0123 Estatistica ICMC-USP Ricardo Ehlers Lista 1

Seção 2.1. Distribuições de freqüência e seus gráficos

Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM

ANÁLISE DE DADOS: DÉCIMA LISTA DE EXERCÍCIOS

MÉTODOS QUANTITATIVOS APLICADOS. Prof. Danilo Monte-Mor

Na aula do dia 24 de outubro analisamos duas variáveis quantitativas conjuntamente com o objetivo de verificar se existe alguma relação entre elas.

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Cap. 6 Medidas descritivas

Estatística para Cursos de Engenharia e Informática

Universidade Federal de Mato Grosso - UFMT ESTATÍSTICA Lista 1. 1) Defina POPULAÇÃO e AMOSTRA e cite pelo menos 3 vantagens da amostragem.

AGRUPAMENTO DE ESCOLAS DE VILA VIÇOSA GRUPO DE MATEMÁTICA ANO LECTIVO 2018 / 2019 MATEMÁTICA APLICADA ÀS CIÊNCIAS SOCIAIS 10º ANO

Regressão linear simples

2009 FATEC GT/FATEC SJC

Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó. Categoria O 1 O 2 O 3 O 4 Freqüência

Análise da Regressão. Prof. Dr. Alberto Franke (48)

Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16)

MAE0219 Introdução à Probabilidade e Estatística I

CONHECIMENTOS ESPECÍFICOS

Prova de Conhecimentos Específicos

Exercícios de programação

2. Faça cada um dos cálculos indicados a seguir, apresentando os resultados com

Estatística 1 - Lista de Exercícios Extra Professor José Carlos Fogo

Estatística Descritiva. Objetivos de Aprendizagem. 6.1 Sumário de Dados. Cap. 6 - Estatística Descritiva 1. UFMG-ICEx-EST. Média da amostra: Exemplo:

Questão 1: Questão 2: Defina tratamentos, fator, nível, parcela, subparcela, coeficiente de variação e interação entre fatores.

Roteiro de Aula Delineamentos Fatoriais 05/06/2018

(a) Use cinco intervalos e construa um histograma e o polígono de frequência. (b) Determine uma medida de posição central e uma medida de dispersão.

Estudar a relação entre duas variáveis quantitativas.

Medidas Descritivas de Posição, Tendência Central e Variabilidade

PROGRAMA e Metas Curriculares Matemática A. Estatística. António Bivar, Carlos Grosso, Filipe Oliveira, Luísa Loura e Maria Clementina Timóteo

Tutorial para o desenvolvimento das Oficinas

Escola Secundária de Jácome Ratton

Aula 3: Análise Exploratória de Dados Espaciais (AEDE) Prof. Eduardo A. Haddad

Análise de Regressão

Capítulo 2. Distribuições de Probabilidade Estimativas de parâmetros e tempos-atéfalha. Flávio Fogliatto

Profa. Lidia Rodella UFPE-CAA

1 a Lista de PE. Universidade de Brasília Departamento de Estatística

MEDIDAS DE DISPERSÃO

Universidade Federal de Alfenas Programa de Pós-graduação em Estatística Aplicada e Biometria-PPGEAB Prova de Conhecimentos Específicos

Exemplo 1. Conjunto de dados de uma amostra de 12 meninas da escola: y i x i

(ii) Acrescente lucros ao modelo da parte (i). Por que essa variável não pode ser

Universidade Federal de Mato Grosso - UFMT ESTATÍSTICA Lista 1 - Agronomia. 1) Defina POPULAÇÃO e AMOSTRA e cite pelo menos 3 vantagens da amostragem.

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA LISTA DE EXERCÍCIOS PROVA 2- BIOESTATÍSTICA

1 2 3 Média (kg) Desvio Padrão (kg) 10 3,3 11

ESCOLA SECUNDÁRIA DE CALDAS DAS TAIPAS

Prof. Dr. Lucas Santana da Cunha de abril de 2018 Londrina

Universidade Federal de Viçosa Departamento de Estatística

Questão 1 Sabe-se que o consumo mensal per capita de um determinado produto tem distribuição normal com desvio padrão σ = 2kg

Universidade Federal de Mato Grosso - UFMT ESTATÍSTICA Lista 1 - Administração

Regressões: Simples e MúltiplaM. Prof. Dr. Luiz Paulo Fávero 1

Experimentos Fatoriais

Engenharia da Qualidade I Aula 5

ESCOLA SECUNDÁRIA JAIME MONIZ Matemática Aplicada às Ciências Sociais 10º ano

Universidade Federal do Paraná Departamento de Estatística Disciplina CE001 Bioestatística Turma A Prof. Cesar Augusto Taconeli

Prof. Sérgio Carvalho Estatística. I Jornada de Especialização em Concursos

P x. 2 i = P y. 2 i = Analise os dados e comente a possibilidade de existir uma relação linear entreasvariáveisemestudo.

Exercício 4 Calcule média e o desvio padrão distribuição de frequências dada abaixo:

Lista 1 Estatística Aplicada à Gestão Prof. Herivelto Marcondes

Transcrição:

Análise Exploratória de Dados

Objetivos da aula Resolver exercícios do livro-texto com o auxílio do R.

1) Exercício 29 Uma amostra de dez casais e seus respectivos salários anuais (em salários mínimos) foi colhida num certo bairro conforme a tabela a seguir Mulher (X) 5 10 10 5 10 10 15 10 10 15 Homem(Y) 10 10 10 15 15 15 15 20 20 20

1) Exercício 29 (a) Obtenha um sumário para os salários dos homens e das mulheres contendo, média, desvio-padrão, esquema dos cinco números. (b) Construa o diagrama de dispersão dos salários das mulheres versus salários dos homens. (c ) Calcule a correlação entre salários de mulheres e de homens.

1) Exercício 29 (d) Qual é o salário médio familiar? E a variância? (e) Se o homem é descontado 8% e a mulher 6%, qual é o salário líquido anual médio familiar? E a variância?

2) Exercício 26 Muitas vezes a determinação da capacidade de produção instalada para certo tipo de indústria em certas regiões é um processo difícil e custoso. Como alternativa, pode-se estimar a capacidade de produção através da escolha de uma outra variável de medida mais fácil e que esteja linearmente relacionada com ela.

2) Exercício 26 Suponha que foram observados os valores para as variáveis: capacidade de produção instalada, potência instalada e área construída. Com base num critério estatístico, qual das variáveis você escolheria para estimar a capacidade de produção instalada? Por que?

2) Exercício 26 Dados: capacidade (ton.) 4 5 4 5 8 9 10 11 12 12 potência (1000kW) 1 1 2 3 3 5 5 6 6 6 área (100m2) 6 7 10 10 11 9 12 10 11 14

3) Exercício 22 Uma pesquisa para verificar a tendência dos alunos a prosseguir os estudos, segundo a classe social do respondente, mostrou o seguinte quadro: Pretende continuar? Alta Média Baixa Total sim 200 220 380 800 não 200 280 720 1200 Total 400 500 1100 2000

3) Exercício 22 Pretende continuar? Alta Média Baixa Total sim 200 220 380 800 não 200 280 720 1200 Total 400 500 1100 2000 a) Você diria que a distribuição de respostas afirmativas é similar à de respostas negativas? b) Existe dependência entre as duas variáveis: classe social e resposta a pretende continuar os estudos? Determine uma medida quantitativa da dependência. c) Se dos 400 estudantes da classe alta, 160 escolhessem continuar os estudos e 240 não, você mudaria a sua conclusão? Justifique

4) Exercício 30 O departamento de vendas de certa companhia foi formado há um ano com a admissão de 15 vendedores. Nessa época foram observados para cada um dos vendedores os valores de três variáveis: teste: resultado em um teste apropriado para vendedores; exp: experiência de vendas; concger: conceito do gerente de venda, quanto ao currículo do candidato;

4) Exercício 30 O diretor da companhia resolveu agora ampliar o quadro de vendedores e pede sua colaboração para responder a algumas perguntas. Para isso, ele lhe dá informações adicionais sobre duas variáveis: vendas: volume médio mensal de vendas em salários mínimos; zona: zona da capital para a qual o vendedor foi designado.

4) Exercício 30 Os dados estão armazenas no arquivo exerc30.txt com os nomes das variáveis na primeira linha. Mais especificamente, o diretor pede que as seguintes tarefas sejam realizadas: a) Histograma das vendas em classes de amplitude 10, tendo por limite inferior da primeira classe o valor 15.

4) Exercício 30 b) Média e variância das vendas. c) Suponha que um vendedor seja considerado excepcional se sua venda está acima de dois desvios-padrões da média. Há vendedores excepcionais entre os 15 iniciais? d) O diretor de vendas anunciou que transferirá para outra praça todos os vendedores cujas vendas foram inferior ao primeiro quartil da distribuição. Qual o mínimo de vendas para não ser transferido?

4) Exercício 30 e) Os vendedores argumentam com o diretor que esse critério não é justo, pois há zonas de venda privilegiadas. A quem você daria razão? Justifique a sua resposta. f) Qual das três variáveis iniciais é mais importante para julgar o futuro candidato ao emprego? Justifique.

4) Exercício 30 g) Qual é o grau de associação entre o conceito do gerente e a zona a que o vendedor foi designado? Você tem alguma explicação para esse resultado? h) Qual é o grau de associação entre o conceito do gerente e o resultado no teste? E entre zona e vendas?

5) Exercício 20 Na tabela a seguir, você concluiria que o tipo de atividade está relacionado ao fato de as embarcações serem de propriedade estatal ou particular? Encontre uma medida de dependência entre as variáveis. propriedade ativ. costeira ativ. fluvial ativ. internacional total estatal 5 141 51 197 particular 92 231 48 371 total 97 372 99 568

6) Exercício 11 (cap. 15) Deseja-se verificar o efeito do tipo de impermeabilização (i,ii,iii ou iv) em lajes de concreto. As quantidades de água que passaram pela laje, em cada tipo, foram medidas durante um mês, obtendose a seguinte tabela: i ii iii iv 56 64 45 42 55 61 46 39 62 50 45 45 59 55 39 43 60 56 43 41

6) Exercício 11 (cap. 15) Você diria que há alguma associação entre o tipo de impermeabilização e a quantidade de água que passa pela laje? Justifique a sua resposta.

7) Exercício 19 (cap. 16) Os dados a seguir correspondem às variáveis renda familiar e gasto com alimentação numa amostra de dez famílias. renda gasto 3 1.5 5 2 10 6 20 10 30 15 50 20 70 25 100 40 150 60 200 80

7) Exercício 19 (cap. 16) Construa o diagrama de dispersão de renda versus gasto com alimentação e calcule a correlação amostral. Obtenha a reta de mínimos quadrados. Estime o gasto com alimentação para uma família de renda 170.

8) Novo medicamento Num estágio do desenvolvimento de uma nova droga para uma alergia, um experimento foi conduzido para estudar o quanto diferentes dosagens do medicamento afeta a duração do alívio dos sintomas da alergia. Dez pacientes foram incluídos no experimento. Cada paciente recebe uma dosagem específica do medicamento e é monitorado.

8) Novo medicamento Os dados estão na tabela abaixo DOSE DURAÇÃO 3 9 3 5 4 12 5 9 6 14 6 16 7 22 8 18 8 24 9 22

8) Novo medicamento Obtenha o diagrama de dispersão de dose versus duração do alívio. Calcule a correlação. Obtenha a reta de mínimos quadrados. Estime a duração do alívio para uma dose de 7,5. Faça o diagrama de dispersão dos valores ajustados versus resíduos do modelo ajustado.

9) Receitas de pão Três receitas de pão vão ser comparadas com respeito à densidade do pão. Cinco pães foram feitos segundo cada uma das receitas. Os resultados estão na tabela a seguir: receita observações I 0.95 0.86 0.71 0.72 0.74 II 0.71 0.85 0.62 0.72 0.64 III 0.69 0.68 0.51 0.73 0.44

9) Receitas de pão Você diria que há alguma associação entre receita e densidade? Obtenha os boxplots das densidades segundos as receitas. Calcule o R 2.