José Roberto Motta Garcia garcia.cptec@gmail.com
Fases da análise de dados Tratamento de dados
Resumo estatístico dos dados - comandos
Resumo estatístico dos dados - resultados
Agrupamento pela soma (via função) e ordenação de resultados - 1 Lê-se: somatória dos votos em função do estado e candidato
Agrupamento pela soma (via função) e ordenação de resultados - 2 Soma por candidato + estado Soma por candidato Soma por candidato (ordenado)
Agrupamento pela média (via data.table) Data.table possui recursos para fazer agregações
Agrupamento pela média (via data.table) Data.table possui recursos para fazer agregações
Tipos de variáveis Tabela de Contingência (ou de frequência) Contabiliza (conta) obs de duas ou mais variáveis (normalmente qualitativas) QUALITATIVA QUANTITATIVA NOMINAL ORDINAL DISCRETA CONTÍNUA não pode ordenar pode ordenar Contável Não contável Quantidades Estado civil Nível educação Idade Peso Religião Classe social Capacidade de passageiros Altura Sexo Faixa de idade Núm. de filhos Largura Medidas Região Núm. De carros Produção de leite Raça Cor dos olhos Salário
Tabela de contingência - univariável
Tabela de contingência - multivariável hp cilindros `
Visualização de séries temporais
Visualização de séries temporais multivariada
Histograma e densidade análise univariada
Gráfico de barras e pizza análise univariada
Gráfico de barras análise multivariada Long Shape
Scatterplot - Distribuição de uma variável em relação a outra (bivariada)
Conceito - Correlacionamento Métodos: - Pearson - Spearman Fonte: www.simplypsychology.or g/correlation.html Perfeita Negativa Perfeita Positiva Bem Bem Bem forte forte mod frac frac frac nula frac mod forte Bem a a forte a a -1.8.6.4.2 0.2.4.6.8 1 As duas distribuições variam em sentidos inversos. Enquanto uma aumenta a outra diminui. As duas distribuições variam no mesmo sentido. Uma aumenta e a outra também.
Scatterplot 3D
Scatter PLot of Matrix (SPLOM)