Importação e Exportação de dados

Documentos relacionados
R Commander Facilitando o aprendizado da Estatística. George Amarante Melo Jony Arrais Pinto Junior

1 Tabelas Dinâmicas para explorar dados multivariados no Excel Uma tabela dinâmica é uma ferramenta do Excel para criar tabelas e resumir dados.

Aula Prática: Análise Descritiva

Inclusão tecnológica aos discentes do Ensino Fundamental II através do Software R

Aprendizado de Máquina (Machine Learning)

Arquivos, pastas e os formatos próprios do R: RData e rds Planilhas e web: csv, xlsx, XML e JSON Pacotes estatísticos e bancos de dados

ESTATÍSTICA Aula de 07/08/2017. Introdução ao R Variáveis Qualitativas: gráficos

Linguagem R R-Gui e R-Commander

Curso introdutório sobre o Software R

O objetivo dessa apostila é apresentar os comandos básicos do software R, especialmente os voltados para a estimação de modelos econométricos.

Função prcomp. 1. Introdução

Introdução ao R. Anderson Castro Soares de Oliveira

Função prcomp em R. 1. Introdução

Introdução ao STATA vs. 9

CIÊNCIA DE DADOS COM R EMENTA AULA 1 INTRODUÇÃO À LINGUAGEM EM R

Módulo VII: Estatística elementar

Estatística Básica. PhD. Wagner Hugo Bonat 1/2017. Universidade Federal do Paraná. Bonat, W. H. (LEG/UFPR) 1/ / 18

ANÁLISE ESTATÍSTICA DE DADOS USANDO O RSTUDIO

CURSO RÁPIDO. E l a b o r a ç ã o : W a n d e r s o n K l e b e r d e O l i v e i r a W i l d o N a v e g a n t e s d e A r a u j o

Prof. Marcelo Azevedo Costa. Departamento de Engenharia de Produção Universidade Federal de Minas Gerais

Document Capture Pro 2.0 para Windows

Primeiros passos das Planilhas de Obra v2.5 Instalação, configuração e primeiros passos para uso das planilhas de obra

Apostila de estatística básica Minitab Organizador: Daniel Magalhães Lima. Autores:

APOIO À ATIVIDADE DE ANÁLISE DESCRITIVA DESENVOLVIDA NA OFICINA ESTATÍSTICA PARA TODOS"

O Proteo permite que programas PLC e CNC acessem dados armazenados em tabelas, para apenas leitura.

Manual Básico EPIINFO

Para seguir esse tutorial você precisará dos arquivos de dados, Estaueamento.csv e Levantamento Vila Arriete.dgn, que acompanham esse tutorial.

Muitas vezes é necessário exportar os dados do sistema Sphinx para que estes sejam importados em outro sistema.

BIOESTATÍSTICA AULA 2. Anderson Castro Soares de Oliveira Jose Nilton da Cruz. Departamento de Estatística/ICET/UFMT

Análise Exploratória Unidimensional

Bioestatística Aula 2

Tutorial. Edição de DBF usando Excel e Access. Autores: Mauricio Schiavolin Silva, Vitor Pires Vencovsky

Lista de Funções do R

Aula 3 Epi-Info 2000 e Epi-Info 6.04: Análises Estatísticas

PROCEDIMENTO OPERACIONAL PADRÃO

INFORMÁTICA PARA CONCURSO MINISTÉRIO PÚBLICO DO PARÁ Cargo: AUXILIAR DE ADMINISTRAÇÃO.

Introdução a Linguagem C. Prof. Me. Hélio Esperidião

IBM SPSS como Ferramenta de Pesquisa Quantitativa

Apostila de estatística básica R Commander Organizador: Daniel Magalhães Lima. Autores:

R é um linguagem (ambiente) de programação para computação estatística e gráfica. Baseada na linguagem S (S-Plus)

Formação de Green Belt - Módulo 4

As diferenças em um relance

Desenvolvimento de Atividades Educacionais usando o software Hot Potatoes. Utilizando a ferramenta JCross

Análise de agrupamentos por métodos hierárquicos aglomerativos

Estatística Descritiva (II)

Consulta a banco de dados no Spring

Excel Prof. André Aparecido da Silva Disponível em:

3. Como olhar os s da sua conta de do grupo rio do peixe? 6. Como visualizar ou criar novos contatos no e-groupware?

Aula 01 Microsoft Excel 2016

Aprendizado de Máquina (Machine Learning)

Princípios de Bioestatística Estatística Descritiva/Exploratória

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro RESUMO -

Sobre Nova Edição 9. Prefácio 11

TITULO: N o : REVISÃO: Exportação e Importação do livro de Endereço - Swap 000. Instrução de Trabalho

BIOESTATÍSTICA BÁSICA USANDO O AMBIENTE COMPUTACIONAL R

Linguagem R R-Gui e R-Commander

Problemas de compatibilidade de relatórios de Tabela Dinâmica. Problemas que causam perda significativa de funcionalidade

Análise fatorial em R

Fundamentos do R. Prof. Cícero Quarto cicerocq.com

SINECON CARREGA CSV. 2) Converter todas as colunas, exceto de números, para o formato Texto, fazendo:

NIVELAMENTO DE INFORMÁTICA. Professor: Cleber Semensate

O USO DO SOFTWARE R COMO FERRAMENTA DE APOIO À PROBABILIDADE, ESTATÍSTICA E PESQUISA OPERACIONAL EM ENGENHARIA DE PRODUÇÃO

APONTAMENTOS DE SPSS

Linguagem R R-Gui e R-Commander

Apresentação do Microsoft Word

Software R - introdução

Teste t. Para Amostras Independentes

ESCOLA SUPERIOR DE TECNOLOGIA DE TOMAR DEPARTAMENTO DE ENGENHARIA INFORMÁTICA 2006/2007

Excel Prof. André Aparecido da Silva Disponível em:

MANUAL DE UTILIZAÇÃO DO SOFTWARE DE IMPRESSÃO DE ETIQUETAS MOORE.

INFORMÁTICA. Texto para as questões de 1 a 3

Curso Introdução à Educação Digital - Carga Horária: 40 horas (30 presenciais + 10 EaD)

Guia de Consulta Rápida

Desenvolvimento de Atividades Educacionais usando o software Hot Potatoes. Utilizando a ferramenta JCloze

UNIVERSIDADE ESTADUAL DE GOIÁS

Grupo A - I semestre de 2014 Lista de exercícios 2 - Introdução à Estatística Descritiva C A S A (gabarito)

Estatística Aplicada à Administração com o software KNIME. Prof. Dr. Evandro Marcos Saidel Ribeiro

Manual de Utilização do software Colacril Office para criação e impressão de etiquetas. Manual de Utilização

Transcrição:

Importação e Exportação de dados Cristiano de Carvalho Santos Departamento de Estatística, Universidade Federal de Minas Gerais (UFMG)

Importação de dados Muitas vezes os dados que iremos utilizar já foram digitados e armazenados num arquivo utilizando outro programa. Para importar dados externos quando eles estão em formato texto sem a necessidade de digitá-los novamente podemos considerar as funções do R: scan( ), read.table() e read.csv( ).

read.table Principais argumentos: le: Nome do arquivo; header: um argumento lógico indicando se o arquivo contém os nomes das variáveis na primeira linha; sep: argumento que diz como os dados estão separados em cada linha. Se sep = (padrão) o separador é espaço em branco; dec: é o simbolo usado para separar decimal no banco de dados;

read.csv As funções read.csv(), read.csv2(), read.delim() e read.delim2() são praticamente iguais a read.table() porém com diferentes opções default. Em geral (mas não sempre) dados em formato csv usado no Brasil são lidos diretamente com read.csv2().

Instalação de pacotes 1. Menu Pacotes > instalar Pacotes > 0-Cloud > Escolher o pacote; 2. Menu Pacotes > carregar Pacote > Escolher o pacote; 3. Toda vez que o R for iniciado é necessário carregar os pacotes que serão utilizados; 4. É possível instalar e carregar pacotes através de comandos (ver script). Obs: Os espelhos CRAN são servidores distribuídos em diversos países que armazenam o software R.

Arquivos em outros formatos É possível ler dados diretamente de outros formatos que não seja texto (ASCII). Isto em geral é mais eciente e requer menos memória do que converter para formato texto. Muitas funções que permitem a importação de dados de outros programas são implementadas no pacote foreign.

Algumas destas funções são: read.dbf() para arquivos DBASE read.epiinfo() para arquivos.rec do Epi-Info read.mtp() para arquivos "Minitab Portable Worksheet" read.s() para arquivos do S-PLUS restore.data() para "dumps"do S-PLUS read.spss() para dados do SPSS read.dta() para dados do STATA read.xport() para ler do formato TRANSPORT do SAS read.ssd() pode escrever dados permanentes do SAS (.ssd ou.sas7bdat) no formato TRANSPORT O pacote Hmisc disponibiliza sas.get() que também requer o SAS no sistema

Para importar dados do MS-Excel para o R. A função read_excel do pacote readxl; A função read.xlsx do pacote xlsx; Um outro pacote capaz de ler dados diretamente de planilhas é o RODBC. > require(rodbc) > xlscon <- odbcconnectexcel("planilha.xls") > dados1 <- sqlfetch(xlscon, "Planilha1") > odbcclose(xlsconnect) > head(dados1)

Exportação de dados write.table(mydata, "mydata.txt", sep=" "); A função WriteXLS do pacote WriteXLS; write.xlsx(mydata, "mydata.xlsx") do pacote xlsx; No pacote foreign: SPSS: write.foreign(mydata, "mydata.txt", "mydata.sps", package="spss") SAS: write.foreign(mydata, "mydata.txt", "mydata.sas", package="sas") STATA: write.dta(mydata, "mydata.dta")

Função attach A função attach é utilizada para xar o data.frame a ser utilizado; Podemos fazer referência à variável apenas pelo seu nome, sem necessidade de usar o símbolo $. Após terminar de trabalhar com o data.frame xado utilize o comando detach (nome do dataset) para desabilitar o comando attach.

Análise descritiva - variáveis qualitativas Construção de tabelas de frequências: As funções table e ftable podem ser usadas para construir tabelas de frequências; prop.table pode ser usada para calcular frequências relativas; round pode ser usada para determinar o número de casas decimais na exibição dos números; margin.table é utilizada para calcular as somas marginais em tabelas de frequências com mais de uma variável.

Construção de grácos de frequências: barplot: função para gráco de barras; pie: função para gráco de pizza.

Principais parâmetros grácos do R Função par dene vários parâmetros da janela gráca atual. Por exemplo, par(mfrow = c(1, 2)) permite colocar dois grácos lado a lado. Cada tipo de gráco permite congurar inúmeros parâmetros. Alguns deles são: main: Título do gráco; sub: Subtítulo do gráco; xlab e ylab: nomes dos eixos; col: relacionado a cor do gráco; cex.axis, cex.lab, cex.main, cex.sub: relativo ao tamanho da letra; cex: relacionado a tamanho de pontos; xlim e ylim: referente a escala que aparece nos eixos x e y ;

Análise descritiva e exploratória de dados - variáveis quantitativas Algumas funções usadas para a calcular medidas resumo de variáveis quantitativas são: mean, median, summary, quantile; sum, max, min; var, sd;

Grácos Gráco de dispersão; Histograma; Boxplot; Gráco de ramo e folhas; Diagrama de pontos

Objetos na área de trabalho A funções objects( ) e ls( ) mostram todos os objetos da área de trabalho A função rm(a) remove o objeto A da área de trabalho rm(list = ls(all = TRUE)) remove todos os objetos da área de trabalho

Diretório de trabalho Diretório de trabalho é a pasta onde você irá guardar os arquivos com resultados de suas análises ou de onde irá ler dados de arquivos externos. É possível alterar no menu principal getwd( ) mostra qual é o diretório de trabalho atual setwd( C : Users/CristianoSantos/Desktop ) altera o diretório de trabalho para o endereço dentro da função

Salvando a Área de Trabalho Para salvar os objetos criados na durante sua sessão de trabalho Vá ao menu principal, clique em arquivo e depois em salvar área de trabalho. Observe que na linha de comandos aparece a sintaxe do comando executado save.image("c:\\meus documentos aula1.rdata") É possível adicionar este comando no script para que a área de trabalho seja salva automaticamente.

Salvando o Histórico de Comandos Para salvar os comandos utilizados durante a sua sessão de trabalho Vá ao menu principal, clique em arquivo e depois em salvar histórico. Observe que na linha de comandos aparece a sintaxe do comando executado save.image("c:\\meus documentos\\aular\\aula1")

Salvando o Output Salvar os resultados mostrados no console em um arquivo de texto Vá ao menu principal, clique em arquivo e depois em salvar em arquivo É possível salvar apenas um parte dos resultados que esteja selecionada