Introdução aos métodos de entrada e aquisição de dados através dos softwares R e EPIDATA Carlos Renato dos Santos carlosrenato@estatistico.com www.saudecoletiva.estatistico.com Organização da aula Parte I EPIDATA (05/06/2014) O que é e para que serve? Objetivos e finalidades. Definir dados. Criar arquivo de dados. Controles Entrada de dados. Documentação Exportação (TXT -> R) 1
Onde obter os programas? Sites oficiais (recomendado) www.epidata.dk www.r-project.org Site da disciplina www.saudecoletiva.estatistico.com/soft.htm Ambiente para confecção digital do questionário de papel com entradas padronizadas e controladas. 2
Em grandes pesquisas existe a necessidade de controlar e documentar um razoável volume de informações. Em geral são muitas variáveis e muitos casos (entrevistas). É preciso estabelecer um padrão para tais dados com fins de agilizar e tornar confiáveis as futuras análises. Diminuir possíveis erros de digitação Melhorar o ambiente de entrada de dados Automatizar algumas transformações Definir a estrutura dos dados Documentar dados Exportar dados para análises 3
4
Pesquisa de campo Definir dados Criar arquivo de dados Controles Entrada Documentação Exportação Definir dados: Criação de variáveis com definição de tipos e rótulos. Criar arquivo de dados: Gera estrutura para salvar os registros. Controles: Cria regras de entradas e saltos. Entrar dados: Visualiza o formulário final para entrar informações. Exportar dados: Exporta os dados armazenados para algum software de interesse. 5
Definir dados Formatar o questionário eletrônico de forma parecida ao questionário de papel. As entradas devem ser formatadas na seguinte seqüência: NomeVar LabelVar TipoVar Sexo Qual seu sexo? # Definir dados Tipos principais de variáveis de entrada Numérica Texto Data Outros 6
Definir dados Variáveis numéricas Sexo Qual seu sexo? # Idade Qual sua idade? ## Renda Qual sua renda? ####.## Definir dados Variáveis texto film Qual filme você assistiu? Mot Qual motivo do não pagamento? 7
Definir dados Variáveis data Datades Data de adesão <dd/mm/yyyy> Data automática Dathoje Data de hoje <Today-dmy> Exemplo de definição de dados Pesquisa sobre filmes Uma pesquisa sobre filmes assistidos na última semana (entre 20/11/2011 e 26/11/2011) foi conduzida em um publico alvo com idade entre 18 e 40 anos de idade. 8
Exemplo de definição de dados Questionário Sexo? Qual sua idade? Qual sua renda? Tem filhos? Seus filhos estudam em escola pública ou particular? Você assistiu filmes nesta última semana? Qual(is) filme(s) e quando? Exemplo de definição de dados PESQUISA SOBRE FILMES sex Sexo? # age Qual sua idade? ## income Qual sua renda? ####.## flagson Tem filhos? # flagesc Seus filhos estudam em escola pública ou particular? # flagmov Você assistiu filmes nesta última semana? # f1 data1 f2 data1 f3 data1 Qual(is) filme(s) e quando? Data que assistiu o filme 1? <dd/mm/yyyy> Qual(is) filme(s) e quando? Data que assistiu o filme 2? <dd/mm/yyyy> Qual(is) filme(s) e quando? Data que assistiu o filme 3? <dd/mm/yyyy> 9
Exemplo de definição de dados Controles > Amplitude desejada 10
Controles > Se o entrevistado não tem filhos a próxima pergunta não se aplica. > Saltos Controles > Saltos 11
Entrar dados Ambiente de entrada de dados com controles e pré-definições do pesquisador. Documentação dos dados Documentação dos dados. Informações sobre nomes de variáveis, rótulos, amplitudes aceitáveis, visualizações... No. Nome Rótulo de variável Tipo de campo Largura Controles Rótulo de valores ------------------------------------------------------------------------------------------------------ 1 sex Sexo? Número 1 Must enter rótulo_sex Legal: 1-2 1: Masculino 2: Feminino 2 age Qual sua idade? Número 2 Must enter Legal: 18-40 3 income Qual sua renda? Número 7:2 4 flagson Tem filhos? Número 1 Must enter rótulo_flagson Legal: 0-1 0: Não Jumps: 0>flagmov 1: Sim 5 flagesc Seus filhos Número 1 Legal: 1-2 rótulo_flagesc estudam em 1: Pública escola pública 2: Particular ou particular? 12
Exportar os dados digitados Possibilidades de exportação disponíveis A exportação carregas todos os rótulos e categorias alimentados no EPIDATA 3.1!!! Arquivos de texto -> R a<-read.table( ENDEREÇO,sep=";",header=T) 13