Universidade Federal do Rio de Janeiro Faculdade de Medicina Departamento de Medicina Preventiva Núcleo de Estudos de Saúde Coletiva Disciplina: Modelos de Regressão em Saúde Introdução ao STATA vs. 9 Tania Guillén de Torres Rejane Sobrino Pinheiro 2009
Introdução ao STATA 9.0 STATA é um Software estatístico que permite analisar grandes bases de dados, usando métodos estatísticos, que poderiam ir desde uma estatística descritiva simples ate o ajuste de modelos bastante complexos. 1. Vantagens: a) Boa interface com processadores de texto e impressoras b) Requer pouco espaço no disco rígido (winchester) c) Requer pouca memória RAM - se necessário é possível aumenta-la d) Importa arquivos do tipo ASCII e planilhas e) É possível copiar e colar no editor do STATA dados de outras planilhas f) Métodos gráficos poderosos na parte de diagnóstico de modelos g) É atualizado con freqüência - publica o Stata Technical Bulletin. Na página www.stata.com encontram-se disponíveis diversas rotinas que podem ser copiadas para o diretório c:\ado e executadas dentro do Stata. 2. Desvantagens Não importa arquivos de bancos de dados (Dbase, Epi Info, Acces, etc.) diretamente requer de um programa de interface (Stat-Transfer) 3. Particularidades do STATA a) Os comandos podem ser executados através da barra de ferramentas do STATA, ou também através da janela de comandos (neste caso devem ser digitados somente em letra minúscula). b) As linhas que iniciam com um * são consideradas pelo STATA como comentários, nelas pode-se usar letras maiúsculas. c) STATA diferencia as letras maiúsculas das minúsculas nos nomes das variáveis, assim peso1 seria uma variável diferente de Peso1 e de PESO1. d) Possui diretório default de trabalho, geralmente c:\data 4. Operadores usados pelo STATA Operadores Aritméticos + Adição - Subtração * Multiplicação / Divisão ^ exponenciação Operadores Lógicos & e ou ~ ou! não Operadores Relacionais > maior >= maior igual < menor <= menor igual = igual ( Obs. Após o comando if devemos usar == ) ~= diferente!= diferente Obs. As expressões lógicas assumem o valor 1 para verdadeiro e 0 para falso. TGT/RSP 2
5. Iniciando o STATA Clicar 2 vezes no ícone do STATA do Windows Caso não exista o ícone clique a seguinte seqüência: iniciar Programas Stata 6.Janelas do STATA A apresentação do STATA é semelhante a qualquer programa windows, apresentando uma barra de ferramentas e diversas janelas que permanecem abertas na sessão Stata. Command : Dos comandos a serem executados Results : Saídas dos comandos digitados Variables : Lista de variáveis do banco em uso Review : Lista de Comandos já executados Graph : Gráficos 6. Barra de Ferramentas do STATA Permite a execução de diversas tarefas de forma análoga à maioria dos programas para o sistema Windows, Os comandos também podem ser digitados a partir da janela dos comandos e se necessario repetidos clicando duas vezes no comando desejado a partir da janela [Review] TGT/RSP 3
Opções da Barra de Ferramentas: File: Permite realizar tarefas do tipo: 1. Abrir e salvar bases de dados no formato STATA (*.dta) 2. Abrir e salvar gráficos criados pelo STATA 3. Executar programas de comandos criados pelo usuário (*.do) 4. Abrir e salvar arquivo que guardem as saídas da janela de resultados, 5. Importar e salvar arquivos em formato ASCII. Edit É possível: Copiar e colar: 1. bases de dados 2. Saídas da janela de Resultados em formato texto ou tabela Preferences: Permite personalizar as cores das janelas do Stata Gráficos Voltar as configurações Padrão TGT/RSP 4
Data: Descrever o banco de dados Editar a base de dados Sortear o banco Combinar bases de Dados do tipo: Append ou Merge Criar rótulos para a base de dados, variáveis ou categorias de variáveis Mudar o nome das variáveis, eliminar observações / variáveis Procurar observações duplicadas Operações com matrizes Calculadora Graphics: Elaborar gráficos tipo: Histograma Boxplot Barra Setores Dispersao, Diagnósticos para os modelos de regressão Series Temporais Controle de qualidade Etc. TGT/RSP 5
Statistics: Estatística descritiva (Médias, proporçoes, intervalos de confiança, testes de hipóteses, etc. Modelos de: Regressão Linear Logística Sobrevida Lineares Generalizados Séries Temporais (Arima, Arch/Garch) Dados Longitudinais Amostragem Complexa Analise Multivariada (Componente principais, Analise Fatorial, etc.) Bootstrap/Jackknife Janela Window Permite ativar as diferentes janelas do Stata: Result, Command,Review, Variables, etc. Janela do HELP: O Stata tem una janela de ajuda que permite lembrar a sintaxe dos comandos, importar e instalar rotinas desenvolvidas por outros pesquisadores, atualizar o programa executável do Stata (watata.exe) etc. Para ativa-la basta clicar no botão [Help] na barra de ferramentas. Na opção Search aparecera a seguinte Janela na qual é possível escolher se a pesquisa será feita no manual do usuário, na internet ou em ambos e a janela [Keywords] permite digitar o nome do comando desejado ou uma palavra chave relacionada ao assunto da pesquisa. TGT/RSP 6
Outras opções da Barra de Ferramentas: Janela [Log ]: Permite salvar as saídas da sessão STATA e mostrar o conteúdo do arquivo que guarda as saídas. Clicar no botão: [ Log...] no Menu do Windows ou na opção Log Escolha o diretório e a seguir escreva o nome do arquivo no qual vai salvar as saídas da sessão Stata. O arquivo pode ser novo ou usar um antigo, neste último caso o Stata perguntará se escreve por cima (apaganto o conteúdo) ou continua a escrever a partir da última linha do arquivo Diretório Nome do Arquivo Apertando novamente no botão [ Log...], podem-se escolher as seguintes alternativas: TGT/RSP 7
olhar as saídas dos comandos executados fecha o arquivo *.log suspende temporariamente a gravação das saídas no arq. log Resume redireciona as saídas novamente ao arq.log 7. Como abrir e Fechar um banco de Dados 7.1 Como usar um banco de dados já existente Clicar no botão [ File ] do menu, a seguir escolha a opção [open...] e na janela Use New Data escolha o diretório e o nome do banco a ser usado. Também é possível abrir um banco a partir da janela de comandos, digitando nesta janela o comando use seguido do diretório e nome do arquivo, ex: use c:\data\arq1.dta 7.2 Como salvar seu banco de dados Os dados podem ser salvos em arquivos usando a barra de menu do Stata ou usando a janela de comandos. Usando a barra de menu: Clicar no botão [ File ] do menu, escolha a opção [save as] e a seguir selecione o diretório e o nome do banco se o arquivo já existe, o Stata perguntará se escreve por cima do arquivo existente [y / n] TGT/RSP 8
Usando a janela de comandos, digite save e a seguir o diretório e o nome do arquivo. save "C:\DATA\aula1.dta" se o arquivo já existe, inclua a opção replace: save "C:\DATA\aula1.dta", replace 8. Criando um banco de dados no STATA 8.1. Entrada de Dados: Escolha a opção Data do menu Stata e a seguir Data editor ou Clicar no botão Digitar os dados na planilha Stata - uma coluna por variável e uma linha por paciente. O Stata automaticamente escolhera o tipo da variável de acordo com os valores digitados, vermelho representa uma variável caracter (string), preto uma variável numérica. Para dar nome à variável clique 2 vezes numa célula da coluna correspondente e digite o nome da variável, que deverá ter no máximo 8 caracteres no campo Name e o rótulo da variável no campo Label. TGT/RSP 9
Stata usa o ponto. para indicar que a observação é missing. 8.2. Adicionando novas observações Na janela do [Data Editor ], bastará digitar as novas observações nas linhas vazias que se encontram após a última preenchida. 8.3. Adicionando novas variáveis Na janela do editor basta digitar os valores da nova variavel na primeira coluna vazia e depois atribuir-lhe um nome. Não esqueça de apertar o botão [Preserve] para que o Stata guarde as mudanças feitas no banco de dados, a seguir aperte o [X] no canto superior direito para sair da janela do editor. Salve o banco na janela File e escolhendo a opção [Save as], indique a seguir o diretório e escreva o nome do arquivo. 9. Importação / Exportação de Dados Lembre que o Stata tem os recursos do windows copiar=ctrl+c e colar=ctrl+v que permitem importar qualquer planilha tipo windows ou salvar bancos do tipo Stata (*.dta) em outros tipos de planilhas. 9.1 Como importar um banco ASCII 9.1.1 Variáveis digitadas separadas por espaços brancos: Os comandos Import na opção [File] do menu Stata ou infile na janela de comandos do STATA permitem ler um banco de dados em formato ASCII. No comando TGT/RSP 10
infile deve-se especificar o tipo e o nome de cada variável e indicar o diretório e o nome do banco de dados, exemplo: > infile str10 nome idade using "E:\exexport.dat" > infile id age fev hgt sex smoke using c:\data\fev.dat 9.1.2 Uso de um dicionário para ler um banco em formato fixo: O dicionário deve ser escrito em formato ASCII e deve especificar o comando dictionary, o nome do banco contendo os dados em formato ASCII e o tipo e a extensão de cada variável no banco. Por exemplo: 9.2 Como exportar um banco ASCII Para exportar um banco de dados *.dta no formato ASCII, para que possa ser importado por qualquer outro pacote que leia este formato, use os comandos: Export na opção [File] do menu Stata ou outfile na janela de comandos. O comando a seguir, exportaria todas as variáveis do banco Stata em uso para o arquivo exexport.dat em formato ASCII: > outfile using e:\exexport.dat Existe o aplicativo Stata/Transfer do propio STATA que permite transformar bancos tipo Stata para outros formatos, por exemplo DBASE, STATISTICA, SPSS, etc. TGT/RSP 11