OFICINA DE FERRAMENTAS COMPUTACIONAIS PARA A DOCUMENTAÇÃO E DESCRIÇÃO LINGUÍSTICA. Extração e codificação de dados (software R)

Documentos relacionados
METODOLOGIA DE COLETA E MANIPULAÇÃO DE DADOS EM SOCIOLINGUÍSTICA

SUBIR LISTAS DE S SÉRIE MANUAIS DA FERRAMENTA ALL IN MAIL SUBIR LISTA DE S SÉRIE MANUAIS DA FERRAMENTA ALL IN MAIL

RAD1509 Estatística Aplicada à Administração II Prof. Dr. Evandro Marcos Saidel Ribeiro R e RStudio

Análise de Tradução MS GSS

OBJETIVOS Selecionar dados aplicando AutoFiltro. Classificar dados por uma ou mais chaves. Aplicar o Filtro Avançado.

Relatórios Dados Federação Nesta opção serão listados os relatórios dos cadastros Federativos.

Manual de Instalação SOFTWARE FACELITE. Adolfo Bratfisch BIOMTECH RUA SATURNO, 31 - SANTA LÚCIA - BELO HORIZONTE - MG

UNIVERSIDADE REGIONAL DO CARIRI-URCA CENTRO DE CIÊNCIA E TECNOLOGIA AUTOR: DANILO DE ARAÚJO ANDRADE ORIENTADOR: RENATO OLIVEIRA FERNANDES

Inclusão tecnológica aos discentes do Ensino Fundamental II através do Software R

Introdução ao R Commander. Marcelo Lauretto

Manual de instalação e operação do Sistema Supervisório MMS-03

Ativar licença DS Starview

Consolidar dados de várias planilhas em uma única planilha

Ponto Secullum 4 Cópia de segurança

2- Carregar o código executável para o testbed e configurar o experimento

DIRECTSUBMIT. SafeAssign AMBIENTE VIRTUAL DE APRENDIZAGEM TUTORIAL DO. DirectSubmit. Autor(es) Natália Regina de Souza Lima

LÓGICA DE PROGRAMAÇÃO PARA ENGENHARIA TUTORIAL OPENWATCOM: CRIANDO O PRIMEIRO PROGRAMA

Manual de Integração. Versão 1.0.2

Manipulação e transcrição de áudio (softwares Audacity e Transcriber)

Dados Externos e SIG: Importação de arquivos de texto para uma planilha eletrônica

Tutorial Produzindo mapas

edictor 1.0 beta 010 M a n u a l F e v e r e i r o, Paixão de Sousa, Kepler & Faria 2010 Versão 2014 do Manual: Igor Leal

R Commander Facilitando o aprendizado da Estatística. George Amarante Melo Jony Arrais Pinto Junior

Desvendando o Excel. Prof. Bruno Gomes

1 Introdução. 2 Especificação

INSTALAÇÃO EM 1 (um) COMPUTADOR INSTALAÇÃO EM REDE

Como abrir arquivo XML no Excel

TUTORIAL CONSULTA DE PREÇOS GERTEC TUTORIAL CONSULTA DE PREÇOS GERTEC 1 / 8

A importância do Backup

SISTEMA PROVINHA BRASIL GUIA DE USO ESCOLAS DIRETORIA DE AVALIAÇÃO DA EDUCAÇÃO BÁSICA DAEB

Dividir nomes usando o Assistente para Conversão de Texto em

Validador Sintegra e TED

Apostila de Excel 2007

Manual de Uso Portal do Fornecedor Consulta Conta Corrente

Gerando um programa executável a partir de um módulo Python

Florianópolis, 11 de março de Sped Fiscal EFD Manual de Geração do Arquivo

INSTALAÇÃO DO CLIENTE LOTUS NOTES ROTEIRO DE INSTALAÇÃO E CONFIGURAÇÃO

Baixando o Arquivo de Instalação do Bentley topograph

15/07/ :15 Leite Júnior QUESTÕES CESPE /07/ :15 Noções de sistema operacional Windows

GLOSSÁRIO DE MATEMÁTICA

SmartMail. Intrudução

Tutorial Planilha de Ressarcimento

BAUR Software para a gestão de dados de medição ITS Lite

Novo Sistema de Relatórios. Associado. Informação Confidencial

Gráfico de barras e linhas: como fazer

Conhecendo a aba Início

Conteúdo Como gerar os arquivos pelo WinMFD da Bematech?... 3 Como saber a data do arquivo?... 9 Como copiar os arquivos gerados para o PENDRIVE:...

Figura 1 - Planilha Relatório de Notas 1

Programa. eecfc. Guia para leitura de dados de usuário de ECFs Sweda com MFD (Atualizado com a versão eecfc 3.12)

CI218 - Trabalho - 2 o sem/2016

SOLICITAÇÃO DE CERTIFICADO SERVIDOR TOMCAT

Tutorial. Editando os arquivos de banco de dados. Autores: Vitor Pires Vencovsky, Rodrigo Viviani

1 Como compilar seu código? 2 Comandos de terminal:

Introdução à Programação Aula 16. Prof. Max Santana Rolemberg Farias Colegiado de Engenharia de Computação

Tutorial Editando os arquivos de banco de dados

TUTORIAL Rbio - Biometria no R 1

Introdução. O BOCA Online Contest Administrator é um sistema de correção online de códigos utilizado em competições de programação de computadores.

Manual de Uso Portal do Fornecedor Consulta Estoque e Venda do CD

PREFEITURA DO MUNICÍPIO DE OSASCO SECRETARIA DE FINANÇAS

Para mostrar como executar uma aplicação básica no testbed CéuNaTerra, usaremos a aplicação Blink disponibilizada junto com o TinyOS.

Criação de Superfície desde um Arquivo de Texto

Prof. Paulo Borges. ao lado do campo Proprietário, clique no botão Novo e preencha os dados, conforme tela abaixo, em seguida clique em Salvar e OK.

LÓGICA DE PROGRAMAÇÃO PARA ENGENHARIA TUTORIAL OPEN WATCOM: CRIANDO O PRIMEIRO PROGRAMA

CONCLUSÃO DO CURSO DE BACHARELADO EM ESTATÍSTICA. Alessandro Alves Santana

MANUAL DE INSTALAÇÃO DA WIZARD - VIMET

TUTORIAL DE BACKUP E RESTAURAÇÃO DE

epucc.com.br SAIBA COMO INCLUIR INFORMAÇÕES DE COLABORADORES, CENTROS DE CUSTO E RATEIO DE DESPESAS

Molduras. Definição e Criação de Molduras

Um programa awk contém uma seqüência de padrões (expressões regulares) e ações da seguinte forma:

Responsáveis: Bruno Silva, André Coelho, Wellington Silva, Marcelo Hirano. Atualizado em: 08/09/2017 CONFIGURAÇÃO DE BACKUP DE ORIGEM LINUX

Copie seletores da velocidade de um usuário do console de atendimento a um outro exemplo de configuração

Guia Rápido AxCrypt. Software para criptografia e deleção segura de arquivos

ELETRÔNICA DIGITAL I

Administração Central. Unidade do Ensino Médio e Técnico Cetec Capacitações São Paulo

PÁGINA DE TÍTULO Centralizar Página Inicial Parágrafo Inserir Quebra de Página

Aula 04 - Trabalhando com listas de dados II. Aula 04 - Trabalhando com listas de dados II. Sumário. Filtro avançado

Como cadastrar uma instituição no Portal Rural Sustentável

Rastreabilidade da CP Netzsch do Brasil

ATIVIDADE 6. Operações com Matrizes no Excel

Como configurar integração com separador Centro de custo e rateio conforme cálculo da folha?

Imprimir planilhas em Excel: Cinco passos. 5 Passos Para Imprimir Planilhas em Excel

LibreOffice Calc: aula 2

LÓGICA DE PROGRAMAÇÃO PARA ENGENHARIA TUTORIAL OPEN WATCOM: CRIANDO O PRIMEIRO PROGRAMA

Tutorial para criação de circuitos digitais em VHDL no Quartus Prime 16.1

Manual Cópias digitais

O objetivo dessa apostila é apresentar os comandos básicos do software R, especialmente os voltados para a estimação de modelos econométricos.

Trabalho de LP 15/07/2013. Prof. Flávio Miguel Varejão

Tutorial Tableau: como elaborar gráficos interativos

Procedimentos para Instalação Sisloc (Estação de Trabalho)

COMANDO DA AERONÁUTICA COMANDO GERAL DE APOIO CENTRO DE COMPUTAÇÃO DA AERONÁUTICA DO RIO DE JANEIRO

Aula 5 PROCESSAMENTO DE PLANILHAS COM O MICROSOFT EXCEL 27/02/2016 1

Esquema Padrão e Rodados de Forma Gráfica

Oficina: Processador de Texto

Introdução à Computação Engenharia Civil

Procedimento de configuração Atualização de firmware DVR linha GTK-DVR (Conferencia nº série).

E-Dictor 1.0 beta. M a n u a l. F e v e r e i r o, Paixão de Sousa, Kepler & Faria 2010

MAC110 Introdução à Computação EP no. 3 Prof. Dr. Paulo Miranda Instituto de Matemática e Estatística (IME) Universidade de São Paulo (USP)

Excel Tabela Dinâmica - Incrementando seus conhecimentos e Aperfeiçoando a sua prática Excel 2010 Uso inteligente da Tabela Dinâmica

Transcrição:

OFICINA DE FERRAMENTAS COMPUTACIONAIS PARA A DOCUMENTAÇÃO E DESCRIÇÃO LINGUÍSTICA Extração e codificação de dados (software R) Ministrantes: Flávia Regina de Santana Evangelista Rebeca Rodrigues de Santana Segundo Oushiro (2014), o R é uma linguagem de programação voltada à análise de dados, que pode ser utilizada para realizar computações estatísticas e gráficas, compilar e anotar corpora, produzir listas de frequências (p. 134) e diversas outras funções, entre elas três desenvolvidas especificamente para tarefas de análise sociolinguística: identificação, extração e amostragem. 1º PASSO Após a instalação do programa, defina a pasta na qual se encontra o corpus. Para tanto: 1. Clique nas reticências, ao lado esquerdo da opção files, para selecionar a pasta:

2. Clique em more, posteriormente em set as working directory para defini-la como diretório de trabalho: 2º PASSO O segundo passo é a identificação na qual as variantes do fenômeno receberão uma marcação que as destacará nos textos do corpus. 1. Selecione a opção source :

2. Digite o script para dar o comando de identificação: 3. Se não ocorrer erros, os textos serão processados e a identificação estará finalizada: 3º PASSO O terceiro passo é a extração por meio da qual as variantes são separadas do texto gerando outro arquivo no formato txt com colunas

separadas contendo também as variáveis sociais e os contextos precedente e seguinte. 1. Memorize no programa as variáveis sociais que serão analisadas. Os números utilizados no script correspondem ás linhas do cabeçalho da transcrição nas quais estas se encontram. 2. Digite o script para a extração 3. Após a extração, é gerado um novo arquivo em txt contendo somente as variantes, seus contextos precedente e seguinte e as variáveis sociais.

4. Selecione todo o conteúdo do arquivo txt e copie. No Excel, clique na primeira linha da tabela e cole o que havia sido copiado. DICAS E EXEMPLOS DE SCRIPTS DO RSTUDIO Para formular um script referente ao fenômeno que você deseja analisar, é necessário utilizar símbolos, quadro 1, que representam funções desenpenhadas pelo programa.

Quadro 1: Caracteres especiais para definição de expressões regulares. (OUSHIRO, 2014, p. 146). ALGUNS SCRIPTS PRONTOS: SCRIPTS PARA O FENÔMENO CONCORDÂNCIA EM PRIMEIRA E TERCEIRA PESSOA DO PLURAL Identificação identificacao(padrao="\\beles\\b \\belas\\bnós", simbolo.marcacao="<>", posicao.marcacao=f, ignorar.linhas="doc", stoplist=null, novos.arquivos="concordancia") Extração 1. nomes.variaveis.sociais<-c("sexo", "idade", "faixa.etária", "escolaridade", "zona.de.residência", "informante", "local.de.residência") 2. variaveis.sociais<-c(3, 4, 5, 6, 7, 8, 9) 3. extracao (padrao="\\beles\\b \\belas\\b \\bnós", palavras.cont.precedente=8, palavras.ocorrencia=1, palavras.cont.seguinte=8, stoplist=null, nomes.colunas.variaveis=nomes.variaveis.sociais, file="concordancia.txt")

SCRIPTS PARA NÓS / A GENTE EM POSIÇÃO DE SUJEITO Identificação identificacao(padrao="\\bnós\\b", simbolo.marcacao="<>", posicao.marcacao=f, ignorar.linhas="doc", stoplist=null, novos.arquivos="nos") identificacao(padrao="\\ba\\sgente",simbolo.marcacao="<>",posicao.marca cao=f,ignorar.linhas= DOC,stoplist=NULL,novos.arquivos="a.gente") identificacao(padrao="\\bnós\\b \\ba\\sgente", simbolo.marcacao="<>", posicao.marcacao=f, ignorar.linhas="doc", stoplist=null, novos.arquivos="nos.e.a.gente") Extração 1. nomes.variaveis.sociais<-c("sexo", "idade", "faixa.etária", "escolaridade", "zona.de.residência", "informante", "local.de.residência") 2. variaveis.sociais<-c(3, 4, 5, 6, 7, 8, 9) 3. extracao (padrao="\\bnós\\b ", palavras.cont.precedente=5, palavras.ocorrencia=1, palavras.cont.seguinte=5, stoplist=null, nomes.colunas.variaveis=nomes.variaveis.sociais, file="nos.txt") extracao (padrao="\\ba\\sgente", palavras.cont.precedente=5, palavras.ocorrencia=2, palavras.cont.seguinte=8, stoplist=null, nomes.colunas.variaveis=nomes.variaveis.sociais, file="a.gente.txt") extracao (padrao="\\bnós\\b \\ba\\sgente",palavras.cont.precedente=5, palavras.ocorrencia=1, palavras.cont.seguinte=5, stoplist=null, nomes.colunas.variaveis=nomes.variaveis.sociais, file="nos.e.a.gente.txt") SCRIPTS PARA A VOCALIZAÇÃO

Identificação identificacao(padrao="lh",simbolo.marcacao="<>", posicao.marcacao=f, ignorar.linhas="doc", stoplist=null, novos.arquivos="vocalizacao") Extração 1. nomes.variaveis.sociais<-c("sexo", "idade", "faixa.etária", "escolaridade", "zona.de.residência", "informante", "local.de.residência") 2. variaveis.sociais<-c(3, 4, 5, 6, 7, 8, 9) 3. extracao (padrao="lh", palavras.cont.precedente=5, palavras.ocorrencia=1, palavras.cont.seguinte=8, stoplist=null, nomes.colunas.variaveis=nomes.variaveis.sociais, file="vocalizacao.txt") REFERÊNCIAS OUSHIRO, Livia. Tratamento de dados com o R para análises sociolinguísticas, p.134-177. In Raquel Meister Ko. Freitag (Organizadora). Metodologia de Coleta e Manipulação de Dados em Sociolinguística, São Paulo: Editora Edgard Blücher, 2014. Disponível em: http://dx.doi.org/10.5151/blucheroa-mcmds-10cap