O MÉTODO LAPELINC: ALIMENTAÇÃO DE DOCUMENTOS DO CORPUS DOViC NO APLICATIVO WEBSINC

Documentos relacionados
De manuscritos históricos a corpora anotados: do Documento Digital Texto (DDT) ao corpus anotado

NOVOS DESAFIOS PARA ANTIGAS FONTES: A EXPERIÊNCIA DOVIC NA NOVA LINGUÍSTICA HISTÓRICA

Jorge Viana Santos * Giovane Santos Brito ** 1. Introdução

O CONTROLE CIENTÍFICO NA CONSTRUÇÃO DE CORPUS DIGITAL DE DOCUMENTOS HISTÓRICOS

COMPUTAÇÃO E LINGUÍSTICA: UM APLICATIVO WEB PARA BUSCAS AUTOMÁTICAS NO CORPUS DIGITAL DOVIC

TESTAMENTOS DO SÉCULO XIX DE VITÓRIA DA CONQUISTA - BA: ESTRUTURA INICIAL

A HIPOSSEGMENTAÇÃO E HIPERSEGMENTAÇÃO NOS DOCUMENTOS INÁBEIS PORTUGUESES E BRASILEIROS 30

A automatização de edições de originais manuscritos com escrita não normatizada para corpora eletrônicos

AS RELAÇÕES DE PODER E DE LIBERDADE EM DOCUMENTOS JURÍDICOS DO SÉCULO XIX 130

eassigner: UMA PROPOSTA DE AUTOMAÇÃO DAS EDIÇÕES DE ANOTAÇÕES XML DO edictor 1

Revista RBBA. Revista Binacional Brasil Argentina

A FLEXÃO PORTUGUESA: ELEMENTOS QUE DESMISTIFICAM O CONCEITO DE QUE FLEXÃO E CONCORDÂNCIA SÃO CATEGORIAS SINTÁTICAS DEPENDENTES 27

VOGAL [A] PRETÔNICA X TÔNICA: O PAPEL DA FREQUÊNCIA FUNDAMENTAL E DA INTENSIDADE 86

ESTUDO DE FERRAMENTAS MATEMÁTICAS SIMPLES EM PHP: APLICAÇÕES EM ENSINO E INSTRUÇÃO EM CIÊNCIA E TECNOLOGIA

A VARIAÇÃO NÓS/ A GENTE NO PORTUGUÊS FALADO DE FEIRA DE SANTANA: COMPARAÇÃO ENTRE FALARES DO PB

TÓPICO EDIÇÃO BITMAP

A ferramenta de busca E-CORP aplicada ao Corpus Eletrônico de Documentos Históricos do Sertão

Seleção de fontes de informação científica

EDIÇÃO SEMIDIPLOMÁTICA DO CADERNO SEM CAPA I DE EULÁLIO MOTTA

ESTUDOS DA TRADUÇÃO II. Prof. Carlos Rodrigues 11 de abril de 2015

ANEXO I. DISCIPLINAS A SEREM OFERECIDAS PELO BiBEaD:

A AQUISIÇÃO DE SUJEITO NULO NO PORTUGUÊS BRASILEIRO (PB): UM ESTUDO COMPARATIVO 1

ANÁLISE DE APLICATIVOS PARA A RESOLUÇÃO DO PROBLEMA QUADRO DE HORÁRIOS EM INSTITUIÇÕES FEDERAIS DE ENSINO

anexo 7 INFORMAÇÕES BÁSICAS PARA O USO DOS RECURSOS TECNOLÓGICOS DISPONÍVEIS EM SUA ESCOLA semana pedagógica 2012

Universidade Estadual do Sudoeste da Bahia UESB Recredenciada pelo Decreto Estadual N 9.996, de

Parte II. A fotografia nos arquivos: etapas de trabalho, processos de significação

VARIANTE CÊ E SUA GRAMATICALIZAÇÃO: UM ESTUDO FUNCIONAL ATRAVÉS DA LINGUÍSTICA DE CORPUS

Módulo Web na Nuvem. Módulo Mobile UPsecure. O futuro chegou para você! Apresentação

A ORDEM LINEAR DOS CONSTITUINTES VERBO- SUJEITO EM ORAÇÕES RAÍZES EM TEXTOS DO CORPUS TYCHO BRAHE

ESTARÁ O PORTUGUÊS BRASILEIRO DEIXANDO DE SER LÍNGUA DE SUJEITO-PREDICADO? *

INFORMÁTICA PARA CONCURSO MINISTÉRIO PÚBLICO DO PARÁ Cargo: AUXILIAR DE ADMINISTRAÇÃO.

INSTITUTO DE ESTUDOS MEDIEVAIS INDICADORES DE PRODUTIVIDADE

Corp-Oral: Corpus oral do

Visualizando Padrões: A visualização do Universo de Metadados

Projecto de tratamento documental e divulgação do Arquivo Fotográfico do Campo Arqueológico de Mértola Bruno Almeida e Paula Rosa

Front Matter / Elementos Pré-textuais / Páginas Iniciales

DA ADMISSIBILIDADE AO JULGAMENTO DO IMPEACHMENT DE DILMA ROUSSEFF: CAPAS DE PERIÓDICOS E EFEITOS DE MEMÓRIA

UM SISTEMA DE RECUPERAÇÃO DE

Estudos da Língua(gem)

Estudos da Língua(gem)

CURRICULUM VITAE DE ANA PEREIRA FERREIRA. (Versão Portuguesa)

FORMAÇÃO DE GESTORES EM VITÓRIA DA CONQUISTA, UMA BREVE ANÁLISE DO PROGRAMA PROGESTÃO 2015/2016

Estudos da Língua(gem)

TÓPICOS EM ESTUDOS DA TRADUÇÃO PROF. DR. JOÃO AZENHA JUNIOR. Apresentação: Tecnologia e tradução Joacyr T Oliveira

Universidade Federal da Bahia:

FFLCH/DLCV-USP- 2º SEMESTRE DE 2015 FILOLOGIA E LÍNGUA PORTUGUESA - FLC0284 TURMAS: / / PROFA. DRA. MÁRCIA S. D.

Apresentação. Ponto Secullum 4 Módulo Web na Nuvem

PROJETO GRÁFICO DO LIVRO DE DIRETRIZES DE DESIGN E USABILIDADE DE APLICATIVOS DE SMARTPHONE

Conteúdos da elibraryusa

MEMÓRIA URBANA DE PALMAS-TO: LEVANTAMENTO DE INFORMAÇÕES E MATERIAL SOBRE O PLANO DE PALMAS E SEUS ANTECEDENTES

Estratégias para a publicação e divulgação de conteúdos digitais

FERRAMENTA DE INTEGRAÇÃO ENTRE SOFTWARES PARA RECURSOS HUMANOS APINTEGRATION UTILIZANDO WEB SERVICES

ISSN: O PARADOXO LINGUÍSTICO EM CARTAS DE ALFORRIA DE VITÓRIA DA CONQUISTA BA

IMPACTOS DOS ELEMENTOS FOTOGRÁFICOS INSERIDOS NO FILME. Camila Vianna Marques Maciel 1 Rogério Luiz Silva de Oliveira 2 RESUMO

Joana Cristina Beato RIBEIRO

ANEXO DA RESOLUÇÃO 45/2003 CRITÉRIOS PARA AVALIAÇÃO DO MEMORIAL DESCRITIVO DO DOCENTE POR SEMESTRE BAREMA PARA JULGAMENTO DO DESEMPENHO ACADÊMICO

PRÁTICAS DE LETRAMENTO DE ALUNOS COM SURDEZ EM SRMs 1 NO MUNICÍPIO DE MARABÁ-PA

O PAPEL DOS CONTEXTOS FONÉTICOS NA DELIMITAÇÃO DA TONICIDADE DE FALA ATÍPICA

UNIVERSIDADE FEDERAL DE SANTA CATARINA CENTRO DE CIÊNCIAS DA EDUCAÇÃO CURSO DE BIBLIOTECONOMIA ITALO PEREIRA CÂMARA

OFICINA DE FERRAMENTAS COMPUTACIONAIS PARA A DOCUMENTAÇÃO E DESCRIÇÃO LINGUÍSTICA. Extração e codificação de dados (software R)

MANUAL DO PÓS-GRADUANDO DOCUMENTOS NECESSÁRIOS PARA EFETIVAÇÃO DA MATRÍCULA

Venâncio Bonfim-Silva 1 Edinaldo Medeiros Carmo 2 INTRODUÇÃO

trabalhos de autor. Mais que a formação de base, ou atualizações contínuas de conhecimentos, a 5ª edição da

CORPOBRAS PUC-RIO: DESENVOLVIMENTO E ANÁLISE DE UM CORPUS REPRESENTATIVO DO PORTUGUÊS

O quarto paradigma: a ciência da análise de dados

AS MELHORES SOLUÇÕES EM SOFTWARES DE GESTÃO

INSTRUÇÃO NORMATIVA nº 001/2019. O REITOR DA UNIVERSIDADE ESTADUAL DO RIO GRANDE DO SUL - UERGS, no uso de suas atribuições legais, RESOLVE:

Identificadores para autores

AS ANALOGIAS NAS AULAS DE CIÊNCIAS E BIOLOGIA: CONTRIBUIÇÃO PARA A SOCIALIZAÇÃO E ENTENDIMENTO DE CONTEÚDOS

Criando pontes entre passado, presente e futuro: o acervo básico-histórico da primeira Escola de Biblioteconomia do Brasil

Pesquisadora: Profa. Dra. Herminia Prado Godoy. 1[1] Profa. Dra/ Raquel Gianolla Miranda. Doutoranda do Pós-Doc 2015.

O OBJETO DIRETO ANAFÓRICO E SUAS MÚLTIPLAS REALIZAÇÕES NO PORTUGUÊS BRASILEIRO

REITORIA CONSELHO DE ENSINO, PESQUISA E EXTENSÃO CONSEPE RESOLUÇÃO Nº 04/2008 NORMAS PARA DEPÓSITO E DISPONIBILIZAÇÃO DE TRABALHOS NA BIBLIOTECA

Indexação automática. CBD/ECA Indexação: teoria e prática

ÁREA DO CONHECIMENTO: ( ) EXATAS ( X )HUMANAS ( )VIDA

MARCADORES PROSÓDICOS NA CONSTRUÇÃO DE SENTIDOS DO TEXTO: DA VISTA DE UM PONTO A UM PONTO DE VISTA

UNIVERSIDADE FEDERAL DE SANTA CATARINA CENTRO DE CIÊNCIAS DA EDUCAÇÃO CURSO DE BIBLIOTECONOMIA

A produção Científica no Stricto Sensu em Design no Brasil 1

Virtual Heritage: A reconstituição do Forte São Luís através de um núcleo computacional de jogo (Engine)

PROPOSTA DE PREÇO COM APOSTILAMENTO (2015)

Mostra de Linguística A Linguística em Portugal: estado da arte, projectos e produtos Reitoria da Universidade de Lisboa, de Junho de 2006

MEMÓRIA VIVA: UMA RECOMPOSIÇÃO DOCUMENTAL DA TRAJETÓRIA HISTÓRICA DO IFRN CAMPUS CURRAIS NOVOS

Infra-Estrutura de Dados Espaciais. Bruno Rabello Monteiro

ORGANIZAÇÃO DA BIBLIOTECA PÚBLICA MUNICIPAL GOVERNADOR JORGE LACERDA

UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular TÉCNICAS DE FOTOGRAFIA Ano Lectivo 2016/2017

IX SEMINÁRIO DE PESQUISA E ESTUDOS LINGUÍSTICOS 21 e 22 de setembro de 2017

B.1. Colocação e distribuição de documentos promocionais B.1.1. Flyers B.1.2. Posters B.1.3. Outros

UTFPR - UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ PROGRAMA DE PÓS-GRADUAÇÃO EM ENSINO DE CIÊNCIA E TECNOLOGIA

Adaptação do Sistema de Busca Semântica ao Padrão XML e Automatização do Processo de Modelagem dos Objetos de Aprendizagem no ROAI para o Padrão OWL

Linguistica, Letras e Artes

Arquigrafia: um repositório digital de imagens em ambiente colaborativo web

JOANA CAMPOS CARVALHO

GERENCIADOR DE REFERÊNCIAS BIBLIOGRÁFICAS: EndNote Web. SIBI/PUCPR Divisão de Serviços aos Usuários

ESTUDO FONÉTICO-EXPERIMENTAL DA INFLUÊNCIA DA PAUSA NA DURAÇÃO DE VOGAIS ACOMPANHADAS DE OCLUSIVAS SURDAS E SONORAS *

TEMAS DOS ORIENTADORES DE TRABALHO DE CONCLUSÃO DE CURSO

Desafios e decisões para a aquisição e tratamento de textos no Projeto Lácio-Web

DIGITALIZAÇÃO DO ACERVO FOTOGRÁFICO: UMA EXPERIÊNCIA NA BIBLIOTECA LÀJUOMIM

Transcrição:

Página 69 de 510 O MÉTODO LAPELINC: ALIMENTAÇÃO DE DOCUMENTOS DO CORPUS DOViC NO APLICATIVO WEBSINC Amanda Moreno Fonsêca de Andrade (UESB/CNPq) Patrick Pereira Campos Brito (UESB) Jorge Viana Santos (UESB/CNPq) Cristiane Namiuti Temponi (UESB/CNPq) RESUMO O Método Lapelinc tem como proposta a construção de um corpus digital que parte de documentos notariais manuscritos guardados em arquivos da região do Sudoeste Baiano: o Corpus DOViC (Corpus de Documentos Oitocentistas de Vitória da Conquista) (SANTOS; NAMIUTI, 2016). O método possui três etapas: Transposição, Transcrição Paleográfica e Compilação de Corpora. No presente trabalho, enfatizamos algumas subetapas das fases do método realizadas por pesquisadores do Lapelinc com a finalidade de alimentar o aplicativo WebSinc 1 com dados de documentos presentes no corpus citado. PALAVRAS-CHAVE: Método Lapelinc; Corpus Dovic; Websinc INTRODUÇÃO O Método Lapelinc foi desenvolvido por pesquisadores da Universidade Estadual do Sudoeste da Bahia. O método iniciou em 2009 e continua a ser desenvolvido no Lapelinc (Laboratório de Pesquisa em Linguística de Corpus-UESB) e possui três etapas, a 1 O WebSinc (Namiuti,Santos e Costa 2015 e Costa e Namiuti 2015) é um aplicativo web para otrabalho de registro, armazenamento, disponibilização, visão e busca de

Página 70 de 510 saber: Transposição, Transcrição Paleográfica e Compilação de Corpora. Após os documentos serem trabalhados nestas três etapas o material digital permanecerá fidedigno ao original, podendo ser acessado remotamente via Web. As subetapas integrantes de cada uma das 3 etapas citadas do Método serão apresentadas na seção metodologia e, na seção seguinte, serão relatadas descritivamente com seus devidos resultados as que foram executadas pelos pesquisadores Amanda M. F. Andrade e Patrick P. C. Brito. MATERIAL E MÉTODOS O Método Lapelinc consiste na transposição do Documento Físico (DF) para o Documento Digital Imagem (DDI) que, após transcrito, origina o Documento Digital Texto (DDT). O método possui 3 etapas: 1) Transposição; 2) Transcrição Paleográfica e 3) Compilação de Corpora. Concernente à primeira, Transposição, temos as seguintes subetapas: 1.1) Controle: etapa da captura de informações da fonte; 1.2) Captura fotográfica da imagem do original: fotografa-se o DF (Documento Físico) para se formar o DDI (Documento Digital Imagem). Nesta etapa está presente a Mesa Cartesiana 2 que é um equipamento que possibilita o registro visual das características físicas dos documentos; 1.3) Edição fotográfica que consiste em preparar versões do DDI controladas para diferentes fins; 1.4) Criação de imagens de uso co-indexadas à imagem-original; 1.5) Análise descritiva/ topográfica que se divide em duas etapas, sendo: a) Localizar o início e o final de Documentos Micro nas folhas-imagem do Documento Macro; b) identificar, a partir dos cabeçalhos dos Documentos Micro, a tipologia do documento. Na segunda etapa, Transcrição Paleográfica, é estabelecida uma relação entre a Fotografia e a Paleografia, que se subdivide em: 2.1) Leitura e Decodificação dos DDIs; e 2.2) Transcrição Paleográfica. Segundo Namiuti e Santos (2016), a etapa de Transcrição envolve as soluções técnicas para a edição 2 Mesa Cartesiana foi idealizada e concebida para ser um equipamento que possibilitasse, junto com o registro do documento, o registro visual cientificamente controlado de suas característicasfísicas

Página 71 de 510 especializada de textos antigos em meio eletrônico. Por fim, para que a terceira etapa, Compilação de Corpora, seja iniciada, é necessário que o documento tenha ganhado o formato digital de texto simples (TXT) após ter passado pelas outras etapas. Desta forma, para dar continuidade ao trabalho, nesta etapa são essenciais algumas ferramentas computacionais, a exemplo do: edictor (PAIXÃO DE SOUSA, KEPLER E FARIA, 2010) que é um editor de marcação extensível; e do WebSinc (NAMIUTI; SANTOS e COSTA, 2015 e COSTA e NAMIUTI, 2015). RESULTADOS E DISCUSSÃO Levando em conta a metodologia adotada nas atividades propostas pelo Método, obtivemos os seguintes resultados das atividades circunscritas das etapas 1 e 3 realizadas pelos pesquisadores Amanda M. F. Andrade e Patrick P. C. Brito envolvidos na alimentação de dados do WebSinc. Na primeira etapa, Transposição, as atividades desenvolvidas foram: primeiramente, edição fotográfica, que consiste no recorte da imagem, que, neste caso, foram recortadas as imagens dos livros E3, E11, E1, E5, E15 e E16, totalizando 6 livros editados. Abaixo pode-se observar a imagem antes do corte e pós o corte, nas figuras 1 e 2: Figura 1: folha-imagem 007-E5-0004.JPEG pertencente ao livro E5 C11 antes do corte.

Página 72 de 510 Figura 2: folha-imagem 007-05-0004e.JPEG pertencente ao livro E5 C11 após o corte. E, em seguida, concernente à terceira etapa, foi feito: a) Alimentação de dados dos documentos macro no WebSinc (Namiuti, Santos e Costa 2015 e Costa e Namiuti 2015) a catalogação de 10 livros da coleta 11 (C11), a saber os livros: E1, E3, E5, E6, E11, E13, E14, E15, E16 e E21, totalizando 10 livros cadastrados no aplicativo, conforme a figura 3 abaixo: Figura 3: Página do Websinc onde os livros do Corpus Dovic foram cadastrados. Fonte: WebSinc

Página 73 de 510 b) Anexação das imagens dos Documentos Macros cadastrados anteriormente; c) Cadastro dos dados e cabeçalhos dos Documentos Micros presente nos Documentos Macros cadastrados. CONCLUSÃO Os materiais históricos e/ou raros precisam ser trabalhados de maneira cuidadosa, pois além de serem antigos, são frágeis. Assim, é necessário cuidado ao manuseá-los. Tendo isto em vista, o Método Lapelinc utiliza a Fotografia como ferramenta no processo de transposição do documento garantindo a sua fidedignidade. O presente trabalho contribui na construção do aplicativo WebSinc, afim de, futuramente, auxiliar pesquisas tanto na área da Linguística, quanto no Direito, por exemplo. REFERÊNCIAS BRITO, Giovane Santos. Do texto ao documento digital: transposição fotográfica de documentos manuscritos históricos para formação de corpora linguísticos eletrônicos. (Dissertação) Mestrado em Linguística Programa de Pós Graduação Linguística da Universidade Estadual do Sudoeste da Bahia, Vitória da Conquista, 2015. Orientador: Jorge Viana Santos; Co-orientadora: Cristiane Namiuti Temponi. COSTA, Aline Silva; NAMIUTI-TEMPONI, Cristiane. WebSinC: Buscas online em corpora sintaticamente anotados. E-Book do Congresso de Humanidades Digitais em Portugal: Construir pontes e quebrar barreiras na era digital 2015. Lisboa: Universidade Nova de Lisboa, 2016 (no prelo). FARIA, P.; KEPLER, F. N.; PAIXÃO DE SOUZA, M. C. An Integrated Tool for Annotating Historical Corpora, In: Fourth Linguistic Annotation Workshop, LAW IV, 48th Annual Meeting of the ACL, 2010, Uppsala. Proceedings of the Fourth Linguistic Annotation Workshop, 2010. p. 217-221. NAMIUTI, Cristiane; SANTOS, Jorge e COSTA, Aline. New challenges for ancient sources: an important dialogue between

Página 74 de 510 Computer Science and new Historical Linguistics. Trabalho apresentado no Workshop: The New Historical Linguistics and the World of Annotated Corpora, Campinas, Brasil, Março 9-13, 2015. NAMIUTI, Cristiane; SANTOS, Jorge Viana. Novos desafios para antigas fontes: a experiência DOViC na nova linguística histórica. E-Book do Congresso de Humanidades Digitais em Portugal. 2015. Lisboa: Universidade Nova de Lisboa, 2016 (prelo).