Memórias de Tradução: auxiliando o humano a traduzir



Documentos relacionados
MEMÓRIAS DE TRADUÇÃO: AUXILIANDO O HUMANO A TRADUZIR

SISTEMA DE SERVIÇOS DE INFRA-ESTRUTURA DA UFRGS

Microsoft Office Outlook Web Access ABYARAIMOVEIS.COM.BR

COORDENAÇÃO DE EAD MANUAL DE UTILIZAÇÃO DO MOODLE 2.6 PERFIL ALUNO. Versão 1.0

Unidade 8: Padrão MVC e DAO Prof. Daniel Caetano

Gerenciamento da Integração (PMBoK 5ª ed.)

Sumário. Administração de Banco de dados Módulo 12. Ilustração Backup-Recovery. Recuperação (Recovery) - Definição

Treinamento do Sistema RH1000

CURSO: Orientações. MÓDULOS: Orientações/Calendário/Links. Curso 3/ Contato com o suporte: Nome.: Empresa.: Data.: / / .

Pró-Reitoria de Administração - PRAd Assessoria de Informática - AI SISTEMA DE PUBLICAÇÃO DE LICITAÇÕES. Manual de Procedimentos

UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO DEPARTAMENTO DE ESTATÍSTICA E INFORMÁTICA BACHARELADO EM SISTEMAS DE INFORMAÇÃO RAPID APPLICATION DEVELOPMENT

Usando o Conference Manager do Microsoft Outlook

Tutorial 7 Fóruns no Moodle

Manual de Rotinas para Usuários. Advogados da União. Procuradoria da União no Estado do Ceará PU/CE SAPIENS. Sistema da AGU de Inteligência Jurídica

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE SISTEMAS DE INFORMAÇÃO BACHARELADO

Cobrança Bancária. Contas / Manutenção.

SIE - SISTEMA DE INFORMAÇÕES PARA O ENSINO CADASTRO DE FUNCIONÁRIOS

Metadados. 1. Introdução. 2. O que são Metadados? 3. O Valor dos Metadados

Sistema de Gestão de Recursos de Aprendizagem

MANUAL CHAT DE ATENDIMENTO VIASOFT

1 Introdução. Componentes Usuários. Provedor de Serviços. Figura 1.1 Ambiente de oferecimento de serviços

Integração de livros fiscais com o Microsoft Dynamics AX 2009

Manual do Usuário. Sistema Estadual de Informações Ambientais e de Recursos Hídricos VERSÃO 2.0

paradigma WBC Public - compra direta Guia do Fornecedor paradigma WBC Public v6.0 g1.0

UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 14 PROFª BRUNO CALEGARO

UNIVERSIDADE FEDERAL DE OURO PRETO PROJETO BÁSICO CURSO DE APERFEIÇOAMENTO EM PRODUÇÃO E ORGANIZAÇÃO DE CONTEÚDO NA EAD CURSO PARA DOCENTES DA UFOP

Gestão Unificada de Recursos Institucionais GURI

CENTRO UNIVERSITÁRIO DE ENSINO SUPERIOR DO AMAZONAS - CIESA CENTRO DE PROCESSAMENTO DE DADOS CPD MANUAL DE UTILIZAÇÃO DO MOODLE 2.

PLANEJAMENTO ESTRATÉGICO

Manual de Publicação Wordpress

Portal do Projeto Tempo de Ser

MOODLE NA PRÁTICA PEDAGÓGICA

agility made possible

Domínios. Domínios Mundiais Usado para atividades comerciais. Usado em instituições sem fins lucrativos. Usado para nomes pessoais.

Manual MQS. Logo após colocar essas informações abrirá a página inicial do sistema:

APÓS A INSTALAÇÃO, MÃOS À OBRA. E AO TECLADO. MANUAL DE INSTALAÇÃO

Guia do Usuário. idocs Content Server v

Compartilhamento on-line 2.0. Nokia N76-1

ACESSANDO COM USUÁRIO DE PROFESSOR

OBTENDO CONHECIMENTO A PARTIR DOS TWITTES PESSOAIS. FRANTZ, Miguel Airton 1 ; FROZZA, Angelo Augusto 2 Instituto Federal Catarinense, Camboriú/SC

LISTA DE VERIFICAÇAO DO SISTEMA DE GESTAO DA QUALIDADE

Capítulo 2 Objetivos e benefícios de um Sistema de Informação

DESENVOLVIMENTO DO NOVO SISTEMA DE CONSULTA DE DADOS DO GSC- UNIJUÍ 1

Gerenciamento de Projetos Modulo II Clico de Vida e Organização

Eng Civil Washington Peres Núñez Dr. em Engenharia Civil pela Universidade Federal do Rio Grande do Sul

6 Ferramenta de Apoio ao Processo de Desenvolvimento de Sistemas Multi-Agentes

Versão Todos os direitos reservados.

Guia de utilização da notação BPMN

Gerenciamento do ciclo de vida de um documento Simone de Abreu

POPULARIZAÇÃO DA CIÊNCIAS ATRAVÉS DE APLICATIVO PUBLICADOR E SIMULADOR EM TABLETS PARA O ENSINO MÉDIO

Gestão Estratégica de Negócios

Esse produto é um produto composto e tem subprodutos

Cinco restrições de desenvolvimento/teste que afetam a velocidade, o custo e a qualidade dos seus aplicativos

13/03/ :24 Leite Júnior

24 de maio de 2002 OBJETO DA ANÁLISE NO ÂMBITO DA PRIMEIRA RODADA

Projeto SIAC 2.0: Uma aplicação do framework Demoiselle para o desenvolvimento de Sistema de Informações Acadêmicas da UFBA (SIAC)

Sistema Integrado de Gerenciamento de Imposto Sobre Serviços.

Prefeitura de Belo Horizonte. Sistema de Controle de Protocolo

AKNA SOFTWARE. Configurações. de DNS

Estratégias para a confecção de moda do futuro

TUTORIAL PMS CARD. Acesse o site:

QUALIDADE DE SOFTWARE

Aprimoramento através da integração

Markes Roberto Vaccaro

BACHARELADO EM SISTEMAS DE INFORMAÇÃO EaD UAB/UFSCar Sistemas de Informação - prof. Dr. Hélio Crestana Guardia

Processos de gerenciamento de projetos em um projeto

PROPOSTA DE PRESTAÇÃO DE SERVIÇO. Novo Site da Minas Comunica

Criando campanhas e gerando pedidos de venda com o Telemarketing

É importante que nos atenhamos a alguns aspectos importantes sobre banco de dados:

Gerenciamento de Riscos no RUP. Hermano Perrelli

FMU - FACULDADES METROPOLITANAS UNIDAS E-COMMERCE, SOCIAL COMMERCE, MOBILE MARKETING E MARKETING DE PERMISSÃO.

Papyrus: Sistema de compras de livros, uma proposta do Instituto Federal do Paraná - Campus Curitiba

JORNADA DE COMPRA. O que é e sua importância para a estratégia de Marketing Digital VECTOR

II Concurso de Artigos sobre Casos de Sucesso na Atuação dos Agentes de Desenvolvimento, edição 2014.

POLÍTICA DE RESPONSABILIDADE SOCIOAMBIENTAL

terceiros ou usar um aplicativo desenvolvido por terceiros, um cookie poderá ser colocado por essa página ou aplicativo).

Astra LX Frases Codificadas Guia para o processo de Configuração de Frases Codificadas no Programa AstraLX.

IBM Software Demos Lotus Workforce Management

(Capitais e Interior) (Demais Localidades) (Capitais e Interior) Golden Fone (SAC)

PROCESSOS DE CRIAÇÃO DE APLICATIVOS

MANUAL MOODLE - PROFESSORES

UM MODELO DE DADOS VOLTADO AO SERVIÇO DE INTELIGÊNCIA POLICIAL. 1. Introdução. 2. Problemática

O QUE É A CENTRAL DE JOGOS?

MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DE GOIÁS CERCOMP/CENTRO DE RECURSOS COMPUTACIONAIS SAU - SERVIÇO DE ATENDIMENTO AO USUÁRIO

1. Introdução Pregão Eletrônico

Introdução a Banco de Dados Aula 03. Prof. Silvestri

SECRETARIA DE ESTADO DA EDUCAÇÃO DE SANTA CATARINA PONTO SECULLUM 4 SISTEMA DE CONTROLE DE PONTO MANUAL PARA A GERÊNCIA DE GESTÃO DE PESSOAS

SISTEMA DE INFORMAÇÕES GERENCIAIS Guia Rápido O que há de novo no SIG?

Manual do Usuário. Protocolo

Projeto de Gestão pela Qualidade Rumo à Excelência

Módulo 9 A Avaliação de Desempenho faz parte do subsistema de aplicação de recursos humanos.

MINISTÉRIO DA EDUCAÇÃO INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO MARANHÃO PRÓ-REITORIA DE PLANEJAMENTO E ADMINISTRAÇÃO

Processos Técnicos - Aulas 4 e 5

Política de Privacidade do Serviço OurSound para Estabelecimentos

P4-MPS.BR - Prova de Conhecimento do Processo de Aquisição do MPS.BR

Transcrição:

Memórias de Tradução: auxiliando o humano a traduzir 1. Introdução Devido aos avanços tecnológicos que ocorreram nos últimos anos, em especial, à popularização da internet, principalmente com o surgimento de sites e repositórios de informação multilíngue, a tradução se tornou uma necessidade do público em geral. Contudo, a disponibilidade crescente de informação multilíngue se contrapõe à dificuldade dos usuários, espalhados por todo o mundo, em entender esse conteúdo. Embora existam, atualmente, diversos sistemas para a tradução automática (TA) comerciais ou disponíveis online como o Systran (http://www.systransoft.com/), o Apertium (http://www.apertium.org/) e os tradutores do Google (http://translate.google.com.br/) ainda não é possível alcançar as ambiciosas metas dos primórdios da TA: produzir uma tradução de boa qualidade em domínios irrestritos, por meio de sistemas completamente automáticos. Em contraposição, outras frentes de pesquisa surgiram com o intuito de criar ferramentas para auxiliar o humano na tarefa de traduzir (Machine-Aided Human Translation) ou de editar a tradução antes, durante ou depois de sua realização (Human-Aided Machine Translation). Na primeira frente estão as ferramentas de Memória de Tradução (MT). Uma MT pode ser entendida como um repositório de segmentos (geralmente frases ou sentenças) originais acompanhados de suas respectivas traduções humanas, armazenados para que possam ser manipulados e reaproveitados [1]. Com o passar do tempo, a MT agrupa um grande conjunto de segmentos que podem ser recuperados pela ferramenta de MT por meio de um casamento (matching) completo ou parcial sempre que um segmento igual ou semelhante aparecer novamente. Assim, uma MT pode ser considerada um corpus paralelo com segmentos alinhados de textos já traduzidos [2]. Entre as principais vantagens do uso de MT estão: consistência e agilidade. Ao mesmo tempo que as MTs asseguram consistência na tradução de documentos incluindo terminologia, estruturas, expressões e definições comuns; elas também aceleram o processo de tradução já que dividem a tarefa com o tradutor humano recordando o que já foi previamente traduzido e deixando-o focado na tradução de novos trechos. Este artigo apresenta uma ferramenta de Memória de Tradução online

desenvolvida com o intuito de auxiliar o tradutor humano a superar as barreiras impostas pelas línguas. Para permitir o entendimento da ferramenta apresentada neste artigo, bem como sua comparação com outras similares, a seção 2 traz um breve relato dos trabalhos relacionados. Em seguida, descreve-se a metodologia empregada no desenvolvimento da ferramenta de MT (seção 3) e seus resultados (seção 4). Por fim, na seção 5, este artigo traz uma breve conclusão e propostas de trabalhos futuros. 2. Trabalhos Relacionados Ferramentas de MT como OmegaT (http://www.omegat.org/br/omegat.html), Anaphraseus (http://anaphraseus.sourceforge.net/), Wordfast (http://www.wordfast. net/), Trados da IBM (http://www.trados.com) e o Déjà Vu da Atril (http://www.atril.com/) basicamente funcionam como descrito a seguir. Primeiramente, o texto sendo traduzido é dividido em segmentos (delimitadores de segmentos usualmente empregados são símbolos de pontuação como ponto final ou dois pontos). Em seguida, cada segmento do texto fonte é apresentado ao tradutor humano para ser traduzido. Cada nova tradução produzida pelo especialista é armazenada na MT juntamente com o segmento original. A partir daí, se o texto original for semelhante a um segmento já traduzido armazenado na MT, a ferramenta recupera a tradução anterior e a indica como sugestão. O tradutor pode utilizar a sugestão, editá-la ou desprezá-la realizando uma tradução completamente diferente. Seja qual for sua decisão, a ferramenta de MT armazena o par (segmento fonte e segmento traduzido) resultante, passando para o próximo segmento do texto original [3]. Diversas funcionalidades podem incrementar esse processo e estão presentes em algumas das ferramentas investigadas, como o uso de glossários, casamento de segmentos similares (e não apenas idênticos), edição manual ou semiautomática dos segmentos e análises estatísticas. 3. Metodologia Para o desenvolvimento da ferramenta de MT apresentada neste artigo utilizou-se: PHP com Zend Framework (no servidor), Javascript com Dojo Toolkit (nas máquinas dos usuários), HTTP Apache (servidor Web) e PostgreSQL (Banco de Dados, BD). O desenvolvimento realizado com essas tecnologias e seguindo o padrão Model-View- Controller garante modularidade e facilita a manutenção da ferramenta.

Para permitir o gerenciamento do processo de tradução, bem como armazenar os pares de segmentos original-traduzido, quatro tabelas foram projetadas e implementadas no BD para: (1) armazenar os dados sobre o projeto de tradução, (2) armazenar os segmentos de uma MT, (3) armazenar os dados da própria MT e (4) relacionar o projeto de tradução com uma ou mais MTs em uso. A ferramenta de MT descrita neste artigo foi criada como parte do projeto [OMITIDO] e está disponível para a utilização via internet por meio do endereço [OMITIDO], podendo ser utilizada com os principais navegadores modernos populares. 4. Resultados A Figura 1 traz a tela principal da ferramenta a qual pode ser dividida em três partes principais contendo: (1) duas caixas de texto (fonte e alvo); (2) sugestões recuperadas da MT; e (3) informações e ferramentas/recursos. Na área (1) há dois textos: o texto fonte sendo traduzido (1a) e o texto alvo com os segmentos já traduzidos (1b). No texto fonte, o segmento que está em tradução é destacado e sua tradução deve ser digitada na caixa de edição na área do texto alvo. Botões de setas abaixo da caixa de edição alvo permitem a navegação entre segmentos, enquanto os botões Cancelar e Salvar ignoram ou adotam, respectivamente, a tradução realizada até então. Vale ressaltar, também, que assim como as demais ferramentas de MT citadas na seção 2, é possível editar a segmentação do texto fonte feita automaticamente por meio da união e da divisão de segmentos. Em (2) são apresentados os segmentos similares recuperados das MTs em uso. O usuário pode selecionar um segmento e enviá-lo para caixa de edição alvo por meio do botão Usar sugestão. A busca por segmentos similares é feita automaticamente pela ferramenta cada vez que um novo segmento fonte é selecionado. Algumas informações (como andamento do processo de tradução) e ferramentas/recursos auxiliares (por exemplo, glossários) são apresentados em (3). No desenvolvimento da ferramenta foram utilizadas as MTs disponíveis na Linguateca (http://www.linguateca.pt/) como o texto utilizado na Figura 1. Os segmentos traduzidos são armazenados automaticamente no BD assim que um novo segmento é selecionado para a tradução. Com isto é possível utilizar os segmentos recém traduzidos ainda durante a tradução do mesmo documento. Outra característica importante dessa ferramenta é a possibilidade de consultar múltiplas MTs

Figura 1: Tela principal da ferramenta de MT durante a tradução. Por fim, outra funcionalidade recém implementada é o alinhamento lexical dos textos fonte e traduzido, por meio do alinhador automático GIZA++ [4]. Os pares de palavras alinhadas automaticamente por esta ferramenta podem ser selecionados e incluídos em um glossário bilíngue a ser utilizado em traduções futuras. Essa funcionalidade é um diferencial da ferramenta em relação a outras pesquisadas. 5. Conclusões e Trabalhos Futuros A ferramenta de MT apresentada neste artigo desempenha as funcionalidades principais esperadas para uma ferramenta deste tipo: segmentação do texto a ser traduzido, recuperação de segmentos similares armazenados na MT e armazenamento dos segmentos traduzidos na MT. Além disso, incorpora uma nova funcionalidade de geração de glossário a partir do alinhamento automático de palavras presentes nos textos original e traduzido. Esta ferramenta pode ser acessada e utilizada com os navegadores populares e modernos, facilitando seu uso já que não é necessária sua instalação. Além disso, como a ferramenta faz parte de um ambiente maior do projeto [OMITIDO], a mesma pode usufruir de ferramentas presentes neste ambiente como o alinhador lexical citado anteriormente.

Pretende-se, agora, acrescentar novas funcionalidades à ferramenta de MT como o compartilhamento de recursos (memórias de tradução e projetos de tradução) entre usuários e a coleta de informação útil sobre o processo de tradução humana, ou seja, as tarefas de edição que o humano realiza para gerar o segmento traduzido. Referências [1] UNIVERSITY OF LEEDS. School of Modern Languages and Cultures. E-CoLoRe Project. Ferramentas: Memória de Tradução. Disponível em: <http://ecolore.leeds.ac.uk/xml/materials/overview/tools/translation_memory.xml? lang=pt>. Acesso em junho 2012. [2] NOGUEIRA, DANILO. Memória de tradução ( CAT ). <http://tradutorprofissional.blogspot.com/2007/09/memria-de-traduo-cat.html>. Acesso em junho 2012. [3] FRACASSI, VAGNER. Memória de Tradução - Como esses programas podem afetar o seu trabalho. Disponível em: <http://www.abrates.com.br/abreartigo.asp? onde=memoria%20de%20traducao.abr>. Acesso em junho 2012. [4] OCH, F. J.; NEY, H. A Systematic Comparison of Various Statistical Alignment Models, Computational Linguistics, 2003, número 1, volume 29, p. 19-51.