A COMPILAÇÃO DE CORPORA PARALELOS E COMPARÁVEIS E O USO DE FERRAMENTAS COMPUTACIONAIS COM FINS PEDAGÓGICOS

Documentos relacionados
A Linguística de Corpus no ensino de línguas materna ou estrangeira ANDRÉA GEROLDO DOS SANTOS XII SEMANA DE FILOLOGIA FFLCH -USP

TÓPICOS EM ESTUDOS DA TRADUÇÃO PROF. DR. JOÃO AZENHA JUNIOR. Apresentação: Tecnologia e tradução Joacyr T Oliveira

Contraste de verbos indicadores de causalidade em originais e traduções: a Química Geral sob observação

A LINGUÍSTICA DE CORPUS NO ENSINO DE INGLÊS UM EXPERIMENTO BASEADO NOS USOS DE TO E FOR

ESTUDOS DA TRADUÇÃO II. Prof. Carlos Rodrigues 11 de abril de 2015

Elisa Duarte Teixeira Doutorado DLM/USP

A IMPORTÂNCIA DO ENSINO DE COLOCAÇÕES ESPECIALIZADAS E COLOCAÇÕES ESPECIALIZADAS ESTENDIDAS PARA A FORMAÇÃO DO TRADUTOR

CULTURA, LÉXICO E REGULARIDADES ESTRUTURAIS EM TEXTOS ESPECIALIZADOS DE MEDICINA E DE DIREITO AMBIENTAL: UM CONTRASTE EXPLORATÓRIO

DESENVOLVIMENTO DE ATIVIDADES ESCRITAS EM LÍNGUA INGLESA

Experiências práticas na UFU com a LC

UM CORPUS DO PORTUGUÊS DO BRASIL: VARIAÇÃO ENTRE GÊNEROS DISCURSIVOS

Para a criação de glossário terminológico bilíngue Português/ Libras 1 da área da Língua Portuguesa: metalinguagem técnico-científica

PADRÕES LEXICAIS DA OBRA DE EDGAR ALLAN POE À LUZ DA LINGUÍSTICA DE CORPUS

ANEXO 1 A Ementário e Quadro de disciplinas por Departamentos/Setores

DEPARTAMENTO DE ARTES E LIBRAS LETRAS LIBRAS EAD PLANO DE ENSINO

A LINGUÍSTICA DE CORPUS NA FORMAÇÃO DE TRADUTORES: COMPILAÇÃO E ANÁLISE DE UM CORPUS DE APRENDIZES DE TRADUÇÃO

A ELABORAÇÃO DE UM CATÁLOGO: CONSTRUÇÕES RECORRENTES EM TEXTOS DE PEDIATRIA PARA APRENDIZES DE TRADUÇÃO

CORPOBRAS PUC-Rio: Desenvolvimento e análise de um corpus representativo do português

Minicurso Expresso (parte única) Estudos contrastivos. Prof. Dr. Ariel Novodvorski (ILEEL/PPGEL/UFU) São Leopoldo RS, 16 de agosto de 2017

ESTUDO LEXICOGRÁFICO A LUZ DA LINGUÍSTICA DE CORPUS: FRASEOLOGISMOS ZOÔNIMOS.

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM FONOAUDIOLOGIA LINHA DE PESQUISA LINGUAGEM E SUBJETIVIDADE

Software para glossário Inglês/Português: uma ferramenta de auxílio para a disciplina de inglês técnico da área de informática

Stella E. O. Tagnin USP 2004

UM ESTUDO DO USO DE VOCÁBULOS, EXPRESSÕES FIXAS E SEMI- FIXAS MAIS FREQÜENTES EM CONTRATOS DE COMPRA E VENDA SUBMETIDOS À TRADUÇÃO JURAMENTADA

MEMÓRIAS DE TRADUÇÃO: AUXILIANDO O HUMANO A TRADUZIR

UNIVERSIDADE DE SÃO PAULO USP FACULDADE DE FILOSOFIA, LETRAS E CIÊNCIAS HUMANAS ALESSANDRA OTERO GOEDERT

Resenha: Corpora no ensino de línguas estrangeiras

HORÁRIO DO CURSO DE LETRAS PERÍODOS DIURNO E NOTURNO ANO LETIVO DE º ANO/1º SEMESTRE

Projeto COMET avanços e carências

Aspectos macro e microestruturais do gênero artigo científico da área Econometria: um estudo exploratório

ESTUDOS DA TRADUÇÃO II. Prof. Carlos Rodrigues 28 de março de 2015

UNIVERSIDADE DE SÃO PAULO. Faculdade de Filosofia, Letras e Ciências Humanas. Departamento de Letras Modernas

O ESTÁGIO SUPERVISIONADO PARA O PROFISSIONAL DE SECRETARIADO EXECUTIVO: UMA INVESTIGAÇÃO BASEADA EM CORPUS

Construções finais recorrentes em textos de Pediatria e de Econometria

CORPOBRAS PUC-Rio: Análise de corpus e a metáfora gramatical. Aluna: Ana Elisa Piani Besserman Vianna Orientadora: Lúcia Pacheco de Oliveira

UM OLHAR PARA A LINGUAGEM NA PRODUÇÃO DE ARTIGOS CIENTÍFICOS

Uso de verbos modais por alunos de inglês como língua estrangeira: uma investigação baseada em corpus

Disciplina: Leituras Dirigidas: Linguística de Corpus Código:

UNIVERSIDADE ESTADUAL PAULISTA CAMPUS DE SÃO JOSÉ DO RIO PRETO INSTITUTO DE BIOCIÊNCIAS, LETRAS E CIÊNCIAS EXATAS DE SÃO JOSÉ DO RIO PRETO

Linguística de Corpus: Possibilidades para o ensino de Línguas e Tradução

Uma proposta de ensino de grupos nominais em inglês para a área de informática

UMA ANÁLISE. Resumo: Este estudo diz respeito à tradução juramentada. Palavras-chave: Tradução juramentada; estudos

Realiter, Rio de Janeiro 2006

VARIAÇÃO DE PALAVRAS-CHAVE ENTRE GÊNEROS DE UM CORPUS JORNALÍSTICO

Linguística de Corpus e Tradução. Maria José Bocorny Finatto Aline Evers

PoloCLUP Linguateca Belinda Maia

A ARQUITETURA DE UM CORPUS NA ÁREA DE TEOLOGIA: CONCEPÇÃO E PROCEDIMENTOS DE COMPILAÇÃO * Solange Aparecida Faria Cardoso 1

DADOS DO COMPONENTE CURRICULAR

21 ÀS 22H30 Parte II: REDAÇÃO DE ABSTRACTS Busca e análise de abstracts da área em bases de dados especializadas

CYBELE M. OLIVEIRA ALLE/Letras-Bacharelado Bolsista voluntária de IC Orientadora: Profa. Dra. Maria José Bocorny Finatto

Inglês IV. plano de ensino. Ementa. Objetivos Gerais. UA 01 Company facts. UA 02 Telephoning in English

CORPOBRAS PUC-RIO: DESENVOLVIMENTO E ANÁLISE DE UM CORPUS REPRESENTATIVO DO PORTUGUÊS

Produção de atividades didáticas corpus-based em língua inglesa com foco em produção escrita

O processo de elaboração de um glossário bilíngue de colocações da área médica: contribuições para tradutores e professores de língua inglesa

Três décadas de pesquisa sobre a formação de professores de alemão no Brasil

CORPUS PARALELO E CORPUS PARALELO ALINHADO: PROPRIEDADES E APLICAÇÕES (PARALLEL CORPUS AND ALIGNED PARALLEL CORPUS: FEATURES AND APPLICATIONS)

Construção de um corpus paralelo e alinhado portuguêsitaliano-português

Plano de Trabalho Docente 2017 Ensino Técnico

FORMAÇÃO DE TRADUTORES: O DESENVOLVIMENTO DAS SUBCOMPETÊNCIAS INSTRUMENTAL E ESTRATÉGICA

TRADUÇÃO TÉCNICA, TERMINOLOGIA E LINGÜÍSTICA DE CORPUS: A FERRAMENTA WORDSMITH TOOLS

METÁFORAS COM VERBOS PONTUAIS DO PB E DO INGLÊS: UMA ANÁLISE DESCRITIVA E COMPARATIVA.

PLANO DE ENSINO SEMESTRE: 2016/02

7 Referências bibliográficas

A tradução na Comissão Europeia

AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E TEXTOS LITERÁRIOS. Bianca Pasqualini. Doutoranda PPGLet/UFRGS

EDITAL 93/2018 CONCURSO PÚBLICO DE PROVAS E TÍTULOS PARA O PROVIMENTO DOS CARGOS DA CARREIRA DO MAGISTÉRIO DO ENSINO BÁSICO, TÉCNICO E TECNOLÓGICO

Elaboração de um Glossário Trilíngue para a área de Tecnologia de Alimentos

UNIVERSIDADE FEDERAL DE MINAS GERAIS

MATRIZ CURRICULAR DO CURSO DE LETRAS. Unidade Responsável FL NÃO HÁ NC OBR

UNIVERSIDADE FEDERAL DE MINAS GERAIS

Recapitulando... Abordagens: PLN. Abordagens: PLN 29/03/2012. Introdução ao Processamento de Línguas Naturais. Distribuição de palavras

SURDOS E OUVINTES EM UMA SALA DE AULA INCLUSIVA: INTERAÇÕES SOCIAIS, REPRESENTAÇÕES E CONSTRUÇÕES DE IDENTIDADES

ESTUDOS DA TRADUÇÃO II. Prof. Carlos Rodrigues 21 de março de 2015

UNIVERSIDADE FEDERAL DE MINAS GERAIS

UNIVERSIDADE FEDERAL DE MINAS GERAIS

UNIVERSIDADE FEDERAL DE MINAS GERAIS

CANÔNICO OU POPULAR? QUALIDADE LITERÁRIA ATRAVÉS DO COMPUTADOR. Em um estudo anterior, Deus et al. (2006) analisaram o conteúdo de dois tópicos

Conceitos Básicos de Linguística. Com SAUSSURE até os dias de hoje. Maria José B. Finatto UFRGS

EXAME DE PROFICIÊNCIA EM LÍNGUA ESTRANGEIRA ESTUDOS PÓS-GRADUADOS DA PUC-SP

LISTA DE LIVROS 2019 UNIDADE CORREIA LIMA ANOS FINAIS - 6º ANO

SERVIÇO PÚBLICO FEDERAL MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DE UBERLÂNDIA INSTITUTO DE LETRAS E LINGUÍSTICA

CYBELE M. OLIVEIRA ALLE / Letras-Tradução Orientadora: Profa. Dra. Maria José Bocorny Finatto

Este documento resume a dissertação na extracção de recursos de tradução (Simões,

Etapa 1: Da inscrição:

Minicurso B: Introdução à Linguística de Corpus: começando do básico Parte 1

A TERMINOLOGIA ACADÊMICA DA ODONTOLOGIA EM LINGUA INGLESA: ANÁLISE ESTATÍSTICO-LEXICAL DE ARTIGOS ESCRITOS POR NATIVOS E POR BRASILEIROS

Estudos da teoria terminológica: história, conceitos e aplicações

COORDENAÇÃO DE LETRAS PORTUGUÊS E INGLÊS PLANO DE CURSO

Dicionario Portugues Espanhol

Centro Universitário Adventista de São Paulo - Campus EC Matriz Curricular do Curso de Letras - Licenciatura

A Compilação de um Corpus Paralelo de Traduções da Constituição Brasileira

Os aspectos linguísticos da tradução à luz dos pressupostos teóricos de Roman Jakobson versus a vertente da tradução da linguística de corpus

A categorização semântica dos compostos nominais técnicos em língua inglesa e os resultados tradutórios em português

ERRATA 001/2017 A) QUADRO DE OFERTA DE VAGAS PARA O MESTRADO. Corpo Projetos de Pesquisa Temas para orientação Vagas docente

Combinatórias léxicas especializadas na linguagem legislativa: investigação com corpus paralelo

Da compilação do corpus à publicação de um vocabulário bilíngue de fotografia: uma vivência real no ensino de tradução

Cadernos do CNLF, Vol. XIII, Nº 04

Transcrição:

A COMPILAÇÃO DE CORPORA PARALELOS E COMPARÁVEIS E O USO DE FERRAMENTAS COMPUTACIONAIS COM FINS PEDAGÓGICOS Este trabalho visa a apresentar iniciativas tomadas por dois pesquisadores em uma universidade pública, no sentido de montar uma base de dados que possibilite discussões teóricas sobre fenômenos linguísticos e questões lexicais, desde a organização de corpora textuais (BIBER et al, 1998; SINCLAIR, 2001; BERBER SARDINHA, 2004; BERNARDINI, 2011), dos processos de elaboração de dicionários (BIDERMAN, 1984, 2001; BORBA, 2002), treinamento de tradutores (BERBER SARDINHA, 2003; TAGNIN, 2003; ZANETTIN, 2009) e ensino e aprendizagem de línguas estrangeiras (CANALE, 1983; ASTON et al, 2004; GABALLO, 2009). Neste sentido, serão apresentados os resultados de sete pesquisas realizadas em nível de graduação e de extensão, nas quais foram utilizados princípios de compilação de corpora eletrônicos para que, por meio deles, fossem realizadas análises linguísticas, levantamentos terminológicos e procedimentos tradutórios. Para tanto, foram utilizados programas de memórias de tradução e ferramentas de análise lexical como o Wordfast (CHAMPOLLION, 1999), o WordSmith Tools (SCOTT, 2005), o Unitex (PAUMIER, 2002), além de ferramentas disponibilizadas gratuitamente na Web como o YouAlign e o Google Translator Toolkit. Os resultados ora apresentados focaram gêneros textuais do discurso especializado, literários, informativos e de divulgação. No caso dos textos especializados, o primeiro projeto visou a constituição de corpora textuais especializados com gêneros do domínio econômico-financeiro em espanhol veiculados em revistas científico-acadêmicas de quatro países de língua espanhola (Espanha, Argentina, Uruguai e Paraguai) para a montagem de uma base de dados por meio da qual seria possível descrever e analisar o uso especializado da língua espanhola (nas variedades peninsular, argentina, uruguaia e paraguaia) a fim de descrever aspectos linguísticos e elaborar dicionários terminológicos. O gênero contemplado na primeira etapa desse projeto foi o artigo científico. Selecionaram-se quatro revistas acadêmicas da área da Economia publicadas na Espanha, Argentina, no Uruguai e no Paraguai e coletaram-se artigos para a futura organização do corpus que, atualmente, conta com aproximadamente 600 mil itens. O segundo projeto (PIBIC/CNPq) prevê a organização de um corpus textual em língua espanhola com textos de diferentes gêneros da esfera jornalística veiculados em

jornais de três países da América do Sul Argentina, Paraguai e Uruguai. Esse projeto continuará no segundo semestre de 2012 com a inclusão de jornais de outros países hispanoamericanos bem como da Espanha. O objetivo desse corpus é desenhar a macroestrutura de um dicionário bilíngue português-espanhol para a produção de textos em espanhol por aprendizes brasileiros. No terceiro projeto, três bolsistas realizaram a versão, para a língua inglesa, de textos informativos constantes do site de Química da universidade na qual estudam, utilizando a Google Translator Toolkit, uma ferramenta CAT online, que garantiu a centralização dos arquivos, já que, como os textos que seriam vertidos estavam na Internet, não haveria problemas de sincronia dos dados. Além da versão, elaboraram um glossário em forma de memórias de tradução que pôde ser utilizados por todos durante todo o processo tradutório. Este corpus paralelo, contendo os textos originais e as traduções, hoje conta com 15.504 itens. Dando continuidade ao projeto de extensão, três novos estagiários iniciarão a versão do site da Faculdade de Farmácia e terão o auxílio de um especialista da área para a consulta terminológica. Na quarta pesquisa, foram compilados dois corpora comparáveis sobre Biotecnologia, nas línguas portuguesa e inglesa, que, por sua vez, foram subdivididos nas subáreas Biotecnologia Ambiental, Celular e Industrial. O corpus conta com 20.150 itens, do qual serão levantados termos simples e complexos a partir de palavras-chave para que constem de um glossário que será transformado em memórias de tradução a ser utilizado na ferramenta de tradução Trados. Passamos, agora, a apresentar os trabalhos de cunho literário. O quinto trabalho tratou-se de um estudo comparativo da ocorrência de sintagmas preposicionais na obra Alice s adventures in Wonderland, de Lewis Carroll, e da respectiva tradução para o português (CARROLL, 1993, 2002). Para tanto, foi realizada uma busca pela estrutura formada por preposição 1 + (artigo) + substantivo + preposição 2 com o auxílio do programa WordSmith Tools, que fez a busca dos sintagmas tendo como palavra de busca as preposições mais frequentes. Em seguida, os textos em inglês e em português foram alinhados pelo programa YouAlign que possibilitou a comparação dos sintagmas nas duas línguas. Os resultados mostraram que, na versão portuguesa, o sintagma preposicional foi repetidamente modificado, o que permitiu a elaboração de um glossário bilíngue da obra de Carroll com o contexto de uso dos sintagmas preposicionais nas duas línguas.

No sexto trabalho, uma equipe de cinco alunos de graduação e de pós, sob a orientação de três professoras de língua e literatura inglesa, traduziram a obra Democratic Vistas, de Walt Whitman, para a língua portuguesa. Após a utilização das ferramentas de tradução Wordfast e Google Toolkit, e pelo alinhamento com o YouAlign para os que não haviam utilizado as duas primeiras ferramentas, o grupo se reunia para discussão e edição do texto final. Após a conclusão da tradução, a obra, em forma de corpus paralelo, foi analisada por meio de levantamento de frequência de palavras, palavras-chave e análise da razão forma/item com o WordSmith Tools. Desta forma, foi possível avaliar a variação lexical da obra traduzida e as palavras-chave do domínio ecológico utilizadas pelo autor e pelos tradutores. Finalmente, no sétimo trabalho, a orientanda traduziu o conto The Angel at the Grave, da escritora norte-americana Edith Wharton, que será publicado em uma coletânea de contos de escritores dos séculos XIX e XX. O conto também foi traduzido com o auxílio da ferramenta de edição e de tradução de textos Google TranslatorToolkit, que, ao automaticamente alinhar os textos original e a tradução, permitiu a reflexão sobre o processo de tradução e sobre os procedimentos técnicos (BARBOSA, 1990) mais utilizados na tradução de um texto literário. A orientanda pôde adequar a tradução oferecida pelo tradutor automático e discutir as vantagens e desvantagens desta ferramenta ao se traduzir um texto literário, que possui características distintas do texto especializado. Uma vez concluídos estes trabalhos, o próximo passo a ser tomado será a organização de todos os corpora compilados até o momento em uma única base de dados para que seja possível a sua expansão e a realização de outros trabalhos que visem a formação de futuros pesquisadores nas áreas de Linguística Aplicada e Análise Linguística, mais especificamente nas linhas de Lexicologia, Lexicografia (monolingue, bilingue, pedagógica), Terminologia, Tradução e Ensino e Aprendizagem de Línguas. Tópicos do Trabalho: Compilação de Corpus; Estudos do Léxico (Lexicologia, Lexicografia e Terminologia/Fraseologia); Tradução Humana e Automática. Referências Bibliográficas ASTON, G.; BERNARDINI, S.; STEWART, D. Corpora and language learners. Amsterdã: John Benjamins, 2004. 311p. BARBOSA, H. G. Procedimentos técnicos da tradução: uma nova proposta. Campinas: Pontes, 1990.

BERBER SARDINHA, A. P. Uso de corpora na formação de tradutores. DELTA 19: Especial, p. 43-70, 2003.. Lingüística de Corpus. São Paulo: Editora Manole, 2004. 410 p. BERNARDINI, S. Specialised corpus construction for language professionals. In: Encontro de Linguística de Corpus, Universidade Federal de Minas Gerais, Belo Horizonte, 2011. BIBER D., CONRAD, S.; REPPEN, R. Corpus Linguistics: investigating language structure and use. Cambridge, Cambridge University Press, 1998. BIDERMAN, M. T. C. A ciência da lexicografia. Alfa: Revista de Lingüística, São Paulo, v.28, supl. p.1-26, 1984. Teoria linguística. São Paulo: Martins Fontes, 2001. BORBA, F. S. et al. Dicionário de usos do português do Brasil. São Paulo: Ática, 2002. CANALE, M. From Communicative Competence to Communicative Language Pedagogy. In: J. Richards &Schimidt (eds). Language and Communication. London: Longman. 1983. CARROLL, L. Alice s Adventures in the Wonderland, New York: Dover, 1993.. Alice no País das Maravilhas, Tradução de Maria Luiza Xavier de Almeida Borges, Rio de Janeiro: Jorge Zahar, 2002. CHAMPOLLION, Y. Wordfast. 1999. Disponível em: <http://www.wordfast.net/index.php> Acesso em 23 de janeiro de 2007. GABALLO, V. English in Translation Studies: methodological perspectives. Macerata: Eum Edizioni di Macerata, 2009. 150 p. Google translator toolkit. Disponível em <http://support.google.com/translate/toolkit/bin/answer.py?hl=pt-br&answer=147809> Acesso em 16 de agosto de 2010. PAUMIER, Unitex. Disponível em < http://www-igm.univ-mlv.fr/~unitex/> Acesso em 21/07/2011. SCOTT, M. WordSmith Tools: version 5.0. Oxford: Oxford University Press, 2007. SINCLAIR, J. 1991. Corpus, concordance, collocation. Oxford: Oxford University Press, 1991. TAGNIN, S. E. O. Os Corpora: instrumentos de auto-ajuda para o tradutor. Cadernos de Tradução, Florianópolis, v. 9, n. 2002/1, 2003. p. 191-213.

Trados. Disponível em < http://www.trados.com/en/> Acesso em 14 de junho de 2011. Youalign. Disponível em < http://youalign.com/ Acesso em 13 de julho de 2011. ZANETTIN, F. Corpus-based Translation Activities for Language Learners. The Interpreter and Translator Trainer, (3)2, 209-224, 2009.