Tradução Automática: Superando as Barreiras entre Línguas Européias e Chinesas



Documentos relacionados
COMPILADORES E INTERPRETADORES

Análise de Sistemas. Visão Geral: Orientação a Objetos. Prof. José Honorato Ferreira Nunes honorato.nunes@bonfim.ifbaiano.edu.br

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

1 Introdução. 1.1 Apresentação do tema

Capítulo 4 - Roteamento e Roteadores

DESENVOLVIMENTO WEB DENTRO DOS PARADIGMAS DO HTML5 E CSS3

Introdução a Informática. Prof.: Roberto Franciscatto

Técnicas de Caixa Preta de Teste de Software

3. O NIVEL DA LINGUAGEM DE MONTAGEM

Introdução à Lógica de Programação

AGRUPAMENTO ESCOLAS DE REDONDO Escola Básica e Secundária Dr. Hernâni Cidade. INGLÊS Abril de 2015 PROVA 06 2º Ciclo do Ensino Básico

Programação de Computadores

PARFOR 2014 CURSO INTENSIVO DE ATUALIZAÇÃO DE PROFESSORES DE PORTUGUÊS LÍNGUA MATERNA FLUP

EMENTÁRIO DAS DISCIPLINAS DO CURSO DE LETRAS INGLÊS E LITERATURAS DE LÍNGUA INGLESA (Currículo iniciado em 2010)

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

Tabela de Símbolos. Análise Semântica A Tabela de Símbolos. Principais Operações. Estrutura da Tabela de Símbolos. Declarações 11/6/2008

Engenharia de Software

Biblioteca Escolar. O Dicionário

Resolução de problemas e desenvolvimento de algoritmos

Fundamentos de Sistemas de Informação Sistemas de Informação

1. NÍVEL CONVENCIONAL DE MÁQUINA

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

Apostila de Fundamentos de Programação I. Prof.: André Luiz Montevecchi

FAP - Faculdade de Apucarana Curso de Sistemas de Informação RESUMO EXPANDIDO DE TRABALHO DE CONCLUSÃO DE CURSO -

Introdução às Linguagens de Programação

Laboratório de Mídias Sociais

Yahoo compra criação de jovem de 17 anos por 30 milhões de dólares

1.1. Organização de um Sistema Computacional

A lógica de programação ajuda a facilitar o desenvolvimento dos futuros programas que você desenvolverá.

Análise e Desenvolvimento de Sistemas ADS Programação Orientada a Obejeto POO 3º Semestre AULA 03 - INTRODUÇÃO À PROGRAMAÇÃO ORIENTADA A OBJETO (POO)

PARSER: UM ANALISADOR SINTÁTICO E SEMÂNTICO PARA SENTENÇAS DO PORTUGUÊS

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon

Algoritmos e Programação (Prática) Profa. Andreza Leite andreza.leite@univasf.edu.br

Orientação a Objetos

Introdução à Computação

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA INGLÊS LE I (2 anos) 2015

Linguística P R O F A. L I L L I A N A L V A R E S F A C U L D A D E D E C I Ê N C I A D A I N F O R M A Ç Ã O

Compiladores. Análise léxica. Plano da aula. Vocabulário básico. Motivação para análise léxica. Estrutura de um compilador

O que é um programa? Programa é uma lista de instruções que descrevem uma tarefa a ser realizada pelo computador.

Sistema de Gerenciamento de Concursos Públicos PROJETO DE TRABALHO

Big Data. Como utilizar melhor e mais rápido seus dados e informações utilizando metodologias e tecnologias GED/ECM

AJUDA À REVISÃO do AnELL

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

AGRUPAMENTO VERTICAL DE ESCOLAS D. ANTÓNIO FERREIRA GOMES INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA DE INGLÊS 2º CICLO ANO 2015

Teoria dos valores no direito:

NOTAÇÃO MUSICAL TRADICIONAL: Como se escrever música?

A Educação Bilíngüe. » Objetivo do modelo bilíngüe, segundo Skliar:

Microsoft Access Para conhecermos o Access, vamos construir uma BD e apresentar os conceitos necessários a cada momento

Conceitos de Banco de Dados

Curso Técnico em Redes

Cinco principais qualidades dos melhores professores de Escolas de Negócios

Organização e Arquitetura de Computadores I. de Computadores

Escola Secundária Dr. João Manuel da Costa Delgado

EMENTAS DAS DISCIPLINAS

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA FRANCÊS

Um compilador é um programa que lê um programa escrito numa dada linguagem, a linguagem objecto (fonte), e a traduz num programa equivalente

PROGRAMA DE CAPACITAÇÃO E APERFEIÇOAMENTO PARA TUTORES - PCAT

Introdução ao Paradigma Orientado a Objetos. Principais conceitos

AULA 6.2 Conteúdo: Suportes de gêneros contemporâneos / Redes Sociais INTERATIVIDADE FINAL LÍNGUA PORTUGUESA DINÂMICA LOCAL INTERATIVA

EDITAL PARA PUBLICAÇÃO REVISTA PESQUISA E DEBATE EM EDUCAÇÃO

Aula 4 Pseudocódigo Tipos de Dados, Expressões e Variáveis

MÓDULO 8 ARQUITETURA DOS SISTEMAS DE BANCO DE DADOS

Linguagem Matemática e as Artes

Módulo 2 Custos de Oportunidade e Curva de Possibilidades de Produção

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

DIFERENÇAS ENTRE HUB, SWITCH E ROOTER

Gerenciamento de Dados e Informação Fernando Castor

Arquitecturas de Software Licenciatura em Engenharia Informática e de Computadores

ECO039 Linguagens Formais

Educação especial: um novo olhar para a pessoa com deficiência

GÍRIA, UMA ALIADA AO ENSINO DE LÍNGUA PORTUGUESA PARA ESTRANGEIROS Emerson Salino (PUC-SP) João Hilton (PUC/SP)

PROVA 358. (Dec.- Lei n.º 139/2012, de 5 de julho) 2014/ ª e 2.ª Fases

Memórias de Tradução: auxiliando o humano a traduzir

Análise e Projeto Orientados por Objetos

Roteiro da Biblioteca das Faculdades Coc Como Fazer Uma Pesquisa Teórica e Elaborar um Trabalho Acadêmico

Elaboração de Projetos

NOME COMPLETO DA SUA INSTITUIÇÃO. Nome completo do integrante A Nome completo do integrante B Nome completo do integrante C

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

Curso de Língua Chinesa, Cultura e Dinâmica de Negócios para Empresários e Gestores na China

A INTERATIVIDADE EM AMBIENTES WEB Dando um toque humano a cursos pela Internet. Os avanços tecnológicos de nosso mundo globalizado estão mudando a

"O MEC não pretende abraçar todo o sistema"

AFIRMAÇÃO CULTURAL E DE SOBERANIA:

IIH Introdução à Informática e Hardware

TECHONOLOGY FOR SECOND LANGUAGE LEARNING

Autómatos Finitos Determinísticos

UMA ESTRATÉGIA PARA A ÁSIA: O CPCLP E O ENSINO DO PORTUGUÊS NA CHINA

Geração de código intermediário. Novembro 2006

CES-32 e CE-230 Qualidade, Confiabilidade e Segurança de Software. Conceitos de Qualidade. CURSO DE GRADUAÇÃO e DE PÓS-GRADUAÇÃO DO ITA

Glossários em Moodle (1.6.5+)

Primeira Pesquisa TecnoAtiva de Segurança da Informação da Bahia e Sergipe 2006

APRENDER A LER PROBLEMAS EM MATEMÁTICA

WORKSHOPS DE INGLÊS TEENS

6 Quarta parte logística - Quarterização

LINGUAGENS E PARADIGMAS DE PROGRAMAÇÃO. Ciência da Computação IFSC Lages. Prof. Wilson Castello Branco Neto

PROVA DE EQUIVALÊNCIA À FREQUÊNCIA [INGLÊS]

PROJETO DE REDES

Pequenas e Médias Empresas no Canadá. Pequenos Negócios Conceito e Principais instituições de Apoio aos Pequenos Negócios

Introdução. 1.1 Histórico

Transcrição:

UFSC / PPGEP / UNL Tradução Automática: Superando as Barreiras entre Línguas Européias e Chinesas Maio, 2002 Paper 4 Irineu Theiss

Automatic Translation: Overcome Barriers between European and Chinese Languages WONG Fai, MAO Yuhang, DONG QingFu, QI YiHong Tsinghua University (China) Speech and Language Processing Research Center, Tsinghua Univ., Beijing 100084, P.R. China ABSTRACT This paper describes the differences between European languages and Chinese language, the urgency and possibility of realizing machine translation between the languages of Chinese and Latin s. Three different levels of realizing machine translation are enumerated: online dictionary, word-to-word translation and text-to-text translation. The difficulties and the ways to realize machine translation are studied and analyzed. It is pointed out that the rule-based machine translation is most promising and feasible. Keywords: machine translation, online dictionary, word segmentation, and ambiguity resolution

Introdução A comunicação entre pessoas que falam línguas diferentes depende de tradução A tradução em tempo real (simultânea) nem sempre é possível e seu custo pode ser proibitivo A TRADUÇÂO AUTOMÁTICA setorna atrativa por ser por ser rápida e barata

Intercâmbio China X Europa Observa-se um grande crescimento no intercâmbio cultural, científico, tecnológico e comercial A eficiência desse intercâmbio sofre o impacto das diferenças linguísticas É urgente construir um tradutor automático para facilitar o intercâmbio MAS...

... há dificuldades naturais Transferir o conhecimento associado a diferentes línguas para o computador não é tarefa fácil Entre línguas européias, por exemplo, existe muita similaridade: projetar o tradutor automático para essas línguas foi fácil, mas executá-lo e colocar no mercado é trabalho de décadas o sistema SYSTRAN é um exemplo de sucesso

Diferenças Linguísticas Para línguas de origens diferentes, há grandes diferenças na estrutura de vocabulário e gramática É o caso do Chinês (mandarim?) em relação às línguas ocidentais É fundamental levar em conta tais diferenças ao projetar um Tradutor Automático

Principais Características Línguas Européias: milhares de palavras construídas com um alfabeto limitado Mandarim: palavras são feitas com milhares de caracteres Numa frase, as palavras são separadas por espaços Na sentença, não há espaço entre palavras e caracteres

Principais Características (cont.) Ocorrem mudanças morfológicas das palavras Não há mudanças morfológicas Há diferença de gênero nos nomes Não há diferença de gênero

Principais Características (cont.) Línguas Européias: usa-se artigos diante dos nomes numa frase Mandarim: pouco uso de artigos Advérbio de tempo e lugar no final da frase Advérbio de tempo e lugar no início da frase Pouco uso de classificadores para modificar nomes Usualmente, nomes são modificados através de classificadores

Principais Características (cont.) Modificadores de sujeito e objeto vêm depois Normalmente vêm antes Expressão de tempo e voz é explícita Expressão de tempo e voz implícita

Diferentes Níveis de Tradução Automática Abordagem de acordo com a forma e precisão requerida Dicionário on-line : para buscar a tradução de uma simples palavra não é suficiente para traduzir um texto

Diferentes Níveis de Tradução Automática Tradução palavra-a-palavra: essa abordagem permite uma tradução expedita de uma frase, um parágrafo ou mesmo um texto faz apenas a análise morfológica (verbo, gênero, número) não faz análise sintática em alguns casos, o resultado da tradução pode ficar incompreensível

Diferentes Níveis de Tradução Automática Tradução palavra-a-palavra (cont.): na tradução do mandarim para uma língua européia, pode ser usado um algoritmo para segmentar as palavras chinesas. Numa frase ambígua, se a segmentação não for apropriada pode-se chegar a uma tradução errônea (ou falsa interpretação da frase) esse tipo de abordagem (palavra-a-palavra) pode ser usado para traduzir termos comerciais ou ligados à tecnologia

Diferentes Níveis de Tradução Automática Tradução texto-a-texto: o maior desafio da tradução via computador é traduzir uma frase inteira o sistema deve fazer não só a análise morfológica, mas também a análise semântica e a análise contextual projetar a base de conhecimento é a tarefa fundamental essa base conterá não só informações sintáticas, mas também semânticas

Diferentes Níveis de Tradução Automática Tradução texto-a-texto (cont.): A resolução de ambigüidades é outra questão importante Para a tradução via computador é absolutamente necessário descobrir os padrões de formação das frases nas diferentes linguagens Em resumo, vários processos são requeridos: segmentação de palavras, análise morfológica, resolução de ambigüidade, construção de frases, compatibilização de padrões de sentenças e geração da língua alvo O modelo de tradução baseado em regras é o mais promissor

Sistemas já Desenvolvidos Sistema de tradução Chinês para Inglês A tecnologia-chave nesse sistema é a segmentação de palavras para o Mandarim e a resolução de ambigüidade para frases ambíguas

Sistemas já Desenvolvidos Sistema THCE 2.0

Sistemas já Desenvolvidos Sistema de tradução Inglês para Mandarim

Sistemas já Desenvolvidos PCT 2.1 Português/Chinês word-by-word MACAU coexistência do Chinês com o Português há grande demanda de tradução de documentos oficiais do Português para Chinês, pois a maioria dos documentos oficiais e Leis estão na Língua Portuguesa Projeto de pesquisa conjunto da Universidade de MACAU e da Universidade Tsinghua

Sistemas já Desenvolvidos PCT 2.1 Português/Chinês word-by-word

Sistemas já Desenvolvidos PCT 2.0 Português/Chinês sentença por sentença em desenvolvimento

Sistemas já Desenvolvidos FET 1.0 Francês/Chinês word-by-word Projeto conjunto com o Ministério da Educação da França CFMT 1.5 Chinês/Francês sentença por sentença projeto em desenvolvimento

Conclusão Há uma demanda urgente por ferramentas para tradução, em função do explosivo crescimento da Internet Com a abertura econômica da China, cresce o número de negócios com empresas estrangeiras

Conclusão Tradução via computador é assunto do campo da Inteligência Artificial Perguntas que precisam ser respondidas: Como é o processo de geração da linguagem na mente humana?

Conclusão Se for uma espécie de database, então o pensamento e o conhecimento humano são infinitos Mas se é baseado em regras, então podemos dizer que as regras para formar sentenças a partir de palavras e frases são finitas

Conclusão O que precisa ser feito é preparar um bom dicionário e um conjunto de regras para as línguas fonte e destino E, aplicando algoritmos, será possível criar sistemas mais eficazes de tradução via computador

Perguntas?