PARSER: UM ANALISADOR SINTÁTICO E SEMÂNTICO PARA SENTENÇAS DO PORTUGUÊS



Documentos relacionados
o objetivo deste projeto 6 propor a analise e implementacao de urn "parser

Processamento de Linguagem Natural (PLN)

Consultas em Bancos de Dados Utilizando Linguagem Natural

Lógica e Prolog. Prolog: Alain Colmerauer e seus colaboradores por volta de 1970

PROCESSAMENTO SINrATICO E SEMANnCO: UMA TENrATWA PARA SfNrESE

Letras. Objetivo. Aspectos das Conexões Sintáticas. Prof a. Dr a. Leda Szabo

ESCOLA BÁSICA FERNANDO CALDEIRA Currículo de Português. Departamento de Línguas. Currículo de Português - 7º ano

PARFOR 2014 CURSO INTENSIVO DE ATUALIZAÇÃO DE PROFESSORES DE PORTUGUÊS LÍNGUA MATERNA FLUP

Roteiro de Aula Prática

CASOS PARTICULARES S + S + A Obs:

Processo Seletivo 2016 Conteúdo Programático - 1º ano do Ensino Fundamental

Círculo Fluminense de Estudos Filológicos e Linguísticos

AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS

EMENTAS DAS DISCIPLINAS

O verbo O verbo. Prof. Erik Anderson. Gramática

2013/2014 CONTEÚDOS TEMÁTICOS CONTEÚDOS GRAMATICAIS CALENDARIZAÇÃO UNIDADE

Biblioteca Escolar. O Dicionário

Práticas de Programação em Lógica. José Romildo Malaquias

PLANO DE CURSO REFERENCIAL LÍNGUA PORTUGUESA/GESTAR 6ª SÉRIE (7º ANO)

3.1 Definições Uma classe é a descrição de um tipo de objeto.

1 Introdução. 1.1 Apresentação do tema

Tradução Automática: Superando as Barreiras entre Línguas Européias e Chinesas

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA INGLÊS LE I (2 anos) 2015

PLANO DE ESTUDOS DE PORTUGUÊS 6.º ANO

Ensino Técnico Integrado ao Médio FORMAÇÃO GERAL. Ensino Médio

Termos integrantes da oração Objeto direto e indireto

Desvios de redações efetuadas por alunos do Ensino Médio

Interface Homem-Computador

RESENHA DE COHESION IN ENGLISH,

PORTUGUÊS PARA CONCURSOS

PLANO DE AULA SEMANAL

Análise semântica. Análise Semântica. Estrutura de um compilador. Anotação da árvore sintática. Tipos de comunicação de atributos?

DICAS DE PORTUGUÊS. Sidney Patrézio Reinaldo Campos Graduando em Ciência da Computação

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD

Linguagens e Programação Ano Lectivo 2006/2007. Relatório Trabalho Teórico. Linguagem Natural

Resolução de problemas e desenvolvimento de algoritmos

4 ESTRUTURA E APRESENTAÇÃO DE ARTIGO CIENTÍFICO

A lógica de programação ajuda a facilitar o desenvolvimento dos futuros programas que você desenvolverá.

A Morfologia é o estudo da palavra e sua função na nossa língua. Na língua portuguesa, as palavras dividem-se nas seguintes categorias:

MANUAL C R M ÍNDICE. Sobre o módulo de CRM Definindo a Campanha... 3

Iniciação à Informática

PROBLEMAS NA CARACTERIZAÇÃO DA CLASSE DOS ADVÉRBIOS: O CASO DO ASSIM Giovanna Mazzaro VALENZA (G- UFPR)

ENSINO FUNDAMENTAL. Sondagem º ANO. Língua Portuguesa

Trabalho Interdisciplinar. MS Project

Sistemas Operacionais de Rede Linux - Gerenciamento de Arquivos

Diagrama de Caso de Uso e Diagrama de Sequência

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1.

Exemplo: programa --> regra; fato. Muito utilizada para definir gramáticas e para processamento de linguagem natural.

Projeto de Graduação 1 Prof. Fabiano Dorça. Metodologia Científica

PLANIFICAÇÃO ANUAL 2015/2016 PORTUGUÊS - 3ºANO

CARVALHO, Maria Adelaide Pinto dos Santos, Programação com Excel para Economia & Gestão, Lisboa: FCA. COELHO, Pedro, Criar e publicar páginas Web

1.º CEB. Clara Amorim

Linguística P R O F A. L I L L I A N A L V A R E S F A C U L D A D E D E C I Ê N C I A D A I N F O R M A Ç Ã O

AULA 5 QUANTIFICADORES, PREDICADOS E VALIDADE

Português. Índice de aulas. Tipologias textuais

Modelagem de Casos de Uso (Parte 1)

COMANDO DA AERONÁUTICA ESCOLA DE ESPECIALISTAS DE AERONÁUTICA SUBDIVISÃO DE ADMISSÃO E DE SELEÇÃO

Professora: Lícia Souza

Técnicas de Teste de Software

Escutar discursos breves para aprender e construir conhecimentos.

Núcleo de Informática Aplicada à Educação Universidade Estadual de Campinas

Nova gramática do português brasileiro: tradição e ruptura Como consultar esta gramática...35

Escola Básica da Madalena Grelha de Conteúdos PORTUGUÊS 7º ano Ano letivo ORALIDADE LEITURA / EDUCAÇÃO LITERÁRIA 1º PERÍODO CONTEÚDOS

Curso de Aprendizado Industrial Desenvolvedor WEB. Disciplina: Banco de Dados Professora: Cheli Mendes Costa Modelo de Dados

1.º Período. Unidade Domínio Objetivos Descritores de desempenho Ser capaz de Recursos Avaliação

Este documento vai ser divulgado na escola-sede do Agrupamento e na página eletrónica:

Curso: Ciência da Computação Disciplina: Construção de Compiladores Período: Prof. Dr. Raimundo Moura

3 Modelo de Controle de Acesso no Projeto de Aplicações na Web Semântica

Pontifícia Universidade Católica de São Paulo Departamento de Ciência da Computação

Português- Prof. Verônica Ferreira

Algoritmos não se aprendem: Copiando algoritmos Estudando algoritmos Algoritmos só se aprendem: Construindo algoritmos Testando algoritmos

Etapas da Introdução do Projeto de Pesquisa Científica. Maria da Conceição Muniz Ribeiro Mestre em Enfermagem pela UERJ

RESPOSTA A RECURSO CONTRA QUESTÃO DE PROVA

Decreto-Lei n.º 139/2012, de 5 de julho, na redação atual. Regulamento de Exames.

Guião da Atividade Declaração de Compromisso com o Futuro

Informação-Exame de Equivalência à disciplina de: INGLÊS (LE I) Prova Oral e Prova Escrita

Alemão (Nível A1) - Nível de Iniciação

Ensino Técnico Integrado ao Médio

PED LÍNGUA PORTUGUESA ORIENTAÇÕES ACADÊMICAS

ROTEIRO PARA ELABORAÇÃO DE PROJETOS

Relatório PIBIC 2012

AGRUPAMENTO DE CLARA DE RESENDE COD COD

COMO REDIGIR ARTIGOS CIENTÍFICOS. Profa. EnimarJ. Wendhausen

Prof. Volney Ribeiro

Linguagem Lógica Prolog

LINGUAGENS E PARADIGMAS DE PROGRAMAÇÃO. Ciência da Computação IFSC Lages. Prof. Wilson Castello Branco Neto

O modelo do computador

COMPILADORES E INTERPRETADORES

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA

A TEORIA DA PROPOSIÇÃO APRESENTADA NO PERIÉRMENEIAS: AS DIVISÃO DAS PRO- POSIÇÕES DO JUÍZO.

O Software Face Match

FundamentosemInformática

FACULTADE DE FILOLOXÍA DEPARTAMENTO DE FILOLOXÍA GALEGA LINGUA PORTUGUESA 5. José Luís Forneiro Pérez GUÍA DOCENTE E MATERIAL DIDÁCTICO

Curso Técnico em Redes

Conteúdo Programático

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

Um estudo sobre a geração e narração automática de estórias. Dissertação apresentada como requisito parcial para obtenção

ALGORITMOS PARTE 01. Fabricio de Sousa Pinto

Turma Regular Semanal Manhã

Vestibular UFRGS Resolução da Prova de Língua Portuguesa

Transcrição:

Estudos Lingüísticos XXVI (Anais de Seminários do GEL) Trabalho apresentado no XLIV Seminário do GEL na UNITAU - Taubaté, em 1996 UNICAMP-IEL Campinas (1997), 352-357 PARSER: UM ANALISADOR SINTÁTICO E SEMÂNTICO PARA SENTENÇAS DO PORTUGUÊS João Luís Garcia ROSA (PUCCAMP) ABSTRACT: This work aims at the analysis and implementation of a semantic parser for oral portuguese sentences. Its approach is based in word thematic role networks. A subset of Portuguese grammar is implemented in Prolog, a programming language based on predicate logic. The system includes morphological analysis, syntactic analysis, and semantic analysis that generates a logical form of the input sentence. KEY WORDS: parser, semantic analysis, logical form, natural language processing. 0 - INTRODUÇÃO O objetivo deste projeto é propor a análise e implementação de um parser semântico para sentenças da língua portuguesa oral, utilizando uma abordagem baseada nas redes de papéis temáticos das palavras. Está em desenvolvimento no Instituto de Estudos da Linguagem da UNICAMP, um projeto de um sintetizador de fala em conjunto com a Faculdade de Engenharia Elétrica da UNICAMP. A idéia deste projeto é gerar a linguagem oral, a partir de um texto escrito. É necessário um parser que transformará o texto escrito, num determinado padrão, com marcas hierárquicas, que alimentará um outro módulo, que se encarregará do restante da análise (análise fonológica, etc.). Como parte do meu projeto de tese de Doutorado, devo participar deste parser, que deverá estabelecer fronteiras sintáticas (relações entre as palavras) e informações relativas às relevâncias das palavras, etc. O parser pode ser assim descrito: Léxico Semântica PARSER O léxico deve conter o vocabulário usado pelo parser. Deve conter elementos de análise lingüística, estrutura e inter-relacionamento das palavras. A semântica deve incluir a

forma lógica, etc., mecanismos para permitir a inferência lógica. Em relação ao parser propriamente dito, várias abordagens podem ser consideradas. 1 - IMPLEMENTAÇÃO A implementação computacional de um fragmento de gramática foi feita através da linguagem de programação lógica Prolog (do francês, Programmation em Logique), onde os comandos da linguagem são transposições de fórmulas da lógica de predicados de primeira ordem. Justamente por este fato preferiu-se implementar uma gramática livre de contexto, baseada em eventos e papéis temáticos. Este analisador semântico fornece várias formas lógicas possíveis de sentenças declarativas da língua portuguesa, analisando o determinante usado e fornecendo o quantificador para o mesmo. A gramática inclui a conjunção de sentenças, possibilitando a utilização de anáforas (pronomes pessoais) na segunda sentença da conjunção. Inclui também sintagmas preposicionais, através das chamadas com-sn, isto é, um sintagma nominal iniciando com a palavra com. Isto permite com que o analisador forneça duas leituras para sentenças como O homem abateu o menino com a maleta obtendo-se uma forma lógica onde maleta é o instrumento de abateu e também a forma onde maleta é objeto de posse de menino. O programa inclui também, uma análise morfológica, que classifica cada verbo regular, em todos os tempos verbais e cada substantivo, adjetivo, etc. em gênero e número. Alguns verbos irregulares foram incluídos, como ser, estar, etc. Deve-se considerar, entretanto, que se trata apenas de uma primeira versão de um parser, que certamente servirá de base para o projeto maior. Várias considerações lingüísticas terão de ser revistas. O sistema inclui diversos advérbios, segundo a classificação de Ilari et alli (1990), entre os quais os predicativos qualitativos e intensificadores, os sentenciais (modalizadores e aspectualizadores) e os não-predicativos (negação). Como a análise fornece a forma lógica baseada em eventos, optou-se por declarar como adjunto o advérbio que acompanha o verbo, o nome ou o adjetivo. Na linguagem Prolog, não é trivial, talvez nem mesmo possível, a implementação de predicação de segunda ordem. Optou-se por usar a notação baseada em eventos, onde o verbo é o elemento principal da sentença que atribui papéis temáticos aos outros elementos que o acompanham. A implementação consiste de um léxico pequeno, onde se define apenas as formas singulares das palavras (a análise morfológica se encarregará de descobrir o número). Consiste também das terminações dos verbos regulares, para todos os tempos do modo indicativo. Foram incluídos também alguns verbos irregulares. O programa dispõe de uma tela de informação sobre o léxico armazenado. A análise se baseia numa gramática 353

sintagmática, a Gramática de Cláusulas Definidas, de Pereira e Warren (1980). Caso a sentença seja agramatical, ou caso o sistema não possua previsão de análise, o parser rejeita a sentença. RESUMO: Este trabalho propõe a análise e implementação de um parser semântico para sentenças da língua portuguesa oral, utilizando uma abordagem baseada nas redes de papéis temáticos das palavras. Foi implementado um fragmento de gramática em Prolog, uma linguagem de programação baseada em lógica. O sistema inclui uma análise morfológica, uma análise sintática e uma análise semântica que gera uma forma lógica para a sentença de entrada. PALAVRAS-CHAVE: parser, análise semântica, forma lógica, processamento de linguagem natural ANEXO O programa, quando executado, fornece a seguinte janela de entrada: ******************** * PARSER * ******************** Análise Morfológica Análise Sintática Geração de Forma Lógica ********************* * João Luís Garcia Rosa * ********************* Deseja informações sobre o léxico (i) ou entrar com uma frase? (f): Caso se entre com um i (informações), o sistema fornece o seguinte: 354

PARSER BASEADO EM EVENTOS E PAPÉIS TEMÁTICOS Sentença declarativa, cláusula relativa, sintagma preposicional e anáfora. Léxico disponível: Determinantes: um, uma, algum, alguma, o, a, todo, toda Substantivos: homem, menino, menina, mulher, bola, maleta, faca, gente. Nomes Próprios: joão, maria Adjetivos: bonito, bonita, posta. Advérbios: bem, muito, mais, demais, meio, não, felizmente, normalmente, realmente, humanamente. Verbos Transitivos: abater, matar. Verbos Intransitivos: viver, partir. Verbos de Cópula: ser, estar. Pronomes Pessoais. Outras: que, e, com. Quer terminar? (s/n) Se o usuário digitar n, o sistema volta a pedir a entrada de uma frase ( f ). As entradas do usuário estão em itálico, para diferenciar das saídas do sistema. Deseja informações sobre o léxico (i) ou entrar com uma frase? (f): f Digite a frase para a geração da(s) forma(s) lógica(s) (entre aspas ): O menino bonito matou as mulheres. Forma(s) Lógica(s): existe(x): (menino(x) & bonito(x)) & qualquer(y): mulher(y) -> existe(e,pret_perf): matar(e) & agente(e,x) & tema(e,y) Quer terminar? (s/n) 355

Caso se digite uma sentença ambígua, o sistema dá as leituras possíveis (uma de cada vez). Suponha a entrada de uma sentença, na qual maleta pode ser instrumento da ação de abater ou posse de menina: Deseja informações sobre o léxico (i) ou entrar com uma frase? (f): f Digite a frase para a geração da(s) forma(s) lógica(s) (entre aspas ): O menino abateu a menina com a maleta. Forma(s) Lógica(s): existe(x): (menino(x) & existe (z): maleta(z) & existe(y): menina(y) & existe (e,pret_perf): abater(e) & agente(e,x) & tema(e,y) & instr(e,z) existe(x): (menino(x) & existe (z): maleta(z) & existe(y): menina(y) & existe (e,pret_perf): abater(e) & agente(e,x) & tema(e,y) & possui(y,z) Deseja informações sobre o léxico (i) ou entrar com uma frase? (f): 356

Uma outra sentença ambígua, na qual a palavra faca também pode ser interpretada como instrumento ou posse: Deseja informações sobre o léxico (i) ou entrar com uma frase? (f): f Digite a frase para a geração da(s) forma(s) lógica(s) (entre aspas ): João matou a mulher bonita com a faca. Forma(s) Lógica(s): existe(x): joão(x) & existe(z): faca(z) & existe(y): (mulher(y) & bonita(y)) & existe(e,pret_perf): matar(e) & agente(e,x) & tema(e,y) & instr(e,z) existe(x): joão(x) & existe(z): faca(z) & existe(y): (mulher(y) & bonita(y)) & existe(e,pret_perf): matar(e) & agente(e,x) & tema(e,y) & possui(y,z) Deseja informações sobre o léxico (i) ou entrar com uma frase? (f): REFERÊNCIAS BIBLIOGRÁFICAS ILARI, R. et allii (1990). Considerações sobre a Posição dos Advérbios. In Gramática do Português Falado - Volume I: A Ordem. Editora da Unicamp/Fapesp. PEREIRA, F. C. N. & WARREN, D. H. D. (1980). Definite Clause Grammars for Language Analysis - A Survey of the Formalism and a Comparison with Augmented Transition Networks. Artificial Intelligence 13, 231-278. 357