o objetivo deste projeto 6 propor a analise e implementacao de urn "parser



Documentos relacionados
PARSER: UM ANALISADOR SINTÁTICO E SEMÂNTICO PARA SENTENÇAS DO PORTUGUÊS

PROCESSAMENTO SINrATICO E SEMANnCO: UMA TENrATWA PARA SfNrESE

Processamento de Linguagem Natural (PLN)

Consultas em Bancos de Dados Utilizando Linguagem Natural

Lógica e Prolog. Prolog: Alain Colmerauer e seus colaboradores por volta de 1970

Letras. Objetivo. Aspectos das Conexões Sintáticas. Prof a. Dr a. Leda Szabo

Roteiro de Aula Prática

CASOS PARTICULARES S + S + A Obs:

Termos integrantes da oração Objeto direto e indireto

Exemplo: programa --> regra; fato. Muito utilizada para definir gramáticas e para processamento de linguagem natural.

3.1 Definições Uma classe é a descrição de um tipo de objeto.

O verbo O verbo. Prof. Erik Anderson. Gramática

Círculo Fluminense de Estudos Filológicos e Linguísticos

ESCOLA BÁSICA FERNANDO CALDEIRA Currículo de Português. Departamento de Línguas. Currículo de Português - 7º ano

A Morfologia é o estudo da palavra e sua função na nossa língua. Na língua portuguesa, as palavras dividem-se nas seguintes categorias:

PREDICADOS COMPLEXOS. Maria José Foltran* Preliminares

DICAS DE PORTUGUÊS. Sidney Patrézio Reinaldo Campos Graduando em Ciência da Computação

Vestibular UFRGS Resolução da Prova de Língua Portuguesa

PLANO DE AULA SEMANAL

1 Introdução. 1.1 Apresentação do tema

LIVRO ENGENHARIA DE SOFTWARE FUNDAMENTOS, MÉTODOS E PADRÕES CAPÍTULO ATIVIDADES, PAG. 138 A 150

Inteligência Artificial

PORTUGUÊS PARA CONCURSOS

Tradução Automática: Superando as Barreiras entre Línguas Européias e Chinesas

Linguagens e Programação Ano Lectivo 2006/2007. Relatório Trabalho Teórico. Linguagem Natural

UNIVERSITY OF SWAZILAND SUPPLEMENTARY EXAMINATION, 2012 LANGUAGE & LINGUISTIC IV IDE-PT202 THREE (3) HOURS

2013/2014 CONTEÚDOS TEMÁTICOS CONTEÚDOS GRAMATICAIS CALENDARIZAÇÃO UNIDADE

COLÉGIO AFAM SÃO MIGUEL Conteúdo Processo Seletivo 2014

Professora: Lícia Souza

EMENTAS DAS DISCIPLINAS

Análise semântica. Análise Semântica. Estrutura de um compilador. Anotação da árvore sintática. Tipos de comunicação de atributos?

Biblioteca Escolar. O Dicionário

PROBLEMAS NA CARACTERIZAÇÃO DA CLASSE DOS ADVÉRBIOS: O CASO DO ASSIM Giovanna Mazzaro VALENZA (G- UFPR)

1.0. Transitividade e intransitividade na gramatica tradicional e na gramatica gerativa

Escutar discursos breves para aprender e construir conhecimentos.

PARFOR 2014 CURSO INTENSIVO DE ATUALIZAÇÃO DE PROFESSORES DE PORTUGUÊS LÍNGUA MATERNA FLUP

As palavras: QUE, SE e COMO.

5 Sintaxe dos verbos haver e existir

AULA 5 QUANTIFICADORES, PREDICADOS E VALIDADE

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA INGLÊS LE I (2 anos) 2015

Prof. Volney Ribeiro

A lógica de programação ajuda a facilitar o desenvolvimento dos futuros programas que você desenvolverá.

Um estudo sobre a geração e narração automática de estórias. Dissertação apresentada como requisito parcial para obtenção

AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS

ENSINO FUNDAMENTAL. Sondagem º ANO. Língua Portuguesa

Conteúdo Provas Trimestrais 6º EF Datas Disciplina Conteúdo

Diagrama de contexto

PLANO DE ESTUDOS DE PORTUGUÊS 6.º ANO

Ensino Técnico Integrado ao Médio FORMAÇÃO GERAL. Ensino Médio

Linguagem Lógica Prolog

PED LÍNGUA PORTUGUESA ORIENTAÇÕES ACADÊMICAS

PLANIFICAÇÃO ANUAL 2015/2016 PORTUGUÊS - 3ºANO

Linguística Computacional Interativa

CRITÉRIOS ESPECÍFICOS DE AVALIAÇÃO 3º ANO (1º CICLO) PORTUGUÊS

Pontifícia Universidade Católica de São Paulo Departamento de Ciência da Computação

Língua Portuguesa 9º ano

PLANO DE CURSO REFERENCIAL LÍNGUA PORTUGUESA/GESTAR 6ª SÉRIE (7º ANO)

Processo Seletivo 2016 Conteúdo Programático - 1º ano do Ensino Fundamental

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1.

Informações sobre Filmes de Cinema em Cartaz em Linguagem Natural Relatório Final

Plano Curricular de Português. 6ºano Ano Letivo 2015/2016

COMANDO DA AERONÁUTICA ESCOLA DE ESPECIALISTAS DE AERONÁUTICA SUBDIVISÃO DE ADMISSÃO E DE SELEÇÃO

... Página 1 AGRUPAMENTO DE ESCOLAS ANO LETIVO: 2013/2014 ANO: 4º CURRÍCULO DA DISCIPLINA: PORTUGUÊS 1º PERÍODO CONTEÚDOS

ESTUDO DE CASO: LeCS: Ensino a Distância

METODOLOGIA DO TRABALHO CIENTÍFICO RESUMOS, FICHAMENTOS E RESENHA

COMPILADORES E INTERPRETADORES

Profª.: Elysângela Neves

Curso de Aprendizado Industrial Desenvolvedor WEB. Disciplina: Banco de Dados Professora: Cheli Mendes Costa Modelo de Dados

1.º Período. Unidade Domínio Objetivos Descritores de desempenho Ser capaz de Recursos Avaliação

Práticas de Programação em Lógica. José Romildo Malaquias

Informação Prova de Equivalência à Frequência

Interface Homem-Computador

Português- Prof. Verônica Ferreira

PLANO DE ENSINO PROJETO PEDAGÓGICO

Núcleo de Informática Aplicada à Educação Universidade Estadual de Campinas

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD

(1) Ha muita cadeira na sala. (2) Tres cafes por favor.

Modelagem de Casos de Uso (Parte 1)

A TEORIA DA PROPOSIÇÃO APRESENTADA NO PERIÉRMENEIAS: AS DIVISÃO DAS PRO- POSIÇÕES DO JUÍZO.

Leia a letra da música "Fico Assim Sem Você", de Claudinho e Buchecha:

Planificação de Língua Portuguesa 9º ano

Sumário. Apresentação - 1. a edição /13 Apresentação - 2 edição /14

Nova gramática do português brasileiro: tradição e ruptura Como consultar esta gramática...35

3 Modelo de Controle de Acesso no Projeto de Aplicações na Web Semântica

Diagrama de Caso de Uso e Diagrama de Sequência

Exercícios de gramática do uso da língua portuguesa do Brasil

Linguística P R O F A. L I L L I A N A L V A R E S F A C U L D A D E D E C I Ê N C I A D A I N F O R M A Ç Ã O

Relatório PIBIC 2012

Desvios de redações efetuadas por alunos do Ensino Médio

ALGORITMOS PARTE 01. Fabricio de Sousa Pinto

CALENDÁRIO DE AVALIAÇÕES 3º TRIMESTRE NOVEMBRO/2013 TURMA 311. Professora Grace

ELABORAÇÃO DE PROJETOS

Estudo das classes de palavras Conjunções. A relação de sentido entre orações presentes em um mesmo período e o papel das

Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL

INSTITUTO CAMPINENSE DE ENSINO SUPERIOR FACULDADE MAURÍCIO DE NASSAU CURSO DE ENFERMAGEM. NOME DOS ALUNOS (equipe de 4 pessoas) TÍTULO DO PROJETO

PROVA DISCURSIVA (P )

Academia Diplomática y Consular Carlos Antonio López

Metodologia de Desenvolvimento de Software. Prof. M.Sc. Sílvio Bacalá Jr

Conteúdo para avaliação bimestral 6º ano 4º Bimestre

Aula 1: Traços morfossintáticos

Transcrição:

PARSER: UM ANALISADOR SINTATICO E SEMANTICO PARA SENTEN«;AS DO PORTUGlltS Joao Luis Garcia ROSA (PUCCAMP) ABSTRACT: This work aims at the analysis and implementation 0/ a semantic parser for oral portuguese sentences. Its approach is based on word thematic role networks. A subset 0/ Portuguese grammar is implemented in Prolog, a programming language based on predicate logic. The system includes morphological analysis, syntactic analysis, and semantic analysis that generates a logical/orm o/the input sentence. KEY WORDS: parser, semantic analysis, logical fonn, natural language processing. o objetivo deste projeto 6 propor a analise e implementacao de urn "parser semantic 0" para sentencas da lfngua portuguesa oral, utilizando uma abordagem baseada nas redes de pap6is tematicos das palavras. Esta em desenvolvimento no Instituto de Estudos da Linguagem da UNICAMP, urn projeto de urn sintetizador de /ala em conjunto com a Faculdade de Engenharia El6trica da UNICAMP. A id6ia deste projeto 6 gerar a linguagem oral, a partir de urn texto escrito. E necessario urn parser que transformara 0 texto escrito, num determinado padrao, com marcas hierarquicas, que alimentara urn outro m6dulo, que se encarregara do restante da analise (analise fonol6gica, etc.). Como parte do meu projeto de tese de Doutorado, devo participar deste parser, que devera estabelecer fronteiras sintaticas (relacoes entre as palavras) e informacoes relativas as relevancias das palavras, etc. 0 parser pode ser assim descrito: o lexico deve conter 0 vocabulario usado pelo parser. Deve conter elementos de analise lingiiistica, estrutura e inter-relacionamento das palavras. A semiintica deve incluir a

forma 16gica, etc., mecanismos para pennitir a inferetlcia logica. Em rela~jio ao parser propriamente dito, vmas abordagens podem ser consideradas. A implementa~lio computacional de um fragmento de gramatica foi feita atraves da linguagem de programa~lio 16gica Prolog (do frances, Programmation en Logique), onde os comandos da linguagem SaG transposi~oes de formulas da 16gica de predicados de primeira ordem. lustamente por este fato preferiu-se implementar uma gramatica livre de contexto, baseada em eventos e papeis tematicos. Este analisador semantico fornece vanas formas logicas possiveis de senten~as declarativas da l{ngua portuguesa, analisando 0 determinante usado e fornecendo 0 q,antificador para 0 mesmo. A gramatica inclui a conjun~ao de senten~as, possibilitando a utiliza~ao de anaforas (pronomes pessoais) na segunda senten~a da conjunylio. Inclui tambem sintagmas preposicionais, atraves das chamadas com-sn, isto e, urn sintagma nominal iniciando com a palavra com. Isto permite com que 0 analisador forneya duas leituras para senten~as como obtendo-se uma forma 16gica onde maleta e 0 instrumento de abateu e tambem a forma onde maleta e objeto de posse de menino. o programa inclui tambem, uma analise morfol6gica, que classifica cada verba regular, em todos os tempos verbais e cada substantivo, adjetivo, etc. em genero e mlmero. Alguns verbos irregulares foram incluldos, como ser, estar, etc. Deve-se considerar, entretanto, que se trata apenas de uma primeira verslio de urn parser, que certamente servira de base para 0 projeto maior. Vcirias considera~oes lingillsticas terao de ser revistas. o sistema inclui divers os adverbios, segundo a classifica~ao de l1ari et alii (1990), entre os quais os predicativos qualitativos e intensificadores, os sentenciais (modalizadores e aspectualizadores) e os nao-predicativos (neg~ao). Como a analise fornece a forma 16gica baseada em eventos, optou-se por declarar como adjunto 0 adverbio que acompanha 0 verbo, 0 nome ou 0 adjetivo. Na linguagem Prolog. nao e trivial, talvez nem mesmo possivel, a implement~ao de predicaylio de segunda ordem. Optou-se por usar a nota~lio baseada em eventos, onde 0 verba e 0 elemento principal da sentenya que atribui papeis tematicos aos outros elementos que 0 acompanham. A implementaylio consiste de urn lexico pequeno, onde se define apenas as formas singulares das palavras (a analise morfol6gica se encarregara de descobrir 0 numero). Consiste tambem das terminayoes dos verbos regulares, para todos os tempos do modo indicativo. Foram incluidos tambem alguns verb os irregulares. 0 programa dispoe de uma tela de informaylio sobre 0 lexico armazenado. A analise se baseia numa gramatica

sintagmatica. a Gramatica de Clausulas Definidas, de Pereira e Wmen (1980). Caso a senten~a seja agramatical, ou caso 0 sistema nao possua previsao de analise, 0 parser rejeita a senten~a. RESUMO: Este trabalho propoe a analise e implementa~iio de um parser semfintico para senten~as da lingua portuguesa oral, utilizando uma abordagem baseada nas redes de papeis tematicos das palavras. Foi implementado umfragmento de gramatica em Prolog, uma linguagem de programa~jjo baseada em logica. 0 sistema inclui uma analise moifol6gica. uma analise sintdtica e uma analise semantica que gera uma forma 16gicapara a sente~a de entrada. PALAVRAS-CHAVB: parser, analise semantica. forma 16gica. processamento de linguagem natural Analise Morfo16gica Analise Sintlitica Gera~lio de Forma L6gica * Jolio Luis Garcia Rosa * *********************

Determinantes: um,uma,algum,alguma,o,a,todo,toda. Substantivos: homem,menino,menina,mulher,bola,maleta,faca,gente. Nomes Pr6prios:. joao,maria. Adjetivos: bonito,bonita,posta., Adverbios: bem,muito,mais,demais,meio,nao,felizmente, normalmente,realmente,humanamente. Verbos Transitivos: abater,matar. Verbos Intransitivos: viver, partir. Verbos de C6prila: ser, estar. Pronomes Pessoais. Outras: que, e, com. Se 0 usucirio digitar "n", 0 sistema volta a pedir a entrada de uma frase ("f'). As entradas do usucirioestao em italico, para diferenciar das safdas do sistema. Digite a frase para a geracao da(s) forma(s) 16gica(s)(entre "aspas"): "0 menino bonito matou as mulheres". existe(x) : (menino(x) & bonito(x» & qualquer(y) : mulher(y) -> existe(e,pret-p erf) : matar(e) & agente(e,x) & tema(e,y)

Caso se digite wna senten~a ambigua, 0 sistema da as leituras possfveis (uma de cada vez). Suponha a entrada de wna senten~a, na qual maleta pode ser instrwnento da a~ao de abater ou posse de menina: Digite a frase para a gera~ao da(s) forma(s) 16gica(s) (entre "aspas"): "0 menino abateu a menina com a maleta ". existe(x) : menino(x) & existe(z) : maleta(z) & existe(y) : menina(y) & existe(e,precperf) : abater(e) & agente(e,x) & tema(e,y) & instr(e,z) existe(x): menino(x) & existe(z) : maleta(z) & existe(y) : menina(y) & existe(e,precperf) : abater(e) & agente(e,x) & tema(e,y) & possui(y,z)

Uma outra sentenr;a ambfgua, na qual a palavra /aca tambem pode ser 'interpretada como instrumento ou posse: Digite a frase para a gerar;ao da(s) forma(s) 16gica(s) (entre "aspas"): "10110 matou a mulher bonita com a/aca". existe(x) : joao(x) & existe(z) : faca(z) & existe(y) : (mulher(y) & bonita(y» & existe(e,precperf) : matar(e) & agente(e,x) & tema(e,y) & instr(e,z) existe(x) : joao(x) & existe(z) : faca(z) & existe(y) : (mulher(y) & bonita(y» & existe(e,precperf): matar(e) & agente(e,x) & tema(e,y) & possui(y,z) ILARI, R. et alii (1990). Coosidera es sobre a Posi~ dos Adv&bios. In Gramdlica do Portugues Falado - Volume I: A Ordem. Editora da UnicamplFapesp. PEREIRA, F. C. N. & WARREN, D. H. D. (1980). Definite Clause Grammars for Language Analysis - A Survey of the Formalism and a Comparison with Augmented Transition Networks. Artificial Intelligence 13, 231-278.