A generalização do sistema ConPor

Tamanho: px
Começar a partir da página:

Download "A generalização do sistema ConPor"

Transcrição

1 Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP A generalização do sistema ConPor Lucia Specia Lucia Helena Machado Rino NILC-TR Janeiro, 2003 Série de Relatórios do Núcleo Interinstitucional de Lingüística Computacional NILC - ICMC-USP, Caixa Postal 668, São Carlos, SP, Brasil

2 Resumo Este relatório descreve o processo de generalização do ConPor, um sistema cuja função é mapear estruturas sintáticas em estruturas conceituais UNL. Para essa generalização, as regras de mapeamento sintático-conceitual foram redefinidas por meio de uma gramática gerativo-transformacional, de acordo com uma metodologia funcional e composicional. São apresentadas as diferenças da versão generalizada em relação à anterior, a expansão do corpus realizada para viabilizar essa generalização e a implementação da nova versão. Este trabalho conta com o apoio financeiro da CAPES

3 Índice 1 Introdução A expansão do corpus base O Repositório Conceitual Regras de projeção Especificação das regras Um exemplo Heurísticas de relacionamento Busca e linearização Extração dos papéis semânticos Atribuição dos RLs Estruturas sintáticas não previstas A implementação, os números e o custo do ConPor Implementação Números Entradas lexicais Regras de projeção Heurísticas de relacionamento Custo de desenvolvimento e expansão Comparação das duas versões Considerações finais Referências bibliográficas Apêndice A Regras de projeção Heurísticas de relacionamento Figuras Figura 1 Arquitetura do ConPor... 1 Figura 2 Estrutura sintática das sentenças (2a) e (2b)... 3 Figura 3 Exemplos de estruturas conceituais UNL para a estrutura sintática da Figura Figura 4 Detalhamento dos módulos Gerador Conceitual e Repositório Conceitual... 4 Figura 5 Exemplos de estruturas sintáticas para períodos independentes... 7 Figura 6 Exemplo do uso de escopos na UNL... 14

4 Figura 7 Estrutura sintática da sentença (8) Figura 8 Regras de projeção para a sentença (8) Figura 9 Esquema geral da aplicação das regras de projeção para sentença (8) Figura 10 Subestruturas sintáticas da sentença (8) Figura 11 Exemplos de diferentes ordens na estrutura conceitual da sentença (10) Figura 12 Estrutura sintática da sentença (8) Figura 13 Regras de projeção para a sentença (8) Figura 14 Simulação da aplicação das regras de projeção para a sentença (8) Figura 15 Resultado do processo de mapeamento da sentença (8) Tabelas Tabela 1 Atributos dos verbos utilizados pelas regras de projeção... 9 Tabela 2 Exemplos de verbos descritos segundo o dicionário de Borba Tabela 3 Possíveis papéis semânticos para os constituintes das sentenças do corpus base Tabela 4 Atributos UNL considerados no ConPor Tabela 5 Relações UNL consideradas no ConPor Tabela 6 Exemplos de possíveis combinações de regras para diferentes constituintes Tabela 7 Números de palavras e entradas lexicais Tabela 8 Número de regras de projeção intermediárias e terminais Tabela 9 Número de regras nas duas etapas da segunda versão do ConPor Tabela 10 Número de regras nas duas versões do ConPor Tabela 11 Número de palavras e entradas lexicais nas duas versões do ConPor... 26

5 1 Introdução O ConPor (Conceitualização do Português) é um sistema de geração de estruturas conceituais UNL (Universal Networking Language) (UNL, 2001) para sentenças do português. No estágio atual, o sistema parte de estruturas sintáticas produzidas pelo parser Curupira, em desenvolvimento no NILC 1, mapeando-as em estruturas conceituais (mapeamento sintático-conceitual, doravante). Na arquitetura do sistema, ilustrada na Figura 1, esse mapeamento é realizado pelo módulo Gerador Conceitual, a partir do conhecimento armazenado no Repositório Conceitual e no Léxico Enriquecido, um léxico semântico que contém informações morfossintáticas e semânticas da língua portuguesa (Specia & Rino, 2002a). Fase de preparação Sentença em Português Parser Curupira Estruturas Sintáticas Seletor Manual Est. Sintática mais Provável Léxico do Português Dicionário Port-UNL Léxico Enriquecido Gerador Conceitual Repositório Conceitual Código UNL Figura 1 Arquitetura do ConPor Os detalhes sobre os módulos dessa arquitetura, bem como sobre o funcionamento da primeira versão do sistema, são descritos em Specia & Rino (2002b). Neste relatório, apresentamos algumas alterações dessa versão, que envolvem, basicamente, a reespecificação do Repositório Conceitual e a modificação correspondente do Gerador Conceitual, com o objetivo de tornar o mapeamento sintático-conceitual mais genérico. Descrevemos, também, a expansão do corpus base, usado para modelar as regras de mapeamento sintático-conceitual e, portanto, para especificar a gramática de fundamentação do ConPor. Essa expansão do corpus é detalhada na Seção 2, seguida da descrição do novo Repositório Conceitual (Seção 3) e das alterações na implementação do sistema (Seção 4). Algumas considerações finais sobre o trabalho são apresentadas na Seção 5. 1 Núcleo Interinstitucional de Lingüística Computacional ( 1

6 2 A expansão do corpus base O corpus base do ConPor define o conjunto de exemplos que servem de base para a definição dos recursos lingüísticos e processos do sistema. Assim, esse corpus indica as estruturas sintáticas que podem ser contempladas pelo processo de mapeamento. Na primeira versão do sistema, esse corpus era constituído por 36 sentenças simples (orações nucleares, isto é, compostas por um único verbo ou locução verbal) declarativas e imperativas, agrupadas em 33 estruturas sintáticas diferentes, conforme descrito em Specia & Rino (2002b). Esse corpus, no entanto, mostrou-se pouco representativo para fornecer subsídios para a generalização pretendida. Portanto, resolvemos expandi-lo, para obter um corpus suficientemente representativo de algumas generalizações da língua portuguesa, as quais deveriam ser identificadas e formalizadas por meio de regras de mapeamento sintáticoconceitual. Nessa expansão, consideramos variações sintáticas e semânticas das novas sentenças, com base principalmente nos seguintes fatores relevantes para a generalização: (a) estruturas sintáticas variadas podem levar a uma mesma estrutura conceitual; (b) uma mesma estrutura sintática pode levar a diferentes estruturas conceituais. Privilegiamos, portanto, o aspecto qualitativo, buscando inserir construções gramaticais diversificadas. Como fonte para a escolha das sentenças, utilizamos um conjunto de textos que já haviam sido selecionados na primeira versão do sistema. Desse conjunto constavam os textos correspondentes a 27 horóscopos diários coletados da versão on-line do jornal Folha de São Paulo ( Esses textos foram analisados segundo os mesmos critérios utilizados na primeira versão do corpus, exceto no que diz respeito às restrições para a seleção e simplificação das sentenças, que se tornou menos rígido. Basicamente, o corpus expandido permite construções gramaticais relativamente mais complexas, como as orações subordinadas reduzidas exemplificadas em (1). (1) a. Reflita mais antes de falar. b. Pretender mais aumentaria a adrenalina. c. Fixar poucos objetivos seria bom. Com essa expansão, obtivemos 86 sentenças (declarativas e imperativas) adicionais, agrupadas em 74 diferentes estruturas sintáticas. Somadas ao corpus base inicial, essas sentenças totalizam 122, agrupadas em 107 estruturas sintáticas. Muito embora essa expansão indique um crescimento relativamente grande do corpus inicial, a representatividade desse corpus ainda é pequena, se considerarmos o uso efetivo do sistema na interpretação de sentenças do português, mesmo para um domínio limitado como o escolhido. No entanto, o objetivo deste trabalho é propor um modelo de interpretação semântica, e não um sistema robusto. Nesse sentido, a implementação de um sistema é apenas uma das conseqüências do trabalho, servindo para comprovar a aplicabilidade do modelo. Além disso, conforme veremos nas próximas seções, o sistema é organizado de forma a permitir a inclusão de regras de mapeamento para novas construções gramaticais, bem como a inclusão de novas palavras no Léxico Enriquecido. Com isso, tal sistema pode ser refinado de modo incremental, considerando novas construções gramaticais para o domínio em questão. 2

7 3 O Repositório Conceitual O Repositório Conceitual responde pela principal diferença entre a primeira versão do ConPor e a versão generalizada descrita neste relatório. Da mesma forma que na primeira versão, ele é um recurso lingüístico constituído pelas regras de mapeamento sintáticoconceitual, ou seja, por regras que, quando aplicadas a estruturas sintáticas, convertem essas estruturas em representações conceituais, isto é, em códigos UNL. A diferença entre as duas versões está localizada na natureza das regras que fazem esse mapeamento e na forma como elas são organizadas, dentre outros fatores. Na primeira versão do sistema, as regras de mapeamento são representadas por templates completos, ou seja, por modelos de mapeamento que assumem como entrada a estrutura sintática completa da sentença e guiam o processo de mapeamento até que a estrutura conceitual UNL seja gerada. Templates de estruturas conceituais são escolhidos de modo que seus slots possam ser preenchidos com as informações da sentença de entrada. Para a aplicação de um determinado template, as restrições nele especificadas devem ser satisfeitas. A única variação permitida nos templates diz respeito às folhas da estrutura sintática de entrada, que correspondem às palavras da sentença, desde que sejam observadas as restrições sintáticas e semânticas do template. Essa especificidade é mantida em todas as etapas do processo de mapeamento, de modo que ele ocorre somente para sentenças cujas características sintáticas e semânticas restritivas são idênticas às previstas pelos templates. Ao assumir a estrutura sintática completa como entrada, essa abordagem, apesar de apresentar chances maiores para um mapeamento correto, limita a capacidade de mapeamento do sistema aos exemplos completos pré-estabelecidos nos templates, uma vez que um ou mais templates precisam ser exaustivamente definidos para cada estrutura sintática completa diferente. Isso acontece porque a definição do repositório de templates não considera a ocorrência das partes análogas de diferentes estruturas sintáticas e, portanto, não permite a generalização (e conseqüente economia) de representação. Por exemplo, no caso das sentenças (2a) e (2b), apesar de todas as similaridades, inclusive a estrutura sintática, ilustrada na Figura 2, são necessários dois templates, uma vez que elas dão origem a diferentes estruturas conceituais. (2) a. O sol brilha em sagitário. b. O sol brilha em janeiro. (FRASE (PERIODO (PERIODO_INDEPENDENTE (SUJ (SUJ_SIMPLES (SN (AADNE (SDET (nucleo_artigo))) (nucleo_subst)))) (PREDICADO (PREDV (SVI (nucleo_verbo)))) (AADVO (AADVO SIMPLES (SP (nucleo preposicao) (SN (nucleo subst)))))))) Figura 2 Estrutura sintática das sentenças (2a) e (2b) A estrutura da Figura 2 segue o formato do parser Curupira: as letras minúsculas indicam os símbolos terminais, enquanto as maiúsculas indicam os não-terminais, sendo SUJ = sujeito, SN = sintagma nominal, AADNE = adjunto adnominal à esquerda, SDET = sintagma determinante, PREDV = predicado verbal, SVI = sintagma verbal intransitivo, AADVO = advérbio e SP = sintagma preposicional. Para essa estrutura sintática, neste caso, há duas possibilidades de mapeamento conceitual em UNL, ilustradas na Figura 3, cada qual considerando diferentes características semânticas: em (2a), o advérbio é representado conceitualmente como lugar (relação plc), em (2b), como tempo (relação tim). 3

8 obj(shine, plc(shine, sagittarius) obj(shine, tim(shine, january) Figura 3 Exemplos de estruturas conceituais UNL para a estrutura sintática da Figura 2 Considerando que todos os constituintes das sentenças, exceto o advérbio, possuem as mesmas características sintáticas e semânticas, parte dos dois templates é idêntica, de modo que a repetição de informações, nessa abordagem, pode ser grande e o modelo de mapeamento, contraproducente. Nessa primeira versão do sistema, o acesso ao Léxico Enriquecido para a verificação de restrições, recuperação do conceito de uma dada palavra e a atribuição do papel semântico a esse conceito é a única regra definida de forma genérica, que pode ser utilizada por vários templates. Na versão generalizada, descrita nesta seção, uma das principais alterações é justamente a utilização de regras específicas para partes das estruturas sintáticas a serem mapeadas, em vez de templates completos. Essas regras são organizadas em uma estrutura hierárquica, de modo a evitar a repetição de informações e modelar o processo de mapeamento de forma mais genérica e flexível, contemplando, muitas vezes, mesmo construções gramaticais não previstas no corpus. Para tanto, os templates completos foram desmembrados em sub-templates que ativam regras de mapeamento de duas naturezas: regras de projeção, que mapeiam os constituintes da sentença em conceitos UNL, associados a seus papéis semânticos, e heurísticas de relacionamento, que combinam pares de conceitos UNL, de acordo com seus papéis semânticos, em relações UNL. A Figura 4, um detalhamento dos módulos Gerador Conceitual e Repositório Conceitual da Figura 1, ilustra a aplicação dessas regras. Estrutura sintática Gramática de Projeção Regras de Projeção Estrutura intermediária Repositório Conceitual Conjunto de Heurísticas Heurísticas de Relacionamento Gerador Conceitual Código UNL Figura 4 Detalhamento dos módulos Gerador Conceitual e Repositório Conceitual 4

9 A seguir, explicamos essas duas categorias de regras de mapeamento e discutimos o comportamento do modelo de mapeamento perante estruturas sintáticas não previstas no corpus. 3.1 Regras de projeção As regras de projeção mapeiam constituintes classificados por suas funções sintáticas (sujeito, objeto direto, adjunto adnominal, etc.) em constituintes conceituais, ou seja, em conceitos da linguagem UNL. Além disso, associam-nos a seus respectivos papéis semânticos (agente, paciente, objeto, modificador, etc.). Esse mapeamento não é um-para-um, isto é, um constituinte sintático não corresponde, necessariamente, a um único item lexical. Por exemplo, no caso dos sintagmas nominais, um constituinte sintático pode ser formado por um nome e um artigo e no caso dos sintagmas verbais, pode ser formado por um verbo auxiliar e um verbo principal. A identificação dos papéis semânticos é a parte mais importante do mapeamento sintático-conceitual, já que a identificação dos conceitos UNL, assim como das suas interrelações na sentença são processos mais simples, apesar de serem indispensáveis para a obtenção das estruturas UNL completas Especificação das regras O conjunto de regras de projeção constitui a gramática de projeção sintático-conceitual do sistema. As regras da gramática são composicionais, uma vez que uma estrutura conceitual completa é obtida a partir da composição de subestruturas conceituais indicadas pelos constituintes da sentença. Além disso, elas contemplam a funcionalidade dos componentes conceituais correspondentes, uma vez que são definidas de acordo com a função sintática e semântica desses componentes. Para contemplar esses aspectos, as regras são definidas segundo uma hierarquia, na qual regras mais genéricas (que recebem como entrada estruturas sintáticas completas, ou mesmo partes de estruturas sintáticas passíveis de decomposição) são decompostas em regras mais específicas, até que a decomposição não seja mais possível ou necessária, isto é, até que se chegue a conceitos elementares. Desse modo, as regras de projeção têm duas naturezas: as genéricas, que podem ser decompostas em regras mais específicas e são chamadas de regras intermediárias, e as específicas, que acessam diretamente o léxico para determinar os conceitos elementares, denominadas regras terminais. Ao aplicar as regras de projeção, o mapeamento constitui, portanto, um processo modular e multinível, no qual a estrutura conceitual é obtida a partir da aplicação sucessiva de uma série de regras intermediárias, que são decompostas em regras mais específicas. Com isso, além de todas as vantagens das abordagens modulares (facilidade de manutenção e expansão das regras, por exemplo), obtém-se um mecanismo mais flexível, que permite representar e manipular regras parciais para determinados constituintes. Outra característica importante da gramática é o seu não-determinismo, isto é, a possibilidade de aplicação de várias regras para uma dada entrada, o que permite diferentes combinações de regras parciais. Dessa forma, mesmo estruturas sintáticas não previstas 5

10 integralmente no corpus podem, eventualmente, ser contempladas a partir da combinação de regras parciais definidas para outras estruturas. O não determinismo da gramática permite, também, que mais de um resultado seja obtido para uma única sentença de entrada. Idealmente, isso deve ocorrer somente para sentenças semanticamente ambíguas. A ocorrência para sentenças não ambíguas semanticamente indica que as próprias regras de projeção são ambíguas ou não são suficientemente claras para mapear corretamente a sentença. Quanto ao seu formato, as regras de projeção são especificadas na forma de regras de produção das gramáticas livres de contexto, com conotações gerativas e transformacionais (Chomsky, 1965), em uma sintaxe próxima à da DCG Definite Clause Grammar (Pereira & Warren, 1980). A DCG é um formalismo lógico, cujo processamento é baseado em unificação. Esse formalismo é uma extensão das gramáticas livres de contexto de Chomsky. Com base nele, a interpretação de uma sentença passa a ser a prova de que ela é bem formada sintática e semanticamente. A definição das regras de projeção é governada, principalmente, pela estrutura sintática e pela classe do verbo, segundo as classes do modelo de Borba (1990), a saber, ação, ação-processo, processo e estado. Ao analisar essas classes, no entanto, percebemos que para os nossos propósitos de mapeamento, as classes ação e açãoprocesso se comportam da mesma forma, isto é, dão origem a estruturas conceituais idênticas. Portanto, definimos apenas três classes de regras de projeção: regras de ação, regras de estado e regras de processo. A estrutura sintática representa um dos argumentos de entrada e a principal restrição sintática para as regras, como ocorre em todos os sistemas nos quais a análise semântica é realizada posterior e isoladamente à análise sintática. A classe verbal representa a principal restrição semântica e o ponto de partida para a aplicação das regras. Abordagens como essa, que consideram o verbo como chave do processo de análise semântica, de acordo com os argumentos que exige (estrutura de argumentos), são sustentadas por diversos autores, dentre os quais, Vendler (1967), Chafe (1970) e Dik (1997). Os detalhes referentes à especificação das regras de projeção, segundo as premissas aqui elencadas, são discutidos a seguir. Aspecto composicional Para seguir a abordagem composicional, a entrada para cada regra de projeção não é a estrutura sintática completa de uma dada sentença, mas sim parte dessa estrutura, sendo que as demais partes podem estar em uma das seguintes situações: (a) são representadas por variáveis na mesma regra, quando mapeiam constituintes mais específicos dessa regra; ou (b) são representadas por outras regras, quando mapeiam constituintes do mesmo nível ou mais gerais, que dependem da resolução da estrutura parcial em questão. Os exemplos a seguir ilustram essas situações, em uma notação simplificada das regras utilizadas: (3) sentença(suj(sn), pred(sv)], [ECs, ECv]) :- resolvesuj(sn, ECs), resolvepred(sv, ECv). (4) resolvesuj(subst(sub), agente:cons) :- recuperaconceito(sub, CONs). (5) resolvepred(verbo(v), evento:conv) :- recuperaconceito(v, CONv). 6

11 A regra (3) ilustra o caso (a), representando uma regra intermediária, na qual a estrutura sintática de entrada é composta por duas partes (suj(sn) e pred(sv)) e cuja resolução depende da resolução das regras para essas partes (resolvesuj e resolvepred), que retornam as estruturas conceituais parciais (ECs e ECv) como resultado. Já as regras (4) e (5) ilustram o caso (b), representando regras terminais, que recuperam do Léxico Enriquecido os conceitos (CONs e CONv) correspondentes aos constituintes da estrutura sintática de entrada (SUB e SV) e atribuem a eles os papéis semânticos agente e evento. Nesse caso, as demais partes da estrutura sintática são mapeadas por regras mais gerais. Os detalhes dessas regras, como a verificação de restrições, não representada aqui, são explicados no decorrer dessa seção. A definição do nível de granularidade das estruturas sintáticas parciais, ou seja, do nível de decomposição dessas estruturas e, conseqüentemente, do nível de decomposição das regras, teve como base as variações nas estruturas sintáticas das sentenças do corpus. As estruturas invariantes não são separadas, sendo vários níveis da estrutura representados por uma única regra. Por exemplo, no parser Curupira, um período pode ser decomposto em um período_coordenado (com duas ou mais orações) ou em um período_independente (simples, com uma única oração). Como não consideramos períodos coordenados nas sentenças do corpus, os constituintes período e período_independente são considerados uma unidade, representada por período(período_independente (...)) nas estruturas sintáticas de entrada. Com isso, existe apenas uma regra de projeção, para períodos independentes. As estruturas sintáticas da Figura 5 são exemplos dos períodos independentes contemplados pelo ConPor. periodo(periodo_independente(predicado(predicado))) periodo(periodo_independente([suj(sujeito),predicado(predicado)])) periodo(periodo_independente([aadvo(adjadverbial),suj(sujeito),predicado(predicado)])) Figura 5 Exemplos de estruturas sintáticas para períodos independentes Aspecto funcional Para seguir a abordagem funcional, os nomes das regras representam o tipo de projeção que elas executam. Por exemplo, uma regra para transformar um sujeito (denominado suj, no parser) em um agente, é chamada de sujacao. Da mesma forma, ao decompor esse constituinte em seus subconstituintes, a regra para o sintagma nominal (denominado sn, no parser), cujo núcleo (um substantivo, por exemplo) corresponde, efetivamente, ao sujeito da sentença, é chamada de snagente. Como vimos, as regras mais genéricas são definidas de acordo com a estrutura sintática genérica e seus macroconstituintes e de acordo com as três classes verbais de Borba. Essas regras, ao serem decompostas em função das suas estruturas sintáticas, mantêm marcadores para indicar que as restrições impostas pela classe verbal devem ser preservadas para as regras mais específicas, sempre que necessário. Por exemplo, uma regra para verbos de ação, cujos macroconstituintes são sujeito e objeto direto (o verbo comer, por exemplo), mapeia o núcleo de tal sujeito em um conceito cujo papel semântico é agente. Agora, uma regra para um verbo de estado ( saber, por exemplo), com os mesmos macroconstituintes, mapeia o núcleo do sujeito em um conceito cujo papel semântico é experienciador, em vez de agente. 7

12 Para algumas regras, a indicação da funcionalidade semântica, incorpora, portanto, uma identificação relacionada à classe de verbo contemplada por aquela regra. Outras regras, no entanto, são mais genéricas, no sentido de que se aplicam às diferentes classes verbais e, portanto, não incorporam esse tipo de identificação. Nesse caso, indicam apenas o papel semântico para o qual o constituinte é mapeado. Isso ocorre, por exemplo, com adjuntos adverbiais (sadvtempo, sadvmaneira, etc.), com modificadores em sintagmas nominais, como adjuntos adnominais à esquerda (aadneposse ou aadnemodificador) ou à direita (aadndmodificador) e complementos nominais (cnmodificador), que são sempre mapeados pelas mesmas regras, independentemente do template que ativa essas regras. Acesso ao Léxico Enriquecido Regras terminais, que mapeiam as palavras da sentença em conceitos e seus papéis semânticos e, portanto, acessam o Léxico Enriquecido, podem ter diferentes objetivos: (a) buscar traços do constituinte, que serão utilizados para representar alguma informação na estrutura conceitual ou como restrição para outro constituinte; (b) verificar restrições de natureza morfossintática e/ou semântica, impostas para o próprio constituinte, pelas regras de projeção; (c) simplesmente recuperar o conceito UNL do constituinte. O acesso ao Léxico Enriquecido é simplificado, em seu estágio atual, pela representação de apenas uma descrição para cada entrada da mesma categoria gramatical. Com isso, evitamos a ambigüidade, em especial, a de sentido, uma vez que apenas um conceito para cada entrada é representado. Esse acesso é feito por meio de estruturas com alguns atributos com valores já fixados (atributos que estabelecem restrições e que devem, portanto, combinar com as informações da estrutura sintática ou da descrição lexical dos constituintes dessa estrutura), e alguns atributos com valores em aberto, representados por variáveis. Os valores fixos dos atributos morfossintáticos, juntamente com a estrutura sintática da sentença, representam as restrições de natureza sintática de uma regra de projeção e definem, portanto, o ambiente sintático delineado por tal regra. Esses atributos incluem alguns traços lexicais dos constituintes, como a transitividade do verbo. Já os atributos morfossintáticos cujos valores são representados via slots em branco apenas fornecem informações adicionais para o mapeamento. Essas informações podem ser de duas categorias: (a) restrições para outros constituintes, mapeados por outras regras; e (b) traços para a inserção de alguns rótulos de atributos (ALs) da UNL. Da mesma forma, os valores fixos dos atributos semânticos, quais sejam, a classe do verbo e a sua subcategorização, representam as restrições semânticas de uma regra de projeção e definem, portanto, o ambiente semântico indicado por essa regra. Os demais atributos semânticos, a saber, as restrições de seleção dos argumentos dos verbos e os traços semânticos dos substantivos, são recuperados do Léxico Enriquecido e utilizados para conduzir o processo de unificação do verbo com os seus argumentos. Os atributos morfossintáticos e semânticos utilizados pelas regras, sejam eles de valores fixos ou em aberto, dependem da categoria sintática das palavras que compõem o constituinte que está sendo mapeado. Por exemplo, as regras de projeção para o verbo acessam o Léxico Enriquecido para verificar atributos que representam informações sobre a sua forma analisada e sobre a sua forma canônica 2. A Tabela 1 apresenta o conjunto dos 2 O Léxico Enriquecido é composto por dois tipos entradas: formas canônicas e formas analisadas das palavras das sentenças do corpus. As formas canônicas são as formas básicas das palavras, não flexionadas. As formas 8

13 atributos para verbos do Léxico Enriquecido, bem como o modo como esses atributos são utilizados no mapeamento. Tabela 1 Atributos dos verbos utilizados pelas regras de projeção Atributo Exemplo Utilização imperativo afirmativo, futuro do presente, futuro do pretérito tempo/modo (da forma analisada) forma canônica da forma analisada tempo/modo (da forma canônica) tipo do verbo classe do verbo ilumina iluminar considere considerar sempre infinitivo pessoal transitivo direto, pronominal, bitransitivo, etc. ação, estado, processo, açãoprocesso. sujeito e objeto, objeto, sujeito e complemento, etc. sujeito animado, complemento lugar mapeado em um AL da UNL associado ao verbo ou ao núcleo do predicado, que indica o tempo de ocorrência do evento ou em que um estado é verdadeiro indica qual a entrada no Léxico Enriquecido da canônica correspondente como restrição, nas locuções verbais, único caso em que o verbo principal é usado na sentença na sua forma não flexionada, que corresponde à canônica como restrição como restrição subcategorização do verbo como restrição, indicando os argumentos que o verbo exige restrições de seleção como restrição para os argumentos para todos os do verbo, indicando os traços argumentos semânticos que eles devem obrigatórios do verbo apresentar UW considere consider representado na codificação UNL resultante, como conceito em uma ou mais relações Por exemplo, para mapear o verbo da sentença (6) no seu respectivo conceito, associado ao papel semântico evento, a regra em (7) é utilizada para acessar o Léxico Enriquecido. (6) Considere seu desgaste físico. (7) vesvtdacao(verbo(v), RestSuj, RestObj, [evento:unlv.@t]) :- (sin(t), can(canv), [V _],[]), v(sin(_,td), unl(unlv), cl(ap), rest([suj(restsuj), obj(restobj)]),[canv _],[]), (AP = acao; AP = acao_proc). Nessa regra, o primeiro argumento da sua cabeça representa a estrutura sintática do constituinte V, que está sendo mapeado (verbo(v)). Os dois argumentos seguintes retornam as restrições de seleção do sujeito e objeto do verbo, para serem utilizadas por outras regras. O último argumento indica o resultado da aplicação dessa regra, consistindo do conceito do verbo (UnlV), associado ao tempo desse verbo (T) e já com o papel semântico de evento. A analisadas são possíveis variações de uma forma canônica, do modo como aparecem na sentença. As variações incluem, por exemplo, flexões de gênero, número, grau, modo e tempo. 9

14 segunda linha representa a entrada lexical da forma analisada do verbo V. Por meio dela, são recuperados a canônica de V (CanV) e o atributo que indica o tempo de V (T). A terceira linha representa a entrada lexical da forma canônica de V, estabelecendo como restrições a transitividade (td = transitivo direto), a subcategorização (suj e obj) e a classe verbal da canônica desse verbo (AP), identificada na quarta linha como ação ou ação-processo. As restrições de seleção dos argumentos da canônica de V são recuperadas por meio de variáveis que são instanciadas com as informações específicas do verbo (RestSuj e RestObj). Como vimos, além de recuperar o conceito de um constituinte, as regras de acesso ao Léxico Enriquecido atribuem um papel semântico a esse constituinte. O modo como esse processo é realizado é descrito a seguir. Atribuição dos papéis semânticos De um modo geral, a definição das regras de projeção partiu da análise dos códigos UNL gerados manualmente para o corpus base, numa etapa anterior à da implementação do modelo computacional. Nessa etapa, a identificação dos papéis semânticos, em especial, que corresponde ao núcleo do processo de mapeamento, teve por base a análise conjunta de informações de três categorias: (a) quando explicitados, os papéis semânticos exigidos pela estrutura de argumentos do verbo, segundo o dicionário de Borba; (b) os papéis semânticos exigidos pelas próprias relações UNL, de acordo com a especificação da interlíngua; e (c) os papéis semânticos identificados como possíveis projeções de constituintes sintáticos no estudo de Sossolote et al. (1997). No dicionário de Borba, as restrições de seleção dos verbos, em alguns casos, são dadas em função do papel semântico dos constituintes. Por exemplo, a sentença (8), com um verbo cuja acepção é identificada como processo, exige um sujeito paciente. Nesse caso, ao conceito correspondente ao núcleo do constituinte que representa o sujeito é atribuído o papel paciente. (8) A lua crescente ocorre amanhã. Todos os verbos das sentenças do corpus foram analisados segundo o referido dicionário e as informações levantadas foram utilizadas tanto para a definição das regras de mapeamento (projeção e heurísticas) quanto para a especificação dos itens do Léxico Enriquecido. Alguns exemplos desse levantamento são ilustrados na Tabela 2. Esquentar Tabela 2 Exemplos de verbos descritos segundo o dicionário de Borba Verbo Classe Papel Semântico 1 Papel Semântico 2 Acepção Desdenhar Açãoprocesso Sujeito agente Complemento expresso por nome Rejeitar com desdém, não fazer caso de Expressar Ação Sujeito agente Complemento expresso por nome abstrato Revelar, fazer conhecer Aparecer Processo Sujeito paciente expresso por nome Revelar-se, manifestar-se abstrato Ir Modal Auxiliar que indica Açãoprocesso Sujeito agente/causativo Complemento expresso por nome abstrato/humano futuridade Animar, acalorar 10

15 Ter Estado Sujeito inativo Complemento expresso por nome abstrato Ocorrer Processo Sujeito paciente expresso por nome designativo de evento Posse inerente ou transitória Acontecer, suceder, dar-se Conforme pode ser verificado na tabela, nem todos os argumentos dos verbos, no entanto, são descritos no dicionário segundo seus papéis semânticos. Muitas vezes, não é possível identificar tal papel. Para esses casos, Borba descreve o argumento em função de seus traços semânticos obrigatórios. Para esses argumentos e também para aqueles constituintes não previstos na valência dos verbos como argumentos, por não serem obrigatórios (adjuntos adverbiais, por exemplo), as outras duas fontes de informação foram consultadas. A especificação da UNL, ao descrever a sintaxe das suas relações, define, em alguns casos, mesmo que implicitamente, quais os possíveis papéis semânticos esperados para os conceitos que fazem parte da relação. Por exemplo, segundo a especificação da UNL, a relação plc define o lugar em que um evento ocorre, ou um estado é verdadeiro, ou uma coisa existe. Portanto, chamamos um dos papéis semânticos exigidos por essa relação de lugar. Por fim, como fonte de informação auxiliar, utilizamos o estudo das manifestações morfossintáticas da UNL no português. Esse estudo foi realizado pelo NILC visando obter subsídios para o desenvolvimento de módulos de codificação e decodificação UNL- Português. O objetivo era identificar as possíveis construções gramaticais correspondentes a todas as estruturas UNL de um determinado corpus. De acordo com esse estudo, uma das formas de manifestação morfossintática da UNL no português é justamente aquela decorrente das suas relações semânticas. Por exemplo, a função sintática de sujeito, segundo tal estudo, pode manifestar-se na UNL pelas relações obj, agt, ins, met, cau e soj (as duas últimas relações não são consideradas na especificação atual da UNL). Para o caso específico da correspondência entre sujeito e ins, por exemplo, as seguintes informações foram apresentadas (Sossolote et al., 1997, p. 27): ins & sujeito ins se manifesta sintaticamente como sujeito entre um substantivo e um verbo, como em: ins(supply, computer_translation) >> ins(fornecer, tradução_automática) >> sujeito (fornecer, tradução_automática) Exemplo: A tradução automática é incapaz de fornecer um resultado de alta qualidade. Nesse caso, consideramos, portanto, que o papel semântico do sujeito é instrumento. Uma vez que essas fontes procuram identificar todos os possíveis papéis semânticos dos constituintes sintáticos, em alguns casos precisamos escolher o papel mais adequado para o contexto de cada sentença. Para facilitar essa escolha, identificamos os casos nos quais foi possível generalizá-la e estabelecemos, para esses casos, convenções a serem seguidas, por exemplo: verbos (exceto os de ligação) exercem sempre o papel semântico evento, advérbios que indicam tempo exercem sempre o papel semântico tempo, adjetivos modificadores de sintagmas nominais exercem sempre o papel semântico modificador. A Tabela 3 ilustra todos os papéis semânticos utilizados nas regras de mapeamento para as sentenças do corpus base, totalizando 26 papéis diferentes. 11

16 Tabela 3 Possíveis papéis semânticos para os constituintes das sentenças do corpus base Papel semântico Descrição Agente constituinte que desencadeia uma ação, sendo origem dele e seu controlador Atributo constituinte que descreve um estado ou uma coisa 3 que representa um estado Beneficiario constituinte sede da transferência de posse, vítima ou destinatário de um benefício Cenário constituinte que define um mundo virtual onde um evento ocorre ou um estado é verdadeiro ou uma coisa existe Co_coisa constituinte nominal secundário (não em foco) que está em um estado Conteúdo constituinte que define que um conceito é equivalente a outro Destino constituinte que define o destino de um evento Duração constituinte que define o período de tempo durante o qual um evento ocorre ou um estado existe Evento constituinte que designa o evento da sentença Experimentador constituinte que designa uma experiência ligada a uma disposição mental, uma sensação, uma emoção, uma cognição Inativo constituinte nominal que está em um estado ou possui um atributo e é, portanto, suporte de uma propriedade, condição ou situação expressa pelo predicado Lugar constituinte que define o lugar no qual um evento ocorre, no qual um estado é verdadeiro ou no qual uma coisa existe LugarDestino constituinte que define o lugar onde um evento termina ou um estado se torna falso LugarOrigem constituinte que define o lugar onde um evento começa ou um estado se torna verdadeiro Maneira constituinte que define a maneira como um evento é realizado ou as características de um estado Meta constituinte que identifica o estado final de um objeto, associado ou não a um evento Modificador constituinte que restringe a descrição de uma coisa em foco Objeto constituinte que é diretamente afetado por um evento ou estado Origem constituinte que define a origem de uma coisa Paciente constituinte afetado por aquilo que o verbo expressa, que sofre uma mudança de estado, condição ou posição Parceiro constituinte que, juntamente com o agente, inicia um evento Possuidor constituinte que possui uma coisa Propósito constituinte que define o propósito ou objetivo do agente de um evento ou o propósito de alguma coisa existir Quantidade constituinte que define a quantidade de alguma coisa Razão constituinte que define a razão pela qual um evento ou estado ocorre Tempo constituinte que define o momento em que um evento ocorre ou em que um estado é verdadeiro Esse conjunto é um pouco maior que o utilizado na primeira versão do ConPor, que totalizavam 21 e foram descritos em Specia & Rino (2002b). Esse aumento se deve, essencialmente, à expansão dos casos conceituais sugeridos pelo novo corpus. 3 Adotamos o termo coisa como uma tradução do termo thing utilizado na especificação UNL original, para indicar um constituinte genérico, sem papel semântico específico. 12

17 Atribuição dos rótulos de atributos Dependendo do constituinte que está sendo mapeado, as regras terminais podem associar alguns rótulos de atributos (ALs) aos seus conceitos recuperados do Léxico Enriquecido, como é o caso, por exemplo, da regra em (7). O ConPor considera um conjunto de ALs que inclui alguns identificados a partir dos traços morfossintáticos das descrições lexicais dos constituintes e outros identificados em função da estrutura sintática da sentença. Ainda, esses ALs podem ser indicados pelos traços do próprio item lexical (por exemplo, a um evento que ocorre no passado é associado o ou pelos traços de outros itens (por exemplo, os substantivos acompanhados de um artigo terão um indicando se o constituinte já foi referenciado ou não, respectivamente). A Tabela 4 exibe a lista dos 13 ALs contemplados pelo ConPor. Tabela 4 Atributos UNL considerados no ConPor Nome do atributo AL Descrição conceito coletivo conceito já referenciado conceito de uma classe não específica evento ocorrerá no futuro evento ocorreu no passado suposição contrária à realidade evento imperativo complemento do evento possibilidade lógica de que um evento ocorra necessidade ou obrigação evento ocorrendo no momento Futuro evento ocorrerá no futuro imediato conceito principal da sentença ou do escopo O número de ALs utilizados, apesar de ser maior que na primeira versão do ConPor, representa apenas um subconjunto do total de ALs previstos na UNL (cerca de 60 ALs). Alguns dos ALs não utilizados simplesmente por foram identificados no corpus. Outros, no entanto, não foram utilizados por exigirem conhecimento mais profundo para a sua identificação (extralingüístico), como é caso dos ALs de aspecto e de ponto de @complete, etc.). Como o ConPor se baseia exclusivamente em conhecimento lingüístico, tais ALs não foram considerados. Os três primeiros ALs da Tabela 4 são associados a substantivos, sendo o primeiro (@pl) identificado por meio do traço número do próprio substantivo e os outros dois (@def por meio do traço tipo do artigo que acompanha esse substantivo. Todos os demais atributos são associados ao evento ou ao estado da sentença. Os quatro @imperative) são identificados a partir do traço modo/tempo do verbo dessa sentença. Os cinco são identificados a partir de constituintes que acompanham o verbo principal (advérbio de negação (não), no caso e verbos auxiliares (poder, precisar, estar e ir, respectivamente), nos demais casos). Seguindo a especificação UNL, esses 9 ALs, bem como o foram associados ao conceito do verbo principal, nas estruturas com verbos que não são de ligação, e ao núcleo do predicado, nas estruturas com verbos de ligação. 13

18 Outro uso do é a indicação de escopos. Na UNL, um escopo especifica um conjunto de relações entre UWs que podem ser referenciadas como uma única UW em outra relação. No corpus atual, escopos foram definidos para as sentenças com conjunções coordenativas e alternativas (identificadas pelas relações and e or, respectivamente) indicando que uma propriedade ou um evento se relaciona com ambos os conceitos ligados pela conjunção and ou com um conceito exclusivo entre os dois ligados pela disjunção or. Isso ocorre, por exemplo, para a sentença (9), cujo código UNL é dado na Figura 6, sendo o escopo definido na primeira relação (a relação conjuntiva and ) e identificado por :01. (9) O trabalho diário e a vida cotidiana exigirão mais iniciativa de sua parte. aoj(require.@entry.@future, :01) and:01(work.@entry.@def, life.@def) mod(work.@entry.@def, daily) mod(life.@def, quotidian) obj(require.@entry.@future, initiative) man(initiative, more) frm(initiative, side) pos(side, you) Figura 6 Exemplo do uso de escopos na UNL Uma vez que a especificação da UNL apenas indica a necessidade de eleger um dos conceitos de um escopo para a atribuição do AL.@entry, convencionamos atribuir tal AL ao primeiro conceito envolvido no escopo (no exemplo, ao conceito work.@def) Um exemplo Para ilustrar as regras de projeção, tomemos como exemplo a sentença (8), aqui repetida, cuja estrutura sintática é ilustrada na Figura 7. As regras especificadas para a sua projeção sintático-conceitual são descritas em uma notação simplificada, na Figura 8. Na Seção 4, que descreve a implementação do sistema, apresentamos novamente esse exemplo, de forma completa. (8) A lua crescente ocorre amanhã. frase(periodo(periodo_independente([suj(suj_simples(sn([aadne(sdet(artigo(a))),subst(lua),aadnd (aadnd_simples(sadj(adj(crescente))))]))),predicado(predv(svi(verbo(ocorre)))),aadvo(aadvo_sim ples(sadv(adv(amanhã))))]))) frase(periodo(periodo_independente([suj(suj_simples(sn([aadne(sdet(artigo(a))),subst(s),aadnd( aadnd_simples(sadj(adj(adj))))]))),predicado(predv(svi(verbo(v)))),aadvo(aadvo_simples(sadv (adv(aadvo))))]))) Figura 7 Estrutura sintática da sentença (8) A estrutura sintática da sentença (8), que serve de entrada para a primeira regra do exemplo, é mostrada na primeira linha da Figura 6. Para chegar a esse formato adequado de estrutura, a partir da saída do parser, são aplicados alguns procedimentos de pré-edição, conforme descrito em Specia & Rino (2002b). Essa mesma estrutura, para servir como entrada para as diversas sentenças, tem as palavras substituídas por variáveis, representadas por letras maiúsculas (por exemplo, V para o verbo, S para o substantivo, etc.). Conforme a 14

19 segunda linha da Figura 6, para a aplicação das regras, essa estrutura também é decomposta em outras subestruturas. mapear(es,ec) :- t_acao(es,ec); t_processo(es,ec); t_estado(es,ec). t_ Processo([SUJ, PRED, ADV],[EC 1,EC 2,EC 3 ]) :- predicado_processo(pred,restsuj,ec 2 ), sujeito_processo(suj,restsuj,ec 1 ), adverbio(adv,ec 3 ). predicado_processo(pred, RestSuj, EC) :- predicado_verbal_processo(pred, RestSuj, EC). predicado_verbal_processo(pred, RestSuj, EC) :- svi_processo(pred, RestSuj, EC). svi_processo(verbo, RestSuj, EC) :- v(sin(t),can(canv),[verbo _]), v(sin(_,int),unl(unlv),cl(processo), rest([suj(restsuj)]),[canv _]), concatena(evento:, UnlV,.@entry.@, T, EC). sujeito_processo(suj, RestSuj, EC) :- sn_paciente(suj, RestSuj, EC). sn_paciente([art, SUBST, AADND], RestSuj, [EC 1, EC 2 ]) :- art(sin(d),_,[art _]), s(_,unl(unls),sem(tracos),[subst _]), subconjunto(tracos,restsuj), concatena(paciente:, UnlS,.@, D,, EC 1 ), adndmodo (AADND, EC 2 ). adndmodo(adj, modificador:unla) :- adj(can(cana),[adj _]), adj(unl(unla),[cana _]). adverbio(sadv, EC) :- sadv_tempo(sadv,ec). sadv_tempo(adv, tempo:unladv) :- adv(sin(cir_temp),unl(unladv),[adv _]). Figura 8 Regras de projeção para a sentença (8) Na Figura 8, a regra mapear procura aplicar à entrada um dos três possíveis templates do ConPor: t_acao, t_processo ou t_estado. Para a sentença (8), o template adequado é t_processo. Este decompõe a estrutura sintática de entrada em sujeito (SUJ), predicado (PRED) e adjunto adverbial (ADV) e ativa regras para mapear essas três subestruturas, retornando como saída o conjunto de resultados das três regras (EC 1, EC 2, EC 3 ). A regra para predicados de processo (predicado_processo) simplesmente ativa uma regra específica para predicados verbais de processo (predicado_verbal_processo). Esta, da mesma forma, continua a decomposição da estrutura sintática da sentença, ativando agora uma regra para sintagmas verbais intransitivos de processo (svi_processo). Essa última regra acessa diretamente o Léxico Enriquecido para verificar os traços do verbo (V) e da sua canônica (CanV), recuperando o tempo de V (T), o conceito da canônica (UnlV) e as restrições de seleção para o sujeito dessa canônica (RestSuj). Por fim, essa regra associa ao conceito do verbo o rótulo de e o rótulo relativo ao tempo do evento (@present). Além disso, atribui o papel semântico evento a esse conceito. Todas essas operações estão sujeitas, certamente, às restrições apresentadas pelo template do verbo: sua classe deve ser processo, deve ser intransitivo e deve apresentar um sujeito (suj) como o argumento obrigatório da subcategorização. A regra para o sujeito (sujeito_processo) ativa outra regra mais específica (sn_processo). Esta última decompõe a estrutura sintática do sujeito em artigo (ART), substantivo (SUBST) e adjunto adnominal (AADND), buscando no Léxico Enriquecido o 15

20 conceito do artigo, para verificar seu tipo (D), definido ou indefinido, e também o conceito do substantivo, aplicando sobre ele as restrições de seleção do verbo (RestSuj). Satisfeitas essas restrições, a regra associa o tipo do artigo como um rótulo de atributo UNL ao conceito do substantivo e atribui a esse conceito o papel paciente. Além disso, essa regra ativa outra, para mapear o adjunto adnominal. A regra para adjunto adnominal acessa o léxico buscando o conceito do adjetivo (UnlAdj) e atribui a ele o papel semântico modificador. Por fim, a regra para o advérbio primeiramente ativa uma regra mais específica, para advérbios de tempo (sadv_tempo), que, por sua vez, acessa o Léxico Enriquecido para buscar o conceito do advérbio (UnlAdv), desde que satisfaça a restrição de ser um advérbio de tempo (cir_temp), e atribui a ele o papel semântico tempo. O esquema geral da aplicação das regras de projeção sobre a estrutura sintática da sentença (8) é ilustrado na Figura 9. estrutura sintática mapear t_processo predicado_processo sujeito_processo adverbio predicado_verbal_ processo sn_paciente sadv_tempo svi_processo paciente: UnlS.@D adndmodo tempo:unladv evento:unlv.@entry.@t modificador: UnlA [[paciente:unls.@d:, modificador:unla], [[evento:unlv.@entry.@t], [tempo:unladv]]] Figura 9 Esquema geral da aplicação das regras de projeção para sentença (8) A decomposição da estrutura sintática da sentença (8) em subestruturas, utilizadas como entradas e manipuladas por essas regras, por sua vez, é esquematizada na Figura

21 frase(periodo(periodo_independente([suj(suj),predicado(pred),aadvo(aadvo)]))) suj_simples(sn(sn)) predv(predv) aadvo_simples(aadvo) [aadne(sdet(artigo(a))),subst(s),aadnd(aadnd_simples(aadnd))] svi(svi) sadv(sadv) a lua sadj(adj(adj)) verbo(v) adv(adv) Figura 10 Subestruturas sintáticas da sentença (8) crescente ocorre amanhã Como pode ser verificado nesse exemplo, o corpo de cada regra possui outras regras de projeção para as partes da estrutura sintática de entrada e/ou, no caso de entradas com constituintes terminais, regras terminais para acessar o léxico, recuperar as informações necessárias sobre tais constituintes, via mecanismo de unificação, e realizar as devidas manipulações para transformá-lo em um conceito UNL com seu papel semântico. As regras podem retornar como resultado, além dos conceitos com seus papéis semânticos, valores de atributos lexicais do constituinte sintático que são utilizados por outras regras, como argumentos de entrada. Este é o caso, por exemplo, das regras para sintagmas verbais, que são decompostas em regras para verbo e objeto. As regras do verbo são aplicadas primeiramente e retornam as restrições de seleção para o objeto daquele verbo, as quais são usadas como entrada nas suas regras. Dessa forma, a aplicação sucessiva das regras é feita até que os constituintes correspondam a elementos terminais da gramática. Nesse ponto, além do reconhecimento da estrutura sintática, as regras transformam as palavras da sentença em conceitos UNL, gerando parte da estrutura conceitual de tal sentença, que deverá ser anexada às estruturas parciais geradas para os demais constituintes. Ao final da aplicação dessas regras, o resultado, que é a composição de todos os resultados das regras mais específicas, é a lista de conceitos a seguir: [[paciente:moon.@def:, modificador:crescent], [[evento:occur.@entry.@present], [tempo:tomorrow]]] Essa lista pode ser considerada uma estrutura conceitual intermediária, cujos elementos são conceitos correspondentes aos constituintes da estrutura sintática, juntamente com seus papéis semânticos, aninhados em sublistas, segundo o próprio aninhamento da estrutura sintática. Nesse ponto, caso a sentença seja semanticamente ambígua, mais de uma lista é gerada, cada qual indicando uma interpretação diferente. Para transformar essa estrutura intermediária na estrutura conceitual UNL, propriamente dita, são aplicadas as heurísticas de relacionamento, conforme será descrito na próxima seção. 17

O código do modelo de mapeamento sintático-conceitual do sistema ConPor

O código do modelo de mapeamento sintático-conceitual do sistema ConPor Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP O código do modelo de mapeamento sintático-conceitual do sistema ConPor Lucia Specia Lucia

Leia mais

ConPor: um gerador de estruturas conceituais UNL

ConPor: um gerador de estruturas conceituais UNL Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP ConPor: um gerador de estruturas conceituais UNL Lucia Specia Lucia Helena Machado Rino

Leia mais

TIPOS DE SINTAGMAS E REPRESENTAÇÕES ARBÓREAS FUNDAMENTOS DE SINTAXE APOIO PEDAGÓGICO 23/05/2018 SAULO SANTOS

TIPOS DE SINTAGMAS E REPRESENTAÇÕES ARBÓREAS FUNDAMENTOS DE SINTAXE APOIO PEDAGÓGICO 23/05/2018 SAULO SANTOS TIPOS DE SINTAGMAS E REPRESENTAÇÕES ARBÓREAS FUNDAMENTOS DE SINTAXE APOIO PEDAGÓGICO 23/05/2018 SAULO SANTOS PROGRAMA DA AULA 1. Tipos de sintagma 2. Sintagmas lexicais 3. Representações arbóreas de sintagmas

Leia mais

O desenvolvimento de um léxico para a geração de estruturas conceituais UNL

O desenvolvimento de um léxico para a geração de estruturas conceituais UNL Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP O desenvolvimento de um léxico para a geração de estruturas conceituais UNL Lucia Specia

Leia mais

Apresentação 11 Lista de abreviações 13. Parte I: NATUREZA, ESTRUTURA E FUNCIONAMENTO DA LINGUAGEM

Apresentação 11 Lista de abreviações 13. Parte I: NATUREZA, ESTRUTURA E FUNCIONAMENTO DA LINGUAGEM Sumário Apresentação 11 Lista de abreviações 13 Parte I: NATUREZA, ESTRUTURA E FUNCIONAMENTO DA LINGUAGEM O homem, a linguagem e o conhecimento ( 1-6) O processo da comunicação humana ( 7-11) Funções da

Leia mais

ConPor: um modelo de geração conceitual para o português

ConPor: um modelo de geração conceitual para o português ConPor: um modelo de geração conceitual para o português Lucia Specia, Lucia Helena Machado Rino Departamento de Computação, Centro de Ciências Exatas e de Tecnologia UFSCar Rod. Washington Luiz, km 235

Leia mais

6 Atributos. A dívida da empresa subiu.

6 Atributos. A dívida da empresa subiu. 6 Atributos Para buscar o sentimento de um texto automaticamente precisamos encontrar boas pistas ao longo do discurso. Uma grande variedade de palavras e expressões possui conotação positiva ou negativa,

Leia mais

3 Kuaba: Uma Ontologia para Design Rationale

3 Kuaba: Uma Ontologia para Design Rationale 3 Kuaba: Uma Ontologia para Design Rationale Para que o conhecimento registrado durante o design possa ser automaticamente processado, é desejável representar o design rationale de uma maneira formalmente

Leia mais

Introdução a uma abordagem formal da sintaxe Teoria X-barra, II

Introdução a uma abordagem formal da sintaxe Teoria X-barra, II Universidade de São Paulo Faculdade de Filosofia, Letras e Ciências Humanas Letras Clássicas e Vernáculas Sintaxe do Português I FLC0277 Maria Clara Paixão de Sousa Introdução a uma abordagem formal da

Leia mais

Ferramenta de apoio a identificação de eventos utilizando Linguagem Natural. Aluno: Ricardo Tomelin Orientador: Everaldo Artur Grahl

Ferramenta de apoio a identificação de eventos utilizando Linguagem Natural. Aluno: Ricardo Tomelin Orientador: Everaldo Artur Grahl Ferramenta de apoio a identificação de eventos utilizando Linguagem Natural Aluno: Ricardo Tomelin Orientador: Everaldo Artur Grahl Roteiro 1. Introdução 2. Objetivos 3. Análise Essencial de Sistemas 4.

Leia mais

Uma proposta de arquitetura

Uma proposta de arquitetura Terceira semana do curso de Linguística III Professor Alessandro Boechat de Medeiros Departamento de Linguística e Filologia Uma proposta de arquitetura A teoria gerativa dominante dos anos oitenta foi

Leia mais

O processo de avaliação do sistema ConPor

O processo de avaliação do sistema ConPor Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP O processo de avaliação do sistema ConPor Lucia Specia Lucia Helena Machado Rino NILC-TR-03-05

Leia mais

Processamento de Linguagem Natural

Processamento de Linguagem Natural Processamento de Linguagem Natural Prof. Dr. Silvio do Lago Pereira Departamento de Tecnologia da Informação Faculdade de Tecnologia de São Paulo Introdução Processamento de de linguagem natural (PLN)

Leia mais

Processamento de Linguagem Natural

Processamento de Linguagem Natural Processamento de Linguagem Natural Prof. Dr. Silvio do Lago Pereira Departamento de Tecnologia da Informação Faculdade de Tecnologia de São Paulo Introdução Processamento de linguagem natural (PLN) consiste

Leia mais

CONTEÚDOS PARA O 3º. TESTE DE INGRESSO Dezembro 2018 MATEMÁTICA (ingresso em 2019) INGRESSO NO 7º. ANO/2019 DO ENSINO FUNDAMENTAL

CONTEÚDOS PARA O 3º. TESTE DE INGRESSO Dezembro 2018 MATEMÁTICA (ingresso em 2019) INGRESSO NO 7º. ANO/2019 DO ENSINO FUNDAMENTAL CONTEÚDOS PARA O 3º. TESTE DE INGRESSO Dezembro 2018 MATEMÁTICA (ingresso em 2019) INGRESSO NO 7º. ANO/2019 DO ENSINO FUNDAMENTAL Frações decimais e números decimais; Operações com frações; Operações com

Leia mais

Conteúdos para o teste de ingresso MATEMÁTICA agosto 2018 (Ingresso em 2019) INGRESSO DE 6ª PARA 7º. ANO/2019 DO ENSINO FUNDAMENTAL

Conteúdos para o teste de ingresso MATEMÁTICA agosto 2018 (Ingresso em 2019) INGRESSO DE 6ª PARA 7º. ANO/2019 DO ENSINO FUNDAMENTAL Conteúdos para o teste de ingresso MATEMÁTICA agosto 2018 (Ingresso em 2019) INGRESSO DE 6ª PARA 7º. ANO/2019 DO ENSINO FUNDAMENTAL Operações com números naturais: adição, subtração, multiplicação, divisão,

Leia mais

TeMário 2006: Estendendo o Córpus TeMário

TeMário 2006: Estendendo o Córpus TeMário Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP TeMário 2006: Estendendo o Córpus TeMário Erick Galani Maziero Vinícius Rodrigues de Uzêda

Leia mais

Processamento de Linguagem Natural

Processamento de Linguagem Natural Processamento de Linguagem Natural Prof. Dr. Silvio do Lago Pereira Departamento de Tecnologia da Informação Faculdade de Tecnologia de São Paulo Introdução Processamento de de linguagem natural (PLN)

Leia mais

Descrição de um Protótipo de Realização Superficial do Português

Descrição de um Protótipo de Realização Superficial do Português Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP Descrição de um Protótipo de Realização Superficial do Português Mauricio José Carvalho

Leia mais

Aula 5 Funções sintáticas e transitividade verbal

Aula 5 Funções sintáticas e transitividade verbal Aula 5 Funções sintáticas e transitividade verbal Pablo Faria HL220C Prática de análise gramatical IEL/UNICAMP SUMÁRIO AULA ANTERIOR Predicado NOMENCLATURA COMPARADA Funções sintáticas diversas Quanto

Leia mais

Lições de Português pela análise sintática

Lições de Português pela análise sintática Evanildo Bechara Professor Titular e Emérito da Universidade do Estado do Riy'deJãneÍro;(tJERj) e da Universidade Federal Fluminense (UFF) Membro da A caciemia 'Brasileira de Letras e da Academia Brasileira

Leia mais

DISCIPLINA DE LÍNGUA PORTUGUESA

DISCIPLINA DE LÍNGUA PORTUGUESA DISCIPLINA DE LÍNGUA PORTUGUESA OBJETIVOS: 6º ano Usar a Língua Portuguesa como língua materna, para integrar e organizar o mundo e a própria identidade com visão empreendedora e como pensador capaz de

Leia mais

OBJETO DIRETO E OBJETO INDIRETO EM UM LIVRO DIDÁTICO: GRAMÁTICA NORMATIVA VS. GRAMÁTICA EXPLICATIVA/GERATIVA

OBJETO DIRETO E OBJETO INDIRETO EM UM LIVRO DIDÁTICO: GRAMÁTICA NORMATIVA VS. GRAMÁTICA EXPLICATIVA/GERATIVA OBJETO DIRETO E OBJETO INDIRETO EM UM LIVRO DIDÁTICO: GRAMÁTICA NORMATIVA VS. GRAMÁTICA EXPLICATIVA/GERATIVA Jessé Pantoja SERRÃO (G-UFPA) Antônia Fernanda de Souza NOGUEIRA (UFPA) 120 Resumo Este artigo

Leia mais

Há dois sintagmas essenciais: o sintagma nominal (SN), cujo núcleo é um nome ou palavra que seja equivalente; e o sintagma verbal (SV) cujo núcleo é

Há dois sintagmas essenciais: o sintagma nominal (SN), cujo núcleo é um nome ou palavra que seja equivalente; e o sintagma verbal (SV) cujo núcleo é Há dois sintagmas essenciais: o sintagma nominal (SN), cujo núcleo é um nome ou palavra que seja equivalente; e o sintagma verbal (SV) cujo núcleo é uma forma verbal. Existem também o sintagma adjetival

Leia mais

Curso: Letras Português/Espanhol. Disciplina: Linguística. Docente: Profa. Me. Viviane G. de Deus

Curso: Letras Português/Espanhol. Disciplina: Linguística. Docente: Profa. Me. Viviane G. de Deus Curso: Letras Português/Espanhol Disciplina: Linguística Docente: Profa. Me. Viviane G. de Deus AULA 2 1ª PARTE: Tema 2 - Principais teóricos e teorias da Linguística moderna Formalismo x Funcionalismo

Leia mais

Gramática. Prof. Yandre Maldonado e Gomes da Costa. Prof. Yandre Maldonado - 1

Gramática. Prof. Yandre Maldonado e Gomes da Costa. Prof. Yandre Maldonado - 1 Prof. Yandre Maldonado - 1 Prof. Yandre Maldonado e Gomes da Costa yandre@din.uem.br Prof. Yandre Maldonado - 2 Mecanismo gerador que permite definir formalmente uma linguagem; Através de uma gramática

Leia mais

Gramática. Gramática. Gramática

Gramática. Gramática. Gramática Prof. Yandre Maldonado - 1 Prof. Yandre Maldonado e Gomes da Costa yandre@din.uem.br Prof. Yandre Maldonado - 2 Mecanismo gerador que permite definir formalmente uma linguagem; Através de uma gramática

Leia mais

2 O Modelo: SetModel. 2.1 Modelo de Informação

2 O Modelo: SetModel. 2.1 Modelo de Informação O Modelo: SetModel 2 O Modelo: SetModel 2.1 Modelo de Informação Modelo de informação é uma representação abstrata e formal de entidades incluindo suas propriedades, relações e operações que podem ser

Leia mais

Período Composto por Subordinação

Período Composto por Subordinação Período Composto por Subordinação Todo período composto por subordinação contém uma oração principal, acompanhada de uma ou mais orações subordinadas. A oração principal é a que encerra o sentido fundamental

Leia mais

Terceiro Trabalho de Inteligência Artificial / Sistemas Inteligentes. Entrega: 29/04/2016

Terceiro Trabalho de Inteligência Artificial / Sistemas Inteligentes. Entrega: 29/04/2016 Terceiro Trabalho de Inteligência Artificial / Sistemas Inteligentes Entrega: 29/04/2016 5 de Abril de 2016 1. Assuma que lhe foi pedido para fazer um programa para planeamento de viagens. O programa é

Leia mais

Sumarizando: o que é uma língua. Métodos para seu estudo...44

Sumarizando: o que é uma língua. Métodos para seu estudo...44 sumário APRESENTAÇÃO...13 1. O que se entende por língua Estudando a língua portuguesa...17 1.1 O Vocabulário: nascimento e morte das palavras. Consultando um dicionário...20 1.2 A Semântica: o sentido

Leia mais

Gramática de Montague

Gramática de Montague Gramática de Montague Apresentação Inicial Luiz Arthur Pagani 1 There is in my opinion no important theoretical dierence between natural languages and the articial languages of logicians; indeed I consider

Leia mais

PORTUGUÊS III Semestre

PORTUGUÊS III Semestre Universidad Nacional Autónoma de México Facultad de Filosofía y Letras Colegio de Letras Modernas Letras Portuguesas PORTUGUÊS III Semestre 2019-1 Profa. Cristina Díaz Padilla Horário: segunda a sexta

Leia mais

Linguagens Lógicas. Aluno: Victor Rocha

Linguagens Lógicas. Aluno: Victor Rocha Linguagens Lógicas Aluno: Victor Rocha Roteiro Introdução Cálculo de Predicados Proposições Conectores Lógicos Variáveis Tipos de Cláusulas fatos regras Banco de Dados Prolog Fatos em Prolog Questões Unificação

Leia mais

Universidade Federal de Goiás Bacharelado em Ciências da Computacão Compiladores

Universidade Federal de Goiás Bacharelado em Ciências da Computacão Compiladores Universidade Federal de Goiás Bacharelado em Ciências da Computacão Compiladores 2013-2 Compilador para a Linguagem Cafezinho Especificação dos trabalhos: T2 (Geração da Representação Intermediária e Análise

Leia mais

Análise Sintática de Frases utilizando Gramáticas Livres de Contexto Probabilísticas

Análise Sintática de Frases utilizando Gramáticas Livres de Contexto Probabilísticas Universidade de São Paulo Mestrado em Ciência da Computação Instituto de Matemática e Estatística Disciplina MAC5725 Lingüística Computacional Análise Sintática de Frases utilizando Gramáticas Livres de

Leia mais

Lógica Computacional

Lógica Computacional Lógica Computacional Conectores Booleanos Negação, Conjunção e Disjunção Tradução de Linguagem Natural Fórmulas de 1ª ordem Definição indutiva 22 Setembro 2014 Lógica Computacional 1 Conectores Booleanos

Leia mais

LUCAS GONÇALVES GRAMÁTICA

LUCAS GONÇALVES GRAMÁTICA LUCAS GONÇALVES GRAMÁTICA 1. Observe o seguinte excerto retirado do texto: Quando os pais usam sanções que não sejam físicas ou humilhantes (...) e assinale a alternativa correta com relação à formação

Leia mais

INE5416 Paradigmas de Programação. Ricardo Azambuja Silveira INE CTC UFSC E Mail: URL:

INE5416 Paradigmas de Programação. Ricardo Azambuja Silveira INE CTC UFSC E Mail: URL: INE5416 Paradigmas de Programação Ricardo Azambuja Silveira INE CTC UFSC E Mail: silveira@inf.ufsc.br URL: www.inf.ufsc.br/~silveira Conceitos Léxica estudo dos símbolos que compõem uma linguagem Sintaxe

Leia mais

Linguagens Documentárias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília

Linguagens Documentárias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília Linguagens Documentárias Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília Contexto Organização da Informação...... procura criar métodos e instrumentos para elaborar

Leia mais

Capítulo 2 - Acentuação gráfica Regras gerais...10 Casos especiais...10 Prosódia...12 Exercícios...14

Capítulo 2 - Acentuação gráfica Regras gerais...10 Casos especiais...10 Prosódia...12 Exercícios...14 Sumário Capítulo 1 - Noções de fonética... 2 Fonemas...2 Letra...2 Sílaba...2 Número de sílabas...3 Tonicidade...3 Posição da sílaba tônica...3 Dígrafos...3 Encontros consonantais...3 Encontros vocálicos...4

Leia mais

Gramáticas Livres de Contexto

Gramáticas Livres de Contexto Gramáticas Livres de Contexto IBM1088 Linguagens Formais e Teoria da Computação Evandro Eduardo Seron Ruiz evandro@usp.br Universidade de São Paulo E.E.S. Ruiz (USP) LFA 1 / 42 Frase do dia Quando vires

Leia mais

UML. Diagrama de Classe

UML. Diagrama de Classe UML Diagrama de Classe Em UML as classes são representadas por um retângulo dividido em três compartimentos: o compartimento de nome, que conterá apenas o nome da classe modelada, o de atributos, que possuirá

Leia mais

Aula10 OUTRAS ESTRUTURAS ORACIONAIS POR SUBORDINAÇÃO

Aula10 OUTRAS ESTRUTURAS ORACIONAIS POR SUBORDINAÇÃO Aula10 OUTRAS ESTRUTURAS ORACIONAIS POR SUBORDINAÇÃO META Apresentar construções oracionais subordinadas por infinitivo, gerúndio, subjuntivo e indicativo. OBJETIVOS Ao final desta aula, o aluno deverá:

Leia mais

6 Conclusão. 6.1 Trabalhos relacionados

6 Conclusão. 6.1 Trabalhos relacionados Conclusão 112 6 Conclusão 6.1 Trabalhos relacionados A primeira versão do método SHDM apresentada por Lima (2003) empregava um modelo orientado a objetos como a base estrutural do modelo conceitual de

Leia mais

Disciplina: LINGUAGENS FORMAIS, AUTÔMATOS E COMPUTABILIDADE Prof. Jefferson Morais

Disciplina: LINGUAGENS FORMAIS, AUTÔMATOS E COMPUTABILIDADE Prof. Jefferson Morais UNIVERSIDADE FEDERAL DO PARÁ INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS FACULDADE DE COMPUTAÇÃO CURSO DE BACHARELADO EM CIÊNCIA DA COMPUTAÇÃO Disciplina: LINGUAGENS FORMAIS, AUTÔMATOS E COMPUTABILIDADE Prof.

Leia mais

EDITOR DE ANOTAÇÃO DE SIMPLIFICAÇÃO: MANUAL DO USUÁRIO

EDITOR DE ANOTAÇÃO DE SIMPLIFICAÇÃO: MANUAL DO USUÁRIO Universidade de São Paulo USP Universidade Federal de São Carlos UFSCar Universidade Estadual Paulista UNESP EDITOR DE ANOTAÇÃO DE SIMPLIFICAÇÃO: MANUAL DO USUÁRIO Helena de Medeiros Caseli Tiago de Freitas

Leia mais

Universidade Federal da Paraíba CCEN Departamento de Informática Disciplina: Banco de Dados. Aula 1 Introdução a Banco de Dados

Universidade Federal da Paraíba CCEN Departamento de Informática Disciplina: Banco de Dados. Aula 1 Introdução a Banco de Dados Universidade Federal da Paraíba CCEN Departamento de Informática Disciplina: Banco de Dados Aula 1 Introdução a Banco de Dados 1. Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído

Leia mais

MINISTÉRIO DA DEFESA EXÉRCITO BRASILEIRO DEPARTAMENTO DE EDUCAÇÃO E CULTURA DO EXÉRCITO DIRETORIA DE EDUCAÇÃO PREPARATÓRIA E ASSISTENCIAL

MINISTÉRIO DA DEFESA EXÉRCITO BRASILEIRO DEPARTAMENTO DE EDUCAÇÃO E CULTURA DO EXÉRCITO DIRETORIA DE EDUCAÇÃO PREPARATÓRIA E ASSISTENCIAL MINISTÉRIO DA DEFESA EXÉRCITO BRASILEIRO DEPARTAMENTO DE EDUCAÇÃO E CULTURA DO EXÉRCITO DIRETORIA DE EDUCAÇÃO PREPARATÓRIA E ASSISTENCIAL 6º ANO Ensino Fundamental Língua Portuguesa 2) Inferir o sentido

Leia mais

Linguística Computacional Interativa

Linguística Computacional Interativa 1 Linguística Computacional Interativa Redes de Transição Recursivas RTN s ATN s s (Woods, 1970) Gramáticas de Cláusulas Definidas ATN s DCG s Aula de 11 de setembro de 2012 2 Pressuposto para a aula:

Leia mais

Funções gramaticais: Complemento e adjunto. Luiz Arthur Pagani (UFPR)

Funções gramaticais: Complemento e adjunto. Luiz Arthur Pagani (UFPR) Funções gramaticais: Complemento e adjunto (UFPR) 1 1 Tradição gramatical termos essenciais termos acidentais: intaxe: um adjunto é um `elemento opcional', enquanto um complemento é um `elemento obrigatório'.[2,

Leia mais

Evento: Concurso Público para Provimento de Cargo Técnico-Administrativo em Educação Edital N 144/2016 PARECER

Evento: Concurso Público para Provimento de Cargo Técnico-Administrativo em Educação Edital N 144/2016 PARECER UNIVERSIDADE FEDERAL DO CEARÁ COORDENADORIA DE CONCURSOS CCV Evento: Concurso Público para Provimento de Cargo Técnico-Administrativo em Educação Edital N 144/2016 PARECER A Comissão Examinadora da Prova

Leia mais

Compiladores. Motivação. Tradutores. Motivação. Tipos de Tradutores. Tipos de Tradutores

Compiladores. Motivação. Tradutores. Motivação. Tipos de Tradutores. Tipos de Tradutores Motivação Prof. Sérgio Faustino Compiladores Conhecimento das estruturas e algoritmos usados na implementação de linguagens: noções importantes sobre uso de memória, eficiência, etc. Aplicabilidade freqüente

Leia mais

Prof. A. G. Silva. 06 de outubro de Prof. A. G. Silva Programação em Lógica 06 de outubro de / 1

Prof. A. G. Silva. 06 de outubro de Prof. A. G. Silva Programação em Lógica 06 de outubro de / 1 Programação em Lógica Prof. A. G. Silva 06 de outubro de 2016 Prof. A. G. Silva Programação em Lógica 06 de outubro de 2016 1 / 1 Gramáticas Processamento de linguagens naturais é um dos principais usos

Leia mais

Banco de dados. Objetivo: Reter os dados de forma que possam ser utilizados em outros momentos

Banco de dados. Objetivo: Reter os dados de forma que possam ser utilizados em outros momentos Banco de dados BD Dados x Informações Banco de dados Objetivo: Armazenar dados Consultar dados (dentro de um determinado contexto) gerando informações úteis Reter os dados de forma que possam ser utilizados

Leia mais

Banco de dados. Objetivo: Reter os dados de forma que possam ser utilizados em outros momentos

Banco de dados. Objetivo: Reter os dados de forma que possam ser utilizados em outros momentos Banco de dados BD Banco de dados Objetivo: Armazenar dados Consultar dados (dentro de um determinado contexto) gerando informações úteis Reter os dados de forma que possam ser utilizados em outros momentos

Leia mais

CARACTERIZAÇÃO DE ITENS LEXICAIS EM LIBRAS

CARACTERIZAÇÃO DE ITENS LEXICAIS EM LIBRAS 267 de 680 CARACTERIZAÇÃO DE ITENS LEXICAIS EM LIBRAS Dener Silva Rocha 75 (UESB) Adriana Stella C. Lessa-de-Oliveira 76 (UESB) RESUMO Este trabalho objetiva investigar um aspecto peculiar a certos itens

Leia mais

Sumário PARTE 1. Gramática

Sumário PARTE 1. Gramática PARTE 1 Gramática Capítulo 1 Fonologia... 25 1. Introdução... 25 1.1 Conceitos básicos da fonologia... 25 1.2 Outros Conceitos Fonológicos... 26 1.3 Polêmicas... 29 2. Divisão silábica... 31 3. Ortografia...

Leia mais

3 Arquitetura MVC baseada em modelos

3 Arquitetura MVC baseada em modelos Arquitetura MVC baseada em modelos 30 3 Arquitetura MVC baseada em modelos 3.1. Visão geral Na arquitetura proposta os componentes de Controle e Visão, da arquitetura tradicional do padrão de projetos

Leia mais

1 Introdução. 1 Neste estudo, será utilizando tanto o termo em inglês parsing, como o termo traduzido análise

1 Introdução. 1 Neste estudo, será utilizando tanto o termo em inglês parsing, como o termo traduzido análise 1 Introdução Este estudo enfoca o desenvolvimento da percepção de elementos de classe fechada, particularmente de afixos verbais e sua representação morfofonológica, assim como o parsing 1 (análise sintática)

Leia mais

23/05/12. Consulta distribuída. Consulta distribuída. Objetivos do processamento de consultas distribuídas

23/05/12. Consulta distribuída. Consulta distribuída. Objetivos do processamento de consultas distribuídas Processamento de Consultas em Bancos de Dados Distribuídos Visão geral do processamento de consultas IN1128/IF694 Bancos de Dados Distribuídos e Móveis Ana Carolina Salgado acs@cin.ufpe.br Bernadette Farias

Leia mais

Princípios da Engenharia de Software aula 03

Princípios da Engenharia de Software aula 03 Princípios da Engenharia de Software aula 03 Prof.: José Honorato Ferreira Nunes Material cedido por: Prof.: Franklin M. Correia Na aula anterior... Modelos de processos de software: Evolucionário Tipos

Leia mais

O ESTUDO DAS PALAVRAS

O ESTUDO DAS PALAVRAS Sumário Capítulo 1 O ESTUDO DAS PALAVRAS Lição 1 Fonética...3 1.1. Fonema e letra... 3 1.2. Divisão dos fonemas... 3 1.3. Classificação dos fonemas... 5 1.4. Encontro vocálico... 6 1.5. Encontro consonantal...

Leia mais

Linguagens de Programação

Linguagens de Programação 45 Linguagens de Programação O paradigma de programação imperativo está diretamente atrelado à arquitetura básica dos computadores sobre os quais os programas eram executados. Boa parte dos computadores

Leia mais

3 Estudos sobre a nominalização na Língua Portuguesa

3 Estudos sobre a nominalização na Língua Portuguesa 3 Estudos sobre a nominalização na Língua Portuguesa O estudo das nominalizações na língua portuguesa é desenvolvido por vários autores, tais como Basilio (1980, 1987, 2004), Gunzburger (1979), Oliveira

Leia mais

Capítulo1. Capítulo2. Índice A LÍNGUA E A LINGUAGEM O PORTUGUÊS: uma língua, muitas variedades... 15

Capítulo1. Capítulo2. Índice A LÍNGUA E A LINGUAGEM O PORTUGUÊS: uma língua, muitas variedades... 15 Capítulo1 Capítulo2 A LÍNGUA E A LINGUAGEM............................................. 9 Linguagem: aptidão inata.............................................. 10 Funções.............................................................

Leia mais

Neste capítulo veremos a arquitetura básica de uma aplicação de mercado eletrônico, apresentando seus principais componentes.

Neste capítulo veremos a arquitetura básica de uma aplicação de mercado eletrônico, apresentando seus principais componentes. 1 Neste capítulo veremos a arquitetura básica de uma aplicação de mercado eletrônico, apresentando seus principais componentes. 2 Este capítulo tem por objetivo apresentar como modelar serviços de comércio

Leia mais

PORTUGUÊS ESTRUTURADO: INTRODUÇÃO INTRODUÇÃO À PROGRAMAÇÃO PROF. ALEXANDRO DOS SANTOS SILVA

PORTUGUÊS ESTRUTURADO: INTRODUÇÃO INTRODUÇÃO À PROGRAMAÇÃO PROF. ALEXANDRO DOS SANTOS SILVA PORTUGUÊS ESTRUTURADO: INTRODUÇÃO INTRODUÇÃO À PROGRAMAÇÃO PROF. ALEXANDRO DOS SANTOS SILVA SUMÁRIO Introdução Conceitos básicos Formato básico Tipos primitivos Variáveis Constantes Operadores Operações

Leia mais

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos Introdução Laboratório de Computação para Ciências Módulo II Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Mestrado Profissional

Leia mais

GRAMÁTICA MODERNA DA LÍNGUA PORTUGUESA

GRAMÁTICA MODERNA DA LÍNGUA PORTUGUESA GRAMÁTICA MODERNA DA LÍNGUA PORTUGUESA Sumário Capítulo 1 O ESTUDO DAS PALAVRAS Lição 1 Fonética 1.1. Fonema e letra 1.2. Divisão dos fonemas 1.3. Classificação dos fonemas 1.4. Encontro vocálico 1.5.

Leia mais

UTFPR - Universidade Tecnológica Federal do Paraná. Processamento e otimização de consultas

UTFPR - Universidade Tecnológica Federal do Paraná. Processamento e otimização de consultas UTFPR - Universidade Tecnológica Federal do Paraná Processamento e otimização de consultas Leyza Baldo Dorini 04/Nov/2009 Programação da aula Introdução: processamento e otimização de consultas Etapas:

Leia mais

6.1. Teste Baseado em Gramática e Outras Abordagens de Teste

6.1. Teste Baseado em Gramática e Outras Abordagens de Teste 6 Discussão Além das técnicas de teste usando modelos gramaticais, existem outras abordagens de teste funcional de sistemas que estão sendo estudadas pela comunidade científica. Algumas delas se dedicam

Leia mais

A SELEÇÃO ARGUMENTAL NA AQUISIÇÃO DE PORTUGUÊS ESCRITO POR SURDOS

A SELEÇÃO ARGUMENTAL NA AQUISIÇÃO DE PORTUGUÊS ESCRITO POR SURDOS 179 de 666 A SELEÇÃO ARGUMENTAL NA AQUISIÇÃO DE PORTUGUÊS ESCRITO POR SURDOS Joyce Maria Sandes da Silva 47 (UESB) Adriana Stella Cardoso Lessa de Oliveira 48 (UESB) RESUMO Esse estudo objetiva, a partir

Leia mais

Sistemas de Banco de Dados

Sistemas de Banco de Dados Sistemas de Banco de Dados Fundamentos em Bancos de Dados Relacionais Wladmir Cardoso Brandão www.wladmirbrandao.com Departamento de Ciência da Computação (DCC) Instituto de Ciências Exatas e Informática

Leia mais

Terceiro Trabalho de Sistemas Inteligentes. Entrega: 25/04/2014

Terceiro Trabalho de Sistemas Inteligentes. Entrega: 25/04/2014 Terceiro Trabalho de Sistemas Inteligentes Entrega: 25/04/2014 31 de Março de 2014 1. Assuma que lhe foi pedido para fazer um programa para planeamento de viagens. O programa é muito simples, mas deve

Leia mais

ELABORAÇÃO DE DICIONÁRIO ELETRÔNICO Mauro Rebello 1, Violeta de San Tiago Dantas Barbosa Quental 2.

ELABORAÇÃO DE DICIONÁRIO ELETRÔNICO Mauro Rebello 1, Violeta de San Tiago Dantas Barbosa Quental 2. DL - DEPARTAMENTO DE LETRAS ELABORAÇÃO DE DICIONÁRIO ELETRÔNICO Mauro Rebello 1, Violeta de San Tiago Dantas Barbosa Quental 2. 1 Aluno do curso de Letras da PUC-Rio 2 Professora e pesquisadora da área

Leia mais

1 Lógica de primeira ordem

1 Lógica de primeira ordem 1 Lógica de primeira ordem 1.1 Sintaxe Para definir uma linguagem de primeira ordem é necessário dispor de um alfabeto. Este alfabeto introduz os símbolos à custa dos quais são construídos os termos e

Leia mais

(2) SN N (SP)/(Adj) {gerando por exemplo: SN = N-livro SP-de chocolate; SN = N-rabo Adj-amarelo]

(2) SN N (SP)/(Adj) {gerando por exemplo: SN = N-livro SP-de chocolate; SN = N-rabo Adj-amarelo] Universidade de São Paulo Faculdade de Filosofia, Letras e Ciências Humanas Letras Clássicas e Vernáculas Sintaxe do Português I FLC0277 Maria Clara Paixão de Sousa Aula 10: Constituência e Estrutura da

Leia mais

Introdução à Programação

Introdução à Programação Introdução à Programação Linguagens de Programação: sintaxe e semântica de linguagens de programação e conceitos de linguagens interpretadas e compiladas Engenharia da Computação Professor: Críston Pereira

Leia mais

ESCOLA SECUNDÁRIA DR. GINESTAL MACHADO PLANIFICAÇÃO ANUAL DE PORTUGUÊS 11º ANO

ESCOLA SECUNDÁRIA DR. GINESTAL MACHADO PLANIFICAÇÃO ANUAL DE PORTUGUÊS 11º ANO Objetivos: Desenvolver os processos linguísticos, cognitivos e metacognitivos necessários à operacionalização de cada uma das competências de compreensão e produção nas modalidades oral e escrita. Interpretar

Leia mais

O ESTUDO DO VOCABULÁRIO

O ESTUDO DO VOCABULÁRIO Sumário Capítulo 1 O ESTUDO DO VOCABULÁRIO Lição 1 Fonética...3 1.1. Fonema e Letra... 3 1.2. Divisão dos Fonemas... 3 1.3. Classificação dos fonemas... 5 1.4. Encontro Vocálico... 7 1.5. Encontro Consonantal...

Leia mais

Linguagens de Programação

Linguagens de Programação O estudante estuda muito. Regras: 7 9 12 14. . Regras: 2 4 . Regras: 1 Representar através de uma árvore de derivação. 77 O estudante estuda muito.

Leia mais

3. Se for apresentada mais do que uma resposta ao mesmo item, só é classificada a resposta que surgir em primeiro lugar.

3. Se for apresentada mais do que uma resposta ao mesmo item, só é classificada a resposta que surgir em primeiro lugar. Prova de Aferição de Português Língua Segunda Prova 82 8.º Ano de Escolaridade 2019 Decreto-Lei n.º 17/2016, de 4 de abril Decreto-Lei n.º 55/2018, de 6 de julho Critérios de Classificação 8 Páginas 1.

Leia mais

1. Teoria X-barra (ou: dos Constituintes Sintáticos)

1. Teoria X-barra (ou: dos Constituintes Sintáticos) TÓPICO III: INTRODUÇÃO A UMA ABORDAGEM FORMAL DA GRAMÁTICA 1. Teoria X-barra (ou: dos Constituintes Sintáticos) Objetivos desta seção Introduzir a noção de constituinte sintático segundo a gramática gerativa

Leia mais

Odilei França. Este material é parte integrante do acervo do IESDE BRASIL S.A., mais informações

Odilei França. Este material é parte integrante do acervo do IESDE BRASIL S.A., mais informações Odilei França Graduado em Letras pela Fafipar. Graduado em Teologia pela Faculdade Batista. Professor de Língua Portuguesa para concursos públicos há 22 anos. Sintaxe do período composto: parte I Conceitos

Leia mais

CAPÍTULO 1 O ESTUDO DAS PALAVRAS

CAPÍTULO 1 O ESTUDO DAS PALAVRAS Índice CAPÍTULO 1 O ESTUDO DAS PALAVRAS LIÇÃO 1 FONÉTICA...3 1.1. Fonema e letra... 3 1.2. Divisão dos fonemas... 3 1.3. Classificação dos fonemas... 4 1.4. Encontro vocálico... 5 1.5. Encontro consonantal...

Leia mais

TÓPICO III: INTRODUÇÃO A UMA ABORDAGEM FORMAL DA GRAMÁTICA 1. Teoria X-barra (ou: dos Constituintes Sintáticos)

TÓPICO III: INTRODUÇÃO A UMA ABORDAGEM FORMAL DA GRAMÁTICA 1. Teoria X-barra (ou: dos Constituintes Sintáticos) Universidade de São Paulo Faculdade de Filosofia, Letras e Ciências Humanas Letras Clássicas e Vernáculas Sintaxe do Português I FLC0277 Maria Clara Paixão de Sousa TÓPICO III: INTRODUÇÃO A UMA ABORDAGEM

Leia mais

Visões Arquiteturais. Visões Arquiteturais

Visões Arquiteturais. Visões Arquiteturais Visões Arquiteturais Separar diferentes aspectos em visões separadas com o objetivo de gerenciar complexidade. Cada visão descreve diferentes conceitos da Engenharia. Visões permitem reduzir a quantidade

Leia mais

Banco de Dados. SGBD - Sistema de Gerenciamento de Banco de Dados Parte 2. Prof. Leonardo Vasconcelos

Banco de Dados. SGBD - Sistema de Gerenciamento de Banco de Dados Parte 2. Prof. Leonardo Vasconcelos Banco de Dados Parte 2 Prof. Leonardo Vasconcelos - Conceitos e Arquiteturas de SBD Modelos de dados: conjunto de conceitos que podem ser usados para descrever a estrutura de um banco de dados. Permitem

Leia mais

Estruturas de Controle: Nível de Unidades de Programação

Estruturas de Controle: Nível de Unidades de Programação Paradigmas de Linguagens I 1 1.5... Estruturas de Controle: Nível de Unidades de Programação As estruturas de controle no nível de unidades de programação são mecanismos de linguagens utilizados para especificar

Leia mais

BOLSÃO 2017 / 6º ANO

BOLSÃO 2017 / 6º ANO Você que se inscreveu no Bolsão do Colégio Futuro Vip para cursar o 6º ano do Ensino Fundamental está BOLSÃO 2017 / 6º ANO Fonética Fonema distinção entre FONEMA e LETRA Sílaba número de sílabas / divisão

Leia mais

ALGORITMOS E TÉCNICAS DE PROGRAMAÇÃO

ALGORITMOS E TÉCNICAS DE PROGRAMAÇÃO INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO RIO GRANDE DO NORTE ALGORITMOS E TÉCNICAS DE PROGRAMAÇÃO Docente: Éberton da Silva Marinho e-mail: ebertonsm@gmail.com eberton.marinho@ifrn.edu.br

Leia mais

CRITÉRIOS DE AVALIAÇÃO 3.º Ciclo do Ensino Básico Departamento de Línguas Disciplina: Português -7º ano

CRITÉRIOS DE AVALIAÇÃO 3.º Ciclo do Ensino Básico Departamento de Línguas Disciplina: Português -7º ano CRITÉRIOS DE AVALIAÇÃO 3.º Ciclo do Ensino Básico Departamento de Línguas Disciplina: Português -7º ano 2018-2019 Domínios Domínios de referência Aprendizagens essenciais Instrumentos Frequência / Periodicidade

Leia mais

SCC5869 Tópicos em Processamento de Língua Natural. Expressão lingüística representação do significado. São necessários para automação do processo

SCC5869 Tópicos em Processamento de Língua Natural. Expressão lingüística representação do significado. São necessários para automação do processo SEMÂNTICA PARTE 2 SCC5869 Tópicos em Processamento de Língua Natural Thiago A. S. Pardo ANÁLISE SEMÂNTICA Expressão lingüística representação do significado São necessários para automação do processo Grande

Leia mais

Professora Patrícia Lopes

Professora Patrícia Lopes Professora Patrícia Lopes É a junção entre a morfologia e a sintaxe. Trata-se de duas partes da gramática que apesar de estarem envolvidas entre si, constituem-se de particularidades distintas. A morfologia

Leia mais

Parte 4 - Semântica. Papéis Temáticos

Parte 4 - Semântica. Papéis Temáticos Parte 4 - Semântica Papéis Temáticos 1 Baseado em slides do Prof. Nuno Mamede PAPÉIS TEMÁTICOS (THEMATIC ROLES) Considerem-se os eventos: O João partiu o vidro. A Maria abriu a porta. Ambos os eventos

Leia mais

A/ART casa/n caiu/v./. Figura 3.1: Frase com anotação morfossintática.

A/ART casa/n caiu/v./. Figura 3.1: Frase com anotação morfossintática. 3 Tarefa Esse capítulo começa dissertando sobre as vantagens de se agrupar as palavras em classes, como elas são agrupadas em part-of-speechs e suas aplicações. Em seguida é apresentado o Anotador Morfossintático

Leia mais

Anexo B Relação de Assuntos Pré-Requisitos à Matrícula

Anexo B Relação de Assuntos Pré-Requisitos à Matrícula Anexo B Relação de Assuntos Pré-Requisitos à Matrícula MINISTÉRIO DA DEFESA EXÉRCITO BRASILEIRO DEPARTAMENTO DE EDUCAÇÃO E CULTURA DO EXÉRCITO DIRETORIA DE EDUCAÇÃO PREPARATÓRIA E ASSISTENCIAL 6º ANO Ensino

Leia mais

Classes e Objetos. Sintaxe de classe em Java

Classes e Objetos. Sintaxe de classe em Java Classes e Objetos Classes e Objetos A Programação Orientada a Objetos (POO) é uma técnica de programação que se baseia na construção de classes e utilização de objetos. Os objetos são formados por dados

Leia mais

Português. Índice de aulas. Tipologias textuais

Português. Índice de aulas. Tipologias textuais Índice de aulas Tipologias textuais Texto narrativo Ação Personagens Narrador Espaço Tempo Modalidades do discurso Narrativas de tradição popular O caldo de pedra Mestre Finezas: o passado glorioso Mestre

Leia mais