COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
|
|
|
- Carmem de Sousa Ximenes
- 9 Há anos
- Visualizações:
Transcrição
1 SANDRA CRISTINA DOS SANTOS ANTUNES COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS Dissertação de Mestrado em Linguística (Área de Especialização: Processamento e Tecnologia das Línguas Naturais) Apresentada à Faculdade de Letras da Universidade de Lisboa Orientador: Professora Doutora Palmira Marrafa 2002
2 SANDRA CRISTINA DOS SANTOS ANTUNES COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS Dissertação de Mestrado em Linguística (Área de Especialização: Processamento e Tecnologia das Línguas Naturais) Apresentada à Faculdade de Letras da Universidade de Lisboa Orientador: Professora Doutora Palmira Marrafa 2002
3 AGRADECIMENTOS Terminado este trabalho, não posso deixar de tornar presentes todos aqueles que, de uma forma ou de outra, contribuíram para a sua realização, manifestando aqui o meu reconhecimento. À Professora Doutora Palmira Marrafa, minha orientadora, agradeço o encorajamento e todas as sugestões e correcções que ajudaram a estruturar este trabalho. Agradeço também o cuidado com que leu as sucessivas versões deste trabalho e a sua crítica constante. À Doutora Fernanda Bacelar agradeço o incentivo e a sensibilidade que sempre demonstrou, permitindo que interrompesse a minha actividade no CLUL na fase final de elaboração deste trabalho. Aos meus colegas e companheiros de mestrado e do CLUL, nomeadamente à Amália Mendes, à Florbela Barreto, à Rita Veloso e à Sara Mendes, agradeço a motivação, a compreensão e o carinho sempre demonstrados, bem como todas as sugestões sempre pertinentes e oportunas. À Raquel Amaro deixo um agradecimento muito especial pela leitura sempre atenta de algumas partes deste trabalho, bem como todo o apoio e ajuda essenciais na sua fase final. Ao Rui Chaves, pela sua inestimável amizade, compreensão e motivação, bem como todos os safanões que nos momentos mais críticos me ajudaram a ir para a frente. Agradeço também todas as leituras que fez deste trabalho e todas as sugestões que em muito o beneficiaram. À Ana Rosa e à Manuela Gonzaga agradeço o apoio e todas as sugestões feitas após a leitura deste trabalho, sempre com o seu espírito crítico de linguistas. Aos meus pais, pelo apoio, incentivo e carinho absolutos, de quem só quer o melhor para mim. Ao Jorge, uma inesgotável fonte de apoio, pelo carinho, compreensão, preocupação e dedicação constantes e por ter feito sempre tudo o que esteve ao seu alcance para que eu pudesse levar este barco a bom porto.
4 When I use a word, Humpty Dumpty said, in rather a scornful tone, it means just what I choose it to mean, neither more nor less. The question is said Alice, whether you can make a word mean so many different things. The question is said Humpty Dumpty, which is to be master that s all. Lewis Carrol, Alice s Adventures in Wonderland
5 ÍNDICE 1. INTRODUÇÃO Objecto de Estudo Metodologia e Selecção dos Dados Organização PROBLEMÁTICA A Questão da Polissemia Polissemia e Vaguidade Polissemia e Homonímia Polissemia e Contexto Polissemia nas Categorias Sintácticas Polissemia Nominal Polissemia Verbal Polissemia Adjectival DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO Léxico Enumerativo de Sentidos Regras Lexicais Léxico Generativo Níveis de Representação Estrutura Argumental Estrutura Eventiva Estrutura Qualia Sistema de Tipos Semânticos e Herança Lexical Paradigma Léxico-Conceptual (PLC) Mecanismos Generativos Coerção de Tipo ix
6 Coerção de Subtipo Coerção de Complemento Co-composição Ligação Selectiva POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO Tipos Nominais Complexos Selecção Semântica e Interpretação de Tipos Complexos O Papel Constitutivo Adjectivos Relativos e Modificadores de Propriedade Transcrição de Tipo Posição do Adjectivo Nomes com o Tipo Simples Indivíduo Nomes com o Tipo Simples Estado Nomes que Denotam Pares Indivíduo Estado Causativos Aspectuais Algumas Questões sobre a Coerção POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS Tipos Complexos e Co-predicação Polissemia Construcional (Modulação de Significados) Polissemia Construcional Adjectival Polissemia Construcional Verbal Polissemia Construcional Nominal Extensão de Significados (Alteração de Significados) Extensão de Significados Nominais Metáforas O Teste de Co-Predicação A Problemática de Itens como Jornal CONCLUSÃO REFERÊNCIAS x
7 1. INTRODUÇÃO Psychologically, the remarkable fact about polysemy is how little trouble it causes. (Miller, 1978: 97) A Semântica Lexical é a área da Linguística que se dedica essencialmente ao estudo da estrutura semântica dos itens lexicais e ao modo como esta deve ser representada no léxico. O léxico tem sido predominantemente encarado como um repositório que contém toda a informação pertinente, de natureza fonológica, morfológica, sintáctica e semântica, sobre cada item lexical representado. Nesta perspectiva, essa informação não é derivável a partir de quaisquer mecanismos gramaticais. As propriedades representadas nas entradas lexicais poderão ser de natureza mais geral (especificando a categoria sintáctica, o quadro de subcategorização e a classe semântica do item lexical, o que permite integrar os itens em classes) ou de natureza mais idiossincrática, caracterizando apenas um ou um pequeno número de itens. Neste quadro, a cada significado diferente de um item corresponderá uma entrada lexical distinta. O estudo do léxico ganhou vigor a partir da década de sessenta e, em particular, a partir da década de oitenta, quando começaram a surgir vários trabalhos que tinham como objecto de investigação a descrição e a classificação das categorias gramaticais de acordo com o(s) seu(s) possível(is) significado(s). Até então, a sintaxe tinha sido considerada a componente mais proeminente da gramática e, consequentemente, o principal objecto de estudo dos linguistas.
8 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS Foi nos últimos anos que o estudo da pluralidade de sentidos que um item lexical pode ter despertou o interesse dos investigadores na área da semântica lexical. Polysemy has been the subject of remarkable little research. Linguists have found it insufficiently regular to succumb to their theoretical accounts, lexicographers have been concerned with instances rather than theory, and NLP has, until recently, overlooked the homonymy/polysemy distinction and ignored the relations between polysemous senses. (Kilgarriff, 1995a: 3) Robins (1967) foi dos primeiros trabalhos a ter em conta as relações complexas existentes entre as palavras e os seus significados, a partir da observação de que um conceito simples podia ser expresso por diferentes palavras - sinonímia - e que, contrariamente, uma palavra podia comportar diferentes significados - polissemia ou homonímia. A distinção entre polissemia e homonímia tem sido largamente discutida na literatura. Neste trabalho assume-se que se está perante uma caso de homonímia quando dois, ou mais, significados distintos e não relacionados partilham acidentalmente a mesma forma lexical (por exemplo, banco - peça de mobiliário - e banco - instituição financeira). Por outro lado, está-se perante um caso de polissemia quando a mesma unidade lexical comporta dois ou mais significados semanticamente relacionados (por exemplo, janela - abertura na parede e objecto físico que tapa essa mesma abertura) 1. A polissemia é um fenómeno comum em todas as línguas, mas raramente constitui um problema na comunicação. Seleccionamos fácil e inconscientemente o significado apropriado, ainda que as palavras mais usadas tendam a ser as mais polissémicas. Embora não constitua problema no uso da língua, excepto em casos de trocadilhos e jogos de palavras, a polissemia coloca problemas a nível da representação semântica, estando longe de haver consenso quanto ao número de significados que uma palavra pode ter ou quanto ao modo como esses significados se relacionam entre si ou como devem ser representados nos dicionários e no léxico. Em termos de aplicações computacionais, o problema da desambiguação também constitui uma questão crucial. A identificação automática dos vários sentidos relacionados que se podem associar a um dado item lexical não é uma questão trivial em termos 1 A distinção entre homonímia e polissemia será debatida mais pormenorizadamente no capítulo 2. 2
9 1. INTRODUÇÃO computacionais, uma vez que, na maioria dos casos, esses sentidos estão associados ao mesmo contexto sintáctico ou a contextos sintácticos muito próximos. Foram as categorias predicativas, verbos e adjectivos, que mais atenção mereceram por parte dos estudiosos, como mostram, entre outros, trabalhos como Levin (1993), para os verbos, Bouillon (1996, 1997, 1999) e Saint-Dizier (1998a, 1998b, 1999), para os adjectivos. No seguimento destes trabalhos, bem como Pinto (2001) e Berkeley Coter (2002), para o Português, o presente trabalho tem como principal objectivo o estudo da polissemia regular nas classes nominal, verbal e adjectival, no Português, e sua representação no quadro de um modelo computacionalmente executável. Há que captar a sistematicidade da relação existente entre os significados relevantes para a interpretação de um mesmo item lexical e dar conta da criação de novos significados em contexto. Trabalhos como os de Copestake & Briscoe (1992, 1995), Pustejovsky (1995a) e Kilgarriff (1992), que assentam na criação de um formalismo que dê conta do fenómeno de polissemia regular, servem de base para a elaboração do presente estudo. Pustejovsky (1995a) propõe a criação de entradas lexicais suficientemente ricas para modelizarem a semântica intrínseca das unidades lexicais e suficientemente subespecificadas para permitirem a derivação, através de mecanismos generativos apropriados, do sentido adquirido em contexto. Copestake & Briscoe (1992, 1995) propõem um modelo que combina entradas lexicais, semelhantes às propostas no âmbito do Léxico Generativo (Pustejovsky 1995a), com regras lexicais, de forma a explicar a derivação de diferentes tipos de significados de um item polissémico. Ambos os modelos têm como objectivo prever o comportamento dos itens polissémicos e obter a interpretação adequada no contexto apropriado OBJECTO DE ESTUDO Quando surgiram os primeiros sistemas de Gramáticas Independentes do Contexto (Context-Free Grammars - CFG) e de Gramáticas Transformacionais, a principal 3
10 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS motivação para a sua criação residia na aparente inadequação dos sistemas de estados finitos existentes na altura para descrever todos os aspectos linguísticos associados à natureza criativa das línguas naturais. Ainda que não se apreciasse a ideia de que os sistemas de estados finitos não eram suficientes para analisar uma dada construção, tornava-se cada vez mais necessária a criação de uma gramática com um maior poder expressivo. Hoje, a semântica das línguas naturais encontra-se numa situação análoga. Atingiu-se um estado em que se descobrem inúmeros fenómenos da língua que se encontram além do poder explanatório dos nossos sistemas de semântica lexical. Um dos fenómenos mais difíceis de tratar é o da ambiguidade lexical. De entre o fenómeno de ambiguidade lexical destaca-se a distinção entre POLISSEMIA e HOMONÍMIA. Atente-se nos seguintes exemplos: (1) a. Este livro é muito deprimente. b. A Rita deixou o livro em cima da mesa. (2) a. A Clara foi buscar o banco ao sótão. b. Este é o banco onde deposito o meu dinheiro. Como se analisará mais detalhadamente no capítulo 2, é notória a existência de uma relação semântica entre os significados de livro em (1), contrariamente aos significados de banco, em (2), que não parecem apresentar qualquer relação semântica entre si. Ou seja, pode estabelecer-se uma relação entre os significados de livro - informação - e livro - objecto físico - em (1a) e (1b), respectivamente. A intuição de que estes dois significados são inerentemente relacionáveis é reforçada pela possibilidade de ocorrência de frases onde ambos os significados estão disponíveis ao mesmo tempo. (3) O livro que a Rita deixou em cima da mesa é muito deprimente. Em contrapartida, não é possível estabelecer-se qualquer relação semântica entre os significados de banco - peça de mobília/assento - e banco - instituição financeira - presentes em (2a) e (2b), respectivamente, nem ter ambos os significados disponíveis na mesma frase. 4
11 1. INTRODUÇÃO (4) *A Clara foi buscar ao sótão o banco onde deposito o meu dinheiro. O estudo dos itens polissémicos levou à constatação de que a polissemia podia ser regular, i.e., que certas alternâncias de significados ocorriam de forma previsível e sistemática dentro de uma determinada classe de palavras (Apresjan, 1973). (5) a. O livro/artigo/revista/quadro/fotografia está em cima da mesa. b. O livro/artigo/revista/quadro/fotografia é muito deprimente. Um dos principais problemas da semântica lexical reside na criação de modelos que consigam captar todos os significados que um determinado item lexical pode adquirir. Na perspectiva clássica do léxico, os itens lexicais têm significados fixos. A aquisição de um novo significado por parte de um item lexical corresponde à criação de uma nova entrada lexical, no léxico, de modo a permitir dar conta desse novo significado. Um sistema com estas características é denominado LINGUAGEM MONOMÓRFICA, e caracteriza-se essencialmente por atribuir um único significado a um item lexical. A ambiguidade lexical é expressa através de múltiplas listas de entradas lexicais para um dado item. Os Léxicos Enumerativos de Sentidos são um exemplo desta abordagem monomórfica. Monomorphic Languages: A language where lexical items and complex phrases are provided a single type and denotation. In all these views, every word has a literal meaning. Lexical ambiguity is treated by multiple listing of words, both for contrastive ambiguity and logical polysemy. (Pustejovsky, 1995a: 56) Para os exemplos (1) e (2) supra, os itens livro e banco teriam ambos duas entradas lexicais, correspondendo a livro 1 [informação], livro 2 [objecto físico], banco 1 [peça de mobiliário], e banco 2 [instituição financeira]. Note-se que, neste sistema, não é possível captar a relação existente entre livro 1 e livro 2, tornando-o um fenómeno de ambiguidade semelhante a banco 1 e banco 2, o que não é o caso. A par da categoria nominal, as categorias verbal e adjectival também apresentam comportamentos polissémicos. Os exemplos em (6) e (7) ilustram alguns casos de polissemia verbal. 5
12 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (6) a. A Rita ferveu o leite. b. O leite ferveu. (7) a. A Maria começou o livro. b. A Maria começou a ler o livro. c. A Maria começou a escrever o livro. As estruturas em (6) correspondem à alternância causativa/incoativa, em que, do ponto de vista sintáctico, o mesmo verbo se comporta quer como transitivo - (6a) - quer como ergativo - (6b). Esta alternância encontra-se relacionada por um traço de causalidade, sendo considerada um caso de polissemia regular. No que respeita às estruturas em (7), o mesmo verbo pode, sintacticamente, seleccionar diferentes tipos de complementos. No entanto, apesar das diferentes estruturas sintácticas, existe uma relação semântica entre o significado dos diversos complementos. Num modelo monomórfico existiriam vários verbos ferver e começar, cada um com várias entradas lexicais, correspondendo, cada uma, a uma estrutura sintáctica possível, o que não permitiria captar qualquer tipo de relação entre as diferentes estruturas. No que respeita aos adjectivos, esta categoria também apresenta um comportamento polissémico. Do ponto de vista semântico, os adjectivos apresentam um comportamento polimórfico, cuja origem pode dever-se, fundamentalmente, a três factores: (i) semântica do próprio adjectivo - alternando entre interpretações de experienciador e de causalidade, podendo seleccionar nomes que denotem indivíduos, objectos ou eventos - como ilustram os exemplos em (8); (ii) semântica do nome que modifica - adquirindo significados distintos de acordo com o item nominal que modifica - como se pode observar pelos exemplos em (9); (iii) posição do adjectivo relativamente ao nome que modifica activando aspectos distintos da semântica do mesmo item nominal - como mostram as estruturas em (10). (8) a. O rapaz está triste. b. Este livro é triste. c. Hoje foi um dia triste. 6
13 1. INTRODUÇÃO (9) a. um bom livro (que está bem concebido) b. um bom investimento (que traz vantagens) c. uma boa caldeirada (que é agradável ao paladar ou ao olfacto) d. uma boa pessoa (que apresenta qualidades morais) e. um bom médico (que desempenha bem as suas funções) f. uma boa faca (que funciona bem) (10) a. um velho marinheiro (de longa data) b. um marinheiro velho (de idade avançada) Como se pode observar pelos exemplos apresentados, torna-se difícil a um Léxico Enumerativo de Sentidos conseguir captar e enumerar todos os significados possíveis de um dado item. O inverso de uma abordagem monomórfica consiste numa abordagem que negue a existência de um significado literal, como é o caso de uma LINGUAGEM POLIMÓRFICA NÃO RESTRINGIDA. O significado é determinado exclusivamente pelo contexto e não por quaisquer propriedades inerentes da língua. Unrestricted Polymorphic Languages: No restriction on the type that a lexical item may assume. No operational distinction between subclasses of polymorphic transformations. (...). The contribution of background knowledge acts as the trigger to shift the meaning of an expression in different pragmatically determined contexts, and there is nothing inherent in the language that constrains the meaning of the words in context. (Pustejovsky, 1995a: 56) No entanto, o que se deseja é um modelo de semântica lexical que consiga captar e prever o comportamento polissémico dos itens lexicais, sem sobregerar ou produzir expressões semanticamente mal formadas. O significado deve ser em parte lexicalmente determinado e não totalmente definido através da pragmática. Trata-se de uma LINGUAGEM POLIMÓRFICA FRACA. Weakly Polymorphic Languages: All lexical items are semantically active, and have a richer typed semantic representation than conventionally assumed; semantic operations of lexically-determined type changing (e.g., type coercions) operate under well-defined constraints. Different subclasses of polymorphic operations are defined, each with independent properties and conditions on their application. (Pustejovsky, 1995a: 57) 7
14 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS Pustejovsky (1995a), propõe, assim, o modelo do Léxico Generativo (LG), que assenta na criação de entradas lexicais subespecificadas e de mecanismos generativos que, ao interagirem com a informação codificada nas várias estruturas que compõem as entradas lexicais, permitem a interpretação adequada do item em contexto. Instead of enumerating the different senses of the words as in a monomorphic approach, the theory adopts a generative (or semipolymorphic) point of view ( ). The word has a lexical sense that can be manipulated by a set of generative devices which derive an infinite number of senses in context. (Bouillon, 1999: 4) Uma outra proposta é a de Copestake & Briscoe (1992, 1995) que se fixa em testes de co-predicação 2 a partir dos quais distingue dois modos distintos de representação dos itens polissémicos: entrada lexicais subespecificadas segundo o modelo generativo, por um lado, e regras lexicais por outro. Considerem-se os seguintes exemplos: (11) a. O livro que a Rita deixou em cima da mesa é muito deprimente. b. O banco onde deposito o meu dinheiro tem uma fachada renascentista. (12) a. *O Jornal despediu o editor e está sujo de café. b. *O João amamenta e come cabrito. Nos exemplos em (11) o item livro é ambíguo entre a interpretação de objecto físico e informação - em (11a) - e o item banco é ambíguo entre a interpretação de instituição financeira e edifício - em (11b). Ambos os itens podem entrar em estruturas de co-predicação. No que respeita aos exemplos em (12), os itens jornal e cabrito, ambíguos entre as interpretações de instituição e objecto físico - em (12a) - e animal e comida - em (12b) - não permitem a co-predicação, resultando em estruturas zeugmáticas. 2 A co-predicação consiste essencialmente na aplicação, numa mesma estrutura, de diferentes predicados sobre um item lexical polissémico, fazendo emergir os seus diferentes significados. 8
15 1. INTRODUÇÃO Com base na não aceitação das estruturas em (12), em contraste com a aceitação das estruturas em (11), Copestake & Briscoe (1992, 1995) propõem dois tipos de polissemia regular e, consequentemente, dois modos distintos de representação lexical. A nível computacional, ambas as propostas são executáveis. No âmbito do LG existem algumas implementações de pequena escala em alguns trabalhos da área, a maior parte deles sob a forma de Matrizes Atributo-Valor - MAV - (cf. capítulo 3, nota 3). A proposta de Copestake & Briscoe (1992, 1995), desenvolvida no âmbito do projecto ACQUILEX 3, faz uso do LG, por um lado, e de regras lexicais, por outro, e é implementada em LRL (Lexical Representation Language), com recurso a estruturas de traços tipificadas. Contrariando o que foi durante largos anos a perspectiva dominante, estas abordagens sustentam que o léxico não é um componente estático e independente da gramática, constituído por listas exaustivas de entradas lexicais providas de informação intralinguística METODOLOGIA E SELECÇÃO DOS DADOS For an understanding of the lexicon, the contributing disciplines are lexicography, psycholinguistics and theoretical, computational and corpus linguistics. (Kilgarriff, 1992: 4) No seguimento de Pustejovsky (1995a), o presente estudo baseou-se primeiramente no estabelecimento prévio de um conjunto de classes de alternâncias nominais, verbais e adjectivais, nas quais os itens lexicais são sistematicamente ambíguos entre dois ou mais significados. 3 ACQUILEX (The Acquisition of Lexical Knowledge for Natural Language Processing Systems) é um projecto que tem como objectivo o desenvolvimento de técnicas e metodologias para a utilização de dicionários informatizados (Machine-Readable Dictionaries MRD) na construção de bases de conhecimento lexical, no âmbito do processamento das línguas naturais. 9
16 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS O recurso à base de dados da WordNet do Português 4 ajudou consideravelmente ao alargamento desse conjunto de alternâncias, nomeadamente no que respeita aos itens polissémicos da categoria nominal. A consulta de um corpus de uso real da língua revelou-se útil na medida em que permitiu captar a regularidade de alguns dados 5. Este trabalho reuniu, assim, um conjunto de exemplos que representam casos relevantes de polissemia, os quais vão constituir objecto de um estudo sistematizado e tão exaustivo quanto possível ORGANIZAÇÃO No próximo capítulo procede-se a uma definição mais detalhada do conceito de polissemia, em geral, e de polissemia regular, em particular, distinguindo estes conceitos dos restantes fenómenos de ambiguidade semântica, nomeadamente da vaguidade e da homonímia. Analisam-se alguns casos de polissemia regular no Português nas categorias nominal, verbal e adjectival. No capítulo 3 analisam-se as abordagens existentes com o objectivo de representar os itens lexicais polissémicos, de modo a permitir o acesso a todas as suas possíveis interpretações. Destacam-se as Técnicas Enumerativas de Sentidos, as Regras Lexicais e o Léxico Generativo (LG), que pretende explicar o comportamento polimórfico das línguas naturais e captar a criação de novos sentidos em contexto, desenvolvendo uma representação semântica complexa com base na noção de co-composicionalidade 6. No capítulo 4 são analisadas algumas expressões polissémicas à luz do modelo do LG, quadro teórico em que este estudo se insere. 4 Também designada WordNet.PT ou WN.PT. Trata-se de um projecto em curso no CLG Grupo de Computação do Conhecimento Léxico-Gramatical - do Centro de Linguística da Universidade de Lisboa. Segundo os pressupostos da WordNet de Princeton, desenvolvida para o inglês americano pelo Laboratório de Ciências da Universidade de Princeton, este projecto consiste numa base de dados do conhecimento linguístico, em que a informação relativamente a cada item lexical é representada de forma estruturada, sendo o significado de cada unidade deduzido das suas relações com outras unidades (Marrafa, 2001). 5 Foi consultado o corpus construído no âmbito do projecto Léxico Multifuncional do Português Contemporâneo, coordenado pelo Centro de Linguística da Universidade de Lisboa. 6 Que respeita, em particular, à interacção entre o significado de um dado item lexical e o significado dos seus argumentos. 10
17 1. INTRODUÇÃO No capítulo 5 distinguem-se dois tipos de polissemia regular - polissemia construcional e extensão de significados - a que correspondem representações distintas (Copestake & Briscoe, 1995). É introduzido o conceito de co-predicação e analisam-se alguns exemplos. Finalmente, e a título de conclusão, o capítulo 6 encerra esta dissertação, focando os aspectos mais importantes analisados ao longo deste trabalho. 11
18 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS 12
19 2. PROBLEMÁTICA The fundamental problem posed by polysemy for computation is that particular words can take on an almost indefinite number of subtle meaning variations. (Verspoor, 1997a: 214) As palavras relacionam-se com outras palavras de diversas maneiras, tornando-se necessário seleccionar e isolar cada uma dessas relações para que sejam apropriadamente analisadas. A sinonímia e a polissemia são, provavelmente, as relações mais produtivas de qualquer língua e resultam em certa medida de uma das propriedades de todas as línguas naturais: a sua criatividade. Para além de produzirem enunciados até então nunca antes produzidos, os falantes também fazem novos usos das palavras, principalmente através de processos metafóricos e metonímicos. No entanto, esses novos usos não são criados arbitrariamente. No seu uso criativo de novos significados os falantes observam as regras e as relações utilizadas na geração de significados conhecidos, gerando, por sua vez, significados desconhecidos mas, contudo, possíveis. Deste modo, o uso criativo que os falantes fazem da linguagem não produz qualquer impedimento à compreensão de novos significados. No entanto, no que respeita aos sistemas de Processamento das Línguas Naturais (PLN), torna-se complicado identificar, de entre os vários sentidos relacionados que se podem associar a uma dada palavra, aquele que é requerido num contexto particular. Como reage um sistema de PLN quando, na sua busca através do léxico para encontrar o
20 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS significado de uma palavra, encontra vários? E, consequentemente, qual será o melhor método de representação lexical dos vários significados que uma palavra pode adquirir? Debruçando-se sobre o estudo da relação de polissemia regular, este capítulo apresenta uma distinção entre os restantes fenómenos de ambiguidade lexical no Português e uma descrição do modo como os vários significados dos itens lexicais se relacionam entre si A QUESTÃO DA POLISSEMIA O conceito de polissemia coloca dois problemas centrais na área da Semântica Lexical: um diz respeito à definição e outro diz respeito à estrutura da polissemia. No que respeita à definição, torna-se necessário, primeiramente, distinguir a polissemia de dois outros fenómenos de ambiguidade lexical: a vaguidade 1 e a homonímia. No respeitante à vaguidade, e de um modo sucinto, este fenómeno refere uma falta de conteúdo informacional relativamente a diferentes especificações não dadas e neutralizadas no contexto. De um modo mais simples, ao contrário da polissemia, que respeita a uma variação de significados, a vaguidade respeita a uma variação dentro do mesmo significado. Por exemplo, estudante ou criança não são palavras polissémicas, mas vagas relativamente à informação sobre o sexo. Quando se opõe a polissemia à vaguidade, coloca-se a questão de precisar se um determinado valor semântico - ou uso - de uma palavra faz parte do conjunto de significados dessa palavra, ou se é o resultado de uma especificação contextual de um desses significados. Do ponto de vista metodológico, na determinação e delimitação dos vários significados de uma palavra, quais são os critérios que se devem utilizar na distinção entre diferentes significados e meras especificações contextuais? Relativamente à homonímia, esta distingue-se da polissemia por envolver diferentes significados com a mesma forma. Por outro lado, a polissemia envolve uma 1 Dada a diferente terminologia encontrada no que respeita a este tipo de ambiguidade, nomeadamente VAGUIDADE, VAGUEZA e INDETERMINAÇÃO, adoptou-se, neste trabalho, e no seguimento de Silva (1997) e Mendes (2001), o termo VAGUIDADE. 14
21 2. PROBLEMÁTICA mesma palavra com vários significados relacionados. Uma vez que o que caracteriza a polissemia, e a distingue da homonímia, é a relação existente entre os vários significados, a questão que se coloca, neste caso, é a de definir a natureza dessa relação. Será ela intuitivamente reconhecida pelos falantes? No que respeita à questão da estrutura do item polissémico, duas questões se afiguram importantes. Por um lado é necessário definir que tipos de relações unem os diferentes significados de um item lexical: apenas as relações baseadas em processos metafóricos e metonímicos, ou também fazem parte desse grupo outro tipo de relações, como as relações hierárquicas? Por outro lado, importa estabelecer como é que se distingue o significado-base e o significado derivado de um item polissémico POLISSEMIA E VAGUIDADE Têm sido propostos vários testes para a distinção entre polissemia e vaguidade, ou seja, para a distinção entre significados distintos e especificações - ou variações - contextuais de um mesmo significado. Geeraerts (1993) classifica estes testes em três tipos: lógicos, linguísticos e da definição 2. No entanto, todos estes testes parecem apresentar alguns problemas. O primeiro grupo diz respeito aos testes lógicos, primeiramente definidos por Quine (1960). Segundo o critério lógico dos valores de verdade, se uma asserção envolver uma palavra que pode ser simultaneamente verdadeira e falsa em relação a um mesmo referente, então essa palavra é polissémica. Um exemplo apresentado em Silva (1997: 613) diz respeito ao item café, que pode ter como significados fruto do cafezeiro e estabelecimento comercial onde se toma a respectiva bebida. A estrutura apresentada em (1) ilustra como, segundo o teste lógico, o item café é polissémico por denotar valores de verdade simultaneamente verdadeiros e falsos. 2 Não se consideram aqui os critérios de sinonímia, antonímia ou derivação morfológica, entre outros, a partir dos quais se considera que a existência de diferentes sinónimos, antónimos ou derivados morfológicos, em relação a um mesmo item lexical, são argumentos a favor da polissemia desse item. Trata-se de testes indirectos, na terminologia de Cruse (1986), que são insuficientes no que respeita à distinção entre polissemia e vaguidade e que levantam, muitas vezes, alguns problemas de aplicação e de interpretação. Estes critérios também podem levar ao tratamento homonímico de um item, mesmo quando é notória a relação entre os significados. 15
22 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (1) Delta é um café, e não um café. A frase é possível uma vez que café está a ser usado como fruto do cafezeiro, no primeiro caso, e como estabelecimento comercial, no segundo. Cruse (1986) acrescenta uma variação a este teste construindo asserções nas quais ambos os significados de uma palavra podem ser verdadeiros, mas não redundantes. (2) O João mudou a sua posição. A frase pode ser verdadeira no que respeita à mudança da localização física do sujeito no espaço ou à mudança do seu ponto de vista em relação a um determinado assunto. O segundo grupo de testes é de natureza linguística e consiste na existência de restrições semânticas no que respeita ao uso de diferentes significados de um item polissémico numa mesma estrutura. Este teste, também designado teste da identidade, foi primeiramente introduzido por Lakoff (1970) e baseia-se na assunção de que a coordenação de significados distintos produz frases zeugmáticas. Atente-se no seguinte exemplo: (3) a. *O João bebeu o café e o Manuel também entrou num. b. O João deixou o café e o Manuel também. A frase em (3a) ilustra como a coordenação dos significados distintos de café é inaceitável. Em (3b) só pode haver uma interpretação para o item café, ou seja, só são admissíveis as leituras em que tanto o João como o Manuel abandonaram ambos ou a bebida ou o estabelecimento comercial. A leitura cruzada em que o João abandona a bebida e o Manuel o estabelecimento, ou vice-versa, não é aceitável, o que mostra que esta é uma palavra polissémica, pois não admite coordenação de significados distintos. Os itens com o significado vago não produzem estruturas zeugmáticas em contextos de coordenação. Considerem-se os seguintes exemplos apresentados em Mendes (2001: 229). 16
23 2. PROBLEMÁTICA (4) a. A minha blusa era azul pastel, e a dela era azul forte. b. A minha blusa era azul e a dela também. A palavra azul, em (4b), constitui um caso de vaguidade e não de polissemia, uma vez que é permitida a coordenação deste item, mesmo que este apresente variações de significado (as blusas podem ser ambas azul pastel, azul forte, ou cada uma de um tom de azul diferente). No entanto, como se analisará pormenorizadamente no capítulo 5, este teste falha quando se verifica a aceitabilidade de estruturas com coordenação de diferentes significados de um item polissémico. Finalmente, o terceiro grupo de testes, informalmente apresentado por Aristóteles, contempla as definições. Segundo este teste, uma palavra é polissémica se mais do que uma definição for necessária para dar conta dos seus significados. Por exemplo, azul pastel e azul forte não representam duas definições, nem, consequentemente, dois significados de azul, uma vez que esses valores podem ser abrangidos por uma única definição: uma das cores do espectro solar que pode apresentar diversas gradações. No entanto, não existe uma definição maximamente genérica, i.e., que consiga abranger todo o conjunto de significados do item café: fruto do cafezeiro, bebida feita a partir do fruto do cafezeiro e estabelecimento comercial. Este teste também comprova que café é polissémico. Todavia, Geeraerts (1993) constata alguns casos em que a aplicação destes diferentes testes pode fazer previsões conflituosas. Se, por um lado, os três critérios convergem relativamente à polissemia do item café, pode acontecer que um item seja considerado polissémico segundo determinado(s) teste(s) e vago segundo outro(s). Os casos mais visíveis ocorrem com palavras como cão e jornal. No que respeita ao item cão - com os usos de canídeo e macho da cadela - este é polissémico de acordo com o teste lógico, como se pode ver em (5). (5) Layka é um cão, mas não é um cão. Contudo, segundo os critérios linguístico e da definição, os dois usos de cão representam um caso de vaguidade. Relativamente ao critério linguístico, são aceites 17
24 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS frases como a apresentada em (6), em que se exige uma identidade entre a semântica do item cão - com o significado de canídeo - e do elemento anafórico o. (6) O Pluto é um cão e a Layka também (o é). No que respeita ao critério da definição, é possível formular uma definição que cubra todos os significados do item cão: canídeo doméstico tanto macho como fêmea. Tal como acontece com cão, também com itens como jornal é possível obter resultados diferentes consoante os testes utilizados. Atente-se no seguinte exemplo: (7) O jornal decidiu reduzir o seu tamanho. Neste caso, o item jornal designa o conjunto de pessoas que encabeçam a organização, enquanto o elemento anafórico seu designa o objecto físico. De acordo com o teste linguístico, a aceitabilidade de (7) é um argumento a favor da interpretação de jornal como vago (relativamente a estes dois valores) e não polissémico. No entanto o item é polissémico de acordo com o teste da definição - uma vez que uma única definição não chega para cobrir todos os seus significados - e de acordo com o teste lógico, tendo em conta a não aceitabilidade de (8). (8) Os redactores são o jornal mas não são o jornal. A existência de resultados contraditórios dependendo do tipo de teste que se aplica mostra, segundo Geeraerts (1993), que a distinção entre polissemia e vaguidade, sendo uma distinção legítima e necessária, é instável e de limites não definidos. O que nalguns contextos pode apresentar-se como um caso de significados distintos pode, noutros contextos, tornar-se um caso de vaguidade e vice-versa. a oposição entre polissemia e vaguidade não constitui uma dicotomia estrita, mas antes um continuum. (...) Se de facto é difícil determinar os significados de uma palavra, então é porque os significados não são como as coisas, isto é, não são entidades que se possam delimitar, individualizar, contar, registar, encontrar, etc. (...) em vez de entendermos os significados como coisas, devemos entender a significação como um processo de criação de sentido. Metaforicamente falando, as palavras não são pacotes de informação 18
25 2. PROBLEMÁTICA (...); as palavras são antes, (...), holofotes que se movem e que, em cada aplicação efectiva, iluminam uma porção particular de todo o seu domínio de aplicação. (Silva, 1997: ) 2.3. POLISSEMIA E HOMONÍMIA O conceito de polissemia está estreitamente relacionado com o de homonímia, uma vez que ambos os conceitos denotam vários sentidos 3 que os itens lexical podem comportar. Tradicionalmente, a distinção entre polissemia e homonímia é baseada num critério diacrónico a partir do qual são consideradas palavras homónimas aquelas cujos significados resultem de étimos diferentes, tornados homógrafos e homófonos através da aplicação de vários processos linguísticos ao longo dos anos. Segundo esta distinção, temos como exemplos de itens homónimos os apresentados em (9) e (10) 4 : (9) camelo 1 - com o sentido de mamífero da fam. dos Camelídeos, de origem asiática, de grande porte, ruminante, com duas corcovas dorsais, muito utilizado como animal de carga nas regiões áridas, proveniente etimologicamente do grego kámelos, pelo latim camelu-. camelo 2 - com o sentido de corda grossa, proveniente etimologicamente do grego kámilos. (10) pena 1 - com os sentidos de castigo; punição; desgosto; tristeza; dor; aflição, proveniente etimologicamente do latim poena-. pena 2 - pena 3 - com os sentidos de cada um dos órgãos cutâneos que revestem o corpo das aves (...), proveniente etimologicamente do latim penna-. com o sentido de rocha, fraga, fraguedo, proveniente do latim pinna- ou penna-. 3 No seguimento de Mendes (2001) também neste trabalho se adopta o termo sentido quando não é referido um tipo específico de pluralidade de sentidos, uma vez que este termo pode abranger tanto variações de um mesmo significado, como variações que correspondem a diferentes significados. 4 Exemplos retirados do Dicionário da Língua Portuguesa, Porto Editora, 8ª Edição. 19
26 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS No entanto, para além da dificuldade por vezes encontrada em precisar com segurança a etimologia de um item lexical, tem vindo a impor-se como um problema proeminente a determinação das semelhanças e das diferenças existentes entre os significados que um determinado item pode assumir. Em consequência, polissemia e homonímia distinguem-se usualmente com base em critérios semânticos sincrónicos, nomeadamente na existência ou não de uma relação entre os vários significados do item em questão. It came to be understood that systematic polysemy senses that are systematically related and therefore predictable over classes of lexical items is fundamentally different from homonymy senses that are unrelated, non-systematic and therefore not predictable. (Buitelaar, 1998:2) Mais concretamente, um item lexical é considerado polissémico se os diferentes significados que comporta estiverem semanticamente relacionados. Por outro lado, a homonímia ocorre quando a uma mesma forma estão associados acidentalmente significados distintos e não relacionados 5. Para ilustrar a distinção entre estes dois conceitos, considerem-se os exemplos de homonímia apresentados em (11) e (12), em contraste com os casos de polissemia apresentados em (13) e (14): (11) a. O Carlos sentou-se num banco. b. Nenhum de nós tem conta no banco. (12) a. O tribunal decretou uma pena de 10 anos de prisão. b. O piriquito arrancou uma pena da asa. (13) a. Este banco foi fundado em b. A loja que procuras fica ao lado do banco que construíram há pouco tempo. 5 Apresentando uma terminologia diferente, Weinreich (1964) defende que a ambiguidade pode ser de natureza contrastiva ou complementar. Os significados contrastivos são desprovidos de qualquer relação (o mesmo que homonímia), enquanto os significados complementares se encontram relacionados de modo sistemático (o mesmo que polissemia regular, definida mais adiante). 20
27 2. PROBLEMÁTICA (14) a. O João entrou pela janela. b. O João pintou a janela. De facto, parece consensual que não existe qualquer relação entre os significados de banco - peça de mobiliário e instituição financeira, em (11a) e (11b), respectivamente. O mesmo acontece com os significados de pena - castigo e órgão que reveste o corpo das aves, em (12a) e (12b), respectivamente. Em contrapartida, os significados de banco - instituição financeira, em (13a), e edifício onde a instituição financeira se localiza, em (13b), encontram-se sistematicamente relacionados. Do mesmo modo, também é possível estabelecer uma relação entre os significados de janela, em que o significado de abertura na parede, em (14a), se encontra sistematicamente relacionado com o significado de objecto que serve para tapar a abertura na parede, em (14b). Um outro aspecto importante a realçar é o facto de a relação existente entre os significados dos nomes polissémicos ser sistemática, ou seja, parece existirem classes de nomes que partilham a capacidade de exprimir conceitos da mesma ordem. Deste modo, podemos encontrar o mesmo tipo de relação entre os significados presentes em banco em nomes como escola, bem como podemos encontrar o mesmo tipo de relação entre os significados presentes em janela em nomes como porta. (15) a. Esta escola foi fundada em b. A loja que procuras fica ao lado da escola que construíram há pouco tempo. (16) a. O João entrou pela porta. b. O João pintou a porta. Uma definição interessante do conceito de polissemia denominada regular (Apresjan, 1973) ou sistemática (Ostler & Atkins, 1992, Copestake & Briscoe, 1992, 1995) ou, ainda, lógica (Pustejovsky, 1995a) 6, pode ser encontrada em Apresjan (1973), e é aqui reproduzida 7 : 6 O autor utiliza o termo Polissemia Lógica definindo-o como um tipo de ambiguidade complementar (no seguimento de Weinreich, 1964), onde não ocorre qualquer alteração da categoria sintáctica do item lexical, contrapondo-a aos casos em que existe tal alteração. (i) a. John crawled through the window. b. The window is closed. 21
28 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS Polysemy of the word A with the meanings a i and a j is called regular if, in the given language, there exists at least one other word B with the meanings b i b j, which are semantically distinguished from each other in exactly the same way as a i and a j and if a i and b i, a j and b j are nonsynonymous. Polysemy is called irregular if the semantic distinction between a i and a j is not exemplified in any other word of the given language. Em suma, segundo o autor, a polissemia é irregular se a relação semântica existente entre os significados de um item lexical for exclusiva desse item (tornando-o um caso isolado dentro da sua classe), sendo a referência a vários significados distintos considerada acidental. Por outro lado, a polissemia é regular (termo adoptado neste trabalho) se o tipo de distribuição existente entre os significados de um item lexical for comum a outros itens da mesma classe, tornando o fenómeno regular e previsível. O autor observa ainda que a polissemia regular se baseia na maior parte das vezes na relação de metonímia existente entre os itens lexicais POLISSEMIA E CONTEXTO One of the central problems of lexical semantics is the sensitivity of word meaning to context. (Cruse, 2000: 30) Dada a sensibilidade do significado dos itens lexicais relativamente ao contexto importa questionar como é que, num plano linguístico, os diversos significados podem ser captados. We do not think that it is possible to define a real theory of sense delimitation, but it is certainly possible to define a few principles or a strategy. (Saint-Dizier, 1998a: 122) (ii) a. If the store is open, check the price of the coffee. b. Zac tried to open his mouth for the dentist. No presente trabalho também só serão tratados casos de polissemia como os apresentados em (i), i.e., sem alteração de categoria sintáctica. 7 Apud Buitelaar (1998: 16). 22
29 2. PROBLEMÁTICA É prática corrente definir o significado básico dos itens lexicais independentemente do contexto, estabelecendo posteriormente princípios de acordo com os quais, num contexto particular, os significados dos vários itens interagem entre si. A questão central consiste em encontrar os aspectos do significado de um item que são prédefinidos e invariantes através dos contextos e os aspectos que só se realizam em determinado contexto. As abordagens existentes são divergentes no que respeita a esta questão. Wierzbicka (1996) e Goddard (2000), entre outros, consideram que os itens lexicais têm o máximo de conteúdo semântico. Os autores propõem um método de definição lexical denominado Natural Semantic Metalanguage NSM através do qual todo o significado de uma expressão semântica (seja um item lexical ou uma expressão gramatical) é captado através de uma paráfrase (ou explicação), construída numa metalinguagem baseada em primitivos semânticos 8. A NSM assenta em duas premissas fundamentais: (i) toda a análise semântica deve ser definida numa língua natural e não em formalismos técnicos ou símbolos lógicos, uma vez que estes não são suficientemente explícitos até serem explicados numa língua natural; (ii) todo o significado de uma expressão semântica deve poder ser captado em termos de uma paráfrase ou expressão equivalente. A possibilidade de substituir qualquer expressão semântica por uma paráfrase em todas as suas ocorrências contextuais permite sustentar que o significado de um item está devidamente lexicalizado.... every language must have an irreducible semantic core consisting of a mini-lexicon of indefinable words (a.k.a. semantic primes ) and a mini-syntax governing how they can be combined. ( ) In the NSM system, the meaning of a semantically complex expression (be it a word or a grammatical construction) is described by means of an explanatory reductive paraphrase (an explication ) framed entirely within the semantic metalanguage. (Goddard, 2000: ) 8 A proposta de Goddard (2000) surge no seguimento de trabalhos inseridos no âmbito de uma perspectiva tradicional, como Wierzbicka (1996). Segundo a autora, os significados das palavras podem ser decompostos num número finito de primitivos semânticos universais, chamados primes. Após cerca de trinta anos de investigação em vários domínios semânticos foram identificados cerca de sessenta primes. No entanto, a hipótese de que o significado lexical pode ser reduzido a um número finito de primitivos é fortemente contestada. 23
30 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS Numa outra perspectiva, Schütze (2000) defende que os itens lexicais não têm conteúdo semântico, mas apenas semelhanças semânticas com outros itens lexicais. O autor propõe um algoritmo de desambiguação de palavras que agrupa contextos semanticamente semelhantes com base em contagens de palavras semelhantes que coocorrem com determinadas palavras num corpus. The more neighbours two words have in common, the more similar they are. The more similar words appear in two contexts, the more similar the two words are. (Schütze, 2000: 208) De acordo com o autor, o significado de um item lexical não está lexicalizado. O significado é simplesmente um conjunto de ocorrências com contextos semelhantes. A contextual representation of a word is knowledge of how that word is used. ( ) Two occurrences of an ambiguous word belong to the same sense to the extent that their contextual representations are similar. (Schütze, 2000: 216) Alguns modelos computacionais apresentam sistemas de delimitação de sentidos tão extremos como os anteriores. Alguns léxicos estruturados distinguem cada sentido consoante o uso - ou contexto - do item lexical, o que resulta numa proliferação de sentidos. Uma abordagem deste tipo é bastante útil na medida em que fornece uma descrição detalhada sobre o uso de várias palavras de uma língua. No entanto, esta abordagem não permite dar conta de certas generalizações da língua, que são de extrema utilidade em sistemas de PLN. No outro extremo, alguns sistemas de Inteligência Artificial postulam a existência de um único significado para um item lexical. Processos complexos de derivação produzem os diferentes significados. As abordagens deste tipo têm como motivação principal o modo de representação de um determinado item lexical, relegando para segundo plano o uso da língua. Outra proposta interessante é a de Cruse (1986: 50-54) que defende que o contexto pode afectar a semântica de um item lexical de duas maneiras. O autor distingue entre o que designa por MODULAÇÃO CONTEXTUAL de um único significado, por um lado, e SELECÇÃO CONTEXTUAL de significados, por outro. O primeiro caso é entendido como a variação induzida pelo contexto de modo a dar mais ou menos ênfase a determinados traços semânticos do significado de uma palavra, enquanto o segundo refere a selecção de um significado particular de entre outros que um item lexical possui. 24
31 2. PROBLEMÁTICA... a single sense can be modified in an unlimited number of ways by different contexts, each context emphasising certain semantic traits, and obscuring or suppressing others ( ). This effect of a context on an included lexical unit will be termed modulation ( ). The second manner of semantic variation concerns the activation by different contexts of different senses associated with ambiguous word forms. This will be termed contextual selection (of senses) ( ). (Cruse,1986: 52) Atente-se nos seguintes exemplos: (17) a. O carro precisa de ir à revisão. (mecânica) b. O carro precisa de ser lavado. (carroçaria) (18) a. O quarto está pintado com uma cor leve. (clara) b. O João fez uma refeição leve. (ligeira) Segundo o autor, frases como as de (17) são consideradas casos de modulação contextual, uma vez que são referidos diferentes aspectos de carro, ou seja, diferentes traços semânticos do significado de carro: a mecânica e a carroçaria. Não se assume que carro refere diferentes entidades em ambas as frases. Os diferentes aspectos do item podem ser activados simultaneamente. (19) O carro precisa de ser lavado e de ir à revisão. A estrutura em (19) é semanticamente aceitável, ainda que diferentes aspectos de carro estejam a ser referidos por cada um dos verbos. Por outro lado, as frases em (18) apresentam casos de selecção contextual, uma vez que só um significado de leve é seleccionado em cada caso. Os diferentes significados não podem ser activados em simultâneo. (20) *O João fez uma refeição leve e tem o quarto pintado da mesma maneira. No entanto, a distinção de Cruse entre selecção e modulação contextuais vai ao encontro da distinção entre polissemia e vaguidade, apresentada anteriormente, 25
32 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS pressupondo uma separação estável entre estes dois tipos de ambiguidade. Segundo o autor, o contexto ou selecciona um significado particular de um dado item, ou modula um significado particular de um item. No entanto, como já se referiu anteriormente, o que num determinado contexto pode ser considerado uma variação de um determinado significado, noutro contexto pode passar a constituir significados distintos. Se nos exemplos (17) e (19) as variações do significado de carro - mecânica e carroçaria - são compatíveis, encontrando-nos, de facto, perante um caso de modulação contextual de um mesmo significado, contextos há em que esses dois aspectos podem tornar-se incompatíveis. Considerando um carro velho (na sucata), sem componentes mecânicas, bancos e algumas rodas, este pode ser considerado um carro no que respeita à sua forma e alguma constituição, mas já não é um carro no que respeita à sua função. De acordo com o teste lógico, o exemplo em (21) ilustra que o item carro pode ser, neste contexto particular, polissémico por permitir denotar valores de verdade simultaneamente verdadeiros e falsos. (21) Isto é um carro mas já não é um carro. O que esta reflexão ilustra é que o contexto pode seleccionar um significado de entre outros que a palavra tenha e modular um mesmo significado, ou seja, realçar determinados traços semânticos de um único significado. No entanto, o contexto também pode tornar incompatíveis variações de um mesmo significado, passando a constituir significados diferentes e vice-versa. Um exemplo extremo é a compatibilização de significados de palavras homónimas que se podem transformar em variações de um mesmo significado. Daddy, what exactly do you call a bank: the place where we moor the boat or the place where I bring my savings? - Well, son, the place where we moor the boat is a bank, but so is the place where you bring your savings. (Geeraerts, 1993: 245) O contexto influencia a interpretação do significado de um item lexical, funcionando quer como elemento selectivo quer como elemento criador da sua semanticidade, constituindo, consequentemente, um componente importante na sua desambiguação. 26
33 2. PROBLEMÁTICA A polissemia é um fenómeno contextual na medida em que o contexto pode conduzir à interpretação particular de um dado valor semântico do item lexical. No entanto, e apesar das várias influências contextuais, nem todos os valores semânticos de um item lexical são o resultado exclusivo do contexto, ou seja, defende-se a existência de propriedades semânticas independentes do contexto.... although in principle word meaning may be regarded as infinitely variable and context sensitive, there are nonetheless regions of higher semantic density ( ), forming, as it were, more or less well-defined lumps of meaning with greater or lesser stability under contextual change. (Cruse, 2000: 30) 2.5. POLISSEMIA NAS CATEGORIAS SINTÁCTICAS Centrando-nos no fenómeno particular de polissemia regular - que pressupõe uma determinada relação semântica entre os significados de um item lexical, tornando-se, essa relação, sistemática e previsível na medida em que abrange toda uma classe de palavras as próximas três secções focarão os tipos de relações existentes nas três principais categorias sintácticas em que se pode observar itens com comportamento polissémico nominal, verbal e adjectival POLISSEMIA NOMINAL No seguimento das alternâncias nominais consideradas em Pustejovsky (1995a), analisemos agora, para o português, alguns casos de polissemia regular nominal, em que os significados se encontram relacionados entre si de forma sistemática e previsível. 27
34 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS INSTITUIÇÃO EDIFÍCIO CONJUNTO DE PESSOAS Retomemos as alternâncias apresentadas em (13), aqui renumeradas como (22): (22) a. Este banco foi fundado em b. A loja que procuras fica ao lado do banco que construíram há pouco tempo. Como se verificou anteriormente, a alternância entre o significado de banco - instituição financeira - e o de banco - edifício - patentes em (22a) e (22b), respectivamente, é extensível a todos os nomes que, a par de banco, denotem uma entidade abstracta com carácter organizativo, por um lado, e uma edificação, por outro. Apresentam esta alternância nomes como escola, faculdade, fábrica, empresa, editora, clínica, jornal 9, escritório, secretaria, entre outros. Note-se, ainda, uma terceira acepção destes itens que consiste na capacidade que estes nomes têm em denotar uma ou mais entidades com carácter [+volitivo], pertencentes a essa instituição, como ilustram os seguintes exemplos: (23) a. A fábrica manifestou-se contra o reduzido aumento salarial. b. A escola secundária de Sacavém saiu para a rua em protesto contra a abolição do ensino nocturno. c. A empresa aplaudiu a decisão da direcção. ABERTURA OBJECTO FÍSICO (24): Recordem-se, agora, os exemplos apresentados em (14), aqui renumerados como (24) a. O João entrou pela janela. b. O João pintou a janela. 9 O item jornal apresenta dois tipos de alternância: (i) instituição/edifício/conjunto de pessoas; (ii) informação/objecto físico (caracterizada mais adiante). A sua complexidade vai ser objecto de estudo mais detalhado no capítulo 5. 28
35 2. PROBLEMÁTICA Neste caso, é expressa uma alternância de significado entre abertura e objecto físico - (24a) e (24b), respectivamente - que se pode encontrar em nomes que partilhem as mesmas propriedades semânticas que janela, como porta, portada, escotilha, entre outros. CONTINENTE CONTEÚDO Atente-se nos seguintes exemplos: (25) a. A Joana partiu o copo. b. Vamos beber um copo com os amigos. A alternância entre continente e conteúdo, presente em (25a) e (25b), respectivamente, exprime a propriedade que todos os nomes que denotam receptáculos têm de denotarem quer o continente, quer, metonimicamente, o conteúdo desse continente. OBJECTO FÍSICO INFORMAÇÃO Relativamente à alternância de significados existente em nomes como livro, que tanto podem ser interpretados como objecto físico - (26a) - ou informação contida no objecto físico - (26b) - esta é extensível a nomes como revista, jornal, carta, artigo, relatório, resumo, tese, exame, dissertação, cassete. (26) a. O Duarte pousou o livro. b. Este livro é muito divertido. 29
36 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS ANIMAL COMIDA A alternância entre as interpretações contável (entidade) e massiva (substância) em que participam nomes que denotam animais encontra-se representada nos exemplos em (27). (27) a. O cabrito foi amamentado por biberão. b. A Maria comeu cabrito ao jantar. Sendo um caso de polissemia regular, todos os nomes que denotam animais deveriam permitir esta alternância de significados 10. No entanto, é aceitável a existência de um subconjunto de animais que são mais facilmente vistos como fontes de alimento. O uso ou não de certos nomes de animais com o significado de massivo parece depender de critérios sociais e pragmáticos. (28) a. A Catarina foi à Coreia e comeu cão. b. A semana passada provei escaravelho. São, igualmente, critérios pragmáticos que estão na base da estranheza, ou mesmo da não aceitação de frases como as apresentadas em (29). O significado massivo está normalmente associado ao masculino, com algumas excepções, como é o caso de vaca, ainda que, em algumas regiões, boi apresente também uma lexicalização para o significado de comida - (29e) Línguas como o Inglês e o Francês apresentam algumas lexicalizações específicas para o significado de comida que, normalmente, não são utilizadas com o significado de animal, ainda que tal possa acontecer em registos dialectais ou familiares. (1) a. John has a cow/ox/bull. (animal) b. We had a join of roast beef for lunch on Sunday. (comida) (2) a. Pigs are often kept in a farm. (animal) b. Mary doesn t eat pork. (comida) (3) a. La guerre consist uniquement à voler des poules et des cochons aux villains. (animal) b. Les musulmans et les israelites ne mangent pas de porc. (comida) 11 Contrariamente ao Português em que ocorre a lexicalização de vaca (feminino) para o significado de comida, o Francês apresenta, para o mesmo significado, a lexicalização do masculino boeuf. (1) a. C est une vache normande. (animal) b. Les boeufs attelés aux pesantes charrettes. (animal) 30
37 2. PROBLEMÁTICA (29) a. *A minha vizinha come porca todos os dias. b.??*o jantar vai ser ovelha estufada. c.??*a cabrita estava saborosa. d.??*ontem comi touro/boi ao jantar. e. O ano passado fui a um restaurante no Porto e comi boi com ervilhas. ÁRVORE - MADEIRA Outra alternância entre as interpretações contável e massiva diz respeito aos nomes de árvores, que podem ser sistematicamente interpretados quer como a própria planta, por um lado, quer como a sua madeira, por outro, como se pode ver pelos exemplos em (30). (30) a. A minha avó tem uma cerejeira no quintal. b. Comprei um móvel em cerejeira. Uma excepção ocorre com a lexicalização de pinho para a substância proveniente da entidade pinheiro. PEDRA PRECIOSA MINERAL É também sistemática a relação existente entre o significado de pedra preciosa (contável) e o de mineral (massivo). É o caso de diamante, rubi, safira, esmeralda, jade, topázio, ametista, ágata, entre outros. (31) a. O anel de noivado da Lurdes tem um diamante. b. Muitas ferramentas industriais são construídas a partir de diamante. (2) a. *Je ne mange pas de vache. (comida) b. Je ne mange pas de boeuf. (comida) 31
38 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS METAL ELEMENTO Existe, igualmente, uma relação sistemática entre o significado de metal e o de elemento, presente em nomes como ferro, cobre, prata, ouro, platina, estanho, chumbo, alumínio, níquel e zinco. (32) a. As janelas eram gradeadas com um ferro ao meio. b. O ferro pode ser encontrado sob quatro formas cristalizadas. LOCAIS CONJUNTO DE PESSOAS Os nomes que denotam locais também podem alternar entre o significado locativo e o significado que denota a população desse lugar, como se verifica em (33). (33) a. A cidade é mais bonita à noite. b. A cidade manifestou-se contra o presidente da Câmara. OBJECTO - EVENTO Nomes como almoço, jantar, banquete, refeição são sistematicamente ambíguos entre a interpretação de alimento e o evento que lhe está associado, como se pode observar a partir dos exemplos em (34). (34) a. O almoço estava saboroso. b. O almoço foi divertido. 32
39 2. PROBLEMÁTICA PROCESSO RESULTADO Um último exemplo de alternâncias diz respeito a nomes deverbais que podem manifestar tanto uma interpretação de processo, como o estado resultante desse processo. Nomes como construção, destruição, tradução, análise, demonstração, entre outros, permitem esta alternância, como se pode ver pelos exemplos em (35) e (36), apresentados em Lopes (1996: 18-19). (35) a. A construção da barragem pela EDP demorou mais tempo do que o previsto. b. A construção da barragem alterou irremediavelmente a paisagem. (36) a. A tradução das Minas de Salomão por Eça de Queirós demorou mais de um ano. b. A tradução das Minas de Salomão de Eça de Queirós continua a ser lida com agrado. Note-se que, enquanto resultado, nomes como tradução, análise ou demonstração apresentam ainda a alternância entre as interpretações de informação e objecto físico, já referida anteriormente para nomes como livro. (37) a. A tradução das Minas de Salomão por Eça de Queirós está bem feita. b. Ontem comprei a tradução das Minas de Salomão de Eça de Queirós. (38) a. A análise de Hernâni Cidade dos Lusíadas é muito interessante. b. A análise de Hernâni Cidade dos Lusíadas está em cima da mesa. As alternâncias nominais apresentadas em (35) e (36) ocorrem somente com nomes deverbais, que, por se encontrarem relacionados com os verbos dos quais derivam, deixam transparecer as suas propriedades sintácticas e semânticas. Nos casos em questão os nomes pressupõem o mesmo tipo de evento denotado pelo predicado verbal ao qual estão associados. 33
40 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS POLISSEMIA VERBAL Os itens verbais também podem apresentar comportamentos polissémicos. Nesta secção descrevem-se dois tipos de comportamento que os verbos polissémicos podem apresentar: (i) a alternância causativa/incoativa; (ii) a possibilidade de selecção de diferentes tipos de complemento. (i) ALTERNÂNCIA CAUSATIVA/INCOATIVA No que respeita ao estudo das alternâncias verbais, destaca-se aqui o trabalho de Levin (1993), para o Inglês, que agrupa estes itens em classes semânticas de acordo com o seu comportamento sintáctico, i.e., de acordo com os argumentos que seleccionam 12. Das alternâncias verbais consideradas, importa aqui salientar a alternância causativa/incoativa. Os predicados designados causativos caracterizam-se por poderem ocorrer tanto em estruturas transitivas como em estruturas ergativas. No entanto, em ambas as estruturas, os significados encontram-se relacionados através de um traço de causalidade, podendo considerar-se os verbos em causa como polissémicos. Considerem-se os seguintes exemplos: (39) a. A Maria ferveu a sopa. b. A sopa ferveu. (40) a. O João partiu o copo. b. O copo partiu-se. c. O copo partiu. 12 Acerca das comummente denominadas alternâncias gramaticais (i.e. contextos sintácticos distintos), Pustejovsky (1995a) argumenta que a participação de um verbo numa determinada alternância gramatical não é suficiente para determinar a sua classe semântica. Só se pode explicar o comportamento de uma determinada classe semântica se se assumir que os diferentes padrões sintácticos de uma dada alternância não são independentes da informação contida nos argumentos envolvidos nessa alternância. De um modo mais simples, a diversidade relativamente ao tipo de complementos que um verbo - ou outra categoria sintáctica - pode seleccionar é em grande parte determinada pela semântica dos próprios complementos. 34
41 2. PROBLEMÁTICA (41) a. O submarino afundou o barco. b. O barco afundou-se. c. O barco afundou. Do ponto de vista sintáctico, nos exemplos em (39a), (40a) e (41a) os verbos ferver, partir e afundar são transitivos, seleccionando um complemento com a função sintáctica de objecto directo. No entanto, como se pode observar a partir dos exemplos em (39b), (40b, c) e (41b, c), o mesmo verbo pode ocorrer numa construção ergativa. Esta alternância pode ser vista como um caso de polissemia lógica, na medida em que se considera a existência de uma relação de causalidade entre as duas construções. De facto, parece consensual que os significados presentes em (39a), (40a) e (41a) pressupõem os significados presentes em (39b), (40b, c) e (41b, c). Importa salientar que as construções ergativas em (40) e (41) diferem de (39), na medida em que, em termos sintácticos, verbos como partir e afundar apresentam preferencialmente o clítico denominado se ergativo 13 (muitos falantes atribuem um maior grau de aceitabilidade a estruturas com o clítico do que a estruturas sem o clítico). A questão do significado, ou ausência de significado, do clítico se ergativo apresenta um elevado grau de complexidade e não constitui objecto de estudo deste trabalho. Contudo, Berkeley Cotter (2002) apresenta algumas hipóteses sobre esta questão: Em Português existe a possibilidade de um verbo pertencente ao PCD [Paradigma Causativo por Defeito] ser [+se] ou [-se]. A distinção passa pela possibilidade de o argumento interno poder ser, ou não, co-indexado com a causa, visto o clítico [+se] implicar agentividade. (Berkeley Cotter, 2002: 87) 14 (ii) POSSIBILIDADE DE SELECÇÃO DE DIFERENTES TIPOS DE COMPLEMENTO Ainda dentro da classe dos verbos causativos, os predicados aspectuais começar e acabar apresentam um comportamento polissémico, na medida em que, do ponto de vista sintáctico, permitem a selecção de diferentes tipos de complementos. Considerem-se os seguintes exemplos, apresentados em Berkeley Cotter (2002: 58): 13 Mateus et alii (1989: ) 14 Para uma abordagem mais aprofundada sobre este assunto veja-se Berkeley Cotter (op. cit.: 63-87). 35
42 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (42) a. A Sónia começou o livro. b. A Sónia começou a ler o livro. c. A Sónia começou a escrever o livro. (43) a. O Pedro acabou a cerveja. b. O Pedro acabou de beber a cerveja. No entanto, outros predicados que não os causativos podem ocorrer em diversos quadros sintácticos. É o caso de querer, como se pode observar pelos exemplos em (44) e (45). um bolo. um cigarro. (44) O João quer uma cerveja. um livro. um filme. comer um bolo. fumar um cigarro. (45) O João quer beber uma cerveja. ler/escrever um livro. ver um filme. Como se verá pormenorizadamente no próximo capítulo, para explicar o comportamento polissémico deste tipo de verbos, Pustejovsky (1995a) propõe a existência de mecanismos generativos que permitem uma interacção entre o verbo e o seu argumento interno. 36
43 2. PROBLEMÁTICA POLISSEMIA ADJECTIVAL No que respeita à função do adjectivo, este é caracterizado por denotar um determinado estado relativamente ao nome que modifica. No seguimento da terminologia adoptada por Casteleiro (1981), do ponto de vista sintáctico os adjectivos são classificados como predicativos e não predicativos. Relativamente aos adjectivos predicativos - como alegre, bonito, calmo, alto - estes caracterizam-se essencialmente, segundo o autor, por poderem ocorrer em frases com as propriedades contextuais ou distribucionais que se podem observar a partir dos exemplos em (46) 15. (46) a. Adoro as paisagens calmas. (propriedade pós-nominal) b. Adoro as calmas paisagens. (propriedade pré-nominal) c. Adoro as paisagens muito calmas. (propriedade de grau) d. Adoro as paisagens que são calmas. (propriedade predicativa) Por outro lado, os adjectivos não predicativos como campestre, citadino, municipal, rural - não podem ocorrer em estruturas com as propriedades distribucionais supra referidas, como se pode verificar pelos exemplos em (47) 16. (47) a. Adoro as casas rurais. b. *Adoro as rurais casas. c. *Adoro as casas muito rurais. d.?*adoro as casas que são rurais. 15 Exemplos retirados de Casteleiro (op. cit.:53). 16 Na gramática tradicional a terminologia adoptada pode variar. Contrariamente a Casteleiro (1981), alguns autores classificam os adjectivos que se encontram na posição predicativa como atributivos, uma vez que exprimem um atributo do sujeito, enquanto os adjectivos em posição adnominal são designados epítetos. Outros estudiosos, como Demonte (1999), classificam os adjectivos como atributivos na posição adnominal e predicativos na posição predicativa. A designação de adjectivo atributivo torna-se assim ambígua, uma vez que, enquanto para alguns autores corresponde à posição predicativa, para outros corresponde à posição adnominal. Note-se, porém, que alguns adjectivos podem ocorrer tanto em posição adnominal como em posição predicativa... casi todos los adjetivos que funcionan como predicados en oraciones copulativas caracterizadoras pueden ser también modificadores. No todos los adjetivos modificadores, empero, concurren en posiciones predicativas... (Demonte (1999: 133)). 37
44 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS Em Português, muitos adjectivos predicativos estão associados a significados diferentes, conforme ocupam a posição pré-nominal ou pós-nominal. (48) a. Ele encontrou o seu amigo rico. b. Ele encontrou o seu rico amigo. (49) a. A Maria é uma rapariga pobre. b. A Maria é uma pobre rapariga. Na posição pós-nominal - (48a) e (49a) os adjectivos têm um valor objectivo, também designado sentido próprio, e podem ser introduzidos por uma frase relativa, sem qualquer alteração do seu significado. (50) a. Ele encontrou o seu amigo que é rico. b. A Maria é uma rapariga que é pobre. Na posição pré-nominal (48b) e (49b) os adjectivos têm um valor subjectivo, avaliativo, e o seu valor semântico não pode ser obtido a partir de frases relativas. Crisma (1990) designa os adjectivos em posição pré-nominal como apositivos. A sequência [Adj N] é considerada uma sequência enfática que permite expressar a opinião do locutor e a sua atitude relativamente ao objecto designado pelo nome ao qual o adjectivo está associado. Em contrapartida, os adjectivos em posição pós-nominal são denominados restritivos, pois restringem o universo denotado pelo nome que modificam. A sequência [N Adj] é considerada a ordem canónica. No entanto, a alteração de sentido mencionada não ocorre com todos os adjectivos predicativos, sendo indiferente, do ponto de vista do seu valor semântico, que se encontrem em posição pré-nominal ou em posição pós-nominal. (51) a. um livro bom b. um bom livro (52) a. uma bonita rapariga b. uma rapariga bonita 38
45 2. PROBLEMÁTICA A relação entre os adjectivos apositivos e restritivos e/ou predicativos e não predicativos constitui um problema extremamente complexo e não faz parte do objecto de estudo deste trabalho 17. O que se pretende realçar nesta secção é o facto de algumas classes de adjectivos predicativos poderem apresentar comportamentos polissémicos dependendo do nome que modificam e da posição que ocupam na estrutura frásica. Trabalhos que se debruçam sobre o estudo dos adjectivos, como Bouillon (1996, 1997, 1999), observam que esta categoria, a par das já analisadas, também apresenta um comportamento polimórfico, exprimindo significados diferentes em função dos contextos nos quais ocorre. A autora defende que o carácter polimórfico dos adjectivos pode ter uma origem semântica ou sintáctica. No que respeita à origem semântica esta pode estar relacionada com a semântica do próprio adjectivo, com a semântica do nome com o qual co-ocorre ou com a semântica resultante da composição destas duas categorias. (53) Polimorfismo Adjectival Semântico Sintáctico Semântica do Adj Semântica do N Composição N-Adj 1. POLIMORFISMO SEMÂNTICO (i) SEMÂNTICA LEXICAL DO ADJECTIVO Bouillon (1997) defende que alguns adjectivos apresentam alternâncias sistemáticas, como se ilustra em (54) e (55). (54) a. Eu estou triste. b. Este livro é triste. c. Hoje foi um dia triste. 17 Para uma abordagem aprofundada sobre este assunto veja-se Casteleiro (op. cit.: 52-66). 39
46 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (55) a. Ele é inteligente. b. A sua argumentação é inteligente. O adjectivo psicológico em (54), tal como alegre ou divertido, entre outros, pode alternar entre a interpretação de experienciador como em (54a), em que o sujeito expressa um estado de tristeza e a interpretação causativa, em que se faz referência à causa de certo estado como em (54b, c), em que o livro/dia causa tristeza. No que respeita ao adjectivo em (55), ou ainda hábil ou ingénuo, entre outros, este pode denotar quer uma qualidade de um indivíduo (55a) - quer a manifestação dessa qualidade - (55b). (ii) SEMÂNTICA LEXICAL DO NOME Há contextos em que o adjectivo pode apresentar um número infinito de significados, dependendo do nome que modifica. Considere-se, primeiramente, o adjectivo bom, analisado em Saint-Dizier (1999) como sendo um dos adjectivos mais polissémicos no Francês. No caso do Português, este é igualmente um dos adjectivos mais polissémicos. Os seguintes exemplos são retirados do DLPC 18. (56) a. A fruta já não está boa. (que está são ou em perfeito estado) b. Um bom livro. (que está bem concebido) c. Um bom investimento. (que traz vantagens) d. É bom passear pela cidade. (que dá prazer) e. Uma boa caldeirada. (que é agradável ao paladar ou ao olfacto) f. Um remédio bom para as dores de dentes. (que tem as qualidades necessárias a um determinado fim) g. Um problema bom de resolver. (que se faz com facilidade) h. Uma pessoa boa. (que apresenta qualidades morais) i. Um bom médico. (que desempenha bem as suas funções) 18 Dicionário da Língua Portuguesa Contemporânea, Academia das Ciências de Lisboa/Editorial Verbo,
47 2. PROBLEMÁTICA j. Esperou uma boa hora e ninguém apareceu. (que indica uma quantidade) k. Uma boa bofetada. (que é forte, intenso, violento) l. se o virem chegar com bom fato, bom chapéu, boa corrente de ouro, não o tomarão por qualquer peneira, (...) (que se distingue pela qualidade) m. Precisa-se de uma boa faca. (que tem as qualidades que se esperam, de acordo com a sua natureza ou função) O mesmo fenómeno de proliferação de significados está presente em adjectivos como rápido ou difícil, como se pode verificar pelos exemplos em (57) e (58). (57) a. um desporto rápido (que envolve movimentos rápidos) b. um carro rápido (que permite que seja conduzido rapidamente) c. uma dactilógrafa rápida (que dactilografa rapidamente) d. um livro rápido (que se lê rapidamente) (58) a. Este é um texto difícil. (de compreender) b. O Pedro é uma criança difícil. (de educar) c. Esta é uma vida difícil. (de viver) Os adjectivos pertencentes a uma mesma classe semântica 19 podem apresentar algumas semelhanças no que respeita ao comportamento polissémico. Podem encontrar- 19 Para além das classes determinadas a partir do comportamento sintáctico dos adjectivos, estes também podem ser distinguidos tendo em conta o seu significado. Dixon (1991) propõe o estabelecimento das seguintes classes: DIMENSÃO (grande, pequeno, largo, comprido, curto); PROPRIEDADE FÍSICA (duro, macio, pesado, leve); COR (vermelho, verde, amarelo); PROPRIEDADE HUMANA (ciumento, feliz, orgulhoso, cruel); IDADE (jovem, velho, novo); VALOR (bom, mau, excelente, delicioso); VELOCIDADE (rápido, lento); DIFICULDADE (difícil, fácil); SEMELHANÇA (parecido, semelhante); QUALIFICAÇÃO (possível, provável). A par da classificação anterior, Demonte (1999) propõe uma divisão dos adjectivos qualificativos (segundo a classificação da autora, os adjectivos qualificativos expressam uma propriedade que se refere à constituição do nome que modificam - cor, forma, idade, etc.), estabelecendo sete classes: DIMENSÃO, VELOCIDADE, PROPRIEDADE FÍSICA, COR, IDADE, PREDISPOSIÇÃO HUMANA E ATITUDE e AVALIATIVOS. O agrupamento dos adjectivos em classes semânticas varia consoante os autores. No entanto, realça-se o facto de algumas classes se manterem relativamente constantes. 41
48 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS se os significados patentes em bom noutros adjectivos avaliativos, como, por exemplo, excelente ou mau de acordo com a classificação de Dixon (1991) - como se pode ver a partir dos exemplos em (59). Do mesmo modo, podem encontrar-se os mesmos significados patentes em rápido noutros adjectivos de velocidade, como lento ou veloz, como se observa a partir dos exemplos em (60). No entanto, pode acontecer que nem todos os significados resultantes da co-ocorrência de um determinado adjectivo com um determinado item nominal sejam partilhados por todos os adjectivos da sua classe, quando associados ao mesmo item nominal, como é o caso de (59e) e (60d). (59) a. um mau/excelente livro b. um mau/excelente investimento c. uma pessoa má/excelente d. um mau/excelente médico e. *Esperou uma má/excelente hora e ninguém apareceu. (60) a. um desporto lento/veloz b. um carro lento/veloz c. uma dactilógrafa lenta/veloz d.??*um livro lento/veloz Os exemplos de (56) a (60) ilustram que os diferentes significados adquiridos pelos adjectivos dependem da semântica do nome que modificam 20. Pustejovsky (1995a) argumenta que o agrupamento dos adjectivos em classes deste tipo pode ser bastante útil para fins descritivos, mas não revela muito acerca das suas propriedades semânticas e sintácticas, podendo agrupar itens com comportamentos sintácticos distintos. 20 Num estudo baseado em corpora, Saint-Dizier (1998b) sustenta que os adjectivos pertencentes às classes semânticas AVALIATIVA (bom, grande, caro), LOCATIVA (central, exterior) e FORMA (redondo, rectangular) são os mais polissémicos. Em contrapartida, os adjectivos pertencentes às classes TÉCNICA (químico), ASPECTUAL (final) e de NACIONALIDADE (internacional) são os menos polissémicos. As classes semânticas de adjectivos são definidas pelo autor e não correspondem às apresentadas por Dixon (1991). 42
49 2. PROBLEMÁTICA (iii) COMPOSIÇÃO NOME - ADJECTIVO Como já foi referido anteriormente, o mesmo adjectivo pode ter significados diferentes conforme se encontra em posição pré-nominal - apositivos - ou pós-nominal - restritivos. Ao analisar para o Francês o adjectivo velho ( vieux ), Bouillon (1999) distingue entre o que designa de adjectivo RELATIVO e adjectivo MODIFICADOR DE PROPRIEDADE. Nas estruturas em que o adjectivo se encontra em posição pós-nominal - N Adj - o adjectivo é considerado relativo, implicando que a entidade modificada seja um N e um Adj, como ilustram os exemplos em (61). (61) a. A Ana é a minha amiga velha. (de idade avançada) A Ana é amiga. A Ana é velha. b. O João é um arquitecto falso. (que é velhaco) O João é arquitecto. O João é falso. No entanto, o mesmo não acontece em estruturas em que o adjectivo se encontra em posição pré-nominal - Adj N - ou seja, quando ele é modificador de propriedade. Como se pode observar pelo exemplo (62a) não é necessariamente verdade que a entidade denotada pelo N tenha a propriedade denotada pelo Adj, ainda que essa interpretação seja igualmente possível. De facto, pode mesmo acontecer que a entidade modificada pelo adjectivo não seja nem a entidade denotada pelo N nem tenha a propriedade denotada pelo Adj, como se verifica em (62b). (62) a. A Ana é a minha velha amiga. (de longa data) A Ana é amiga. (#)A Ana é velha. b. O João é um falso arquitecto. (que não tem as aptidões que finge ter) #O João é arquitecto. #O João é falso. 43
50 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS Como se pode verificar, neste caso, a alteração de significado resulta da posição do adjectivo relativamente ao mesmo nome, realçando diferentes aspectos da semântica do nome. 2. POLIMORFISMO SINTÁCTICO Tal como os verbos, também os adjectivos podem ocorrer em contextos sintácticos distintos, como ilustram os exemplos (63). Neste caso, os diferentes contextos sintácticos não implicam necessariamente uma alteração de significado do adjectivo, ainda que tenhamos, nos exemplos contemplados, uma interpretação de experienciador - (63a), (63b), (63c) e (63d) - e uma interpretação causativa - (63e) e (63f). (63) a. Este homem está triste. b. Este homem está triste por tu partires. c. Este homem está triste por partir. d. Ele é um homem triste. e. Partir é triste. f. É triste que tu partas. A partir da análise efectuada pode observar-se que, de um ponto de vista sintáctico, os adjectivos podem ocorrer como modificadores de um nome (um livro triste) ou em estruturas predicativas com verbos copulativos, como ser (este livro é triste). De um ponto de vista semântico, os adjectivos apresentam um comportamento polimórfico notório, cuja origem pode dever-se, fundamentalmente, à semântica do próprio adjectivo (alternando entre interpretações de experienciador e causativas, podendo modificar nomes que denotem indivíduos, objectos ou eventos), à semântica do nome que modifica (adquirindo significados distintos de acordo com o item nominal que modifica) ou à posição do adjectivo relativamente ao nome que modifica (realçando aspectos distintos da semântica do mesmo item nominal). 44
51 2. PROBLEMÁTICA Como podem as relações existentes entre os vários significados dos itens polissémicos aqui descritos ser representadas no léxico, de modo a permitir o acesso a todas as suas interpretações? É o que se discutirá no próximo capítulo. 45
52 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS 46
53 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO... the form that a lexicon takes influences the overall design and structure of the grammar. (Pustejovsky, 1995a: 33) Uma das preocupações centrais da investigação no âmbito da Semântica Lexical Computacional reside na concepção de um modelo que permita representar a ambiguidade lexical descrita no capítulo anterior. Em termos gerais, três abordagens merecem particular atenção: (i) a enumeração de sentidos, que lista exaustivamente, tanto quanto possível, todos os sentidos de uma palavra, em entradas lexicais distintas; (ii) as regras lexicais, que geram significados derivados a partir de um significado-base; (iii) o modelo do Léxico Generativo, que permite captar todos os significados de um item através da interacção de mecanismos generativos com a informação especificada na sua entrada lexical.
54 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS 3.1. LÉXICO ENUMERATIVO DE SENTIDOS Treating the lexicon as an enumerative listing of word senses has been the predominate view... (Pustejovsky, 1995b: 74) A forma mais directa, e tradicionalmente utilizada, de representar um item lexical consiste na enumeração exaustiva de todos os seus significados. Cada sentido distinto corresponde a uma entrada lexical distinta. Este modo de listar os significados das palavras é normalmente referido como Léxico Enumerativo de Sentidos (LES), e é utilizado, no âmbito de uma abordagem lexicográfica tradicional, por alguns modelos teóricos e computacionais. No seguimento de Pustejovsky (1995a), um LES é caracterizado da seguinte forma: (1) Um léxico L é um Léxico Enumerativo sse para cada palavra w em L, com múltiplos sentidos s1,..., sn, existir uma entrada lexical distinta para cada sentido: w s1,...,w sn. 1 Um exemplo clássico da utilização de técnicas enumerativas de sentidos diz respeito aos artigos de dicionário. Analisem-se os exemplos apresentados em (2), bem como a figura 1, que representa o verbete abreviado do item banco, de acordo com o DLPC 2. (2) a. A Maria foi buscar um banco para se sentar. b. Este é o banco no qual deposito o meu dinheiro. c. O banco fica ao lado do supermercado. 1 Traduzido de Pustejovsky (1995a: 34). 2 Dada a extensão dos verbetes, optou-se por omitir algumas abonações e registar apenas a definição das acepções sem os agrupamentos composicionais (colocações, combinatórias e expressões idiomáticas). 48
55 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO banco [bαku]. s.m. (Do ger. bank). 1. Assento estreito e comprido, de material variável, com ou sem encosto, para várias pessoas. No jardim havia bancos pintados de verde, onde os mais velhos se sentavam a ler o jornal. (...). 2. Assento para uma pessoa, sem encosto, de tampo redondo ou quadrado, sustentado por três ou quatro pés. MOCHO. Comprou na feira dois bancos para a cozinha e um banco baixinho para descansar os pés. (...). 3. Assento comprido e largo, com encosto alto, de tampo amovível, que pode servir também de tampa de uma arca. ARQUIBANCO, ESCABELO, ESCANO. 4. Prancha comprida, sustentada por quatro pés, ou mesa de trabalho onde se fixam as peças em que se trabalha, especialmente em marcenaria, carpintaria e serralharia BANCADA. (...). 5. Elevação do fundo do mar ou dum rio por acumulação de areias, de rochas, de detritos e que pode aflorar à superfície durante a maré baixa. BAIXIO, BAIXO. Naquela zona havia vários bancos de areia que dificultavam a entrada e a saída das embarcações. (...). 6. Massa de gelo de grande altura, flutuando à superfície do mar. 7. Geol. camada ou estrato de aglomeração de detritos de rocha, de conchas fósseis ou de matérias sólidas. 8. Pesc. Grande quantidade de peixes que se encontram perto da costa, especialmente na época da desova. CARDUME. Um banco de sardinha. 9. estabelecimento particular ou estatal, cuja actividade se centra no depósito e empréstimo de valores, transacções de fundos... «Houve [...] muitas pessoas que retiraram do banco as suas pequenas poupanças.» (PF, 971). (...) 10. edifício onde funciona esse estabelecimento. Pararam a conversar em frente do banco. (...). 11. Estabelecimento clínico onde se recolhem órgãos ou substâncias do organismo humano, para posterior utilização. (...). Fig. 1. Verbete banco do DLPC O verbete da figura 1 ilustra como, numa abordagem enumerativa, os diferentes sentidos do item banco são exaustivamente listados. Fazendo corresponder os diferentes significados de banco apresentados em (2) à entrada correspondente no verbete, o DLPC regista na acepção número 2 o significado correspondente a (2a), na acepção número 9 o significado correspondente a (2b) e na acepção número 10 o significado correspondente a (2c). No entanto, e para além da dificuldade muitas vezes encontrada em listar todos os diferentes significados de uma palavra uma vez que é sempre possível que esta adquira novos significados em novos contextos - outro dos principais problemas das técnicas enumerativas de sentidos reside no facto de estas não captarem as relações semânticas sistemáticas existentes entre os significados dos itens polissémicos. it [polysemy] demands the impossible task of enumerating in advance all the senses which might be associated with a lexical form. (Verspoor, 1997a: 219) 49
56 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS De facto, a partir da observação do verbete de banco, pode constatar-se que não há qualquer forma de distinguir a relação polissémica existente entre as acepções 9 e 10, da relação de homonímia existente relativamente às restantes acepções. Dada a discriminação de todos os significados, uma abordagem enumerativa não permite, deste modo, captar os significados de estruturas como as apresentadas em (3), em que banco denota simultaneamente os significados de instituição e de edifício. (3) O banco no qual deposito o meu dinheiro fica ao lado do supermercado. Pustejovsky (1995a) apresenta exemplos da abordagem enumerativa sob a forma de estruturas de traços 3. As estruturas em (4), (5) e (6) ilustram, do mesmo modo, como os três significados da palavra banco, apresentados em (2), são representados através de entradas distintas. (4) banco1 CAT nome contável GENUS assento (5) banco 2 CAT nome contável GENUS instituiçã o financeira 3 A informação acerca dos itens lexicais pode ser codificada em estruturas de traços organizadas em matrizes atributo-valor (MAV), como as utilizadas em formalismos como a HPSG (Pollard & Sag, 1994). Cada MAV é composta por pares atributo: valor, onde o atributo (ou traço) é expresso em maiúsculas e o seu valor em minúsculas. Este último pode ser atómico ou constituído por outras estruturas de traços. (i) ATRIBUTO a valora ATRIBUTO ATRIBUTOb ATRIBUTO c d valorc valord 50
57 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO (6) banco3 CAT nome contável GENUS edifício Em que o traço CAT designa a categoria gramatical da palavra e o traço GENUS designa, basicamente, o significado da palavra. Este tipo de representação pode ser aplicada a expressões homónimas (banco 1 vs banco 2 e banco 3). No entanto, não parece ser a mais adequada no que respeita à representação de expressões polissémicas em que, contrariamente à homonímia, os diferentes significados se encontram estreitamente relacionados, como é o caso de banco 2 e banco 3. Do mesmo modo que se verificou com a enumeração de sentidos exposta no verbete da figura 1, as representações apresentadas em (4), (5) e (6) parecem, igualmente, indicar que a relação entre os significados de banco 2 e banco 3 são comparáveis à relação (ou ausência dela) existente entre estes e os significados de banco 1, o que não é o caso. Ou seja, também não parece ser possível representar, através deste tipo de entrada, a relação semântica sistemática existente entre os diferentes significados das expressões polissémicas. Uma alteração possível à abordagem dos Léxicos Enumerativos, que permite distinguir os casos de homonímia dos de polissemia, consiste na representação dos vários significados numa única entrada lexical para os itens polissémicos, evitando-se, deste modo, a proliferação de entradas lexicais. (7) banco1 CAT nome contável GENUS assento 51
58 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (8) banco 2 SIGNIFICADO SIGNIFICADO 1 2 CAT GENUS CAT GENUS nome contável instituiçã o nome contável edifício Deste modo, no seguimento de (Pustejovsky, 1995a), haverá que proceder a uma reformulação da definição de Léxico Enumerativo apresentada em (1) supra, de modo a dar conta desta distinção respeitante ao armazenamento dos diferentes significados. (9) Um léxico L é um Léxico Enumerativo sse a cada palavra w em L, com múltiplos sentidos s1,..., sn: (i) s1,..., sn corresponderem a significados de palavras homónimas, não apresentando qualquer relação semântica, e houver uma entrada lexical distinta para cada significado, representada como w s1,...,w sn; (ii) s1,..., sn corresponderem a significados de palavras polissémicas, apresentando uma relação semântica, e houver uma única entrada lexical que lista todos os significados possíveis, representada como w{ s1,..., sn}. 4 Esta é uma abordagem comum, que visa o estabelecimento de um conjunto finito de significados e, em cada contexto, a selecção do mais apropriado. No entanto, não só essa selecção envolve níveis de complexidade computacionalmente insatisfatórios, como a própria enumeração de sentidos nem sempre é uma questão trivial:... there are three basic arguments showing the inadequacies of SELs [Sense Enumerative Lexicons] for the semantic description of language. (1) THE CREATIVE USE OF WORDS: Words may assume new senses in novel contexts. (2) THE PERMEABILITY OF WORD SENSES: Word senses are not atomic definitions but overlap and make reference to other senses of the word. (3) THE EXPRESSION OF MULTIPLE SYNTACTIC FORMS: A single word sense can have multiple syntactic realization. (Pustejovsky, 1995a: 39) 4 Traduzido de Pustejovsky (1995a: 38). 52
59 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO Um léxico fixo dificilmente dá conta de fenómenos de metonímia, metáfora ou transferência de significados (Nunberg, 1995), cuja referência se encontra dependente do contexto. Given the fact that reference transfer is an entirely contextdependent phenomenon, it is difficult to see how it could plausible be accounted for in terms of a fixed lexicon (Verspoor, 1997a: 220) A produtividade e dinamismo das línguas tornam as abordagens enumerativas inadequadas tanto a nível estritamente linguístico, como a nível computacional. A enumeração de significados trata o léxico como um repositório estático de informação, ao qual se pode aceder, mas que, por ser um componente independente da gramática, não interage com quaisquer processos gramaticais ou pragmáticos. Outra desvantagem importante reside na falta de economia. Esta enumeração tem como resultado uma lista exaustiva de significados que, em termos computacionais, requer muito espaço - memória, com custos importantes a nível de eficiência do sistema REGRAS LEXICAIS Em oposição à abordagem enumerativa apresentada anteriormente, os diferentes significados podem ser derivados através de regras lexicais aplicadas a entradas lexicais específicas. Permitindo gerar significados a partir de um significado-base, as regras lexicais têm um papel central numa concepção dinâmica do léxico. Se um sistema computacional captar uma regra que determine que um nome contável que denota um animal pode ser usado como um nome massivo que denota a carne desse animal, então terá uma base que lhe vai permitir distinguir significados como os apresentados em (10). (10) a. O João costuma passear o cão aos fins-de-semana. b. Ontem comemos cão ao jantar. 53
60 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS De modo a dar conta do fenómeno de polissemia regular, as instanciações desta regra [animal comida] irão permitir processar correctamente estruturas como as representadas em (11). (11) a. Ontem provei lagarto. b. O coala estava delicioso. Copestake & Briscoe (1992, 1995) propõem um conjunto de operações lexicais baseadas em estruturas de traços, com a seguinte representação esquemática: (12) regra _ lexical 1 signo_lexi cal 0 signo_lexi cal Todas as regras lexicais têm de ter os traços 1 e 0 aos quais vão corresponder valores do tipo signo_lexical. Estas regras vão ter como input a estrutura de traços presente em 1 e como output a estrutura de traços presente em 0, que vai corresponder ao novo significado gerado. Retomando a alternância ANIMAL - COMIDA, a regra em (13) ilustra como a estrutura de traços que tem como input o significado de animal vai ter como output o significado de comida. A operação lexical também dá conta da alteração de nome contável para nome massivo. animal_comida nome_contável 1 ORTH 1 (13) animal_comida regra_lexical animal objecto_individual RQS COMESTÍVEL + nome_massivo 0 ORTH 1 RQS comida_substância substância 54
61 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO Em que ORTH significa orthography e RQS significa Relativised Qualia Structure (Calzolari, 1991). O efeito desta regra consiste na transformação de um nome contável que denota um animal num nome massivo que denota uma substância. A componente principal desta regra consiste numa operação sintáctica, na medida em que afecta a realização sintáctica do item possibilitando a sua ocorrência sem determinante, co-relacionada com uma operação semântica subespecificada. O uso de regras lexicais está dependente de um léxico estruturado.... it depends on a lexicon in which various generalisations are captured about the semantic classes which words in the lexicon belong to (e.g. animal nouns). (...) It is difficult to imagine a semantic motivated way of defining the appropriate input to a rule in the absence of represented semantic relationships between words. Lexical rules would be extremely difficult to formulate under a unstructured multiple lexical entry view of the lexicon, in which entries are not grouped into classes. (Verspoor, 1997a: 221) Uma das grandes questões relativamente ao uso de regras lexicais diz respeito à necessidade de evitar ambiguidades desnecessárias que possam ser geradas por estas regras. É necessário, assim, bloquear a geração de algumas regras lexicais. A aplicação de uma regra é bloqueada se já existir no léxico uma palavra que possa estar no lugar do suposto output. Existem dois tipos de bloqueio: pre-emption 5 semântico - que ocorre quando o significado que vai ser gerado já está lexicalizado noutra palavra (a lexicalização de vaca para o significado de comida bloqueia a geração de boi para o mesmo significado) - e pre-emption lexical - que ocorre quando a palavra que vai ser gerada já existe no léxico com outro significado. Ostler & Atkins (1992) propõe que as regras devem ter uma direccionalidade definida e que o fenómeno de bloqueio pode ser formulado através de restrições na aplicação das regras. Uma das questões centrais que resulta da assunção da direccionalidade das regras lexicais consiste em determinar qual é o significado-base e qual é o significado derivado. 5 Dada a dificuldade em encontrar termos equivalentes em Português, adoptou-se a terminologia da versão original. 55
62 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS Saint-Dizier (1998b) defende que o significado base é aquele que é mais usado e, provavelmente, historicamente o mais antigo.... it is often the most usual usage which is the most primitive, probably the most concrete one, often one of the most widely used and also possibly historically and ontogenetically the oldest (...). (Saint-Dizier, 1998b: 125) Kilgarriff (1992) defende que há casos em que, numa relação sistemática, alguns itens são mais proeminentes em certas instanciações do que outros. No caso da alternância ÁRVORE-MADEIRA, os itens cerejeira e nogueira, por exemplo, têm como significado mais saliente o de árvore, enquanto itens como faia e mogno têm como significado mais saliente o de madeira. O mesmo acontece com a alternância ANIMAL-COMIDA, em que para peru o significado de comida é mais saliente, ao contrário de cão, em que o significado mais saliente é o de animal. Na sua ontologia, Kilgarriff dá conta deste fenómeno exprimindo as alternâncias em ambos os nós (relaciona o nó árvore com o nó madeira e vice-versa), o que se torna desnecessariamente redundante. Por outro lado, Copestake & Briscoe (1992, 1995) propõem adicionar às regras lexicais uma condição probabilística, baseando-se na frequência dos significados de cada item, e que vai reflectir o modo como esse item é usado num determinado contexto 6. Uma vez que as regras lexicais geram significados derivados a partir de significados-base, estes significados vão estar associados a frequências diferentes, podendo mesmo acontecer que, para algumas palavras, o significado derivado tenha uma frequência mais alta que o significado-base. É o caso de peru, já referido anteriormente, em que o significado derivado ( comida ) ocorre com mais frequência que o significado-base ( animal ). A informação sobre a frequência de ocorrência dos significados dos itens parece, desta forma, não ser um critério para a definição do significado-base e do significado derivado (uma vez que pode acontecer que os significados derivados tenham uma frequência mais alta que os significados-base), mas apresenta alguma utilidade, na medida em que reflecte o uso desses significados num determinado contexto. A nível computacional, os parsers podem beneficiar desta informação estatística para melhorar o seu processamento. Os itens polissémicos podem ser inicialmente 6 Kilgarriff (1997b) refere que alguns dicionários de língua inglesa, nomeadamente o Longman Dictionary of Contemporary English (3 rd Edition, 1995) e o Collins Cobuild English Dictionary (New Edition, 1995), também incorporam informação acerca da frequência de um item a partir de corpora. 56
63 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO processados com base na frequência mais alta dos seus significados. A frequência mais baixa será posteriormente escolhida no caso de conflitos sintácticos ou de subsequentes processos pragmáticos, que determinarão que esse é o significado adequado. Uma outra proposta é a de Ostler & Atkins (1992) que estabelece um conjunto de cerca de 130 tipos de alteração sistemática de significado, denominados REGRAS DE IMPLICAÇÃO LEXICAL (RIL), e que podem definir-se esquematicamente como se segue: (14) CL 1 [...α...]: [CS 1 [...σ...] CL 1/CL 2 [...α...]: [CS 2 [...t...] De acordo com este esquema, um item lexical é composto por uma componente lexical (CL) - que contém informação fonológica, ortográfica, morfológica e sintáctica (α) - e por uma componente semântica (CS) - que expressa as propriedades semânticas e o significado do item lexical (σ/t). A aplicação das RIL pode ou não alterar a componente lexical, mas altera sempre a componente semântica. De (15) a (19) encontram-se alguns exemplos destas regras. Note-se que em (15) e (19) só se verifica alteração a nível semântico. No entanto, de (16) a (18) existe alteração a nível sintáctico. Em (16) e (17) verifica-se uma transição de nome contável (NC) para nome massivo (NM). Em (18) verifica-se uma transição de verbo transitivo para verbo ergativo. (15) NC: continente NC: conteúdo a. O João partiu a garrafa. b. Não bebas a garrafa toda. (16) NC: animal NM: carne desse animal a. O cabrito corre pelo prado. b. A Maria não come cabrito. (17) NC: árvore NM: madeira a. O João está escondido atrás do carvalho. b. Esta mesa é de carvalho. 57
64 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (18) V Transitivo: causativo V Ergativo: incoativo a. A Rita ferveu o leite. b. O leite ferveu. (19) Adj: experienciador Adj: causa a. O João está triste. b. Foi um dia triste. A aplicação das RIL também pode ser bloqueada, através de pre-emption, a nível da CS, quando o output resultante já estiver lexicalizado noutro item. É o caso da já mencionada alternância ANIMAL COMIDA, em que o significado de comida para boi, já está lexicalizado em vaca. Uma das propriedades das RIL reside no facto de poderem ser específicas de uma determinada língua ou dialecto, uma vez que a alternância de significados de uma classe de palavras pode ser específica de uma língua e não universal LÉXICO GENERATIVO O Léxico Generativo (LG) consiste num modelo de Semântica Lexical que permite situar os casos de polissemia regular e fenómenos associados (metonímia, metáfora, extensão de significados) na interface entre o significado lexical e o significado composicional. As entradas lexicais contêm idealmente toda a informação (sintáctica e semântica) considerada necessária para a caracterização das unidades lexicais. Esta informação encontra-se especificada em vários níveis de representação, que se relacionam de algum modo, mas que não são dependentes uns dos outros. Interagindo com estes componentes existe ainda um conjunto de mecanismos generativos que permitem captar a variação de significado em função do contexto. What we hope to achieve is a model of meaning in language that captures the means by which words can assume a potentially 58
65 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO infinite number of senses in context, while limiting the number of senses actually stored in the lexicon.(pustejovsky, 1995a: 105) Dadas as virtualidades deste modelo, o LG é pormenorizadamente apresentado nas secções seguintes NÍVEIS DE REPRESENTAÇÃO Tendo como objectivo fornecer uma descrição formal da língua que seja expressiva e flexível o suficiente para captar a natureza generativa da criatividade lexical e os fenómenos de extensão de significado, o LG envolve quatro níveis de representação: 1. ESTRUTURA ARGUMENTAL (A) Especifica o número e o tipo de argumentos de um predicado, bem como o modo como eles se realizam sintacticamente. 2. ESTRUTURA EVENTIVA (E) Especifica o tipo do evento (estado, processo ou transição) associado a uma expressão lexical ou sintáctica. 3. ESTRUTURA QUALIA (Q) Codifica os aspectos essenciais da semântica das unidades lexicais, estabelecendo a relação entre as duas primeiras estruturas (A e E), através dos papéis constitutivo, formal, télico e agentivo. 4. ESTRUTURA DE HERANÇA LEXICAL (H) Estabelece a relação entre uma estrutura lexical e outras estruturas lexicais num dado reticulado. A interagir com estes quatro níveis de representação, existe um conjunto de mecanismos generativos que permite a interpretação composicional das unidades lexicais em contexto: 59
66 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (i) COERÇÃO DE TIPO Um item lexical, ou um sintagma, é coagido a uma determinada interpretação semântica através de um item regente (functor), sem qualquer alteração do seu tipo sintáctico. (ii) CO-COMPOSIÇÃO Múltiplos elementos de um sintagma comportam-se como functores, gerando novos significados não-lexicalizados para as palavras que fazem parte da composição. (iii) LIGAÇÃO SELECTIVA Um item lexical ou sintagma operam especificamente na subestrutura de outro sintagma, sem qualquer alteração do tipo da estrutura. Estes mecanismos de composição semântica, explicados mais pormenorizadamente na secção 3.3.4, são fundamentais para captar a relação semântica existente entre expressões sintacticamente distintas. Ao definir o comportamento funcional dos itens lexicais em diferentes níveis de representação, espera-se chegar a uma caracterização do léxico como um componente activo na composição dos significados em contexto. Os mecanismos generativos envolvidos, que permitem obter o significado atribuído a uma dada expressão num dado contexto, contribuem para que esta abordagem reúna toda a informação relativa a um item lexical numa meta-entrada (que permite prever todas as regularidades de comportamento desse item quando contextualizado) e, como resultado, reduza o número de entradas no léxico. Essas meta-entradas denominam-se PARADIGMAS LÉXICO- CONCEPTUAIS (PLC). 60
67 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO ESTRUTURA ARGUMENTAL A estrutura argumental, definida como uma especificação dos argumentos de um predicado (número de argumentos, tipo sintáctico e semântico, realização sintáctica), foi objecto de investigação importante no âmbito da semântica lexical, particularmente dos estudos sobre a interface sintaxe-semântica. O que originalmente começou por ser uma lista simples dos argumentos associados a um predicado desenvolveu-se numa visão sofisticada do modo como os argumentos são projectados na estrutura sintáctica. No quadro do modelo de Princípios e Parâmetros (Chomsky, 1981), por exemplo, o Princípio de Projecção requer que os argumentos sejam expressos como constituintes sintácticos em todos os níveis de representação sintáctica 7. Uma das mais recentes e importantes contribuições para a teoria da gramática consiste na assunção de que a estrutura argumental é altamente estruturada e independente da sintaxe. Trabalhos como Grimshaw (1990) sustentam que a estrutura argumental é hierarquicamente estruturada, estabelecendo e definindo relações de proeminência entre os argumentos de um predicado. Pustejosvky (1995a) propõe um nível de representação independente para a estrutura argumental dos itens lexicais e distingue quatro tipos de argumentos: (i) ARGUMENTOS VERDADEIROS Os argumentos verdadeiros satisfazem os requisitos do Princípio de Projecção e do Critério Temático da Teoria de Princípios e Parâmetros (Chomsky 1981, 1986a), sendo que a sua realização sintáctica é obrigatória. A sua não realização induz normalmente agramaticalidade, como se exemplifica em (20a) e (20b). (20) a. *O João pôs. b. *O João pôs o livro. c. O João pôs o livro na prateleira. 7 Representations at each syntactic level (i.e. LF and D- and S-structure) are projected from the lexicon, in that they observe the subcategorization properties of lexical items. Chomsky (1981: 29). 61
68 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (ii) ARGUMENTOS POR DEFEITO Os argumentos por defeito são considerados implícitos por estarem já expressos nos qualia do item lexical. Só têm realização sintáctica em função de factores contextuais ou discursivos, sendo, por isso, opcionais. (21) a. O João construiu uma casa com tijolos/de madeira. b. O João construiu uma casa. (iii) ARGUMENTOS-SOMBRA Os argumentos-sombra estão semanticamente incorporados no item lexical e só são expressos em determinadas condições, nomeadamente em casos especificação do discurso. (22) a. O João pintou o quarto. b. *O João pintou o quarto com tinta. c. O João pintou o quarto com tinta lavável. Denotando pintar cobrir com tinta, a realização de com tinta em (22b) é redundante, tornando a expressão agramatical. No entanto, num caso de introdução de uma maior especificação, como em (22c), a realização do argumento em causa já é aceitável. (iv) ADJUNTOS VERDADEIROS Os adjuntos são modificadores - de que são exemplo os temporais e os locativos - que fazem parte da interpretação situacional de uma expressão, mas que não estão ligados à representação específica de um item lexical. Como tal, a sua realização é opcional. 62
69 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO (23) a. A Maria dormiu até tarde no domingo. b. O Rui falou com o João no comboio. A codificação da informação sobre os argumentos é feita através de uma estrutura de traços como a apresentada em (24). Os traços ARG 1 e ARG 2 representam os tipos dos argumentos verdadeiros. ARG-D vale por argumento por defeito e ARG-S por argumento-sombra. (24) ARG1... ARG2... ESTR_ARG ARG - D... ARG - S Deste modo, para os verbos mencionados anteriormente teremos as representações informais apresentadas de (25) a (27) 8. (25) pôr... ESTR_ARG ARG ARG ARG indivíduo_ animado objecto_físico local (26) construir... ARG ESTR_ARG ARG2 1 ARG - indivíduo_ animado artefacto D matéria 8 Por motivos de economia, em cada representação apresentada optou-se por incluir apenas os atributos relevantes para a análise do fenómeno em questão. 63
70 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (27) pintar... ARG ESTR_ARG ARG2 1 ARG - S indivíduo_ animado objecto_físico tinta ESTRUTURA EVENTIVA Um predicado denota um determinado tipo de evento, entendido como uma situação ou acontecimento, em que participam os seus argumentos. No seguimento de Vendler (1967), Dowty (1979), Moens & Steedman (1988), Pustejovsky (1991) e Marrafa (1993), entre outros, consideram-se aqui três tipos de eventos primitivos: ESTADOS (E), PROCESSOS (P) e TRANSIÇÕES (T). Um ESTADO pode ser informalmente definido como um evento atómico, alargado no tempo, não se fazendo referência ao seu início nem ao seu fim, e não avaliado em relação a qualquer outro. Um PROCESSO consiste numa sequência de eventos idênticos (iteração), que pode apresentar uma culminação ou não, em relação, geralmente, com a presença ou ausência de operadores temporais ou quantificacionais. Uma TRANSIÇÃO é descrita como um evento complexo, constituído por dois subeventos, um processo e um estado, que representam, respectivamente, o período inicial e final do evento, resultando numa mudança de estado. Em termos estruturais, um ESTADO é representado como uma estrutura atómica, não ramificada, um PROCESSO como uma estrutura com ramificações múltiplas e uma TRANSIÇÃO como uma estrutura binária, como abaixo se ilustra. 64
71 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO (28) ESTADO: [e] E e Exs: saber, amar, acreditar, conhecer, possuir (29) PROCESSO: [e 1... e n] P e 1... e n Exs: correr, nadar, conduzir, andar (30) TRANSIÇÃO [P, E] T P E Exs: construir, pintar, ler, escrever Dado que os eventos apresentam uma estrutura interna, é necessário assumir um nível específico para a sua representação que indique os tipos de eventos que estão associados a um item lexical (E 1 e E 2), bem como as restrições que os regem (RESTR), como se ilustra em (31). 65
72 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (31) E ESTR_EVENT E RESTR... No que respeita às restrições que regem os eventos, e no seguimento de Pustejovsky (1995a), estas relacionam-se com a ordenação temporal dos eventos. Deste modo podemos ter três tipos de relações: (i) PRECEDÊNCIA (< α ) A restrição de precedência está associada a predicados que denotam uma transição, como construir. Um evento complexo (e 3) é constituído por dois subeventos (e 1 e e 2) em que e 1 e e 2 estão temporalmente ordenados, de modo que o primeiro precede o segundo (< α ({e 1, e 2}, e 3)). Ou seja, para que algo esteja no estado construído é necessário, em primeiro lugar, o processo de construção. A representação estrutural abreviada do verbo construir será a apresentada em (32). (32) construir E 1 ESTR_EVENT E2 2 e1: processo e :estado < RESTR 66
73 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO (ii) SOBREPOSIÇÃO (o α) A restrição de sobreposição está associada a predicados como acompanhar, em que um evento complexo (e 3) é constituído por dois subeventos (e 1 e e 2), que ocorrem simultaneamente (o α ({e 1, e 2}, e 3)). (33) acompanhar ESTR_EVENT E E 1 2 e1: processo e 2 : processo o RESTR (iii) PRECEDÊNCIA COM SOBREPOSIÇÃO (<o α) A restrição de precedência com sobreposição está associada a predicados como andar, em que um evento complexo (e 3) é constituído por dois subeventos simultâneos (e 1 e e 2), em que e 1 começa primeiro que e 2 (<o α ({e 1, e 2}, e 3)). No caso de andar ocorre primeiro o movimento das pernas, resultando no movimento final do corpo. (34) andar ESTR_EVENT E E 1 2 e1: processo e 2 : processo < o RESTR Para além das restrições que regem os subeventos, Pustejovsky (1995a) propõe também uma subespecificação das estruturas eventivas relativamente ao núcleo. Numa 67
74 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS estrutura eventiva bipartida, um dos subeventos pode ser mais proeminente em relação ao outro, ocupando a posição de núcleo. O subevento que ocupa a posição de núcleo é representado como e* 1 ou e* 2, quer seja o subevento inicial ou final, respectivamente. Em (35) é apresentada a matriz por defeito da estrutura eventiva de um dado predicado α. (35)... E1... E2... ESTR_EVENT RESTR... NÚCLEO Relativamente à marcação das estruturas eventivas em relação ao núcleo, considerando que o subevento mais proeminente pode ser o inicial, o final, ambos ou nenhum, existem quatro hipóteses distintas de marcação, de acordo com Pustejovsky (1995a: 73): (i) ESTRUTURAS ENDOCÊNTRICAS À ESQUERDA Exs: Construir [e* 1 <α e 2] Comprar [e* 1 o α e 2] Caminhar [e* 1 <o α e 2] (ii) ESTRUTURAS ENDONCÊNTRICAS À DIREITA Exs: Chegar [e 1 <α e* 2] Vender [e 1 o α e* 2] Caminhar para casa [e 1 <o α e* 2] 68
75 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO (iii) ESTRUTURAS ENDOCÊNTRICAS À ESQUERDA E À DIREITA Exs: Dar [e* 1 <α e* 2] Casar [e* 1 o α e* 2] (iv) ESTRUTURAS NÃO ENDOCÊNTRICAS Exs: Ferver [e 1 <α e 2] Alugar [e 1 o α e 2] Começar [e 1 <o α e 2] As estruturas em (iv), que não são especificadas relativamente ao núcleo, representam os casos de predicados polissémicos. Em termos de estrutura eventiva, a polissemia ocorre quando uma expressão não é especificada relativamente ao núcleo, admitindo duas interpretações. Encontram-se neste agrupamento, entre outros, os predicados que alternam entre uma estrutura causativa/incoativa, como ferver, e certos predicados causativos aspectuais, como começar. De um modo sucinto, os predicados não endocêntricos podem ter como núcleo qualquer um dos subeventos que constituem a estrutura eventiva. Uma vez que os subeventos estão associados a papéis qualia distintos o papel agentivo encontra-se associado a e 1 (processo), ao passo que o papel formal se encontra associado a e 2 (estado) a proeminência de um ou de outro resulta em interpretações diferentes. No caso da alternância causativa/incoativa, a interpretação causativa ocorre quando o subevento inicial é o núcleo, projectando informação relativa ao papel agentivo (A Maria ferveu o leite). Por outro lado, a interpretação incoativa ocorre quando o subevento final é o núcleo, projectando informação relativa ao papel formal (O leite ferveu) ESTRUTURA QUALIA A designação de qualia baseia-se na noção aristotélica de modos de explanação, através da qual o sujeito processa a compreensão de um objecto ou relação no mundo. 69
76 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS Esta estrutura codifica a informação semântica necessária para a interpretação de um item nominal, e é constituída por quatro componentes, ou papéis qualia, distintos: (i) CONSTITUTIVO Especifica a relação entre o objecto semântico e as partes que o constituem, codificando características como o material, o peso, os componentes. (ii) FORMAL Especifica aquilo que distingue o objecto semântico num dado domínio, como a orientação, a magnitude, a forma, a dimensionalidade, a cor. (iii) TÉLICO Indica a função do objecto semântico. (iv) AGENTIVO Especifica os factores que estão envolvidos na origem do objecto semântico, como o criador, tipo natural ou nexo de causalidade. A estrutura qualia pode ser entendida como um conjunto de propriedades ou eventos associados a um item lexical nominal, e, consequentemente, ao sintagma nominal no qual está inserido. A informação contida nos papéis qualia vai ser associada aos argumentos de um predicado e aos seus subeventos. Esta estrutura inclui os diferentes tipos de relações que os objectos semânticos podem estabelecer entre si: meronímia/holonímia 9, através do papel constitutivo, hiponímia/hiperonímia 10, através do papel formal, propósito ou função, através do papel télico e origem ou causalidade, através do papel agentivo. Enquanto os papéis 9 Corresponde à relação parte/todo. Em termos informais, a relação meronímia/holonímia pode ser definida do seguinte modo: A é merónimo de B sse A é necessariamente parte de B e B inclui necessariamente A; B é holónimo de A sse A é merónimo de B. Exemplificando, pétala é merónimo de corola e corola holónimo de pétala, uma vez que pétala é necessariamente parte de corola e corola inclui necessariamente pétala (Marrafa 2001: 38). 10 Segundo Fellbaum (1998), a hiperonímia e a hiponímia são relações inversas e dizem basicamente respeito à noção de inclusão em classes: se Y é um tipo de X, então X é hiperónimo de Y e Y é hipónimo de X. Exemplificando, o hiperónimo de cão será canídeo, e os hipónimos serão as várias raças de cães (dálmata, pastor alemão, etc.). A relação de hiponímia requer que o hiperónimo possa substituir o hipónimo num contexto referencial (este dálmata hipónimo é bonito / este cão hiperónimo é bonito). 70
77 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO constitutivo e formal estabelecem uma relação com outros objectos semânticos, os papéis télico e agentivo fazem referência a eventos. Todos os itens lexicais têm uma estrutura qualia associada, mas não existe obrigatoriedade de atribuir valores a todos os papéis que a compõem. Em (36) é apresentada a matriz por defeito da estrutura qualia de um dado predicado α. (36)... CONST constituição_de_ FORMAL identifica ção_de_ ESTR_QUALIA TÉLICO função_de_ AGENTIVO origem_de_ É fácil verificar através da estrutura qualia que, por exemplo, romance se distingue de dicionário relativamente ao seu papel constitutivo (o primeiro é uma narrativa, enquanto o segundo consiste numa lista de palavras), ao seu papel télico (o primeiro é para ler enquanto o segundo é para consultar), e ao seu papel agentivo (o primeiro é escrito enquanto o segundo é compilado), sendo somente semelhantes no seu papel formal (ambos são livros). Em termos informais, teríamos as seguintes representações para os referidos itens: (37) romance... CONST narrativa FORMAL livro ESTR_QUALIA TÉLICO ler AGENTIVO escrever 71
78 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (38) dicionário... CONST lista de palavras FORMAL livro ESTR_QUALIA TÉLICO consultar AGENTIVO compilar É também neste nível de representação que se processa toda a informação semântica pertinente para a caracterização de itens com comportamento polissémico SISTEMA DE TIPOS SEMÂNTICOS E HERANÇA LEXICAL Os itens lexicais são definidos no léxico por um conjunto de tipos semânticos que reflectem distinções ontológicas como humano, artefacto, objecto_físico, evento, entre outros. Os tipos podem ser simples ou complexos. Os tipos simples caracterizam as expressões não polissémicas, ou seja, que só têm uma interpretação. É o caso de homem (x: humano), faca (x:artefacto) ou pedra (x:objecto_físico). Ao contrário das expressões não polissémicas, as expressões polissémicas, por terem mais do que uma interpretação, denotam tipos complexos (dotted types, segundo Pustejovsky (1995a)). É o caso de livro (x:objecto físico, y:informação), janela (x:objecto_físico, y:abertura) ou banco (x:instituição, y:edifício). Os tipos complexos são representados pelo operador cartesiano. Deste modo, por exemplo, livro denota o tipo complexo objecto_físico informação, enquanto janela denota o tipo complexo objecto_físico abertura. A todas as expressões de uma língua pode ser atribuído um tipo semântico. Pustejovsky (1995a) defende que, para se obter a representação semântica de um item lexical, é necessário que este aceda a um tipo semântico, presente numa rede de tipos 72
79 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO hierarquicamente organizada, de modo a permitir a herança de traços dos seus supertipos. No LG, um item lexical herda informação a partir da sua estrutura qualia. De facto, os quatro papéis qualia introduzem quatro redes de herança lexical separadas. A herança de traços processa-se, assim, através de quatro canais diferentes e independentes. Retomem-se os exemplos de romance e dicionário que, como se verificou a partir das estruturas (37) e (38), apresentam uma estrutura qualia distinta, sendo o papel formal livro - o único que têm em comum. De um modo sucinto, estes itens terão as relações de herança apresentadas em (39). (39) a. dicionário É_FORMAL livro b. dicionário É_TÉLICO consulta c. dicionário É_AGENTIVO matéria_compilada d. romance É_FORMAL livro e. romance É_TÉLICO leitura f. romance É_AGENTIVO escrita g. livro É_FORMAL objecto_físico informação h. livro É_TÉLICO leitura i. livro É_AGENTIVO escrita De um modo mais simples, o diagrama em (40) representa as relações de herança apresentadas em (39). (40) objecto_físico informação consulta leitura escrita F matéria_compilada T A T A livro F F T A dicionário romance 73
80 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS O diagrama em (40) ilustra como dicionário e romance são um subtipo de livro - uma vez que ambos partilham o valor do papel formal (F). No entanto, estes objectos semânticos distinguem-se relativamente aos traços que herdam do seu supertipo, apresentando, consequentemente, valores distintos para os restantes papéis qualia. Relativamente a dicionário, este só herda o valor do papel formal de livro - objecto_físico informação - distinguindo-se no que respeita aos papéis télico (T) consulta - e agentivo (A) matéria_compilada. No que respeita a romance, este herda de livro os valores dos papéis formal, télico leitura - e agentivo escrita PARADIGMA LÉXICO-CONCEPTUAL (PLC) Um dos objectivos centrais do modelo do LG consiste em construir uma única entrada lexical que englobe todos os significados das expressões polissémicas, reduzindo, assim, o número de entradas armazenadas no léxico. Considerem-se, os seguintes exemplos com o item livro, que é um nome polissémico que denota o tipo complexo objecto_físico informação. (41) a. Este livro é muito divertido. b. Este livro está mal estimado. c. Este livro está mal estimado mas é muito divertido. Nos exemplos acima, o nome livro apresenta três significados: informação (41a), objecto físico (41b) e informação e objecto físico em (41c). Pustejovsky & Anick (1988) denominam PARADIGMA LÉXICO-CONCEPTUAL (PLC) a representação, numa mesma entrada, dos vários sentidos de um mesmo item. Estas meta-entradas permitem que seja projectado qualquer um dos três significados em contextos semânticos e sintácticos distintos. O PLC representa, assim, um tipo complexo para um item polissémico α que tem os significados σ 1 e σ 2. 74
81 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO (42) : PLC 1 : 2 ( ): 1 2 O que (42) indica é que dois tipos simples (σ 1 e σ 2) podem juntar-se e formar um tipo complexo (σ 1 σ 2). O PLC contém todas as combinações de tipos possíveis, ou seja, os dois tipos simples e o tipo complexo resultante da sua combinação, como se pode ver em (43). (43) PLC {σ 1 σ 2, σ 1, σ 2} Concretizando, o PLC do nome livro será o apresentado em (44) e terá a entrada lexical apresentada abreviadamente em (45). (44) objecto_físico informação_plc {objecto_físico informação, objecto_físico, informação} (45) livro ESTR_ARG ESTR_QUALIA ARG1 x :informação ARG2 y :objecto físico informação objecto físico_ FORMAL conter(y,x) TÉLICO ler(e1, w,x y) AGENTIVO escrever(e 2,v, x y) PLC Na próxima secção analisar-se-á de que modo é que a interacção entre a semântica do predicado e dos seus complementos resulta na interpretação adequada do item polissémico. 75
82 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS MECANISMOS GENERATIVOS Existe um conjunto de mecanismos generativos que se combinam com os diferentes níveis de representação semântica descritos anteriormente (estrutura argumental, estrutura eventiva e estrutura qualia) e que permitem dar conta da interpretação composicional das palavras em contexto. Esses mecanismos são: (i) (ii) (iii) (iv) (v) COERÇÃO DE TIPO; COERÇÃO DE SUB-TIPO; COERÇÃO DE COMPLEMENTO; CO-COMPOSIÇÃO; LIGAÇÃO SELECTIVA. Nas secções seguintes será analisado cada um destes mecanismos, que permite captar os meios através dos quais as palavras podem assumir um número potencialmente infinito de significados em contexto, ao mesmo tempo que se limita o número de significados armazenados no léxico COERÇÃO DE TIPO Como já se referiu anteriormente, os tipos semânticos encontram-se ordenados numa hierarquia de tipos, como a apresentada em (46), de acordo com Copestake & Briscoe (1992) e Pustejovsky (1995a). 76
83 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO (46) nomrqs 11 indivíduo proposição evento abstracto objecto_físico informação Cada tipo está associado a uma forma sintáctica canónica. Deste modo, o tipo indivíduo está associado a um Sintagma Nominal (SN), o tipo proposição a uma Frase (F) e o tipo evento a um Sintagma Verbal (SV). A coerção de tipo consiste numa operação semântica que converte, no contexto de uma dada função, um argumento no tipo esperado pela função. De outro modo resultará um erro de tipo e a estrutura será anómala. Existem alguns casos de verbos que foram comummente tratados como ambíguos, mas cuja aparente ambiguidade pode ser explicada através do fenómeno de coerção. Alguns casos discutidos por Dowty (1985) dizem respeito aos tipos de complementos do verbo querer, como é ilustrado em (47) e (48). (47) a. O João quer uma cerveja. (beber) b. O João quer um livro. (ler) c. O João quer um cigarro. (fumar) (48) a. A Maria quer [comer um bolo]. [F] b. A Maria quer [um bolo]. [SN] Dowty (1985) defende uma abordagem enumerativa para explicar estas diferenças de interpretação. Mas uma estratégia diferente é adoptada no Léxico Generativo. Assumindo que o tipo do verbo se mantém inalterável, o que muda é o tipo do complemento do verbo, que sofre uma operação de mudança de tipo em virtude de se encontrar sob regência lexical do verbo. Esta operação é chamada de coerção de tipo, por ser uma mudança de tipo lexicalmente regida. 11 Em que nomrqs refere o elemento supremo do subconjunto de tipos considerado, ou seja, o tipo imediatamente acima relativamente aos tipos indivíduo, preposição e evento. 77
84 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS TYPE COERCION: a semantic operation that converts an argument to the type which is expected by a function, where it would otherwise result in a type error. (Pustejovsky, 1995a: 111) Pustejovsky (1993) sugere que cada expressão α pode ter disponível um conjunto de operadores de mudança, Σα, que pode operar sobre uma expressão, mudando o seu tipo e denotação. Em (49) é apresentada uma formulação da regra de APLICAÇÃO DA FUNÇÃO COM COERÇÃO (AFC): (49) APLICAÇÃO DA FUNÇÃO COM COERÇÃO: se α é do tipo c e β é do tipo <a, b>, então: (i) se o tipo c a, então β(α) é do tipo b; (ii) se existir um σ Σα, tal que σ(α) resulte numa expressão do tipo a, então β(σ (α)) é do tipo b; (iii) de outro modo ocorrerá um erro de tipo. 12 Para ilustrar os efeitos desta regra, tomem-se como exemplo as estruturas apresentadas em (47) e (48). É necessário ter em conta: (i) os diferentes contextos sintácticos que o verbo querer pode seleccionar, em (48); (ii) as diferentes interpretações emergentes dos complementos SN em (47), que parecem requerer uma enumeração de significados. No entanto, e como já foi referido, em vez de propor diferentes tipos semânticos para o verbo - o que resultaria em diferentes entradas lexicais - propõe-se uma única entrada, em que o tipo do verbo se mantém constante. Por sua vez o argumento interno é uniformemente identificado com um determinado tipo, neste caso uma proposição. A estrutura apresentada em (50) ilustra a relação existente entre o tipo semântico requerido e as realizações sintácticas possíveis dos complementos. 12 Traduzido de Pustejovsky (1995a: 111). 78
85 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO (50) [prop] coerção coerção SN F SV Segundo esta proposta, três hipóteses afiguram-se possíveis: (i) (ii) (iii) se a forma sintáctica que ocorre na posição de complemento coincidir com o tipo proposição, requerido pelo verbo, então a estrutura é bem formada; se, pelo contrário, não houver essa correspondência, então o tipo do complemento sofre um processo de coerção de forma a transformar-se no tipo esperado, i.e., numa proposição, e a estrutura passa a ser bem formada; se não houver correspondência entre o tipo do complemento e o tipo requerido pelo verbo, e não houver coerção, haverá um erro de tipo e a estrutura é mal formada. Constata-se, assim, que um mesmo tipo semântico pode ter realizações sintácticas diferentes, e que uma dada estrutura sintáctica pode assumir um tipo semântico particular dependendo do contexto em que se encontra. No que respeita aos exemplos em (47), é importante salientar, em primeiro lugar, as propriedades de selecção do predicado querer que, semanticamente, selecciona um complemento com uma interpretação eventiva. Uma vez que, sintacticamente, este verbo selecciona um SN com o tipo indivíduo, não satisfazendo, deste modo, a condição de selecção de um complemento eventivo, o verbo executa um processo de coerção que resulta na mudança de tipo do complemento, possível devido à informação contida na estrutura qualia da expressão nominal. É a informação contida na estrutura qualia do complemento, neste caso no papel télico, que permite interpretar correctamente o significado de querer. O facto de o papel télico de cerveja, livro e cigarro ser beber, ler e fumar, respectivamente (i.e. eventos) permite que, em (47), o complemento de querer seja interpretado adequadamente como beber uma cerveja, ler um livro e fumar um 79
86 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS cigarro, nos contextos apropriados. Note-se, contudo, que, no que respeita à estrutura querer um livro, para além do papel télico, o papel agentivo também denota um evento - neste caso escrever. Deste modo a estrutura torna-se ambígua entre as interpretações de querer ler um livro e querer escrever um livro, sendo a primeira preferencial, decorrente de razões pragmáticas COERÇÃO DE SUBTIPO A coerção de subtipo baseia-se essencialmente na existência de uma hierarquia de tipos que pode, de certa maneira, assemelhar-se à hierarquia lexical existente nas relações de hiperonímia/hiponímia. Atente-se nos seguintes exemplos: (51) a. O Pedro conduziu um Ferrari no sábado. b. A Joana leu Os Maias nas férias. É necessário, neste caso, estabelecer uma relação entre o tipo semântico denotado por cada SN na posição de complemento e o tipo que é formalmente seleccionado pelos verbos conduzir e ler. Essa relação é convencionalmente denominada coerção de subtipo. Nos casos acima listados o verbo conduzir selecciona um complemento do tipo veículo, que tem como subtipos Ferrari, Honda, etc., enquanto o verbo ler selecciona um complemento do tipo texto, que tem como subtipos Os Maias, Os Lusíadas, etc.. Assume-se então que se uma função selecciona um tipo τ 1 e ocorre um complemento do tipo τ 2, em que τ 2 é um subtipo de τ 1, (τ 2 τ 1), este deve ser aceite pela função como um argumento legítimo. Assumindo que a representação lexical para o nome veículo é a apresentada em (52), e, assumindo que Ferrari é um subtipo de carro, que, por sua vez, é um subtipo de veículo, estabelece-se a seguinte relação: Ferrari carro veículo. 80
87 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO (52) veículo ESTR_ARG ESTR_QUALIA x mover(e 1, y, x) construir(e 2,z, x) [ ARG1 x : objecto_físico ] FORMAL TÉLICO AGENTIVO (53) carro ESTR_ARG ESTR_QUALIA [ ARG1 x : veículo ] FORMAL TÉLICO AGENTIVO x conduzir(e 1, y, x) construir(e 2,z, x) (54) Ferrari ESTR_ARG ESTR_QUALIA [ ARG1 x :carro] FORMAL TÉLICO AGENTIVO x conduzir(e 1, y, x) construir(e 2,Ferrari - Co,x) Note-se que os valores dos qualia formal e télico de Ferrari são herdados da entrada de carro, enquanto a especificidade do tipo do valor do quale agentivo é localmente definida (especifica-se o produtor). A relação de coerção de subtipo, formalmente representada pelo símbolo Θ, pode ser definida de seguinte forma: (55) : 1, [ 1 2 ]: 1 [ 1 2 ]( ):
88 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS O que a representação em (55) indica é que, tendo um antecedente com uma dada expressão α do tipo σ 1, que é um subtipo de σ 2, existe um mecanismo de coerção entre σ 1 e σ 2 que tem como consequência alterar o tipo de α para σ 2. Concretizando, para o exemplo (51b) é estabelecida a relação Os Maias livro texto entre o tipo seleccionado pelo verbo ler e o tipo do complemento que neste caso ocorre COERÇÃO DE COMPLEMENTO Enquanto a coerção de subtipo envolve mecanismos de inferência disponíveis numa estrutura de tipos, a coerção de complemento tem fundamentalmente como base a informação disponível nos qualia dos complementos. Por outro lado, a coerção de complemento é licenciada por regência lexical. Tomem-se como exemplos as estruturas abaixo apresentadas: (56) a. O João começou o livro. b. O João começou a ler o livro. c. O João começou a escrever o livro. A regra de Aplicação da Função com Coerção (AFC), apresentada em (49), assegura que o tipo semântico seleccionado pelo verbo é satisfeito nos três casos, independentemente da estrutura sintáctica dos complementos. Ao analisar a estrutura por defeito do verbo começar, apresentada em (57), verificase que o segundo argumento (ARG 2) é, explicitamente, um evento. 82
89 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO (57) começar ESTR_ARG ESTR_EVENT ESTR_QUALIA ARG ARG E E x : humano e 2 e1: processo e 2 : estado < P(e2,x) acto_de_começar(e, x,e ) 1 2 RESTR FORMAL AGENTIVO A coerção aplicada ao complemento de modo a satisfazer o tipo semântico requerido pelo verbo (neste caso um evento) só é aplicada com sucesso se o complemento tiver acessível, na sua estrutura, o tipo apropriado. No caso de (56), o complemento livro tem disponível na sua estrutura qualia dois tipos de evento, patentes no valor dos seus papéis télico e agentivo. (58) livro ESTR_ARG ESTR_QUALIA ARG1 x :informação ARG2 y : objecto_físico informação objecto_físico_ FORMAL conter(y,x) TÉLICO ler(e1,w,x y) AGENTIVO escrever(e2,v, x y) PLC Deste modo, e através do processo de coerção de complemento, o complemento adquire o tipo semântico requerido pelo verbo e as interpretações presentes em (56b) e (56c) são possíveis, sem qualquer alteração da estrutura sintáctica. Considerem-se agora os seguintes exemplos: 83
90 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (59) a. A Maria acredita no livro. (informação) b. A Maria rasgou o livro. (objecto físico) Contrariamente às estruturas em (56), nas frases em (59) os verbos acreditar e rasgar não seleccionam um complemento com o tipo evento. Ao observar a estrutura lexical de livro em (58), verifica-se que este item consiste num dot object que denota dois tipos semânticos diferentes: informação e objecto físico. Como se referiu anteriormente, um dot object consiste num par lógico de significados compostos por tipos individuais, formando um tipo complexo. Torna-se, assim, necessário definir, a partir do tipo complexo, as operações de extracção do tipo que contém o significado apropriado. Essas operações de coerção, que, a partir do tipo complexo (dot object), extraem um tipo particular, são definidas através dos operadores Σ 1 e Σ 2, como se evidencia em (60). (60) PLC {σ 1 σ 2, Σ 1[σ 1 σ 2]:σ 1, Σ 2[σ 1 σ 2]:σ 2} Informalmente, Σ n é uma função que entra no dot object e extrai um dos tipos disponíveis, fazendo emergir o tipo certo no contexto apropriado. (61) a. Σ 1[inf objecto_físico]:inf b. Σ 2[inf objecto_físico]:objecto_físico c. inf objecto_físico_plc {inf objecto_físico, inf, objecto_físico} Deste modo, através da aplicação das operações de coerção (AFC), subtipificação (Θ) e do operador Σ, é possível extrair os dois significados de livro, como se pode observar a partir de (62), permitindo interpretar adequadamente as estruturas em (59). (62) a. livro informação proposição b. livro objecto_físico indivíduo 84
91 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO CO-COMPOSIÇÃO A co-composição está directamente relacionada com a polissemia verbal e permite a derivação de novos sentidos em contexto, na medida em que consiste num mecanismo que opera na semântica do verbo e na semântica do nome que lhe serve de complemento, alterando o significado do primeiro. Considere-se, para o Inglês, o verbo bake, apresentado em Pustejovsky (1995a: 122), que, dependendo da natureza do complemento com que co-ocorre, pode ser interpretado como uma mudança de estado ou um processo de criação, conforme ilustram os exemplos (63a) e (63b), respectivamente. (63) a. John baked the potato. b. John baked the cake. De modo a captar os diferentes significados sem postular a existência de entradas lexicais distintas, Pustejovsky (1995a) propõe que os complementos contêm determinada informação que vai actuar sobre a semântica do verbo. Só existe uma entrada lexical para bake e qualquer outro significado é derivado através do mecanismo generativo de cocomposição. Considere-se a entrada lexical de bake, em (64) 13 : (64) bake E1 e1: process EVENTSTR HEAD e1 animate_in d ARG1 1 FORMAL physobj ARGSTR mass ARG2 2 FORMAL physobj state_change_lcp QUALIA AGENTIVE bake_act(e1, 1, 2 ) 13 Por respeitar a um item em inglês optou-se por reproduzir a entrada lexical original, a partir de Pustejovsky (1995a: 123). 85
92 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS Pertencente ao paradigma dos verbos de mudança de estado quando ocorre com nomes como potato, o verbo bake passa a pertencer ao paradigma dos verbos de criação quando ocorre com nomes como cake, bread ou cookie. A explicação para a alteração de significado do verbo reside no facto de, enquanto complementos como potato denotam um objecto natural, pelo que só podem sofrer uma mudança de estado, complementos como cake não existem na natureza, tendo, por isso, de sofrer um processo de criação. A distinção entre estes dois sentidos faz-se com base nas representações lexicais dos complementos, nomeadamente através do seu papel agentivo. Considere-se a entrada lexical de cake, em (65): (65) cake ARGSTR QUALIA ARG 1 D - ARG CONST FORMAL TELIC AGENTIVE x : food_ind 1 y : mass y x eat(e2,z, x) bake_act(e1, w, y) A partir das estruturas lexicais em (64) e (65) pode verificar-se que ambas partilham o valor do papel agentivo. A semântica do SV bake a cake resulta de duas operações básicas: (i) aplicação de uma função que liga o objecto à estrutura argumental do verbo bake (ARG 2); (ii) unificação do traço do quale agentivo: Q A(bake) Q A(the cake). Em (66) encontra-se representada a estrutura lexical do SV bake a cake. 86
93 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO 87 (66) < ) 3, 1 AGENTIVE ) 2 FORMAL QUALIA FORMAL 3 ARG FORMAL 3 CONST 2 ARG FORMAL 1 ARG ARGSTR HEAD RESTR E E EVENTSTR, bake_act(e, exist(e create_lcp mass material physobj artifact physobj animate_in d e e2 :state process : e bake a cake O resultado do mecanismo de co-composição consiste, assim, numa representação semântica a nível do SV. Para o português, este tipo de operação é normalmente ilustrado com o verbo cozer. Atente-se nos exemplos (67), apresentados em Berkeley Cotter (2002: 44): (67) a. O Manuel cozeu a carne. b. O Manuel cozeu o pão. Neste caso, o verbo cozer também pode denotar uma mudança de estado - (67a) - ou um processo de criação - (67b) - comportando-se do mesmo modo que bake. No entanto, como a autora refere, a distinção entre estes sentidos para o verbo cozer pode não ser tão linear em Português como o é em Inglês. Observem-se os seguintes exemplos (Berkeley Cotter, op. cit.: 46):
94 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (68) a. Vou pôr o pão a cozer. b. O pão já está a começar a ficar cozido. Em ambas as estruturas em (68) o item pão é interpretado como um artefacto já confeccionado, que ainda não está no estado cozido, ou seja, não há nenhum processo de criação, verificando-se somente a leitura de mudança de estado. De facto, parece que o verbo cozer não implica uma criação, mas apenas uma mudança de estado, independentemente do complemento que o acompanha. (...) talvez os falantes considerem o artefacto pão enquanto tal, assim que dão a sua confecção por terminada e não apenas após a sua cozedura. (Berkeley Cotter, op. cit.: 46) Vai ser, igualmente, através do mecanismo de co-composição, ou seja, através da interacção entre o significado de um item lexical e os significados dos seus argumentos, que é possível interpretar adequadamente estruturas como as apresentadas em (69). (69) a. A Maria abriu a carta. b. A Maria abriu a porta. Ao analisarmos as entradas lexicais de carta e porta, em (70) e (71), podemos observar que o papel télico destes nomes é ler e atravessar, respectivamente. (70) carta ESTR_ARG ESTR_QUALIA ARG1 x : objecto_físico ARG2 y :informação objecto_físico informação_plc FORMAL conter(x,y) TÉLICO ler(e1,z,x y) 88
95 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO (71) porta ESTR_ARG ESTR_QUALIA ARG1 x : objecto_físico ARG2 y : abertura objecto_físico abertura_plc TÉLICO atravessar(e1,z, y) O valor dos papéis télico dos complementos carta e porta é partilhado pelo valor do papel formal do predicado abrir, procedendo-se, deste modo, a uma unificação qualia entre o predicado e o complemento. Em (72) apresenta-se a representação lexical por defeito de abrir. (72) abrir E1 e1: processo ESTR_EVENT E2 e2 : estado RESTR < entidade ARG1 1 FORMAL indivíduo ESTR_ARG entidade ARG2 2 FORMAL objecto_físico causativo_por_defeito_plc ESTR_QUALIA FORMAL P(e2, [ TÉLICO( 2 )]) AGENTIVO acto_de_abrir(e 1, 1, 2 ) Em que representa o operador modal que exprime possibilidade. A partir da estrutura em (72) pode verificar-se que o argumento mais proeminente é ARG 2, ou seja, o argumento interno. É sobre o papel télico da estrutura deste argumento que o verbo abrir vai operar, procedendo-se a uma unificação de papéis qualia. 89
96 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS 90 Estruturas como abrir a carta e abrir a porta possibilitam a actualização do papel télico dos complementos, i.e., ler e atravessar. Deste modo, através do mecanismo generativo de co-composição, a unificação qualia é possível, permitindo captar um determinado significado verbal em contexto. Em (73) e (74) representam-se as estruturas resultantes da co-composição dos SV s abrir a carta e abrir a porta. (73) [ ] < ) 2,, acto_de_abrir(e ), P(e causativo_por_defeito_plc y) ler(e,z, x conter(x, y) informação_plc objecto_físico y :informação x : objecto_físico carta 2 indivíduo entidade estado : e processo : e abrir a carta 1 AGENTIVO 3 FORMAL ESTR_QUALIA 3 TÉLICO FORMAL ESTR_QUALIA ARG ARG ESTR_ARG ARG FORMAL 1 ARG ESTR_ARG RESTR E E ESTR_EVENT
97 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO 91 (74) [ ] < ) 2,, acto_de_abrir(e ), P(e causativo_por_defeito_plc y) atravessar(e,z, abertura_plc objecto_físico abertura y : objecto_físico x : porta indivíduo entidade :estado e processo : e porta abrir a 1 AGENTIVO 3 FORMAL ESTR_QUALIA 3 TÉLICO ESTR_QUALIA ARG ARG ESTR_ARG 2 ARG FORMAL 1 ARG ESTR_ARG RESTR E E ESTR_EVENT O mecanismo de co-composição permite, desta forma, fazer uso da informação semântica presente nos qualia, tanto do functor como dos seus argumentos LIGAÇÃO SELECTIVA A ligação selectiva está relacionada com a polissemia adjectival e opera dentro de estruturas nome-adjectivo. Considerem-se os seguintes exemplos:
98 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (75) a. O Carlos é um dactilógrafo rápido. b. Precisamos de um carro rápido para chegar a tempo. c. Há que tomar decisões rápidas. O adjectivo rápido tem significados diferentes em (75) em consequência da relação semântica que estabelece com o nome que modifica. Ou seja, o significado do adjectivo é parcialmente determinado pela semântica do nome com o qual co-ocorre. Através da operação de ligação selectiva o adjectivo selecciona uma determinada interpretação contida na estrutura qualia do nome que modifica. Neste caso, é o adjectivo que tem o papel de functor que é aplicado a um determinado papel quale do nome com o qual co-ocorre. Nos casos de dactilógrafo e carro é o papel télico (que denota actividade ou função) que é referido pelo adjectivo. No caso de decisões é o papel agentivo que é seleccionado. Em suma, a diferença de significados em frases como as apresentadas em (75) é explicada através de um dos papéis qualia do nome, sobre o qual o adjectivo opera. Observem-se as seguintes representações para dactilógrafo rápido, em (76), e decisões rápidas, em (77). (76) dactilógrafo rápido [ ] ESTR_EVENT E1 e1: estado dactilógrafo ARG1 x : humano ESTR_ARG ARG1 ESTR_ARG ARG2 y : texto FORMAL x ESTR_QUALIA [ ] TÉLICO dactilografar(e 2,x, y) ESTR_QUALIA FORMAL rápido(e1,e2) 92
99 3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO (77) decisões rápidas ESTR_EVENT ESTR_ARG ARG ESTR_QUALIA [ E1 e1:estado] decisões ARG1 y : humano ESTR_ARG ARG2 x :abstracto FORMAL x ESTR_QUALIA AGENTIVO tomar(e2, 1 y, x) [ ] FORMAL rápido(e1,e2) Enquanto adjectivos como rápido seleccionam eventos, denotados pelos valores dos papéis télico ou agentivo dos nomes com os quais se combinam, adjectivos como bonito seleccionam objectos, denotados pelo valor do papel formal. Uma estrutura como dactilógrafo bonito teria a seguinte representação: (78) dactilógrafo bonito [ ] ESTR_EVENT E1 e1: estado dactilógrafo ARG1 x : humano ESTR_ARG ARG1 ESTR_ARG ARG2 y : texto FORMAL x ESTR_QUALIA [ ] TÉLICO dactilografar(e 2,x, y) ESTR_QUALIA FORMAL bonito(e 1, x) A diferença entre (76) e (77), por um lado, e (78), por outro, reside no facto de os adjectivos se aplicarem a distintos papéis qualia de dactilógrafo: rápido aplica-se ao papel télico, enquanto bonito se aplica ao papel formal. Contrariamente a abordagens como os Léxicos Enumerativos de Sentidos, o modelo do Léxico Generativo propõe uma única entrada lexical complexa, na qual está 93
100 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS codificada toda a informação pertinente para a interpretação do item lexical. Esta informação encontra-se distribuída por vários níveis de representação, que, por sua vez, se relacionam com vários mecanismos generativos, permitindo obter a interpretação adequada do item polissémico no contexto apropriado. 94
101 4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO 4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO... generative lexicon theory (GL) has succeeded in describing and explaining many cases of systematic polysemy. (Buitelaar, 1998: 29) Após a apresentação de várias abordagens utilizadas na representação dos itens lexicais, este capítulo centra-se no modelo do Léxico Generativo, quadro teórico em que este estudo se insere. Caracterizados os níveis de representação, que codificam toda a informação pertinente associada aos itens lexicais, bem como os mecanismos generativos, que, interagindo com essa informação, captam a variação de sentidos em contexto, cabe agora reflectir sobre alguns casos de polissemia em particular. Em termos gerais, neste capítulo procede-se a uma caracterização de algumas expressões polissémicas, do modo como são representadas no quadro do LG, salientando as virtualidades e dificuldades encontradas, bem como algumas questões sobre a aplicação dos mecanismos de coerção TIPOS NOMINAIS COMPLEXOS Considere-se novamente o item livro, polissémico entre as interpretações de objecto físico e informação, cuja entrada lexical se apresenta em (1), de acordo com o modelo do LG. 95
102 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (1) livro ESTR_ARG ESTR_QUALIA ARG1 x :informação ARG2 y : objecto_físico informação objecto_físico_ FORMAL conter(y,x) TÉLICO ler(e1,w,x y) AGENTIVO escrever(e2,v, x y) PLC O PLC 1 de livro representa o tipo complexo (x y), que é composto pelos tipos simples (x:informação) e (y:objecto_físico). Como já foi referido, o PLC contém todas as combinações possíveis entre os tipos, ou seja, os dois tipos simples e o tipo complexo resultante da sua combinação. Quando o PLC surge em contexto torna-se necessário extrair, a partir do tipo complexo, o tipo que contém o significado apropriado. Essa extracção é feita através do operador Σ, que, do dot object, extrai um dos três tipos disponíveis cada um dos tipos individuais e o próprio tipo complexo - como se pode ver a partir da função apresentada em (2) e contextualizada em (3). (2) PLC {σ 1 σ 2, Σ 1[σ 1 σ 2]:σ 1, Σ 2[σ 1 σ 2]:σ 2} (3) a. Σ 1[inf objecto_físico]:inf b. Σ 2[inf objecto_físico]:objecto_físico c. inf objecto_físico_plc {inf objecto_físico, inf, objecto_físico} Analisem-se, agora, os seguintes exemplos: (4) a. O João leu o livro. b. O João escreveu o livro. c. O João acredita no livro. 1 Para uma definição de PLC cf
103 4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO (5) a. O João rasgou o livro. b. O João estragou o livro. c. O João sujou o livro. (6) O cão estragou o livro mais divertido que eu tinha. Nas frases em (4) os predicados ler, escrever e acreditar seleccionam o tipo simples que denota informação. Nas frases em (5), os predicados rasgar, estragar e sujar seleccionam o tipo simples objecto físico. Finalmente, em (6), a ocorrência dos predicados estragar e divertido na mesma estrutura seleccionam o tipo complexo informação objecto_físico, na medida em que cada um dos predicados é aplicado sobre um tipo simples distinto, fazendo emergir ambos os tipos na mesma estrutura. Formalmente, na selecção dos tipos semânticos são aplicados os mecanismos de coerção de subtipo -Θ - e de coerção de complemento - Σ. Em (7) e (8) encontram-se representados os mecanismos aplicados na extracção do tipo informação. (7) a. Θ [livro informação] : livro informação b. Θ [informação proposição] : informação proposição (8) Σ1(inf Θ objecto_físico) : inf, Θ[ inf proposição] :inf [ inf proposição] ( Σ1(inf objecto_físico)) : proposição proposição A estrutura em (7) mostra como o operador Θ permite derivar um supertipo, através da hierarquia de tipos (livro informação proposição). No que respeita à estrutura em (8), esta ilustra como o operador Σ permite extrair o tipo informação (inf) que pode, por sua vez, ser usado por Θ para obter o supertipo proposição. Em (9) é apresentada a interpretação semântica associada à representação em (8). Em (9b) é aplicado o mecanismo de coerção de complemento que extrai o tipo semântico adequado (inf). Em (9c) é aplicado o mecanismo de coerção de subtipo que permite interpretar adequadamente livro como uma proposição, tornando possível interpretar correctamente a estrutura O João acredita no livro como o João acredita na informação que está no livro. 97
104 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (9) a. O João acredita no livro. b. acreditar( Θ (Σ 1(livro))) (João) c. acreditar( Θ (livro:inf)) (João) d. acreditar(livro:proposição) (João) No que respeita à extracção do tipo objecto físico, em (10) e (11) encontram-se representados os mecanismos aplicados. (10) a. Θ [livro obj_físico] : livro obj_físico b. Θ [obj_físico indivíduo] : obj_físico indivíduo (11) Σ1(inf, Θ[ obj_físico indivíduo ]: obj_físico [ obj_físico indivíduo ]( Σ1(inf objecto_físico)) : indivíduo obj_físico ) : obj_físico Θ indivíduo À semelhança do que se observou anteriormente, em (12) é apresentada a interpretação semântica associada à representação em (11), a partir da qual é possível interpretar adequadamente o João sujou o livro como o João sujou o objecto físico que livro representa. (12) a. O João sujou o livro. b. sujar(θ (Σ 1(livro))) (João) c. sujar(θ (livro:obj_físico)) (João) d. sujar(livro:indivíduo) (João) Nos exemplos analisados, os mecanismos de coerção, nomeadamente de coerção de subtipo (Θ ) e de coerção de complemento (Σ), permitem, desta forma, seleccionar o tipo semântico requerido pelo verbo, obtendo-se a interpretação adequada no contexto apropriado. 98
105 4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO SELECÇÃO SEMÂNTICA E INTERPRETAÇÃO DE TIPOS COMPLEXOS Como se pode verificar, alguns predicados são semanticamente especificados na medida em que seleccionam directamente um tipo semântico particular. É o caso de ler, escrever, acreditar ou divertido, entre outros, que seleccionam o tipo informação, ou de rasgar, sujar, riscar ou cair, entre outros, que seleccionam o tipo objecto físico. No entanto, existem alguns predicados que podem ser vagos no que respeita ao tipo semântico que seleccionam. Observem-se os exemplos apresentados em (13) (13) a. O João gostou do livro porque tem uma capa bonita. b. O João gostou do livro porque a história é divertida. c. O João gostou do livro. É importante salientar, nestes casos, as propriedades de selecção do predicado gostar que, semanticamente, selecciona um complemento com uma interpretação eventiva. A presença das orações subordinadas causais em (13a) e (13b) remetem para a interpretação de livro como objecto físico e informação, respectivamente. No entanto, em (13c), não há nenhuma informação que especifique quais são os aspectos de livro de que o João gosta. Tanto pode ser denotado o objecto físico (capa, tamanho, qualidade do papel), como a informação (história, estilo de escrita), como, ainda, o objecto físico e a informação simultaneamente. Note-se ainda que o nome livro tem acessível, como parte da sua especificação lexical, um papel agentivo e um papel télico, relativos ao seu processo típico de criação e uso, respectivamente. Deste modo, se se aludir ao significado de informação - (13b) -, a frase tem ainda como interpretações possíveis O João gostou de ler/escrever o livro. Para a estrutura em (13c) são possíveis os vários contextos presentes em (14), que forçam uma dada interpretação. Nos exemplos em (15) representa-se a forma lógica de cada interpretação. 99
106 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (14) a. O João gostou do livro. É de fácil leitura. b. O João gostou do livro. Divertiu-se muito a escrevê-lo. c. O João gostou do livro. A capa é bonita e o papel é de boa qualidade. d. O João gostou do livro. A capa é bonita e a história é muito divertida. (15) a. x y e e [gostar(e, João, e ) ler(e, João, y) livro(x:obj y:inf)] b. x y e e [gostar(e, João, e ) escrever(e, João, y) livro(x:obj y:inf)] c. x y e[gostar(e, João, x) livro(x:obj y:inf)] d. x y e[gostar(e, João, x y) livro(x:obj y:inf)] No entanto, a leitura preferencial e imediatamente reconhecida pelos falantes é a de informação, mais particularmente aquela que alude ao papel télico de livro, ou seja, ler. Contudo, a interpretação que se refere ao papel agentivo, i.e. escrever, também é aceite, principalmente se a estrutura envolver aspectos relativos ao conhecimento do mundo, como se pode observar em (16). (16) O Ensaio Sobre a Cegueira é o livro de que Saramago gostou mais. Finalmente, a interpretação de objecto físico (14c) parece ser mais forçada do que as anteriores, mas também é aceite pelos falantes e prevista pelo modelo. Note-se que os predicados que se encontram numa relação de sinonímia, antonímia ou hiponímia com gostar apresentam um comportamento semântico semelhante. (17) a. O João apreciou/adorou o livro. b. O João detestou/odiou o livro. A par de predicados como gostar, predicados como vender ou comprar, quando seleccionam complementos como livro, também admitem ambiguidade relativamente ao tipo semântico que seleccionam. (18) O Pedro vendeu o livro. 100
107 4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO Neste caso, o complemento livro pode ser interpretado quer como objecto físico leitura mais imediata quer como informação, na medida em que vender o livro pode ser entendido como vender o conteúdo informacional O PAPEL CONSTITUTIVO Quando os itens lexicais denotam tipos complexos, uma das questões que se coloca no modelo do LG diz respeito à atribuição do valor respeitante ao seu papel constitutivo. Pustejovsky (1995a) não apresenta nenhuma especificação relativamente a este quale. Na verdade, o autor defende a não obrigatoriedade de atribuir valores a todos os papéis da estrutura qualia. There are two general points that should be made concerning qualia roles: (1) Every category expresses a qualia structure; (2) Not all lexical items carry a value for each qualia role. (Pustejovsky, 1995a: 76) No caso das expressões polissémicas, verifica-se que os dois tipos simples que compõem o tipo complexo apresentam constituições diferentes. Relativamente a livro, se, por um lado, enquanto objecto físico livro é composto por capa, folhas e páginas, enquanto informação livro é, por sua vez, composto por capítulos, parágrafos, frases, palavras, entre outros. Deste modo, o valor do papel constitutivo de livro teria uma representação como a apresentada em (19). 101
108 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (19) livro ESTR_ARG ESTR_QUALIA ARG1 x :informação ARG2 y : objecto_físico informação objecto físico_ PLC FORMAL conter(y,x) CONST [ capa(a) parte_de(a, y) folha(b) parte_de(b, y) palavra(c) parte_de(c, x) frase(d) parte_de(d, x)... ] TÉLICO ler(e1, w,x y) AGENTIVO escrever(e2,v, x y) No entanto, esta enumeração exaustiva não é a opção mais económica. Como se referiu no capítulo 3.3.2, para se obter a representação semântica de um item lexical é necessário que este aceda a um tipo semântico, presente numa rede de tipos hierarquicamente organizada, de modo a permitir a herança de traços dos seus supertipos. Assim, também a informação respeitante à estrutura qualia é herdada através da estrutura de tipos. Deste modo, pode deduzir-se que livro herda o valor do papel constitutivo dos seus supertipos - respeitantes ao objecto físico e à informação não sendo necessário listar esse valor na sua entrada lexical. O mesmo processo de herança de valores dos papéis qualia parece ser válido para outros itens polissémicos como banco ou cerejeira, por exemplo. Cerejeira herdará constituintes como folhas, ramos, tronco, ou raiz, a partir do supertipo árvore. Por outro lado, herdará constituintes como veios ou nódulos, a partir do supertipo madeira. Relativamente a banco, este herdará constituintes como paredes, tecto ou janelas, a partir do supertipo edifício, bem como os constituintes trabalhadores ou directores, a partir do supertipo instituição. Um dos aspectos que merece particular atenção acerca dos elementos constituintes ou partes - de livro tem a ver com o facto de estes poderem representar, ou não, casos análogos de polissemia regular. Considerem-se, primeiramente, os constituintes relativos ao tipo objecto físico, como capa, folhas e páginas. 102
109 4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO Relativamente a capa, importa realçar a relação de metonímia existente entre as interpretações de cobertura dura ou mole que protege as folhas que constituem o livro, por um lado, e face oposta à contracapa, por outro. No primeiro caso, capa é, por sua vez, constituída pela lombada, pela contracapa e pela parte da frente, ou capa. Os exemplos em (20) ilustram as duas acepções mencionadas. (20) a. Os livros de capa mole são mais baratos. (cobertura) b. Comprei o livro que tem o Stephen Hawking na capa. (oposto à contracapa) Considerem-se agora os exemplos de (21) e (22): (21) a. Esta capa está riscada/suja/mal impressa. b. Esta folha está riscada/suja/mal impressa. c. Esta página está riscada/suja/mal impressa. (22) a. Esta capa é deprimente/falaciosa/confusa. b.??esta folha é deprimente/falaciosa/confusa. c. Esta página é deprimente/falaciosa/confusa. Enquanto nas estruturas em (21) os itens capa, folha e página são interpretados como objecto físico, em (22) os mesmos itens denotam a informação contida no respectivo objecto físico. A gramaticalidade de (22a) e (22c) mostra que os constituintes de livro - capa e página - apresentam o mesmo tipo de polissemia que o seu holónimo, ou seja, permitem a alternância entre as interpretações de objecto físico e informação. No que respeita a folha, a interpretação de objecto físico parece ser mais proeminente. De facto, quando se refere o tipo informação página parece ser a expressão mais aceite. Atente-se agora nos constituintes relativos ao tipo informação, como frases, parágrafos e desenho. 103
110 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (23) a. Esta frase é deprimente/falaciosa/confusa. b. Este parágrafo é deprimente/falacioso/confuso. c. Este desenho é deprimente/falacioso/confuso. (24) a. Esta frase está riscada/suja/mal impressa. b. Este parágrafo está riscado/sujo/mal impresso. c. Este desenho está riscado/sujo/mal impresso. Como se pode ver a partir dos exemplos em (23) e (24) os itens frase, parágrafo e desenho, a par de livro, também apresentam um comportamento polissémico, podendo entrar em construções que seleccionam quer o tipo informação quer o tipo objecto físico. Este último pode ser explicado tendo em consideração que estes elementos ocupam um determinado espaço físico num dado objecto físico. Tendo já em consideração que os elementos que se encontram numa relação de subtipificação com livro - como romance ou dicionário - por herdarem certos traços do seu supertipo são expressões que apresentam igualmente a alternância entre as interpretações de objecto físico e informação, esta secção tinha como objectivo principal questionar se os seus constituintes, ou merónimos, também apresentavam esta alternância de significados. A partir da análise dos exemplos de (21) a (24) pode verificar-se que os diferentes constituintes referentes aos dois tipos denotados por livro também apresentam comportamento polissémico ADJECTIVOS RELATIVOS E MODIFICADORES DE PROPRIEDADE Como se referiu anteriormente no capítulo 2, o mesmo adjectivo pode ter significados diferentes conforme se encontra em posição pré-nominal ou pós-nominal. (25) O António é um marinheiro velho. #O António é marinheiro há muito tempo. O António é um marinheiro de idade avançada. 104
111 4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO (26) O António é um velho marinheiro. O António é marinheiro há muito tempo. O António é um marinheiro de idade avançada. Na terminologia de Bouillon (1999), cuja proposta se explora nesta secção 2, enquanto em (25) o adjectivo velho é RELATIVO e a frase tem como única interpretação o António é um marinheiro de idade avançada, em (26) o adjectivo é MODIFICADOR DE PROPRIEDADE 3 e a frase pode ser interpretada tanto como o António é marinheiro há muito tempo, como o António é um marinheiro de idade avançada 4. O comportamento de adjectivos como velho origina, assim, o levantamento de algumas questões: (i) Como é que se podem derivar os significados de relativo e de modificador de propriedade a partir das representações do nome e do adjectivo? (ii) Como é que o adjectivo velho pode ser ambíguo entre os significados de relativo e de modificador de propriedade quando se encontra em posição pré-nominal (Adj N), como se pode observar a partir de (26)? (iii) Por que é que nem todas as construções Adj N apresentam essa alternância de significados (por exemplo, porque é que se pode interpretar um velho amigo como alguém que é amigo há muito tempo, mas estruturas como um velho homem ou uma velha tia não podem ser interpretadas como alguém que é homem/tio há muito tempo )? (iv) Por que é que o adjectivo tem de preceder o nome para que a interpretação de modificador de propriedade seja possível (um marinheiro velho dificilmente é interpretado como alguém que é marinheiro há muito tempo )? 2 As representações aqui propostas seguem no essencial a análise de Bouillon (1999) para o Francês. 3 Como se referiu em 2.5.3, na terminologia de Bouillon (1997, 1999), o adjectivo é RELATIVO quando se encontra em posição pós-nominal e MODIFICADOR DE PROPRIEDADE quando se encontra em posição prénominal. 4 Os juízos de valor podem variar relativamente à interpretação de frases como O António é um velho marinheiro. Ainda que a interpretação preferencial seja o António é marinheiro há muito tempo, em que o adjectivo adquire o valor de modificador de propriedade, não se exclui, neste trabalho, a interpretação de idoso. Note-se, contudo, que esta última não é decorrente da primeira, ou seja, não é necessariamente verdade que, sendo marinheiro há muito tempo, o António seja um indivíduo idoso. 105
112 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS Nas próximas secções tentar-se-á responder a estas questões no quadro do modelo do LG. As representações subespecificadas permitem derivar os diferentes significados de adjectivos como velho, tendo em atenção a semântica do próprio adjectivo, a semântica do nome e o modo como ambos se combinam TRANSCRIÇÃO DE TIPO No que respeita à semântica de adjectivos como velho, estes podem modificar tanto nomes que denotem indivíduos como nomes que denotem estados, como se pode observar a partir dos exemplos (27) e (28), respectivamente. (27) a. um velho homem b. um velho cão (28) a. uma velha amizade b. um velho amor Bouillon (1999) defende que existe uma relação entre os tipos indivíduo e estado, uma vez que quando adjectivos como velho se combinam com um nome que denota um indivíduo está implícito que este se encontra num determinado estado. A partir das estruturas em (27) pode observar-se que homem e cão, ainda que denotando indíviduos, é o estado de existir que é modificado: existem há bastante tempo. Os adjectivos como velho podem combinar-se com nomes que denotem argumentos de tipos diferentes. No caso de marinheiro, por exemplo, que, por poder ser definido como alguém que tem aptidão para navegar, pode ser caracterizado como tendo argumentos de três tipos: humano, estado (ter aptidão) e processo (navegar). De acordo com o modelo do LG, o adjectivo tem acesso à estrutura qualia do nome com o qual se combina (Ligação Selectiva) 5. Note-se que os adjectivos como velho podem modificar dois tipos semânticos diferentes ( indivíduo e estado ). Deste modo, estes 5 Cf. capítulo
113 4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO adjectivos podem predicar sobre ambos os tipos contidos na estrutura qualia do nome, dando origem à ambiguidade presente nas construções Adj N. Estruturas como um velho marinheiro podem ser interpretadas do seguinte modo: (i) o adjectivo é aplicado ao argumento do tipo humano denotado por marinheiro, obtendo-se a interpretação de um indivíduo velho que tem aptidão para navegar ; (ii) o adjectivo é aplicado ao argumento do tipo estado (ter aptidão), obtendo-se a interpretação de alguém que tem aptidão para navegar há bastante tempo. Em (29) encontra-se representada a entrada lexical para o adjectivo velho, adaptada de Bouillon (1999: 7). (29) velho ESTR_ARG ESTR_EVENT estado_ PLC ESTR_QUALIA FORMAL existir(e 1, x [ ARG1 x :indivíduo e2 : estado] [ E1 e1: estado] e2) velho(e 1) A estrutura em (29) representa um estado - existir(e 1,x e 2) - que é velho - velho(e 1). Bouillon (1999) propõe que o adjectivo toma como argumento o tipo complexo indivíduo estado. Esta proposta é inovadora na medida em que, ao considerar que o adjectivo apresenta um argumento do tipo complexo, o adjectivo tem, necessariamente, acesso aos tipos que compõem esse tipo complexo, podendo predicar sobre nomes que denotem apenas um desses tipos. No entanto, no caso de o adjectivo modificar um nome que denote somente o tipo indivíduo, por exemplo, este vai ser coagido de modo a denotar igualmente um estado através de um processo de TRANSCRIÇÃO DE TIPO: o indivíduo encontra-se num estado de existência e esse estado é velho. A TRANSCRIÇÃO DE TIPO é uma variante à COERÇÃO DE TIPO. Em vez de alterar o tipo semântico do argumento para o tipo requerido pelo predicado, a transcrição de tipo adiciona à semântica do argumento a informação presente na semântica do predicado. A sua aplicação depende de dois factores: (i) o adjectivo seleccionar um tipo complexo indivíduo estado; (ii) o argumento denotar um tipo contido no tipo complexo do adjectivo. Deste modo, o argumento não sofre alteração de tipo, apenas lhe é acrescentada 107
114 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS informação relativa ao outro tipo simples que faz parte do tipo complexo do adjectivo, que ele não possui POSIÇÃO DO ADJECTIVO De acordo com a classificação apresentada em 2.5.3, velho é um adjectivo predicativo que pode ocorrer tanto em posição adnominal (um homem velho/um velho homem), como em posição predicativa (este homem é velho). Tendo em consideração esta propriedade distribucional, esta secção tem como objectivo analisar o modo como o adjectivo se combina com diferentes tipos de nomes no LG, quer em posição adnominal quer em posição predicativa. Distinguir-se-ão três tipos de nomes: (i) nomes com o tipo simples indivíduo ; (ii) nomes com o tipo simples estado ; (iii) nomes que contêm na sua estrutura semântica elementos com o tipo indivíduo e com o tipo estado NOMES COM O TIPO SIMPLES INDIVÍDUO indivíduo. Considere-se em (30) a representação do nome homem, que denota o tipo simples homem (30) ESTR_ARG [ ARG1 x :indivíduo ] indivíduo_ PLC ESTR_QUALIA FORMAL x 108
115 4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO Quando se combina com nomes como homem, os adjectivos como velho só podem ser aplicados ao tipo semântico indivíduo, adicionando, através do mecanismo de transcrição de tipo, o tipo estado, constituinte do tipo complexo indivíduo estado exigido pelo adjectivo. Em posição predicativa, o conteúdo semântico do nome é inserido no papel formal da estrutura qualia do adjectivo, como se pode ver em (31). (31) este homem é velho ESTR_ARG ESTR_EVENT estado_ PLC ESTR_QUALIA FORMAL existir(e 1,x [ ARG1 x :indivíduo e2 :estado] [ E1 e1:estado] e2) velho(e 1) homem(x) :indivíduo Em posição adnominal, é o conteúdo semântico do adjectivo que é inserido no papel formal da estrutura qualia do nome, como se pode ver em (32). um homem velho / um velho homem (32) ESTR_ARG [ ARG1 x :indivíduo ] indivíduo_ PLC ESTR_QUALIA FORMAL x velho(e 1) :existir(e 1, x e2) velho(e 1) Uma vez que o nome denota apenas um dos tipos simples - indivíduo - que constituem o tipo complexo denotado pelo adjectivo, este só pode modificar o estado existir (que surge no conteúdo semântico do nome através do mecanismo de transcrição de tipo) aplicado ao indivíduo denotado pelo nome. Em (33) verifica-se que só existe uma interpretação possível, independentemente da posição ocupada pelo adjectivo. 109
116 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (33) a. um homem velho b. um velho homem c. Este homem é velho. Um indivíduo que existe há bastante tempo NOMES COM O TIPO SIMPLES ESTADO estado. Considere-se em (34) a representação do nome amizade, que denota o tipo simples (34) amizade ESTR_ARG ESTR_EVENT ESTR_QUALIA ARG - D1 x :indivíduo ARG - D2 y :indivíduo [ E1 e1:estado] estado_ PLC FORMAL amizade(e 1, x, y) Do mesmo modo que se verificou anteriormente com o nome homem, que denota somente o tipo simples indivíduo, o nome amizade denota somente o tipo simples estado. Quando nomes como amizade se combinam com adjectivos como velho, estes só podem modificar o estado existir aplicado a esse tipo. A junção do conteúdo semântico do adjectivo ao conteúdo semântico do nome processa-se do mesmo modo que se verificou com homem. Quando o nome denota um tipo simples - estado ou indivíduo - o adjectivo modifica unicamente esse tipo e é sempre interpretado como relativo, não gerando qualquer ambiguidade dependente da sua posição. 110
117 4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO NOMES QUE DENOTAM PARES INDIVÍDUO - ESTADO Considere-se a representação do nome alcoólico, que denota argumentos tanto do tipo indivíduo como do tipo estado. (35) alcoólico ESTR_ARG ESTR_EVENT ESTR_QUALIA [ ] ARG1 x :indivíduo E1 - D e1: estado E2 - D e2 : processo agentivo_ PLC FORMAL x TÉLICO beber(e2, x) AGENTIVO ter_hábito_de(e 1, x,e2) Bouillon (1999) distingue o que considera o NÚCLEO, ou seja, os argumentos e os eventos verdadeiros denotados pelo item lexical, em contraste com os argumentos e os eventos por defeito. No caso de alcoólico o núcleo é ARG 1, enquanto os eventos por defeito são E 1-D e E 2-D. Dependendo do tipo de argumento sobre o qual o adjectivo vai ser aplicado, este relaciona-se com o nome de modos diferentes: (i) se o adjectivo se aplicar ao núcleo do nome é interpretado como relativo; (ii) se o adjectivo não se aplicar ao núcleo do nome é interpretado como modificador de propriedade. Por seleccionar o tipo complexo indivíduo estado, os adjectivos como velho, quando se combinam com nomes cujos argumentos denotam igualmente estes dois tipos, vão adquirir uma interpretação relativa e de modificadores de propriedade. Observem-se as representações em (36) e (37): 111
118 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (36) um velho alcoólico / um alcoólico velho ESTR_ARG [ ARG1 x :indivíduo ] E1 - D e1: estado ESTR_EVENT E2 - D e2 : processo agentivo_ PLC FORMAL x velho(e 3) : existir(e 3, x ESTR_QUALIA TÉLICO beber(e2,x) AGENTIVO ter_hábito_de(e 1,x,e2) e2) velho(e 3) (37) um velho alcoólico ESTR_ARG [ ARG1 x :indivíduo ] E1 - D e1: estado ESTR_EVENT E2 - D e2 : processo agentivo_ PLC FORMAL x ESTR_QUALIA TÉLICO beber(e2,x) AGENTIVO ter_hábito_de(e 1,x,e2) velho(e 3) : existir(e 3, x e2) velho(e 3) Em (36) o adjectivo modifica o tipo indivíduo, ou seja, o núcleo da estrutura de alcoólico, adquirindo uma interpretação relativa, independentemente de se encontrar em posição pré ou pós-nominal ambas as estruturas um alcoólico velho e um velho alcoólico têm a interpretação de idade avançada, ou seja, um indivíduo que existe há bastante tempo e que é alcoólico. A informação semântica do adjectivo é inserida no papel formal da estrutura qualia, ou seja, o papel que denota o tipo indivíduo. A outra interpretação possível para o adjectivo em posição pré-nominal um indivíduo que é alcoólico há bastante tempo - encontra-se representada em (37). O adjectivo modifica o tipo estado e o seu conteúdo semântico é inserido no papel agentivo, ou seja, o papel que denota o hábito de beber. Quando o adjectivo se encontra em posição predicativa este alcoólico é velho é a informação semântica do nome que é inserida no papel formal da estrutura qualia do 112
119 4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO adjectivo. A construção predicativa só tem como interpretação um indivíduo que existe há bastante tempo e que é alcoólico. Nas construções predicativas, independentemente de os nomes que se combinam com o adjectivo denotarem argumentos com apenas um dos tipos ou ambos os tipos que constituem o tipo complexo denotado pelo adjectivo, este só modifica o tipo indivíduo. A representação de este alcoólico é velho, em (38), é, deste modo, semelhante à de este homem é velho, apresentada em (31). (38) este alcoólico é velho ESTR_ARG ESTR_EVENT estado_ PLC ESTR_QUALIA FORMAL existir(e 1,x [ ARG1 x :indivíduo e2 : estado] [ E1 e1: estado] e2) velho(e 1) alcoólico(x) :indivíduo Através do modelo do LG é possível, deste modo, representar os diferentes significados que os adjectivos como velho podem adquirir, dependendo da posição que ocupam relativamente ao nome com o qual se combinam. As diferentes interpretações de idade avançada, por um lado, e existência num determinado estado há bastante tempo, por outro, são representadas através da modificação de valores de papéis qualia distintos da semântica do nome. Enquanto no primeiro caso o adjectivo modifica o valor do papel formal, no segundo caso o adjectivo modifica o valor do papel agentivo CAUSATIVOS ASPECTUAIS Os predicados causativos aspectuais, como começar, apresentam um comportamento polissémico na medida em que, do ponto de vista sintáctico, permitem a selecção de diferentes tipos de complementos, como se pode observar a partir das estruturas em (39). 113
120 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (39) a. O João começou o livro b. O João começou a ler o livro. c. O João começou a escrever o livro. Como foi referido no capítulo anterior, os diferentes contextos sintácticos são explicados através de um mecanismo de coerção que coage os complementos que não apresentam o tipo sintáctico-semântico requerido pelo verbo a adquirir esse tipo sintáctico-semântico 6. O facto de a estrutura em (39a) poder ser ambígua entre as estruturas (39b) e (39c) prende-se com o facto de o verbo começar seleccionar um evento que pode ser denotado pelos valores dos papéis télico e agentivo do nome que lhe serve de complemento, neste caso, livro. No entanto, alguns autores têm contestado a aplicação do mecanismo generativo de coerção de tipo como uma estratégia eficaz no que respeita à interpretação adequada de algumas estruturas da língua. Na próxima secção analisar-se-ão algumas estruturas que parecem apresentar-se como contra-exemplos à aplicação dos mecanismos de coerção, mas que, como se verá, também podem ser analisadas através destes mecanismos ALGUMAS QUESTÕES SOBRE A COERÇÃO Algumas estruturas com começar parecem revelar que alguns complementos nominais não permitem a aplicação dos processos de coerção, tornando-se necessário restringir a acção dos mecanismos de coerção por forma a não haver sobregeração de interpretações. Atente-se nos seguintes exemplos: (40) a. *O João começou o dicionário. (... começou a consultar...) b. *O João começou a auto-estrada. (... começou a conduzir...) 6 Cf. capítulo
121 4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO O que as estruturas em (40) evidenciam é que, para as interpretações em questão, o mecanismo de coerção falha, gerando agramaticalidade, por não encontrar no papel télico do complemento nominal - consultar no caso de dicionário e conduzir no caso de autoestrada - o tipo esperado pelo verbo começar. Em Pustejovsky & Bouillon (1996) argumenta-se que os verbos causativos como começar seleccionam um evento do tipo transição, excluindo, consequentemente, as interpretações de consultar o dicionário e conduzir a auto-estrada, visto tratar-se de processos. Deste modo, as estruturas em (40) terão uma interpretação adequada se o mecanismo de coerção se aplicar ao papel agentivo dos complementos, que denota o acto de criação, ou seja, um evento de transição do tipo esperado (cf. 41). (41) a. O João começou o dicionário. (... começou a compilar...) b. O João começou a auto-estrada. (... começou a construir...) A mesma explicação sobre a selecção de complementos que denotem transições está na base da agramaticalidade das estruturas em (43). (42) a. O João começou o livro. (... começou a ler/escrever...) b. O João começou o queijo. (...começou a comer...) (43) a. *O João começou livros. (... começou a ler/escrever...) b. *O João começou queijos. (... começou a comer...) Enquanto em (42) a estrutura eventiva denota uma transição, sendo a aplicação do mecanismo de coerção bem sucedida, em (43), a indefinitude do SN complemento altera o tipo de evento de transição para processo, falhando a aplicação do mecanismo de coerção. Deste modo, conclui-se que os complementos seleccionados pelos verbos causativos aspectuais têm de ter associada uma estrutura eventiva do tipo transição, disponível directamente ou através do mecanismo de coerção. Outra restrição à aplicação do mecanismo de coerção está relacionada com as estruturas de controlo e de elevação em que alguns verbos causativos aspectuais podem entrar. Atente-se nos seguintes exemplos: 115
122 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (44) a. A festa começou. b. O jantar começou. Para além das estruturas de controlo como as apresentadas em (39), o verbo começar pode, também, entrar em construções de elevação como as apresentadas em (44). A relação sintáctica existente entre as construções de controlo e de elevação é, de alguma forma, semelhante à relação existente entre as construções causativas e incoativas, como se pode observar a partir de (45) e (46). (45) a. O avião afundou o barco. b. O barco afundou. (46) a. A Maria começou o filme. b. O filme começou. Pustejovsky (1995a) propõe que se aplique o conceito de causalidade à alternância entre as construções de controlo e de elevação.... both raising and control constructions exist for the same aspectual predicate, given that causative and unaccusative forms exist for the same predicate, as with sink. That is, we can view the relation between these two constructions as one involving causation in much the same way as the default causative paradigm. (Pustejovsky, 1995a: 201) Apesar de os significados associados às estruturas de controlo e de elevação estarem estreitamente relacionados, em Pustejovsky & Bouillon (1996) defende-se que só as estruturas de controlo permitem a coerção. Atente-se nos seguintes exemplos: (47) a. O Rui começou a escrever a tese. b. O Miguel começou a beber a cerveja. c. O ácido começou a corroer o mármore. d. O João começou a ficar enjoado. 116
123 4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO Um dos testes-diagnóstico que permite distinguir os predicados de controlo dos predicados de elevação consiste em construir estruturas com o verbo forçar, denominadas CONSTRUÇÕES COMPLEMENTO DE FORÇAR (force-complement constructions). Apenas o sentido de controlo satisfaz as restrições de selecção impostas pelo verbo forçar. (48) a. O João forçou o Rui a escrever a tese. b. A Ana forçou o Miguel a beber a cerveja. c. *O Luís forçou o ácido a corroer o mármore. d. *A Sofia forçou o João a ficar enjoado. Conforme se pode observar a partir das estruturas com o verbo forçar em (48), de acordo com este teste-diagnóstico, a gramaticalidade de (48a) e (48b) permite concluir que o verbo começar em (47a) e (47b) é um predicado de controlo, que selecciona uma transição, e que permite a aplicação dos mecanismos de coerção. (49) a. O Rui começou a tese. (... começou a escrever...) b. O Miguel começou a cerveja. (... começou a beber...) Pelo contrário, a agramaticalidade de (48c) e (48d) permite admitir que o verbo começar em (47c) e (47d) é um predicado de elevação, que selecciona, nos exemplos mencionados, um processo e um estado, respectivamente, mas que não coloca restrições quanto à estrutura eventiva do seu complemento 7. Estes predicados não permitem a aplicação dos mecanismos de coerção. (50) a. *O ácido começou o mármore (... começou a corroer...) b. *O João começou o enjoo. (... começou a ficar...) Deste modo, ainda que possa ocorrer em construções de controlo e de elevação, a natureza da estrutura eventiva do complemento com que co-ocorre em cada um dos casos é diversa: enquanto predicado de controlo selecciona apenas transições ao passo que 7 Para mais argumentação sobre esta análise cf. Pustejovsky & Bouillon (1996). 117
124 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS enquanto predicado de elevação não impõe restrições quanto à estrutura eventiva do seu complemento. No âmbito do LG, a entrada lexical de começar, apresentada em (51) possibilita ambos os sentidos, o de controlo e o de elevação. (51) começar ESTR_ARG ESTR_EVENT ESTR_QUALIA ARG ARG E E x : humano e 2 e1: processo e 2 : estado < P(e2,x) acto_de_começar(e, x,e ) 1 2 RESTR FORMAL AGENTIVO Como se referiu no capítulo 3, a par dos predicados que exibem a alternância causativo/incoativo, predicados como começar também são caracterizados pela natureza não endocêntrica da sua estrutura eventiva, ou seja, não são especificados relativamente ao núcleo. Deste modo, uma estrutura não endocêntrica como (51) pode ter como proeminente, ou núcleo, qualquer um dos subeventos que compõem a estrutura eventiva. Por sua vez, estes subeventos vão estar associados a um papel qualia específico. A proeminência de um subevento relativamente aos restantes dá conta da não projecção na sintaxe dos argumentos associados a todos os eventos não nucleares, licenciando apenas a projecção de argumentos associados ao subevento que constitui o NÚCLEO da estrutura. (Berkeley Cotter, 2002: 69) Como se pode observar a partir de (51), os papéis qualia estão associados a subeventos diferentes. Vai ser com base no mecanismo de especificação do núcleo que se determina o subevento e, consequentemente, o papel qualia mais proeminentes numa determinada estrutura, desencadeando, assim, as construções de controlo ou de elevação. Deste modo, se o subevento inicial (e 1:processo) for o núcleo, projectando informação relativa ao papel agentivo (acto_de_começar), está-se perante uma construção de controlo (A Maria começou o filme). Por outro lado, se o subevento final (e 2:estado) for o mais 118
125 4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO proeminente, projectando informação relativa ao papel formal (P(e 2,x)), está-se perante uma construção de elevação (O filme começou). Ao longo desta secção pretendeu-se ilustrar que existem restrições ao nível da aplicação dos mecanismos de coerção, evitando-se, deste modo, a sobregeração de interpretações. Without a proper notion of constraints on coercion, however, there can indeed be overgeneration of interpretations in the semantics, and in fact, the notion of conditions on coercion has always been integral to the basic spirit of generative lexicons. (Pustejovsky & Bouillon, 1996: 133) No próximo capítulo analisar-se-ão diferentes casos de polissemia regular com base num conjunto de fenómenos de referência, nomeadamente a co-predicação. No seguimento de Copestake & Briscoe (1995), esta distinção tem como principal consequência a existência de diferentes modos de representação dos itens lexicais: descrições complexas segundo o modelo generativo de Pustejovsky (1995a), por um lado, e significados relacionados através de regras lexicais, por outro. 119
126 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS 120
127 5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS 5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS... there exist various types of polysemy, and, following from that, various types of identifying and representing lexical senses. (Verspoor, 1997: 225) No seguimento da necessidade de representar computacionalmente os vários significados dos itens polissémicos, no âmbito do projecto ACQUILEX, Copestake & Briscoe (1995) distingue dois tipos de polissemia regular: a polissemia construcional, por um lado, e a extensão de significados, por outro. A polissemia construcional prevê um único significado atribuído numa entrada lexical, contextualmente especificado através de processos de co-composição sintagmática. A extensão de significados relaciona previsivelmente dois ou mais significados. Do ponto de vista da formalização e da implementação, a polissemia construcional é tratada como uma instanciação de uma entrada lexical subespecificada, enquanto a extensão de significados recorre ao uso de regras lexicais (já referidas no capítulo 3), que podem ser usadas tanto para relacionar significados completamente convencionados, como para serem aplicadas produtivamente para reconhecer novos usos. Um dos fundamentos para a distinção entre estes dois tipos de polissemia e, consequentemente, a criação de dois modos distintos de representação, baseia-se no modo 121
128 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS como os diferentes significados de um item polissémico se relacionam entre si. Enquanto com alguns itens é possível aceder aos seus diferentes significados na mesma estrutura, com outros apenas é possível aceder a um dos significados em cada estrutura. O teste utilizado para aceder aos diferentes significados de um item polissémico numa mesma estrutura denomina-se CO-PREDICAÇÃO TIPOS COMPLEXOS E CO-PREDICAÇÃO Como se referiu anteriormente, ao contrário dos nomes não polissémicos, que denotam um tipo semântico simples - faca (x:artefacto), homem (x:indivíduo) -, os itens polissémicos denotam tipos semânticos complexos - livro (x:objecto_físico, y:informação), banco (x:instituição, y:edifício). No que respeita aos tipos complexos, é importante definir de que modo é que eles se relacionam, i.e., se ambos os tipos podem ou não estar acessíveis simultaneamente num dado contexto. No âmbito do LG, Buitelaar (1998) propõe a existência de dois tipos complexos distintos, ligados por diferentes operadores: - liga tipos relacionados sistematicamente que são sempre interpretados simultaneamente. - liga tipos relacionados sistematicamente que nunca podem ser interpretados simultaneamente. Segundo o autor, o tipo complexo (x y) denota um objecto complexo cujos tipos são sempre interpretados em simultâneo, como, por exemplo, livro ou cassete (x:informação, y:objecto físico). Por outro lado, o tipo complexo (x y) denota um objecto complexo cujos 122
129 5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS tipos nunca são interpretados em simultâneo, como, por exemplo, janela ou porta (x:abertura, y:objecto físico). No entanto, como se sustenta em Pinto (2001), se, por um lado, no Português, os tipos denotados por cassete podem não ser interpretados simultaneamente, por outro, os tipos denotados por porta podem ser interpretados simultaneamente, como se pode verificar em (1) e (2) respectivamente 1. (1) A cassete está partida. (2) A Ana entrou pela porta que o João pintou de amarelo. Enquanto em (1) só se alude ao objecto físico, em (2) tanto a interpretação de abertura como a de objecto estão disponíveis. Demonstrando a inadequação da proposta de Buitelaar (1998) para os casos acima descritos, Pinto (2001: 85) procede a uma redefinição das relações existentes entre os tipos complexos: - liga tipos relacionados sistematicamente que são interpretados simultaneamente. - liga tipos relacionados sistematicamente que podem não ser interpretados simultaneamente. De acordo com esta nova proposta, o tipo complexo (x y) denota um objecto constituído por tipos que são geralmente interpretados em simultâneo, como, por exemplo, cassete ou livro (x:informação, y:objecto físico). Por outro lado, o tipo complexo (x y) denota um objecto constituído por tipos que podem ou não ser interpretados em simultâneo, como, por exemplo, banco (x:instituição, y:edifício). 1 Exemplos retirados de Pinto (2001: 85). 123
130 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS No entanto, de acordo com esta nova proposta, ambos os tipos complexos (x y) e (x y) permitem que os significados de um item polissémico possam ou não ser interpretados simultaneamente, tornando-se, por isso, um pouco redundante. Considerem-se os exemplos (3) e (4), apresentados em Pinto (2001: 63-64, 76). (3) a. O João pediu um empréstimo ao banco. b. O banco foi reconstruído por um arquitecto japonês. c. O João pediu um empréstimo ao banco que foi reconstruído por um arquitecto japonês. (4) a. A cassete está partida. b. A cassete ficou mal gravada. c. A cassete está partida e ficou mal gravada. 2 De acordo com a autora, banco seria representado pelo tipo complexo instituição edifício e cassete pelo tipo complexo informação objecto físico. Os exemplos apresentados em (3) e (4) ilustram que ambos os tipos complexos podem apresentar uma estrutura em que cada um dos tipos simples está disponível (3a, 3b, 4a, 4b), bem como uma estrutura em que ambos os tipos ocorrem simultaneamente (3c, 4c), não parecendo, assim, existir nenhuma diferença relativamente ao modo como os tipos se combinam. O que parece ser importante distinguir é se, por um lado, existe algum caso em que os tipos que constituem o tipo complexo possam ser interpretados simultaneamente (não sendo, contudo, necessário que tal aconteça sempre) e, por outro, verificar se existe algum caso em que os tipos que constituem o tipo complexo nunca possam ser interpretados simultaneamente (caso representado pelo operador proposto por Buitelaar (1998), mas que, em Português, parece não ser adequado ao exemplo que o autor apresenta). 2 Ainda que Pinto (op. ci.:76) apresente a estrutura em (4c) por forma a ilustrar que o item cassete pode ser interpretado simultaneamente como objecto físico e informação, na verdade, a expressão ficou mal gravada pode denotar também o objecto físico, não havendo, nesse caso, selecção de tipos diferentes. Um exemplo que ilustra melhor a interpretação simultânea de ambos os tipos será a cassete é pimba e está partida. 124
131 5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS Um dos testes utilizados para aceder aos tipos simples que compõem um tipo complexo na mesma estrutura sintáctica consiste na co-predicação. Em concreto, dois predicados distintos seleccionam o mesmo argumento sintáctico (que incluirá o item polissémico), mas, a nível semântico, seleccionam tipos diferentes, como se pode verificar pelos exemplos de (5) a (7). (5) O livro está rasgado mas é muito divertido. (6) O ladrão entrou pela janela amarela. (7) Este banco dá facilidades de empréstimo e fica ao lado da minha casa. Enquanto em (5) o predicado rasgado só pode remeter para o tipo objecto físico, o adjectivo divertido envolve, necessariamente, o tipo informação. Do mesmo modo, em (6), o verbo entrar selecciona o tipo que denota a abertura, enquanto o adjectivo amarela requer o tipo que denota o objecto físico. Finalmente, em (7), a estrutura dá facilidades de empréstimo remete para o tipo instituição, ao passo que fica ao lado da minha casa recupera o tipo edifício. Propõe-se, deste modo, uma nova reformulação no que respeita à relação existente entre os tipos complexos de um dado item. - liga tipos relacionados sistematicamente que podem ser interpretados simultaneamente. - liga tipos relacionados sistematicamente que não podem ser interpretados simultaneamente. Deste modo, e seguindo o modelo do LG, janela, cujos tipos podem ser interpretados simultaneamente, e cabrito, cujos tipos não podem ser interpretados simultaneamente, como se analisará na secção 5.3.1, são representados da seguinte forma: 125
132 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (8) janela ARG1 x : objecto_físico ESTR_ARG ARG2 y :abertura objecto_físico abertura_ PLC FORMAL conter(y,x) ESTR _ QUALIA TÉLICO entrar_ar_luz(e 1, y) tapar(e2,x,y) AGENTIVO construir(e 3,w,x y) (9) cabrito ARG1 x :animal ESTR_ARG ARG2 y :comida animal comida_ PLC FORMAL conter(x,y) ESTR _ QUALIA TÉLICO fornecer_carne(e 1, x) comer(e2,z,y) AGENTIVO cozinhar(e 3, w, y) Diferente da proposta de Buitelaar (1998) é a de Copestake & Briscoe (1995). Com base na assunção de que a impossibilidade de co-predicação entre os vários significados de um item implica que esses mesmos significados não podem estar disponíveis na mesma estrutura, os autores distinguem os dois tipos de polissemia e de representações já mencionados, e sobre os quais vão incidir as próximas secções deste capítulo. 126
133 5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS 5.2. POLISSEMIA CONSTRUCIONAL (MODULAÇÃO DE SIGNIFICADOS) Na polissemia construcional, o item lexical polissémico é representado através de entradas lexicais complexas, seguindo o modelo do LG. Este tipo de polissemia assenta na assunção de que a um dado item lexical é atribuído um significado básico e de que a alternância entre o(s) outros(s) significado(s) em contexto é consequência da herança de valores dos seus papéis qualia e da aplicação de processos de co-composição sintagmática (cf. capítulo 3.3.4). Os itens polissémicos pertencentes a esta classe podem ser co-predicados. Existe uma única entrada lexical que, aliada a mecanismos de coerção, permite que se aceda a ambos os significados do item, disponibilizando-os simultaneamente no mesmo contexto sintáctico. Os itens polissémicos de categoria verbal e adjectival são sempre tratados como fenómenos de polissemia construcional. São, igualmente, tratadas no âmbito da polissemia construcional algumas alternâncias nominais POLISSEMIA CONSTRUCIONAL ADJECTIVAL Um dos casos de polissemia construcional diz respeito à modificação adjectival. (10) a. O squash é um jogo rápido. b. O Ferrari é um carro rápido. c. O João é um condutor rápido. d. A Maria é uma dactilógrafa rápida. e. Esta partida de ténis foi rápida. f. Há que tomar decisões rápidas. Como já foi referido, os adjectivos adquirem diferentes significados seleccionando uma determinada interpretação, contida na estrutura qualia dos nomes que modificam, 127
134 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS através do mecanismo generativo de ligação selectiva (cf. capítulo ). Nos exemplos em (10), o adjectivo predica sobre os papéis agentivo ou télico dos nomes com os quais co-ocorre, adquirindo os significados de movimento rápido (a, b), execução de uma acção rapidamente (c, d, e) e execução de uma acção que requer um tempo reduzido (f). É possível coordenar adjectivos do mesmo tipo ou de tipos diferentes, ainda que sejam impostas algumas restrições à produtividade deste processo, principalmente quando os adjectivos seleccionam papéis qualia distintos (cf. (11a)). No entanto, em (11b), a coordenação é gramatical, uma vez que as propriedades coordenadas se encontram relacionadas. Por razões pragmáticas é mais esperado que um bom dactilógrafo seja rápido e inteligente do que rápido e bem vestido. (11) a.?uma dactilógrafa rápida e bem-vestida. b. Uma dactilógrafa rápida e inteligente. No que respeita à coordenação de nomes modificados pelo mesmo adjectivo, é possível coordenar nomes que denotem o mesmo tipo ou que se encontrem numa relação de subtipificação. A coordenação também é aceite se o adjectivo seleccionar o mesmo papel qualia dos nomes coordenados. (12) a. Alain Prost só se entusiasma com pistas e carros rápidos. (que se percorrem / conduzem rapidamente) b. A televisão e a serra eléctrica são boas. (funcionam bem) c. O administrador quer para a sua empresa dactilógrafos e computadores rápidos. (que trabalham rapidamente) d. *Este livro e esta criança são difíceis. (de ler/de educar) 128
135 5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS POLISSEMIA CONSTRUCIONAL VERBAL Considerem-se agora os seguintes exemplos: (13) a. O João quer uma cerveja a O João quer beber uma cerveja. b. O João quer um livro. b O João quer ler um livro. c. O João quer um cigarro. c O João quer fumar um cigarro. Nos exemplos em (13) o verbo querer, do ponto de vista sintáctico, subcategoriza um SN ou uma frase infinitiva. Semanticamente, requer um complemento com uma interpretação eventiva. As frases (13a), (13b) e (13c) são interpretadas como (13a ), (13b ) e (13c ), respectivamente, devido à aplicação do mecanismo generativo de coerção de tipo. O verbo querer, que selecciona um determinado tipo semântico, coage o seu argumento a adquirir o tipo requerido. Este mecanismo evita que as diferentes interpretações que querer pode assumir sejam listadas em entradas lexicais distintas, contrariamente ao que acontece com as abordagens enumerativas (cf. capítulo 3.1). A existência de uma única entrada lexical subespecificada que interage com o mecanismo generativo de coerção de tipo permite que, em contexto, qualquer interpretação do predicado verbal possa emergir. Essa acessibilidade de significados a partir da entrada lexical licencia o fenómeno de co-predicação, somente possível nos casos de polissemia construcional. (14) a. O João quer uma cerveja e um cigarro. a. O João quer beber uma cerveja e fumar um cigarro. b. A minha avó só quer renda e telenovelas. b. A minha avó só quer fazer renda e ver telenovelas. 129
136 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS Realça-se aqui que, para se obter a interpretação adequada do verbo querer nas estruturas (14a) e (14b), não é necessário que o mecanismo de coerção seja aplicado aos mesmos papéis qualia dos complementos nominais coordenados. De facto, enquanto em (14a, a ) o mecanismo de coerção é aplicado ao papel télico de cerveja e cigarro, em (14b, b ) o mecanismo de coerção é aplicado ao papel agentivo de renda e ao papel télico de telenovelas POLISSEMIA CONSTRUCIONAL NOMINAL Existem algumas alternâncias nominais em que os diferentes significados podem ser co-predicados. Neste caso, o item nominal é representado através de uma única entrada lexical em que a interacção entre as diferentes estruturas que a compõem - nomeadamente a argumental e a qualia - e os vários mecanismos generativos permitem seleccionar os diferentes significados nos contextos apropriados. Os exemplos de (15) a (18) ilustram como nas alternâncias OBJECTO FÍSICO- INFORMAÇÃO, OBJECTO FÍSICO-ABERTURA, CONTINENTE-CONTEÚDO e INSTITUIÇÃO-EDIFÍCIO, através do PLC (que contém todas as combinações de tipos possíveis, ou seja, os dois tipos simples e o tipo complexo resultante da sua combinação), é possível dar conta da interpretação de cada um dos tipos isoladamente - alíneas (a) e (b) - ou em simultâneo - alínea (c). (15) a. Este livro é muito divertido. b. O Duarte rasgou o livro. c. O Duarte rasgou o livro mais divertido que tinha. (16) a. Os bombeiros entraram pela janela. b. O João tem uma janela de vidro fumado. c. Os bombeiros entraram pela janela de vidro fumado. 130
137 5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS (17) a. A Ana pegou no copo. b. Vamos beber um copo com os amigos. c. A Ana bebeu o copo que tinham posto à sua frente. (18) a. Este banco tem o melhor crédito bonificado. b. O banco fica ao lado do supermercado. c. Este banco tem o melhor crédito bonificado e fica ao lado do supermercado EXTENSÃO DE SIGNIFICADOS (ALTERAÇÃO DE SIGNIFICADOS) Contrastando com os casos de polissemia construcional, existe um caso de polissemia regular, referida como extensão de significados, que consiste na criação previsível de diferentes significados relacionados através de regras lexicais. O formalismo utilizado para exprimir estas regras é suficientemente expressivo para descrever processos de morfologia derivacional, conversão, metonímicos e metafóricos. Uma das motivações para a aplicação destas regras tanto a processos metonímicos como a processos de morfologia derivacional reside no facto de as regras lexicais criarem significados derivados a partir de significados-base, muitas vezes relacionados com alterações morfológicas ou gramaticais subtis. Em Copestake & Briscoe (1995) sublinha-se que, no Inglês, alguns casos de metonímia, como a alternância CONTEÚDO-CONTINENTE, podem ser acompanhados de processos derivacionais, como se pode verificar pelos exemplos em (19). (19) 3 a. He drank a whole bottle (of whiskey). b. He drank a bottleful (of whiskey). 3 Tradução: Ele bebeu uma garrafa inteira (de whiskey). 131
138 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS As alternâncias que envolvem metonímia podem não envolver qualquer alteração sintáctica numa determinada língua, mas envolver alterações sistemáticas noutras. Enquanto no Inglês não há qualquer alteração na forma das palavras que denotam o fruto, por um lado, e a árvore da qual o fruto é proveniente, por outro (olive, apple) 4, resultando num caso de polissemia regular nesta língua, o mesmo não acontece com línguas como o Português, o Espanhol e o Italiano. No Português ocorre normalmente uma regra morfológica de sufixação (maçã - macieira) 5, enquanto no Espanhol e no Italiano, ambos apresentam uma alteração no género da palavra (aceituna - aceituno, pomela - pomelo). Outro exemplo semelhante ocorre com a alternância ANIMAL-COMIDA, em que não há qualquer alteração na forma da palavra, tanto no Português (cordeiro) como no Inglês (lamb), mas em que, contrariamente, no Alemão se procede a um processo de sufixação _vless para derivar a interpretação de carne (lams, lamsvless). A par das regras de morfologia derivacional, que tanto podem alterar a categoria sintáctica do item como mantê-la inalterável (construir V construção N; cereja N cerejeira N), as regras de extensão de significados também podem alterar, ou não, a estrutura sintáctica e semântica do item sobre o qual são aplicadas (cerejeira Ncontável cerejeira Nmassivo). Existem ainda outras semelhanças entre as regras derivacionais e as regras de extensão de significados: ambos os processos são produtivos e ambos permitem ser bloqueados. No que respeita à morfologia derivacional, a forma regular roubador não ocorre normalmente devido à existência da forma ladrão. Por seu lado, no que respeita à extensão de significados, a geração de boi, enquanto denotando a substância carne, derivada do animal com o mesmo nome, é bloqueada devido à existência do lexema sinónimo vaca. 4 Tradução: (azeitona/oliveira, maçã/macieira). 5 No caso de oliveira, do latim olivaria, esta forma já sofreu um processo de sufixação no latim a partir da forma latina oliva. Em Português oliva tem, hoje em dia, um uso reduzido, praticamente só literário ( Creio que este voc. desapareceu do uso vencido pelo arabismo azeitona. A partir, porém, do séc. XVI voltou a aparecer, mas apenas como termo de linguagem literária, quer na acepção de azeitona, quer na de oliveira. (in Dicionário Etimológico da Língua Portuguesa, José Pedro Machado)). 132
139 5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS EXTENSÃO DE SIGNIFICADOS NOMINAIS Um dos processos de polissemia de extensão de significados mais produtivos é aquele que gera nomes massivos, que denotam uma substância, a partir de nomes contáveis, que denotam um objecto físico. As alternâncias ANIMAL-COMIDA, ÁRVORE-MADEIRA e PEDRA PRECIOSA-MINERAL são disso um exemplo. Tal como no caso da polissemia construcional, não é assumido que os diferentes significados deste tipo de expressões estejam exaustivamente listados no léxico. A geração de novos significados é feita através de regras lexicais que têm como input um significado-base e como output um significado derivado. A aplicação destas regras está sujeita a processos de bloqueio (cf. capítulo 3.2). No entanto, e contrariamente ao caso de polissemia construcional - em que os diferentes significados são derivados a partir de uma única entrada lexical, permitindo que sejam co-predicados - no caso de extensão de significados, a aplicação de regras lexicais impede que os significados-base (input) e derivado (output) estejam acessíveis simultaneamente. Os processos de co-predicação, permitidos pela polissemia construcional, dificilmente são aceites na extensão de significados. (20) a. O cabrito teve de ser amamentado com um biberão. b. O João comeu cabrito ao jantar. c. * O João amamenta e come cabrito. (21) a. A Ana plantou uma cerejeira no quintal. b. A Ana prefere os móveis em cerejeira. c. *A Ana planta e prefere cerejeira. (22) a. O Grão-Mogol é o diamante mais célebre do mundo, com 280 quilates. b. Algumas ferramentas industriais são feitas de diamante. c. *O diamante é muito valioso e pode ser utilizado na construção de algumas ferramentas industriais. 133
140 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS No entanto, no caso da alternância ANIMAL-COMIDA, é importante salientar a existência de estruturas como a apresentada em (23), em que ambos os significados do item estão acessíveis simultaneamente. (23) Foi um prato de cabrito, colhido ali mesmo na Serra da Peneda, que o júri escolheu como o melhor deste concurso. Contudo, a alteração sintáctica de nome contável para nome massivo, nalgumas línguas, a ocorrência de processos derivacionais de sufixação para derivar um dos significados, noutras, e a existência de estruturas em que não é possível a co-predicação continuam a ser motivações para que a alternância ANIMAL-COMIDA seja tratada através de uma regra de extensão de significados. Outro tipo de processo metonímico bastante produtivo nas línguas é aquele permite que nomes de objectos e locais denotem indivíduos. (24) a O terceiro violino é muito convencido. b. A mesa três quer uma coca-cola. c. O avião aplaudiu a aterragem do piloto. (25) a. O país elegeu Jorge Sampaio para Presidente da República. b. Lisboa admite encerrar o aeroporto devido ao mau tempo. c. O Governo ouviu a aldeia no ano passado. Tal como no caso das alternâncias anteriores, a co-predicação também não é possível com este tipo de estruturas. Os exemplos em (26) mostram que não é possível, na mesma estrutura, aceder aos significados de objecto físico e indivíduos. O mesmo acontece nos exemplos em (27) relativamente aos significados de local e indivíduos. 134
141 5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS (26) a. *O terceiro violino está riscado e é muito convencido. b. *A mesa três está suja e quer uma coca-cola. c. *O avião já tinha feito vários voos sem ir à revisão e aplaudiu a aterragem do piloto. (27) a. *O país é banhado a oeste pelo Oceano Atlântico e elegeu Jorge Sampaio para Presidente da República. b. *Lisboa fica situada na foz do Tejo e admite fechar o aeroporto devido ao mau tempo. c. *O Governo reconstruiu e ouviu a aldeia no ano passado. No entanto, o teste de co-predicação pode nem sempre dar uma indicação clara acerca da possibilidade de aceder, na mesma estrutura, a ambos os significados de um item polissémico, podendo mesmo gerar previsões conflituosas, como adiante se verá METÁFORAS Apesar de a maior parte dos fenómenos de extensão de significados estar relacionado com processos metonímicos, Briscoe & Copestake (1991) sugere que mecanismos semelhantes podem também ser usados para dar conta de processos metafóricos. Um desses processos consiste na aplicação de características particulares de animais a humanos. (28) Ele é um porco/burro. Este tipo de extensão de significados é aparentemente produtivo, ainda que as características envolvidas não possam ser previsíveis a partir do significado do animal. As propriedades dos animais atribuídas aos humanos são associações estereotipadas do animal que não estão codificadas na estrutura qualia. Deste modo, a interpretação do nome em frases 135
142 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS 136 como a apresentada em (28) deve ser expressa em termos de uma regra lexical de extensão de significados, como a apresentada em (29). (29) 1 SEX RQS 3 ORTH 2 SYNTAX 1 SEX RQS 3 ORTH 2 SYNTAX pessoa 0 animal 1 regra_lexical 5.4. O TESTE DE CO-PREDICAÇÃO Apesar de se fazer a distinção entre polissemia construcional e extensão de significados e, consequentemente, de se sugerirem dois métodos diferentes de tratamento da polissemia regular, essa distinção nem sempre é linear. Não é fácil, através do teste de copredicação, distinguir os casos em que os diferentes aspectos de uma entidade estão codificados numa única entrada lexical dos casos em que é necessário postular a construção de regras lexicais para determinar o significado apropriado do item lexical. No âmbito do LG, também se torna difícil distinguir os casos em que os diferentes tipos podem ser interpretados simultaneamente, sendo ligados pelo operador, dos casos
143 5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS em que os diferentes tipos não podem ser interpretados simultaneamente, sendo ligados pelo operador. O teste de co-predicação, utilizado em ambos os modelos, pode não dar uma indicação clara sobre se se consegue aceder simultaneamente aos diferentes significados de um item polissémico, uma vez que os resultados da coordenação podem ser mais ou menos antagónicos consoante as construções sintácticas utilizadas. Ao longo deste trabalho as estruturas de co-predicação têm sido construídas a partir de três construções sintácticas distintas: (i) coordenação; (ii) orações relativas; (iii) SN s com modificadores. Considerem-se novamente os itens livro e aldeia. Como se verificou anteriormente, enquanto no caso de livro a co-predicação é possível, sendo tratado como um caso de polissemia construcional (Copestake & Briscoe, 1995), ou através do operador (Buitelaar, 1998), no caso de aldeia a co-predicação, à partida, não é possível, sendo tratado como um caso de extensão de significados, ou através do operador, conforme as propostas adoptadas. (i) CO-PREDICAÇÃO ATRAVÉS DE PREDICADOS COORDENADOS A coordenação pode ser feita através de predicados adjectivais ou verbais, conforme se pode observar pelos exemplos (30) e (31), respectivamente. (30) a.??este livro é amarelo e divertido. b.??esta aldeia é ocidental e comunista. (31) a. O João comprou e memorizou o livro ontem. b. *O Governo reconstruiu e ouviu a aldeia no ano passado. 137
144 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (ii) CO-PREDICAÇÃO ATRAVÉS DE ORAÇÕES RELATIVAS A co-predicação através de orações relativas permite com alguma facilidade aceder aos vários significados de um item, independentemente de as estruturas envolverem orações relativas restritivas ou explicativas, como ilustram os exemplos (32) e (33). (32) a. O livro que tem a capa amarela é muito divertido. b. A aldeia que não foi reconstruída o ano passado manifestou-se contra o governo. (33) a. Este livro, que tem a capa amarela, é muito divertido. b. Esta aldeia, que não foi reconstruída o ano passado, manifestou-se contra o governo. (iii) CO-PREDICAÇÃO ATRAVÉS DE SN S COM MODIFICADORES Considerem-se os seguintes exemplos: (34) a. O João memorizou o livro amarelo. b. O governo reconstruiu a aldeia comunista. (35) a. O livro amarelo é divertido. b. A aldeia ocidental é comunista. 6 6 Comparem-se os seguintes exemplos: (1) a.??o livro divertido é amarelo. b.??a aldeia comunista é ocidental. O facto de a troca de adjectivos tornar as frases anómalas está relacionado com uma ordem generalizada que estabelece que os adjectivos se agrupam de acordo com o seu campo semântico: as características físicas precedem as características abstractas (Demonte, 1999). 138
145 5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS (36) a. O livro de capa amarela é divertido. b. A aldeia do lado ocidental é comunista. O que se pretende mostrar a partir dos exemplos apresentados em (30) - (36) é que o teste de co-predicação pode gerar construções gramaticais ou não consoante a estrutura sintáctica utilizada. De facto, não é possível aceder simultaneamente aos diferentes significados de aldeia através de estruturas com coordenação, o mesmo não acontecendo com estruturas com orações relativas ou com SN s com modificadores, o que torna estes testes pouco fiáveis. As construções de co-predicação com orações relativas ou com SN s modificados parecem permitir mais facilmente o acesso simultâneo aos vários significados de um item do que as construções com coordenação. No âmbito da proposta de Copestake & Briscoe (1995), se itens como aldeia forem tratados como casos de extensão de significados, a co-predicação não é previsível nem pode ocorrer. Os diferentes significados não estão acessíveis a partir de uma única estrutura. Quando um dos significados é derivado a partir de uma regra lexical, o significado-base deixa de estar acessível. Por este motivo não devia existir nenhuma estrutura em que a copredicação fosse possível. Contudo, os exemplos (32b), (33b), (34b), (35b) e (36b), construídos a partir de orações relativas e de SN s com modificadores, apresentam casos de copredicação, em que os significados de local e conjunto de pessoas estão acessíveis simultaneamente. Apenas as construções de co-predicação através de estruturas com coordenação geram agramaticalidade. Como se referiu anteriormente, também no âmbito do modelo do LG, o facto de o teste de co-predicação poder gerar resultados conflituosos torna difícil decidir se os tipos semânticos dos itens lexicais se encontram relacionados através do operador ou através do operador. Desta observação levantam-se algumas questões importantes. Pode considerar-se que o teste de co-predicação através de construções com coordenação, por ser o mais restringido, é o mais fiável e que, consequentemente, se gerar estruturas agramaticais, então a copredicação não pode ocorrer. No entanto, caso gere agramaticalidade, como no caso de aldeia, 139
146 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS em (30b) e (31b), torna-se necessário explicar a possibilidade de aceder simultaneamente aos diversos significados através de outro tipo de construções. De facto, o teste de co-predicação através de estruturas com coordenação parece ser o mais fiável e o único em que os diferentes predicados, encontrando-se, do ponto de vista sintáctico, ao mesmo nível, estão realmente a co-predicar sobre o mesmo item lexical. No que respeita às estruturas com orações relativas que, contrariamente às estruturas com coordenação, apresentam, do ponto de vista sintáctico, uma configuração de adjunção, admite-se que, ao recuperar o objecto linguístico (livro, aldeia), o pronome relativo recupera todo o tipo complexo e não apenas um dos tipos simples. Deste modo, o predicado introduzido pela oração relativa continua a predicar sobre todo o tipo complexo e não sobre um tipo simples em particular, deixando, assim, de haver co-predicação. Relativamente às estruturas com SN s com modificadores, que podem apresentar uma configuração de adjunção ou complementação, admite-se que a presença do modificador conduz a uma relação de subtipificação relativamente a um dos tipos simples que compõem o tipo complexo. Em estruturas como o governo reconstruiu a aldeia comunista, o item aldeia denotará o tipo complexo composto pelos tipos simples local e comunistas, sendo este último um subtipo de indivíduos. De um modo análogo, em estruturas como a aldeia ocidental/do lado ocidental manifestou-se a favor da regionalização, o item aldeia denotará o tipo complexo composto pelos tipos simples indivíduos e ocidental, sendo este último um subtipo de local. Nestes casos, os itens comunista e ocidental não estão a predicar sobre um tipo simples ( indivíduos e local, respectivamente), fazendo eles próprios parte do tipo complexo. Deste modo, também neste tipo de estrutura sintáctica deixa de haver copredicação. Admitindo que o teste de co-predicação através de construções com coordenação é o teste mais fiável, é necessário explicar por que razão as estruturas em (30), em que são coordenados predicados adjectivais, são pouco naturais se não mesmo inaceitáveis. De facto, como se referiu em 5.2.1, da mesma forma que são impostas algumas restrições à coordenação de adjectivos quando estes seleccionam papéis qualia diferentes, também parecem ser impostas algumas restrições à coordenação de adjectivos que seleccionem tipos semânticos diferentes. Enquanto em estruturas como um livro grande e amarelo ou um livro 140
147 5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS metafórico e divertido os diferentes adjectivos seleccionam o mesmo tipo semântico e as frases são gramaticais, em estruturas como um livro amarelo e metafórico os adjectivos seleccionam tipos semânticos diferentes tornando a frase inaceitável. Importa, ainda, salientar o facto de a estranheza das co-predicações poder dever-se, também, a incompatibilidades entre os predicados. Há que ter em atenção a coerência semântica das estruturas e evitar predicar propriedades sem uma relação aparente entre si, uma vez que é fácil construir exemplos de co-predicação de difícil aceitação por incoerência semântica A PROBLEMÁTICA DE ITENS COMO JORNAL Existem alguns itens que constituem um tipo mais complexo de polissemia. É o caso de jornal ou revista, que tanto podem ser interpretados como o objecto físico ou como a informação nele contida, comportando-se do mesmo modo que livro, carta ou artigo. Contudo, estes itens também pode ter os significados de instituição, edifício ou grupo de pessoas, comportando-se do mesmo modo que banco, fábrica ou escola, entre outros. Atente-se nos seguintes exemplos: (37) a. Aquele jornal fica do outro lado da rua. b. Aquele jornal foi processado por difamação. c. Aquele jornal manifestou-se ontem, em frente à Assembleia da República, contra a decisão do tribunal. d. Aquele jornal está cheio de linguagem metafórica. e. Aquele jornal está sujo de café. Nos exemplos em (37) estão presentes os diferentes significados relativamente à entidade jornal: distinguem-se as propriedades que denotam o edifício (a), a instituição (b), o conjunto de pessoas (c), o conteúdo informativo (d) e o objecto físico (e). 141
148 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS A co-predicação entre os significados de edifício, instituição e conjunto de pessoas parece ser permitida, conforme ilustram os exemplos em (38). (38) a. Aquele jornal fica do outro lado da rua e foi processado por difamação. b. Aquele jornal foi processado por difamação e manifestou-se ontem, em frente à Assembleia da República, contra a decisão do tribunal. c. Aquele jornal fica do outro lado da rua e manifestou-se ontem, em frente à Assembleia da República, contra a decisão do tribunal. d. Aquele jornal fica do outro lado da rua, foi processado por difamação e manifestou-se ontem, em frente à Assembleia da República, contra a decisão do tribunal. Por outro lado, a co-predicação entre os significados de informação e objecto físico também parece ser permitida, conforme ilustram os exemplos em (39). (39) Aquele jornal está cheio de linguagem metafórica e sujo de café, por isso é muito difícil de ler. No entanto, a co-predicação entre os significados de instituição, edifício e conjunto de pessoas, por um lado, e os significados de objecto físico e informação, por outro, gera agramaticalidade, como ilustram os exemplos de (40) a (42). (40) a. *Aquele jornal fica do outro lado da rua e está sujo de café. b *Aquele jornal fica do outro lado da rua e está cheio de linguagem metafórica. (41) a. *Aquele jornal foi processado por difamação e está sujo de café. b. *Aquele jornal foi processado por difamação e está cheio de linguagem metafórica. 142
149 5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS (42) a. *Aquele jornal manifestou-se ontem, em frente à Assembleia da República, contra a decisão do tribunal e está sujo de café. b. *Aquele jornal manifestou-se ontem, em frente à Assembleia da República, contra a decisão do tribunal e está cheio de linguagem metafórica. Contudo, em alguns casos, a co-predicação entre os significados de instituição e objecto físico parece aceitável. (43) O jornal foi processado pela oposição e queimado nas ruas pelos manifestantes. Estes dados conduzem a uma questão importante no que respeita a itens como jornal: como é que as suas propriedades semânticas são representadas no léxico? Uma das propostas é a apresentada em Pustejovsky (1995a: 155). O autor só contempla três interpretações para jornal: objecto físico, informação e instituição. Jornal distingue-se, assim, de livro na medida em que este último não pode denotar a instituição editorial. Por poder denotar três tipos distintos, itens como jornal distinguem-se, igualmente, no que respeita à construção do PLC. Deste modo, o PLC de jornal consiste numa construção de dois tipos, um dos quais é por si só um tipo complexo. A estrutura em (44) representa o modo como os tipos se combinam numa hierarquia de tipos. (44) objecto_físico informação instituição material_impresso ( ) jornal ( ) livro 143
150 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS A partir das representações em (45) e (46) pode observar-se que o PLC de jornal é construído recursivamente através de pares de tipos. Em (45) é construído o PLC relativo ao tipo complexo objecto_físico informação - σ 1 σ 2 - idêntico a nomes como livro. Em (46) é construído o PLC relativo ao tipo complexo instituição (objecto_físico informação), característico de itens como jornal. (45) : PLC 1 : 2 ( ): 1 2 (46) : PLC 3 : ( ): ( ) A estrutura qualia de jornal especifica, deste modo, uma relação produto-produtor. O papel agentivo refere o elemento que denota a relação produto-produtor e o papel formal refere o elemento que denota o produto. (47) jornal ARG1 x : instituição ESTR_ARG ARG2 y :informação objecto_físico instituição informação objecto_físico_ PLC FORMAL y ESTR_QUALIA TÉLICO ler(e2, w, y) AGENTIVO publicar(e 1, x, y) Note-se que o tipo complexo instituição (objecto_físico informação) nunca ocorre como valor dos papéis qualia, o que significa que só um dos valores semânticos objecto_físico informação, por um lado, e instituição, por outro - pode estar disponível. 144
151 5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS Deste modo, é possível dar conta da agramaticalidade de frases como as apresentadas em (40) - (42). No entanto, esta proposta não contempla a aceitabilidade da frase apresentada em (43), nem os casos em que jornal também pode ser interpretado como edifício e conjunto de pessoas. Como se referiu, itens como jornal ou revista denotam dois tipos complexos distintos, ainda que, de certo modo, relacionados: o tipo complexo objecto_físico informação - podendo os tipos que o compõem entrar em estruturas de co-predicação - e o tipo complexo edifício (instituição conjunto_pessoas) 7 - cujos tipos também podem entrar em estruturas de co-predicação. No entanto, através dos testes de co-predicação apresentados em (40) (42), verificou-se que a co-predicação entre estes dois tipos complexos gera, normalmente, agramaticalidade. Outro modo de representação possível por forma a captar os diferentes significados de jornal e o modo como eles se relacionam baseia-se na proposta de Buitelaar (1998) e consiste num PLC que representa o tipo complexo (objecto_físico informação) (edifício (instituição conjunto_pessoas)), como se pode ver a partir de (48). O papel agentivo continua a especificar a relação produtor-produto, o papel formal especifica o produto e o papel télico o evento de ler. Contudo, ao contrário da representação em (47) os tipos complexos ocorrem como valor dos papéis qualia. A possibilidade de só um dos tipos complexos - objecto_físico informação, por um lado, e edifício (instituição conjunto_pessoas), por outro estar disponível numa estrutura é representada por meio do operador. 7 No seguimento de Pustejovsky (1995a) assume-se que a construção do PLC de jornal relativamente a estes três tipos é feita do seguinte modo: (1) (2) PLC : instituição : conjunto_pessoas ( ) : instituição conjunto_pessoas PLC : edifício : instituição conjunto_pessoas ( ) : edifício ( instituição conjunto_pessoas ) Considera-se, deste modo, que a interpretação de conjunto de pessoas está mais estreitamente relacionada com a de instituição do que com a de edifício. No que respeita à construção de tipos complexos a partir de três tipos (instituição edifício conjunto_pessoas) e não recursivamente através de pares de tipos, Pustejovsky (1995a: 155) defende que There may, in fact, turn out to be instances of dot objects that are constructed from three dot elements or more, but this is question open to further investigation.. 145
152 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS (48) jornal ARG1 x : objecto_físico ARG2 y : informação ESTR_ARG ARG3 w : instituição conjunto_pessoas ARG4 z : edifício (x y) (w z)_ PLC FORMAL conter(x,y) conter(z,w) ESTR_QUALIA TÉLICO ler(e1,i, x y) AGENT produzir(e 2, w z, x y) Em suma, o PLC apresentado em (48) consiste, assim, no novo tipo complexo (x y) (z (w k)). Enquanto o operador liga tipos que podem ser interpretados simultaneamente, o operador liga tipos que não podem ser interpretados simultaneamente. No entanto, no seguimento de Buitelaar (1998), admite-se que, em alguns casos, esta restrição possa ser violada e a co-predicação seja permitida, ainda que o autor só se refira a casos de trocadilhos e uso humorístico da linguagem. Mas dada a relação estreita, imediatamente reconhecida pelos falantes, entre o produto e o produtor, existente em nomes como jornal, torna-se possível interpretar estruturas como as apresentadas em (43). No âmbito da proposta de Copestake & Briscoe (1995), que propõe a existência de regras lexicais quando não é possível aceder a todos os significados de um item na mesma estrutura, os autores não defendem, no entanto, a utilização das mesmas por forma a derivar os significados de jornal - instituição, edifício e conjunto de pessoas - que não podem copredicar com os significados de informação e objecto físico, ou vice-versa. Contudo, os 146
153 5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS autores também não consideram a existência de uma única entrada lexical que consiga captar todos os significados de jornal.... assuming that a single structure can cover all the senses of newspaper is highly problematic. Constructing a qualia structure to cover all the senses of newspaper in such a way that different predicates can apply appropriately is difficult, since it seems that the copy and the organization sense (at least) should have their own distinct qualia. (Copestake & Briscoe, 1995: 30) Copestake & Briscoe (1995) assumem, então, a existência de duas estruturas, correspondendo uma ao significado objecto físico, e a outra ao significado instituição. Thus, for newspaper, we assume two structures, one corresponding primarily to the copy and one to the institution. Both of these may be involved in constructional polysemy - the text and parent organisation of the newspaper copy is accessible via its qualia, and conversely the copies are accessible from the structure representing the parent organisation. (Copestake & Briscoe, 1995: 30) Da necessidade de criação de um modelo de semântica lexical que consiga captar todos os significados que um item lexical pode adquirir surgem duas abordagens interessantes e que mereceram particular destaque. O modelo do LG, inovador no que respeita ao seu poder generativo, tem sido largamente estudado nos últimos anos e adoptado por muitos investigadores na tentativa de criar um modelo computacional que consiga captar o significado adequado dos itens lexicais no contexto apropriado. Desenvolvendo uma representação semântica com base na noção de co-composicionalidade, o LG permite captar a variação do significado em função do contexto reduzindo o número de entradas armazenadas no léxico, tornando-se, assim, num modelo generativo universal, económico e descritivamente adequado. Por outro lado, a proposta de Copestake & Briscoe (1995) combina o poder generativo do LG com a especificidade das regras lexicais, que permitem captar generalizações específicas de uma língua. De facto, como se referiu na secção 5.3, uma das motivações para a aplicação das regras lexicais reside no facto de, em algumas línguas, alguns casos de metonímia serem acompanhados de processos derivacionais. No entanto, para além da aplicação das regras lexicais poder ser específica de uma determinada língua, acarretam 147
154 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS ainda a desvantagem de não preverem a criação de novos significados. A produtividade e criatividade das línguas permitem compor significados inesperados em contexto dificilmente captáveis através das regras lexicais. Outra das motivações fundamentais para a aplicação de regras lexicais respeitava ao facto de não ser possível aceder simultaneamente aos diferentes significados de alguns itens polissémico na mesma estrutura sintáctica, o que constituía um indício de que esses significados não podiam estar acessíveis a partir de uma única entrada lexical. No entanto, Buitelaar (1998) propõe, no âmbito do LG, a inserção do operador, que também permite distinguir os casos em que os diferentes significados de um item lexical não podem ser interpretados simultaneamente, contribuindo, deste modo, para a riqueza e economia do modelo. 148
155 6. CONCLUSÃO 6. CONCLUSÃO Sense delimitation is largely an open problem. It is indeed almost impossible to state precise and general principles that characterize the boundaries of different senses of a lexeme and what a sense exactly is. (Saint-Dizier, 1998a:125) A polissemia é uma questão bastante complexa que tem constituído, nos últimos anos, objecto de investigação aprofundada no âmbito da semântica lexical. A criatividade das línguas naturais e o recurso a processos metafóricos e metonímicos constituem o factor fundamental para a produção de novos significados. A distinção entre a polissemia e os restantes fenómenos de ambiguidade lexical, nomeadamente a vaguidade e a homonímia, ainda que teoricamente pareça bem estabelecida, e de limites concretos, pode apresentar, na prática, alguns problemas. Por vezes, pode tornar-se difícil precisar com segurança se se está perante: (i) diferentes significados relacionados que uma palavra particular possui (polissemia); (ii) modulação de um significado particular de uma palavra (vaguidade); (iii) diferentes significados respeitantes a diferentes palavras com a mesma forma (homonímia). Como se pôde observar no capítulo 2, o contexto desempenha um papel fundamental na delimitação de sentidos de uma dada palavra, na medida em que conduz à interpretação particular do seu valor semântico. O que num dado contexto pode ser entendido como uma palavra vaga, pode, noutro contexto, ser interpretado como uma palavra polissémica. Centrando-se no fenómeno de polissemia regular (que pressupõe que as alternâncias de significados ocorrem de forma previsível e sistemática dentro de uma 149
156 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS determinada classe de palavras), este trabalho reuniu um vasto conjunto de exemplos que representam casos relevantes de polissemia em Português. Verificou-se que se podem observar itens com comportamento polissémico nas três principais categorias sintácticas (nominal, verbal e adjectival) e analisaram-se os tipos de relações existentes em cada uma. Tendo em atenção as relações existentes entre os vários significados dos itens polissémicos, há que modelizar a informação lexical de modo a permitir o acesso a todas as possíveis interpretações. Surgem, então, no âmbito da Semântica Lexical Computacional, várias abordagens de representação dos itens lexicais. Destacam-se neste trabalho os Léxicos Enumerativos de Sentidos, as Regras Lexicais e o modelo do Léxico Generativo, analisados detalhadamente no capítulo 3. Os Léxicos Enumerativos de Sentidos são considerados ineficientes e incompletos tanto a nível linguístico como a nível computacional. Para além de postularem uma entrada lexical distinta para cada significado da palavra (o que resulta numa proliferação de entradas lexicais que, em termos computacionais, implica custos importantes a nível de eficiência do sistema), os LES tornam-se incompletos na medida em que, dada a produtividade e criatividade das línguas, não é possível enumerar exaustivamente todos os significados de um item lexical. Para além disso, os LES acarretam ainda a desvantagem de não permitirem captar a relação sistemática existente entre os significados dos itens polissémicos, assumindo um processamento equivalente ao da homonímia. Diferente da abordagem enumerativa, as Regras Lexicais (Copestake & Briscoe (1992, 1995), Ostler & Atkins (1992)) permitem a geração de significados a partir de um significado-base. As regras estão sujeitas a processos de bloqueio de modo a evitar ambiguidades desnecessárias, como a geração de um significado que já está lexicalizado, no léxico, noutra palavra. É o caso da geração do significado de comida para o item boi, que é bloqueado devido à lexicalização de vaca para o mesmo significado. No entanto, esta abordagem também apresenta algumas desvantagens. Para além do facto de poderem ser específicas de uma determinada língua ou dialecto, e não universais, as regras lexicais nem sempre conseguem prever a criação de novos significados, tornandose necessário construir novas regras para dar conta dos novos significados. Tentando dar conta da polissemia regular de forma económica e descritivamente adequada, o modelo do Léxico Generativo (Pustejovsky, 1995a) assenta em entradas lexicais complexas e em mecanismos generativos que permitem obter a interpretação 150
157 6. CONCLUSÃO adequada do item polissémico no contexto apropriado. As entradas lexicais são compostas por três níveis de representação relevantes (Estrutura Argumental, Etrutura Eventiva e Estrutura Qualia), que codificam toda a informação pertinente relativamente a um item lexical. A interagir com essa informação encontram-se vários mecanismos generativos (Coerção de Tipo, Co-composição e Ligação Selectiva) que permitem derivar os significados em contexto, dando conta da criatividade característica das línguas naturais. Por ser baseado na co-composicionalidade, ou seja, na interacção entre o significado de um dado item com o significado dos seus argumentos, o LG torna-se um modelo económico (na medida em que reduz o número de entradas armazenadas no léxico), dinâmico (encarando o léxico como um componente flexível, subespecificado e sensível ao contexto), universal e, fundamentalmente, capaz de prever os significados das palavras. É no quadro do LG que se analisam, no capítulo 4, para o Português, alguns itens com comportamento polissémico, representantes de cada uma das categorias sintácticas consideradas. Observa-se como, através de representações no quadro do LG, itens como livro, velho e começar são adequadamente processados e interpretados. Uma outra proposta de processamento da polissemia é a de Copestake & Briscoe (1995) que se fixa num conjunto de fenómenos de referência (co-predicação) que permitem distinguir diferentes casos de polissemia regular e, consequentemente, diferentes modos de representação: palavras dotadas de uma descrição complexa segundo o modelo generativo, por um lado, e significados relacionados através de regras lexicais, por outro. Um outro argumento a favor da existência de regras lexicais para explicar os fenómenos de extensão de significados baseia-se na comparação com processos morfológicos e derivacionais. De facto, em algumas línguas, como o Espanhol, o Italiano, o Alemão e mesmo o Inglês, alguns processos de alteração de significados são muitas vezes acompanhados de processos morfológicos, como a alteração do género da palavra ou processos de sufixação, o que pode indiciar que os processos morfológicos e semânticos agem em simultâneo. Todavia, a motivação mais forte para postular dois modos diferentes de representação dos itens polissémicos reside na possibilidade, ou não, de aceder, na mesma estrutura, a todos os significados de um item polissémico. Através de testes de copredicação, Copestake & Briscoe (1995) propõe que, se for possível aceder 151
158 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS simultaneamente, na mesma estrutura sintáctica, aos diferentes significados de um item, então este é tratado como um caso de polissemia construcional e representado através de uma entrada lexical subespecificada. Por outro lado, se não for possível aceder simultaneamente aos diferentes significados de um item polissémico, então este é tratado como um caso de extensão de significados e derivado através de uma regra lexical. No entanto, Buitelaar (1998) propõe, no âmbito do LG, a inserção do operador, que, contrariamente a, relaciona tipos que não podem ser interpretados simultaneamente. A distinção entre estes operadores contribui para a riqueza do modelo do LG, deixando, deste modo, de haver necessidade de postular a existência de regras lexicais. No seguimento da inadequação das definições dos operadores e, para o Português, propostas por Buitelaar (1998) - por serem demasiado rígidas - e Pinto (2001) - por serem pouco precisas -, propõe-se, no capítulo 5, uma nova reformulação no que respeita à relação existente entre os tipos simples que compõem os tipos complexos de um dado item. Na tentativa de construir testes de co-predicação constatou-se, no presente trabalho, que os mesmos podem não dar uma indicação clara acerca da possibilidade de aceder, na mesma estrutura, a ambos os tipos semânticos de um item polissémico, podendo mesmo gerar previsões conflituosas consoante as construções sintácticas utilizadas. Podendo ser construídos através de estruturas com coordenação, orações relativas e SN s com modificadores, concluiu-se que, por ser aquele em que se verifica uma verdadeira co-predicação, encontrando-se os predicados ao mesmo nível na estrutura sintáctica, o teste mais fiável é o de co-predicação através de estruturas com coordenação. Analisaram-se, ainda, alguns itens que constituem um caso mais complexo de polissemia, como jornal e revista, propondo-se uma representação no quadro do LG capaz de captar todos os significados que estes itens podem comportar. Como se evidenciou ao longo deste trabalho, o contexto é um componente fundamental no estabelecimento da multiplicidade de significados de um item lexical. Qualquer sistema de Semântica Lexical Computacional que vise captar e prever o comportamento polissémico dos itens lexicais tem de ter em atenção que os itens se relacionam uns com os outros, adquirindo significados diferentes em virtude dos itens 152
159 6. CONCLUSÃO que seleccionam ou pelos quais são seleccionados. Por ter em atenção o contexto, o modelo do LG parece ser, de facto, aquele que melhor capta e prevê essa alteração de significados, sendo, como se referiu anteriormente, económico, dinâmico e universal. O seu poder generativo, do qual se tentou dar conta ao longo deste trabalho, permite prever o significado de um vasto conjunto de itens em contexto, tendo sido, por isso já muito estudado e adoptado em várias implementações computacionais. Sendo um modelo relativamente recente, o LG pode ainda estar incompleto ou ser pouco preciso relativamente a algumas questões (as estruturas de hierarquia de tipos são ainda pouco definidas). No entanto, os vários estudos e propostas de que tem sido alvo só o podem beneficiar e servir para enriquecer e tornar mais sólido o modelo (note-se a proposta de Buitelaar (1998)). Um possível trabalho futuro poderá consistir na adaptação da informação codificada nas estruturas qualia e argumental a bases de dados lexicais electrónicas, como a WordNet, contribuindo assim para o enriquecimento das mesmas 1. 1 De facto, já existem algumas propostas nesse sentido, nomeadamente Mendes & Chaves (2001): Since WordNet is a lexical inheritance system, the qualia features (and in fact, the relations already available) must be monotonically inherited. Thus, if such an enrichment is to take place, what is semantically specified for a hyperonym is shared by its hyponyms, keeping synsets as simple as possible. (Mendes & Chaves, op.cit.: 6) 153
160 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS 154
161 REFERÊNCIAS REFERÊNCIAS ALVES, A. T. (1993), Levantamento e Análise da Bibliografia sobre o Tempo na Língua Portuguesa (first draft), Cadernos de Semântica nº 13, Faculdade de Letras da Universidade de Lisboa. APRESJAN, J. D. (1973), Regular Polysemy, Linguistics, 142, pp ASHER, N., A. Lascarides (1995), Metaphor in discourse, Representation and Acquisition of Lexical Knowledge: Polysemy, Ambiguity and Generativity, AAAI Symposyum, Menlo Park, California. ASHER, N., J. Pustejovsky (2000), The Metaphysics of Words in Context, in BERKELEY COTTER, M.J.F. (2002), Especificações para a Computação dos Predicados Causativos, Dissertação de Mestrado, Universidade de Lisboa. BOUILLON, P. (1996), Mental State Adjectives: the Perspective of Generative Lexicon, Proceedings of COLING-96, Copenhaguen. BOUILLON, P. (1997), Polymorphie et Sémantique Lexical: Le Cas des Adjectifs, Thèse de Troisième Cycle, Université de Paris 7 Denis Diderot. BOUILLON, P. (1999), The Adjective Vieux : the Point of View of Generative Lexicon, in E. Viegas (ed.), Breadth and Depth of Semantic Lexicons, Kluwer, pp
162 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS BRISCOE, T., A. Copestake (1991), Sense Extension as Lexical Rules, in D. Fass, E. Hinkelman and J. Martin (eds.) Computational Approaches to Non-literal Language: Metaphor, Metonymy, Idiom, Speech Acts, Implicature, in Proceedings of the IJCAI Workshop on Computational Approaches to Non-Literal Language, Sydney, Australia, pp BRISCOE, T., A. Copestake (1996), Controlling the Application of Lexical Rules, in E. Viegas (ed.), Proceedings.of the SIGLEX Workshop on Breadth and Depth of Semantic Lexicons, ACL, Santa Cruz, California, pp BUITELAAR, P. (1998), CoreLex: Systematic Polysemy and Underspecification, PhD., Brandeis University. CALZOLARI, N. (1991), Representation of Semantic Information in a Lexical Knowledge Base, in T. Briscoe, A. Copestake (eds.), First ACQUILEX Workshop, Cambridge, MA. CASTELEIRO, J. M. (1981), Sintaxe Transformacional do Adjectivo, Textos de Linguística, Instituto Nacional de Investigação Científica; Lisboa. CASTELEIRO, J. M. (coord.) (2001), Dicionário da Língua Portuguesa Contemporânea, Academia das Ciências/Editorial Verbo, Lisboa. CHOMSKY, N. (1970), Remarks on Nominalization, in R. Jacobs, P. Rosenbaum (eds,), Readings in English Transformational Grammar, Walthan, MA, Ginn & Co., pp CHOMSKY, N. (1981), Lectures on Government and Binding, Dordrecht, Foris Publications. CHOMSKY, N. (1986a), Barriers, MA, The MIT Press. CHOMSKY, N. (1986b), O Conhecimento da Língua: Sua Natureza, Origem e Uso, Colecção Linguística, Editorial Caminho. COPESTAKE, A. (1992), The Representation of Lexical Semantic Information, PhD., University of Cambridge. COPESTAKE, A. (1995), Representing Lexical Polysemy, in J. Klavans (ed.), Representation and Acquisition of Lexical Knowledge: Polysemy, Ambiguity and Generativity, AAAI Symposyum, Menlo Park, California, pp
163 REFERÊNCIAS COPESTAKE, A. (2001), The Semi-generative Lexicon: Limits on Lexical Productivity, Proceedings on the 1 st International Workshop on Generative Approaches to the Lexicon, Geneva. COPESTAKE, A., T. Briscoe (1992), Lexical Operations in a Unification-Based Framework, in J. Pustejovsky, S. Bergler (eds.), Lexical Semantics and Knowledge Representation, Berlin, Springer-Verlag, LNAI nº 627, pp COPESTAKE, A., T. Briscoe (1995), Semi Productive Polysemy and Sense Extension, in J. Pustejovsky, B. Boguraev (eds.), Lexical Semantics, Oxford, Clarendon Press, pp COSTA, J., A. Melo (1998), Dicionário da Língua Portuguesa, 8ª edição, Porto Editora, Porto. CRISMA, P. (1990), Functional Categories Inside the Noun Phrases, Tesi di Laurea, Università degli Studi di Venezia. CRUSE, D.A. (1986), Lexical Semantics, Cambridge University Press. CRUSE, D.A. (1995), Polysemy and Related Phenomena from a Cognitive Linguistic Viewpoint, in P. Saint-Dizier, E. Viegas (eds.), Computational Lexical Semantics, Cambridge University Press. CRUSE, D. A. (2000), Aspects of the Micro-structure of Word Meanings, in Y. Ravin, C. Leacock (eds.), Polysemy: Theoretical and Computational Approaches, Oxford, University Press, pp CUNHA, C., L. Cintra (1984), Nova Gramática do Português Contemporâneo, Edições João Sá da Costa, Lisboa. DEMONTE, V. (1999) El Adjetivo: Clases y Usos. La Posición del Adjetivo en el Sintagma Nominal, in I. Bosque, V. Demonte (eds.), Gramática Descriptiva de la Lengua Española, Real Academia Española, Colección Nebrija y Bello, Editorial Espassa. DIXON, R. M. W. (1991), A New Approach to English Grammar on Semantic Principles, Oxford, Clarendon Press. DOWTY, D. (1979), Word Meaning and Montague Grammar: the Semantics of Verbs and Times in Generative Semantics and Montague s PTQ, Dordrecht, Reidel. 157
164 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS DOWTY, D. (1985), On Some Recent Analyses of Control, Linguistics and Philosophy 8, pp FELLBAUM, C., (ed.) (1998), WordNet: an Electronic Lexical Database, MA, The MIT Press. FELLBAUM, C. (1999), The Case for Electronic Lexicography: Some Linguistic and Computational Arguments, in P. Marrafa, A. Mota (orgs.), Linguística Computacional: Investigação Fundamental e Aplicações, Associação Portuguesa de Linguística, Edições Colibri, 1999, Lisboa. GEERAERTS, D. (1993), Vagueness s Puzzles, Polysemy s Vagaries, Cognitive Linguistics, pp GODDARD, C. (2000), Polysemy: A Problem of Definition, in Y. Ravin, C. Leacock (eds.), Polysemy: Theoretical and Computational Approaches, Oxford, University Press, pp GRIMSHAW, J. (1990), Argument Structure, Cambridge, MA, The MIT Press. GRISHMAN, R. (1986), Computational Linguistics: An Introduction, Cambridge University Press. JACKENDOFF, R. (1990), Semantic Structures, Cambridge, MA, The MIT Press. JOHNSTON, M., F. Busa, (1996), Qualia Structure and the Compositional Interpretation of Compounds, in E. Viegas (ed.), Proceedings.of the SIGLEX Workshop on Breadth and Depth of Semantic Lexicons, ACL, Santa Cruz, California, pp KILGARRIFF, A. (1992), Polysemy, PhD., University of Sussex. KILGARRIFF, A. (1995a), Inheriting Polysemy, in P. Saint-Dizier, E. Viegas (eds.), Computational Lexical Semantics, Cambridge University Press. KILGARRIFF, A. (1997a), What is Word Sense Disambiguation Good for? Proceedings NLP Pacific Rim Symposium 97, Phuket, Thailand. KILGARRIFF, A. (1997b), Using Word Frequency Lists to Measure Corpus Homogeneity and Similarity between Corpora. 158
165 REFERÊNCIAS KROVETZ, R. (1998), More than One Sense Per Discourse, Proceedings of the ACL-SIGLEX workshop. LAKOFF, G. (1970), A Note on Vagueness and Ambiguity, Linguistic Inquiry, 1, pp LAKOFF, G., M. Johnson (1980), Metaphors We Live By, The University of Chicago Press. LAPATA, M. (2001), A Corpus-based Account of Regular Polysemy: the Case of Contextsensitive Adjectives, Proceedings of NAACL. LASCARIDES, A., A. Copestake (1995), Pragmatics and Word meaning, Proceedings of Semantics and Linguistic Theory V. LASCARIDES, A., Copestake, A., Briscoe, T. (1996), Ambiguity and Coherence, Journal of Semantics 13.1, pp LEVIN, B. (1993), English Verb Classes and Alternations: A Preliminary Investigation, Chicago, The University of Chicago Press. LOPES, M. H. (1996), Sintaxe e Aspecto dos Nomes Deverbais em Português, Dissertação de Mestrado, Universidade do Porto. LYON, J. (1977), Semantics, Cambridge University Press. MACHADO, J. P. (1977), Dicionário Etimológico da Língua Portuguesa, 3ª Edição, Livros Horizonte, Lisboa. MARRAFA, P. (1993), Predicação Secundária e Predicados Complexos em Português: Análise e Modelização, Dissertação de Doutoramento, Universidade de Lisboa. MARRAFA, P. (2001), WordNet do Português: uma Base de Dados de Conhecimento Linguístico, Instituto Camões. MATEUS, M. H. M. et alii (1989), Gramática da Língua Portuguesa, Colecção Linguística, Editorial Caminho. MENDES, A. (2001), Propriedades Sintácticas e Semânticas de Predicados Verbais com Pluralidade de Sentidos: o Caso dos Verbos psicológicos, Dissertação de Doutoramento, Universidade de Lisboa. 159
166 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS MENDES, S., R. P. Chaves (2001), Enriching WordNet with Qualia Information, Workshop on WordNet and Other Lexical Resources, NAACL 2001, Pittsburgh, PA, USA. MILLER, G.A. (1978), Semantic Relation Among Words, in M. Halle, J. Bresnen, G.A. Miller (eds.), Linguistic Theory and Psycholinguistic Reality, Cambridge, MA, The MIT Press, pp MILLER, G. A., C. Fellbaum, (1991), Semantic Networks in English, Cognition, 41, pp MINEUR, A., Buitelaar, P. (1996), A Compositional Treatment of Polysemous Arguments in Categorial Grammar, in K. van Deemter, S. Peters (eds.), Semantic Ambiguity and Underspecification, Chicago, Chicago University Press, pp MOENS, M., M. Steedman (1988), Temporal Ontology and Temporal Reference, Computational Linguistics, vol. 14, pp MONTAGUE, R. (1974), Towards a Proper Treatment of Quantification in English, in R. H. Thomason (ed.), Formal Philosophy: Selected Papers of Richard Montague, New Haven, Yale University Press. NIGHTINGALE, S. (1999), Polysemy and Homonymy in Japanese Verbal Alternations, PhD., University of Edinburgh. NUNBERG, G. (1995), Transfers of Meaning, Journal of Semantics, 1. NUNBERG, G., A. Zaenen (1992), Systematic Polysemy in Lexicology and Lexicography, Proceedings of Euralex92, Tampere, Finland. OLIVEIRA, F. (1992), Algumas Questões sobre o Tempo e Aspecto, Cadernos de Semântica nº 9, Faculdade de Letras da Universidade de Lisboa. OSTLER, N., B. Atkins (1992), Predictable Meaning Shift: Some Linguistic Properties of Lexical Implication Rules, in J. Pustejovsky, S. Bergler (eds.), Lexical Semantics and Knowledge Representation, Berlin, Springer-Verlag, LNAI nº 627, pp PALMER, M. (1998), Are WordNet Sense Distinctions Appropriate for Computational Lexicons?, Proceedings of Senseval, Siglexl98, Brighton, England. 160
167 REFERÊNCIAS PANMAN, O. (1982), Homonymy and Polysemy, Lingua, 58, pp PARTEE, B., M. Rooth (1982), Generalized Conjunction and Type Ambiguity, in Bäuerle, Schwarze, von Stechow (eds.), Meaning, Use and Interpretation of Language, Walter de Gruyter. PARTEE, B., A. Meulen, R. Wall (1990), Mathematical Methods in Linguistics, Dordrecht, Kluwer Academic Publishers. PAUSE, P., D. Heitz (1998), Verbal Polysemy: An Open Problem, Arbeitspapier Nr. 95, (English Version). PETERS, W., I. Peters (2000), Lexicalised Systematic Polysemy in WordNet, Proceedings of Second International Conference on Language Resources and Evaluation, Athens. PINTO, C. (2001), Para a Computação da Polissemia Nominal em Português, Dissertação de Mestrado, Universidade de Lisboa. POLLARD, C., I. Sag (1994), Head-Driven Phrase Structure Grammar, University of Chicago Press. PUSTEJOVSKY, J. (1991), The Syntax of Event Structure, Cognition, 41, pp PUSTEJOVSKY, J. (1993), Type Coercion and Lexical Selection, in J. Pustejovsky (ed.), Semantics and the Lexicon, Dordrecht, Kluwer Academic Publishers. PUSTEJOVSKY, J. (1995a), The Generative Lexicon, Cambridge, MA, The MIT Press. PUSTEJOVSKY, J. (1995b), Linguistic Constraints on Type Coercion, in P. Saint-Dizier, E. Viegas (eds.), Computational Lexical Semantics, Cambridge, Cambridge University Press, pp PUSTEJOVSKY, J. (1996), The Semantics of Complex Types, Langue Française. PUSTEJOVSKY, J. (1997), Knowledge is Elsewhere : Natural Language Semantics Meets the X-Files, Linguistic Inquiry. PUSTEJOVSKY, J. (1998), The Semantics of Lexical Underspecification Folia Linguistica. 161
168 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS PUSTEJOVSKY, J. (2001), Type Construction and the Logic of Concepts in P. Bouillon, F. Busa (eds.), The Syntax of Word Meaning, Cambridge University Press. PUSTEJOVSKY, J., P. Anick (1988), On the Semantic Interpretation of Nominals, Proceedings of COLING-1988, Budapest. PUSTEJOVSKY, J., B. Boguraev (1996), Introduction: Lexical Semantics in Context, in J. Pustejovsky, B. Boguraev (eds.), Lexical Semantics: The Problem of Polysemy, Oxford University Press, pp PUSTEJOVSKY, J., P. Bouillon (1996), Aspectual Coercion and Logical Polysemy, in J. Pustejovsky, B. Boguraev (eds.), Lexical Semantics: The Problem of Polysemy, Oxford University Press, pp QUINE, W. V (1960), Word and Object; Cambridge, Mass., The MIT Press. RAPOSO, E. P. (1992), Teoria da Gramática. A Faculdade da Linguagem, Colecção Linguística, Editorial Caminho. RAVIN, Y., C. Leacock (2000), Polysemy: An Overview, in Y. Ravin, C. Leacock (eds.), Polysemy: Theoretical and Computational Approaches, Oxford, University Press, pp ROBINS, R. H. (1967), A Short History of Linguistics, Bloomington, Indiana University Press. SAINT-DIZIER, P. (1995), Generativity, Type Coercion and Verb Semantic Classes, Representation and Acquisition of Lexical Knowledge: Polysemy, Ambiguity and Generativity, AAAI Symposyum, Menlo Park, California. SAINT-DIZIER, P. (1998a), Sense Variation and Lexical Semantics Generative Operations, in D.M.W. (ed.), New Methods in Language Processing and Computational Natural Language Learning, ACL, pp SAINT-DIZIER, P. (1998b), A Generative Lexicon Perspective for Adjectival Modification, COLING-ACL. SAINT-DIZIER, P. (1999), On the Polimorphic Behavior of Word-Senses, in P. Marrafa, A. Mota (orgs.), Linguística Computacional: Investigação Fundamental e Aplicações, Associação Portuguesa de Linguística, Edições Colibri, Lisboa, pp
169 REFERÊNCIAS SCHÜTZE, H. (2000), Disambiguation and Connectionism, in Y. Ravin, C. Leacock (eds.), Polysemy: Theoretical and Computational Approaches, Oxford, University Press, pp SILVA. A. S. (1997), A Semântica de Deixar: Uma Contribuição para a Abordagem Cognitiva em Semântica Lexical, Fundação Calouste Gulbenkian, Fundação para a Ciência e a Tecnologia, Ministério da Ciência e da Tecnologia. TOMURO, N. (1998), Semi-automatic Induction of Systematic Polysemy from WordNet, Proceedings of the Workshop on Usage of WordNet in Natural Language Processing Systems, at COLING-ACL. VENDLER, Z. (1967), Linguistics in Philosophy, Ithaca, Cornell University Press. VERSPOOR, C. (1996), Lexical Limits on the Influence of Context, in G. W. Cottrell (ed.) Proceedings of the Eighteen Annual Conference of the Cognitive Science Society, Lawrence Erlbaum Associates Publishers, pp VERSPOOR, C. (1997a), Contextually-Dependent Lexical Semantics, PhD., The University of Edinburgh. VERSPOOR, C. (1997b), Conventinality-Governed Logical Metonymy, in H. Bunt, L. Kievit, R. Muskens, M. Verlinden (eds.), Proceedings of the 2 nd International Workshop on Computational Semantics, Tilburg, the Netherlands, pp WEINREICH, U. (1964), Webster s Third: a Critique of its Semantics, International Journal of American Linguistics 30, pp WIERZBICKA, A. (1996), Semantics: Primes and Universals, Oxford, Oxford University Press. XAVIER, M. F. & M. H. Mateus (orgs.) (1992), Dicionário de Termos Linguísticos, Associação Portuguesa de Linguística/Instituto de Linguística Teórica e Computacional, 2 Volumes, Edições Cosmos, Lisboa. 163
170 COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS 164
Fernando Gil Coutinho de Andrade. Polissemia e produtividade nas construções lexicais: um estudo do prefixo re- no português contemporâneo
Fernando Gil Coutinho de Andrade Polissemia e produtividade nas construções lexicais: um estudo do prefixo re- no português contemporâneo Dissertação de Mestrado Dissertação apresentada como requisito
SEMÂNTICA PARTE 3 ANÁLISE SEMÂNTICA 14/06/2012. SCC5908 Tópicos em Processamento de Língua Natural. Até agora, significado da sentença
SEMÂNTICA PARTE 3 SCC5908 Tópicos em Processamento de Língua Natural Thiago A. S. Pardo ANÁLISE SEMÂNTICA Até agora, significado da sentença Rhumba closed. e Closing(e) Closed(e,Rhumba) 2 1 ANÁLISE SEMÂNTICA
ADVÉRBIOS ASPECTUALIZADORES NO TEXTO DISSERTATIVO PRODUZIDO NA ESCOLA
JOSÉLIA RIBEIRO ADVÉRBIOS ASPECTUALIZADORES NO TEXTO DISSERTATIVO PRODUZIDO NA ESCOLA Dissertação apresentada como requisito parcial à obtenção do grau de Mestre em Língüística, Curso de Pósgraduação em
1 Complementos e Modificadores de Nome... 2
Guião 4 3 A estrutura da frase 3.4 A estrutura interna de alguns constituintes: sintagma verbal, nominal, adjectival e preposicional. 3.5 Funções sintácticas (de constituintes obrigatórios e de constituintes
Pronome relativo A língua portuguesa apresenta 7 formas de pronomes e advérbios relativos consensuais: Que O que Quem O qual Onde Quanto Cujo
Orações Subordinadas Relativas / Adjectivas (Bibliografia: Peres, J. e Móia, T., (1995), Áreas Críticas da Língua Portuguesa, Editorial Caminho, Lisboa) Não são argumentos de um predicador (ou seja, não
Lógica Computacional
Lógica Computacional Lógica de Operadores Booleanos Interpretações Tautológicas, Lógicas e Analíticas Funcionalidade / Tabelas de Verdade dos Operadores Booleanos Consequências Tautológica, Lógica e Analítica
A diculdade da denição de palavra. Luiz Arthur Pagani (UFPR)
A diculdade da denição de palavra (UFPR) 1 sentença maior unidade gramatical: A frase é a maior unidade de descrição gramatical. [1, p. 180] sentença sem distribuição: a noção de distribuição que se baseia
SEMÂNTICA PARTE 3 (CONTINUAÇÃO)
SEMÂNTICA PARTE 3 (CONTINUAÇÃO) SCC5908 Tópicos em Processamento de Língua Natural Thiago A. S. Pardo EVENTOS E SEUS PARTICIPANTES Semântica de eventos Predição de participantes/argumentos de um predicador
1 Introdução. 1 CÂMARA JR., J.M, Estrutura da língua portuguesa, p Ibid. p. 88.
1 Introdução A categoria tempo é um dos pontos mais complexos dos estudos em língua portuguesa. Por se tratar de um campo que envolve, sobretudo, conceitos igualmente complexos como semântica e interpretação
PL/SQL: Domine a linguagem do banco de dados Oracle (Portuguese Edition)
PL/SQL: Domine a linguagem do banco de dados Oracle (Portuguese Edition) Eduardo Gonçalves Click here if your download doesn"t start automatically PL/SQL: Domine a linguagem do banco de dados Oracle (Portuguese
Ontologias Linguísticas e Processamento de Linguagem Natural. Ygor Sousa CIn/UFPE
Ontologias Linguísticas e Processamento de Linguagem Natural Ygor Sousa CIn/UFPE [email protected] 2015 Roteiro Processamento de Linguagem Natural Ontologias Linguísticas WordNet FrameNet Desambiguação
Guião 1 Anexo (v1.0) 2. Do léxico à frase 2.1. Classes de palavras e critérios para a sua identificação
F a c u l d a d e d e L e t r a s d a U n i v e r s i d a d e d e L i s b o a D e p a r t a m e n t o d e L i n g u í s t i c a G e r a l e R o m â n i c a E s t r u t u r a d a s F r a s e s e m P o r
UNIVERSIDADE DE LISBOA FACULDADE DE LETRAS
UNIVERSIDADE DE LISBOA FACULDADE DE LETRAS Relatório de Projeto: Traduzir textos sobre História: questões de tradução na obra El Reino Olvidado Marta Manuel Henriques Silva MESTRADO EM TRADUÇÃO 2013 UNIVERSIDADE
Dicionário Terminológico uma ferramenta auxiliar do professor de português
Dicionário Terminológico uma ferramenta auxiliar do professor de português Paula Batista Guerreiro Escola Secundária Mouzinho da Silveira O Dicionário Terminológico (DT) apresenta-se como uma ferramenta
2. Morfologia Flexional Derivação: criar novos itens lexicais Flexão: Afixação determinada sintaticamente
1. DERIVAÇ Ã O E FLEXÃ O DERIVAÇ Ã O FLEXÃ O pode mudar a categoria lexical de base + - admite a ordem oposta de dois afixos presos + - é um processo bastante produtivo - + é paradigmática - + muda o sentido
Ana Alexandra da Costa Castro Neto
A COMPREENSÃO DAS METÁFORAS UM ESTUDO PSICOLINGUÍSTICO Ana Alexandra da Costa Castro Neto Mestrado em Linguística Área de especialização: Psicolinguística Departamento de Linguística Geral e Românica Faculdade
DISCIPLINA DE LÍNGUA PORTUGUESA ANO LECTIVO 2007/2008
DISCIPLINA DE LÍNGUA PORTUGUESA ANO LECTIVO 2007/2008 1. COMPETÊNCIAS ESSENCIAIS 8º Ano COMPETÊNCIAS GERAIS 1- Mobilizar saberes culturais, científicos e tecnológicos para compreender a realidade e para
Morfologia dos gestos
15 Um olhar sobre a Morfologia dos gestos Sandra Nascimento & Margarita Correia 15 Apresentação UNIDADE 1: O início: estudos linguísticos sobre línguas orais, gestuais e LGP 19 1. Objectivos da Unidade
2. A Nominalização no Lexicalismo Gerativista 2.1 Considerações Preliminares
15 2. A Nominalização no Lexicalismo Gerativista 2.1 Considerações Preliminares A partir dos primeiros anos de seu desenvolvimento, sob a perspectiva da Hipótese Transformacionalista, o gerativismo dispensava
Introdução à perspectiva cognitivista da linguagem: visão geral. Sintaxe do Português II Prof. Dr. Paulo Roberto Gonçalves Segundo FFLCH-USP DLCV FLP
Introdução à perspectiva cognitivista da linguagem: visão geral Sintaxe do Português II Prof. Dr. Paulo Roberto Gonçalves Segundo FFLCH-USP DLCV FLP O que é a Linguística Cognitiva (LC)? Para Croft & Cruse
Como testar componentes eletrônicos - volume 1 (Portuguese Edition)
Como testar componentes eletrônicos - volume 1 (Portuguese Edition) Renato Paiotti Newton C. Braga Click here if your download doesn"t start automatically Como testar componentes eletrônicos - volume 1
Objectivos / Competências Conteúdos Descrição dos Domínios de referência: Unidades temáticas
MATRIZ DA PROVA DE EXAME A NÍVEL DE ESCOLA AO ABRIGO DO DECRETO-LEI Nº 357/07, DE 29 DE OUTUBRO ESPANHOL NÍVEL DE INICIAÇÃO 10º ANO (Cursos Científicos- Humanísticos Decreto Lei nº 74/04, de 26 de Março)
IDEF3 - Process Description Capture Method
IDEF3 - Process Description Capture Method Como foi referido no texto anterior, a metodologia IDEF é constituída por vários módulos, cada um destes com especificidades e propriedades adequadas ao contexto
Curso de Línguas e Humanidades
ESCOLA SECUNDÁRIA MANUEL TEIXEIRA GOMES Departamento de Línguas [Românicas e Clássicas] Docente: Luís Pinto Salema Prova Escrita de Latim A 10.º Ano de Escolaridade Curso de Línguas e Humanidades Informação
Grice: querer dizer. Projecto de Grice: explicar a significação em termos de intenções.
Grice: querer dizer Referências: Grice, Paul, Meaning, in Studies in the Way of Words, Cambridge (Mas.), Harvard University Press, 1989, pp 213-223. Schiffer, Stephen, Meaning, Oxford, Oxford University
MCZA Processamento de Linguagem Natural Semântica e similaridade de palavras: Parte I
MCZA017-13 Processamento de Linguagem Natural Semântica e similaridade de palavras: Parte I Prof. Jesús P. Mena-Chalco [email protected] 1Q-2018 1 Bibliografia Daniel Jurafsky & James H. Martin.
6 Atributos. A dívida da empresa subiu.
6 Atributos Para buscar o sentimento de um texto automaticamente precisamos encontrar boas pistas ao longo do discurso. Uma grande variedade de palavras e expressões possui conotação positiva ou negativa,
2011/2012 (Despacho nº 5238/2011 de 28 de Março) 2º Ano CONTEÚDOS ANUAIS DISCIPLINA: Língua Portuguesa. CEF Serviço de Bar
2011/2012 (Despacho nº 5238/2011 de 28 de Março) 2º Ano CONTEÚDOS ANUAIS DISCIPLINA: Língua Portuguesa CEF Serviço de Bar CONTEÚDOS 1º PERÍODO AULAS PREVISTAS 46 TEXTOS DE TEATRO - AUTO DA BARCA DO INFERNO,
Análise Sintática. Compiladores Cristina C. Vieira. Compiladores 2012/2013
Análise Sintática Compiladores Cristina C. Vieira 1 Árvore Sintática Nós internos: símbolos não-terminais Folhas: símbolos terminais Arcos: de símbolos não-terminais do LHS da produção para nós do RHS
Cap. 2. Introdução a Teoria de Utilidade e Teoria de Jogos
Cap. 2. Introdução a Teoria de Utilidade e Teoria de Jogos Teoria de Utilidade Como as pessoas escolhem e como formalizar o processo? Preferências Racionais Utilidade Utilidade x Dinheiro Utilidades multiatributos
Gramática de Montague
Gramática de Montague Apresentação Inicial Luiz Arthur Pagani 1 There is in my opinion no important theoretical dierence between natural languages and the articial languages of logicians; indeed I consider
Novo Programa de Português do Ensino Básico
Etapa 2 Laboratório de Língua Para que possas redigir com consistência a tua apreciação crítica, é importante aprofundares os teus conhecimentos sobre alguns elementos gramaticais e sobre algumas construções
CADA PAÍS TEM UMA LÍNGUA DE SINAIS PRÓPRIA E A LIBRAS É A LÍNGUA BRASILEIRA DE SINAIS
CADA PAÍS TEM UMA LÍNGUA DE SINAIS PRÓPRIA E A LIBRAS É A LÍNGUA BRASILEIRA DE SINAIS Desse modo, a língua de sinais não é uma língua universal, pois adquire características diferentes em cada país e,
DISCIPLINA DE LÍNGUA PORTUGUESA ANO LECTIVO 2009/ º Ano 1. COMPETÊNCIAS ESSENCIAIS
DISCIPLINA DE LÍNGUA PORTUGUESA ANO LECTIVO 2009/2010 1. COMPETÊNCIAS ESSENCIAIS 8º Ano COMPETÊNCIAS GERAIS 1- Mobilizar saberes culturais, científicos e tecnológicos para compreender a realidade e para
O guia do enxoval do bebê nos Estados Unidos: Dicas e segredos da maior especialista de compras em Miami, Orlando e Nova York (Portuguese Edition)
O guia do enxoval do bebê nos Estados Unidos: Dicas e segredos da maior especialista de compras em Miami, Orlando e Nova York (Portuguese Edition) Priscila Goldenberg Click here if your download doesn"t
Metáfora. Companion to the Philosophy of Language, Oxford, Blackwell, 1998, pp
Metáfora Referências: Aristóteles, Retórica, Lisboa, INCM, 2005. Black, Max, More about metaphor, in Ortony, Andrew (ed.), Metaphor and Thought (2 nd ed.), Cambridge, Cambridge University Press, 1993,
Indiscernibilidade de Idênticos. Atitudes Proposicionais e indiscernibilidade de idênticos
Indiscernibilidade de Idênticos Atitudes Proposicionais e indiscernibilidade de Consideremos agora o caso das atitudes proposicionais, das construções epistémicas e psicológicas, e perguntemo-nos se é
3. Modelação Evolução histórica
3. Modelação 3.1. Evolução histórica 1 2 Evolução histórica Antes de serem abordados os modelos Ambiental e Comportamental, é importante observar o quadro seguinte, que apresenta a evolução histórica dos
Inflation Expectations and Behavior: Do Survey Respondents Act on their Beliefs? O. Armantier, W. Bruine de Bruin, G. Topa W. VanderKlaauw, B.
Inflation Expectations and Behavior: Do Survey Respondents Act on their Beliefs? O. Armantier, W. Bruine de Bruin, G. Topa W. VanderKlaauw, B. Zafar November 18, 2010 Introduction Inflation expectations
Professora: Jéssica Nayra Sayão de Paula
Professora: Jéssica Nayra Sayão de Paula Conceitos básicos e importantes a serem fixados: 1- Sincronia e Diacronia; 2- Língua e Fala 3- Significante e Significado 4- Paradigma e Sintagma 5- Fonética e
Metodologia de pesquisa para Ciência da Computação
Metodologia de pesquisa para Ciência da Computação Prof. Raul Sidnei Wazlawick 1 Escrita da Monografia A escrita de uma monografia depende fundamentalmente da existência de algum conteúdo para ser apresentado.
Lógica Proposicional
Lógica Proposicional Lógica Computacional Carlos Bacelar Almeida Departmento de Informática Universidade do Minho 2007/2008 Carlos Bacelar Almeida, DIUM LÓGICA PROPOSICIONAL- LÓGICA COMPUTACIONAL 1/28
Linguagens Documentárias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília
Linguagens Documentárias Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília Contexto Organização da Informação...... procura criar métodos e instrumentos para elaborar
Língua Portuguesa 8º ano
Escutar para Aprender e Construir Conhecimento Tipologia textual: texto conversacional. Variação e normalização linguística. Língua padrão (traços específicos). Língua Portuguesa 8º ano Conteúdos 1º Período
Instituto Tecnológico de Aeronáutica
Instituto Tecnológico de Aeronáutica Programa de Pós-Graduação em Engenharia de Infraestrutura Aeronáutica Programa de Pós-Graduação em Engenharia Aeronáutica e Mecânica Prova de Seleção o semestre de
Lógica Computacional
Aula Teórica 1: Apresentação Departamento de Informática 14 de Fevereiro de 2011 O que é a lógica? Lógica: de que se trata? A lógica está na base do raciocínio É um processo inerentemente humano, tão básico
Unidade 1 Introdução à Análise de Sistemas. Objectivos
Unidade 1 Introdução à Análise de Sistemas Objectivos 1 2 Objectivos Definir a análise de sistemas Reconhecer as funções do analista de sistemas Definir conceitos de sistema Reconhecer a finalidade do
METÁFORAS COM VERBOS PONTUAIS DO PB E DO INGLÊS: UMA ANÁLISE DESCRITIVA E COMPARATIVA.
METÁFORAS COM VERBOS PONTUAIS DO PB E DO INGLÊS: UMA ANÁLISE DESCRITIVA E COMPARATIVA. Aluna: Luênnya Alves Clemente 1 Orientadora: Dieysa Kanyela Fossile 2 Nesta pesquisa, temos como objetivo (i) descrever
PROJETO DE INTERFACES PARA ÁLGEBRA DE MAPAS EM GEOPROCESSAMENTO NO AMBIENTE SPRING
MINISTÉRIO DA CIÊNCIA E TECNOLOGIA INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS INPE-9307-TDI/820 PROJETO DE INTERFACES PARA ÁLGEBRA DE MAPAS EM GEOPROCESSAMENTO NO AMBIENTE SPRING Ivan Soares de Lucena Dissertação
Tecnologia dos Computadores 2002/2003. Exercícios
Introdução à Álgebra de Boole 1 Introdução Em 1854, George Boole, um matemático inglês, inventou um sistema algébrico de dois valores, cujo resultado da sua evolução até aos dias de hoje se dá o nome de
18 Introdução à. Semântica
18 Introdução à Semântica 5 Introdução UNIDADE 1: O significado 9 1. Objectivos da Unidade 1 9 1.1. Em busca do sentido 13 1.2. A semiótica 22 1.3. A semântica 30 1.4. A semântica e a cognição UNIDADE
1.1 Qual a relevância do sistema pronominal para uma teoria da aquisição da linguagem? Por que os complementos pronominais?
1 Introdução Nesta dissertação, o problema da aquisição do sistema pronominal, no que concerne aos complementos acusativos de terceira pessoa, é investigado em função de um contraste entre o sistema pronominal
1. Porquemedir? 2. Conceitos de Medida 3. Como medir?
1. Porquemedir? 2. Conceitos de Medida 3. Como medir? Por que medir? Monitoramento de um processo ou sistema Controle de um processo ou sistema Validação de predições teóricas Experimentação - formulação
Como deixar seus cabelos lindos e saudáveis (Coleção Beleza) (Portuguese Edition)
Como deixar seus cabelos lindos e saudáveis (Coleção Beleza) (Portuguese Edition) Edições Lebooks Click here if your download doesn"t start automatically Como deixar seus cabelos lindos e saudáveis (Coleção
Conhecimento explícito da língua LEITURA
Compreensão do oral/expressão oral Leitura Conhecimento explícito da língua Escrita LEITURA 1 Apresentação 1. Nome da Sequência: 2. Contexto/projecto: Conhecimento explícito da língua 3. Ano de escolaridade:
Considerações finais
Considerações finais Ana Carolina Sperança-Criscuolo SciELO Books / SciELO Livros / SciELO Libros SPERANÇA-CRISCUOLO, AC. Considerações finais. In: Funcionalismo e cognitismo na sintaxe do português: uma
CATEGORIAS LEXICAIS EM LIBRAS
665 de 682 CATEGORIAS LEXICAIS EM LIBRAS Adriana Stella C. Lessa-de-Oliveira (UESB) Letícia Matos Santos Da Silva (UESB) Jéssica Caroline Souza Aguiar (UESB) RESUMO Este trabalho objetiva verificar características
Divisão de Engenharia Mecânica. Programa de Pós-Graduação em Engenharia Aeronáutica e Mecânica. Prova de Seleção para Bolsas 1 o semestre de 2014
Divisão de Engenharia Mecânica Programa de Pós-Graduação em Engenharia Aeronáutica e Mecânica Prova de Seleção para Bolsas 1 o semestre de 2014 07 de março de 2014 Nome do Candidato Observações 1. Duração
Capítulo1. Capítulo2. Índice A LÍNGUA E A LINGUAGEM O PORTUGUÊS: uma língua, muitas variedades... 15
Capítulo1 Capítulo2 A LÍNGUA E A LINGUAGEM............................................. 9 Linguagem: aptidão inata.............................................. 10 Funções.............................................................
Inteligência Artificial. Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional
Inteligência Artificial Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional OBJETIVOS : Introduzir o estudo Processamento de Linguagem Natural. Histórico O processamento de linguagem natural, nasceu
Departamento Curricular de Línguas
Escola Básica Integrada c/ji Fialho de Almeida- Cuba Departamento Curricular de Línguas Ano Lectivo de 2007/2008 Critérios de avaliação Em reunião de Departamento Curricular de Línguas e de acordo com
O que é uma convenção? (Lewis) Uma regularidade R na acção ou na acção e na crença é uma convenção numa população P se e somente se:
Convenções Referências Burge, Tyler, On knowledge and convention, The Philosophical Review, 84 (2), 1975, pp 249-255. Chomsky, Noam, Rules and Representations, Oxford, Blackwell, 1980. Davidson, Donald,
ATLAS DE ACUPUNTURA VETERINáRIA. CãES E GATOS (EM PORTUGUESE DO BRASIL) BY CHOO HYUNG KIM
Read Online and Download Ebook ATLAS DE ACUPUNTURA VETERINáRIA. CãES E GATOS (EM PORTUGUESE DO BRASIL) BY CHOO HYUNG KIM DOWNLOAD EBOOK : ATLAS DE ACUPUNTURA VETERINáRIA. CãES E GATOS Click link bellow
RELAÇÕES SEMÂNTICAS FUNDAMENTOS DE SEMÂNTICA APOIO PEDAGÓGICO 20/04/2018 SAULO SANTOS
RELAÇÕES SEMÂNTICAS FUNDAMENTOS DE SEMÂNTICA APOIO PEDAGÓGICO 20/04/2018 SAULO SANTOS PROGRAMA DA AULA 1. Relações semânticas 2. Correspondência 2.1.1. Sinonímia 2.1.2. Identidade de referência 2.1.3.
2ª AVALIAÇÃO/ º ANO / PRÉ-VESTIBULAR PROVA 1-25/04/2015 PROVA DISCURSIVA
2ª AVALIAÇÃO/ 2015 3º ANO / PRÉ-VESTIBULAR PROVA 1-25/04/2015 PROVA DISCURSIVA ATENÇÃO! w Consulte a tabela abaixo para identificar a prova discursiva específica ao curso de sua opção. Curso com códigos
Programação Funcional Apontamentos (Versão 1.16)
Programação Funcional Apontamentos (Versão 1.16) Pedro Quaresma de Almeida 1 2 de Outubro de 2008 1 Departamento de Matemática da Universidade de Coimbra. Conteúdo 1 Introdução 2 1.1 Diferentes Metodologias.............................
SEMÂNTICA DAS PREDICAÇÕES ESTATIVAS
SEMÂNTICA DAS PREDICAÇÕES ESTATIVAS PARA UMA CARACTERIZAÇÃO ASPECTUAL DOS ESTADOS SUB Hamburg Luís Filipe Cunha A 2007/9518 2007 LINCOM EUROPA ÍNDICE AGRADECIMENTOS RESUMO ABSTRACT RESUME INTRODUÇÃO 1
A INFLUÊNCIA DA CULTURA NA GESTÃO DE PROJETOS - CASO DE ESTUDO: COFICAB
INSTITUTO POLITÉCNICO DA GUARDA ESCOLA SUPERIOR DE TECNOLOGIA E GESTÃO A INFLUÊNCIA DA CULTURA NA GESTÃO DE PROJETOS - CASO DE ESTUDO: COFICAB PROJETO APLICADO DO MESTRADO EM GESTÃO ESPECIALIZAÇÃO EM LOGÍSTICA
AGRUPAMENTO DE ESCOLAS DE CUBA
DISCIPLINA : LÍNGUA PORTUGUESA : 6ºano ANO LECTIVO: 2007/2008 PLANIFICAÇÃO ANUAL COMPETÊNCIAS GERAIS Mobilizar saberes culturais, científicos e tecnológicos para compreender a realidade e para abordar
Conversação Para Viagem - Inglês (Michaelis Tour) (Portuguese Edition)
Conversação Para Viagem - Inglês (Michaelis Tour) (Portuguese Edition) Antonio Carlos Vilela Click here if your download doesn"t start automatically Conversação Para Viagem - Inglês (Michaelis Tour) (Portuguese
Iam Vita Jabour. O Impacto de Atributos Estruturais na Identificação de Tabelas e Listas em Documentos HTML. Dissertação de Mestrado
Iam Vita Jabour O Impacto de Atributos Estruturais na Identificação de Tabelas e Listas em Documentos HTML Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do grau de
