O uso de dicionários e de autómatos finitos na representação lexical das línguas naturais

Tamanho: px
Começar a partir da página:

Download "O uso de dicionários e de autómatos finitos na representação lexical das línguas naturais"

Transcrição

1 Versão de autor do texto com o mesmo título incluído na obra Tratamento das Linguas por Computador. Uma introdução à Linguística Computacional e suas aplicações, Lisboa: Caminho, 2001, pp O uso de dicionários e de autómatos finitos na representação lexical das línguas naturais Elisabete Marques Ranchhod Faculdade de Letras da Universidade de Lisboa & CAUTL-IST 1. Introdução Nos últimos anos tornou-se evidente que os recursos linguísticos e, em particular, os recursos lexicais são a pedra de toque de qualquer sistema de processamento de linguagem natural. Na verdade, a crescente necessidade de aplicações da linguística computacional fez ressaltar a carência de dados linguísticos de dimensões reais, e, em particular, de léxicos e gramáticas de grande cobertura. Assim, para responder às actuais solicitações e exigências de qualidade, o tratamento automático das línguas naturais obriga a uma descrição sistemática e completa das línguas a tratar, de modo a evitar ou, pelo menos, reduzir as falhas de processamento devidas à insuficiência dos dados linguísticos. Se, em relação ao tratamento do léxico, os dicionários utilizados pelos sistemas de processamento não forem adequados, quer do ponto de vista da sua cobertura lexical, quer do ponto de vista da formalização e sistematização da informação linguística, isso afectará não só a análise lexical de um determinado texto, mas também todas as fases de processamento subsequentes. Se, por exemplo, uma palavra não for reconhecida ou não for correctamente identificada, a análise sintáctica da frase ou da estrutura em que ela se encontre não poderá ser feita. O léxico surge assim como uma componente de crucial importância em qualquer sistema de processamento automático de texto. Um outro aspecto igualmente importante do ponto de vista da qualidade do processamento é o da capacidade dos sistemas informáticos aplicarem em tempo real estes léxicos e gramáticas de grandes dimensões a textos de vários milhões de palavras. Neste capítulo, abordar-se-á a questão da forma, do conteúdo e da cobertura dos dicionários para utilização automática, uma vez que já existem sistemas informáticos com a robustez necessária para, em tempo real, lidarem com léxicos de dimensões igualmente reais e para os aplicarem eficazmente ao tratamento automático de corpora de grandes dimensões.

2 Elisabete Ranchhod 1.1. Dicionários electrónicos e dicionários de uso informatizados Um dicionário electrónico é um léxico computacional concebido para ser usado, sem intervenção humana, por programas informáticos em diversas operações de processamento de linguagem natural: reconhecimento de unidades lexicais simples e complexas (de natureza terminológica ou não) num texto a ser automaticamente indexado, análise de um texto para extrair informação ou para o traduzir para outra língua, etc. Esta finalidade dos dicionários electrónicos faz com que eles tenham de ser fundamentalmente diferentes daqueles que são elaborados para utilizadores humanos, mesmo quando estes se encontram em suporte magnético ou óptico a fim de poderem ser consultados em ambiente informatizado. Contudo, o facto das versões digitais dos dicionários de uso serem frequentemente comercializadas com a designação de dicionários electrónicos pode levar a uma certa confusão entre os dois tipos de léxicos, que convém esclarecer. Em geral, as versões informatizadas dos dicionários de uso são completamente idênticas às tradicionais edições em papel desses mesmos dicionários: idêntico conteúdo, idêntica estruturação de entradas, idêntica cobertura lexical 1. A sua diferente apresentação pode facilitar a sua consulta, mas não torna diferentes os seus objectivos: em papel ou em formato digital, destinam-se a serem consultados por humanos e não podem em caso algum ser directamente explorados por programas de análise automática de texto. Assim, apesar de alguns aspectos comuns, há entre os léxicos computacionais e aqueles que o não são diferenças apreciáveis Formalização e sistematicidade O que aproxima e justifica a designação de dicionário para os dois tipos de objectos é que, em qualquer dos casos, se trata de repositórios lexicais mais ou menos completos, organizados em artigos. Cada artigo é constituído por uma entrada (em geral, uma palavra) e um conteúdo (a descrição linguística da entrada). A diferença mais evidente, e que tem que ver com os fins a que se destinam, reside no facto de, num dicionário de uso, a informação linguística não estar formalizada, enquanto que a codificação da informação é um requisito imprescindível de um dicionário electrónico. Elaborados com o objectivo específico de serem usados em análise automática de texto, estes dicionários têm de conter informações linguísticas codificadas e formatadas, pois só assim se tornam acessíveis aos programas de análise lexical e sintáctica. Não podem conter lacunas (nem lexicais, nem descritivas) e todas as informações linguísticas têm de estar coerentemente estruturadas. Os dicionários de uso, informatizados ou não, não estão sujeitos a estas imposições. Para não sobrecarregar o dicionário, muitas informações evidentes para o utilizador (humano) são 1 Vejam-se as edições em papel (8ª edição, 1998) e electrónica (CD-ROM, versão 1.0, 1996) de um dos dicionários do português mais completos e mais amplamente divulgados: o Dicionário da Língua Portuguesa, a que voltaremos a fazer referência. 2

3 omitidas, muitas outras são apenas implicitamente referidas. Pressupõe-se, em muitos casos acertadamente, que os falantes que os consultam têm conhecimentos linguísticos suficientes para estabelecer relações e reconstituir o que eventualmente falte. Mas, às máquinas, é preciso dizer-lhes tudo, e é preciso dizer-lhes tudo de forma completa, explícita e coerente. Vejamos um exemplo simples mas ilustrativo. Em português, a formação de adjectivos participiais regulares, sobretudo a partir de verbos da primeira conjugação, é muito produtiva e não levanta, em princípio, dificuldades de maior. Perante palavras como abalançado ou abalroado, qualquer falante é capaz de as relacionar com os verbos correspondentes, abalançar e abalroar, desde que os conheça. Por isso, nos dicionários de uso, opta-se frequentemente por não introduzir essas formas como entradas de dicionário. Do ponto de vista do utilizador humano, os inconvenientes são aceitáveis. São, mesmo assim, mais difíceis de entender as razões por que algumas dessas formas são introduzidas e outras não. O Dicionário da Língua Portuguesa 2 não regista nem abalançado nem abalroado, mas inclui, por exemplo, abafado e abalado. Ora, trata-se de quatro elementos do mesmo tipo e têm idênticas probabilidades de ocorrer num dado texto. Mas vejamos o tratamento gramatical que é dado a abafado e abalado, os elementos que constituem artigos do dicionário. São ambos classificados como adjectivos, indicando-se entre parêntesis a sua relação com os verbos correspondentes: (Part. pass. de abafar); (Part. pass. de abalar). A partir desta informação, o utilizador tem acesso directo às respectivas entradas verbais 3. Uma vez visualizada a entrada desejada, pode solicitar a conjugação do verbo. Nem todos os verbos estão conjugados 4, mas abafar e abalar estão. Esperar-se-ia, pois, encontrar as formas abafado e abalado dentro das conjugações desses verbos. Surpreendentemente, isso não acontece. Na verdade, verificámos que, nesta edição, o particípio não está incluído na lista das formas conjugadas de nenhum verbo. Apesar de existirem certas dificuldades em classificar como participiais ou não as várias formas (regulares e irregulares) que se prestam a ser consideradas como tal, a exclusão do particípio passado das formas conjugadas dos verbos não fica certamente a dever-se à aplicação de qualquer critério de natureza linguística. Ela só pode ser entendida como um lapso, que será certamente corrigido em próximas edições. Para os utilizadores, falantes do português na sua maioria, a ausência do particípio da conjugação dos verbos impedirá o esclarecimento de dúvidas frequentes acerca das formas participiais, como: o particípio do verbo acender é aceso, acendido ou ambos? Por outro lado, isso faz com que o dicionário não contenha qualquer informação sobre os particípios (usados com valor adjectival ou 2 Todas as referências a este dicionário dizem respeito à edição em CD-ROM (versão 1.0, 1996). 3 Nas edições em papel, o dicionário de verbos conjugados constitui um dicionário específico. A edição informatizada permite uma consulta mais cómoda, pois a partir do dicionário geral é possível chamar o dicionário de conjugações. 4 Nem sempre é fornecida a conjugação das entradas verbais do dicionário. Em muitos casos, os verbos são acompanhados por indicações gramaticais e pelos textos de definição, mas não estão conjugados. É o caso, por exemplo, das dez primeiras entradas verbais: ababalhar, ababosar-se, abaçanar, abacelar, abacinar, abadar, abadernar, abadessar, abadiar e abaetar. Trata-se, de facto, de verbos pouco usados. 3

4 Elisabete Ranchhod não) que não constituam entradas (independentes) do dicionário. Mas, mais uma vez, o conhecimento implícito ou mesmo explícito dos humanos que consultam este tipo de obras ajudará a colmatar no todo ou em parte esta lacuna. Contudo, do ponto de vista das máquinas, as lacunas e incoerências resultantes da não inclusão do particípio passado nas formas conjugadas dos verbos bastariam por si só para tornar impraticável a utilização do dicionário em processamento automático de texto. Nos dicionários que tenham estes objectivos, é necessário que todas as entradas verbais estejam associadas a códigos (que representam tabelas de dados formalizados), a partir dos quais são automaticamente geradas todas as formas conjugadas, incluindo, evidentemente, o particípio. Em português, além das formas registadas nos dicionários de verbos conjugados, é preciso prever também aquelas que, tendo o mesmo valor, são formalmente diferentes devido às eventuais adjunções de clíticos, que, por sua vez, em contacto com certas formas verbais, também sofrem alterações (por exemplo: acendemos uma vela > acendemo-la; acenderemos essa vela mais tarde > essa vela, acendê-la-emos mais tarde). Um verbo transitivo não defectivo dá origem a cerca de 60 formas diferentes (ver a conjugação de beber em 3.1.), nas quais estão incluídas várias formas homógrafas (por exemplo, acendemos ou bebemos, que tanto podem ser formas do presente como do pretérito perfeito). A flexão das restantes categorias morfologicamente variáveis tem de ser tratada, como a dos verbos, de modo completo e explícito. A flexão dos nomes e adjectivos é feita por programas que lêem e utilizam a informação codificada que acompanha cada uma das entradas de dicionário (isto é, cada um dos lemas). Conforme o caso, serão geradas: as formas femininas e/ou plurais, os diminutivos e/ou superlativos, etc. Para dar mais um exemplo, tomemos o caso do tratamento do plural dos nomes e adjectivos. Nos dicionários de uso, as informações sobre plurais só em raros casos são explicitamente fornecidas. Mas o Dicionário da Língua Portuguesa permite solicitar uma listagem das palavras plurais. Porém, a noção de «plural» utilizada não é exclusivamente formal, e recobre valores muito diversos. Uma rápida pesquisa das palavras plurais da letra A mostra que a notação plural «pl.» é usada, entre outras coisas, para: - Indicar que o lema da palavra é plural: alvíssaras (s. f. pl.); andrajos (s. m. pl.), não existindo formas singulares correspondentes. - Estabelecer uma distinção entre as diferentes acepções associadas ao singular e ao plural: - alga - s. f. «talófita com clorofila, por vezes microscópica, que vive nas águas ou nos sítios húmidos»; pl. «grupo de talófitas que apresentam núcleos celulares, germes e leucitos»; - azeite - s. m. «óleo extraído da azeitona»; pl. (fig.) «mau humor». - Informar que o étimo da palavra é uma forma plural: 4

5 - agenda - s. f. «livro destinado à anotação [ ]» (Do lat. agenda, «coisas que devem ser feitas», ger. neut. pl. de agere, «agir; fazer»); - alcaraviz - s. m. «guarda-fogo do tubo que [ ]» (Do ár. al-qarabíç, pl. de qarabúç, «arção»?). Se no primeiro caso, plural (pl.) corresponde a uma noção formal: marcação de palavras que são exclusivamente plurais, isso não acontece nos restantes exemplos. A informação de que agenda ou alcaraviz provêm de palavras no plural é de natureza etimológica, o que tem certamente o seu interesse para muitos utilizadores do dicionário, mas essa particularidade não tem qualquer relação com o comportamento morfológico das mesmas, enquanto palavras do português. Incluí-las nas listas das palavras que só existem no plural (caso de alvíssaras e andrajos) é uma aproximação. Em todo o caso, isso significa que a notação pl. é ambígua, o que não pode acontecer com as notações concebidas para serem usadas por programas. No segundo tipo de exemplos, as noções de singular e plural estão relacionadas com diferentes acepções das entradas, que dependem em larga medida das interpretações e cultura pessoais dos lexicógrafos. A acepção de alga associada a pl. não parece ser claramente diferente da de alga s.f. e, assim sendo, não se justifica o desdobramento de entradas com base nesse critério. Quanto a azeites, o que se quer certamente indicar é que, se esta palavra estiver integrada em expressões como: Ele hoje está com os azeites, não tem forma singular possível (*Ele hoje está com o azeite), por razões que se prendem com a falta de composicionalidade (lexical, sintáctica e semântica) de toda a expressão. Mas estas informações de natureza mais sintáctico-semântica também têm de ser tratadas nos dicionários electrónicos. Por isso, eles devem ser desde o início concebidos para poderem receber cumulativamente não só informações adicionais sobre as palavras, mas também sobre as combinações de palavras, isto é, sobre o comportamento (as propriedades sintácticas e semânticas) dessas combinações. Sejam de que tipo forem as entidades linguísticas a descrever, todas as informações têm de ser clara e rigorosamente anotadas. Os códigos das entradas verbais, por exemplo, devem conter informações explícitas sobre o número e o tipo de posições sintácticas que podem ser preenchidas em relação a cada um dos verbos: formas que o sujeito e os eventuais complementos podem apresentar, sua realização lexical, eventuais preposições que introduzem os complementos, preenchimento dessas posições por pronomes e advérbios, possibilidades de apassivação e/ou nominalização da frase, etc. Em síntese: o uso cada vez mais generalizado dos computadores pessoais levou à criação de uma enorme massa de dados digitais, o que permitiu e obrigou a uma total renovação das técnicas de impressão. Hoje em dia, os dicionários, tal como a grande maioria dos jornais, livros, revistas e outros documentos, são compostos em suporte informático. Isso torna possível uma nova e mais ampla divulgação da informação, mas não altera o conteúdo das obras assim editadas. 5

6 Elisabete Ranchhod As breves observações que fizemos sobre as edições informatizadas dos dicionários de uso mostram também que esse formato os torna acessíveis a processos de consulta modernos, mas que as informações que contêm são idênticas às das edições tradicionais. Concebidos para serem usados por humanos, não possuem, por mais completos e bem elaborados que sejam, os requisitos necessários à sua utilização automática. As várias tentativas para reconverter os dicionários de uso em dicionários electrónicos, isto é, em léxicos que possam ser usados automaticamente em operações de processamento das línguas naturais, têm-se revelado uma tarefa difícil, uma vez que a explicitação da informação implícita nas definições obriga a reescrever completamente o conteúdo das entradas. Por isso, várias equipas de investigação têm optado por elaborar de raiz os dicionários electrónicos. 2. Léxicos computacionais especificamente elaborados Parece ser hoje consensual que as aplicações industriais que têm como objectivo a exploração automática de textos escritos melhorarão significativamente se incorporarem melhores sistemas de tratamento linguístico: melhores dicionários, melhores gramáticas. O processamento linguístico de textos é feito a vários níveis: lexical, sintáctico, semântico, que, convém não esquecer, se intersectam em diversos momentos. As unidades textuais de mais baixo nível são as palavras. Assim, a primeira fase de tratamento de um texto passa inevitavelmente pela sua análise lexical. Esta consiste grosseiramente em: (i) identificar as unidades lexicais do texto; (ii) descrever cada uma delas através de informações linguísticas formalizadas, à cabeça das quais se encontram as de natureza morfológica e categorial; (iii) resolver o maior número possível de ambiguidades lexicais provocadas pela homografia. Quanto ao primeiro ponto, numa língua como o português, a identificação das palavras simples como, por exemplo, andar, modelo, par e passo não é complicada: elas estão tipograficamente separadas umas das outras. Porém, muitas unidades lexicais não são palavras simples. São palavras compostas, como o nome andar modelo e o advérbio a par e passo, formadas pela combinação de, pelo menos, duas palavras simples. Contrariamente à das palavras simples, a identificação dos compostos levanta várias questões não triviais. Eles não podem, contudo, ser ignorados, por um lado, devido a razões estritamente linguísticas e, por outro, devido ao seu elevado número em qualquer tipo de texto, e em particular nos de natureza técnica e científica. A associação de informações linguísticas às unidades lexicais de um texto (isto é, a etiquetagem das palavras do texto) pode parecer independente da (adequada) identificação das unidades lexicais, mas, na verdade, depende crucialmente da noção de palavra simples e composta. Se o sistema de etiquetagem não utilizar a noção de composto a palavra par, por exemplo, receberá o mesmo tratamento quer em: 6

7 (1) Cada um dançou com o seu par, em que par é um nome simples pluralizável, desempenhando uma função sintáctica própria desta categoria, quer em: (2) Todas as decisões foram tomadas a par e passo, em que o mesmo elemento lexical perde as propriedades (sintácticas e morfológicas) que tem em (1), nomeadamente a possibilidade de estar no plural e de desempenhar funções próprias de um nome. Ele só tem valor dentro da combinação a par e passo, que no seu todo se comporta como um advérbio, devendo, pois, ser analisada e etiquetada como tal. Se o sistema de etiquetagem não utilizar a noção de composto, cada um dos constituintes do advérbio é contado como uma unidade lexical, o que até certo ponto é verdade, mas pouco pertinente do ponto de vista da análise linguística da sequência, uma vez que se perde o mais importante: a noção fundamental de que a sequência de categorias Prep N Conj N (a par e passo) é uma unidade lexical e sintáctica de carácter adverbial 5. É, por isso, desejável que, aquando do processamento de um texto que contenha compostos (como é o caso de (2)), os analisadores lexicais os identifiquem adequadamente e dêem o seguinte resultado: e não: a par e passo Advérbio a Determinante a Preposição a Pronome par Nome e Conjunção passo Verbo, presente do indicativo passo Nome Este exemplo mostra também que a ambiguidade lexical provocada pela homografia das palavras simples, dramaticamente frequente nas línguas que, ao contrário do inglês, têm um sistema morfológico muito desenvolvido, é resolvida em boa parte mediante um tratamento adequado das palavras compostas. O problema da ambiguidade é tratado em pormenor por Laporte (Resolução de Ambiguidades, neste volume), mas damos aqui mais alguns exemplos ilustrativos. Como tantas outras, as palavras andar, modelo e passo são ambíguas: à partida, podem ser ou verbos (formas dos verbos andar, modelar e passar) ou nomes (um andar bem situado; um modelo de plástico; dar um passo). Porém, quando se combinam entre si para formar, por exemplo, andar modelo e passo a passo, cada uma delas só tem um valor categorial: nome, embora, como se disse antes, essa informação 5 Em geral, os etiquetadores (taggers) baseados exclusivamente em cálculos estatísticos não contemplam os compostos. Mas mesmo os sistemas que se baseiam na consulta de dicionários podem não utilizar dicionários de compostos. Esta é uma das razões, mas não a única, por que se torna difícil comparar resultados de etiquetagem (Ver também as duas notas a seguir). 7

8 Elisabete Ranchhod categorial perca agora muita da sua pertinência. Se um sistema de análise lexical contemplar a existência de compostos e der prioridade à identificação destas unidades lexicais, andar modelo e passo a passo serão analisadas globalmente como, respectivamente, um nome e um advérbio compostos e receberão apenas essas etiquetas. Num sistema que não tenha em conta a existência de compostos, seja qual for a situação linguística em que se encontrem, serão analisadas individualmente como palavras simples e terão, pelo menos, dois valores (duas etiquetas) cada uma: nome e verbo 6. Os métodos de análise lexical actualmente em desenvolvimento 7 utilizam como dados linguísticos (Laporte, 1997: 49): - «um dicionário e gramáticas de resolução de ambiguidades (Koskenniemi, 1993; Silberztein, 1993; Oflazer, 1996), - um corpus de textos etiquetado (Church, 1988; Dermatas & Kokkinakis, 1995), eventualmente acompanhado de informações linguísticas tais como esquemas de regras estabelecidos à mão (Brill, 1995), - um corpus não etiquetado mas acompanhado de informações linguísticas, por exemplo um jogo de etiquetas lexicais e um conjunto de relações etiqueta-sufixo (Levinger et al., 1995), - um corpus não etiquetado (MacMahon & Smith, 1996); neste caso, o jogo de etiquetas é construído automaticamente mediante cálculos estatísticos e o seu conteúdo é mais ou menos imprevisível». No sistema concebido por Silberztein o sistema INTEX 8, que utiliza dados linguísticos especificamente elaborados por especialistas em processamento de linguagem natural, os textos, os dicionários e as gramáticas são representados (Silberztein, 1997) por transdutores de estados finitos (FST «Finite State Transducer»), que têm a forma de grafos. Esta característica do sistema permite o desenvolvimento, e a aplicação ao processamento de grandes corpora, de dicionários e de gramáticas de ampla cobertura. Em operações de análise automática de texto, os dicionários e gramáticas são aplicados em combinação, a fim de, entre outras coisas: (i) indexar o texto de vários modos possíveis; (ii) reconhecer unidades lexicais, simples e compostas; (iii) identificar estruturas sintácticas ou léxicosintácticas; (iv) resolver ambiguidades; (v) etiquetar palavras ou expressões; (vi) solicitar concordâncias parametrizáveis de estruturas linguísticas variadas; (vii) obter dados 6 O conteúdo das etiquetas varia de sistema para sistema. Se a informação associada às palavras for apenas de natureza categorial, terão duas etiquetas cada uma; mas quanto mais completo for o seu conteúdo, maior é o número de etiquetas. A forma verbal andar, por exemplo, terá cinco etiquetas se, além da categoria, forem tidas em conta as informações relativas a tempo, modo, pessoa e número (neste caso: infinitivo impessoal, primeira e terceira pessoas do singular do infinitivo pessoal e do futuro do conjuntivo). 7 Para uma síntese sobre o desenvolvimento dos vários sistemas de análise lexical, sua avaliação e principais aplicações a que se destinam, ver Laporte, 1997 e neste volume. 8 No endereço: é feita uma apresentação geral do sistema, bem como uma demonstração de algumas das suas potencialidades. 8

9 estatísticos sobre o texto. O sistema permite ainda uma manutenção fácil (automática e semi-automática) dos dicionários e gramáticas. Uma das vantagens do INTEX é o facto de ter sido concebido de modo a integrar de modo fácil dados linguísticos de qualquer língua. Os métodos de análise e de formalização adoptados os definidos no âmbito da rede de laboratórios RELEX 9, fazem com que eles sejam completamente reprodutíveis e que, portanto, possam ser usados, criados, aumentados e melhorados por qualquer equipa ou mesmo por qualquer investigador (e não apenas por talentosos investigadores individuais). Os dicionários e gramáticas elaborados para o português pela equipa do LabEL 10 (Eleutério et al., 1995; Ranchhod, 1999a; Ranchhod, Mota e Baptista, 1999b; Ranchhod e Mota, 1999c) foram, após uma simples conversão de formatos, implementados no INTEX (no qual estão igualmente integrados dados linguísticos de diversas línguas, nomeadamente: alemão, espanhol, francês, inglês e italiano). Tomaremos os dados do português como exemplo e, numa breve síntese, veremos quais as suas principais características. 3. Dicionários electrónicos do português O conjunto dos recursos linguísticos do português está organizado do seguinte modo: - um dicionário geral de palavras simples, correspondendo estas a qualquer sequência de caracteres alfabéticos delimitada por espaços ou qualquer outro separador, que é o elemento central do sistema de dicionários. Contém cerca de lemas, cujos atributos gramaticais são sistematicamente descritos e codificados. As formas flexionadas desses lemas (aproximadamente ) são automaticamente geradas a partir dos códigos associados a cada um deles; - dicionários de palavras compostas, sendo estas formadas por sequências de palavras simples e de separadores. De momento, o léxico das palavras compostas é fundamentalmente constituído por cerca de nomes e 3000 advérbios. Esta cobertura representa já um conjunto de dados importante, mas está longe de ser satisfatória. - Uma biblioteca de gramáticas locais, representadas por transdutores de estados finitos (FST), que descrevem vários tipos de objectos linguísticos: expressões numéricas, expressões com fortes restrições e dependências lexicais, expressões em que há 9 Para obter informações pormenorizadas, ver: 10 O Laboratório de Engenharia da Linguagem (LabEL) está integrado no Centro de Automática da Universidade Técnica de Lisboa (CAUTL-IST). No LabEL, têm vindo a ser elaborados dados linguísticos formais, que são utilizados pelos sistemas DIGRAMA e INTEX. O primeiro, implementado em UNIX, está a ser desenvolvido, no LabEL, por S. Martins Eleutério; o segundo, implementado em Windows NT - 95/98 e em OpenStep, tem sido desenvolvido por M. Silberztein no LADL (Laboratoire d Automatique Documentaire et Linguistique). A versão Windows NT - 95/98 do INTEX encontra-se disponível em CD- ROM. 9

10 Elisabete Ranchhod recursividade sintáctica, etc. Conforme o tipo de fenómeno que representam, são usadas em fases diferentes do processamento de texto: normalização do texto, reconhecimento de padrões linguísticos, resolução de ambiguidades, análise sintáctica, etc. - Um conjunto de matrizes binárias, convertíveis em FST, onde está descrito um fragmento importante do léxico-gramática do português: cerca de 3000 construções verbais, mais de 4000 construções com nomes predicativos e aproximadamente 3000 advérbios. Além destes dados, estão a ser elaborados léxicos mais específicos, nomeadamente dicionários terminológicos (Ranchhod e Mota, 1999c), dicionários de siglas (Moura, 2000), dicionários de cargos e funções, dicionários de topónimos, etc. No âmbito deste capítulo, concentrar-nos-emos fundamentalmente nos dicionários gerais de palavras simples (3.1.), compostas (3.2.) e nos FST lexicais (3.3.). Em 4., falaremos do seu modo de utilização, apresentando resultados ilustrativos. De seguida, daremos, em 5., exemplos variados de operações características da análise lexical automática de texto Representação das palavras simples. Os dicionários DELAS e DELAF Os dicionários de palavras simples correspondem à forma mais elementar de dicionário: uma lista de palavras e, associadas a cada uma delas, informações sobre a sua categoria gramatical e sobre o modelo de flexão que se lhes aplica. Conforme a sua categoria, as informações dirão respeito à variação em género, número, caso (só para os pronomes pessoais), tempo, modo e pessoa, às adjunções de sufixos diminutivos, aumentativos e superlativos e de pronomes clíticos. Trata-se, por agora, de dicionários fundamentalmente morfológicos, mas a que se vão progressivamente acrescentando informações de natureza sintáctica e semântica. As entradas destes dicionários correspondem ao que em qualquer dicionário se entende por tal: uma forma canónica (lema), representante, no caso de a palavra ser flexionável, de todas as formas flexionadas que permitir. Os verbos são representados pelo infinitivo; os nomes e adjectivos pelo masculino singular (quando aplicável), pelo feminino singular quando só têm esse género, etc. As categorias invariáveis (a maioria dos advérbios, preposições, conjunções e certos determinantes) são, evidentemente, representadas pela sua única forma. Em alguns raros casos, as formas canónicas são formas plurais (alvíssaras, andrajos, calendas, pêsames, etc.), que não variam em género. Apesar de serem invariáveis, o plural tem de ser explicitamente marcado, a fim de permitir, a nível sintáctico, a sua concordância com os determinantes, os adjectivos e as formas plurais dos verbos de que possam ser sujeito. Assim, a estrutura das entradas simples é, exemplificando, a seguinte: banal,a111s1 10

11 beber,v201t bem,adv1 bota,n301d1 botão,n208d2 A vírgula separa o lema do seu código de flexão. A primeira informação sobre a palavra é a indicação da categoria gramatical a que pertence. Nos exemplos: adjectivo (A), verbo (V) advérbio (ADV) e nome (N). O código numérico indica o modelo de flexão da categoria em causa. Beber, por exemplo, é um verbo da segunda conjugação (2), que tem uma conjugação regular (regra 01). Os códigos S e D seguidos de um código numérico adicional permitem gerar, respectivamente, o(s) superlativo(s) e o(s) diminutivo(s) adequado(s). As entradas verbais são ainda marcadas quanto à possibilidade de se construirem ou não com clíticos (t). Como se sabe, alguns clíticos alteram certas formas verbais, podendo eles próprios sofrer alterações de forma. Portanto, se bem que a questão da transitividade ou intransitividade de um verbo só possa ser adequadamente tratada a nível sintáctico, dadas as alterações formais provocadas pela adjunção de clíticos à direita dos verbos (*bebemos-o > bebemo-lo) e da combinação dos clíticos entre si (*disseramnos-o > disseram-no-lo), tornou-se necessário tratar o assunto logo ao nível morfológico. Cada código representa uma regra de flexão, que é formalizada num transdutor de estados finitos. Os FST flexionais associam conjuntos de sufixos às informações de flexão das entradas lexicais do dicionário de lemas (DELAS) e geram as correspondentes formas flexionadas. Por exemplo, a flexão representada pelo código A111S1 (adjectivo banal, por exemplo) é descrita pelo transdutor A111S1 da Fig. 1. Fig. 1: FST de flexão Este FST contém dois sub-transdutores: A111, que descreve e gera a flexão em género e número e S1, que gera as formas superlativas. Todos os adjectivos que no dicionário de lemas estejam codificados como A111S1 são flexionados por aplicação deste transdutor. Adjectivos igualmente terminados em -al mas que não admitam o superlativo (decimal ou editorial) estão codificados como A111 e as sua flexão é gerada apenas pelo transdutor A

12 Elisabete Ranchhod As formas flexionadas de todas as entradas simples constituem o módulo DELAF, gerado automaticamente a partir do DELAS. A flexão das entradas dadas atrás como exemplo corresponde à seguinte listagem, ordenada alfabeticamente: DELAF (amostragem) banais,banal.a:mfp banal,banal.a:mfs banalíssima,banal.a:sfs banalíssimas,banal.a:sfp banalíssimo,banal.a:sms banalíssimos,banal.a:smp beba,beber.v:s1s:s4s:s3s:y4s bebais,beber.v:s2p:y2p bebam,beber.v:s4p:s3p:y4p bebamo,beber.v:y1p bebamos,beber.v:s1p:y1p bebas,beber.v:s2s:y2s bebe,beber.v:p2s:p4s:p3s:y2s bebei,beber.v:p2p:y2p bebeis,beber.v:p2p bebem,beber.v:p4p:p3p bebemo,beber.v:p1p:j1p bebemos,beber.v:p1p:j1p bebendo,beber.v:g beber,beber.v:r:u1s:u4s:u3s:w:v1s:v4s:v3s bebera,beber.v:m1s:m2s:m4s:m3s beberam,beber.v:j4p:j3p:m4p:m3p beberas,beber.v:m2s beberá,beber.v:f4s:f3s beberás,beber.v:f2s beberão,beber.v:f4p:f3p beberde,beber.v:v2p beberdes,beber.v:u2p:v2p bebere,beber.v:v2s beberei,beber.v:f1s bebereis,beber.v:f2p beberem,beber.v:u4p:u3p:v4p:v3p beberemos,beber.v:f1p beberes,beber.v:u2s:v2s beberia,beber.v:c1s:c4s:c3s beberiam,beber.v:c4p:c3p beberias,beber.v:c2s beberíamos,beber.v:c1p beberíeis,beber.v:c2p bebermo,beber.v:v1p bebermos,beber.v:u1p:v1p bebes,beber.v:p2s bebesse,beber.v:t1s:t4s:t3s bebessem,beber.v:t4p:t3p bebesses,beber.v:t2s bebeste,beber.v:j2s:j2p bebestes,beber.v:j2p bebeu,beber.v:j4s:j3s bebê,beber.v:r:w:v1s:v2s:v4s:v3s bebêramo,beber.v:m1p bebêramos,beber.v:m1p bebêrei,beber.v:m2p bebêreis,beber.v:m2p bebêsseis,beber.v:t2p bebêssemos,beber.v:t1p bebi,beber.v:j1s bebia,beber.v:i1s:i2s:i4s:i3s bebiam,beber.v:i4p:i3p bebias,beber.v:i2s bebido,beber.v:k bebíamo,beber.v:i1p bebíamos,beber.v:i1p bebíei,beber.v:i2p bebíeis,beber.v:i2p bebo,beber.v:p1s bem,bem.adv bota,bota.n:fs botas,bota.n:fp botão,botão.n:ms botãozinho,botão.n:dms botãozito,botão.n:dms botinha,bota.n:dfs botinhas,bota.n:dfp botita,bota.n:dfs botitas,bota.n:dfp botões,botão.n:mp botõezinhos,botão.n:dmp botõezitos,botão.n:dmp 12

13 As entradas do DELAF são, como se vê pela amostragem, formas flexionadas que aparecem associadas ao seu lema, por exemplo: banais,banal., especificando-se a seguir qual a sua categoria gramatical e a flexão que corresponde a essa forma (A:mfp, adjectivo uniforme para masculino e feminino, p para plural). De igual modo, é indicado que banalíssima corresponde ao superlativo de banal no feminino singular (Sfs). Em relação aos verbos, existem, sobretudo se forem regulares, várias formas homógrafas. Por exemplo, bebemos é potencialmente a primeira pessoa do plural do presente do indicativo (P1p) e do pretérito perfeito simples (J1p) de beber. As formas alteradas pela eventual adjunção de clíticos à direita dos verbos são igualmente geradas. É o caso de bebemo,beber.v:p1p:j1p, equivalente à anterior. A validação destas formas e dos clíticos possíveis é feita através de gramáticas (autómatos) especificamente elaboradas (para uma solução parcial, ver adiante ), que são aplicadas em combinação com os dicionários aquando da análise de texto. Observação: De acordo com a definição de palavra simples adoptada, estritamente formal, são entradas do dicionário geral de palavras simples unidades lexicais que, de um ponto de vista linguístico, não podem ser assim classificadas. Trata-se naturalmente das contracções. Formas como daqui, dele, dum, lho são constituídas por duas palavras pertencentes ou não a duas categorias distintas, mas que se apresentam ortograficamente como se fossem palavras simples. Por essa razão, elas têm de receber tratamento específico. No DELAF, a estrutura deste tipo de entrada é, exemplificando, a seguinte: daqui,daqui.prepxadv dele,dele.prepxpro+pes:o3ms dum,dum.prepxdet+art+ind:ms lho,mo.proxpro+pesxpes:d34mfspxa34ms Como é evidente, com as contracções, a noção de lema é uma aproximação grosseira. As categorias a que pertencem os constituintes das formas contraídas estão delimitados por «X»: daqui é constituída por uma preposição e por um advérbio (PREPXADV), ambos categorias invariáveis. Quando as palavras de base flexionam, a informação sobre a respectiva flexão vem imediatamente à direita de cada elemento, especificada por «:». Dele, por exemplo, corresponde à contracção da preposição de e da terceira pessoa, masculino singular, do pronome pessoal oblíquo ele (Pes:O3ms). Algumas contracções são ambíguas, como lho, uma vez que cada um dos pronomes, respectivamente dativo e acusativo, pode ter à partida mais do que um referente. A ambiguidade de lho só pode ser resolvida ao nível de uma análise sintáctica já muito fina, mas outros casos de ambiguidade são de mais fácil resolução (ver ). Dada a interdependência dos vários módulos do sistema de dicionários, figuram ainda no dicionário geral palavras que não têm existência autónoma na língua, mas que entram na formação de palavras compostas. São fundamentalmente de dois tipos: 13

14 Elisabete Ranchhod (i) (ii) Palavras do português: acerca, apesar, contragosto, riquismo, etc., que só podem constituir unidades lexicais e ser integradas numa categoria gramatical quando combinadas com outras: acerca de (preposição), apesar de (preposição e conjunção), a contragosto (advérbio), novo-riquismo (nome); Palavras vindas de outras línguas que também só têm valor em português como elementos de compostos: aequo (ex aequo), check (check-up) quanti (tutti-quanti), etc Representação das palavras compostas. Os dicionários DELAC e DELACF As palavras compostas constituem uma percentagem muito elevada do léxico de qualquer língua 11. São frequentes em todos os textos, mas são particularmente abundantes nos de natureza técnica e científica. Em processamento de linguagem natural, torna-se cada vez mais evidente a necessidade de tratar estas unidades lexicais, por todo o tipo de razões (algumas já invocadas em 2.), a não menos importante das quais é o facto de grande parte do sentido de um texto estar ancorado nos nomes que contém, sobretudo, nos nomes compostos (cf. 5.1.). Como se referiu, as entradas do dicionário de compostos (DELAC) são unidades lexicais formadas por uma sequência de palavras simples e de separadores (espaço, hífen e apóstrofo, no caso do português). Embora todas elas apresentem restrições (morfológicas, combinatórias, etc.) quanto às propriedades que era suposto possuirem, há que distinguir, em primeiro lugar, as que são completamente invariáveis das que o não são. As preposições e conjunções compostas (junto de, para com, já que, à medida que, etc.) são invariáveis. A maioria dos advérbios também o são: à flor da pele, a olhos vistos, de mão beijada, sem papas na língua, etc., são exemplos representativos de advérbios compostos, que apresentam um grau de fixidez extremo, não sendo possível flexionar, omitir ou comutar quaisquer dos seus elementos constituintes (Ranchhod, 1991). Há contudo alguns advérbios, como: por Poss i conta e risco: É um homem que toma decisões por sua conta e risco em que um dos constituintes, neste caso, o possessivo (Poss i ), varia em função de um grupo nominal livre, em geral o sujeito da frase principal, de que é co-referente. A representação deste tipo de dados levanta algumas dificuldades. Uma vez que a parte variável do advérbio pertence a um paradigma fechado, a mais simples consiste na 11 Para ter uma ideia, basta verificar que os advérbios simples do português (incluindo os terminados em - mente) registados na generalidade dos dicionários são da ordem dos elementos, e os advérbios compostos, até agora formalizados nos dicionários do LabEL, rondam já os 3.000, número que, por comparação com o que se passa em relação a outras línguas (7.000, para o francês, M. Gross, 1990), deverá aumentar significativamente. 14

15 reduplicação de entradas de dicionário. Esta solução é fiável, do ponto de vista do reconhecimento lexical das expressões, mas tem o inconveniente de não tornar possível, mais tarde, estabelecer as redes de co-referência existentes. Outra, que não reduplica as entradas, mas não permite resolver a questão da co-referência, é a da sua descrição através de gramáticas locais, representando o conjunto das formas possíveis. A solução adoptada e que, por agora, se afigura mais adequada é a formalização destes advérbios em tabelas de expressões semi-fixas, em que, entre outras informações, figura explicitamente a indicação de que existem redes de co-referência obrigatórias entre eles e um constituinte da oração principal. Essas tabelas são utilizadas por autómatos para análise sintáctica de texto. Quanto aos nomes e adjectivos, eles são, em princípio, categorias que podem flexionar. E, se existem inúmeros casos de total invariabilidade morfológica, como acontece com os nomes compostos: ar livre, comum dos mortais, guerra fria etc., a maioria não apresenta restrições tão rígidas. Por isso, para os identificar de forma fundamentada, é necessário utilizar critérios linguísticos (Ranchhod, 1990; Baptista, 1995), que vão desde a análise do seu comportamento morfológico, até à verificação da sua, total ou parcial, perda de composicionalidade, lexical, sintáctica e semântica. Esses critérios são igualmente necessários para distinguir os nomes compostos de grupos nominais livres, formalmente idênticos. De facto, se bem que a ambiguidade dos compostos seja menor do que a das palavras simples, há combinações de palavras que tanto podem constituir um composto como corresponder a uma construção livre. É o caso, entre outros, de: bola de neve, carta aberta, capacete azul, ponto alto, que, de acordo com as características da construção em que estejam inseridos, tanto podem ser nomes compostos como grupos nominais livres. Se, por exemplo, capacte azul estiver na posição sintáctica de sujeito de um verbo como recear: (1) Os capacetes azuis receiam não conseguir controlar a situação, posição que, em situação discursiva normal, só pode ser preenchida por um nome humano, a análise como grupo nominal livre é totalmente desadequada. Se, pelo contrário, esta mesma combinação de palavras for argumento de outro tipo de predicado: (2) Todos os visitantes tiveram de usar capacetes azuis, capacetes azuis, agora na posição de complemento directo de usar, já não é uma unidade lexical, mas um grupo nominal em que um dado nome é livremente modificado por um adjectivo. Consequentemente, em (1), o adjectivo azul não pode ser omitido: *Os capacetes receiam não conseguir controlar a situação, nem nenhum dos elementos do composto pode comutar com outro da mesma categoria: *Os bonés azuis receiam não conseguir controlar a situação, *Os capacetes amarelos receiam não conseguir controlar a situação. 15

16 Elisabete Ranchhod Em (2), estas restrições não se observam: Todos os visitantes tiveram de usar capacetes, Todos os visitantes tiveram de usar bonés azuis, Todos os visitantes tiveram de usar capacetes amarelos. A adjunção de informações semânticas às entradas de dicionário (por exemplo, a marcação do nome composto capacete azul com o traço +Hum (humano) ajuda a distinguir o composto do grupo nominal livre homógrafo, mas a resolução satisfatória deste tipo de ambiguidade passa pela elaboração de gramáticas que têm de ter em conta informações de natureza sintáctica. Ao nível do léxico, os compostos ambíguos são formalizados e representados como os restantes compostos (se bem que, como veremos adiante, em 4., sejam utilizados de modo diferente aquando da análise de texto). A estrutura das entradas dos dicionários de compostos é fundamentalmente idêntica à das palavras simples. Para ilustração sucinta, escolheu-se uma amostragem, constituída pelos exemplos até agora utilizados. As entradas do DELAC têm o seguinte formato 12 : DELAC (categorias invariáveis) a olhos vistos,adv+pca à flor da pele,adv+pcdc à medida que,conj de mão beijada,adv+pca já que,conj junto de,prep para com,prep sem papas na língua,adv+pcpc DELAC (nomes) ar livre,n+na:ms - - bola (301) de neve,n+ndn:fs - + capacete (200) azul (111),N+NA+Hum:mfs + + carta (301) aberta (001), N+NA:fs - + comum dos mortais, N+NDN:ms - - guerra fria, N+NA:fs - - ponto (200) alto (001),N+NA:ms - + A formalização dos advérbios, preposições e conjunções é bastante simples. Uma vez que se trata de categorias invariáveis, não têm códigos de flexão associados. Para além da sua categoria gramatical (ADV, PREP, CONJ), podem contudo ter, sobretudo as conjunções e advérbios, informações relativas a sub-classe e, adicionalmente, outros códigos que remetam para tabelas com informação sintáctica. É o caso dos advérbios: 12 Por razões de clareza, apresentam-se em listas separadas os nomes (categoria que pode flexionar) e as categorias invariáveis. 16

17 como acima se referiu, os que estão dicionarizados foram também objecto de estudo sintáctico. Na respectiva amostragem, os códigos PCA, PCDC e PCPC remetem para as classes léxico-sintácticas em que estão integrados. A formalização das entradas dos nomes compostos é um pouco mais complexa. Logo a seguir à informação categorial (N), é indicada a sua estrutura interna: NA (nome + adjectivo), NDN (nome + de + nome), etc., frequentemente relacionada com o comportamento morfológico do composto: por exemplo, os nomes compostos da classe NA (a mais numerosa) permitem, na maioria dos casos, a pluralização de ambos os elementos e, eventualmente, a sua flexão em género (caso de: prim(o,a,os,as) direit(o,a,os,as)); a maior parte dos NDN só permitem a pluralização do primeiro nome. Mas, para além da variação morfológica interna, há igualmente que explicitar a flexão global da entrada (género e número) 13 ; ms, por exemplo, significa que, na sua forma de base, o nome composto se comporta, na globalidade, como um nome masculino singular (na amostragem: ar livre, comum dos mortais e ponto alto). Ainda quanto à flexão interna dos nomes compostos, uma vez que as restrições são de vários tipos e de natureza eminentemente lexical, são indicados, a seguir aos constituintes que flexionam, os códigos flexionais que têm no dicionário de palavras simples. As restrições a essa flexão: possibilidade ou impossibilidade de o composto variar em género e número é indicada pelos sinais «+» e «-», respectivamente. Assim, ar livre é invariável (logo, os seus constituintes não têm código de flexão), mas carta aberta pode pluralizar. O plural de carta corresponde ao código 301 dos nomes femininos e o de aberta ao 001 dos adjectivos, com a restrição de o adjectivo não poder flexionar em género. As formas flexionadas dos nomes compostos são automaticamente geradas a partir destas informações codificadas: DELACF (nomes) ar livre,ar livre.n+na:ms bola de neve,bola de neve.n+ndn:fs bolas de neve,bola de neve.n+ndn:fp capacete azul,capacete azul.n+na+hum:mfs capacetes azuis,capacete azul.n+na+hum:mfp carta aberta,carta aberta.n+na:fs cartas abertas,carta aberta.n+na:fp comum dos mortais,comum dos mortais.n+ndn:ms guerra fria,guerra fria.n+na:fs ponto alto,ponto alto.n+na:ms pontos altos,ponto alto.n+na:mp 13 A ideia generalizada de que o género e o número de um nome composto são idênticos ao do primeiro elemento constituinte nem sempre se verifica. Pele-vermelha, por exemplo, é iniciado por um nome exclusivamente feminino, mas o composto tanto pode ser feminino como masculino: um pele-vermelha, uma pele-vermelha. Acontece o mesmo com capacete azul, que, como nome composto humano, é passível de ser precedido por determinantes masculinos e femininos. 17

18 Elisabete Ranchhod Os nomes compostos flexionados constituem, juntamente com as categorias invariáveis, o DELACF FST lexicais Até agora temos implicitamente considerado que o conjunto de palavras simples de uma língua é finito e que a função de um dicionário como o DELAS é a de alistar e descrever todos os seus elementos de forma adequada. Há, contudo, vários objectos linguísticos que, sendo formados por sequências de letras (i.e. correspondendo à noção formal de palavra simples), não seria fácil nem natural enumerar em extensão e tratar num dicionário de lemas. Estão, por exemplo, nesta situação os números romanos: II, III, IV, XII, XXI, MCM,... Para os descrever, são utilizados transdutores de estados finitos lexicais, como o que está representado na Fig. 2. Fig. 2: FST NRom O transdutor NRom 14, em que os nós sombreados correspondem a FST encaixados, identifica todos os números romanos, inclui-os na sua classe gramatical (DET), com a indicação de que se trata de um romano (NR) correspondente a um dado algarismo: II,II.DET+NR+VAL=2 III,III.DET+NR+VAL=3 IV,IV.DET+NR+VAL=4 MCM,MCM.DET+NR+VAL=1900 XII,XII.DET+NR+VAL=12 XXI,XXI.DET+NR+VAL=21 Os FST lexicais são ainda utilizados para descrever as variantes ortográficas de uma palavra (por exemplo, a alternância ou/oi em palavras como louça/loiça, touro/toiro) ou para agrupar as famílias lexicais resultantes de processos derivacionais (nação, nacional, nacionalidade, nacionalismo, nacionalista, nacionalizar, desnacionalizar, nacionalizável, renacionalizar, nacionalização, desnacionalização, renacionalização, nacionalizador, desnacionalizador,...). O que se passa em relação às palavras simples também se verifica com as palavras compostas. Há dados linguísticos que, de um ponto de vista formal, correspondem a compostos, mas que não faria sentido alistar num dicionário. Um exemplo claro é o dos 14 Os transdutores para os números romanos e para os cardinais e ordinais compostos (ver a seguir) foram concebidos e construídos por Cristina Mota. 18

19 determinantes numerais (cardinais e ordinais) como: vinte e um, duzentos e trinta e sete, nove mil quatrocentos e cinquenta e oito; vigésimo primeiro, ducentésimo trigésimo sétimo,... O transdutor DnumC, que contém vários transdutores encaixados, que, por sua vez, contêm outros (ver Fig. 3), descreve e gera o dicionário das expressões numéricas entre vinte e um e novecentos e noventa e nove mil novecentos e noventa e nove, incluindo as formas femininas (vinte e dois livros, vinte e duas cadeiras, mil e duzentos livros, mil e duzentas cadeiras,...). Fig. 3: FST DNumC Tal como o anterior, integra as expressões numéricas na sua categoria gramatical (determinante numeral: DET+Num) e associa a cada uma delas o seu valor em algarismos, como se vê nos exemplos (utilizados acima): duzentas e trinta e sete,duzentas e trinta e sete.det+num+val=237:cfp duzentos e trinta e sete,duzentos e trinta e sete.det+num+val=237:cmp mil e duzentas,mil e duzentas.det+num+val=1200:cfp mil e duzentos,mil e duzentos.det+num+val=1200:cmp nove mil quatrocentas e cinquenta e oito,nove mil quatrocentas e cinquenta e oito.det+num+val=9458:cfp nove mil quatrocentos e cinquenta e oito,nove mil quatrocentos e cinquenta e oito.det+num+val=9458:cmp novecentas e noventa e nove mil novecentas e noventa e nove,novecentas e noventa e nove mil novecentas e noventa e nove.det+num+val=999999:cfp novecentos e noventa e nove mil novecentos e noventa e nove,novecentos e noventa e nove mil novecentos e noventa e nove.det+num+val=999999:cmp vinte e dois,vinte e dois.det+num+val=22:cfp vinte e duas,vinte e duas.det+num+val=22:cfp vinte e um,vinte e um.det+num+val=21:cmp vinte e uma,vinte e uma.det+num+val=21:cmp Os ordinais são descritos por FST lexicais do mesmo tipo. 19

20 Elisabete Ranchhod 4. Aplicação dos dicionários e FST lexicais à análise lexical de texto Os recursos linguísticos formalizados e representados nos dicionários e transdutores de estados finitos lexicais são utilizados pelo INTEX em várias operações de análise automática de texto. Como já o dissemos antes, neste capítulo, será apenas abordado o caso da análise lexical. Uma vez que os textos são constituídos por formas flexionadas, os dicionários aplicados aos textos têm de estar no formato DELAF, para identificação das palavras simples flexionadas, ou DELACF, para reconhecimento das palavras compostas flexionadas. Mas, antes da aplicação destes recursos lexicais, o texto pode ser préprocessado ou normalizado. Vejamos sucintamente do que se trata Pré-processamento de texto Um texto é um ficheiro em formato ASCII, que não contém qualquer informação linguística. Depois de aberto, é automaticamente feita uma primeira indexação, sendo também simultaneamente efectuada a determinação da frequência das palavras simples (sequências de caracteres contidos num alfabeto) e de todos os caracteres não contidos no alfabeto da língua em que o texto está escrito. A unidade textual corresponde ao parágrafo. Estes textos podem ser pré-processados, isto é, podem ser preparados para as análises linguísticas que venham a ser realizadas posteriormente. Os resultados do préprocessamento ou de qualquer outra operação são sempre escritos em ficheiros auxiliares, mantendo-se o texto inicial intacto. O pré-processamento (ou normalização) consiste fundamentalmente em: (i) segmentar os parágrafos em frases; (ii) identificar e etiquetar os compostos não ambíguos; (iii) decompor as contracções, reconstituindo e etiquetando os elementos por que são formadas; (iv) reconhecer e etiquetar pronomes clíticos em posição pós-verbal. Estas operações são opcionais e podem ser realizadas de forma independente Segmentação de frases A delimitação das frases do texto é feita por aplicação de uma gramática específica, representada por um FST, que insere o símbolo {S} entre frases consecutivas. Por exemplo, os caminhos do grafo Sentence do português, representados na Fig. 4, 20

1 Introdução. 1.1 Apresentação do tema

1 Introdução. 1.1 Apresentação do tema 1 Introdução 1.1 Apresentação do tema Segundo Basílio (1987), as principais funções do léxico são a representação conceitual e o fornecimento de unidades básicas para a construção dos enunciados. Para

Leia mais

Vantagens da integração de dicionários de palavras compostas em sistemas de PLN

Vantagens da integração de dicionários de palavras compostas em sistemas de PLN AVALON 2003 Encontro de Avaliação Conjunta de Sistemas de Processamento Computacional do Português Faro, 28 de Junho de 2003 Vantagens da integração de dicionários de palavras compostas em sistemas de

Leia mais

Arquitecturas de Software Licenciatura em Engenharia Informática e de Computadores

Arquitecturas de Software Licenciatura em Engenharia Informática e de Computadores UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR TÉCNICO Arquitecturas de Software Licenciatura em Engenharia Informática e de Computadores Primeiro Teste 21 de Outubro de 2006, 9:00H 10:30H Nome: Número:

Leia mais

Modelo Cascata ou Clássico

Modelo Cascata ou Clássico Modelo Cascata ou Clássico INTRODUÇÃO O modelo clássico ou cascata, que também é conhecido por abordagem top-down, foi proposto por Royce em 1970. Até meados da década de 1980 foi o único modelo com aceitação

Leia mais

DEMONSTRAÇÕES FINANCEIRAS COMBINADAS

DEMONSTRAÇÕES FINANCEIRAS COMBINADAS 24 DEMONSTRAÇÕES FINANCEIRAS COMBINADAS Os mercados de capitais na Europa e no mundo exigem informações financeiras significativas, confiáveis, relevantes e comparáveis sobre os emitentes de valores mobiliários.

Leia mais

1. NÍVEL CONVENCIONAL DE MÁQUINA

1. NÍVEL CONVENCIONAL DE MÁQUINA 1. NÍVEL CONVENCIONAL DE MÁQUINA Relembrando a nossa matéria de Arquitetura de Computadores, a arquitetura de Computadores se divide em vários níveis como já estudamos anteriormente. Ou seja: o Nível 0

Leia mais

O Acordo de Haia Relativo ao Registro. Internacional de Desenhos Industriais: Principais características e vantagens

O Acordo de Haia Relativo ao Registro. Internacional de Desenhos Industriais: Principais características e vantagens O Acordo de Haia Relativo ao Registro Internacional de Desenhos Industriais: Principais características e vantagens Publicação OMPI N 911(P) ISBN 92-805-1317-X 2 Índice Página Introdução 4 Quem pode usufruir

Leia mais

Engenharia de Software III

Engenharia de Software III Engenharia de Software III Casos de uso http://dl.dropbox.com/u/3025380/es3/aula6.pdf (flavio.ceci@unisul.br) 09/09/2010 O que são casos de uso? Um caso de uso procura documentar as ações necessárias,

Leia mais

Biblioteca Escolar. O Dicionário

Biblioteca Escolar. O Dicionário O Dicionário O que é um dicionário? Livro de referência onde se encontram palavras e expressões de uma língua, por ordem alfabética, com a respetiva significação ou tradução para outra língua e ainda,

Leia mais

APROG - Civil. Excel. Técnicas de pesquisa de informação em tabelas. Instituto Superior de Engenharia do Porto 2000-2007

APROG - Civil. Excel. Técnicas de pesquisa de informação em tabelas. Instituto Superior de Engenharia do Porto 2000-2007 APROG - Civil Excel Técnicas de pesquisa de informação em tabelas Instituto Superior de Engenharia do Porto 2000-2007 Elaborado por: António Silva (DEI-ISEP) Pesquisa de Informação em Tabelas O Excel

Leia mais

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES 3.1 - IDENTIFICADORES Os objetos que usamos no nosso algoritmo são uma representação simbólica de um valor de dado. Assim, quando executamos a seguinte instrução:

Leia mais

Plataforma de Benefícios Públicos Acesso externo

Plataforma de Benefícios Públicos Acesso externo Índice 1. Acesso à Plataforma... 2 2. Consulta dos Programas de Beneficios Públicos em Curso... 3 3. Entrar na Plataforma... 4 4. Consultar/Entregar Documentos... 5 5. Consultar... 7 6. Entregar Comprovativos

Leia mais

CAP. I ERROS EM CÁLCULO NUMÉRICO

CAP. I ERROS EM CÁLCULO NUMÉRICO CAP. I ERROS EM CÁLCULO NUMÉRICO 0. Introdução Por método numérico entende-se um método para calcular a solução de um problema realizando apenas uma sequência finita de operações aritméticas. A obtenção

Leia mais

Utilização do SOLVER do EXCEL

Utilização do SOLVER do EXCEL Utilização do SOLVER do EXCEL 1 Utilização do SOLVER do EXCEL José Fernando Oliveira DEEC FACULDADE DE ENGENHARIA DA UNIVERSIDADE DO PORTO MAIO 1998 Para ilustrar a utilização do Solver na resolução de

Leia mais

2 Diagrama de Caso de Uso

2 Diagrama de Caso de Uso Unified Modeling Language (UML) Universidade Federal do Maranhão UFMA Pós Graduação de Engenharia de Eletricidade Grupo de Computação Assunto: Diagrama de Caso de Uso (Use Case) Autoria:Aristófanes Corrêa

Leia mais

Índice. Como aceder ao serviço de Certificação PME? Como efectuar uma operação de renovação da certificação?

Índice. Como aceder ao serviço de Certificação PME? Como efectuar uma operação de renovação da certificação? Índice Como aceder ao serviço de Certificação PME? Como efectuar uma operação de renovação da certificação? Como efectuar uma operação de confirmação de estimativas? Como aceder ao Serviço de Certificação

Leia mais

Avanços na transparência

Avanços na transparência Avanços na transparência A Capes está avançando não apenas na questão dos indicadores, como vimos nas semanas anteriores, mas também na transparência do sistema. Este assunto será explicado aqui, com ênfase

Leia mais

Tarefa Orientada 16 Vistas

Tarefa Orientada 16 Vistas Tarefa Orientada 16 Vistas Objectivos: Vistas só de leitura Vistas de manipulação de dados Uma vista consiste numa instrução de SELECT que é armazenada como um objecto na base de dados. Deste modo, um

Leia mais

Programa de Parcerias e Submissão de Propostas 2014/15

Programa de Parcerias e Submissão de Propostas 2014/15 DEPARTAMENTO DE INFORMÁTICA Programa de Parcerias e Submissão de Propostas 2014/15 O Departamento de Informática (DI) da Faculdade de Ciências da Universidade de Lisboa (FCUL) procura criar e estreitar

Leia mais

43. Jogo do bingo com figuras

43. Jogo do bingo com figuras 43. Jogo do bingo com figuras São confeccionadas cartelas com os desenhos de todas as figuras. Podem ser montadas 8 cartelas com seis figuras, se não houver repetição; é possível criar muito mais cartelas,

Leia mais

LINGUAGEM, LÍNGUA, LINGÜÍSTICA MARGARIDA PETTER

LINGUAGEM, LÍNGUA, LINGÜÍSTICA MARGARIDA PETTER LINGUAGEM, LÍNGUA, LINGÜÍSTICA MARGARIDA PETTER Duas explicações da Origem do mundo palavra (a linguagem verbal) associada ao poder mágico de criar. Atributo reservado a Deus. Através dela ele criou as

Leia mais

Procedimentos para a divulgação de eventos no site da ECUM

Procedimentos para a divulgação de eventos no site da ECUM Procedimentos para a divulgação de eventos no site da ECUM Pressupostos introdutórios 3 Descrição da tarefa 4 Autenticação/Login 4 Página de entrada 4 Criar um novo evento 5 Colocar um evento em destaque

Leia mais

SUMÁRIO 1. AULA 6 ENDEREÇAMENTO IP:... 2

SUMÁRIO 1. AULA 6 ENDEREÇAMENTO IP:... 2 SUMÁRIO 1. AULA 6 ENDEREÇAMENTO IP:... 2 1.1 Introdução... 2 1.2 Estrutura do IP... 3 1.3 Tipos de IP... 3 1.4 Classes de IP... 4 1.5 Máscara de Sub-Rede... 6 1.6 Atribuindo um IP ao computador... 7 2

Leia mais

Português- Prof. Verônica Ferreira

Português- Prof. Verônica Ferreira Português- Prof. Verônica Ferreira 1 Com relação a aspectos linguísticos e aos sentidos do texto acima, julgue os itens a seguir. No trecho que podemos chamar de silenciosa (l.15-16), o termo de silenciosa

Leia mais

Pesquisa e organização de informação

Pesquisa e organização de informação Pesquisa e organização de informação Capítulo 3 A capacidade e a variedade de dispositivos de armazenamento que qualquer computador atual possui, tornam a pesquisa de informação um desafio cada vez maior

Leia mais

Ajuda On-line - Sistema de Portaria. Versão 4.8.J

Ajuda On-line - Sistema de Portaria. Versão 4.8.J Versão 4.8.J Sumário PORT - Módulo de Apoio Portaria 3 1 Manual... de Processos - Portaria 4 Fluxo - Portaria... 5 2 Configurações... 6 Unidades... de Internação 6 Setores Administrativos... 9 Configuração...

Leia mais

ISO 9000:2000 Sistemas de Gestão da Qualidade Fundamentos e Vocabulário. As Normas da família ISO 9000. As Normas da família ISO 9000

ISO 9000:2000 Sistemas de Gestão da Qualidade Fundamentos e Vocabulário. As Normas da família ISO 9000. As Normas da família ISO 9000 ISO 9000:2000 Sistemas de Gestão da Qualidade Fundamentos e Vocabulário Gestão da Qualidade 2005 1 As Normas da família ISO 9000 ISO 9000 descreve os fundamentos de sistemas de gestão da qualidade e especifica

Leia mais

2. Representação Numérica

2. Representação Numérica 2. Representação Numérica 2.1 Introdução A fim se realizarmos de maneira prática qualquer operação com números, nós precisamos representa-los em uma determinada base numérica. O que isso significa? Vamos

Leia mais

MICROSOFT ACCESS MICROSOFT ACCESS. Professor Rafael Vieira Professor Rafael Vieira

MICROSOFT ACCESS MICROSOFT ACCESS. Professor Rafael Vieira Professor Rafael Vieira MICROSOFT ACCESS MICROSOFT ACCESS Professor Rafael Vieira Professor Rafael Vieira - Access - Programa de base de dados relacional funciona em Windows Elementos de uma Base de Dados: Tabelas Consultas Formulários

Leia mais

Informática II Cap. 3

Informática II Cap. 3 Cap. 3 1 Tradicionalmente, programar significava apenas a escrita de um programa, que resolvesse o problema pretendido de uma forma aparentemente correcta. Problema Problema Programa Programa Desvantagens:

Leia mais

Computadores e Sistemas de Informação. Bases de Dados Relacionais (linguagem SQL)

Computadores e Sistemas de Informação. Bases de Dados Relacionais (linguagem SQL) Computadores e Sistemas de Informação Bases de Dados Relacionais (linguagem SQL) 2004/2005 Utilidade das Bases de Dados Recolha e processamento de dados que possuem um volume significativo, que são interrelacionados,

Leia mais

Instituto Superior Politécnico de VISEU. Escola Superior de Tecnologia

Instituto Superior Politécnico de VISEU. Escola Superior de Tecnologia 1 Tradicionalmente, programar significava apenas a escrita de um programa, que resolvesse o problema pretendido de uma forma aparentemente correcta. Problema Problema Programa Programa Desvantagens: Programas

Leia mais

Múltiplos Estágios processo com três estágios Inquérito de Satisfação Fase II

Múltiplos Estágios processo com três estágios Inquérito de Satisfação Fase II O seguinte exercício contempla um processo com três estágios. Baseia-se no Inquérito de Satisfação Fase II, sendo, por isso, essencial compreender primeiro o problema antes de começar o tutorial. 1 1.

Leia mais

Autómatos Finitos Determinísticos

Autómatos Finitos Determinísticos Ficha 2 Autómatos Finitos Determinísticos 2.1 Introdução Se olharmos, de forma simplificada, para um computador encontramos três componentes principais: a) A unidade de processamento central b) As unidades

Leia mais

OCOMON PRIMEIROS PASSOS

OCOMON PRIMEIROS PASSOS OCOMON PRIMEIROS PASSOS O OCOMON ainda não possui um arquivo de Help para atender a todas questões relacionadas ao sistema. Esse arquivo serve apenas para dar as principais instruções para que você tenha

Leia mais

Desvios de redações efetuadas por alunos do Ensino Médio

Desvios de redações efetuadas por alunos do Ensino Médio Desvios de redações efetuadas por alunos do Ensino Médio 1. Substitua as palavras destacadas e copie as frases, tornando os fragmentos abaixo mais elegantes, além de mais próximos à língua padrão e à proposta

Leia mais

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA INGLÊS LE I (2 anos) 2015

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA INGLÊS LE I (2 anos) 2015 MINISTÉRIO DA EDUCAÇÃO E CIÊNCIA INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA INGLÊS LE I (2 anos) 2015 Prova 06 / 2015 --------------------------------------------------------------------------------------------------------------------------

Leia mais

1. Introdução ao uso da calculadora

1. Introdução ao uso da calculadora 1. Introdução ao uso da calculadora O uso da calculadora científica no curso de Estatística é fundamental pois será necessário o cálculo de diversas fórmulas com operações que uma calculadora com apenas

Leia mais

Feature-Driven Development

Feature-Driven Development FDD Feature-Driven Development Descrição dos Processos Requisitos Concepção e Planejamento Mais forma que conteúdo Desenvolver um Modelo Abrangente Construir a Lista de Features Planejar por

Leia mais

Índice. Como aceder ao serviço de Certificação PME? Como efectuar uma operação de renovação da certificação?

Índice. Como aceder ao serviço de Certificação PME? Como efectuar uma operação de renovação da certificação? Índice Como aceder ao serviço de Certificação PME? Como efectuar uma operação de renovação da certificação? Como efectuar uma operação de confirmação de estimativas? Como aceder ao Serviço de Certificação

Leia mais

Trabalhos Práticos. Programação II Curso: Engª Electrotécnica - Electrónica e Computadores

Trabalhos Práticos. Programação II Curso: Engª Electrotécnica - Electrónica e Computadores Trabalhos Práticos Programação II Curso: Engª Electrotécnica - Electrónica e Computadores 1. Objectivos 2. Calendarização 3. Normas 3.1 Relatório 3.2 Avaliação 4. Propostas Na disciplina de Programação

Leia mais

Turma Regular Semanal Manhã

Turma Regular Semanal Manhã A) ARTIGOS CORRELATOS CONCORDÂNCIA NOMINAL Introdução Leia a frase abaixo e observe as inadequações: Aquele dois meninos estudioso leram livros antigo. Note que as inadequações referem-se aos desajustes

Leia mais

Manual SAGe Versão 1.2 (a partir da versão 12.08.01)

Manual SAGe Versão 1.2 (a partir da versão 12.08.01) Manual SAGe Versão 1.2 (a partir da versão 12.08.01) Submissão de Relatórios Científicos Sumário Introdução... 2 Elaboração do Relatório Científico... 3 Submissão do Relatório Científico... 14 Operação

Leia mais

Agrupamento Vertical de Escolas de Salir Biblioteca Escolar 2008/2009. Como fazer um trabalho

Agrupamento Vertical de Escolas de Salir Biblioteca Escolar 2008/2009. Como fazer um trabalho Agrupamento Vertical de Escolas de Salir Biblioteca Escolar 2008/2009 Como fazer um trabalho Etapas na elaboração de um trabalho 1ª Etapa Penso sobre o tema 2ª Etapa Onde vou encontrar a informação? 3ª

Leia mais

Sphinx Scanner Informações gerais V 5.1.0.8

Sphinx Scanner Informações gerais V 5.1.0.8 Sphinx Scanner Informações gerais V 5.1.0.8 Pré-requisitos: Possuir modalidade scanner no software Sphinx A SPHINX Brasil propõe uma solução de leitura automática de questionários por scanner. O Sphinx

Leia mais

Entrega de Folhas de Férias

Entrega de Folhas de Férias Entrega de Folhas de Férias Questões mais frequentes FAQs Maio/2012 Versão 2.0 DDO É obrigatório adoptar o novo formato para envio da informação de Folhas de Férias estabelecido na legislação em vigor

Leia mais

Processo de Controle das Reposições da loja

Processo de Controle das Reposições da loja Processo de Controle das Reposições da loja Getway 2015 Processo de Reposição de Mercadorias Manual Processo de Reposição de Mercadorias. O processo de reposição de mercadorias para o Profit foi definido

Leia mais

Conceitos básicos de programação

Conceitos básicos de programação O QUE É UM PROGRAMA? Para executar uma dada tarefa é geralmente necessário entender o sistema onde ela é realizada. Por exemplo, para fazer um bolo temos um sistema composto por: Ingredientes Cozinheiro

Leia mais

FACULDADE DE ENGENHARIA DE COMPUTAÇÃO. PROJETO FINAL I e II PLANO DE TRABALHO <NOME DO TRABALHO> <Nome do Aluno> <Nome do Orientador>

FACULDADE DE ENGENHARIA DE COMPUTAÇÃO. PROJETO FINAL I e II PLANO DE TRABALHO <NOME DO TRABALHO> <Nome do Aluno> <Nome do Orientador> FACULDADE DE ENGENHARIA DE COMPUTAÇÃO PROJETO FINAL I e II PLANO DE TRABALHO O Trabalho de Conclusão de Curso (TCC) a ser desenvolvido

Leia mais

TÉCNICAS DE PROGRAMAÇÃO

TÉCNICAS DE PROGRAMAÇÃO TÉCNICAS DE PROGRAMAÇÃO (Adaptado do texto do prof. Adair Santa Catarina) ALGORITMOS COM QUALIDADE MÁXIMAS DE PROGRAMAÇÃO 1) Algoritmos devem ser feitos para serem lidos por seres humanos: Tenha em mente

Leia mais

PLANIFICAÇÃO ANUAL 2015/2016 PORTUGUÊS - 3ºANO

PLANIFICAÇÃO ANUAL 2015/2016 PORTUGUÊS - 3ºANO DIREÇÃO DE SERVIÇOS DA REGIÃO ALGARVE Agrupamento de Escolas José Belchior Viegas (Sede: Escola Secundária José Belchior Viegas) PLANIFICAÇÃO ANUAL 2015/2016 PORTUGUÊS - 3ºANO METAS Domínios/ Conteúdos

Leia mais

GUIA PARA O PREENCHIMENTO DOS FORMULÁRIOS ENTIDADE GESTORA ERP PORTUGAL

GUIA PARA O PREENCHIMENTO DOS FORMULÁRIOS ENTIDADE GESTORA ERP PORTUGAL GUIA PARA O PREENCHIMENTO DOS FORMULÁRIOS ENTIDADE GESTORA ERP PORTUGAL Versão: 1.0 Data: 05-06-2009 Índice Acesso e estados dos Formulários... 3 Escolha do Formulário e submissão... 4 Bases para a navegação

Leia mais

Análise e Concepção de Sistemas de Informação

Análise e Concepção de Sistemas de Informação Análise e Concepção de Sistemas de Informação Projecto Versão 2.0 amazon.com 2005-2006 1. Introdução O presente documento tem como objectivo apresentar o enunciado do projecto de ACSI 2005-2006. O projecto

Leia mais

Uma Aplicação de gestão de stocks com data bases hierárquicos, relações lógicas e indexação secundária, e sua exploração em Teleprocessamento.

Uma Aplicação de gestão de stocks com data bases hierárquicos, relações lógicas e indexação secundária, e sua exploração em Teleprocessamento. Uma Aplicação de gestão de stocks com data bases hierárquicos, relações lógicas e indexação secundária, e sua exploração em Teleprocessamento. RESUMO Descrevem-se as estruturas de bases de dados utilizadas

Leia mais

TIC Unidade 2 Base de Dados. Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado.

TIC Unidade 2 Base de Dados. Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado. Conceitos relativos à Informação 1. Informação O que á a informação? Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado. 2. Dados Em informática designa-se

Leia mais

Prova de Aferição de Matemática

Prova de Aferição de Matemática PROVA DE AFERIÇÃO DO ENSINO BÁSICO A PREENCHER PELO ALUNO Nome A PREENCHER PELO AGRUPAMENTO Número convencional do Aluno Número convencional do Aluno A PREENCHER PELA U.A. Número convencional do Agrupamento

Leia mais

Observação das aulas Algumas indicações para observar as aulas

Observação das aulas Algumas indicações para observar as aulas Observação das aulas Algumas indicações para observar as aulas OBJECTVOS: Avaliar a capacidade do/a professor(a) de integrar esta abordagem nas actividades quotidianas. sso implicará igualmente uma descrição

Leia mais

Planejando o aplicativo

Planejando o aplicativo Um aplicativo do Visual FoxPro geralmente inclui um ou mais bancos de dados, um programa principal que configura o ambiente de sistema do aplicativo, além de uma interface com os usuários composta por

Leia mais

Importação de Dados no Sphinx

Importação de Dados no Sphinx Importação de Dados no Sphinx A importação de dados refere-se à transferência de dados coletados em outro ambiente para dentro do software Sphinx. No software, encontre a opção Importar dados no estágio

Leia mais

Professora Verônica Ferreira

Professora Verônica Ferreira Professora Verônica Ferreira 1- Prova: ESAF - 2013 - DNIT - Técnico Administrativo (questão nº 1) Disciplina: Português Assuntos: Crase; Assinale a opção que completa corretamente a sequência de lacunas

Leia mais

PARFOR 2014 CURSO INTENSIVO DE ATUALIZAÇÃO DE PROFESSORES DE PORTUGUÊS LÍNGUA MATERNA FLUP

PARFOR 2014 CURSO INTENSIVO DE ATUALIZAÇÃO DE PROFESSORES DE PORTUGUÊS LÍNGUA MATERNA FLUP PARFOR 2014 CURSO INTENSIVO DE ATUALIZAÇÃO DE PROFESSORES DE PORTUGUÊS LÍNGUA MATERNA FLUP Semântica 28/jan/2014 António Leal a.leal006@gmail.com AGENDA Semântica Frásica: Tempo (considerações gerais)

Leia mais

Parece claro que há uma, e uma só, conclusão a tirar destas proposições. Esa conclusão é:

Parece claro que há uma, e uma só, conclusão a tirar destas proposições. Esa conclusão é: Argumentos Dedutivos e Indutivos Paulo Andrade Ruas Introdução Em geral, quando se quer explicar que géneros de argumentos existem, começa-se por distinguir os argumentos dedutivos dos não dedutivos. A

Leia mais

Treinamento GVcollege Módulo Acadêmico - Pedagógico

Treinamento GVcollege Módulo Acadêmico - Pedagógico Treinamento GVcollege Módulo Acadêmico - Pedagógico 2015 GVDASA Sistemas Pedagógico 2 AVISO O conteúdo deste documento é de propriedade intelectual exclusiva da GVDASA Sistemas e está sujeito a alterações

Leia mais

Algumas vantagens da Teoria das Descrições Definidas (Russel 1905)

Algumas vantagens da Teoria das Descrições Definidas (Russel 1905) Textos / Seminário de Orientação - 12 de Março de 2005 - Fernando Janeiro Algumas vantagens da Teoria das Descrições Definidas (Russel 1905) Assume-se que o objecto de uma teoria semântica é constituído

Leia mais

Dadas a base e a altura de um triangulo, determinar sua área.

Dadas a base e a altura de um triangulo, determinar sua área. Disciplina Lógica de Programação Visual Ana Rita Dutra dos Santos Especialista em Novas Tecnologias aplicadas a Educação Mestranda em Informática aplicada a Educação ana.santos@qi.edu.br Conceitos Preliminares

Leia mais

Problemas insolúveis. Um exemplo simples e concreto

Problemas insolúveis. Um exemplo simples e concreto Surge agora uma outra questão. Viemos buscando algoritmos para resolver problemas. No entanto, será que sempre seria possível achar esses algoritmos? Colocando de outra forma: será que, para todo problema,

Leia mais

4.1. UML Diagramas de casos de uso

4.1. UML Diagramas de casos de uso Engenharia de Software 4.1. UML Diagramas de casos de uso Nuno Miguel Gil Fonseca nuno.fonseca@estgoh.ipc.pt Utilizados para ajudar na análise de requisitos Através da forma como o utilizador usa o sistema

Leia mais

Roteiro para a escrita do documento de Especificação de Requisitos de Software (ERS)

Roteiro para a escrita do documento de Especificação de Requisitos de Software (ERS) Roteiro para a escrita do documento de Especificação de Requisitos de Software (ERS) Definição Geral: Disciplina de Compiladores Prof. Jorge Bidarra (UNIOESTE) A especificação de requisitos tem como objetivo

Leia mais

Diagrama de transição de Estados (DTE)

Diagrama de transição de Estados (DTE) Diagrama de transição de Estados (DTE) O DTE é uma ferramenta de modelação poderosa para descrever o comportamento do sistema dependente do tempo. A necessidade de uma ferramenta deste tipo surgiu das

Leia mais

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE MÓDULO 6 INTRODUÇÃO À PROBBILIDDE Quando estudamos algum fenômeno através do método estatístico, na maior parte das vezes é preciso estabelecer uma distinção entre o modelo matemático que construímos para

Leia mais

COMPETÊNCIAS BÁSICAS EM TIC NAS EB1

COMPETÊNCIAS BÁSICAS EM TIC NAS EB1 COMPETÊNCIAS BÁSICAS EM TIC NAS EB1 Oficina do Correio Para saber mais sobre Correio electrónico 1. Dicas para melhor gerir e organizar o Correio Electrónico utilizando o Outlook Express Criar Pastas Escrever

Leia mais

Sistema Banco de Preços Manual do Usuário OBSERVATÓRIO

Sistema Banco de Preços Manual do Usuário OBSERVATÓRIO Sistema Banco de Preços Manual do Usuário OBSERVATÓRIO da Despesa Pública 1 Sumário O Banco de Preços... 3 Acessando o Banco de Preços... 4 Funções do Banco de Preços... 5 Gerar Preço de Referência...

Leia mais

Podemos encontrar uma figura interessante no PMBOK (Capítulo 7) sobre a necessidade de organizarmos o fluxo de caixa em um projeto.

Podemos encontrar uma figura interessante no PMBOK (Capítulo 7) sobre a necessidade de organizarmos o fluxo de caixa em um projeto. Discussão sobre Nivelamento Baseado em Fluxo de Caixa. Item aberto na lista E-Plan Podemos encontrar uma figura interessante no PMBOK (Capítulo 7) sobre a necessidade de organizarmos o fluxo de caixa em

Leia mais

Um compilador é um programa que lê um programa escrito numa dada linguagem, a linguagem objecto (fonte), e a traduz num programa equivalente

Um compilador é um programa que lê um programa escrito numa dada linguagem, a linguagem objecto (fonte), e a traduz num programa equivalente Capítulo 1 Introdução Um compilador é um que lê um escrito numa dada linguagem, a linguagem objecto (fonte), e a traduz num equivalente numa outra linguagem, a linguagem destino Como parte importante neste

Leia mais

Ajuda ao SciEn-Produção 1. 1. O Artigo Científico da Pesquisa Experimental

Ajuda ao SciEn-Produção 1. 1. O Artigo Científico da Pesquisa Experimental Ajuda ao SciEn-Produção 1 Este texto de ajuda contém três partes: a parte 1 indica em linhas gerais o que deve ser esclarecido em cada uma das seções da estrutura de um artigo cientifico relatando uma

Leia mais

Novo Formato de Logins Manual de Consulta

Novo Formato de Logins Manual de Consulta Gestão Integrada de Acessos Novo Formato de Logins Manual de Consulta Gestão Integrada de Acessos Histórico de Alterações Versão Descrição Autor Data 1.0 Versão inicial DSI/PPQ 2014-07-11 Controlo do documento

Leia mais

Informação Prova de Equivalência à Frequência - 2014. Agrupamento de Escolas de ANTÓNIO NOBRE. DISCIPLINA: Inglês CÓDIGO DA PROVA: 358

Informação Prova de Equivalência à Frequência - 2014. Agrupamento de Escolas de ANTÓNIO NOBRE. DISCIPLINA: Inglês CÓDIGO DA PROVA: 358 DISCIPLINA: Inglês CÓDIGO DA PROVA: 358 CICLO: Secundário ANO DE ESCOLARIDADE: 12º Introdução O presente documento visa divulgar as características da prova de exame de equivalência à frequência da disciplina

Leia mais

Como funciona? SUMÁRIO

Como funciona? SUMÁRIO SUMÁRIO 1. Introdução... 2 2. Benefícios e Vantagens... 2 3. Como utilizar?... 2 3.1. Criar Chave / Senha de Usuário... 2 3.2. Recursos da Barra Superior... 2 3.2.1. Opções... 3 3.2.1.1. Mover Para...

Leia mais

PHC dteamcontrol Interno

PHC dteamcontrol Interno PHC dteamcontrol Interno A gestão remota de projetos em aberto A solução via Internet que permite acompanhar os projetos em aberto em que o utilizador se encontra envolvido, gerir eficazmente o seu tempo

Leia mais

INTRODUÇÃO ÀS LINGUAGENS DE PROGRAMAÇÃO

INTRODUÇÃO ÀS LINGUAGENS DE PROGRAMAÇÃO Capítulo 1 INTRODUÇÃO ÀS LINGUAGENS DE PROGRAMAÇÃO 1.1 Histórico de Linguagens de Programação Para um computador executar uma dada tarefa é necessário que se informe a ele, de uma maneira clara, como ele

Leia mais

Metodologia de Gerenciamento de Projetos da Justiça Federal

Metodologia de Gerenciamento de Projetos da Justiça Federal Metodologia de Gerenciamento de Projetos da Justiça Federal Histórico de Revisões Data Versão Descrição 30/04/2010 1.0 Versão Inicial 2 Sumário 1. Introdução... 5 2. Público-alvo... 5 3. Conceitos básicos...

Leia mais

Tabela de Símbolos. Análise Semântica A Tabela de Símbolos. Principais Operações. Estrutura da Tabela de Símbolos. Declarações 11/6/2008

Tabela de Símbolos. Análise Semântica A Tabela de Símbolos. Principais Operações. Estrutura da Tabela de Símbolos. Declarações 11/6/2008 Tabela de Símbolos Análise Semântica A Tabela de Símbolos Fabiano Baldo Após a árvore de derivação, a tabela de símbolos é o principal atributo herdado em um compilador. É possível, mas não necessário,

Leia mais

Agrupamento de Escolas de Terras de Bouro

Agrupamento de Escolas de Terras de Bouro Informação Prova de Equivalência à Frequência INGLÊS Abril 2015 2ºCiclo do Ensino Básico (Decreto-Lei n.º 139/2012, de 5 de julho) Prova 06/2015 Tipo de Prova: Escrita e Oral Duração: 90 minutos + 15 minutos

Leia mais

2.º Ciclo do Ensino Básico (Decreto-Lei n.º 139/2012, de 5 de julho)

2.º Ciclo do Ensino Básico (Decreto-Lei n.º 139/2012, de 5 de julho) AGRUPAMENTO DE ESCOLAS DE ALMANCIL (145142) Prova de equivalência à frequência de Inglês (Prova escrita e oral) 1.ª e 2.ª Fases 2.º Ciclo do Ensino Básico (Decreto-Lei n.º 139/2012, de 5 de julho) As informações

Leia mais

ENGENHARIA DA COMPUTAÇÃO BANCO DE DADOS I CONTEÚDO 5 ABORDAGEM RELACIONAL

ENGENHARIA DA COMPUTAÇÃO BANCO DE DADOS I CONTEÚDO 5 ABORDAGEM RELACIONAL ENGENHARIA DA COMPUTAÇÃO BANCO DE DADOS I CONTEÚDO 5 ABORDAGEM RELACIONAL PROF. MS C. RICARDO ANTONELLO WWW.ANTONELLO.COM.B R PORQUE SER RELACIONAL? Hoje, há um claro predomínio dos SGBD relacionais, principalmente

Leia mais

Guia de Consulta. Percorrer

Guia de Consulta. Percorrer Guia de Consulta Percorrer A secção "Percorrer" permite-lhe consultar uma das listas numa determinada ordem. Existem cinco listas diferentes: Comunidades, Colecções, Títulos, Autores e Datas. Poderá percorrer

Leia mais

Sistema de Controle de Solicitação de Desenvolvimento

Sistema de Controle de Solicitação de Desenvolvimento Sistema de Controle de Solicitação de Desenvolvimento Introdução O presente documento descreverá de forma objetiva as principais operações para abertura e consulta de uma solicitação ao Setor de Desenvolvimento

Leia mais

QFD: Quality Function Deployment QFD: CASA DA QUALIDADE - PASSO A PASSO

QFD: Quality Function Deployment QFD: CASA DA QUALIDADE - PASSO A PASSO QFD: CASA DA QUALIDADE - PASSO A PASSO 1 - INTRODUÇÃO Segundo Akao (1990), QFD é a conversão dos requisitos do consumidor em características de qualidade do produto e o desenvolvimento da qualidade de

Leia mais

Manual Geral do OASIS

Manual Geral do OASIS Manual Geral do OASIS SISTEMA DE GESTÃO DE DEMANDA, PROJETO E SERVIÇO DE TECNOLOGIA DA INFORMAÇÃO OASIS Introdução Esse manual tem como objetivo auxiliar aos usuários nos procedimentos de execução do sistema

Leia mais

GUIA DE CURSO. Tecnologia em Sistemas de Informação. Tecnologia em Desenvolvimento Web. Tecnologia em Análise e Desenvolvimento de Sistemas

GUIA DE CURSO. Tecnologia em Sistemas de Informação. Tecnologia em Desenvolvimento Web. Tecnologia em Análise e Desenvolvimento de Sistemas PIM PROGRAMA DE INTEGRAÇÃO COM O MERCADO GUIA DE CURSO Tecnologia em Sistemas de Informação Tecnologia em Desenvolvimento Web Tecnologia em Análise e Desenvolvimento de Sistemas Tecnologia em Sistemas

Leia mais

Auxiliar de pesquisa

Auxiliar de pesquisa 1/7 Auxiliar de pesquisa Encontra duas possibilidades de pesquisa: a pesquisa básica e a pesquisa avançada. Se é a primeira vez que pretende consultar documentos neste Arquivo, sugerimos que inicie a sua

Leia mais

Cadernos do CNLF, Vol. XVI, Nº 04, t. 3, pág. 2451

Cadernos do CNLF, Vol. XVI, Nº 04, t. 3, pág. 2451 O PLURAL DAS PALAVRAS TERMINADAS EM -ÃO: MUDANÇA OU VARIAÇÃO ESTÁVEL? Miriam Cristina Almeida Severino (UFRJ) cristinasmiriams@yahoo.com.br Christina Abreu Gomes (UFRJ) christina-gomes@uol.com.br 1. Introdução

Leia mais

Introdução à Computação

Introdução à Computação Aspectos Importantes - Desenvolvimento de Software Motivação A economia de todos países dependem do uso de software. Cada vez mais, o controle dos processos tem sido feito por software. Atualmente, os

Leia mais

Análise e Desenvolvimento de Sistemas ADS Programação Orientada a Obejeto POO 3º Semestre AULA 03 - INTRODUÇÃO À PROGRAMAÇÃO ORIENTADA A OBJETO (POO)

Análise e Desenvolvimento de Sistemas ADS Programação Orientada a Obejeto POO 3º Semestre AULA 03 - INTRODUÇÃO À PROGRAMAÇÃO ORIENTADA A OBJETO (POO) Análise e Desenvolvimento de Sistemas ADS Programação Orientada a Obejeto POO 3º Semestre AULA 03 - INTRODUÇÃO À PROGRAMAÇÃO ORIENTADA A OBJETO (POO) Parte: 1 Prof. Cristóvão Cunha Objetivos de aprendizagem

Leia mais

Agrupamento de Escolas de Porto de Mós Informação-Prova de Equivalência à Frequência

Agrupamento de Escolas de Porto de Mós Informação-Prova de Equivalência à Frequência Prova de Equivalência à Frequência de Inglês (Escrita + Oral) Prova Código 06-2015 2º Ciclo do Ensino Básico - 6ºano de escolaridade 1. Introdução O presente documento visa divulgar as características

Leia mais

ISO 9001:2008. A International Organization for Standardization (ISO) publicou em 2008-11- 14 a nova edição da Norma ISO 9000:

ISO 9001:2008. A International Organization for Standardization (ISO) publicou em 2008-11- 14 a nova edição da Norma ISO 9000: A International Organization for Standardization (ISO) publicou em 2008-11- 14 a nova edição da Norma ISO 9000: ISO 9001:2008 Esta nova edição decorre do compromisso da ISO em rever e actualizar as Normas,

Leia mais