EXTRAÇÃO AUTOMÁTICA DE ESTRUTURAS DE SUBCATEGORIZAÇÃO A PARTIR DE CORPORA EM PORTUGUÊS

Tamanho: px
Começar a partir da página:

Download "EXTRAÇÃO AUTOMÁTICA DE ESTRUTURAS DE SUBCATEGORIZAÇÃO A PARTIR DE CORPORA EM PORTUGUÊS"

Transcrição

1 EXTRAÇÃO AUTOMÁTICA DE ESTRUTURAS DE SUBCATEGORIZAÇÃO A PARTIR DE CORPORA EM PORTUGUÊS Leonardo Zilio (PPG-Letras/UFRGS) Adriano Zanette (PPG-Computação/UFRGS) Carolina Scarton (ICMC/USP) Introdução A tarefa de identificar automaticamente estruturas de subcategorização (subcategorization frames SCFs), que se enquadra como um tipo de aquisição lexical a partir de corpora, é um desafio no Processamento de Linguagem Natural (PLN) que tem sido trabalhado em diversas línguas. Tal tarefa, além de servir para a classificação de elementos linguísticos (como, por exemplo, de verbos e substantivos), também pode ser utilizada para várias tarefas de descrição de linguagem, podendo inclusive ajudar a melhorar o desempenho de um parser (Korhonen et al., 2006). Além disso, a aquisição lexical automática pode ser útil para classificação automática de verbos (Li e Brew, 2008; Sun e Korhonen, 2009; Sun et al., 2010) e extração de informação (Surdeanu et al., 2003), entre outros. Tendo essa perspectiva em mente, este trabalho apresenta um sistema para a identificação, extração e organização de SCFs para o português (Zanette, 2010; Zanette et al., 2012), o qual iniciou como uma adaptação para o português do sistema de Messiant (2006), e mostra a aplicação desse sistema em dois trabalhos de descrição do português baseados em corpora. Assim, os objetivos aqui propostos são: 1) descrever a ferramenta de extração de SCFs; 2) relatar a sua aplicação prática em dois estudos; e 3) apresentar brevemente os resultados desses estudos. Na seção a seguir, apresentamos uma definição de SCF e indicamos alguns trabalhos que abordam o tema. Posteriormente, discorremos brevemente sobre o funcionamento do sistema desenvolvido. Após a descrição da ferramenta, apresentamos dois estudos que a utilizaram para diferentes fins, e a última seção é reservada para nossas considerações finais. Estruturas de subcategorização

2 Uma estrutura de subcategorização (subcategorization frame SCF) é uma representação sintática de uma sentença ou sintagma que, observada em grandes extensões de texto, permite a classificação de determinados elementos linguísticos. Neste trabalho, os elementos linguísticos relevantes são os verbos, sendo que as SCFs representam a estrutura argumental dos verbos presentes em sentenças de diferentes corpora. Na Figura 1, apresentamos alguns exemplos de SCFs do verbo encontrar extraídos de um corpus de textos de Cardiologia. Fig. 1: SCFs do verbo encontrar em um corpus de Cardiologia Os sistemas de SCFs já foram desenvolvidos para várias línguas, como inglês (Korhonen et al., 2006; Briscoe e Carrol, 1997), alemão (Schulte Im Walde, 2002), francês (Messiant, 2008) e italiano (Ienco et al., 2008). Tais trabalhos foram desenvolvidos principalmente para o reconhecimento de SCFs verbais. No inglês, os trabalhos de SCFs já foram utilizados, por exemplo, para expandir a VerbNet (Kipper, 2005; Kipper et al., 2006), um repositório de verbos com anotação de papéis semânticos. Para o português, o trabalho com SCFs está ainda em seus primeiros passos. Podemos citar o sistema de Augustini (2006), que procura abranger também as SCFs de preposições, substantivos e adjetivos. A grande restrição desse estudo, porém, é que as SCFs têm de ser determinadas antes da extração. Extrator de estruturas de subcategorização O sistema que apresentamos se ocupa exclusivamente de SCFs verbais. A entrada utilizada são corpora anotados pelo parser PALAVRAS (Bick, 2000), de modo que o sistema extrai uma lista de SCFs para cada verbo, contendo informações de frequência para todas as sentenças no corpus, como pôde ser visto na Figura 1. Após a extração, o sistema armazena as informações em um banco de dados.

3 No momento do armazenamento, o sistema apresenta duas opções: um armazenamento dos dados da forma como aparecem na sentença, sem qualquer alteração em sua ordem (por exemplo, uma topicalização de objeto direto não seria colocada na forma direta); ou uma avaliação do tipo de estrutura sintática, de modo que os elementos sejam classificados em uma ordem direta predeterminada, que é a seguinte: 1) sujeito; 2) objeto direto; 3) objeto indireto; 4) adjetivo (separado de um substantivo); 5) adjunto adverbial. O processo de funcionamento do sistema é o seguinte: 1) para cada sentença, o sistema extrai todos os verbos; 2) para cada verbo na sentença, o sistema busca as suas dependências (ou seja, os elementos que se ligam, de acordo com a anotação do parser, ao verbo); e 3) as demais informações (morfossintáticas e sintáticas) anotadas pelo parser são avaliadas e os constituintes relevantes são utilizados para construir as SCFs. O sistema desenvolvido mostrou-se bastante flexível conforme as necessidades. Esse fato é comprovado pelas diferentes aplicações às quais o sistema se destina, sendo que, na seção a seguir, apresentamos dois trabalhos distintos que fazem uso dele. Estudos desenvolvidos com o sistema Léxico de verbos Um dos estudos nos quais o sistema de extração de SCFs vem sendo utilizado envolve a construção de um léxico de verbos para o português brasileiro (Scarton e Aluísio, 2012), baseado na VerbNet (Kipper, 2005). A VerbNet é um léxico verbal que contém informações sintático-semânticas de verbos agrupados de acordo com as classes de Levin (1993). Segundo Levin, verbos que compartilham padrões sintáticos (alternâncias sintáticas) tendem a compartilhar, também, componentes semânticos. As alternâncias sintáticas são alternâncias nas expressões dos argumentos dos verbos que podem ou não acarretar mudança de sentido. Cada alternância é realizada em SCFs diferentes. Como exemplo, podemos ver a alternância locativa: Sharon sprayed water on the plants. (Sharon borrifou água sobre as plantas) Sharon sprayed the plants with water. (Sharon borrifou as plantas com água) No primeiro exemplo, a SCF é SUBJ[NP] V NP PP[sobre] e, no segundo, é SUBJ[NP] V NP PP[com].

4 A ideia da VerbNet.Br é utilizar os alinhamentos existentes entre a VerbNet, a WordNet (Fellbaum, 1998) e a WordNet.Br (Dias-da-Silva et al., 2008) para trazer automaticamente verbos candidatos a membros das classes de Levin para o português do Brasil. Após isso, verificam-se as SCFs (em corpus) dos verbos candidatos no português. Por fim, comparam-se os padrões encontrados no corpus com padrões definidos manualmente para cada classe. Verbos que apresentam no corpus os padrões manualmente definidos são selecionados como membros. Outra tarefa que também foi realizada com as SCFs foi o agrupamento automático de verbos (AAV). Nessa tarefa, as SCFs foram utilizadas como atributos para agrupar os verbos. O resultado das duas abordagens serão comparados com um gold standard das classes da VerbNet para o português do Brasil, criado com o apoio da Drª. Karin Kipper e da Drª. Magali Duran. Para ambas as tarefas, como pôde ser visto nos exemplos acima, o sistema foi adaptado de modo a apresentar a posição do verbo e do sujeito na SCF. Portanto, em comparação com a coluna 1 da Figura 1, os padrões são um pouco diferentes. Neste estudo, usamos, por exemplo, SUBJ[NP] V NP PP[em], em vez de simplesmente NP_NP_PP[em] (ver Figura 1). Inicialmente, utilizou-se como entrada para o sistema o corpus Lácio-Ref (Aluísio et al., 2004), que tem aproximadamente 9 milhões de palavras e apresenta 4 gêneros: científico, informativo, judiciário e literário. Como a quantidade de verbos identificados e a frequência dos mesmos não era suficiente para a tarefa de AAV, foi necessário processar mais textos. Para isso, escolheram-se o corpus PLN-BR-FULL (Bruckschen et al., 2008) do gênero jornalístico (aproximadamente 26 milhões de palavras) e o corpus da Revista FAPESP ( (Aziz e Specia, 2011) do gênero de divulgação científica (aproximadamente 6 milhões de palavras). Somando-se os três corpora, foram identificados verbos (com frequência superior a 10) e SCFs (com frequência superior a 5). O melhor resultado apresentado para a VerbNet.Br foi de 51,18% para F- measure. Já o melhor resultado para a tarefa de agrupamento de verbos atingiu uma F- measure de 49,07% (esse resultado é promissor se comparado com resultados obtidos para o inglês (63,30%) (Sun e Korhonen, 2009) e para o francês (50,60%) (Sun et al.,

5 2010), considerando que essas línguas possuem recursos maiores e ferramentas mais precisas). Anotação de papéis semânticos Outro trabalho desenvolvido com a ferramenta de extração de SCFs envolve a anotação semiautomática de papéis semânticos em corpora escritos em português brasileiro. O objetivo é gerar uma lista de verbos com suas respectivas SCFs e papéis semânticos, além de dois corpora com orações semanticamente anotadas. De modo sucinto, os papéis semânticos identificam um significado mais abstrato e esquemático dos argumentos de um elemento linguístico (em nosso caso, um verbo). Um exemplo bastante simples, somente a título de ilustração, seria indicar que, na oração João viu Maria., existe um verbo que é ver (em sua forma canônica) e dois argumentos. A anotação de papéis semânticos indica que o argumento João é o experienciador e o argumento Maria é o experienciado. Este estudo utiliza dois corpora anotados com o parser PALAVRAS (Bick, 2000), sendo um de linguagem especializada composto por artigos científicos da área de Cardiologia (Zilio, 2009) e outro de linguagem não especializada contendo textos jornalísticos do Diário Gaúcho (compilado pelo projeto PorPopular, disponível em A ferramenta de extração de SCFs que descrevemos neste trabalho auxilia a anotação dos papéis semânticos por meio da extração e organização dos dados presentes nos dois corpora e também por meio de uma interface de anotação, que é gerada automaticamente a partir do banco de dados (Figura 2). Fig. 2: Interface para anotação dos papéis semânticos.

6 Na Figura 2, cada sentença com o verbo levar é organizada em exemplos, e os argumentos desse verbo em cada um dos exemplos já se apresentam classificados na ordem discutida anteriormente. Para cada argumento, é apresentada a anotação sintática e uma caixa de rolagem que permite a seleção de um papel semântico. A lista dos papéis semânticos presentes na caixa de rolagem se encontra em um arquivo separado, podendo ser modificada facilmente conforme a necessidade do pesquisador. Atualmente, desenvolvemos um estudo-piloto que visou a testar se a lista de papéis semânticos selecionada seria aplicável em grande escala. A lista contém 46 papéis semânticos e foi proposta nos trabalhos de Brumm (2008) e Gelhausen (2010). Os papéis semânticos são estes: agente, paciente, ação, experienciador, experienciado, estímulo, beneficio, beneficiante, beneficiado, possuidor, posse, donatário, recipiente, dimensão geográfica, local, local de origem, local de destino, trajeto, dimensão temporal, momento, início, fim, frequência, guia, acompanhante, comparado, modelo, contrariado, opositor, ator, papel, qualificado, qualidade, substituto, substituído, tema, descrição, todo, parte, criador, resultado, causa, requisito, intenção, instrumento e modo. O espaço neste artigo não permite que se explique cada um dos papéis semânticos individualmente, mas ressaltamos que os nomes de alguns podem confundir o leitor, sendo importante a leitura dos artigos que os descrevem. O papel tema, por exemplo, representa a contraparte do papel descrição, e não está relacionado com o papel tema da forma como é empregado, por exemplo, na VerbNet, em que ele representa participantes que estão em um lugar ou que estão mudando de lugar (Kipper, 2005). Como essa lista de papéis foi desenvolvida com a ideia de se poder usar mais de um papel semântico por argumento e também de se anotarem argumentos de substantivos e de outros elementos não verbais, os 18 papéis compreendidos na lista entre guia e resultado são papéis com função principalmente descritora, representando uma maior especificação do argumento em relação aos demais papéis. Para o estudo-piloto, selecionamos quatro verbos (receber, levar, usar e encontrar) presentes nos dois corpora e anotamos até dez sentenças por SCF (somente usamos SCFs com frequência maior que dez), totalizando 482 sentenças, das quais resultaram 138 diferentes grupos de papéis semânticos. O estudo permitiu observar que alguns papéis semânticos da lista podem ser unidos e que outros são demasiado específicos. Um exemplo de papéis semânticos que poderiam ser unidos são os papéis

7 de posse e benefício, que se apresentam nas mesmas estruturas argumentais e com os mesmos verbos, diferindo apenas na semântica do léxico presente no argumento, mas não na semântica do verbo propriamente dita. Na comparação dos resultados nos dois corpora, percebemos que os SCFs e os papéis semânticos empregados foram muito próximos. O verbo usar foi o mais similar nos dois corpora, sendo que os papéis semânticos empregados foram realmente muito próximos. O mesmo se pode dizer do verbo receber, que apresentou papéis semânticos como recipiente e posse, benefício e beneficiado, e experienciador e experienciado na maioria dos casos em ambos os corpora. Quanto ao verbo encontrar, também observamos uma distribuição de papéis semânticos bastante parecida nos dois corpora, com predominância dos papéis agente, paciente e tema. Esses resultados pareceriam levar à conclusão de que as diferenças entre especializado e não especializado estão apenas no vocabulário, e não atingem um nível semântico mais abstrato. Mas as ocorrências do verbo levar mostraram que a questão é um pouco mais complexa. Enquanto o corpus de Cardiologia privilegiou papéis como criador e resultado, o corpus do Diário Gaúcho claramente privilegiou os papéis de agente e paciente; ainda que tenham existido também configurações muito próximas, como a de experienciador e experienciado nos dois corpora. Essas observações ainda não são robustas o suficiente para uma conclusão acerca do assunto, tendo em vista o número pequeno de observações realizadas, mas já servem como um ponto de partida para as observações futuras, nas quais serão utilizados mais verbos e mais sentenças. Considerações finais A ferramenta aqui apresentada, um extrator e organizador de SCFs, se mostrou bastante útil para a descrição do português brasileiro. Isso é visível a partir da aplicação que demonstramos em dois estudos de cunho diferente, que visam a aumentar a capacidade que temos de processar a linguagem natural. Além disso, a ferramenta pode ser aplicada a outros corpora para desenvolver outros tipos de trabalho, sendo bastante flexível, uma possibilidade seria a anotação de frames no estilo da FrameNet (Baker et al., 1998).

8 Um limite que a ferramenta apresenta é o uso do parser PALAVRAS como base, pois ele é, infelizmente, um recurso pago ao qual o acesso é bastante restrito. A opção por esse parser se deu por ele ser atualmente o mais preciso, porém, seria interessante ter como alternativa a possibilidade de se usar um parser gratuito na anotação das dependências. Esse é um dos passos que deve ser levado adiante nos trabalhos futuros relacionados à ferramenta. Agradecimentos A CAPES, CNPq e FAPESP pelo apoio financeiro e ao projeto CAPES/Cofecub 707/11 pelo suporte. Referências ALUÍSIO, S.; PINHERO, G. M.; MANFRIM, A. M. P.; OLIVEIRA, L. H. M. de; GENOVES JR., L. C.; TAGNIN, S. E. O. (2004). The Lácio-Web: Corpora and Tools to advance Brazilian Portuguese Language Investigations and Computational Linguistic Tools, in: The Proceedings of the 4th International Conference on Language Resources and Evaluation (LREC 2004). Lisboa, Portugal, AUGUSTINI, A. (2006). Aquisição Automática de Subcategorização Sintáctico- Semântica e sua Utilização em Sistemas de Processamento da Língua Natural. Tese de Doutorado em Informática: Universidade Nova de Lisboa. AZIZ, W. e SPECIA, L. (2011). Fully Automatic Compilation of a Portuguese-English Parallel Corpus for Statistical Machine Translation, in: Proceedings of the 8th Brazilian Symposium in Information and Human Language Technology, Cuiabá, Brasil. BAKER, C. F., FILLMORE, C. J. e LOWE, J. F. (1998). The Berkeley FrameNet Project, in: Proceedings of the 36th Annual Meeting of the Association for Computational Linguistics and 17th International Conference on Computational Linguistics, University of Montréal, Canadá, pp BICK, E. (2000). The Parsing System PALAVRAS: Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Aarhus: Aarhus University Press. BRISCOE, T.; CARROL, J. (1997). Automatic extracton of subcategorization from corpora, in: Proceedings of the fifth conference on Applied natural language processing, Washington, DC,

9 BRUCKSCHEN, M., MUNIZ, F., SOUZA, J. G. C., FUCHS, J. T., INFANTE, K., MUNIZ, M., GONÇ ALVES, P. N., VIEIRA, R. e ALUÍSIO, S. M. (2008). Anotação Lingüística em XML do Corpus PLN-BR, in: Série de Relatórios do NILC. NILC-TR , 39 p. BRUMM, T. (2008). Erstellung eines Systems thematischer Rollen mit Hilfe einer multiplen Fallstudie. Trabalho de conclusão de curso. DIAS-DA-SILVA, B. C., DI FELIPPO, A. E NUNES, M. G. V. (2008). The automatic mapping of Princeton WordNet lexical conceptual relations onto the Brazilian Portuguese WordNet database. In Proceedings of the 6th International Conference on Language Resources and Evaluation (LREC 2008), Marrakech, Morocco, pp FELLBAUM, C. (1998). WordNet: An electronic lexical database. Cambridge: MIT Press. GELHAUSEN, T. (2010). Modellextraktion aus natürlichen Sprachen: Eine Methode zur systematischen Erstellung von Domänenmodellen. Karlsruhe: KIT Scientific Publishing. Tese de doutorado, Karlsruher Institut für Technologie. IENCO, D., VILLATA, S., BOSCO, C. (2008). Automatic extraction of subcategorization frames for Italian, in: Proceedings of the sixth International Conference on Language Resources and Evaluation (LREC 2008), Marrakech, Marocco, KIPPER, K. (2005). VerbNet: a broad-coverage, comprehensive verb lexicon. University of Pennsylvania. Doutorado em Computer and Information Science: University of Pennsylvania. KIPPER, K.; KORHONEN, A.; RYANT, N.; PALMER, M. (2006). Extending VerbNet with Novel Verb Classes, in: Fifth International Conference on Language Resources and Evaluation (LREC 2006), Genoa, Italy. KORHONEN, A.; KRYMOLOWSKI, Y.; BRISCOE T. (2006). A Large Subcategorization Lexicon for Natural Language Processing Applications, in: Proceedings of the fifth international conference on Language Resources and Evaluation (LREC 2006), Genova, Italy.

10 LI, J.; BREW, C. (2008). Which are the Best Features for Automatic Verb Classification, in: Proceedings of the 46th Annual Meeting of the Assoication for Computational Linguistics, Columbus, Ohio. MESSIANT, C. (2006). A subcategorization acquisition system for French verbs, in: Proceedings of the 46th Annual Meeting of the Association for Computational Linguistics on Human Language Techonologies, Columbus, Ohio, SCARTON, C. e ALUÍSIO, S. M. (2012). Towards a cross-linguistic VerbNet-style lexicon to Brazilian Portuguese, in: Proceedings of the LREC 2012 Workshop on Creating Cross-language Resources for Disconnected Languages and Styles (CREDISLAS 2012), Istanbul, Turkey. SCHULTE IM WALDE, S. (2002). A Subcategorisation Lexicon for German Verbs induced from a Lexicalised PCFG, in: Proceedings of the 3rd Conference on Language Resources and Evaluation, v. IV, Las Palmas de Gran Canaria, Espanha, p SUN, L.; KORHONEN, A. (2009). Improving verb clustering with automatically acquired selectional preferences, in: Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing (EMNLP 2009), Singapura, pp SUN, L.; KORHONEN, A.; POIBEAU, T.; MESSIANT, C. (2010). Investigating the cross-linguistic potential of VerbNet: style classification, in: Proceedings of the 23rd International Conference on Computational Linguistics (COLING 2010), Beijing, China, SURDEANU, M.; HARABAGIU, S.; WILLIAMS, J.; AARSETH, P. (2003). Using predicate-argument structures for information extraction, in: The Proceedings of the 41st Annual Meeting of ACL, Sapporo, Japan, ZANETTE, A. (2010). Aquisição de Subcategorization frames para Verbos da Língua Portuguesa. Projeto de Diplomação orientado por Aline Villavicencio, UFRGS. ZANETTE, A.; SCARTON, C.; ZILIO, L. (2012). Subcategorization frames extractor from corpus: an approach to Portuguese language, in: Demo session of PROPOR 2012, 17 a 20 de abril de 2012, Coimbra, Portugal. ZILIO, L. (2009). Colocações especializadas e Komposita: um estudo contrastivo alemão-português na área de Cardiologia. Dissertação de Mestrado orientada por Maria José Bocorny Finatto, UFRGS.

VerbLexPor: um recurso léxico com anotação de papéis semânticos para o português

VerbLexPor: um recurso léxico com anotação de papéis semânticos para o português Proceedings of Symposium in Information and Human Language Technology. Natal, RN, Brazil, November 4 7, 2015. c 2015 Sociedade Brasileira de Computação. VerbLexPor: um recurso léxico com anotação de papéis

Leia mais

O tratamento da partícula se para fins de anotação de papéis semânticos

O tratamento da partícula se para fins de anotação de papéis semânticos O tratamento da partícula se para fins de anotação de papéis semânticos Magali Sanches Duran, Sandra Maria Aluísio Núcleo Interinstitucional de Linguística Computacional ICMC Universidade de São Paulo

Leia mais

VerbNet.Br: construção semiautomática de um léxico computacional de verbos para o português do Brasil

VerbNet.Br: construção semiautomática de um léxico computacional de verbos para o português do Brasil VerbNet.Br: construção semiautomática de um léxico computacional de verbos para o português do Brasil Carolina Evaristo Scarton Núcleo Interinstitucional de Linguística Computacional (NILC) Instituto de

Leia mais

Verificação automática de substantivos compostos através de reconhecimento de padrões sintáticos

Verificação automática de substantivos compostos através de reconhecimento de padrões sintáticos Universidade Federal do Rio Grande do Sul Grupo de Processamento de Linguagens Naturais Projeto Expressões Multipalavras Verificação automática de substantivos compostos através de reconhecimento de padrões

Leia mais

DESENVOLVIMENTO DE UM PARSER DE CONECTORES TEXTUAIS E SUA APLICAÇÃO PARA ANÁLISE DE. Leonardo Zilio(Letras/UFRGS) Rodrigo Wilkens(PPG-Comp/UFRGS)

DESENVOLVIMENTO DE UM PARSER DE CONECTORES TEXTUAIS E SUA APLICAÇÃO PARA ANÁLISE DE. Leonardo Zilio(Letras/UFRGS) Rodrigo Wilkens(PPG-Comp/UFRGS) DESENVOLVIMENTO DE UM PARSER DE CONECTORES TEXTUAIS E SUA APLICAÇÃO PARA ANÁLISE DE GÊNEROS TEXTUAIS Leonardo Zilio(Letras/UFRGS) Rodrigo Wilkens(PPG-Comp/UFRGS) IX ELC Porto Alegre 08 de Outubro de 2010

Leia mais

SEMÂNTICA PARTE 3 ANÁLISE SEMÂNTICA 14/06/2012. SCC5908 Tópicos em Processamento de Língua Natural. Até agora, significado da sentença

SEMÂNTICA PARTE 3 ANÁLISE SEMÂNTICA 14/06/2012. SCC5908 Tópicos em Processamento de Língua Natural. Até agora, significado da sentença SEMÂNTICA PARTE 3 SCC5908 Tópicos em Processamento de Língua Natural Thiago A. S. Pardo ANÁLISE SEMÂNTICA Até agora, significado da sentença Rhumba closed. e Closing(e) Closed(e,Rhumba) 2 1 ANÁLISE SEMÂNTICA

Leia mais

Índice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed

Índice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed Classificação de textos para o ensino de português como segunda língua Pedro Santos Curto Conclusões, Contribuições e Trabalho futuro 1 2 Motivação Aplicações e escala da classificação de textos Motivação

Leia mais

Um repositório de verbos para a anotação de papéis semânticos disponível na web

Um repositório de verbos para a anotação de papéis semânticos disponível na web Um repositório de verbos para a anotação de papéis semânticos disponível na web Magali Sanches Duran, Jhonata Pereira Martins, Sandra Maria Aluísio Núcleo Interinstitucional de Linguística Computacional

Leia mais

Comparação dos algoritmos sequencial e paralelo para contagem de palavras e contexto

Comparação dos algoritmos sequencial e paralelo para contagem de palavras e contexto Comparação dos algoritmos sequencial e paralelo para contagem de palavras e contexto Eduardo Delazeri Ferreira, Francieli Zanon Boito, Aline Villavicencio 1. Introdução 1 Instituto de Informática - Universidade

Leia mais

CULTURA, LÉXICO E REGULARIDADES ESTRUTURAIS EM TEXTOS ESPECIALIZADOS DE MEDICINA E DE DIREITO AMBIENTAL: UM CONTRASTE EXPLORATÓRIO

CULTURA, LÉXICO E REGULARIDADES ESTRUTURAIS EM TEXTOS ESPECIALIZADOS DE MEDICINA E DE DIREITO AMBIENTAL: UM CONTRASTE EXPLORATÓRIO CULTURA, LÉXICO E REGULARIDADES ESTRUTURAIS EM TEXTOS ESPECIALIZADOS DE MEDICINA E DE DIREITO AMBIENTAL: UM CONTRASTE EXPLORATÓRIO Elisandro José Migotto - PIBIC/CNPq UFRGS Edna Regina Hornes de Lima -

Leia mais

Introdução ao Processamento de Línguas Naturais. SCC5908 Introdução ao Processamento de Língua Natural. Thiago A. S. Pardo

Introdução ao Processamento de Línguas Naturais. SCC5908 Introdução ao Processamento de Língua Natural. Thiago A. S. Pardo /0/0 Introdução ao Processamento de Línguas Naturais SCC5908 Introdução ao Processamento de Língua Natural Thiago A. S. Pardo Dilemas no Brasil Como lidar com a interdisciplinaridade Linda no papel, complicada

Leia mais

Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação

Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação Universidade Federal do Rio Grande do Sul Instituto de Informática Programa de Pós-Graduação em Computação Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação Otávio

Leia mais

PORTUGUÊS POPULAR ESCRITO: O VOCABULÁRIO DO JORNAL DIÁRIO GAÚCHO

PORTUGUÊS POPULAR ESCRITO: O VOCABULÁRIO DO JORNAL DIÁRIO GAÚCHO X Salão de Iniciação Científica PUCRS PORTUGUÊS POPULAR ESCRITO: O VOCABULÁRIO DO JORNAL DIÁRIO GAÚCHO Bruna Rodrigues da Silva¹, Maria José Bocorny Finatto ²(orientador) ¹ Acadêmica do curso de Letras

Leia mais

ELABORAÇÃO DE DICIONÁRIO ELETRÔNICO Mauro Rebello 1, Violeta de San Tiago Dantas Barbosa Quental 2.

ELABORAÇÃO DE DICIONÁRIO ELETRÔNICO Mauro Rebello 1, Violeta de San Tiago Dantas Barbosa Quental 2. DL - DEPARTAMENTO DE LETRAS ELABORAÇÃO DE DICIONÁRIO ELETRÔNICO Mauro Rebello 1, Violeta de San Tiago Dantas Barbosa Quental 2. 1 Aluno do curso de Letras da PUC-Rio 2 Professora e pesquisadora da área

Leia mais

6 Atributos. A dívida da empresa subiu.

6 Atributos. A dívida da empresa subiu. 6 Atributos Para buscar o sentimento de um texto automaticamente precisamos encontrar boas pistas ao longo do discurso. Uma grande variedade de palavras e expressões possui conotação positiva ou negativa,

Leia mais

PROTÓTIPO PARA SUMARIZAÇÃO AUTOMÁTICA DE TEXTOS ESCRITOS EM LÍNGUA PORTUGUESA ALEXANDRE BUSARELLO JOYCE MARTINS

PROTÓTIPO PARA SUMARIZAÇÃO AUTOMÁTICA DE TEXTOS ESCRITOS EM LÍNGUA PORTUGUESA ALEXANDRE BUSARELLO JOYCE MARTINS PROTÓTIPO PARA SUMARIZAÇÃO AUTOMÁTICA DE TEXTOS ESCRITOS EM LÍNGUA PORTUGUESA ALEXANDRE BUSARELLO JOYCE MARTINS Roteiro Introdução Objetivos Fundamentação Teórica Especificação Implementação Operacionalidade

Leia mais

ANOTAÇÃO DE SENTIDOS DE VERBOS EM NOTÍCIAS JORNALÍSTICAS EM PORTUGUÊS DO BRASIL

ANOTAÇÃO DE SENTIDOS DE VERBOS EM NOTÍCIAS JORNALÍSTICAS EM PORTUGUÊS DO BRASIL ANOTAÇÃO DE SENTIDOS DE VERBOS EM NOTÍCIAS JORNALÍSTICAS EM PORTUGUÊS DO BRASIL 1 Marco A. Sobrevilla Cabezudo, 1 Erick G. Maziero, 2 Jackson W. C. Souza, 1 Márcio S. Dias, 1 Paula C. F. Cardoso, 1 Pedro

Leia mais

PADRÕES LEXICAIS DA OBRA DE EDGAR ALLAN POE À LUZ DA LINGUÍSTICA DE CORPUS

PADRÕES LEXICAIS DA OBRA DE EDGAR ALLAN POE À LUZ DA LINGUÍSTICA DE CORPUS PADRÕES LEXICAIS DA OBRA DE EDGAR ALLAN POE À LUZ DA LINGUÍSTICA DE CORPUS Bianca Franco Pasqualini Tradução/Inglês UFRGS IC Voluntária Orientação: Profa. Dra. Maria José Bocorny Finatto PROJETO-MARCO

Leia mais

Hierarquias de conceitos extraídas automaticamente de corpus de domínio específico Um experimento sobre um corpus de Pediatria

Hierarquias de conceitos extraídas automaticamente de corpus de domínio específico Um experimento sobre um corpus de Pediatria Hierarquias de conceitos extraídas automaticamente de corpus de domínio específico Um experimento sobre um corpus de Pediatria Lucelene Lopes, Renata Vieira, Daniel Martins Grupo Processamento de Linguagem

Leia mais

Uma avaliação de analisadores morfológicos do português

Uma avaliação de analisadores morfológicos do português Uma avaliação de analisadores morfológicos do português Jéssica O. de Souza, André C. Santiago, Katiuscia de M. Andrade, Mardônio J. C. de França, Hélio L. B. Silva, Ananda L. Freire, Leonel F. de Alencar,

Leia mais

Grupo de Processamento de Linguagem Natural do Instituto de Informática (PLN-II)

Grupo de Processamento de Linguagem Natural do Instituto de Informática (PLN-II) Integrantes Grupo de Processamento de Linguagem Natural do Instituto de Informática (PLN-II) Aline Villavicencio 1,2 1 Instituto de Informática, Universidade Federal do Rio Grande do Sul (Brasil) 2 Department

Leia mais

5 Metodologia e limitações de trabalho

5 Metodologia e limitações de trabalho 5 Metodologia e limitações de trabalho Para atender os objetivos de nossa investigação, será realizado um estudo baseado em corpus. O corpus utilizado é o NILC-São Carlos 1, que contém textos brasileiros

Leia mais

PLN e áreas correlatas

PLN e áreas correlatas Introdução ao Processamento de Línguas Naturais SCC5869 Tópicos em Processamento de Língua Natural Thiago A. S. Pardo PLN e áreas correlatas Limites entre PLN e outras áreas: como percebem isso? Recuperação

Leia mais

Estudo Semântico e Aplicação Computacional de Adjetivos do Português do Brasil

Estudo Semântico e Aplicação Computacional de Adjetivos do Português do Brasil Estudo Semântico e Aplicação Computacional de Adjetivos do Português do Brasil 1 Cláudia Dias de Barros 1 Programa de Pós-Graduação em Linguística Universidade Federal de São Carlos (UFSCar) Caixa Postal

Leia mais

DADOS DO COMPONENTE CURRICULAR

DADOS DO COMPONENTE CURRICULAR DADOS DO COMPONENTE CURRICULAR Nome: Inglês Instrumental Curso: Licenciatura em Ciências Biológicas Período: Optativa Carga Horária total: 50h Pré-requisito: não possui EMENTA Conscientização do processo

Leia mais

Anotação de corpus com a OpenWordNet-PT: um exercício de desambiguação

Anotação de corpus com a OpenWordNet-PT: um exercício de desambiguação Proceedings of Symposium in Information and Human Language Technology. Natal, RN, Brazil, November 4 7, 2015. c 2015 Sociedade Brasileira de Computação. Anotação de corpus com a OpenWordNet-PT: um exercício

Leia mais

Extração de Alvos em Comentários de Notícias em Português baseada na Teoria da Centralização

Extração de Alvos em Comentários de Notícias em Português baseada na Teoria da Centralização Proceedings of Symposium in Information and Human Language Technology. Natal, RN, Brazil, November 4 7, 2015. c 2015 Sociedade Brasileira de Computação. Extração de Alvos em Comentários de Notícias em

Leia mais

Fusão Automática de Sentenças Similares em Português

Fusão Automática de Sentenças Similares em Português Fusão Automática de Sentenças Similares em Português Eloize Rossi Marques Seno, Maria das Graças Volpe Nunes NILC ICMC Unisidade de São Paulo Caixa Postal 668 13560-970 São Carlos SP Brasil {eloize,gracan}@icmc.usp.br

Leia mais

Corpus e Anotação Semântica: um Experimento para a Língua Portuguesa a partir da Semântica de Frames

Corpus e Anotação Semântica: um Experimento para a Língua Portuguesa a partir da Semântica de Frames Corpus e Anotação Semântica: um Experimento para a Língua Portuguesa a partir da Semântica de Frames Rove Chishman rove@unisinos.br Lucas Lermen lucaslermen@gmail.com ABSTRACT This paper describes the

Leia mais

Modelagem Conceitual Orientada a Objetos. Classes e Tipos. Classe x Tipo x Instância...

Modelagem Conceitual Orientada a Objetos. Classes e Tipos. Classe x Tipo x Instância... Modelagem Conceitual Orientada a Objetos Fernanda Baião UNIRIO Material parcialmente extraído a partir das notas de aula de Maria Luiza M. Campos, Arnaldo Vieira e Maria Cláudia Cavalcanti 1 Classes e

Leia mais

Hierarquias de Conceitos para um Ambiente Virtual de Ensino Extraídas de um Corpus de Jornais Populares

Hierarquias de Conceitos para um Ambiente Virtual de Ensino Extraídas de um Corpus de Jornais Populares Hierarquias de Conceitos para um Ambiente Virtual de Ensino Extraídas de um Corpus de Jornais Populares Maria José Bocorny Finatto 1, Lucelene Lopes 2, Renata Vieira 2, Aline Evers 3 1,3 Programa de Pós-Graduação

Leia mais

Ferramenta de apoio a identificação de eventos utilizando Linguagem Natural. Aluno: Ricardo Tomelin Orientador: Everaldo Artur Grahl

Ferramenta de apoio a identificação de eventos utilizando Linguagem Natural. Aluno: Ricardo Tomelin Orientador: Everaldo Artur Grahl Ferramenta de apoio a identificação de eventos utilizando Linguagem Natural Aluno: Ricardo Tomelin Orientador: Everaldo Artur Grahl Roteiro 1. Introdução 2. Objetivos 3. Análise Essencial de Sistemas 4.

Leia mais

Guião 1 Anexo (v1.0) 2. Do léxico à frase 2.1. Classes de palavras e critérios para a sua identificação

Guião 1 Anexo (v1.0) 2. Do léxico à frase 2.1. Classes de palavras e critérios para a sua identificação F a c u l d a d e d e L e t r a s d a U n i v e r s i d a d e d e L i s b o a D e p a r t a m e n t o d e L i n g u í s t i c a G e r a l e R o m â n i c a E s t r u t u r a d a s F r a s e s e m P o r

Leia mais

Análise Sintática de Frases utilizando Gramáticas Livres de Contexto Probabilísticas

Análise Sintática de Frases utilizando Gramáticas Livres de Contexto Probabilísticas Universidade de São Paulo Mestrado em Ciência da Computação Instituto de Matemática e Estatística Disciplina MAC5725 Lingüística Computacional Análise Sintática de Frases utilizando Gramáticas Livres de

Leia mais

Alinhamento Sentencial e Lexical de Córpus Paralelos: Recursos para a Tradução Automática

Alinhamento Sentencial e Lexical de Córpus Paralelos: Recursos para a Tradução Automática Alinhamento Sentencial e Lexical de Córpus Paralelos: Recursos para a Tradução Automática Helena de Medeiros Caseli 1, Maria das Graças Volpe Nunes 1 1 Núcleo Interinstitucional de Lingüística Computacional

Leia mais

Técnicas de Identificação

Técnicas de Identificação Técnicas de Identificação Várias técnicas (de uso não exclusivo) são usadas para identificar classes: 1. Categorias de Conceitos 2. Análise Textual de Abbott (Abbot Textual Analysis) 3. Análise de Casos

Leia mais

Obtendo Interoperabilidade Semântica em Sistemas. Metamorphosis

Obtendo Interoperabilidade Semântica em Sistemas. Metamorphosis Obtendo Interoperabilidade Semântica em Sistemas Heterogéneos de Informação com Metamorphosis Giovani R. Librelotto José Carlos Ramalho Pedro R. Henriques Departamento de Informática Universidade do Minho

Leia mais

JWN-Br Uma API Java para a WordNet.Br

JWN-Br Uma API Java para a WordNet.Br JWN-Br Uma API Java para a WordNet.Br Vitor Machado Oliveira 1, Norton Trevisan Roman 1 1 Escola de Artes, Ciências e Humanidades Universidade de São Paulo (USP) São Paulo, SP Brazil {vitor.machado.oliveira,norton}@usp.br

Leia mais

Construções finais recorrentes em textos de Pediatria e de Econometria

Construções finais recorrentes em textos de Pediatria e de Econometria Construções finais recorrentes em textos de Pediatria e de Econometria Larissa B. Ramos Voluntária IC PROPESQ UFRGS Orientadora: Profa. Dra. Maria José Bocorny Finatto - CNPq Colaborador: Gilson Mattos

Leia mais

Termos livres retirados do texto representam o conteúdo do documento.

Termos livres retirados do texto representam o conteúdo do documento. Palavras-chave Termos livres retirados do texto representam o conteúdo do documento. Um bom critério para selecionar as palavras-chaves são os Vocabulários Controlados Termos organizados, segundo um método,

Leia mais

Novo dicionário de formas flexionadas do Unitex-PB: Avaliação da flexão verbal

Novo dicionário de formas flexionadas do Unitex-PB: Avaliação da flexão verbal Novo dicionário de formas flexionadas do Unitex-PB: Avaliação da flexão verbal Oto Araujo Vale Jorge Baptista otovale@ufscar.br jbaptist@ualg.pt Plano Unitex Unitex-PB Adaptação à nova ortografia: revisão

Leia mais

Descrição de um Protótipo de Realização Superficial do Português

Descrição de um Protótipo de Realização Superficial do Português Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP Descrição de um Protótipo de Realização Superficial do Português Mauricio José Carvalho

Leia mais

DESCRIÇÃO DAS COMBINATÓRIAS LÉXICAS ESPECIALIZADAS DA GESTÃO AMBIENTAL EM LÍNGUA ESPANHOLA

DESCRIÇÃO DAS COMBINATÓRIAS LÉXICAS ESPECIALIZADAS DA GESTÃO AMBIENTAL EM LÍNGUA ESPANHOLA DESCRIÇÃO DAS COMBINATÓRIAS LÉXICAS ESPECIALIZADAS DA GESTÃO AMBIENTAL EM LÍNGUA ESPANHOLA Carolina dos Santos Carboni (PIBIC/CNPq) carolsc33@hotmail.com Orientadora: Profa. Dra. Cleci Regina Bevilacqua

Leia mais

Aula 11 Desenvolvimento da linguagem: emergência da sintaxe (parte 2)

Aula 11 Desenvolvimento da linguagem: emergência da sintaxe (parte 2) Aula 11 Desenvolvimento da linguagem: emergência da sintaxe (parte 2) Pablo Faria HL422A Linguagem e Pensamento: teoria e prática Módulo 1: Aquisição da Linguagem IEL/UNICAMP 5 de outubro de 2016 SUMÁRIO

Leia mais

APLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA.

APLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA. APLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA.NET Heloína Alves Arnaldo (bolsista do PIBIC/UFPI), Vinicius Ponte

Leia mais

Sistema de recomendação de segundo nível para suporte à produção de matérias jornalísticas

Sistema de recomendação de segundo nível para suporte à produção de matérias jornalísticas Demetrius Costa Rapello Sistema de recomendação de segundo nível para suporte à produção de matérias jornalísticas Dissertação de mestrado Dissertação apresentada como requisito parcial para a obtenção

Leia mais

JADEX: A BDI REASONING ENGINE. Alexander Pokahr, Lars Braubach e Winfried Lamersdorf Springer US - Multi-Agent Programming 2005 pp.

JADEX: A BDI REASONING ENGINE. Alexander Pokahr, Lars Braubach e Winfried Lamersdorf Springer US - Multi-Agent Programming 2005 pp. JADEX: A BDI REASONING ENGINE Alexander Pokahr, Lars Braubach e Winfried Lamersdorf Springer US - Multi-Agent Programming 2005 pp. 149-174 Volume 15 Motivação Existem muitas plataformas para desenvolvimento

Leia mais

Os tipos de anotações, a codificação, e as interfaces do Projeto Lácio-Web: Quão longe estamos dos padrões internacionais para córpus?

Os tipos de anotações, a codificação, e as interfaces do Projeto Lácio-Web: Quão longe estamos dos padrões internacionais para córpus? Os tipos de anotações, a codificação, e as interfaces do Projeto Lácio-Web: Quão longe estamos dos padrões internacionais para córpus? Sandra Maria Aluísio 1,2, Leandro H. M. de Oliveira 1, Gisele Montilha

Leia mais

Inteligência Artificial. Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional

Inteligência Artificial. Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional Inteligência Artificial Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional OBJETIVOS : Introduzir o estudo Processamento de Linguagem Natural. Histórico O processamento de linguagem natural, nasceu

Leia mais

Pronome relativo A língua portuguesa apresenta 7 formas de pronomes e advérbios relativos consensuais: Que O que Quem O qual Onde Quanto Cujo

Pronome relativo A língua portuguesa apresenta 7 formas de pronomes e advérbios relativos consensuais: Que O que Quem O qual Onde Quanto Cujo Orações Subordinadas Relativas / Adjectivas (Bibliografia: Peres, J. e Móia, T., (1995), Áreas Críticas da Língua Portuguesa, Editorial Caminho, Lisboa) Não são argumentos de um predicador (ou seja, não

Leia mais

Brasil no domínio do e-commerce

Brasil no domínio do e-commerce Extração de relações semânticas de textos em português do Brasil no domínio do e-commerce Leonardo Henrique Tozzatto Volpe 1,2, Helena de Medeiros Caseli 1 1 Departamento de Computação Universidade Federal

Leia mais

ESPANHOL INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA. Prova º Ciclo do Ensino Básico AGRUPAMENTO DE ESCOLAS VERGÍLIO FERREIRA

ESPANHOL INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA. Prova º Ciclo do Ensino Básico AGRUPAMENTO DE ESCOLAS VERGÍLIO FERREIRA AGRUPAMENTO DE ESCOLAS VERGÍLIO FERREIRA INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA ESPANHOL Prova 15 2014 Tipo de prova: Escrita / Oral 1ª e 2ª Fases 3º Ciclo do Ensino Básico O presente documento

Leia mais

A importância dos recursos lexicais para o processamento automático do português 1

A importância dos recursos lexicais para o processamento automático do português 1 A importância dos recursos lexicais para o processamento automático do português 1 (The importance of lexical resources for automatic processing of Portuguese) Magali Sanches Duran 1 1 Núcleo Interinstitucional

Leia mais

Introdução a UML (Unified Modeling Language)

Introdução a UML (Unified Modeling Language) Introdução a UML (Unified Modeling Language) O que é a UML? Linguagem Gráfica de Modelagem para: Visualizar Especificar Construir Documentar Comunicar Artefatos de sistemas complexos Linguagem: vocabulário

Leia mais

Paradigmas de Representação de Conhecimento

Paradigmas de Representação de Conhecimento Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Paradigmas de Representação de Conhecimento Inteligência Artificial Site: http://jeiks.net E-mail:

Leia mais

INGLÊS Nível de Continuação (Prova Escrita e Prova Oral) Maio 2014

INGLÊS Nível de Continuação (Prova Escrita e Prova Oral) Maio 2014 INFORMAÇÃO-PROVA DE EQUIVALÊNCIA À FREQUÊNCIA INGLÊS Nível de Continuação (Prova Escrita e Prova Oral) Maio 2014 Prova 358 2014 ---------------------------------------------------------------------------------------------------------------------------

Leia mais

UNIVERSIDADE FEDERAL DE UBERLÂNDIA UFU

UNIVERSIDADE FEDERAL DE UBERLÂNDIA UFU UNIVERSIDADE FEDERAL DE UBERLÂNDIA UFU PLANO DE TRABALHO EM INICIAÇÃO CIENTÍFICA Desenvolvimento e aplicação de um modelo gravitacional simplificado para análise de texturas coloridas. Uberlândia 30/04/2014

Leia mais

Contributo para o processamento computacional do português: o CRdLP

Contributo para o processamento computacional do português: o CRdLP Contributo para o processamento computacional do português: o CRdLP Pedro Veiga e Diana Santos O carácter cada vez mais importante que as tecnologias da informação e da comunicação desempenham no nosso

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Pré-processamento de documentos Organização e Recuperação de Informação(GSI521) Introdução O pré-processamento de

Leia mais

INTERFACE DE ACESSO AO TEP 2.0 THESAURUS PARA O PORTUGUÊS DO BRASIL

INTERFACE DE ACESSO AO TEP 2.0 THESAURUS PARA O PORTUGUÊS DO BRASIL Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP INTERFACE DE ACESSO AO TEP 2.0 THESAURUS PARA O PORTUGUÊS DO BRASIL Erick Galani Maziero

Leia mais

Terminol Alemã. de Especificidade. Subprojeto

Terminol Alemã. de Especificidade. Subprojeto Termos Compostos como Fator de Especificidade Terminol erminológica da Língua Alemã Bolsista de Iniciação Científica: Carlos Henrique Besen (PIBIC-CNPq/UFRGS, Bacharelando em Filosofia UFRGS) Co-autora:

Leia mais

Análise Estruturada. Modelagem de Software Prof. Flávio de Oliveira Silva, Ph.D.

Análise Estruturada. Modelagem de Software Prof. Flávio de Oliveira Silva, Ph.D. Análise Estruturada Análise estruturada Proposta a partir de 1975 por vários autores (Constantine, Tom DeMarco, Yourdon, Gane & Sarson) Caiu em desuso com os modelos orientados a objetos Entretanto...

Leia mais

Curso de Línguas e Humanidades

Curso de Línguas e Humanidades ESCOLA SECUNDÁRIA MANUEL TEIXEIRA GOMES Departamento de Línguas [Românicas e Clássicas] Docente: Luís Pinto Salema Prova Escrita de Latim A 11.º Ano de Escolaridade Curso de Línguas e Humanidades Informação

Leia mais

Ensino Secundário (Decreto-Lei n.º 139/2012, de 5 de julho)

Ensino Secundário (Decreto-Lei n.º 139/2012, de 5 de julho) INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA Inglês Maio de 2015 Prova 358 12º Ano (continuação) Escrita e Oral Ensino Secundário (Decreto-Lei n.º 139/2012, de 5 de julho) 1. Introdução O presente documento

Leia mais

GUIA PARA ANOTAÇÃO LINGUÍSTICA USANDO A FERRAMENTA SALTO

GUIA PARA ANOTAÇÃO LINGUÍSTICA USANDO A FERRAMENTA SALTO GUIA PARA ANOTAÇÃO LINGUÍSTICA USANDO A FERRAMENTA SALTO Por: Magali Sanches Duran Organizei este guia sob a forma de perguntas e respostas a fim de apoiar o minicurso "Anotação Semântica na prática: apresentação

Leia mais

Capítulo1. Capítulo2. Índice A LÍNGUA E A LINGUAGEM O PORTUGUÊS: uma língua, muitas variedades... 15

Capítulo1. Capítulo2. Índice A LÍNGUA E A LINGUAGEM O PORTUGUÊS: uma língua, muitas variedades... 15 Capítulo1 Capítulo2 A LÍNGUA E A LINGUAGEM............................................. 9 Linguagem: aptidão inata.............................................. 10 Funções.............................................................

Leia mais

Inglês Ensino Secundário (Decreto-Lei n.º 139/2012, de 5 de Julho) 1. INTRODUÇÃO

Inglês Ensino Secundário (Decreto-Lei n.º 139/2012, de 5 de Julho) 1. INTRODUÇÃO INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA Inglês 2017 Prova 367 Ensino Secundário (Decreto-Lei n.º 139/2012, de 5 de Julho) 1. INTRODUÇÃO O presente documento divulga informação relativa à Prova de

Leia mais

BIREME/OPAS/OMS Comitê Assessor Nacional do Convênio de Manutenção da BIREME I Reunião do ano 2004, BIREME, São Paulo, 06 de agosto de 2004

BIREME/OPAS/OMS Comitê Assessor Nacional do Convênio de Manutenção da BIREME I Reunião do ano 2004, BIREME, São Paulo, 06 de agosto de 2004 BIREME/OPAS/OMS Comitê Assessor Nacional do Convênio de Manutenção da BIREME I Reunião do ano 2004, BIREME, São Paulo, 06 de agosto de 2004 Anexo 2 Biblioteca Virtual em Saúde e o controle bibliográfico

Leia mais

847- ESPANHOL (NÍVEL- CONTINUAÇÃO 10.º/ 11.º ANO)

847- ESPANHOL (NÍVEL- CONTINUAÇÃO 10.º/ 11.º ANO) 847- ESPANHOL (NÍVEL- CONTINUAÇÃO 10.º/ 11.º ANO) FORMAÇÃO ESPECÍFICA 1ª/2ª FASE 1.INTRODUÇÃO O presente documento visa divulgar as características do Exame de Espanhol a nível de escola a realizar em

Leia mais

Prof. Daniela Barreiro Claro

Prof. Daniela Barreiro Claro O volume de dados está crescendo sem parar Gigabytes, Petabytes, etc. Dificuldade na descoberta do conhecimento Dados disponíveis x Análise dos Dados Dados disponíveis Analisar e compreender os dados 2

Leia mais

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA Inglês LE I (2 anos) 2016

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA Inglês LE I (2 anos) 2016 INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA Inglês LE I (2 anos) 2016 Prova 06 --------------------------------------------------------------------------------------------------------------------------

Leia mais

Objectivos / Competências Conteúdos Descrição dos Domínios de referência: Unidades temáticas

Objectivos / Competências Conteúdos Descrição dos Domínios de referência: Unidades temáticas MATRIZ DA PROVA DE EXAME A NÍVEL DE ESCOLA AO ABRIGO DO DECRETO-LEI Nº 357/07, DE 29 DE OUTUBRO ESPANHOL NÍVEL DE INICIAÇÃO 10º ANO (Cursos Científicos- Humanísticos Decreto Lei nº 74/04, de 26 de Março)

Leia mais

EXPLORANDO PERFIS VERBAIS EM TEXTOS DE PEDIATRIA: CONTRAPONTOS COM A LINGUAGEM DA QUÍMICA E A LINGUAGEM JORNALÍSTICA

EXPLORANDO PERFIS VERBAIS EM TEXTOS DE PEDIATRIA: CONTRAPONTOS COM A LINGUAGEM DA QUÍMICA E A LINGUAGEM JORNALÍSTICA EXPLORANDO PERFIS VERBAIS EM TEXTOS DE PEDIATRIA: CONTRAPONTOS COM A LINGUAGEM DA QUÍMICA E A LINGUAGEM JORNALÍSTICA Larissa B. Ramos IC CNPq Susana de Azeredo Gonçalves Aluna Especial PPG Letras Maria

Leia mais

METÁFORA: ANALISANDO COMO A METAFORA É PRATICADA EM SALA DE AULA E COMO PODERIA SER TRABALHADA EM SALA DE AULA. COMPREENDENDO TEORIAS.

METÁFORA: ANALISANDO COMO A METAFORA É PRATICADA EM SALA DE AULA E COMO PODERIA SER TRABALHADA EM SALA DE AULA. COMPREENDENDO TEORIAS. METÁFORA: ANALISANDO COMO A METAFORA É PRATICADA EM SALA DE AULA E COMO PODERIA SER TRABALHADA EM SALA DE AULA. COMPREENDENDO TEORIAS. Nome dos autores: Leane da Silva Ferreira, Dieysa Kanyela Fossile.

Leia mais

Extração de Conhecimento & Mineração de Dados

Extração de Conhecimento & Mineração de Dados Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática

Leia mais

MATERIAL DE DIVULGAÇÃO DA EDITORA MODERNA

MATERIAL DE DIVULGAÇÃO DA EDITORA MODERNA MATERIAL DE DIVULGAÇÃO DA EDITORA MODERNA Professor, nós, da Editora Moderna, temos como propósito uma educação de qualidade, que respeita as particularidades de todo o país. Desta maneira, o apoio ao

Leia mais

Domínios Especializados

Domínios Especializados Extração de Vocabulário Multilíngue para Tradução em Domínios Especializados Lucas Welter Hilgert, Renata Vieira Faculdade de Informática (FACIN) Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)

Leia mais

Informação - Prova de Equivalência à Frequência. Espanhol Prova 15 / Ciclo do Ensino Básico

Informação - Prova de Equivalência à Frequência. Espanhol Prova 15 / Ciclo do Ensino Básico AGRUPAMENTO DE ESCOLAS VIEIRA DE ARAÚJO ESCOLA EB/S VIEIRA DE ARAÚJO VIEIRA DO MINHO Espanhol Prova 15 / 2015 3 Ciclo do Ensino Básico INTRODUÇÃO O presente documento dá a conhecer os seguintes aspetos

Leia mais

7 Referências bibliográficas

7 Referências bibliográficas 7 Referências bibliográficas ABREU, A. S. A Arte de Argumentar: gerenciando razão e emoção. Cotia: Ateliê Editorial, 2009. AMARANTE, R. C. Heróis de Papel: a imagem do jornalista em notícias de guerra

Leia mais

AGRUPAMENTO de ESCOLAS Nº1 de SANTIAGO do CACÉM Ano Letivo 2013/2014

AGRUPAMENTO de ESCOLAS Nº1 de SANTIAGO do CACÉM Ano Letivo 2013/2014 AGRUPAMENTO de ESCOLAS Nº1 de SANTIAGO do CACÉM Ano Letivo 2013/2014 3º CICLO LÍNGUA PORTUGUESA CEF - INSTALAÇÃO E OPERAÇÃO DE SISTEMAS INFORMÁTICOS 1º ANO PLANIFICAÇÃO ANUAL Documento(s) Orientador(es):

Leia mais

INFORMAÇÃO DE EXAME A NÍVEL DE ESCOLA EQUIVALENTE A NACIONAL Secundário - 1.ª e 2.ª FASES CÓDIGO: 847

INFORMAÇÃO DE EXAME A NÍVEL DE ESCOLA EQUIVALENTE A NACIONAL Secundário - 1.ª e 2.ª FASES CÓDIGO: 847 2015/2016 ANO DE ESCOLARIDADE: 11.º ANO DURAÇÃO DO EXAME: 120 minutos TOLERÂNCIA: 30 minutos INFORMAÇÃO DE EXAME A NÍVEL DE ESCOLA EQUIVALENTE A NACIONAL Secundário - 1.ª e 2.ª FASES CÓDIGO: 847 DISCIPLINA:

Leia mais

INFORMAÇÃO DE PROVA EQUIVALENTE A EXAME NACIONAL

INFORMAÇÃO DE PROVA EQUIVALENTE A EXAME NACIONAL INFORMAÇÃO DE PROVA EQUIVALENTE A EXAME NACIONAL Espanhol Continuação (Bienal)- Prova Escrita Prova 847 2016 Duração da Prova: 120 minutos. Tolerância: 30 minutos 11º Ano de Escolaridade (Decreto-lei nº

Leia mais

Arquitecturas de Software Enunciado de Projecto 2007 2008

Arquitecturas de Software Enunciado de Projecto 2007 2008 UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR TÉCNICO Arquitecturas de Software Enunciado de Projecto 2007 2008 1 Introdução Na primeira metade da década de 90 começaram a ser desenvolvidas as primeiras

Leia mais

P R O G R A M A. IV Unidade Prática de textos: Textos de autores portugueses e brasileiros dos séculos XIX e XX

P R O G R A M A. IV Unidade Prática de textos: Textos de autores portugueses e brasileiros dos séculos XIX e XX PERÍODO: 76.1 / 77.2 I Unidade Estrutura e formação dos vocábulos 1.1 Estruturas mórficas 1.2 - Formação do léxico português 1.3 - Processos de formação de palavras II Unidade Funções sintáticas dos termos

Leia mais

INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO RIO GRANDE DO NORTE CAMPUS JOÃO CÂMARA UML UNIFIED MODELING LANGUAGE

INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO RIO GRANDE DO NORTE CAMPUS JOÃO CÂMARA UML UNIFIED MODELING LANGUAGE 1 INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO RIO GRANDE DO NORTE CAMPUS JOÃO CÂMARA UML UNIFIED MODELING LANGUAGE Nickerson Fonseca Ferreira nickerson.ferreira@ifrn.edu.br O que é?? 2 A UML

Leia mais

Apresentação 11 Lista de abreviações 13. Parte I: NATUREZA, ESTRUTURA E FUNCIONAMENTO DA LINGUAGEM

Apresentação 11 Lista de abreviações 13. Parte I: NATUREZA, ESTRUTURA E FUNCIONAMENTO DA LINGUAGEM Sumário Apresentação 11 Lista de abreviações 13 Parte I: NATUREZA, ESTRUTURA E FUNCIONAMENTO DA LINGUAGEM O homem, a linguagem e o conhecimento ( 1-6) O processo da comunicação humana ( 7-11) Funções da

Leia mais

Desambiguação Lexical de Sentido com uso de Informação Multidocumento por meio de Redes de Co-ocorrência

Desambiguação Lexical de Sentido com uso de Informação Multidocumento por meio de Redes de Co-ocorrência Desambiguação Lexical de Sentido com uso de Informação Multidocumento por meio de Redes de Co-ocorrência Fernando Antônio A. Nóbrega, Thiago A. Salgueiro Pardo Núcleo Interinstitucional de Linguística

Leia mais

Linguagens de Domínio Específico

Linguagens de Domínio Específico Linguagens de Domínio Específico Fabio Mascarenhas 2016.1 http://www.dcc.ufrj.br/~fabiom/dsl Processamento de uma DSL Erros Uma falha em um parser de combinadores tem dois significados: A alternativa que

Leia mais

EM BUSCA DE EMOÇÃO EM AMBIENTES VIRTUAIS DE APRENDIZAGEM * 1

EM BUSCA DE EMOÇÃO EM AMBIENTES VIRTUAIS DE APRENDIZAGEM * 1 EM BUSCA DE EMOÇÃO EM AMBIENTES VIRTUAIS DE APRENDIZAGEM * 1 Isa Mara da Rosa Alves Sandro José Rigo Francini Scipioni Belau Mary Angela Henz RESUMO: Neste trabalho, apresentam-se os resultados iniciais

Leia mais

Perspectivas para Busca Semântica para Comunicação Alternativa: o caso SCALA. João Carlos Gluz Universidade do Vale do Rio dos Sinos (UNISINOS)

Perspectivas para Busca Semântica para Comunicação Alternativa: o caso SCALA. João Carlos Gluz Universidade do Vale do Rio dos Sinos (UNISINOS) Eixo 3:. Research and Development to inform the field of AAC. Área C : AAC action research Área D: Development in AAC Perspectivas para Busca Semântica para Comunicação Alternativa: o caso SCALA João Carlos

Leia mais

Informação - Prova de Equivalência à Frequência de. Inglês

Informação - Prova de Equivalência à Frequência de. Inglês Informação - Prova de Equivalência à Frequência de Inglês Ano Letivo 2016 / 2017 Código da Prova: 367 Ensino Secundário Tipo de Prova: Escrita e Oral 1. Objeto de avaliação A prova de exame tem por referência

Leia mais

PROCESSAMENTO DE LINGUAGEM NATURAL (PLN): FERRAMENTAS E DESAFIOS

PROCESSAMENTO DE LINGUAGEM NATURAL (PLN): FERRAMENTAS E DESAFIOS PROCESSAMENTO DE LINGUAGEM NATURAL (PLN): FERRAMENTAS E DESAFIOS Lucas Matheus Santos Andrade, Rafael Couto Barros, Marcelo Anderson Batista dos Santos Instituto Federal de Educação, Ciência e Tecnologia

Leia mais

Desenvolvimento da Pesquisa

Desenvolvimento da Pesquisa Desenvolvimento da Pesquisa Ricardo de Almeida Falbo Metodologia de Pesquisa Departamento de Informática Universidade Federal do Espírito Santo Agenda Modelo de Processo de Pesquisa Estratégias de Pesquisa

Leia mais

Processo de Admissão de Novos Estudantes Conteúdos programáticos para candidatos que ingressarão no. 3º ano do Ensino Médio MATEMÁTICA

Processo de Admissão de Novos Estudantes Conteúdos programáticos para candidatos que ingressarão no. 3º ano do Ensino Médio MATEMÁTICA Processo de Admissão de Novos Estudantes 2017 Conteúdos programáticos para candidatos que ingressarão no 3º ano do Ensino Médio MATEMÁTICA HABILIDADES CONTEÚDOS Identificar padrões numéricos ou princípios

Leia mais

ABORDAGEM PARA ANÁLISES DE REDES SOCIAIS

ABORDAGEM PARA ANÁLISES DE REDES SOCIAIS ABORDAGEM PARA ANÁLISES DE REDES SOCIAIS Aluno: MAICON DOS SANTOS TEODORO RAMOS Colaboradores: Orientador: MIGUEL GABRIEL PRAZERES DE CARVALHO Curso / Instituição de Ensino Superior: ANÁLISE E DESENVOLVIMENTO

Leia mais

3 Estudos sobre a nominalização na Língua Portuguesa

3 Estudos sobre a nominalização na Língua Portuguesa 3 Estudos sobre a nominalização na Língua Portuguesa O estudo das nominalizações na língua portuguesa é desenvolvido por vários autores, tais como Basilio (1980, 1987, 2004), Gunzburger (1979), Oliveira

Leia mais

Orientações sobre a Estrutura da Avaliação da Aprendizagem em Processo Língua Portuguesa

Orientações sobre a Estrutura da Avaliação da Aprendizagem em Processo Língua Portuguesa Orientações sobre a Estrutura da Avaliação da Aprendizagem em Processo Língua Portuguesa A Avaliação da Aprendizagem em Processo - AAP, em sua 15ª edição, tem o intuito de apoiar o trabalho do professor

Leia mais

Buscador Online do CINTIL-Treebank Patricia Nunes Gonçalves, António Branco

Buscador Online do CINTIL-Treebank Patricia Nunes Gonçalves, António Branco Buscador Online do CINTIL-Treebank Patricia Nunes Gonçalves, António Branco Faculdade de Ciências da Universidade de Lisboa Abstract This paper describes the CINTIL-Treebank Online Searcher, a freely available

Leia mais

COMO ESCREVER UM MANUAL DE INSTRUÇÕES CONFORME A NR 12:

COMO ESCREVER UM MANUAL DE INSTRUÇÕES CONFORME A NR 12: COMO ESCREVER UM MANUAL DE INSTRUÇÕES CONFORME A NR 12: Com a publicação do texto revisado da Norma Regulamentadora 12, em Dezembro de 2010 pela Portaria SIT 197 do Ministério do Trabalho e Emprego, surgiram

Leia mais

1. Introdução. Prova de Equivalência à Frequência de: 3.º Ciclo do Ensino Básico. Informação n.º 01 /2014. Prova 16 / 2014.

1. Introdução. Prova de Equivalência à Frequência de: 3.º Ciclo do Ensino Básico. Informação n.º 01 /2014. Prova 16 / 2014. AGRUPAMENTO DE ESCOLAS DE MEM MARTINS Sede: ES de Mem Martins EB23 Maria Alberta Menéres; EB1 de Mem Martins n.º 2; EB1 com JI da Serra das Minas n.º 1 Informação n.º 01 /2014 Prova 16 / 2014 Prova de

Leia mais