Avaliação da inteligibilidade de textos para o público infantil: adaptação das métricas do Coh-Metrix para o Português

Tamanho: px
Começar a partir da página:

Download "Avaliação da inteligibilidade de textos para o público infantil: adaptação das métricas do Coh-Metrix para o Português"

Transcrição

1 Avaliação da inteligibilidade de textos para o público infantil: adaptação das métricas do Coh-Metrix para o Português Carolina Evaristo Scarton Núcleo Interinstitucional de Linguística Computacional (NILC) Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo (USP) Caixa Postal São Carlos SP Brazil carolina@grad.icmc.usp.br Abstract. This article presents the first version of the tool Coh-Metrix-PORT, which aims to adapt the metrics of the tool Coh-Metrix to Brazilian Portuguese. The article describes the motivation for creating this tool, the implementation of decisions taken and the Natural Language Processing (NLP) resources needed. An example of the use of the tool is also presented to show the usefulness of the tool in assessing the readability of texts. Resumo. Este artigo apresenta a primeira versão da ferramenta Coh-Metrix- PORT, que visa à adaptação de métricas da ferramenta Coh-Metrix para o português do Brasil. Descrevemos a motivação para a criação dessa ferramenta, as decisões de implementação tomadas e os recursos de Processamento de Língua Natural (PLN) necessários. Um exemplo do uso da ferramenta também é apresentado, visando mostrar a utilidade da ferramenta na avaliação da inteligibilidade de textos. 1. Introdução No processo de compreensão de um texto, o texto, o leitor e as circunstâncias em que se dá o encontro são fatores importantes (Leffa, 1996). Entre os fatores relativos ao texto, destacam-se, tradicionalmente, a legibilidade (apresentação gráfica do texto) e a inteligibilidade (uso de palavras freqüentes e estruturas sintáticas menos complexas). Atualmente, há também uma preocupação com a macroestrutura do texto, em que outros fatores são visto como facilitadores da compreensão como a organização do texto, coesão, coerência, o conceito do texto sensível ao leitor. Este último apresenta características que podem facilitar a compreensão como proximidade na anáfora e o uso de marcadores discursivos entre as orações. Segundo DuBay (2004), até 1980 já existiam por volta de 200 fórmulas superficiais de inteligibilidade, para a língua inglesa. A fórmula mais divulgada no Brasil é o Flesch Reading Ease, pois se encontra adaptada para o português no processador de texto MSWord (Martins et al, 1996). Essas métricas são consideradas superficiais, pois não conseguem capturar a coesão e dificuldade de um texto (McNamara et al, 2002) nem avaliar mais profundamente as razões e correlações de fatores que tornam um texto difícil de ser entendido. A ferramenta Coh-Metrix 1 (McNamara et al, 2002; Graesser et al, 2004; Crossley et al., 2007) foi desenvolvida com a finalidade de capturar a coesão e a dificuldade de um texto (em inglês), usando vários níveis de análise lingüística: léxico, sintático, discursivo e conceitual. A autora recebe apoio FAPESP para o desenvolvimento deste projeto de pesquisa. 1

2 O foco deste artigo (que também é o foco do projeto de Iniciação Científica) é a adaptação de algumas métricas do Coh-Metrix para o português. Além disso, pretendemos responder as seguintes questões: como o uso de métricas que avaliam a inteligibilidade de textos pode auxiliar na adequação de um texto para um determinado público alvo? Particularmente, quais métricas auxiliam na adaptação de textos para o público infantil e juvenil? Estas respostas serão dadas via análise de dois córpus com textos em português para o público infantil. Este trabalho faz parte de um projeto maior que envolve a Simplificação Textual do Português para Inclusão e Acessibilidade Digital o PorSimples (Aluísio et al., 2008). Na seção 2, apresentamos a ferramenta Coh-Metrix e as ferramentas e recursos de PLN utilizados por ela. A seção 3 contém nossas decisões de projeto e um exemplo de um texto analisado com as métricas já adaptadas. 2. A ferramenta Coh-Metrix A versão livre da ferramenta (Coh-Metrix 2.0) conta com 60 índices de inteligibilidade que vão desde métricas simples (como contagem de palavras) até medidas mais complexas envolvendo algoritmos de resolução anafórica. Nosso trabalho é baseado nesta versão (a versão completa do Coh-Metrix possui cerca de 500 índices). Os índices da ferramenta estão divididos em seis classes: Identificação Geral e Informação de Referência, Índices de Inteligibilidade, Palavras Gerais e Informação do Texto, Índices Sintáticos, Índices Referenciais e Semânticos e Dimensões do Modelo de Situações. A primeira classe contém as informações sobre o texto (título, gênero, fonte, entre outros). Na segunda estão os índices de inteligibilidade superficiais (índice Flesch). As demais classes contêm as métricas ainda não implementadas para o português que tem a finalidade de capturar a coerência e coesão de um texto. Para computar freqüências de palavras, o Coh-Metrix 2.0 utiliza o CELEX uma base de dados do Dutch Centre for Lexical Information, (Baayen et al, 1995). Para as métricas de concretude, utiliza o MRC Psycholinguistics Database (Coltheart, 1981) que possui palavras com 26 propriedades psicolinguísticas diferentes para essas palavras. O cálculo de hiperônimos é realizado utilizando a WordNet (Fellbaum, 1998). Para os índices sintáticos foi utilizado o parser sintático de Charniak (Charniak, 2000). Os conectivos foram identificados utilizando listas com os conectivos classificados em 2 eixos: i) positivos e negativos e ii) aditivos, causais, lógicos e temporais. Por fim, a Análise Semântica Latente (LSA) (Deerwester et al, 1990) foi utilizada para recuperar a relação entre documentos de texto e significado de palavras. 3. A ferramenta Coh-Metrix-Port Para a implementação da ferramenta adaptada à língua portuguesa do Brasil, selecionamos recursos de PLN disponíveis para o português, utilizando aqueles que apresentam as melhores precisões a um baixo custo. Infelizmente, nossos recursos são bem mais limitados do que os existentes para a língua inglesa. Escolhemos o tagger MXPOST (Ratnaparkhi, 1996) com o NILC tagset 2 para pré-processar o texto. Para a extração de sintagmas nominais, utilizamos a ferramenta 2

3 de Identificação de Sintagmas Nominais Reduzidos (Oliveira et al, 2006) e, neste caso, substituímos o tagset do MXPOST para o tagset do projeto Lácio-Web 3 (MacMorpho). Para calcular freqüências de palavras escolhemos a lista de frequências do córpus Banco do Português (BP) 4, compilada por Tony Sardinha da PUC-SP, com cerca de 700 milhões de tokens. A contagem de sílabas é feita utilizando o Separador Silábico desenvolvido no projeto ReGra (Nunes et al, 1999). Para as métricas que contam conectivos/marcadores, seguimos a classificação do Coh-Metrix: i) conectivos positivos ampliam eventos, enquanto que conectivos negativos param a ampliação de eventos; ii) os marcadores são também classificados de acordo com o tipo de coesão: aditivos, causais, lógicos ou temporais. Nossa lista de marcadores foi construída utilizando listas já compiladas por outros pesquisadores (Pardo e Nunes, 2004; Moura Neves, 2000) e que são utilizadas no projeto PorSimples 5, além da tradução alguns marcadores das listas em inglês. Os recursos que ainda estão sendo estudados são a WordNet.Br (Dias-da-Silva et al, 2008), sendo desenvolvida nos moldes da WordNet de Princeton 6 e a MultiWordNet 7 (Pianta et al., 2002). A primeira, ainda em construção, possui o alinhamento de verbos com a Wordnet.Pr (Fellbaum, 1998), porém ainda não possui relações de hiperonímia; já a segunda, possui relações de hiperonímia somente para substantivos. Decidimos implementar a ferramenta utilizando a linguagem Ruby e o Framework Rails, com o banco de dados MySQL. As duas tecnologias foram escolhidas com base no desempenho delas em projetos anteriores. Até o presente momento, já implementamos 30 métricas da versão livre. Na Tabela 1 apresentamos a análise de um texto retirado jornal Zero Hora 8, utilizando algumas das 30 métricas já adaptadas 9. Tabela 1 Análise de um texto utilizando algumas métricas do Coh-Metrix-Port 150 mil casas sem água hoje Com a manutenção preventiva que será realizada na Estação de Tratamento de Água Menino Deus, o Departamento Municipal de Água e Esgotos (Dmae) interromperá o fornecimento de 28% da Capital a partir das 7h de hoje. No total, medida atingirá cerca de 150 mil casas de mais de 30 bairros de Porto Alegre. O superintendente de Operações do Dmae, Valdir Flores, explica que o trabalho será para a revisão de equipamentos e troca de peças. O serviço ocorrerá independentemente das condições climáticas. A previsão é de que o abastecimento esteja normalizado até a madrugada de amanhã. Segundo o Dmae, o horário de retorno da água variará de acordo com a localização da casa. Contagens Básicas Número de Palavras: Número de Sentenças: 6.0 Número de Parágrafos: 4.0 Palavras por Sentenças: 19.0 Sentenças por Parágrafos: 1.5 Sílabas por Palavras de Conteúdo: Número de Verbos: 11.0 Número de Substantivos: 39.0 Número de Adjetivos: 4.0 Número de Advérbios: 3.0 Número de Pronomes: 2.0 Operadores Lógicos Número de E: 2.0 Número de OU: 0.0 Número de SE: Mais detalhes podem ser encontados em

4 Número de Negações: 0.0 Frequências Frequências: Mínimo Frequências: Pronomes, Type/Token Número de Pronomes Pessoais: 0.0 Pronomes por Sintagmas: Type/Token: Constituintes Sintagmas: Modificadores por Sintagmas: Palavras antes de verbos principais: Conclusões Esperamos conseguir, com este projeto, estabelecer diretrizes para a construção de textos mais inteligíveis. A validação será realizada com um córpus de textos adaptados para crianças de 7 a 11 anos da Seção Para seu Filho Ler do Jornal ZeroHora e com outro córpus de textos de divulgação científica para crianças da revista Ciência Hoje para Crianças 10, destinados a crianças de 12 a 15. Este projeto é um início de uma pesquisa para satisfazer uma carência muito grande na área de inteligibilidade para a língua portuguesa. Referências Sandra Maria Aluísio, Lucia Specia, Thiago Alexandre Salgueiro Pardo, Erick G. Maziero e Renata P. M. Fortes (2008). Towards Brazilian Portuguese Automatic Text Simplification Systems. Em Proceedings of The Eight ACM Symposium on Document Engineering (DocEng 2008), páginas , São Paulo, Brasil. Harald R. Baayen, Richard Piepenbrock e Leon Gulikers (1995). The CELEX lexical database (CD-ROM). Philadelphia: Linguistic Data Consortium, University of Pennsylvania. Eugene Charniak (2000). A Maximum-Entropy-Inspired Parser. Em Proceedings of NAACL'00, páginas , Seattle, Washington. Max Coltheart (1981). The MRC psycholinguistic database. Em Quartely Jounal of Experimental Psychology, 33A, páginas Scott A. Crossley, Max M. Louwerse, Philip M. McCarthy e Danielle S. McNamara (2007). A linguistic analysis of simplified and authentic texts. Em Modern Language Journal, 91, (2), páginas Scott Deerwester, Susan T. Dumais, George W. Furnas, Thomas K. Landauer e Richard Harshman (1990). Indexing By Latent Semantic Analysis. Em Journal of the American Society For Information Science, 41, páginas Bento Carlos Dias-da-Silva, Ariani Di Felippo e Maria das Graças Volpe Nunes (2008). The automatic mapping of Princeton WordNet lexicalconceptual relations onto the Brazilian Portuguese WordNet database. Em Proceedings of the 6th International Conference on Language Resources and Evaluation, Marrakech, Morocco. Willian H. DuBay (2004). The Principles of Readability. A brief introduction to readability research. 0/1b/bf/46.pdf 10

5 Christiane Fellbaum (1998). WordNet: An electronic lexical database. MIT Press, Cambridge, Massachusetts. Arthur C. Graesser, Danielle S. McNamara, Max M. Louwerse e Zhiqiang Cai (2004). Coh-Metrix: Analysis of text on cohesion and language. Em Behavioral Research Methods, Instruments, and Computers, 36, páginas Vilson José Leffa (1996) Fatores da compreensão na leitura. Em Cadernos no IL, v.15, n.15, páginas , Porto Alegre. < Acesso em julho de Teresa B. F. Martins, Claudete M. Ghiraldelo, Maria das Graças Volpe Nunes e Osvaldo Novais de Oliveira Junior (1996). Readability formulas applied to textbooks in brazilian portuguese. Notas do ICMC, N. 28, 11p. Danielle S. McNamara, Max M. Louwerse e Arthur C. Graesser (2002) Coh-Metrix: Automated cohesion and coherence scores to predict text readability and facilitate comprehension. Grant proposal. Disponível em: Maria Helena de Moura Neves (2000). Gramática de Usos do Português. Editora Unesp, 2000, 1040 p. Maria das Graças Volpe Nunes, Denise Campos e Silva Kuhn, Ana Raquel Marchi, Ana Cláudia Nascimento, Sandra Maria Aluísio e Osvaldo Novais de Oliveira Júnior (1999). Novos Rumos para o ReGra: extensão do revisor gramatical do português do Brasil para uma ferramenta de auxílio à escrita. Em Proceedings do IV Encontro para o Processamento Computacional da Língua Portuguesa Escrita e Falada, PROPOR'99, páginas Évora, Portugal. Cláudia Oliveira, Maria Cláudia Freitas, Violeta Quental, Cícero Nogueira dos Santos, Renato Paes Leme e Lucas Souza (2006). A Set of NP-extraction rules for Portuguese: defining and learning. Em 7th Workshop on Computational Processing of Written and Spoken Portuguese, Itatiaia. Thiago Alexandre Salgueiro Pardo e Maria das Graças Volpe Nunes (2004). Relações Retóricas e seus Marcadores Superficiais: Análise de um Corpus de Textos Científicos em Português do Brasil. Relatório Técnico NILC. Emanuele Pianta, Luisa Bentivogli e Christian Girardi (2002). MultiWordNet: developing an aligned multilingual database. Em Proceedings of the First International Conference on Global WordNet, páginas , Mysore, India. Adwait Ratnaparkhi (1996). A Maximum Entropy Part-of-Speech Tagger. Em Proceedings of the First Empirical Methods in Natural Language Processing Conference, páginas

Análise da Inteligibilidade de textos via ferramentas de Processamento de Língua Natural: adaptando as métricas do Coh-Metrix para o Português

Análise da Inteligibilidade de textos via ferramentas de Processamento de Língua Natural: adaptando as métricas do Coh-Metrix para o Português Análise da Inteligibilidade de textos via ferramentas de Processamento de Língua Natural: adaptando as métricas do Coh-Metrix para o Português Carolina Evaristo Scarton, Daniel Machado de Almeida, Sandra

Leia mais

AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E TEXTOS LITERÁRIOS. Bianca Pasqualini. Doutoranda PPGLet/UFRGS

AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E TEXTOS LITERÁRIOS. Bianca Pasqualini. Doutoranda PPGLet/UFRGS AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E TEXTOS LITERÁRIOS Bianca Pasqualini Doutoranda PPGLet/UFRGS Orientadora: Profa. Dra. Maria José B. Finatto PRIMEIRO ESTUDO: ANÁLISE DE ÍNDICES

Leia mais

Gêneros científicos e o processamento da leitura por alunos universitários

Gêneros científicos e o processamento da leitura por alunos universitários Gêneros científicos e o processamento da leitura por alunos universitários Aluna: Juliana da Silva Neto Orientadora: Erica dos Santos Rodrigues Introdução e objetivos O trabalho a ser relatado aqui se

Leia mais

Coesão e coerência no jornal Diário Gaúcho: um estudo exploratório

Coesão e coerência no jornal Diário Gaúcho: um estudo exploratório XXII Salão de Iniciação Científica UFRGS Coesão e coerência no jornal Diário Gaúcho: um estudo exploratório Ana Maria Sigas Pichini Graduanda Letras / Bacharelado Voluntária de IC PROPESQ UFRGS Profª Drª

Leia mais

Neste capítulo iremos examinar o corpus, os procedimentos e critérios de análise do trabalho que desenvolvemos.

Neste capítulo iremos examinar o corpus, os procedimentos e critérios de análise do trabalho que desenvolvemos. 5 Metodologia Neste capítulo iremos examinar o corpus, os procedimentos e critérios de análise do trabalho que desenvolvemos. 5.1 O corpus O corpus consiste de uma coleção intitulada Cadernos Didáticos

Leia mais

Índice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed

Índice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed Classificação de textos para o ensino de português como segunda língua Pedro Santos Curto Conclusões, Contribuições e Trabalho futuro 1 2 Motivação Aplicações e escala da classificação de textos Motivação

Leia mais

Avaliador Automático de Coesão Textual em Redação Dissertativa - AVAC

Avaliador Automático de Coesão Textual em Redação Dissertativa - AVAC Avaliador Automático de Coesão Textual em Redação Dissertativa - AVAC João Carlos Silva Nobre 1, Sérgio Roberto Matiello Pellegrino 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica

Leia mais

Recapitulando... Abordagens: PLN. Abordagens: PLN 29/03/2012. Introdução ao Processamento de Línguas Naturais. Distribuição de palavras

Recapitulando... Abordagens: PLN. Abordagens: PLN 29/03/2012. Introdução ao Processamento de Línguas Naturais. Distribuição de palavras Introdução ao Processamento de Línguas Naturais SCC5908 Introdução ao Processamento de Língua Natural Thiago A. S. Pardo Recapitulando... Abordagens superficiais vs. profundas Simbolismo vs. estatística

Leia mais

ANOTAÇÃO DE SENTIDOS DE VERBOS EM NOTÍCIAS JORNALÍSTICAS EM PORTUGUÊS DO BRASIL

ANOTAÇÃO DE SENTIDOS DE VERBOS EM NOTÍCIAS JORNALÍSTICAS EM PORTUGUÊS DO BRASIL ANOTAÇÃO DE SENTIDOS DE VERBOS EM NOTÍCIAS JORNALÍSTICAS EM PORTUGUÊS DO BRASIL 1 Marco A. Sobrevilla Cabezudo, 1 Erick G. Maziero, 2 Jackson W. C. Souza, 1 Márcio S. Dias, 1 Paula C. F. Cardoso, 1 Pedro

Leia mais

TeMário 2006: Estendendo o Córpus TeMário

TeMário 2006: Estendendo o Córpus TeMário Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP TeMário 2006: Estendendo o Córpus TeMário Erick Galani Maziero Vinícius Rodrigues de Uzêda

Leia mais

EDITOR DE ANOTAÇÃO DE SIMPLIFICAÇÃO: MANUAL DO USUÁRIO

EDITOR DE ANOTAÇÃO DE SIMPLIFICAÇÃO: MANUAL DO USUÁRIO Universidade de São Paulo USP Universidade Federal de São Carlos UFSCar Universidade Estadual Paulista UNESP EDITOR DE ANOTAÇÃO DE SIMPLIFICAÇÃO: MANUAL DO USUÁRIO Helena de Medeiros Caseli Tiago de Freitas

Leia mais

UMA FERRAMENTA PARA A PESQUISA EM CORPORA DE AQUISIÇÃO DE LINGUAGEM

UMA FERRAMENTA PARA A PESQUISA EM CORPORA DE AQUISIÇÃO DE LINGUAGEM UMA FERRAMENTA PARA A PESQUISA EM CORPORA DE AQUISIÇÃO DE LINGUAGEM 1. INTRODUÇÃO Corpora de linguagem dirigida a e produzida por crianças são recursos valiosos para estudos de aquisição da linguagem,

Leia mais

O código do modelo de mapeamento sintático-conceitual do sistema ConPor

O código do modelo de mapeamento sintático-conceitual do sistema ConPor Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP O código do modelo de mapeamento sintático-conceitual do sistema ConPor Lucia Specia Lucia

Leia mais

Estudo Semântico e Aplicação Computacional de Adjetivos do Português do Brasil

Estudo Semântico e Aplicação Computacional de Adjetivos do Português do Brasil Estudo Semântico e Aplicação Computacional de Adjetivos do Português do Brasil 1 Cláudia Dias de Barros 1 Programa de Pós-Graduação em Linguística Universidade Federal de São Carlos (UFSCar) Caixa Postal

Leia mais

Ontologias Linguísticas e Processamento de Linguagem Natural. Ygor Sousa CIn/UFPE

Ontologias Linguísticas e Processamento de Linguagem Natural. Ygor Sousa CIn/UFPE Ontologias Linguísticas e Processamento de Linguagem Natural Ygor Sousa CIn/UFPE ycns@cin.ufpe.br 2015 Roteiro Processamento de Linguagem Natural Ontologias Linguísticas WordNet FrameNet Desambiguação

Leia mais

Índices para cálculo de Leiturabilidade. Por: Gabriel Luciano Ponomarenko Orientadora: Maria José Bocorny Finatto

Índices para cálculo de Leiturabilidade. Por: Gabriel Luciano Ponomarenko Orientadora: Maria José Bocorny Finatto Índices para cálculo de Leiturabilidade Por: Gabriel Luciano Ponomarenko Orientadora: Maria José Bocorny Finatto Roteiro 1. Introdução: o conceito de leiturabilidade e a história dos índices que a calculam;

Leia mais

Análise da Inteligibilidade de textos via ferramentas de Processamento de Língua Natural: adaptando as métricas do Coh-Metrix para o Português

Análise da Inteligibilidade de textos via ferramentas de Processamento de Língua Natural: adaptando as métricas do Coh-Metrix para o Português Análise da Inteligibilidade de textos via ferramentas de Processamento de Língua Natural: adaptando as métricas do Coh-Metrix para o Português Carolina Evaristo Scarton, Sandra Maria Aluísio NILC ICMC

Leia mais

6 Atributos. A dívida da empresa subiu.

6 Atributos. A dívida da empresa subiu. 6 Atributos Para buscar o sentimento de um texto automaticamente precisamos encontrar boas pistas ao longo do discurso. Uma grande variedade de palavras e expressões possui conotação positiva ou negativa,

Leia mais

INTERFACE DE ACESSO AO TEP 2.0 THESAURUS PARA O PORTUGUÊS DO BRASIL

INTERFACE DE ACESSO AO TEP 2.0 THESAURUS PARA O PORTUGUÊS DO BRASIL Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP INTERFACE DE ACESSO AO TEP 2.0 THESAURUS PARA O PORTUGUÊS DO BRASIL Erick Galani Maziero

Leia mais

Resumo. Palavras-chave: wordnet, Wordnet.Br, relações semânticas, hiperonímia

Resumo. Palavras-chave: wordnet, Wordnet.Br, relações semânticas, hiperonímia Resumo Uma wordnet pode ser entendida como uma base de dados que sistematiza o conjunto dos verbos, substantivos, adjetivos e advérbios de um dado idioma em termos de uma rede de quatro relações: sinonímia,

Leia mais

Sumarização Automática para Simplificação de Textos: Experimentos e Lições Aprendidas

Sumarização Automática para Simplificação de Textos: Experimentos e Lições Aprendidas Sumarização Automática para Simplificação de Textos: Experimentos e Lições Aprendidas Paulo R. A. Margarido, Thiago A. S. Pardo e Sandra M. Aluísio Núcleo Interinstitucional de Lingüística Computacional

Leia mais

Problemas de Escrita. Graça Nunes Thiago Pardo

Problemas de Escrita. Graça Nunes Thiago Pardo Problemas de Escrita Graça Nunes Thiago Pardo Qual é o problema? A transformada de Hough é um algoritmo muito conhecido em visão computacional, mas a sua aplicação em alguns sistemas de tempo real é proibitiva,

Leia mais

SEMÂNTICA PARTE 3 ANÁLISE SEMÂNTICA 14/06/2012. SCC5908 Tópicos em Processamento de Língua Natural. Até agora, significado da sentença

SEMÂNTICA PARTE 3 ANÁLISE SEMÂNTICA 14/06/2012. SCC5908 Tópicos em Processamento de Língua Natural. Até agora, significado da sentença SEMÂNTICA PARTE 3 SCC5908 Tópicos em Processamento de Língua Natural Thiago A. S. Pardo ANÁLISE SEMÂNTICA Até agora, significado da sentença Rhumba closed. e Closing(e) Closed(e,Rhumba) 2 1 ANÁLISE SEMÂNTICA

Leia mais

Automatização de um Método de Avaliação de Estruturas Retóricas

Automatização de um Método de Avaliação de Estruturas Retóricas Automatização de um Método de Avaliação de Estruturas Retóricas Erick Galani Maziero (erickgm@grad.icmc.usp.br) Thiago Alexandre Salgueiro Pardo (taspardo@icmc.usp.br) Núcleo Interinstitucional de Lingüística

Leia mais

Alinhamento Sentencial e Lexical de Córpus Paralelos: Recursos para a Tradução Automática

Alinhamento Sentencial e Lexical de Córpus Paralelos: Recursos para a Tradução Automática Alinhamento Sentencial e Lexical de Córpus Paralelos: Recursos para a Tradução Automática Helena de Medeiros Caseli 1, Maria das Graças Volpe Nunes 1 1 Núcleo Interinstitucional de Lingüística Computacional

Leia mais

Verificação automática de substantivos compostos através de reconhecimento de padrões sintáticos

Verificação automática de substantivos compostos através de reconhecimento de padrões sintáticos Universidade Federal do Rio Grande do Sul Grupo de Processamento de Linguagens Naturais Projeto Expressões Multipalavras Verificação automática de substantivos compostos através de reconhecimento de padrões

Leia mais

Análise Automática de Coerência Textual em Resumos Científicos: Avaliando Quebras de Linearidade

Análise Automática de Coerência Textual em Resumos Científicos: Avaliando Quebras de Linearidade Proceedings of Symposium in Information and Human Language Technology. Natal, RN, Brazil, November 4 7, 2015. c 2015 Sociedade Brasileira de Computação. Análise Automática de Coerência Textual em Resumos

Leia mais

Introdução ao Processamento de Línguas Naturais. SCC5908 Introdução ao Processamento de Língua Natural. Thiago A. S. Pardo

Introdução ao Processamento de Línguas Naturais. SCC5908 Introdução ao Processamento de Língua Natural. Thiago A. S. Pardo /0/0 Introdução ao Processamento de Línguas Naturais SCC5908 Introdução ao Processamento de Língua Natural Thiago A. S. Pardo Dilemas no Brasil Como lidar com a interdisciplinaridade Linda no papel, complicada

Leia mais

ABORDAGENS COMPUTACIONAIS da teoria da gramática

ABORDAGENS COMPUTACIONAIS da teoria da gramática 1 9 7 2 5 0 ABORDAGENS COMPUTACIONAIS da teoria da gramática 1 9 7 2 5 0 Leonel Figueiredo de Alencar Gabriel de Ávila Othero (organizadores) ABORDAGENS COMPUTACIONAIS da teoria da gramática 1 9 7 2 5

Leia mais

PLN e áreas correlatas

PLN e áreas correlatas Introdução ao Processamento de Línguas Naturais SCC5869 Tópicos em Processamento de Língua Natural Thiago A. S. Pardo PLN e áreas correlatas Limites entre PLN e outras áreas: como percebem isso? Recuperação

Leia mais

Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação

Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação Universidade Federal do Rio Grande do Sul Instituto de Informática Programa de Pós-Graduação em Computação Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação Otávio

Leia mais

Caracterização linguística de sumários humanos multidocumento: explorando o nível lexical

Caracterização linguística de sumários humanos multidocumento: explorando o nível lexical Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP Caracterização linguística de sumários humanos multidocumento: explorando o nível lexical

Leia mais

O Corpus CSTNews e sua Complementaridade Temporal

O Corpus CSTNews e sua Complementaridade Temporal O Corpus CSTNews e sua Complementaridade Temporal Jackson W. C. Souza 1,3, Ariani Di Felippo 2,3 1 Programa de Pós-graduação em Linguística e Língua Portuguesa (PPGL/UFSCar) 2 Departamento de Letras (DL)

Leia mais

INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DA PARAÍBA CÂMPUS ITAPORANGA CURSO TÉCNICO EM EDIFICAÇÕES (INTEGRADO)

INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DA PARAÍBA CÂMPUS ITAPORANGA CURSO TÉCNICO EM EDIFICAÇÕES (INTEGRADO) COMPONENTE CURRICULAR: INGLÊS II CURSO: Técnico Integrado em Edificações SÉRIE: 3ª CARGA HORÁRIA: 67 h.r. DOCENTE RESPONSÁVEL: INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DA PARAÍBA CÂMPUS ITAPORANGA

Leia mais

Capítulo1. Capítulo2. Índice A LÍNGUA E A LINGUAGEM O PORTUGUÊS: uma língua, muitas variedades... 15

Capítulo1. Capítulo2. Índice A LÍNGUA E A LINGUAGEM O PORTUGUÊS: uma língua, muitas variedades... 15 Capítulo1 Capítulo2 A LÍNGUA E A LINGUAGEM............................................. 9 Linguagem: aptidão inata.............................................. 10 Funções.............................................................

Leia mais

Semântica no Reconhecedor Gramatical Linguístico

Semântica no Reconhecedor Gramatical Linguístico Workshop de Tecnologias Adaptativas WTA 2015 Semântica no Reconhecedor Gramatical Linguístico Ana Contier, Djalma Padovani, João José Neto Linguagem Natural - Desafios Crescente quantidade de documentos

Leia mais

Bianca Pasqualini LEITURA, TRADUÇÃO E MEDIDAS DE COMPLEXIDADE TEXTUAL EM CONTOS DA LITERATURA PARA LEITORES COM LETRAMENTO BÁSICO

Bianca Pasqualini LEITURA, TRADUÇÃO E MEDIDAS DE COMPLEXIDADE TEXTUAL EM CONTOS DA LITERATURA PARA LEITORES COM LETRAMENTO BÁSICO LEITURA, TRADUÇÃO E MEDIDAS DE COMPLEXIDADE TEXTUAL EM CONTOS DA LITERATURA PARA LEITORES COM LETRAMENTO BÁSICO Dissertação de Mestrado PPGLet/UFRGS (2013) Bianca Pasqualini Doutoranda PPGLet/UFRGS Orientadora:

Leia mais

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO Sistema de Sumarização Automática de Textos Baseado em Classes de Documentos PROPOSTA DE TRABALHO DE GRADUAÇÃO

Leia mais

Contraste de verbos indicadores de causalidade em originais e traduções: a Química Geral sob observação

Contraste de verbos indicadores de causalidade em originais e traduções: a Química Geral sob observação Contraste de verbos indicadores de causalidade em originais e traduções: a Química Geral sob observação Aline Evers Letras/Tradução (PIBIC/CNPq) Orientadora: Profa. Dra. Maria José Bocorny Finatto Origem

Leia mais

Realiter, Rio de Janeiro 2006

Realiter, Rio de Janeiro 2006 Sandra Maria Aluísio (ICMC-USP) Ieda Maria Alves (FFLCH-USP) Mariangela de Araujo (FFLCH-USP) Bruno Oliveira Maroneze (PG-FFLCH-USP) Thiago A. S. Pardo (ICMC-USP) Esta exposição tem a finalidade de apresentar

Leia mais

MCZA Processamento de Linguagem Natural Semântica e similaridade de palavras: Parte I

MCZA Processamento de Linguagem Natural Semântica e similaridade de palavras: Parte I MCZA017-13 Processamento de Linguagem Natural Semântica e similaridade de palavras: Parte I Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 1Q-2018 1 Bibliografia Daniel Jurafsky & James H. Martin.

Leia mais

Sumarizando: o que é uma língua. Métodos para seu estudo...44

Sumarizando: o que é uma língua. Métodos para seu estudo...44 sumário APRESENTAÇÃO...13 1. O que se entende por língua Estudando a língua portuguesa...17 1.1 O Vocabulário: nascimento e morte das palavras. Consultando um dicionário...20 1.2 A Semântica: o sentido

Leia mais

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ APLICADA AUGUSTO CESAR SOUZA MARTINS

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ APLICADA AUGUSTO CESAR SOUZA MARTINS UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO APLICADA AUGUSTO CESAR SOUZA MARTINS AVALIAÇÃO DE CARACTERÍSTICAS QUE INFLUENCIAM NOS VOTOS DE UTILIDADE DE OPINIÕES SOBRE

Leia mais

A categorização semântica dos compostos nominais técnicos em língua inglesa e os resultados tradutórios em português

A categorização semântica dos compostos nominais técnicos em língua inglesa e os resultados tradutórios em português Paula Santos Diniz A categorização semântica dos compostos nominais técnicos em língua inglesa e os resultados tradutórios em português Dissertação de Mestrado Dissertação apresentada como requisito parcial

Leia mais

Corretor Gramatical Para o Emacs

Corretor Gramatical Para o Emacs Corretor Gramatical Para o Emacs Aluno: Thiago Maciel Batista (5749922) Supervisor: Marcelo Finger 4 de junho de 2010 1 Sumário 1 Resumo da Monograa 3 1.1 PLN................................ 3 1.2 CoGrOO..............................

Leia mais

Desenvolvimento de Sistemas de Extração de Informações para Ambientes Colaborativos na Web

Desenvolvimento de Sistemas de Extração de Informações para Ambientes Colaborativos na Web Desenvolvimento de Sistemas de Extração de Informações para Ambientes Colaborativos na Web Douglas Nogueira 1, Vladia Pinheiro 2, Vasco Furtado 1, Tarcisio Pequeno 1 1 Mestrado em Informática Aplicada

Leia mais

EXTRAÇÃO AUTOMÁTICA DE ESTRUTURAS DE SUBCATEGORIZAÇÃO A PARTIR DE CORPORA EM PORTUGUÊS

EXTRAÇÃO AUTOMÁTICA DE ESTRUTURAS DE SUBCATEGORIZAÇÃO A PARTIR DE CORPORA EM PORTUGUÊS EXTRAÇÃO AUTOMÁTICA DE ESTRUTURAS DE SUBCATEGORIZAÇÃO A PARTIR DE CORPORA EM PORTUGUÊS Leonardo Zilio (PPG-Letras/UFRGS) Adriano Zanette (PPG-Computação/UFRGS) Carolina Scarton (ICMC/USP) Introdução A

Leia mais

Extração de Termos de Manuais Técnicos de Produtos Tecnológicos: uma Aplicação em Sistemas de Adaptação Textual

Extração de Termos de Manuais Técnicos de Produtos Tecnológicos: uma Aplicação em Sistemas de Adaptação Textual Extração de Termos de Manuais Técnicos de Produtos Tecnológicos: uma Aplicação em Sistemas de Adaptação Textual Fernando A. M. Muniz 1, Willian M. Watanabe 2, Carolina E. Scarton 1, Sandra M. Aluisio 1

Leia mais

MCZA Processamento de Linguagem Natural Introdução

MCZA Processamento de Linguagem Natural Introdução MCZA017-13 Processamento de Linguagem Natural Introdução Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 1Q-2018 1 Motivação Processamento de Linguagem Natural (PLN) tem relação com: atividades que

Leia mais

A construção de wordnets terminológicas com base em corpus

A construção de wordnets terminológicas com base em corpus A construção de wordnets terminológicas com base em corpus Ariani Di Felippo (UFSCar) ariani@ufscar.br Resumo: No âmbito do Processamento Automático das Línguas Naturais (PLN), é premente a necessidade

Leia mais

Explorando Métodos de Uso Geral para Desambiguação Lexical de Sentidos para a Língua Portuguesa

Explorando Métodos de Uso Geral para Desambiguação Lexical de Sentidos para a Língua Portuguesa Explorando Métodos de Uso Geral para Desambiguação Lexical de Sentidos para a Língua Portuguesa Fernando Antônio A. Nóbrega 1, Thiago A. Salgueiro Pardo 1 1 Núcleo Interinstitucional de Linguística Computacional

Leia mais

CTCH DEPARTAMENTO DE LETRAS

CTCH DEPARTAMENTO DE LETRAS CTCH DEPARTAMENTO DE LETRAS CATEGORIAS FUNCIONAIS NO DESENVOLVIMENTO LINGUÍSTICO E NO QUADRO DE DEL (DÉFICIT ESPECIFICAMENTE LINGUÍSTICO): EXPLORANDO SEMELHANÇAS E DISTINÇÕES ENTRE DEL E DÉFICIT DE APRENDIZAGEM

Leia mais

Mapeamento da Comunidade Brasileira de Processamento de Línguas Naturais

Mapeamento da Comunidade Brasileira de Processamento de Línguas Naturais Mapeamento da Comunidade Brasileira de Processamento de Línguas Naturais Thiago Alexandre Salgueiro Pardo, Helena de Medeiros Caseli 2, Maria das Graças Volpe Nunes Instituto de Ciências Matemáticas e

Leia mais

CYBELE M. OLIVEIRA ALLE/Letras-Bacharelado Bolsista voluntária de IC Orientadora: Profa. Dra. Maria José Bocorny Finatto

CYBELE M. OLIVEIRA ALLE/Letras-Bacharelado Bolsista voluntária de IC Orientadora: Profa. Dra. Maria José Bocorny Finatto CYBELE M. OLIVEIRA ALLE/Letras-Bacharelado Bolsista voluntária de IC Orientadora: Profa. Dra. Maria José Bocorny Finatto Histórico Artigos científicos da 2008 PEDIATRIA 2009 Conectores Causais Verbos Causais

Leia mais

OntoLP: Engenharia de Ontologias em Língua Portuguesa

OntoLP: Engenharia de Ontologias em Língua Portuguesa OntoLP: Engenharia de Ontologias em Língua Portuguesa Luiz Carlos Ribeiro Jr. (PUCRS, lucarijr@gmail.com) Renata Vieira (PUCRS, renata.vieira@gmail.com) Patrícia Nunes Gonçalves (PUCRS, patt.nunes@gmail.com)

Leia mais

O tratamento da partícula se para fins de anotação de papéis semânticos

O tratamento da partícula se para fins de anotação de papéis semânticos O tratamento da partícula se para fins de anotação de papéis semânticos Magali Sanches Duran, Sandra Maria Aluísio Núcleo Interinstitucional de Linguística Computacional ICMC Universidade de São Paulo

Leia mais

Comparação dos algoritmos sequencial e paralelo para contagem de palavras e contexto

Comparação dos algoritmos sequencial e paralelo para contagem de palavras e contexto Comparação dos algoritmos sequencial e paralelo para contagem de palavras e contexto Eduardo Delazeri Ferreira, Francieli Zanon Boito, Aline Villavicencio 1. Introdução 1 Instituto de Informática - Universidade

Leia mais

Ferramenta de apoio a identificação de eventos utilizando Linguagem Natural. Aluno: Ricardo Tomelin Orientador: Everaldo Artur Grahl

Ferramenta de apoio a identificação de eventos utilizando Linguagem Natural. Aluno: Ricardo Tomelin Orientador: Everaldo Artur Grahl Ferramenta de apoio a identificação de eventos utilizando Linguagem Natural Aluno: Ricardo Tomelin Orientador: Everaldo Artur Grahl Roteiro 1. Introdução 2. Objetivos 3. Análise Essencial de Sistemas 4.

Leia mais

Introdução ao Processamento de Línguas Naturais. Thiago A. S. Pardo

Introdução ao Processamento de Línguas Naturais. Thiago A. S. Pardo Introdução ao Processamento de Línguas Naturais Thiago A. S. Pardo Núcleo Interinstitucional de Lingüística Computacional Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo 1 Meta

Leia mais

Padrão de uso de adjetivos nos jornais Diário Gaúcho e Zero Hora

Padrão de uso de adjetivos nos jornais Diário Gaúcho e Zero Hora Padrão de uso de adjetivos nos jornais Diário Gaúcho e Zero Hora Integra a pesquisa PADRÕES DO PORTUGUÊS POPULAR ESCRITO: O VOCABULÁRIO DO JORNAL DIÁRIO GAÚCHO - FASE 1 Bruna Rodrigues da Silva PIBIC-CNPq-UFRGS

Leia mais

CORPUS PARALELO E CORPUS PARALELO ALINHADO: PROPRIEDADES E APLICAÇÕES (PARALLEL CORPUS AND ALIGNED PARALLEL CORPUS: FEATURES AND APPLICATIONS)

CORPUS PARALELO E CORPUS PARALELO ALINHADO: PROPRIEDADES E APLICAÇÕES (PARALLEL CORPUS AND ALIGNED PARALLEL CORPUS: FEATURES AND APPLICATIONS) CORPUS PARALELO E CORPUS PARALELO ALINHADO: PROPRIEDADES E APLICAÇÕES (PARALLEL CORPUS AND ALIGNED PARALLEL CORPUS: FEATURES AND APPLICATIONS) Helena de Medeiros CASELI (PG Universidade de São Paulo São

Leia mais

Síntese de programas utilizando a linguagem Alloy

Síntese de programas utilizando a linguagem Alloy Universidade Federal de Pernambuco Centro de Informátiva Graduação em Ciência da Computação Síntese de programas utilizando a linguagem Alloy Proposta de Trabalho de Graduação Aluno: João Pedro Marcolino

Leia mais

Análise de sentimentos para português brasileiro usando redes neurais recursivas

Análise de sentimentos para português brasileiro usando redes neurais recursivas Análise de sentimentos para português brasileiro usando redes neurais recursivas Henrico Bertini Brum 1, Fábio Natanel Kepler 1 1 Ciência da Computação Universidade Federal do Pampa (UNIPAMPA) Caixa Postal

Leia mais

Indexação automática. CBD/ECA Indexação: teoria e prática

Indexação automática. CBD/ECA Indexação: teoria e prática Indexação automática CBD/ECA Indexação: teoria e prática Indexação documentária Identificar pela análise dos documentos, os seus assuntos extrair os conceitos que indicam o seu conteúdo traduzir os conceitos

Leia mais

SUBCATEGORIZATION FRAMES A PARTIR DE CORPORA EM PORTUGUÊS

SUBCATEGORIZATION FRAMES A PARTIR DE CORPORA EM PORTUGUÊS EXTRAÇÃO AUTOMÁTICA DE SUBCATEGORIZATION FRAMES A PARTIR DE CORPORA EM PORTUGUÊS 1 Introdução A tarefa de identificar automaticamente subcategorization frames (SCFs), que se enquadra como um tipo de aquisição

Leia mais

Apresentação 11 Lista de abreviações 13. Parte I: NATUREZA, ESTRUTURA E FUNCIONAMENTO DA LINGUAGEM

Apresentação 11 Lista de abreviações 13. Parte I: NATUREZA, ESTRUTURA E FUNCIONAMENTO DA LINGUAGEM Sumário Apresentação 11 Lista de abreviações 13 Parte I: NATUREZA, ESTRUTURA E FUNCIONAMENTO DA LINGUAGEM O homem, a linguagem e o conhecimento ( 1-6) O processo da comunicação humana ( 7-11) Funções da

Leia mais

METÁFORAS COM VERBOS PONTUAIS DO PB E DO INGLÊS: UMA ANÁLISE DESCRITIVA E COMPARATIVA.

METÁFORAS COM VERBOS PONTUAIS DO PB E DO INGLÊS: UMA ANÁLISE DESCRITIVA E COMPARATIVA. METÁFORAS COM VERBOS PONTUAIS DO PB E DO INGLÊS: UMA ANÁLISE DESCRITIVA E COMPARATIVA. Aluna: Luênnya Alves Clemente 1 Orientadora: Dieysa Kanyela Fossile 2 Nesta pesquisa, temos como objetivo (i) descrever

Leia mais

Corretor Gramatical Para o Emacs

Corretor Gramatical Para o Emacs Trabalho de Conclusão de Curso Thiago Maciel batista Orientador: Prof. Dr. Marcelo Finger Instituto de Matemática e Estatística Universidade de São Paulo 16 de novembro de 2010 Roteiro 1 Introdução 2 Processamento

Leia mais

Encontro 10 Anos da Linguateca PROPOR 2008 Aveiro Portugal

Encontro 10 Anos da Linguateca PROPOR 2008 Aveiro Portugal Marcirio Silveira Chaves Pólo XLDB da Linguateca LaSIGE Departamento de Informática Faculdade de Ciências da Universidade de Lisboa Encontro 10 Anos da Linguateca PROPOR 2008 Aveiro Portugal 9/16/08 1

Leia mais

MAPAS CONCEITUAIS COMPILADOS: UMA FERRAMENTA PARA CONSTRUÇÃO DE DIAGNÓSTICOS EM ENSINO A DISTÂNCIA

MAPAS CONCEITUAIS COMPILADOS: UMA FERRAMENTA PARA CONSTRUÇÃO DE DIAGNÓSTICOS EM ENSINO A DISTÂNCIA MAPAS CONCEITUAIS COMPILADOS: UMA FERRAMENTA PARA CONSTRUÇÃO DE DIAGNÓSTICOS EM ENSINO A DISTÂNCIA Márcio Roberto Machado da Silva; Marlise Geller Universidade Luterana do Brasil marcioms@ulbra.br; mgeller@terra.com.br

Leia mais

Patrícia Conceição Ribeiro Arteiro Annechine Marçal

Patrícia Conceição Ribeiro Arteiro Annechine Marçal Patrícia Conceição Ribeiro Arteiro Annechine Marçal Análise das demandas de processamento associadas a textos e enunciados de provas de língua portuguesa do SAERJinho Dissertação de Mestrado Dissertação

Leia mais

Anexo B Relação de Assuntos Pré-Requisitos à Matrícula

Anexo B Relação de Assuntos Pré-Requisitos à Matrícula Anexo B Relação de Assuntos Pré-Requisitos à Matrícula MINISTÉRIO DA DEFESA EXÉRCITO BRASILEIRO DEPARTAMENTO DE EDUCAÇÃO E CULTURA DO EXÉRCITO DIRETORIA DE EDUCAÇÃO PREPARATÓRIA E ASSISTENCIAL RELAÇÃO

Leia mais

Assessement of features influencing the voting for opinions helpfulness about services in Portuguese

Assessement of features influencing the voting for opinions helpfulness about services in Portuguese Association for Information Systems AIS Electronic Library (AISeL) Proceedings of the XI Brazilian Symposium on Information Systems (SBSI 2015) Brazilian Symposium on Information Systems (SBIS) 5-2015

Leia mais

MATERIAL DE DIVULGAÇÃO DA EDITORA MODERNA

MATERIAL DE DIVULGAÇÃO DA EDITORA MODERNA MATERIAL DE DIVULGAÇÃO DA EDITORA MODERNA Professor, nós, da Editora Moderna, temos como propósito uma educação de qualidade, que respeita as particularidades de todo o país. Desta maneira, o apoio ao

Leia mais

(1) A análise dos resultados experimentais indicaram um efeito principal de número do núcleo interveniente no processamento da concordância.

(1) A análise dos resultados experimentais indicaram um efeito principal de número do núcleo interveniente no processamento da concordância. 1 Introdução A presente tese tem como tema o processamento da concordância de número entre sujeito e verbo na produção de sentenças e está vinculada ao Projeto Explorando relações de interface língua-sistemas

Leia mais

SUMÁRIO. Língua Portuguesa. Pronome: classificação, emprego, colocação dos pronomes pessoais oblíquos átonos, formas de tratamento...

SUMÁRIO. Língua Portuguesa. Pronome: classificação, emprego, colocação dos pronomes pessoais oblíquos átonos, formas de tratamento... Língua Portuguesa Compreensão Textual... 3 Ortografia... 15 Semântica... 27 Morfologia... 30 Sintaxe... 59 Compreensão e interpretação de textos... 3 Variação linguística... 7 Gêneros de texto... 9 Coerência

Leia mais

GistSumm GIST SUMMarizer: Extensões e Novas Funcionalidades

GistSumm GIST SUMMarizer: Extensões e Novas Funcionalidades Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP GistSumm GIST SUMMarizer: Extensões e Novas Funcionalidades Thiago Alexandre Salgueiro

Leia mais

Computação Musical - Introdução slides do curso Computação Musical

Computação Musical - Introdução slides do curso Computação Musical - Introdução slides do curso Departamento de Ciência da Computação Universidade Federal de São João Del Rei 2014/2 O que é computação musical? Denitivamente é computação. Relacionada e aplicada à música.

Leia mais

Sobre a resolução de correferência

Sobre a resolução de correferência Sobre a resolução de correferência Tatiane de Moraes Coreixas¹, Renata Vieira¹ ¹Faculdade de Informática Pontifícia Universidade Católica do RS (PUC) tatiane.coreixas@pucrs.br, renata.vieira@pucrs.br Abstrat.

Leia mais

Geração de Modelo para Reconhecimento de Entidades Nomeadas no OpenNLP

Geração de Modelo para Reconhecimento de Entidades Nomeadas no OpenNLP Geração de Modelo para Reconhecimento de Entidades Nomeadas no OpenNLP Gabriel C. Chiele 1, Evandro Fonseca 1, Renata Vieira 1 1 Faculdade de Informática Pontifícia Universidade Católica do Rio Grande

Leia mais

5º Congresso de Pós-Graduação

5º Congresso de Pós-Graduação 5º Congresso de Pós-Graduação UMA FERRAMENTA PARA GERAÇÃO AUTOMÁTICA DE DIAGRAMA DE CLASSES A PARTIR DA ESPECIFICAÇÃO DE REQUISITOS EM LINGUAGEM NATURAL Autor(es) Orientador(es) LUIZ EDUARDO GALVÃO MARTINS

Leia mais

Implementação de algoritmos para consultas de segmentos em janelas

Implementação de algoritmos para consultas de segmentos em janelas Implementação de algoritmos para consultas de segmentos em janelas MAC0499 - Trabalho de formatura supervisionado Proposta de Trabalho Aluno: Mateus Barros Rodrigues Orientador: Prof. Dr. Carlos Eduardo

Leia mais

Construções finais recorrentes em textos de Pediatria e de Econometria

Construções finais recorrentes em textos de Pediatria e de Econometria Construções finais recorrentes em textos de Pediatria e de Econometria Larissa B. Ramos Voluntária IC PROPESQ UFRGS Orientadora: Profa. Dra. Maria José Bocorny Finatto - CNPq Colaborador: Gilson Mattos

Leia mais

Características do jornalismo popular: inteligibilidade e auxílio à descrição do gênero

Características do jornalismo popular: inteligibilidade e auxílio à descrição do gênero Características do jornalismo popular: inteligibilidade e auxílio à descrição do gênero avaliação da Maria José Bocorny Finatto 1, Carolina Evaristo Scarton 2, Sandra Maria Aluísio 2, Amanda Rocha 2 1

Leia mais

PLANO DE ENSINO AGROECOLOGIA EMENTA

PLANO DE ENSINO AGROECOLOGIA EMENTA PLANO DE ENSINO AGROECOLOGIA DADOS DA DISCIPLINA Nome da Disciplina: Inglês Instrumental Curso:Agroecologia SÉRIE: Superior Carga Horária: 50 horas Docente Responsável: Ana Angélica de Lucena Taveira Rocha

Leia mais

PROCESSAMENTO DE LINGUAGEM NATURAL (PLN): FERRAMENTAS E DESAFIOS

PROCESSAMENTO DE LINGUAGEM NATURAL (PLN): FERRAMENTAS E DESAFIOS PROCESSAMENTO DE LINGUAGEM NATURAL (PLN): FERRAMENTAS E DESAFIOS Lucas Matheus Santos Andrade, Rafael Couto Barros, Marcelo Anderson Batista dos Santos Instituto Federal de Educação, Ciência e Tecnologia

Leia mais

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais Universidade de São Paulo Biblioteca Digital da Produção Intelectual - BDPI Departamento de Ciências de Computação - ICMC/SCC Comunicações em Eventos - ICMC/SCC 2015 Identificação de Pontos Perceptualmente

Leia mais

Revisão/Mapeamento Sistemático

Revisão/Mapeamento Sistemático Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação SSC0572 - Computadores, Sociedade e Ética Profissional Revisão/Mapeamento Sistemático Prof. Dr. José Carlos Maldonado PAE: Pedro

Leia mais

Inteligência Artificial. Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional

Inteligência Artificial. Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional Inteligência Artificial Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional OBJETIVOS : Introduzir o estudo Processamento de Linguagem Natural. Histórico O processamento de linguagem natural, nasceu

Leia mais

Desambiguação Lexical de Sentido com uso de Informação Multidocumento por meio de Redes de Co-ocorrência

Desambiguação Lexical de Sentido com uso de Informação Multidocumento por meio de Redes de Co-ocorrência Desambiguação Lexical de Sentido com uso de Informação Multidocumento por meio de Redes de Co-ocorrência Fernando Antônio A. Nóbrega, Thiago A. Salgueiro Pardo Núcleo Interinstitucional de Linguística

Leia mais

O Desenvolvimento de um Sistema Computacional de Sumarização Multidocumento com Base em um Método Linguisticamente Motivado

O Desenvolvimento de um Sistema Computacional de Sumarização Multidocumento com Base em um Método Linguisticamente Motivado O Desenvolvimento de um Sistema Computacional de Sumarização Multidocumento com Base em um Método Linguisticamente Motivado Guilherme Gonçalves, Thiago Alexandre Salgueiro Pardo Núcleo Interinstitucional

Leia mais

Fusão Automática de Sentenças Similares em Português

Fusão Automática de Sentenças Similares em Português Fusão Automática de Sentenças Similares em Português Eloize Rossi Marques Seno, Maria das Graças Volpe Nunes NILC ICMC Unisidade de São Paulo Caixa Postal 668 13560-970 São Carlos SP Brasil {eloize,gracan}@icmc.usp.br

Leia mais

REUNIÃO DE PAIS 4º ANO A PROFESSORA LUANA

REUNIÃO DE PAIS 4º ANO A PROFESSORA LUANA REUNIÃO DE PAIS 4º ANO A PROFESSORA LUANA AVALIAÇÃO ANSIEDADE ENTENDER AGITAÇÃO SURPRESA CONHECIMENTO NERVOSO RELEMBRAR SUSTO PREOCUPAÇÃO PRESSÃO MEDO ESPANTO AFLIÇÃO PENSATIVO ADRENALINA ESTUDAR ALEGRIA

Leia mais

Rafael Tanizawa

Rafael Tanizawa Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Relatório Científico 4 Processo nro. 09/50011-3 Bolsa no País Regular Iniciação Científica Maio a Outubro de 2009 Rafael Tanizawa

Leia mais

Verificação da Adequação do Conteúdo Textual dos Serviços Web Públicos Brasileiros para Usuários com Baixo Letramento

Verificação da Adequação do Conteúdo Textual dos Serviços Web Públicos Brasileiros para Usuários com Baixo Letramento 88 Verificação da Adequação do Conteúdo Textual dos Serviços Web Públicos Brasileiros para Usuários com Baixo Letramento Eliane Capra 1, Simone Leal Ferreira 2, Bruno Torres 3, Carolina Sacramento 4 Resumo

Leia mais

Infra-Estrutura de Dados Espaciais. Bruno Rabello Monteiro

Infra-Estrutura de Dados Espaciais. Bruno Rabello Monteiro Infra-Estrutura de Dados Espaciais Bruno Rabello Monteiro Agenda Introdução e Conceituação SDI Problemas e Pesquisas Referências Bibliográficas Introdução Um SIG pode ser definido como (Bernard et al,,

Leia mais

DESENVOLVIMENTO DE UM PARSER DE CONECTORES TEXTUAIS E SUA APLICAÇÃO PARA ANÁLISE DE. Leonardo Zilio(Letras/UFRGS) Rodrigo Wilkens(PPG-Comp/UFRGS)

DESENVOLVIMENTO DE UM PARSER DE CONECTORES TEXTUAIS E SUA APLICAÇÃO PARA ANÁLISE DE. Leonardo Zilio(Letras/UFRGS) Rodrigo Wilkens(PPG-Comp/UFRGS) DESENVOLVIMENTO DE UM PARSER DE CONECTORES TEXTUAIS E SUA APLICAÇÃO PARA ANÁLISE DE GÊNEROS TEXTUAIS Leonardo Zilio(Letras/UFRGS) Rodrigo Wilkens(PPG-Comp/UFRGS) IX ELC Porto Alegre 08 de Outubro de 2010

Leia mais

Evaluating Textual Cohesion: Challenges to Essays Assessment

Evaluating Textual Cohesion: Challenges to Essays Assessment Avaliação da Coesão Textual: Desafios para Automatizar a Correção de Redações Thiago Gaglietti de Cândido 1, Carine Geltrudes Webber 1 1 Área do Conhecimento de Ciências Exatas e Engenharias Universidade

Leia mais