SEMÂNTICA PARTE 3 ANÁLISE SEMÂNTICA 14/06/2012. SCC5908 Tópicos em Processamento de Língua Natural. Até agora, significado da sentença

Documentos relacionados
SEMÂNTICA PARTE 3 ANÁLISE SEMÂNTICA 12/11/2010. SCC5869 Tópicos em Processamento de Língua Natural. Até agora, significado da sentença. Rhumba closed.

Ontologias Linguísticas e Processamento de Linguagem Natural. Ygor Sousa CIn/UFPE

SCC5869 Tópicos em Processamento de Língua Natural. Expressão lingüística representação do significado. São necessários para automação do processo

Recapitulando... Abordagens: PLN. Abordagens: PLN 29/03/2012. Introdução ao Processamento de Línguas Naturais. Distribuição de palavras

SEMÂNTICA PARTE 3 (CONTINUAÇÃO)

MCZA Processamento de Linguagem Natural Semântica e similaridade de palavras: Parte I

RELAÇÕES SEMÂNTICAS FUNDAMENTOS DE SEMÂNTICA APOIO PEDAGÓGICO 20/04/2018 SAULO SANTOS

Estudo Semântico e Aplicação Computacional de Adjetivos do Português do Brasil

Sinonímia. Em qual contexto não são sinônimas? Significado idêntico Mesmas condições de verdade (a) acarreta (b) e (b) acarreta (a) aluno = estudante

Anotação de Sentidos de Verbos no Córpus CSTNews

Relações semânticas entre palavras. O papel das relações semânticas em português: Comparando o TeP, a MWN.PT e o PAPEL

ANOTAÇÃO DE SENTIDOS DE VERBOS EM NOTÍCIAS JORNALÍSTICAS EM PORTUGUÊS DO BRASIL

Resumo. Palavras-chave: wordnet, Wordnet.Br, relações semânticas, hiperonímia

4 Trabalhos relacionados à extração automática de hiperonímia

definitions in natural language (say, English) and, if possible, using formal relations and

Uma Abordagem ao PÁGICO baseada no Processamento e Análise de Sintagmas dos Tópicos

Automatização da Geração de Dicionários Tratáveis por Máquina: Reutilização de Recursos Linguísticos

Organização da Teleaula. A Significação. Contextualização. Processos Sintáticos e Semânticos em Língua Portuguesa. Teleaula 5. Licenciatura em Letras

PLN e áreas correlatas

Verb Sense Annotation in News Texts in the CSTNews Corpus

Capítulo1. Capítulo2. Índice A LÍNGUA E A LINGUAGEM O PORTUGUÊS: uma língua, muitas variedades... 15

Introdução ao Processamento de Línguas Naturais. Thiago A. S. Pardo

Edição de informações sintático-semânticas dos adjetivos na base da rede Wordnet.Br

Leitura de Documentos. Priscila Engiel

ANTONÍMIA NOS ADJETIVOS DESCRITIVOS DO PORTUGUÊS DO BRASIL: UMA PROPOSTA DE ANÁLISE E REPRESENTAÇÃO. Cláudia Dias de Barros

Português 1º ano João J. Linguagem e Significação

5 Ambigüidades no contexto de Mineração de Textos

Universidade de Lisboa

Inclusão de Informação Semântica dos Adjetivos na Base da Rede Wordnet para o Português do Brasil

WordNet: Relações Semânticas e Métricas de Associação/Semelhança. Seminário Doutoral Nuno Seco

COESÃO COERÊNCIA. É um dos meios que garante a unidade semântica e a organização de um enunciado.

Introdução ao Processamento de Línguas Naturais. SCC5869 Tópicos em Processamento de Língua Natural. Thiago A. S. Pardo

LISTA DE EXERCÍCIOS GRAMÁTICA

Onto.PT: Construção automática de uma ontologia lexical para o português

as wordnets do português

INTERFACE DE ACESSO AO TEP 2.0 THESAURUS PARA O PORTUGUÊS DO BRASIL

Explorando Métodos de Uso Geral para Desambiguação Lexical de Sentidos para a Língua Portuguesa

Modelos em Sistemas de Informação. Aula 3

Inteligência Artificial. Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional

A ONTOGOV-MT: CONTRIBUIÇÕES LINGÜÍSTICO-TECNOLÓGICAS PARA A DEMOCRATIZAÇÃO DOS SERVIÇOS PÚBLICOS EM MATO GROSSO

Significação das palavras

Introdução 1 Língua, Variação e Preconceito Linguístico 1 Linguagem 2 Língua 3 Sistema 4 Norma 5 Português brasileiro 6 Variedades linguísticas 6.

A construção da base da Wordnet.Br: conquistas e desafios

1.HIPÔNIMOS E HIPERÔNIMOS 2.POLISSEMIA 3.SINONÍMIA 4.ANTONÍMIA 5.HOMONÍMIA 6.PARONÍMIA 7.DENOTAÇÃO/CONOTAÇÃO 8.ATIVIDADES

A interlíngua e o alinhamento léxico-conceitual da base de dados bilíngue REBECA

TeMário 2006: Estendendo o Córpus TeMário

Bárbara da Silva. Português. Aula 32 Semântica

Objectivos / Competências Conteúdos Descrição dos itens

Prof. Walter Moreira Unesp / Marília, 2017

Em direção ao delineamento conceitual de corpus via indexação léxico-conceitual

Semântica no Reconhecedor Gramatical Linguístico

WordnetAffectBR: uma base lexical de palavras de emoções para a língua portuguesa

SIGNIFICAÇÃO VOCABULAR E TEXTUAL

Criação de Ontologias Linguísticas Automáticas a partir de Texto

Fenômenos Linguísticos

UNIVERSIDADE DO ESTADO DO PARÁ LÍNGUA PORTUGUESA e REDAÇÃO PROSEL/ PRISE 1ª ETAPA

Português. Índice de aulas. Tipologias textuais

01/10/2010 SINTAXE PARTE 3. SCC5869 Tópicos em Processamento de Língua Natural. Thiago A. S. Pardo ATRIBUTOS E UNIFICAÇÃO

Introdução ao Processamento de Línguas Naturais. SCC5908 Introdução ao Processamento de Língua Natural. Thiago A. S. Pardo

Construção automática de uma wordnet com medidas de confiança associadas

6 Atributos. A dívida da empresa subiu.

O PAVEL: curso interativo de Terminologia

INTERPRETAÇÃO DE TEXTOS SEMÂNTICA II (SIGNIFICAÇÃO DE PALAVRAS)


FONOLOGIA (Fonética): SEMÂNTICA: MORFOLOGIA: a palavra. SINTAXE: a sentença, a frase MORFOSSINTAXE: sons da língua. o significado

Português. Índice de aulas. Tipologias textuais

REBECA 1 uma Base de Dados Léxico-Conceitual Bilíngüe Inglês-Português

Extração de informações e web semântica: a importância da semântica verbal

PORTUGUÊS. Interpretação de textos Coesão e Coerência. Prof.ª Isabel Vega

O código do modelo de mapeamento sintático-conceitual do sistema ConPor

ESCT Português 10º Ano Cursos Profissionais

Realiter, Rio de Janeiro 2006

Introdução ao Processamento de Línguas Naturais (PLN) SCC0230 Introdução à IA. Prof. Thiago A. S. Pardo. Em oposição às linguagens artificiais

Objectivos / Competências Conteúdos Descrição dos Domínios de referência: Unidades temáticas

ESCOLA SECUNDÁRIA DE GONDOMAR Planificação Anual de Português - 10º ANO Ano letivo MANUAL: Com Textos (Edições ASA)

Objectivos / Competências Conteúdos Descrição dos itens

Uma proposta de representação das relações de polissemia em wordnets

LÍNGUA PORTUGUESA DISCIPLINA

A SEMÂNTICA DOS ADJETIVOS: COMO E POR QUE INCLUÍ-LA EM UMA ONTOLOGIA DE DOMÍNIO JURÍDICO

Investigação de métodos de desambiguação lexical de sentidos de verbos do português do Brasil. Marco Antonio Sobrevilla Cabezudo

Novas Ferramentas e Recursos Linguísticos para a Tradução Automática

Programa Interdisciplinar de Pós-Graduação em. Computação Aplicada. Mestrado Acadêmico. Allan de Barcelos Silva

Extração e Validação de Ontologias a partir de Recursos Digitais

SUMÁRIO. Língua Portuguesa

Análise de Sentimento - Parte I

SINÔNIMOS E PARÔNIMOS

Os desafios da anotação de um corpus da linguagem do futebol com frames semânticos

OS PRINCÍPIOS DA PESQUISA TERMINOLÓGICA APLICADOS AO ENSINO DA PRÁTICA DE TRADUÇÃO DE TEXTOS TÉCNICOS E CIENTÍFICOS

EMENTÁRIO DAS DISCIPLINAS DO CURSO DE LETRAS-PORTUGUÊS - IRATI (Currículo iniciado em 2015)

UNIVERSIDADE ESTADUAL DE GOIÁS UNIDADE UNIVERSITÁRIA DE CIÊNCIAS SÓCIO-ECONÔMICAS E HUMANAS DE ANÁPOLIS

Introdução ao Processamento de Línguas Naturais. SCC5908 Introdução ao Processamento de Língua Natural. Thiago A. S. Pardo

Portuguesa. divulgação. Língua. Comparativos curriculares. Material de

Análise de Texto e Fenômenos Linguísticos - Ambiguidade, Polissemia, Tipos de Discurso e Intertextualidade.

MCZA Processamento de Linguagem Natural Introdução

hábito (a) [Metoprene, substância análoga a o hormônio juvenil de os insetos,] que atua em as formas imaturas ( larvas e pupas ), impedindo...

P R O G R A M A. O léxico português. Processos de criação e renovação

Desambiguação Lexical de Sentido com uso de Informação Multidocumento por meio de Redes de Co-ocorrência

Português. Índice de aulas. Tipologias textuais

Dicionário-Aberto: Construção semiautomática de uma funcionalidade codificadora

Transcrição:

SEMÂNTICA PARTE 3 SCC5908 Tópicos em Processamento de Língua Natural Thiago A. S. Pardo ANÁLISE SEMÂNTICA Até agora, significado da sentença Rhumba closed. e Closing(e) Closed(e,Rhumba) 2 1

ANÁLISE SEMÂNTICA Até agora, significado da sentença Rhumba closed. Mas... o que é Rhumba? Qual sua caracterização semântica? É preciso mais do que simplesmente a palavra: semântica lexical 3 SEMÂNTICA LEXICAL Exemplos relativamente simples Eu banco sua viagem. Em qual banco você trabalha? O banco tinha três pernas. Quais os sentidos? Verbo financiar, instituição financeira ou assento? 4 2

SEMÂNTICA LEXICAL Exemplos relativamente simples Eu banco sua viagem. Em qual banco você trabalha? O banco tinha três pernas. Quais os sentidos? Verbo financiar, instituição financeira ou assento? Exemplos bem mais complexos O banco está quebrado. O homem encontrou o banco. 5 E agora? Mais informação (contextual) é necessária SEMÂNTICA LEXICAL Tarefas envolvidas Desambiguação lexical de sentido Significado/sentido das palavras Reconhecimento de entidades nomeadas Tipo semântico de nomes próprios, normalmente Entidades nomeadas vs. mencionadas Isso é semântica lexical? Anotação de papéis semânticos Atribuição de papéis aos elementos sentenciais Outras? 6 3

SEMÂNTICA LEXICAL Tarefas envolvidas Desambiguação lexical de sentido Significado/sentido das palavras Reconhecimento de entidades nomeadas Tipo semântico de nomes próprios, normalmente Entidades nomeadas vs. mencionadas Isso é semântica lexical? Anotação de papéis semânticos Atribuição de papéis aos elementos sentenciais Relacionamentos entre palavras, construção de ontologias, indexação ontológica, subcategorização, restrições de seleção, metáforas, etc. 7 SEMÂNTICA Níveis de análise semântica mais usuais em PLN e interação entre eles Há outros níveis? Semântica lexical é sempre necessária para a análise sentencial? Semântica textual??? Semântica textual Semântica sentencial 8 Semântica lexical 4

SEMÂNTICA Níveis de análise semântica mais usuais em PLN e interação entre eles Há outros níveis? SIM, por exemplo, morfologia Semântica lexical é sempre necessária para a análise sentencial? NÃO, depende da aplicação e do que se quer Semântica textual??? RST, por exemplo Semântica textual Semântica sentencial 9 Semântica lexical SEMÂNTICA LEXICAL Principais recursos utilizados para as tarefas relacionadas à semântica lexical Relações entre sentidos WordNet de Princeton (Fellbaum, 1998) e outras wordnets, por exemplo Eventos e seus participantes FrameNet (Baker et al., 1998), por exemplo Decomposição em primitivas de significados Schank (1975), por exemplo 10 5

RELAÇÕES ENTRE SENTIDOS Sentido: representação discreta de um aspecto do significado da palavra Diferentes tipos de relações entre sentidos Sinonímia Ameaça e perigo Antonímia Feio e bonito Meronímia (e holonímia): parte-todo (todo-parte) Roda é merônimo de carro, mas carro é holônimo de roda Hiperônimo (e hipônimo): mais genérico (mais específico) Veículo é hiperônimo de carro, mas carro é hipônimo de veículo 11 RELAÇÕES ENTRE SENTIDOS Sentido: representação discreta de um aspecto do significado da palavra Diferentes tipos de relações entre sentidos Homonímia: mesma forma, sentidos não relacionados Manga (da camisa) e manga (fruta) Polissemia: mesma forma, sentidos relacionados Banco (de areia) e banco (instituição financeira) Onde se depositam coisas Metonímia: uso de um termo no lugar de outro Leitura de Machado de Assis 12 6

SINONÍMIA Atenção Indicação: as palavras podem ser usadas de forma intercambiável Não há sinônimos perfeitos Por exemplo, água e H 2 O H 2 O é um termo mais científico, não apropriado para um guia turístico, por exemplo Essa diferença de gênero faz parte do significado dos termos 13 ANTONÍMIA Atenção: vários tipos de oposição conceitual, podendo tornar a identificação difícil Exemplos Vivo vs. morto, homem vs. mulher (oposição complementar) Frio vs. quente (gradação) Grande vs. pequeno (escala) Esquerda vs. direita (direção) Filho vs. pai (reversível) 14 7

ANTONÍMIA Atenção: vários tipos de oposição conceitual, podendo tornar a identificação difícil Alguns antônimos são marcados morfologicamente Gostoso vs. desgostoso 15 HIPERONÍMIA/HIPONÍMIA Atenção: relações usadas em vários contextos Taxonomias: somente hiperonímias/hiponímias 16 8

HIPERONÍMIA/HIPONÍMIA Atenção: relações usadas em vários contextos Taxonomias: somente hiperonímias/hiponímias Nem sempre é simples Cão de caça e filhote são hipônimos de cão Poodle e pastor alemão também são tipos de cães, mas expressam relações diferentes das anteriores 17 HIPERONÍMIA/HIPONÍMIA Atenção: relações usadas em vários contextos Ontologias: outras relações também Di Felippo (2008) 18 9

HIPERONÍMIA/HIPONÍMIA Atenção: relações usadas em vários contextos Ontologias: outras relações também 19 HIPERONÍMIA/HIPONÍMIA Atenção: relações usadas em vários contextos Taxonomias vs. ontologias Atenção: não há consenso 20 10

RELAÇÕES ENTRE SENTIDOS Algumas relações entre sentidos são sistemáticas Exemplo Eu moro perto da USP <local>. A USP <organização> elegeu um novo reitor. <local> <organização> Padrão recorrente: escolas, hospitais, organizações, etc. 21 CAMPO SEMÂNTICO Identifica um conjunto de palavras de um mesmo domínio, dentre as quais há várias relações Por exemplo: reserva, vôo, viagem, preço, tarifa, refeição, avião Campo semântico de viagem de avião 22 11

WORDNET DE PRINCETON Maior e mais famoso repositório de relações Conceitos representados por listas de palavras sinônimas Synsets (synonym sets) Exemplo: {casa, lar, moradia} Palavras organizadas por frequência, muitas vezes Relações entre synsets, formando uma grande rede Entradas acompanhadas por glosas e exemplos de uso Glosas: definições no estilo de dicionários Sem consenso, mas muitos a classificam como uma ontologia linguística 23 WORDNET DE PRINCETON WordNet 3.0 24 12

WORDNET DE PRINCETON Exemplo: entity (unique beginner) para substantivos 25 WORDNETS Redes semânticas Iniciativas para várias línguas Possibilidade de indexação entre as wordnets Por exemplo, EuroWordNet E para o português? 26 13

WORDNETS Redes semânticas Iniciativas para várias línguas Possibilidade de indexação entre as wordnets Por exemplo, EuroWordNet E para o português? TeP e Wordnet.Br Wordnet.Pt MWN.PT Onto.PT 27 EXERCÍCIO Como construir manualmente uma wordnet para uma língua sem recursos semânticos significativos? 28 14

EXERCÍCIO Como construir manualmente uma wordnet para uma língua sem recursos semânticos significativos? Linguistas e dicionários Wordnet.Pr e córpus paralelo para traduzir seus termos Etc. 29 EXERCÍCIO Como construir automaticamente (mesmo que parcialmente) uma wordnet para uma língua sem recursos semânticos significativos? 30 15

EXERCÍCIO Como construir automaticamente (mesmo que parcialmente) uma wordnet para uma língua sem recursos semânticos significativos? Expressões em córpus, por exemplo, X é um tipo de Y Tradução de outra wordnet Importação de relações de outra wordnet Etc. 31 16