Motivação e objectivos. Trabalho relacionado. Arquitectura. Contribuições. Avaliação. Conclusões
|
|
- Liliana Filipe Mendonça
- 7 Há anos
- Visualizações:
Transcrição
1 Extracção e classificação de entidades mencionadas Diogo Correia de Oliveira L 2 F - Spoken Language Systems Laboratory 1 L 2 F - Spoken Language Systems Laboratory 2 Motivação (1 / 3) Identificação e classificação de entidades em textos de língua portuguesa Tarefa importante em Processamento de Língua Natural Um dos primeiros passos para extrair significado de um texto Directivas de classificação Categorias: VALOR, HUMANO e LOCAL L 2 F - Spoken Language Systems Laboratory 3 4 Motivação (2 / 3) Motivação (3 / 3) Entrada: Entrada: O realizador James Cameron, natural do Canadá, escreveu, produziu e dirigiu o filme Avatar, cujo orçamento ultrapassou os 200 milhões de dólares. HUMANO LOCAL VALOR Saída: O realizador <EM CATEG= HUMANO TIPO= INDIVIDUAL SUBTIPO= PESSOA >James Cameron</EM>, natural do <EM CATEG= LOCAL TIPO= CRIADO SUBTIPO= PAIS >Canadá</EM>, escreveu, produziu e dirigiu o filme Avatar, cujo orçamento ultrapassou os <EM CATEG= VALOR TIPO= MOEDA >200 milhões de dólares</em>. 1143: Portugal consegue obter a independência VALOR? LOCAL? HUMANO? No segundo exemplo, estamos perante um caso de metonímia Estes casos passaram a ser tratados de forma especial no sistema 5 6
2 Objectivos Propor um novo conjunto de Directivas de Classificação Melhorar o sistema em questão nas categorias VALOR, HUMANO e LOCAL Estabelecer uma nova maneira de representar a metonímia e melhorar a capacidade do sistema em capturar entidades deste género Avaliar o trabalho efectuado, usando métricas de avaliação bem definidas 7 L 2 F - Spoken Language Systems Laboratory 8 Trabalho relacionado (1 / 2) Trabalho relacionado (2 / 2) conjunta: o Segundo HAREM (2008) Sistema Posição Medida F (ident.) Medida F (class.) # Categorias Priberam 1 71% 57% 9 9 participantes: 8 relevantes para este estudo Objectivo comum: REM em português Identificação e classificação de entidades Relação entre entidades: fora do âmbito deste trabalho R3M 2 68% 3 REMBRANDT 2 68% 57% 9 XIP 4 61% 54% 7 REMMA 5 55% 45% 9 CaGE 6 43% 34% 4 SEI-Geo 7 24% 20% 1 Abordagens diferentes Objectivo comum, construídos por motivos diferentes Categorias consideradas Tecnologia usada PorTexTO 8 16% 16% 1 Todos usam regras manuais R3M usa abordagem semi-supervisionada REMBRANDT e REMMA usam a Wikipedia Outras fontes externas: listas de palavras, ontologias 9 10 Arquitectura / Cadeia de processamento Input Segmentação Etiquetação morfossintáctica (Palavroso) Divisão em frases Desambiguador morfossintáctico (RuDriCo) Desambiguador estatístico (MARv) Análise sintáctica e semântica (XIP) Output L 2 F - Spoken Language Systems Laboratory 11 12
3 Arquitectura / XIP Arquitectura / XIP / Chunking (1 / 3) Recebe entradas textuais e fornece informação linguística Cálculo de chunks e de dependências Regras de chunking e regras de dependência Adicionamento de informação lexical, sintáctica e semântica Ficheiros de léxico Chunking Processo para agrupar sequências ordenadas de nós O 44.º Presidente dos EUA afirmou que... 1> noun[people=+, cargo=+, (num),?[title], prep[lemma:de], (art[def]),?[maj,location] Arquitectura / XIP / Chunking (2 / 3) Arquitectura / XIP / Chunking (3 / 3) Regras de dependência Servem para extrair dependências (relações) entre nós Providenciam um conhecimento mais rico relativo ao texto processado Exemplo Marcar um nó como entidade mencionada Partido Social Democrata São usadas no XIP para: Estabelecer relações de dependência entre os nós Marcar os nós como entidades mencionadas NP{?*, noun#1[partido]} if ( ~NE[partido](#1) ) Sintaxe padrão if ( condição ) NE[...] NE[collective=+, institution=+, partido=+](#1) Arquitectura / XIP / Léxico Ficheiros de léxico Ficheiros de texto, começam com a indicação Vocabulary: Atribuição de traços Exemplos: Palavras com traço local: cordilheira : noun += [location=+, geographic=+, mountain=+]. ilha : noun += [location=+, geographic=+, island=+]. Palavras com traço organizacional: NATO : noun += [collective=+, institution=+, acron=+]. Apple : noun += [collective=+, institution=+]. Entre muitos outros L 2 F - Spoken Language Systems Laboratory 18
4 Contribuições Contribuições / Directivas (1 / 4) Novas Directivas de Classificação Segmentação Novo conjunto de Directivas de Classificação Inspiradas pelas directivas do Segundo HAREM, mas com diferenças substanciais Consistência Adopção de Directivas mais focadas na utilização prática de sistemas que precisem de REM As antigas estavam demasiado afastadas destas necessidades Léxico e regras Metonímia Contribuições / Directivas (2 / 4) Contribuições / Directivas (3 / 4) Segundo HAREM Novas directivas Segundo HAREM Novas directivas Individual País Divisão País Divisão Cargo Pessoa Humano Região Criado Região GrupoCargo Construção Construção Pessoa GrupoMembro Individual Rua AguaMassa Rua AguaMassa Membro GrupoInd Povo Humano Cargo Local Físico AguaCurso Relevo Planeta Ilha Local Físico AguaCurso Relevo Planeta Ilha Organização Administração Empresa Colectivo Administração Instituição Região Outro Sítio RegiãoNatural Sítio Instituição Grupo Virtual Obra ComSocial Virtual Documentos Outro Contribuições / Directivas (4 / 4) Contribuições / Segmentação Segundo HAREM Quantidade Valor Moeda Novas directivas Quantidade Moeda Valor Classificação Números por extenso eram apanhados token a token e aglomerados mais tarde Script de segmentação alterado para suportar números por extenso De 1 até Misturas de dígitos com palavras também são aceites (e.g. 2 mil ) Dezenas, centenas e milhares também são aceites (e.g. duas centenas ) Classificação ResultadosDesportivos Mais tempo de processamento na fase inicial, mas menos trabalho em fases posteriores, porque existem menos tokens para analisar 0,11 mseg/palavra -> 0,20 mseg/palavra 23 24
5 Contribuições / Consistência Contribuições / Léxico e regras Cadeia de processamento muito longa Gera inconsistências pelo caminho Lemas desactualizados no XIP devido a mudanças no RuDriCo Regras não eram corridas, logo os nós não ganhavam os traços e as entidades não eram apanhadas Tarefa fundamental para acompanhar o desenvolvimento do RuDriCo regras em regras em 2010 Melhorias nas categorias VALOR, HUMANO e LOCAL Muito mais léxico (sobretudo na categoria Humano) Aproximadamente: 200 novas entradas para a categoria VALOR novas entradas para a categoria HUMANO 200 novas entradas para a categoria LOCAL Aproximadamente 450 regras corrigidas, melhoradas e/ou criadas Contribuições / Metonímia (1 / 5) Contribuições / Metonímia (2 / 5) O que é a metonímia? Literalmente, mudança de nome Designa a substituição de um nome por um outro nome, normalmente tendo ambos uma relação parte-todo (ou metonímica ) Exemplos Portugal votou a favor desta moção na ONU Portugal não conseguiu chegar aos quartos-de-final no Mundial de Futebol de 2010 Grande impacto em REM, bem como noutras tarefas de PLN Difícil capturar a relação entre um nome, explícito, e outro nome, implícito No Segundo HAREM, a metonímia estava espalhada por muitas categorias Se uma entidade fosse identificada e classificada como metonímica, o output mostrava a nova categoria, o novo tipo e o novo subtipo (se aplicável) Impossível perceber a alteração que se deu Adopção de uma nova propriedade XML particular para representar casos de metonímia <EM MET-CAT=... CATEG=... TIPO=... SUBTIPO=... > </EM> Novas regras de dependência para cobrir mais casos Existem cerca de 30 regras para cobrir casos de VALOR, HUMANO e LOCAL São necessárias muitas mais Contribuições / Metonímia (3 / 5) Contribuições / Metonímia (4 / 5) Exemplos Antes (Segundo HAREM) <EM CATEG= ORGANIZACAO TIPO= ADMINISTRACAO >Portugal</EM> ratificou o tratado Depois (novas directivas) <EM MET-CAT= HUMANO COLECTIVO CATEG= LOCAL TIPO= CRIADO SUBTIPO= PAIS >Portugal</EM> ratificou o tratado Abordagem seguida Uma entidade tem sempre uma classe base Em caso de metonímia, a entidade sofre uma transição metonímica entre classes Transições suportadas: LOCAL para HUMANO HUMANO COLECTIVO para HUMANO INDIVIDUAL HUMANO COLECTIVO para LOCAL Exemplos 29 30
6 Contribuições / Metonímia (5 / 5) LOCAL para HUMANO Cristiano Ronaldo conquistou a admiração da Inglaterra HUMANO COLECTIVO para HUMANO INDIVIDUAL O GNR constatou que eu ia em excesso de velocidade HUMANO COLECTIVO para LOCAL No ano passado estive na Google 31 L 2 F - Spoken Language Systems Laboratory 32 Avaliação / Contextualização Avaliação / Cenários de avaliação Detalhes do corpus de avaliação Foram usados os programas de avaliação do Segundo HAREM, adaptados às novas categorias Anotação feita por Tipo de anotação Corpus de avaliação (Colecção Dourada) Linguista Manual, de acordo com as novas directivas Número de palavras ~ Número de entidades ~ (~ 280 de metonímia) sem metonímia Avaliação de cada categoria em separado Avaliação global com metonímia Avaliação apenas das entidades metonímicas Avaliação global Estabelecer o impacto da metonímia nos resultados Avaliação / Métricas Avaliação / Resultados sem metonímia (1 / 2) Uma entidade mencionada pode estar Certa, Em falta, ou ser Espúria Identificação sem metonímia Foram usadas as seguintes métricas na avaliação: Precisão Abrangência Medida-F LOCAL HUMANO VALOR GLOBAL Precisão Abrangência Medida-F 35 36
7 Avaliação / Resultados sem metonímia (2 / 2) Avaliação / Resultados com metonímia (1 / 2) Classificação sem metonímia Identificação com metonímia LOCAL HUMANO VALOR GLOBAL 0 Metonímia GLOBAL Precisão Abrangência Medida-F Precisão Abrangência Medida-F Avaliação / Resultados com metonímia (2 / 2) Avaliação / Impacto da metonímia Classificação com metonímia Ao introduzirmos avaliação de metonímia: A identificação sofre um decréscimo de aproximadamente 1% na precisão, 2% na abrangência e 2% na medida-f A classificação sofre um decréscimo de 0.3% na precisão, 0.4% na abrangência e 0.4% na medida-f A metonímia tem um impacto negativo mínimo nos resultados Metonímia GLOBAL Precisão Abrangência Medida-F Conclusões / Comentários finais A contribuição para umas novas Directivas de Classificação foi muito positiva A metonímia é agora tratada de uma maneira uniforme, mas ainda há muito por melhorar No geral, os resultados da avaliação foram bons A precisão foi abaixo do esperado. Os problemas existem e são conhecidos, faltou tempo para os corrigir A abrangência foi acima do esperado L 2 F - Spoken Language Systems Laboratory 41 42
8 Conclusões / Trabalho futuro Melhorar a precisão da categoria VALOR Melhorar a abrangência da categoria HUMANO Criar mais regras de dependência para cobrir mais casos de metonímia O método de propagação de traços ficou por melhorar. É importante torná-lo uma realidade para mais casos do que apenas para nomes de pessoas L 2 F - Spoken Language Systems Laboratory 43
Desafios. Calendário do HAREM (2008)
Desafios Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota HAREM clássico (seguindo genericamente o modelo de classificação proposto no Primeiro
Leia maisAdaptação do sistema de reconhecimento de entidades mencionadas da Priberam ao HAREM
Adaptação do sistema de reconhecimento de entidades mencionadas da Priberam ao HAREM Carlos Amaral, Helena Figueira, Afonso Mendes, Pedro Mendes, Cláudia Pinto, Tiago Veiga Priberam Informática Alameda
Leia maisUma Abordagem ao PÁGICO baseada no Processamento e Análise de Sintagmas dos Tópicos
Uma Abordagem ao PÁGICO baseada no Processamento e Análise de Sintagmas dos Tópicos Ricardo Rodrigues Hugo Gonçalo Oliveira Paulo Gomes CISUC, Universidade de Coimbra CISUC, Universidade de Coimbra CISUC,
Leia mais6 Atributos. A dívida da empresa subiu.
6 Atributos Para buscar o sentimento de um texto automaticamente precisamos encontrar boas pistas ao longo do discurso. Uma grande variedade de palavras e expressões possui conotação positiva ou negativa,
Leia maisAvaliação de Sistemas de Reconhecimento de Entidades Mencionadas. Linguateca
Avaliação de Sistemas de Reconhecimento de Entidades Mencionadas Simpósio Doutoral da Linguateca Por: Nuno Cardoso Orientadores: Eugénio de Oliveira (FEUP) Mário J. Silva (FCUL) Linguateca Estrutura da
Leia maisMarcação de Nomes Próprios usando técnicas de pesquisa local e recorrendo a fontes de conhecimento na Internet
Marcação de Nomes Próprios usando técnicas de pesquisa local e recorrendo a fontes de conhecimento na Internet João Laranjinho Universidade de Évora Évora, Portugal joao.laranjinho@gmail.com Irene Rodrigues
Leia mais4 Algoritmos de Aprendizado
4 Algoritmos de Aprendizado Este capítulo apresenta os algoritmos utilizados ao longo da dissertação e alguns utilizados como base por eles. Os algoritmos adotados são todos de aprendizado supervisionado.
Leia maisÍNDICE Capítulo 1. Avaliação conjunta Diana Santos Capítulo 2. Organização e resultados morfolímpicos Luís Costa, Paulo Rocha e Diana Santos
ÍNDICE Prefácio Lista dos capítulos Lista alfabética de autores Capítulo 1. Avaliação conjunta Diana Santos 1. Apresentação 2. O modelo da avaliação conjunta 2.1 Modelos de avaliação anteriores 2.2 Características
Leia mais03-Out-2006 III Simpósio Doutoral da Linguateca Out-2006 III Simpósio Doutoral da Linguateca 4
III Simpósio Doutoral da Linguateca Proposta de tese de doutorado: Uma metodologia para construção de ontologias e integração de Informação geográfica é pervasiva na web é transversal a vários domínios
Leia maisFolha 3 - Análise léxica
Folha 3 Análise léxica 1. Escrever um programa em FLEX que permite contar o número de ocorrências de uma cadeia de caracteres contida num ficheiro de texto. 2. Escrever um programa em FLEX que permite
Leia maisPlano de Estudos. Escola: Instituto de Investigação e Formação Avançada Grau: Programa de Doutoramento Curso: Informática (cód.
Plano de Estudos Escola: Instituto de Investigação e Formação Avançada Grau: Programa de Doutoramento Curso: Informática (cód. 264) 1. o Ano - 1. o Semestre INF9258D Iniciação à Investigação Informática
Leia maisCriação e expansão de geo-ontologias, dimensionamento de informação geográfica e reconhecimento de locais e seus relacionamentos em textos
Capítulo 8 Criação e expansão de geo-ontologias, dimensionamento de informação geográfica e reconhecimento de locais e seus relacionamentos em textos Marcirio Chaves Luís Costa, Diana Santos e Nuno Cardoso,
Leia maisO impacto de diferentes fontes de conhecimento na marcação de Nomes Próprios em Português
O impacto de diferentes fontes de conhecimento na marcação de Nomes Próprios em Português João Tomé da Silva Laranjinho and Irene Pimenta Rodrigues joao.laranjinho@gmail.com, ipr@di.uevora.pt Departamento
Leia maisGeração de Modelo para Reconhecimento de Entidades Nomeadas no OpenNLP
Geração de Modelo para Reconhecimento de Entidades Nomeadas no OpenNLP Gabriel C. Chiele 1, Evandro Fonseca 1, Renata Vieira 1 1 Faculdade de Informática Pontifícia Universidade Católica do Rio Grande
Leia maisÍndice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed
Classificação de textos para o ensino de português como segunda língua Pedro Santos Curto Conclusões, Contribuições e Trabalho futuro 1 2 Motivação Aplicações e escala da classificação de textos Motivação
Leia maisDirectivas para a identificação e classificação morfológica na colecção dourada do HAREM
Capítulo 17 Directivas para a identificação e classificação morfológica na colecção dourada do HAREM Nuno Cardoso, Diana Santos e Rui Vilela Este capítulo foi previamente publicado como Relatório Técnico
Leia maisEstrutura. O que é? História. Para que serve? Aplicações em que dá jeito: Reconhecimento de entidades mencionadas
Estrutura Reconhecimento de entidades mencionadas Diana Santos Linguateca www.linguateca.pt Palestra na PUC Rio 18 de Maio de 2006 Qual o problema? História Aplicações Uma digressão sobre anotação gramatical
Leia maisCompiladores. Análise Léxica
Compiladores Análise Léxica Regras Léxicas Especificam o conjunto de caracteres que constituem o alfabeto da linguagem, bem como a maneira que eles podem ser combinados; Exemplo Pascal: letras maiúsculas
Leia maisClefomania 2 F: Primeiros Passos
Clefomania QA@L 2 F: Primeiros Passos Ana Cristina Bastos Mendes Dissertação para obtenção do Grau de Mestre em Engenharia Informática e de Computadores Júri Presidente: Orientador: Co-orientador: Vogal:
Leia maisCorretor Gramatical Para o Emacs
Trabalho de Conclusão de Curso Thiago Maciel batista Orientador: Prof. Dr. Marcelo Finger Instituto de Matemática e Estatística Universidade de São Paulo 16 de novembro de 2010 Roteiro 1 Introdução 2 Processamento
Leia maisFamiliarização com a ferramenta JavaCC
Ficha nº 2 Familiarização com a ferramenta JavaCC Estrutura do ficheiro JavaCC O JavaCC utiliza um ficheiro com a extensão.jj, onde são descritos, pelo utilizador, o léxico e a sintaxe da linguagem e gera
Leia maisIntrodução ao Processamento de Línguas Naturais. SCC5908 Introdução ao Processamento de Língua Natural. Thiago A. S. Pardo
/0/0 Introdução ao Processamento de Línguas Naturais SCC5908 Introdução ao Processamento de Língua Natural Thiago A. S. Pardo Dilemas no Brasil Como lidar com a interdisciplinaridade Linda no papel, complicada
Leia maisReconhecimento e normalização de expressões temporais no HAREM 2. C. Hagège J. Baptista e N. Mamede
Reconhecimento e normalização de expressões temporais no HAREM 2 C. Hagège ( France ) Xerox Research Centre Europe, Grenoble J. Baptista e N. Mamede ( Portugal ) L2f INESC-ID Lisboa Plano da apresentação
Leia maisDeterminação do Grau de Similaridade entre Frases
Determinação do Grau de Similaridade entre Frases UC 21095 Projeto Final Licenciatura em Informática Estudante nº 1100194: Helena Sofia Felisberto Coelho Orientadora: Prof.ª Gracinda Carvalho Lisboa, setembro
Leia maisAula de hoje. Tipos de Dados e Variáveis. Constantes literais. Dados. Variáveis. Tipagem dinâmica. SCC Introdução à Programação para Engenharias
SCC 12 - Introdução à Programação para Engenharias Tipos de Dados e Variáveis Professor: André C. P. L. F. de Carvalho, ICMC-USP Pos-doutorando: Isvani Frias-Blanco Monitor: Henrique Bonini de Britto Menezes
Leia maisIdentificadores Nome de variáveis, constantes, métodos, etc...
IV.2 Aspectos Léxicos Convencionais Classes de símbolos Genéricos Token genérico / Lei de formação bem definida Podem possuir limitações de tamanho e/ou valor Possuem valor semântico o token deve ser acompanhado
Leia maisTrabalho de Linguagens Formais e Compilação
Trabalho de Linguagens Formais e Compilação Desenho de uma linguagem simples e do seu compilador para MIPS. (cod. 5387) Departamento de Informática Universidade da Beira Interior Ano lectivo 2012/2013
Leia maisIntrodução. Modelo de um Sistema de Comunicação
I 1 Comunicação de Dados e Redes de Computadores Introdução FEUP/DEEC/CDRC I 2002/03 MPR/JAR Modelo de um Sistema de Comunicação» Fonte gera a informação (dados) a transmitir» Emissor converte os dados
Leia maisAvaliação da qualidade de imagens 2D reconstruídas a partir de imagens holoscópicas 3D
Avaliação da qualidade de imagens 2D reconstruídas a partir de imagens holoscópicas 3D A tecnologia de imagens holoscópica, também conhecidas como imagens plenópticas, imagens integrais ou imagens de campo
Leia maisIV.2 Aspectos Léxicos Convencionais
IV.2 Aspectos Léxicos Convencionais Classes de símbolos Genéricos - Token genérico / Lei de formação bem definida - Limitações de tamanho e/ou valor - Possuem valor semântico o token deve ser acompanhado
Leia maistechnology Sumário technology A cadeia de Processamento de Língua Natural do L2F (em Dezembro de 2009)
Sumário A cadeia de Processamento de Língua Natural do L2F (em Dezembro de 2009) Arquitectura Parametrização Nuno Mamede Documentação Como Usar Trabalho em curso Trabalho futuro Equipa 1 2 Arquitectura
Leia maisUNIVERSIDADE DE LISBOA Faculdade de Ciências Departamento de Informática
UNIVERSIDADE DE LISBOA Faculdade de Ciências Departamento de Informática Prospecção de Conceitos Geográficos na Web David Soares Batista MESTRADO EM ENGENHARIA INFORMÁTICA Especialização em Arquitectura,
Leia maisDescrição da Linguagem DECAF
Descrição da Linguagem DECAF Eduardo Ferreira dos Santos 24 de maio de 2017 Abstract The project for the course is to write a compiler for a language called Decaf. Decaf is a simple imperative language
Leia maisSemântica no Reconhecedor Gramatical Linguístico
Workshop de Tecnologias Adaptativas WTA 2015 Semântica no Reconhecedor Gramatical Linguístico Ana Contier, Djalma Padovani, João José Neto Linguagem Natural - Desafios Crescente quantidade de documentos
Leia maisCompiladores 02 Analise léxica
Compiladores 02 Analise léxica Sumário Análise Léxica Definição: Lexema, tokens Tabela símbolos Expressões regulares, automatos Relembrando O compilador é dividido em duas etapas Análise Síntese Análise
Leia maisUtilização da Programação Declarativa para processamento do CETEMPúblico
Utilização da Programação Declarativa para processamento do CETEMPúblico Agostinho Monteiro monteiro.agostinho@gmail.com Júlio Barbas julio.barbas@gmail.com Nuno C. Marques nmm@di.fct.unl.pt PROPOR - Encontro
Leia mais1 Descrição da Linguagem LM
Descrição Formal da Linguagem LM Leandro Motta Barros Dezembro de 02001 1 Descrição da Linguagem LM LM é uma linguagem de programação funcional. LM não é ML. LM significa Leandro Motta, em homenagem a
Leia maisCompiladores. Análise lexical. Plano da aula. Motivação para análise lexical. Vocabulário básico. Estrutura de um compilador
Estrutura de um compilador programa fonte Compiladores Análise lexical () Expressões Regulares analisador léxico analisador sintático analisador semântico análise gerador de código intermediário otimizador
Leia maisGestão e Tratamento de Informação 1º semestre
DepartamentodeEngenhariaInformática 2009/2010 GestãoeTratamentodeInformação1ºsemestre Laboratório6 Exercícios Nesta aula de laboratório iremos resolver exercícios relacionados com extracção de informaçãoeprocessamentodedocumentostextuais.
Leia maisPolítica de Privacidade Este aplicativo coleta alguns dados pessoais de seus usuários. Resumo
Política de Privacidade Este aplicativo coleta alguns dados pessoais de seus usuários. Resumo Dados pessoais coletados para os seguintes fins e usando os seguintes serviços: Acesso a contas de serviços
Leia maisINE5416 Paradigmas de Programação. Ricardo Azambuja Silveira INE CTC UFSC E Mail: URL:
INE5416 Paradigmas de Programação Ricardo Azambuja Silveira INE CTC UFSC E Mail: silveira@inf.ufsc.br URL: www.inf.ufsc.br/~silveira Conceitos Léxica estudo dos símbolos que compõem uma linguagem Sintaxe
Leia maisEncontro 10 Anos da Linguateca PROPOR 2008 Aveiro Portugal
Marcirio Silveira Chaves Pólo XLDB da Linguateca LaSIGE Departamento de Informática Faculdade de Ciências da Universidade de Lisboa Encontro 10 Anos da Linguateca PROPOR 2008 Aveiro Portugal 9/16/08 1
Leia maisObjectivos / Competências Conteúdos Descrição dos Domínios de referência: Unidades temáticas
MATRIZ DA PROVA DE EXAME A NÍVEL DE ESCOLA AO ABRIGO DO DECRETO-LEI Nº 357/07, DE 29 DE OUTUBRO ESPANHOL NÍVEL DE INICIAÇÃO 10º ANO (Cursos Científicos- Humanísticos Decreto Lei nº 74/04, de 26 de Março)
Leia maisREMando para o futuro: reconhecimento de entidades mencionadas e não só
REMando para o futuro: reconhecimento de entidades mencionadas e não só Diana Santos e Nuno Cardoso Linguateca www.linguateca.pt Information and Communication Technologies 1 Resumo Introdução O que é REM?
Leia maisFERRAMENTA DE AUXÍLIO AO PROCESSO DE DESENVOLVIMENTO DE SOFTWARE INTEGRANDO TECNOLOGIAS OTIMIZADORAS
FERRAMENTA DE AUXÍLIO AO PROCESSO DE DESENVOLVIMENTO DE SOFTWARE INTEGRANDO TECNOLOGIAS OTIMIZADORAS Acadêmico: Roger Anderson Schmidt Orientador : Marcel Hugo Supervisor : Ricardo de Freitas Becker Empresa
Leia maisAVALIAÇÃO DA CONSCIÊNCIA LINGUÍSTICA ASPECTOS FONOLÓGICOS E SINTÁCTICOS DO PORTUGUÊS
AVALIAÇÃO DA CONSCIÊNCIA LINGUÍSTICA ASPECTOS FONOLÓGICOS E SINTÁCTICOS DO PORTUGUÊS AVALIAÇÃO DA CONSCIÊNCIA LINGUÍSTICA ASPECTOS FONOLÓGICOS E SINTÁCTICOS DO PORTUGUÊS Coordenação M. João Freitas Anabela
Leia maisProspecção de Conceitos Geográficos na Web
David Soares Batista Orientado por: Prof. Mário J. Gaspar da Silva XLDB, LaSIGE, Faculdade de Ciências November 13, 2009 Motivação Informação Geográfica na Web Análise da recolha da Web portuguesa de 2003
Leia maisSEMÂNTICA PARTE 3 ANÁLISE SEMÂNTICA 14/06/2012. SCC5908 Tópicos em Processamento de Língua Natural. Até agora, significado da sentença
SEMÂNTICA PARTE 3 SCC5908 Tópicos em Processamento de Língua Natural Thiago A. S. Pardo ANÁLISE SEMÂNTICA Até agora, significado da sentença Rhumba closed. e Closing(e) Closed(e,Rhumba) 2 1 ANÁLISE SEMÂNTICA
Leia maisCriação de estruturas de acolhimento dos centros de informação da rede de informação EUROPE DIRECT CONVITE À APRESENTAÇÃO DE PROPOSTAS GESTÃO DIRECTA
COMISSÃO EUROPEIA DIRECÇÃO-GERAL DA COMUNICAÇÃO Criação de estruturas de acolhimento dos centros de informação da rede de informação EUROPE DIRECT CONVITE À APRESENTAÇÃO DE PROPOSTAS GESTÃO DIRECTA A Comissão
Leia maisCompiladores. Análise Léxica
Compiladores Análise Léxica Cristiano Lehrer, M.Sc. Introdução (1/3) Análise léxica é a primeira fase do compilador. A função do analisador léxico, também denominado scanner, é: Fazer a leitura do programa
Leia maisA ferramenta make. A - Introdução. O C é orientado para a produção de aplicações informáticas de grande dimensão
A - Introdução O C é orientado para a produção de aplicações informáticas de grande dimensão Na geração de aplicações informáticas há ficheiros gerados a partir de outros: logo, os segundos têm obrigatoriamente
Leia maisLinguagens de Domínio Específico
Linguagens de Domínio Específico Fabio Mascarenhas 2016.1 http://www.dcc.ufrj.br/~fabiom/dsl Processamento de uma DSL Análise Sintática Descendente O analisador sintático descendente é parecido com o analisador
Leia maisFluxograma. Conjunto de símbolos utilizados em fluxogramas
27 Símbolo Nome Terminador Seta de fluxo Entrada de dados Atribuição Saída de dados Desvio condicional Declaração Fluxograma Descrição Indica o início e o fim do fluxo do algoritmo. Indica o sentido do
Leia maisLinguateca e Processamento de Texto Livre na Área da Saúde: Alguns Comentários e Sugestões
Linguateca e Processamento de Texto Livre na Área da Saúde: Alguns Comentários e Sugestões Liliana Ferreira e António Teixeira Encontro 10 anos: Linguateca Setembro 2008 Aveiro Estrutura 1 O nosso trabalho
Leia maisAspectos do analisador sintático Usabilidade da Dias de atraso
Aspectos do analisador sintático Usabilidade da Dias de atraso Grupo Interface Modularidade e Doc. Interna Doc. Externa Erros léxicos Cada teste vale (0.5) Total = (7,0) Nota Final fluxo de dados (0.5)
Leia maisMatéria: Desenho e desenvolvimento de tecnologias linguísticas
Introdução às tecnologias linguísticas Pablo Gamallo Otero Departamento de Língua Espanhola Universidade de Santiago de Compostela Matéria: Desenho e desenvolvimento de tecnologias linguísticas Mestrado
Leia maisLINGUAGENS FORMAIS Definições. Desenvolveram-se na História em função da necessidade dos grupos humanos que as empregavam
Linguagens Naturais LINGUAGENS FORMAIS Definições Desenvolveram-se na História em função da necessidade dos grupos humanos que as empregavam São muito ricas, mas também ambíguas e imprecisas. Ex.: João
Leia maisCompiladores - JFlex. Fabio Mascarenhas
Compiladores - JFlex Fabio Mascarenhas 2018.1 http://www.dcc.ufrj.br/~fabiom/comp JFlex Um gerador de analisadores léxicos que gera analisadores escritos em Java A sintaxe das especificações é inspirada
Leia maisINTRODUÇÃO À PROCESSOS
INTRODUÇÃO À PROCESSOS Na aula de hoje iremos aprender... O que é um processo Quais os tipos de processos A hierarquia de um processo Como representar graficamente um processo Como a qualidade do processo
Leia maisAgregação de conteúdos e construção de redes de recursosdigitais à medida
Agregação de conteúdos e construção de redes de recursosdigitais à medida José Carlos Ramalho jcr@di.uminho.pt jcr@keep.pt 2011 05 24 Seminário: Ambiente Digital Aberto O que está a acontecer Mudança de
Leia maisCompiladores - JFlex. Fabio Mascarenhas Monday, April 15, 13
Compiladores - JFlex Fabio Mascarenhas - 2013.1 http://www.dcc.ufrj.br/~fabiom/comp JFlex Um gerador de analisadores léxicos que gera analisadores escritos em Java A sintaxe das especificações é inspirada
Leia maisRecapitulando... Abordagens: PLN. Abordagens: PLN 29/03/2012. Introdução ao Processamento de Línguas Naturais. Distribuição de palavras
Introdução ao Processamento de Línguas Naturais SCC5908 Introdução ao Processamento de Língua Natural Thiago A. S. Pardo Recapitulando... Abordagens superficiais vs. profundas Simbolismo vs. estatística
Leia mais% 70 54,5. 2 Inclui atividades de inovação abandonadas ou incompletas
Principais resultados do CIS 214 - Inquérito Figura 1 Atividades de, CIS 212 - CIS 214 () Comunitário à Inovação 7 6 54,5 53,8 Setembro de 216 5 4 3 41,2 44,6 25,9 28,3 35,2 33,5 33, 32,6 26,1 2 A Direção-Geral
Leia maisObjectivos / Competências Conteúdos Descrição dos itens
MATRIZ DA PROVA DE EXAME A NÍVEL DE ESCOLA AO ABRIGO DO DECRETO-LEI Nº 357/07, DE 29 DE OUTUBRO ESPANHOL NÍVEL DE INICIAÇÃO 12.º ANO (Cursos Científicos- Humanísticos Decreto Lei nº 74/04, de 26 de Março)
Leia maisCompiladores. Prof. Bruno Moreno Aula 8 02/05/2011
Compiladores Prof. Bruno Moreno Aula 8 02/05/2011 RECONHECIMENTO DE TOKENS Reconhecimento de Tokens Até aqui aprendemos a identificar tokens Para reconhecimento, a única abordagem utilizada foi árvores
Leia maisAnálise Sintática de Frases utilizando Gramáticas Livres de Contexto Probabilísticas
Universidade de São Paulo Mestrado em Ciência da Computação Instituto de Matemática e Estatística Disciplina MAC5725 Lingüística Computacional Análise Sintática de Frases utilizando Gramáticas Livres de
Leia maisa 2009/2010 Classificação Orientadores 28 de Julho de
Universidade Nova de Lisboa Faculdade de Ciências e Tecnologia Departamento de Informátic ca Dissertação de Mestrado em Engenharia InformáticaI a 2009/2010 Classificação Automática de Textos baseada em
Leia maisAbordagens na Tradução Automática
Abordagens na Tradução Automática Alberto Manuel Brandão Simões ambs@di.uminho.pt Escola de Verão Junho 2009 Alberto Simões Abordagens na Tradução Automática (1/38) 1 Arquitecturas de Tradução Automática
Leia maisCompiladores Ciência e Tecnologia da Computação Engenharia Informática e de Computadores
Compiladores Ciência e Tecnologia da Computação Engenharia Informática e de Computadores Análise Semântica Universidade dos Açores Departamento de Matemática www.uac.pt/~hguerra Análise semântica 3ª etapa
Leia maisNovas Ferramentas e Recursos Linguísticos para a Tradução Automática
Novas Ferramentas e Recursos Linguísticos para a Tradução Automática Por ocasião d O Fim do Início de uma Nova Era no Processamento da Língua Portuguesa Anabela Barreiro barreiro_anabela@hotmail.com FLUP
Leia maisProcura-PALavras (P-PAL):
II Jornadas Internacionais Per-Fide Corpora e Terminologia I 6-7 Junho, 2013 I Braga: Universidade do Minho, Portugal Procura-PALavras (P-PAL): Da constituição do corpus à base lexical Ana Costa 4, Ana
Leia maisPesquisa Digital PATRICIA para Consultas a Banco de Dados em Linguagem Natural
Pesquisa Digital PATRICIA para Consultas a Banco de Dados em Linguagem Natural Rodrigo Bonone Moreira 1, Alexandre de Oliveira Zamberlan 1 1 UNIFRA Centro Universitário Franciscano Curso de Ciência da
Leia maisLinguagens de Domínio Específico
Linguagens de Domínio Específico Fabio Mascarenhas 2016.1 http://www.dcc.ufrj.br/~fabiom/dsl Processamento de uma DSL Análise sintática A análise sintática quebra o texto de um programa na sua estrutura
Leia maisHistória, Língua e Informática Interfaces
História, Língua e Informática Interfaces Departamento de Informática Universidade de Évora Paulo Quaresma pq@di.uevora.pt L2F/INESC-ID CITI/UEvora 1 História, Língua e Informática - Reconhecimento de
Leia maisTÉCNICO EM MANUTENÇÃO E SUPORTE EM INFORMÁTICA FORMA SUBSEQUENTE. Professora: Isabela C. Damke
TÉCNICO EM MANUTENÇÃO E SUPORTE EM INFORMÁTICA FORMA SUBSEQUENTE Professora: Isabela C. Damke isabeladamke@hotmail.com Linguagem de Programação Uma linguagem de programação é um conjunto de símbolos (
Leia maisR3M, uma participação minimalista no Segundo HAREM
Capítulo 10 R3M, uma participação minimalista no Segundo HAREM Cristina Mota Cristina Mota e Diana Santos, editoras, Desafios na avaliação conjunta do reconhecimento de entidades mencionadas: O Segundo
Leia maisUnidade III ORGANIZAÇÃO DE COMPUTADORES. O que quer dizer 14?
Unidade III 6 CIRCUITOS DIGITAIS 6.1 Sistemas de numeração O que quer dizer 14? Sabemos, por força de educação e hábito, que os algarismos 1 e 4 colocados desta forma representam a quantidade catorze.
Leia maisIntrodução à Programação
Introdução à Programação Linguagens de Programação: sintaxe e semântica de linguagens de programação e conceitos de linguagens interpretadas e compiladas Engenharia da Computação Professor: Críston Pereira
Leia mais3. Linguagem de Programação C
Introdução à Computação I IBM1006 3. Linguagem de Programação C Prof. Renato Tinós Departamento de Computação e Matemática (FFCLRP/USP) 1 Principais Tópicos 3. Linguagem de programação C 3.1. Conceitos
Leia mais18 Introdução à. Semântica
18 Introdução à Semântica 5 Introdução UNIDADE 1: O significado 9 1. Objectivos da Unidade 1 9 1.1. Em busca do sentido 13 1.2. A semiótica 22 1.3. A semântica 30 1.4. A semântica e a cognição UNIDADE
Leia maisSegundo HAREM: Balanço e perspectivas de futuro
Capítulo 6 Segundo HAREM: Balanço e perspectivas de futuro Diana Santos, Cláudia Freitas, Hugo Gonçalo Oliveira, Paula Carvalho e Cristina Mota Cristina Mota e Diana Santos, editoras, Desafios na avaliação
Leia maisAgrupamento de Escolas de S. Pedro do Sul Escola-sede: Escola Secundária de São Pedro do Sul
Agrupamento de Escolas de S. Pedro do Sul 161780 Escola-sede: Escola Secundária de São Pedro do Sul INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA 2.º CICLO DO ENSINO BÁSICO ANO LETIVO: 2016/2017 1 ª /
Leia maisCompilador de LP3 para C3E e P3
Compilador de LP3 para C3E e P3 Luís Gil 1 13 de Junho de 2005 1 estudante de Ciências Informáticas no Instituto Superior Técnico 1 Introdução Este relatório descreve a sintaxe e a semântica da Linguagem
Leia maisLinguagens de Domínio Específico
Linguagens de Domínio Específico Fabio Mascarenhas 2016.1 http://www.dcc.ufrj.br/~fabiom/dsl Processamento de uma DSL Erros Uma falha em um parser de combinadores tem dois significados: A alternativa que
Leia maisNúmero: Nome: Compiladores, LEIC Alameda. Teste 1 (2010/04/17, 11:00, 90 minutos)
Compiladores, LEIC Alameda Compiladores, LEIC Alameda 1/6 Ano Lectivo 2009/2010, 2º Semestre Ano Lectivo 2009/2010, 2º Semestre Teste 1, 2009/04/17, 11:00, 90 minutos Teste 1 (2010/04/17, 11:00, 90 minutos)
Leia maisAbertura científica: processamento computacional da língua portuguesa. Interdisciplinaridade. Nível esperado. Aulas teóricas e práticas
Abertura científica: processamento computacional da língua portuguesa Diana Santos Primeira Escola de Verão da Linguateca Interdisciplinaridade Uns vêm de Letras Outros de informática Mas o caminho a seguir
Leia maisArquitecturas de Software Enunciado de Projecto 2007 2008
UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR TÉCNICO Arquitecturas de Software Enunciado de Projecto 2007 2008 1 Introdução Na primeira metade da década de 90 começaram a ser desenvolvidas as primeiras
Leia maisAULA TEÓRICA 3 Tema 2. Introdução a programação em Java (JVM, JDK)
AULA TEÓRICA 3 Tema 2. Introdução a programação em Java (JVM, JDK) Ø LP Java. Estrutura de um programa em Java. Ø Conjunto de caracteres utilizado. Ø Identificadores. Ø Variáveis e constantes. Ø Tipos
Leia maisMCZA Processamento de Linguagem Natural Modelando a linguagem com N-gramas
MCZA017-13 Processamento de Linguagem Natural Modelando a linguagem com N-gramas Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 1Q-2018 1 Outras abordagens para stemming? 2 Bibliografia Daniel Jurafsky
Leia maisPrincipais Resultados CIS 2016 Inquérito Comunitário à Inovação CIS 2016
Principais Resultados CIS 216 Inquérito Comunitário à Inovação CIS 216 1 FICHA TÉCNICA Título Principais resultados: CIS 216 Inquérito Comunitário à Inovação Autor Direção-Geral de Estatísticas da Educação
Leia maisConceitos básicos de programação
Para aprender uma linguagem de programação podemos começar por conhecer os vocábulos ou símbolos que formam o seu léxico e depois aprender como esses vocábulos integram as instruções (frases) que compõe
Leia maisInformação-Prova de Equivalência à Frequência
Agrupamento de Escolas Fernão de Magalhães Informação-Prova de Equivalência à Frequência Exame de Equivalência à Frequência Espanhol 11º Ano Nível de Iniciação Prova 375 2017 Ensino Secundário I Introdução
Leia maisO Futuro da Internet
Web 1.0... Web 2.0... WEB 3.0 Web Semântica e as novas normas HTML5 e CSS3 Ricardo André Pereira Freitas rfreitas@fam.ulusiada.pt Universidade Lusíada Norte, Campus Vila Nova de Famalicão Portugal Fevereiro
Leia maisSCC5869 Tópicos em Processamento de Língua Natural. Expressão lingüística representação do significado. São necessários para automação do processo
SEMÂNTICA PARTE 2 SCC5869 Tópicos em Processamento de Língua Natural Thiago A. S. Pardo ANÁLISE SEMÂNTICA Expressão lingüística representação do significado São necessários para automação do processo Grande
Leia maisLinguagens de Programação
O estudante estuda muito. Regras: 7 9 12 14. . Regras: 2 4 . Regras: 1 Representar através de uma árvore de derivação. 77 O estudante estuda muito.
Leia maisImplementação de um sistema de validação estatística configurável de dados
Implementação de um sistema de validação estatística configurável de dados Eduardo Dias Filho Supervisores: João Eduardo Ferreira e Pedro Losco Takecian 16 de novembro de 2014 Introdução Table of Contents
Leia mais