Making the most of a 100-year-old dictionary. Alberto Simões, Álvaro Iriarte

Documentos relacionados
Dicionário-Aberto: Construção semiautomática de uma funcionalidade codificadora

O presente manual tem como objectivo orientar os utilizadores a efectuarem o seu registo no SISO.

Redes Sociais. Informação sujeita a alterações Última atualização: 20/11/2015 Versão ETPICK 1.

B-On. A biblioteca do conhecimento online. Maria do Rosário 03 de Outubro de 2016

Fundo Florestal Permanente (FFP) Manual de Utilizador Externo Registo e autenticação na plataforma do ICNF (FAU)

Dicionário-Aberto: Construção semiautomática de uma funcionalidade codificadora

springerlink.com SpringerLink Referência rápida

ASSOCIAÇÃO PORTUGUESA DE SEGURADORES

REPOSITÓRIO DO ISPA GUIA DO AUTO-ARQUIVO

1.1 Candidaturas on-line

Manual de Utilização Balcão Digital

JusNet. solução integral de informação jurídica online

PASSO 1 - REGISTO. TUTORIAL ESSNorteCVP - CANDIDATURAS ONLINE

ESCLARECIMENTO SOBRE LIVROS DE RECLAMAÇÃO

REPOSITÓRIO DO ISPA GUIA DO AUTO-ARQUIVO

GUIA DE UTILIZAÇÃO DO PORTAL DE CANDIDATURAS CANDIDATURA AOS CURSOS TÉCNICOS SUPERIORES PROFISSIONAIS

GUIA DE APOIO CANDIDATURA

manual de procedimentos gestão documental - escolas manual de procedimentos gestão documental - escolas DREN

Tutorial Google Académico

Entrega de Dissertação de Mestrado

Picnik Manual e Guia de exploração do picnik para utilização em contexto de Educação Visual e Tecnológica currículo. Rosabela Agostinho Borges

Plataformas Informáticas. Correio Electrónico Intranet/MyNet

DOCUMENTO DE APOIO À CANDIDATURA ON LINE À BOLSA TERRITORIAL - REGIME DE ACESSO HABITAÇÃO MUNICIPAL

1. APLICAÇÃO Entrada na aplicação Recuperação de dados Atualização de dados Alteração de password...

Política de Privacidade Website

SISTEMA INTEGRADO DE REGISTO DA AGÊNCIA PORTUGUESA DO AMBIENTE SIRAPA. Lígia Varandas, 23 Novembro 2010, S. João da Madeira

Guia de Candidatura a Bolsa de Estudo SETEMBRO 2014

Pesquisa preliminar recorrendo a uma base bibliográfica ou motor de pesquisa para identificar os artigos relevantes sobre o assunto pretendido:

Guia Prático. de Registo, Preenchimento e Submissão de candidaturas à. Bolsa de Estudo

Recapitulando... Abordagens: PLN. Abordagens: PLN 29/03/2012. Introdução ao Processamento de Línguas Naturais. Distribuição de palavras

1. PROCESSO DE REGISTO DE DADOS POR ALUNO

M a n u a l d o C a n d i d a t o

SMS. Serviço de Manutenção de Software: Conheça todos os benefícios!

Ulisses Universidade de Lisboa

Serviços de Documentação da Universidade de Lisboa - Reitoria

IPV.ESTG Volume de Trabalho Total (horas): 106 Total Horas de Contacto: 50,7 T TP P PL OT ,7 Competências

Questões Mais Frequentes (FAQ)

ADENDA AO MANUAL VERSÃO 1.13

Guia de Instalação do Google Cloud Print

Manual do utilizador ON!Track. Versão móvel 2.3 Versão do manual 1.1

1 Candidaturas on-line

CONSELHO SUPERIOR DA MAGISTRATURA

Catálogo BloguesEDU Apoio técnico

ABD Arquivos e Bibliotecas Digitais

GO021 - Guia de candidatura à Universidade de Coimbra como usar o [pt] revisão: 2.0

PORTAL DO ASSOCIATIVISMO Plataforma de Registo das Associações e submissão de Candidaturas ao PAPC

20 Aula Digital Manual do Utilizador do Aluno

IPV.ESTG ,5 Volume de Trabalho Total (horas): 172 Total Horas de Contacto: 58,5 T TP P 39 19,5 Competências

Gestor de referências bibliográficas

2 Versão 1: Funcionalidade Básica e Interface Web

bases de dados de artigos científicos bases de dados de artigos científicos

O novo método de recolha de dados estatísticos nos tribunais

Instituto Superior de Engenharia de Lisboa

Procura-PALavras (P-PAL):

Pré-Processamento de Documentos

Guia de Instalação do "Google Cloud Print"

José Palma Fernandes. 17 de Maio de 2011 Sala Polivalente da Fundação Portuguesa das Comunicações. Apresentação Pública

Manual de Utilizador. Documento de Apoio. (Versão Janeiro 2019)

B-On Pesquisar Periódicos. Centro de Documentação e Biblioteca Faculdade de Ciências e Tecnologia Universidade Nova de Lisboa 2009

Ferramentas Web, Web 2.0 e Software Livre em EVT

O parceiro Certo na implementação do projeto de Faturação Eletrónica, Saiba Porquê!

GUIA RÁPIDO CLOUD BACKUP SOLUÇÕES CLOUD

Divisão de Gestão de ASSUNTOS ACADÉMICOS. Candidatura online

MANUAL DE CONFIGURAÇÃO DE CORREIO ELETRÓNICO

20 Aula Digital. Manual do Utilizador do Aluno. Versão 1.9

Rede HortiNET Guia de Utilização

Descrição de Funcionalidades

Livros. Operações básicas. Submenu Livro

Dr. José Palma Fernandes ( Coordenador do Estudo )

MANUAL DE UTILIZAÇÃO

Ferramentas Web, Web 2.0 e Software Livre em EVT

20 Aula Digital. Manual do Utilizador do Aluno. Versão 1.5

E.B. D. MANUEL I TAVIRA TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO. 5º Ano. Professor Tiago Pires

Ferramentas Web, Web 2.0 e Software Livre em EVT

Projeto Testes Intermédios (TI) 2013/2014. Manual de utilização da Extranet TI. Diretores e Gestores de Projeto

Seguinte Contas de Correio Eletrónico Seguinte Ficheiro Definições da Conta Adicionar Conta Configuração da Conta Automática O Seu Nome

Guia rápido de iniciação ao SAPO Campus

Word Completo. Apresentação OBJETIVOS. Microsoft Office

E-Portefólio da especificação ao processamento digital

Documento de Requisitos SISTEMA DE APOIO À ESCRITA (SAPES)

FLiP: O WordPress já tem um corretor ortográfico em Português

Oficina: O uso adequado das fontes de informação na área de Humanidades. Sandra Pedro da Silva Biblioteca da Faculdade de Ciências e Letras UNESP

Manual de Utilização. Balcão Digital

Passa a Passo de Solicitação de Viagem

Rede HortiNET. Guia de Utilização.

PARTICIPAÇÃO ELECTRONICA DE SINISTROS - ACIDENTES DE TRABALHO

Perfil Candidato. MANUAL DE UTILIZAÇÃO Módulo: Candidaturas online (2.º/3.º Ciclos e Pós-Graduações)

1.1 Candidaturas on-line

Mobilidade de Pessoal Não Docente

IPV.ESTG Volume de Trabalho Total (horas): 106 Total Horas de Contacto: 50,7 T TP P PL OT 19, ,5 11,7 Competências

SERVIÇ OS DO PEDIDO ONLINE DA PROPRIEDADE INDUSTRIAL - FAQ

1. A Loja Lisboa Online

Manual do utilizador Prestigio Nobile PER3562. Operações básicas

PEDIDO DE ACESSO AO COOPERA2020 PARA OS UTILIZADORES DOS PROJETOS APROVADOS

Aviso de Propriedade e Confidencialidade. Este documento é propriedade do INFARMED, I.P., e toda a informação nele incluído é confidencial.

Guia de Apoio credenciação no Portal Abril/2018

Transcrição:

Making the most of a 100-year-old dictionary Alberto Simões, Álvaro Iriarte

http://dicionario-aberto.net Tarefa 1: Criar utilizador no Dicionário-Aberto. 1. Aceder ao sítio do dicionário; 2. Usar ligação entrar/registar ; 3. Preencher formulário registar ; 4. Visitar caixa do correio, e esperar pelo e-mail de registo; 5. Confirmar registo no sítio do dicionário; 6. Entrar no sítio do dicionário com o utilizador criado.

Parte I História do Dicionário Aberto

Motivação Não existência de um dicionário livre de língua, da língua Portuguesa para PLN: Disponível para acesso local; Disponível em formato electrónico; Disponível em formato legível por computador;

Problemas Inexistência de mão de obra para a criação de um dicionário de raiz; Inexistência de editoras interessadas em disponibilizar versões livres dos seus dicionários; Existência de dicionários com mais de 90 anos, no domínio público em formato papel!

Desafio Desafiar equipa portuguesa dos Distributed Proofreaders do Projecto Gutenberg para transcrever um destes dicionários; Dicionário escolhido: Novo Diccionário da Língua Portuguesa de Cândido de Figueiredo (1913) Razão: digitalizado (imagens) pela Biblioteca Nacional.

Transcrição Processo demorado, por etapas, por voluntários; Obrigado, Manuela! Revisto por mais voluntários; Obrigado, Rita! Processo com mais de quatro anos!

Incorporação Transcrição num dialecto tipo Wiki; Adição diária de 100/200 palavras, desde início de 2007; Sítio on-line a partir de Junho de 2007! Palavras adicionadas disponíveis no dia seguinte! Incorporação terminada a 2 de Março de 2010!

Estatísticas

Estatísticas

Estruturação Formato usado simples para ser aprendido e usado pelos voluntários; Formato demasiado vago e ambíguo; Transformação num formato XML rico; Subconjunto do TEI para dicionários; De forma completamente automática!!

Modernização Dicionário com grafia de 1913! Modernização da grafia de forma semi-automática: 1. Construção de regras de conversão; 2. Validação manual! 3. Voluntários responsáveis, precisam-se.!

Modernização

Outras Funcionalidades Disponível em PDF e Base de Dados SQL; Disponível como motor de pesquisa para Firefox; Disponível em epub; Disponível em StarDict; Disponível em API RESTless: Aplicação para ios disponível; Aplicação para Android e Win8 em desenvolvimento.

Parte II Interface Geral

Pesquisa Simples

Sugestões léxicas

Folhear o Dicionário

Palavra aleatória

Palavras Favoritas

Histórico Ortográfico

Parte III Pesquisa Avançada

Pesquisa Avançada Pesquisa por afixos; Ocorrências nas definições; Relações léxico-conceptuais entre termos introduzidos; Resultados ordenados por relevância.

Pesquisa por prefixo

Pesquisa por sufixo

Pesquisa de infixos

Pesquisa Reversa base de dados conceptuais / dicionário onomasiológico / dicionário de produção ou codificador (mais do que um thesaurus, que ordena palavras por sinónimos, hiperónimos ou outras relações léxico-conceptuais)

Pesquisa Reversa dicionário codificador: endurecer + metal temperar

Pesquisa Ontológica Criação de uma ontologia de forma automática usando padrões (Hearst 1992)

Pesquisa Ontológica Completação da Ontologia por regras matemáticas Permite que se use informação incompleta: Verbete A indica sinonímia com B. Verbete B não faz qualquer referência a A

Estrutura Ontológica

Pesquisa Ontológica

Parte IV Exercícios

Procura por Afixos Palavras Cruzadas: _ F E U (Vértebra; 10 letras) E P I _ (Vértebra; 10 letras)

Pesquisa por Afixos Dicionário de Rimas (gráficas) Que palavras rimam com camafeu?

Pesquisa por Afixos Estudo de Morfologia (produtividade de afixos): Todos os adjectivos em -vel (como amável) podem formar advérbios em -velmente (amavelmente)?

Pesquisa por Afixos Estudo de Morfologia (produtividade de afixos): Um professor de Língua Portuguesa disse aos alunos que o sufíxo "-ería" em Espanhol, é sempre "-aria" em Português. É verdade? cafetería ES = cafetaria PT

Pesquisa Reversa Dicionários Ideológicos/Onomasiológicos: O que acontece à água com o frio? Quem é o médico dos olhos? Que palavras derivam do prefixo grego orthos?

Pesquisa Ontológica Procurar sargaço. O que difere da pesquisa reversa?

Pesquisa Ontológica Procurar pirilampo na pesquisa reversa, e na pesquisa ontológica. Quais são as diferenças?

Pesquisa Ontológica Que variedades de oliveiras (ou espécie de oliveiras ) há? Uso da pesquisa reversa Uso da pesquisa ontológica

Making the most of a 100-year-old dictionary Alberto Simões, Álvaro Iriarte