ATITUDE LINGUÍSTICA NO SISTEMA DE CONVERSÃO DE GRAFEMA PARA FONE

Documentos relacionados
Processamento de texto escrito em Linguagem Natural para um Sistema Conversor Texto-fala. Acadêmico: Thiago M. Oechsler Orientadora: Joyce Martins

Os recursos da Linguateca ao serviço do desenvolvimento da tecnologia de fala na Microsoft. Daniela Braga e Miguel Sales Dias

PROCESSAMENTO DIRIGIDO DE ROTAS ATRAVÉS DE TEXTO-FALA

BOLSÃO 2017 / 6º ANO

Procura-PALavras (P-PAL):

RESUMO 1. INTRODUÇÃO 2. FORMALIZAÇÃO LINGÜÍSTICA DO SISTEMA VOCÁLICO DO PORTUGUÊS FALADO NO BRASIL

O ESTUDO DO VOCABULÁRIO

Sistemas de Informação

O ESTUDO DAS PALAVRAS

Listas de frequência de palavras como marcadores de estilo no reconhecimento de autoria. Rui Sousa Silva

CURSO ANO LETIVO PERIODO/ANO Departamento de Letras º CÓDIGO DISCIPLINA CARGA HORÁRIA Introdução aos estudos de língua materna

Sara Candeias 1 O DESAFIO DA PARTICIPAÇÃO HUMANA DO IT - COIMBRA NO PÁGICO

DIÁLOGO ENTRE HOMENS E MÁQUINAS O PAPEL DO LINGUISTA NESTE NOVO FORMATO DE COMUNICAÇÃO

Prefácio índice geral Lista das abreviaturas 14 Lista dos símbolos 16 Introdução geral 17

Estrutura e Processo de Formação da Palavra

MAC 499 TRABALHO DE FORMATURA SUPERVISIONADO. Antônio Galves Arnaldo Mandel Denis Antônio Lacerda

CAPÍTULO 1 O ESTUDO DAS PALAVRAS

Procura-PALavras (P-PAL):

Dicionário De Termos Gramaticais

Sónia Frota, Fernando Martins & Marina Vigário

CONTEÚDOS DIVERSIFICADOS, DE ACORDO COM AS NECESSIDADES LINGUISTICAS, CURRICULARES E DE INTEGRAÇÃO DOS ALUNOS.

Português - alfabeto; - sequência alfabética; - formação de palavras; - leitura e interpretação (imagem, palavra, frase e texto).

Relatório. Ano lectivo Dados extraídos da Plataforma Moodle da DGIDC.

CONTEÚDOS APS 1º BIMESTRE/2018 2º ANO

Universidade de Santa Cruz do Sul UNISC Departamento de informática COMPILADORES. Introdução. Geovane Griesang

AVALIAÇÃO INSTRUMENTAL DOS CORRELATOS ACÚSTICOS DE TONICIDADE DAS VOGAIS MÉDIAS BAIXAS EM POSIÇÃO PRETÔNICA E TÔNICA *

DISCIPLINA DE LÍNGUA PORTUGUESA - 5.º Ano A 1. COMPETÊNCIAS ESSENCIAIS COMPETÊNCIAS GERAIS COMPETÊNCIAS ESPECÍFICAS

PROF. RENATO PORPINO

5 CLASSE, ESTRUTURA E FORMAÇÃO DE PALAVRAS, 7/ Palavra e morfema, 7/ Formação de palavras, 82 Famílias de palavras, 83

índice geral Prefácio, X/77

Corp-Oral: Corpus oral do

1º PERÍODO DISCIPLINA DE PORTUGUÊS [5.º] PLANIFICAÇÃO ANUAL 2018/ º ANO DE ESCOLARIDADE. DOMÍNIO CONTEÚDO TEMPOS 1 Educação Literária

Síntese da Planificação da Disciplina de Português-5.º Ano Ano letivo Período

FONOLOGIA. [»bobu] [»bobu] este par mínimo permite-nos ver que os sons [b] e [l] têm função distintiva dentro do

Morfologia e Classes Apresentação da Professora Gramaticais Licenciatura em Letras Língua Portuguesa e Literaturas Ementa Organização da Disciplina

Apresentação 11 Lista de abreviações 13. Parte I: NATUREZA, ESTRUTURA E FUNCIONAMENTO DA LINGUAGEM

P R O G R A M A. IV Unidade Prática de textos: Textos de autores portugueses e brasileiros dos séculos XIX e XX

GRAMÁTICA MODERNA DA LÍNGUA PORTUGUESA

ELEMENTAR da LÍNGUA PORTUGUESA

Capítulo 2 - Acentuação gráfica Regras gerais...10 Casos especiais...10 Prosódia...12 Exercícios...14

Planificação Anual º Ciclo / Português 6º ano MATRIZ DE CONTEÚDOS E DE PROCEDIMENTOS CONTEÚDOS PROCEDIMENTOS Nº DE BLOCOS

RELAÇÃO DOS VERBETES. B behaviorismo bilingüismo Black English boa formação

A Realização do Schwa no Português Europeu

Síntese da Planificação da Disciplina de Português-5.º Ano 2017/2018 Período

Inteligência Artificial. Prof. Tiago A. E. Ferreira Aula 21 Projeto de RNA

Marcação de Nomes Próprios usando técnicas de pesquisa local e recorrendo a fontes de conhecimento na Internet

GERAÇÃO COLÉGIO E CURSO Fazendo história, de geração em geração! 1º ANO

DISCIPLINA DE LÍNGUA PORTUGUESA - 5.º Ano 1. COMPETÊNCIAS ESSENCIAIS COMPETÊNCIAS GERAIS COMPETÊNCIAS ESPECÍFICAS

Planificação Simplificada de Português- 5ºano Ano letivo

Introdução: uma palavra inicial para confortar o coração...

Pedro Oliveira

Fonêmica. CRISTÓFARO SILVA, Thaïs. Fonética e fonologia do português: roteiro de estudos e guia de exercícios. 9. ed. São Paulo: Contexto, 2009.

DISCIPLINA DE LÍNGUA PORTUGUESA - 5.º Ano B 1. COMPETÊNCIAS ESSENCIAIS COMPETÊNCIAS GERAIS COMPETÊNCIAS ESPECÍFICAS

Síntese da Planificação da Disciplina de Português-5.º Ano Ano letivo Período

3 Formador: Luís Fernando Pinto Salema

Programa de Português 3º Ano

AULA 3: ANÁLISE FONÊMICA EM PORTUGUÊS 1. Introdução Fonêmica

DISCIPLINA DE LÍNGUA PORTUGUESA - 5.º Ano 1. COMPETÊNCIAS ESSENCIAIS COMPETÊNCIAS GERAIS COMPETÊNCIAS ESPECÍFICAS

Ill Encontro para o Processamento Computacional de Português Escrito e Ffêlado (PROPORES) Porto Alegre, Brasil, novembro de 1998

Programa - Nivel Superior

Marcação nominal de gênero no português, segundo Souza e Silva & Koch. Luiz Arthur Pagani

Capítulo1. Capítulo2. Índice A LÍNGUA E A LINGUAGEM O PORTUGUÊS: uma língua, muitas variedades... 15

Compiladores. Motivação. Tradutores. Motivação. Tipos de Tradutores. Tipos de Tradutores

SINTETIZADOR DE FALA DIDÁTICO MÓDULO ACÚSTICO MODELO DE FORMANTES

Color Eyes Detector. Duarte Petiz. DCC/FCUP

PLANIFICAÇÃO ANUAL 5º Ano. Disciplina de Português Ano Letivo /2017. Domínios/Conteúdos/Descritores. Unidade 0 Apresentações

Escutar discursos breves para aprender e construir conhecimentos.

ÍNDICE. AGRADECIMENTOS... v. TÍTULO E RESUMO... ix. TITLE AND ABSTRACT... xi. TITRE ET RÉSUMÉ... xiii. TÍTULO Y RESUMEN... xv

Marisa Cruz & Sónia Frota. XXVII Encontro Nacional da APL

Preâmbulo. Ensino do. Português

TONICIDADE E COARTICULAÇÃO: UMA ANÁLISE INSTRUMENTAL

Sumarizando: o que é uma língua. Métodos para seu estudo...44

Computação e Programação

Produção do Português Escrito

Ficha de acompanhamento da aprendizagem

Planificação Anual 4º Ano

PRÉ-EDITAL EBSERH

6 Atributos. A dívida da empresa subiu.

Dados pessoais. Nome. Apelido. Morada. Estado Civil

Fonética e Fonologia: modos de operacionalização

Síntese da Planificação da Disciplina de Língua Portuguesa 5 º Ano

CAPÍTULO 01 - INTERPRETAÇÃO DE TEXTO TIPOS DE TEXTO GÊNERO DE TEXTO TIPOS DE DISCURSO... 21

Avaliação da qualidade de imagens 2D reconstruídas a partir de imagens holoscópicas 3D

NOÇÕES DE FONÉTICA. Fonemas São as unidades sonoras mais simples da língua, ou seja, os sons distintivos que entram na formação do vocábulo.

Workshop 7. Workshop 7

Tarefa 01 Professora Lúcia. Tríade da Comunicação: Linguagem, Língua e Fala

MATRIZ DE CONTEÚDOS E DE PROCEDIMENTOS CONTEÚDOS PROCEDIMENTOS Nº DE BLOCOS

Identificar e compreender as alterações introduzidas pelo Acordo Ortográfico de 1990 na expressão escrita do português europeu.

CERT-A CERT-O CERT-A-MENTE CERT-EZA A - CERT - A - R

Planejamento Anual 2012

Árvores e Florestas Probabilísticas

Informações práticas sobre aulas de

Geração Colégio e Curso Resgatando valores e construindo verdadeiros cidadãos! VERIFICAÇÃO DE APRENDIZAGEM PARCIAL- UNIDADE 01 (ROTEIRO 1º ANO)

Planejamento Anual 2013

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

AGRUPAMENTO DE ESCOLAS CEGO DO MAIO PLANIFICAÇÃO ANUAL DISCIPLINA: Português Ano4 Ano letivo 2016/2017

ANEXO II MODELO DE REQUERIMENTO DE VAGA PARA CANDIDATO PORTADOR DE DEFICIÊNCIA

A ELISÃO DA VOGAL /o/ EM FLORIANÓPOLIS-SC RESULTADOS PRELIMINARES

Transcrição:

Coimbra, 10-11 de Dezembro de 2010 ATITUDE LINGUÍSTICA NO SISTEMA DE CONVERSÃO DE GRAFEMA PARA FONE Sara Candeias Fernando Perdigão 2005, it - instituto de telecomunicações. Todos os direitos reservados.

Sumário Sistema de conversão G-F Enquadramento Descrição do Módulo Exemplificação Conclusão / Discussão 2

Objectivo DESCRIÇÃO do sistema de Conversão Grafema-Fone (G-F) EXPLICITAÇÃO de algumas REGRAS LINGUÍSTICAS, considerando o Português Europeu (padrão) G-F? Um dos principais módulos de processamento de texto subjacentes à arquitectura de um sistema de Conversão Texto-Fala UTILIDADES do Conversão Texto-Fala Software de ensino de línguas e de e-learning em geral Sistemas de auxílio à leitura para cegos Sistemas de auxílio à navegação por GPS Sistemas de pergunta-resposta usadas em aplicações para telemóvel Aplicações industriais (máquinas com comandos mãos-livres) Aplicações médicas de monitorização de doentes 3

Normalizador de texto Marcador de tonicidade Conversor G-F Analisador morfossintáctico Modelos de entoação, durações e intensidade Determinação de foco Arquitectura do Sistema de Conversão Texto-Fala Esquema genérico Texto pré- processamento pós- processamento Análise do texto Transcrição Fonética Geração Prosódica Motor de Síntese Base de dados de voz Voz Sintética PROPOR 2008 4 10 Anos de Linguateca 2008.Setembro.11

Sistema de Conversão G-P (Grafema para Fone) Texto (grafemas) Divisão em palavras Conversor G-F Transcrições Fonéticas SAMPA Conversão G-F Quadros Teóricos Árvores de decisão (treinadas automaticamente) Modelos de «Tabela Look-Up» Abordagens baseadas em dicionários Abordagens por redes neuronais Máquinas de estados finitos Cadeias escondidas de Marcov Modelos estatísticos Modelos híbridos Abordagens baseadas em regras linguísticas 5

1. Siglas > Soletração 2. Lista de excepções Casos de alternância vocálica: afectados por metafonia: Casos no interior da flexão verbal: [E] > [e] medo [O] > [o] novo meto [e] : metes [E] Casos responsáveis pela própria etimologia do vocábulo: ferro [E] < FERRUnegro [e] < NIGRU- Conversor G-F Etapas 3. Vocábulos com 1, 2, 3 grafemas > Regras para 1, 2, 3 grafemas Regras concebidas a partir da sequências dos padrões gráficos Natura Corpora: 600M vocábulos 6

4. Afixos > Divisão entre afixos e radical 5. Conversor G-F (implementação de regras) Conversor G-F Etapas Marca a tonicidade das vogais Converte grafema>fone Regras para marcar Vog Tónicas Átonas Regras para marcar as Vog Nasais Regras para <Vog> (Regras para <Gl>) Regras para <Cons> Se <ã>, <õ> Se <Vog>+<m n(s)> pudim, confins Se <Vog>+<m n>+<cons> campo, canto 7

Regras para os grafemas <Vog> Exemplos Caso de <a> <â> <a> <â> [a 6 a~] regra padrão contextual fone exemplo obs. 1 + # 6 semana, gama 2 nasal + <m n nh> 6 ano, cama, banha ganha 3 + <i u> a pai, caixa, aula, flauta 4 = nasal a~ campo, cantar 5 + <l> + <Cons> a salvação, alterar 6 + <z> + # a eficaz, cartaz 7 = tónica a faculdade 8 por omissão 6 faculdade Caso de <e> <e> [E e @ i 6 6~j~] : 23 regras saud- faulh- 8

Caso de <c> <c> [s k ] regra padrão contextual fone exemplo obs. 1 + <e i> s aceitar, cifra Regras para os grafemas <Cons> Exemplos 2 + <t > k 7815 casos k bact- 25 casos -caract- -pact- 216 casos 451 casos -tact- 105 casos, tacto, tactear intelect- -lact- oct- hecto- facto, nectar 3 por omissão k caderno, acordar 106 casos 113 casos 18 casos, nocturno 8 casos factor, olfacto 9

Caso de <s> <s> [z Z S s ] Regras para os grafemas <Cons> Exemplos regra padrão contextual fone exemplo obs. 1 # + <*> + <Vog> s saber 2 <Vog> + <*> + <Vog> z coisa 3 <trans> <trâns> +<Vog> z transição, trânsito 4 <Cons> + <*> + <Vog> s inserir, salsa <ans> ( 3600 casos) 5 + <b d g m n l r v z> # z rasga, bisneto disjunto (?) 6 por omissão S casca, cores, constatar 10

Algoritmos de Conversão baseados em Regras Linguísticas Conclusão / Discussão optimizados as variações alofónicas dependentes do contexto são parâmetros extraídos automaticamente aquando da selecção das unidades feita pelo treino da base de dados problemas Alternâncias vocálicas [e] : [E]; [o] : [O] pares de homógrafos heterófonos (de categorias gramaticais distintas) (Nome : Verbo) <selo> [e] : <selo> [E]; <olho> [o] : <olho> [O] (Preposição: Verbo) <sobre> [o] : <sobre> [O] Soluções? Recolha exaustiva de homógrafos em Português? Regrar tipologias e implementá-las? Avaliar a performance do sistema? 11

Muito Obrigada Fim saracandeias@co.it.pt fp@co.it.pt Muito Obrigada [mu~j~tu] [obrigad6] 2005, it - instituto de telecomunicações. Todos os direitos reservados.