Coimbra, 10-11 de Dezembro de 2010 ATITUDE LINGUÍSTICA NO SISTEMA DE CONVERSÃO DE GRAFEMA PARA FONE Sara Candeias Fernando Perdigão 2005, it - instituto de telecomunicações. Todos os direitos reservados.
Sumário Sistema de conversão G-F Enquadramento Descrição do Módulo Exemplificação Conclusão / Discussão 2
Objectivo DESCRIÇÃO do sistema de Conversão Grafema-Fone (G-F) EXPLICITAÇÃO de algumas REGRAS LINGUÍSTICAS, considerando o Português Europeu (padrão) G-F? Um dos principais módulos de processamento de texto subjacentes à arquitectura de um sistema de Conversão Texto-Fala UTILIDADES do Conversão Texto-Fala Software de ensino de línguas e de e-learning em geral Sistemas de auxílio à leitura para cegos Sistemas de auxílio à navegação por GPS Sistemas de pergunta-resposta usadas em aplicações para telemóvel Aplicações industriais (máquinas com comandos mãos-livres) Aplicações médicas de monitorização de doentes 3
Normalizador de texto Marcador de tonicidade Conversor G-F Analisador morfossintáctico Modelos de entoação, durações e intensidade Determinação de foco Arquitectura do Sistema de Conversão Texto-Fala Esquema genérico Texto pré- processamento pós- processamento Análise do texto Transcrição Fonética Geração Prosódica Motor de Síntese Base de dados de voz Voz Sintética PROPOR 2008 4 10 Anos de Linguateca 2008.Setembro.11
Sistema de Conversão G-P (Grafema para Fone) Texto (grafemas) Divisão em palavras Conversor G-F Transcrições Fonéticas SAMPA Conversão G-F Quadros Teóricos Árvores de decisão (treinadas automaticamente) Modelos de «Tabela Look-Up» Abordagens baseadas em dicionários Abordagens por redes neuronais Máquinas de estados finitos Cadeias escondidas de Marcov Modelos estatísticos Modelos híbridos Abordagens baseadas em regras linguísticas 5
1. Siglas > Soletração 2. Lista de excepções Casos de alternância vocálica: afectados por metafonia: Casos no interior da flexão verbal: [E] > [e] medo [O] > [o] novo meto [e] : metes [E] Casos responsáveis pela própria etimologia do vocábulo: ferro [E] < FERRUnegro [e] < NIGRU- Conversor G-F Etapas 3. Vocábulos com 1, 2, 3 grafemas > Regras para 1, 2, 3 grafemas Regras concebidas a partir da sequências dos padrões gráficos Natura Corpora: 600M vocábulos 6
4. Afixos > Divisão entre afixos e radical 5. Conversor G-F (implementação de regras) Conversor G-F Etapas Marca a tonicidade das vogais Converte grafema>fone Regras para marcar Vog Tónicas Átonas Regras para marcar as Vog Nasais Regras para <Vog> (Regras para <Gl>) Regras para <Cons> Se <ã>, <õ> Se <Vog>+<m n(s)> pudim, confins Se <Vog>+<m n>+<cons> campo, canto 7
Regras para os grafemas <Vog> Exemplos Caso de <a> <â> <a> <â> [a 6 a~] regra padrão contextual fone exemplo obs. 1 + # 6 semana, gama 2 nasal + <m n nh> 6 ano, cama, banha ganha 3 + <i u> a pai, caixa, aula, flauta 4 = nasal a~ campo, cantar 5 + <l> + <Cons> a salvação, alterar 6 + <z> + # a eficaz, cartaz 7 = tónica a faculdade 8 por omissão 6 faculdade Caso de <e> <e> [E e @ i 6 6~j~] : 23 regras saud- faulh- 8
Caso de <c> <c> [s k ] regra padrão contextual fone exemplo obs. 1 + <e i> s aceitar, cifra Regras para os grafemas <Cons> Exemplos 2 + <t > k 7815 casos k bact- 25 casos -caract- -pact- 216 casos 451 casos -tact- 105 casos, tacto, tactear intelect- -lact- oct- hecto- facto, nectar 3 por omissão k caderno, acordar 106 casos 113 casos 18 casos, nocturno 8 casos factor, olfacto 9
Caso de <s> <s> [z Z S s ] Regras para os grafemas <Cons> Exemplos regra padrão contextual fone exemplo obs. 1 # + <*> + <Vog> s saber 2 <Vog> + <*> + <Vog> z coisa 3 <trans> <trâns> +<Vog> z transição, trânsito 4 <Cons> + <*> + <Vog> s inserir, salsa <ans> ( 3600 casos) 5 + <b d g m n l r v z> # z rasga, bisneto disjunto (?) 6 por omissão S casca, cores, constatar 10
Algoritmos de Conversão baseados em Regras Linguísticas Conclusão / Discussão optimizados as variações alofónicas dependentes do contexto são parâmetros extraídos automaticamente aquando da selecção das unidades feita pelo treino da base de dados problemas Alternâncias vocálicas [e] : [E]; [o] : [O] pares de homógrafos heterófonos (de categorias gramaticais distintas) (Nome : Verbo) <selo> [e] : <selo> [E]; <olho> [o] : <olho> [O] (Preposição: Verbo) <sobre> [o] : <sobre> [O] Soluções? Recolha exaustiva de homógrafos em Português? Regrar tipologias e implementá-las? Avaliar a performance do sistema? 11
Muito Obrigada Fim saracandeias@co.it.pt fp@co.it.pt Muito Obrigada [mu~j~tu] [obrigad6] 2005, it - instituto de telecomunicações. Todos os direitos reservados.