Divisão Silábica Automática tica do Texto Escrito e Falado João Paulo Teixeira, Paulo Gouveia, Diamantino Freitas 1 Instituto Politécnico de Bragança (Portugal) 1 Faculdade de Engenharia da Universidade do Porto (Portugal)
Estrutura da apresentação Motivação Breve Descrição Regras para a Divisão Silábica do Texto Escrito Regras para a Divisão Silábica do Texto Falado Testes e Análise de Resultados Conclusões 2
Motivação realização de estudos prosódicos enquadrados no desenvolvimento de um sintetizador de fala encarando a sílaba, como unidade relevante na determinação dos parâmetros prosódicos necessidade de ter o texto separado em sílabas como estrutura de dados a considerar no bloco prosódico e fonético do sintetizador 3
Descrição o algoritmo proposto realiza automaticamente a separação silábica de um texto em português com aplicação em duas situações distintas: texto escrito texto falado baseia-se no pressuposto de apenas se considerarem os seguintes tipos de sílabas: V, VC, VCC, CV, CVC, CCV e CCVC V - vogal ou ditongo; C - consoante 4
Regras p/ Texto Escrito Após a normalização do texto: procura-se decompor a palavra em sílabas que sejam combinações de letras do tipo: V, VC, VCC, CV, CVC, CCV e CCVC ocorrendo ambiguidade na regra anterior, isso deve-se à existência de duas consoantes entre duas vogais (...VCCV...) três consoantes entre duas vogais (...VCCCV...) 5
Regras p/ Texto Escrito, cont. RESOLUÇÃO do caso (...VCCV...) divisões possíveis: 1. VCC-V 2. VC-CV (ex: al-tas) 3. V-CCV (ex: a-tlas) resolução a 1ª hipótese é excluída uma vez que a divisão silábica nunca pode ocorrer entre uma consoante e uma vogal a 3ª só será escolhida se as duas consoantes constituírem um par de consoantes inseparáveis par de consoantes inseparáveis quando a 1ª delas pertencer ao conjunto {b, p, d, t, g, k, v, f} e a 2ª ao conjunto {l, r} 6
Regras p/ Texto Escrito, cont. ra s RESOLUÇÃO do caso (...VCCCV...) divisões possíveis: 1. V-CCCV ou VCCC-V 2. VC-CCV (ex: ul-tra) 3. VCC-CV (ex: obs-tar) resolução a 1ª hipótese é excluída uma vez que nunca podem ocorrer três consoantes seguidas numa mesma sílaba a 3ª só será escolhida se as primeiras duas consoantes forem inseparáveis, ou então a segunda a letra s quando a letra s precede outra consoante as duas pertencerão a sílabas diferentes 7
Regras p/ Texto Escrito, cont. Identificação de DITONGOS Quando no texto surgem duas vogais seguidas é necessário verificar se formam um ditongo ou um hiato Apenas são considerados ditongos decrescentes (semivogal após vogal) pois só esses são estáveis para a detecção de ditongos, procuram-se ocorrências de uma vogal seguida de uma semivogal ongos crescentes podem ser considerados como hiatos 8
Regras p/ Texto Escrito, cont. Identificação de SEMIVOGAIS uma vogal alfabética será considerada semivogal se for a 2ª de duas vogais seguidas, um i ou u, e diferente da vogal que a preceder (contra ex: ni-ilismo) e não lhe suceder : um r ou l como última letra da palavra (ex: ca-ir) um r ou l como 1ª de duas ou mais consoantes seguidas (ex: ca-irmos) a vogal u (ex: ca-iu) ou uma consoante indicadora de nasalidade (ex: a-inda) ivogal o considera-se ainda como semivogal a letra o quando precedida pela letra a (ex: ao) 9
Regras p/ Texto Falado Ao conjunto de tipo de sílabas inicialmente considerado acrescentam-se mais duas: C e CC resultantes da supressão das vogais em sílabas do tipo: CV, CVC e CCV Não se considera a supressão da vogal em sílabas do tipo CCVC por ser pouco frequente para evitar efeitos secundários procura-se então decompor a palavra em sílabas que sejam combinações de letras do tipo: V, VC, VCC, CV, CVC, CCV, CCVC, C e CC 10
Regras p/ Texto Falado, cont. Considerarmos válidas sílabas sem vogais complica, de sobremaneira, a correcta identificação das sílabas Torna-se, por isso, necessário considerar um conjunto adicional de regras (aqui utiliza-se o código SAMPA): as consoantes {l, r, S, z, Z}, quando seguidas de outra consoante, associam-se à sílaba anterior as consoantes {S, z, Z}, em final de palavra, ligam-se à sílaba anterior quando uma vogal preceder um dos pares de consoantes {bk, bd, bz, bs, bt, km, kn, ks, dz, dm, dk, ds, dv, fn, ft, gd, gm, gn, mn, ps, pn, pt, tm, tn} a separação será entre as consoantes ongos a identificação dos ditongos aparece simplificada, uma vez que, neste caso, as semivogais encontram-se já identificadas 11
Testes e Análise dos Resultados A metodologia seguida baseou-se no princípio da independência dos conjuntos de informação de desenvolvimento e de teste Para teste dos algoritmos, utilizou-se, como conjunto de informação, textos extraídos de publicações periódicas A verificação dos erros realizou-se por comparação do resultado dos algoritmos com o resultado de uma divisão manual dos mesmos textos A taxa de erro foi calculada com o nº de divisões silábicas incorrectas por nº de sílabas divididas, em permilagem 12
Testes e Análise dos Resultados, cont. TEXTO ESCRITO O algoritmo foi testado com um conjunto de 1164 palavras não repetidas, de duas ou mais letras Num total de 3387 sílabas ocorreram apenas 2 erros, correspondendo a uma taxa de 0.6 Embora os 2 erros tenham ocorrido em palavras distintas (cai-remos e reu-ni-ão) representam um mesmo tipo de erro hiato interpretado como ditongo decrescente Os erros não são de solução imediata veja-se o exemplo de Cai-ro e reu-má-ti-co As situações não resolvidas podem ser consideradas numa tabela de excepções 13
Testes e Análise dos Resultados, cont. TEXTO FALADO O algoritmo foi aplicado à sequência de fonemas etiquetados de um sinal de fala de 5mn de duração Num total de 1569 sílabas ocorreram 14 erros, correspondendo a uma taxa de 8.9 Os 14 erros ocorreram em 7 palavras distintas ft- bol, iv-de~-t- me~-t, mnis- te-riw, irs-po~s6-bli- da, i~d-s-tri- al, 6k-z6- s6~w, dmo~s-tr6- s6~w Todas as situações de erro resultam de sílabas em que foi omitida a vogal ficando a consoante dessas sílabas associada a sílabas vizinhas 14
Conclusões A aplicação dos algoritmos conduz a resultados ligeiramente diferentes para os dois casos (texto escrito e texto falado) deve-se à omissão de vogais no texto falado a taxa de erro é para os dois casos bastante baixa Dificuldade de aplicação deste conjunto de regras a palavras estrangeiras Para as aplicações que se pretendem dar aos algoritmos, os objectivos foram seguramente atingidos para estudo prosódico como parte integrante do bloco prosódico de um sintetizador 15