Inteligibilidade em Voz Sintetizada

Documentos relacionados

NCE/15/00099 Relatório preliminar da CAE - Novo ciclo de estudos

AERT EB 2/3 DE RIO TINTO CRITÉRIOS GERAIS DE AVALIAÇÃO DOS ALUNOS COM NECESSIDADES EDUCATIVAS ESPECIAIS DE CARATER PERMANENTE

INGLÊS INFORMAÇÃO PROVA. 1. Objeto de avaliação. Prova de Equivalência à Frequência de. Prova Fases 1ª e 2ª. 10.º e 11.º Anos de Escolaridade

DESENVOLVIMENTO DE COMPETÊNCIAS E TALENTOS

Exercícios Práticos para as Dificuldades de Aprendizagem

Entrevistas clínicas para estudar a flexibilidade no cálculo numérico

As informações apresentadas neste documento não dispensam a consulta da legislação em vigor e o Programa da disciplina.

Anexo II. Conclusões científicas e fundamentos para a recusa apresentados pela Agência Europeia de Medicamentos

O que é coleta de dados?

Lógicas de Supervisão Pedagógica em Contexto de Avaliação de Desempenho Docente. ENTREVISTA - Professor Avaliado - E 5

Papo com a Especialista

AGRUPAMENTO DE ESCOLAS DE SAMORA CORREIA ESCOLA BÁSICA PROF. JOÃO FERNANDES PRATAS ESCOLA BÁSICA DE PORTO ALTO

TÍTULO: TRABALHANDO SISTEMAS LINEARES ATRAVÉS DE SITUAÇÕES PROBLEMA CATEGORIA: EM ANDAMENTO ÁREA: CIÊNCIAS EXATAS E DA TERRA SUBÁREA: MATEMÁTICA

1 ACCLE Bateria de Testes de Avaliação das Competências de Linguagem para a Leitura e Escrita. Registo no IGAC n.º

Relatório de Investigação da Escola julho 2015

NCE/14/01786 Relatório final da CAE - Novo ciclo de estudos

A REGULAMENTAÇÃO DA EAD E O REFLEXO NA OFERTA DE CURSOS PARA FORMAÇÃO DE PROFESSORES

3 Metodologia 3.1. Tipo de pesquisa

NOTA DE APRESENTAÇÃO

Rotas da Leitura. Biblioteca Municipal de Beja. Cristina Taquelim. Introdução

CRITÉRIOS DE AVALIAÇÃO. Departamento de Expressões Educação Especial

Informação n.º Data: Para: Direção-Geral da Educação. Inspeção-Geral de Educação e Ciência. AE/ENA com ensino secundário CIREP

PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIAS DA REABILITAÇÃO PROCESSO SELETIVO 2013 Nome: PARTE 1 BIOESTATÍSTICA, BIOÉTICA E METODOLOGIA

COMISSÃO CIENTÍFICA DO CURSO DE MESTRADO EM ENSINO DE DANÇA ANO LECTIVO DE 2011/2012-1º SEMESTRE RELATÓRIO

PARLAMENTO EUROPEU. Comissão dos Assuntos Jurídicos PE v01-00

Como funciona uma aula de inglês na Language Plus

Grupo de Trabalho da Qualidade de Energia Elétrica (GT-QEE) Relatório da Reunião n.º 5

As informações apresentadas neste documento não dispensam a consulta da legislação referida e do Programa da disciplina.

ENSINO ESPECIAL PLANO PEDAGÓGICO

JANGADA IESC ATENA CURSOS

RELATÓRIO. Oficina de Formação

INFORMAÇÃO -PROVA DE EQUIVALÊNCIA À FREQUÊNCIA DE INGLÊS DO 2º CICLO

Prova Escrita (Código 21) / 2015

Em FORMATO E-LEARNING PQ A Página 1 de 6

Guia de Apoio ao Formando. Formação à distância

Agrupamento de Escolas Dr.ª Laura Ayres

1 Um guia para este livro

Os Segredos da Produtividade. por Pedro Conceição

Estudo Exploratório. I. Introdução. Pontifícia Universidade Católica do Rio de Janeiro Pesquisa de Mercado. Paula Rebouças

Direito a inclusão digital Nelson Joaquim

Liberdade e Autonomia no Estudo

MÍDIAS NA EDUCAÇÃO Introdução Mídias na educação

AUTO-AVALIAÇÃO DO AGRUPAMENTO

FÁBIO JOSÉ DE ARAUJO. Projeto Ensinando Educação Física com Jogos

INGLÊS PARA INICIANTES: ESTRATEGIAS DE COMUNICAÇÃO E INSERÇÃO NA CULTURA INGLESA

Tema I: Teoria Matemática das Eleições Nº de Aulas Previstas (90 m): 18

DISCUSSÕES UE/EUA RELATIVAS AO ACORDO SOBRE EQUIVALÊNCIA VETERINÁRIA

365 FRANCÊS (continuação-11.ºano) escrita e oral 11.ºano de escolaridade

Relatório de Gestão. Enquadramento Macroeconómico / Setorial

DESIDRATAÇÃO E ALTERAÇÕES COGNITIVAS

A ADEQUAÇÃO DO ENSINO ACADÉMICO ÀS NECESSIDADES DAS EMPRESAS: O CASO DA SIMULAÇÃO EMPRESARIAL EM FINANÇAS NO ISCA-UA

ORIENTAÇÕES PARA A APLICAÇÃO DAS NOVAS MEDIDAS EDUCATIVAS DO REGIME EDUCATIVO ESPECIAL

ADMINISTRAÇÃO I. Família Pai, mãe, filhos. Criar condições para a perpetuação da espécie

FICHA TÉCNICA AUTORIA DESIGN IMPRESSÃO TIRAGEM ISBN DEPÓSITO LEGAL EDIÇÃO. Relatório Síntese. Rita Espanha, Patrícia Ávila, Rita Veloso Mendes

358 INGLÊS (continuação-12.ºano) escrita e oral 12.ºano de escolaridade

Índice. 1. Metodologia de Alfabetização Aprendizagem da Escrita Aprendizagem da Leitura...6

UNIVERSIDADE FEDERAL DE SÃO JOÃO DEL REI

Agrupamento de Escolas de S. Pedro do Sul Escola-sede: Escola Secundária de São Pedro do Sul

AGRUPAMENTO DE ESCOLAS DE SAMORA CORREIA ESCOLA BÁSICA PROF. JOÃO FERNANDES PRATAS ESCOLA BÁSICA DE PORTO ALTO

Enoturismo em Portugal Caraterização das empresas e da procura

Projecto de Acompanhamento do Uso Educativo da Internet nas Escolas Públicas do 1.º ciclo no distrito de Bragança

ALEMÃO; ESPANHOL; FRANCÊS; INGLÊS Novembro de 2016

Entrevista ao Professor

3 Método 3.1. Entrevistas iniciais

NÚMEROS REAIS: APRENDIZAGEM ATRAVÉS DA HISTÓRIA E COM O AUXÍLIO DA CALCULADORA - UMA INTERVENÇÃO DA EQUIPE PIBID UEPB CAMPINA GRANDE

SEMINÁRIOS AVANÇADOS GESTÃO DE PROJECTOS

FMU - FACULDADES METROPOLITANAS UNIDAS E-COMMERCE, SOCIAL COMMERCE, MOBILE MARKETING E MARKETING DE PERMISSÃO.

Pesquisa Pantanal. Job: 13/0528

Ferramenta de Apoio ao Jogo 2 (Ensino da Leitura) incluído nos Jogos da Mimocas

PRINCÍPIOS ORIENTADORES DO PLANO DE REQUALIFICAÇÃO DOS EDIFÍCIOS DOS TRIBUNAIS (2012 / 2015)

Governança urbana, Estratégia 2020 e Crescimento Inteligente: Da retórica das cidades criativas à facilitação das dinâmicas criativas

Formulários FOLHA DE ROSTO

Apostar na cadeia de valor

NCE/12/00971 Relatório final da CAE - Novo ciclo de estudos

Palavras chave: Formação de Professores, Tecnologias Assistivas, Deficiência.

AULA. Natércia do Céu Andrade Pesqueira Menezes UNIVERSIDADE PORTUCALENSE. Doutora Sónia Rolland Sobral

Módulo 16 Redes sem Fio (Wireless)

AGRUPAMENTO DE ESCOLAS DE AVEIRO

PERGUNTAS FREQUENTES. Sobre Horários. Pessoal docente, escolas públicas. 1 Há novas regras para elaboração dos horários dos professores?

Divulgação de Dados Meteorológicos das Estações da Grande Florianópolis

Resistência de Bactérias a Antibióticos Catarina Pimenta, Patrícia Rosendo Departamento de Biologia, Colégio Valsassina

Evolução da população do Rio Grande do Sul. Maria de Lourdes Teixeira Jardim Fundação de Economia e Estatística. 1 - Introdução

FICHA DE CURSO DESIGNAÇÃO. DURAÇÃO 128 Horas + 3 horas de exame. ÁREA TEMÁTICA DA FORMAÇÃO 862 Segurança e Higiene no Trabalho

PIBIC 05/06. Departamento de Educação

MATERIAL E MÉTODOS RESULTADOS E DISCUSSÃO

PROGRAMA DE ACÇÃO COMUNITÁRIO RELATIVO À VIGILÂNCIA DA SAÚDE. PROGRAMA DE TRABALHO PARA 2000 (Nº 2, alínea b), do artigo 5º da Decisão nº 1400/97/CE)

Transcrição:

Synthetic Speech Intelligibility João Miguel Ferreira 1, 2 Marina Vigário 2 Fábio Fernandes 1 Fernanda Belchior 1 Susana Azevedo 1 Ana Rita Neca 1 1 Escola Superior de Saúde Instituto Politécnico de Setubal 2 Laboratório de Fonética do Centro de Linguistica da Universidade de Lisboa Lisboa 2014

Porquê estudar Inteligibilidade em Fala Sintetizada? Diversas patologias impedem o uso funcional da fala/voz, pelo que a fala/voz sintetizada é a alternativa mais funcional. A qualidade da mesma é fundamental para a eficácia comunicativa, sendo que a inteligibilidade é uma das medidas de qualidade. A qualidade da fala/voz sintetizada é ainda fundamental para o desenvolvimento linguístico dos utilizadores, tendo em consideração ser o modelo de aprendizagem dos mesmos.

Inteligibilidade em Fala Sintetizada Braga, Freitas, & Barros, (2002) referem-se à inteligibilidade da fala sintetizada como sendo um grau de compreensão de fala, sendo que a inteligibilidade demonstra a capacidade que o ouvinte tem de identificar palavras ou frases sintetizadas. Esta identificação refere-se a palavras e frases apresentadas isoladamente sem contexto linguístico (Ralston, Pisoni & Mullennix, 1989, citados por Koul & Clapsaddle, 2006).

Inteligibilidade em Fala Sintetizada O estudo de Logan, Greene & Pisoni ( 1989 cit. por Winters & Pisoni, 2004) revelou resultados bastante semelhantes entre a fala natural e sintetizadores de fala de alta qualidade (DECTalk) quando se usava a resposta fechada, e significativamente piores quando utilizavam a versão de resposta aberta. Quando se utilizavam sintetizadores de baixa qualidade a diferença era bastante significativa em ambos os estudos Um estudo para o PE utilizado a versão portuguesa do Dynamic Rhyme Test (DRT), comparando resultados entre jovens adulto e idosos, com voz sintetizada (voz Célia Acapela), apontava para taxas de acerto na ordem dos 90% (Ferreira; Laranjeira; Perpétua; 2012).

Inteligibilidade em Fala Sintetizada O DRT é aceite como um dos standards para avaliação da inteligibilidade, utilizando pares de palavras. O DRT ou o Modified Rhyme Test (MRT) apesar de apresentarem diversas vantagens como a fiabilidade, facilidade de aplicação em participantes inexperientes e facilidade de cotação (Logan, Pisoni Greeene 1985 cit por Koul, 2003), bem como as suas versões portuguesas, não têm em consideração a estrutura silábica do PE, nem o acento, nem o tamanho das palavras.

Experiência Inteligibilidade Tendo em consideração as fragilidades dos instrumentos utilizados, dada a sua não adequação ao PE, elaborou-se um novo instrumento, pensado para o PE, que será descrito mais à frente. Dada a falta de investigação relativa à qualidade dos SSF que suportam estas vozes, optamos por iniciar uma investigação a diversos aspetos das mesmas. Numa primeira fase a avaliação centra-se na Inteligibilidade, sendo que posteriormente nos focaremos em aspetos suprassegmentais (prosódia).

Experiência Inteligibilidade Comparar 3 vozes sintetizadas* entre si e com uma voz natural, relativamente a taxas de acerto e tempos de reação Hipótese Dado a voz eletrónica utilizada ser uma voz de alta qualidade, não é esperada diferença significativa na inteligibilidade. *As 3 vozes foram escolhidas por serem as que são mais utilizadas nos SSF do PE, em software de CAA respetivamente Voz Célia (Acapela Group, GRID II), Voz Joana (Nuance, Nuance Vocalizer) e Voz Madalena ( Nuance, Software Comunicar com Símbolos) ( Ferreira 2013)

Objetivos Contribuir para a melhoria da inteligibilidade dos sistemas de voz sintetizada. Comparando as vozes dos sistemas de síntese de fala para o Português Europeu, entre si e com uma voz natural Averiguar se o tipo de voz tem influência na taxa de acertos e tempos de reação

Experiência Inteligibilidade Instrumento de Avaliação Teve-se por base o modelo dos testes standard de avaliação da inteligibilidade de síntese de fala. Elaborou-se um novo instrumento tendo em conta o tamanho da palavras (nº de silabas), estrutura silábica e e distribuição de acento do PE. Não é tida em consideração a frequência dos segmentos no PE. Consulta da base de dados FrePOP 1.0 (Frota; Vigário; Martins & Cruz 2010) para as frequências de ocorrência no PE. Utilização da ferramenta FreP 3.1.1.1 (Martins ; Vigário& Frota ;2011) para verificação das frequências no instrumento.

Instrumento de Avaliação Localização do Acento Número de Sílabas Tipos Silábicos 157 pseudopalavras 157 palavras prosódicas 358 silabas

Metodologia Nº de sujeitos=80 18-25 anos PE língua materna S/ alterações auditivas (despiste auditivo prévio) 4 grupos de 20 sujeitos distribuídos pelas 4 vozes 4 vozes 3 de síntese de fala Célia, Madalena e Joana 1 voz natural (feminina) Cada grupo sujeito a uma só condição experimental Apresentação da experiência em SuperLab 4.5

Metodologia Foi pedido aos participantes que ouvissem os estímulos (pseudopalavras) e que imediatamente a seguir as escrevessem o mais adequadamente possível, na caixa de texto reservada para o efeito. Os estímulos eram apresentados pelo SuperLab, através de headphones e os participantes digitaram as respostas no computador.

Variáveis Participantes Sistemas de Síntese de Fala (SSF) /Vozes Taxa de Acerto Global (totais entre vozes) Tempo de Reação por tipo de SSF Taxas de Acerto Nº Sílabas por tipo de SSF Taxas de Acerto Acento por tipo de SSF

100,0 90,0 80,0 70,0 Taxa de Acerto Global Resultados 60,0 50,0 40,0 30,0 20,0 64,3 49,4 52,2 59,7 Mad Joan Cel Nat 10,0 0,0 Mad Joan Cel Nat Vozes

Taxa de Acerto por padrão acentual 100,00 Resultados 90,00 80,00 70,00 60,00 50,00 40,00 30,00 20,00 10,00 0,00 88 79 74 67 59 60 55 56 52 48 41 43 23 20 10 5 MAD JOAN CEL NAT Vozes mon gr ag esd

100,0 Acerto por Nº de Sílabas 90,0 Resultados 80,0 70,0 60,0 50,0 40,0 30,0 20,0 88,3 62,5 54,6 44,3 73,6 45,6 39,2 36,8 79,0 51,0 41,5 27,3 66,7 57,6 57,5 58,3 1 2 3 4+ 10,0 0,0 MAD JOAN CEL NAT Vozes

Tempo reação ms Inteligibilidade em Voz Sintetizada 800,00 700,00 600,00 500,00 543 Tempos de Reação 667 622 Resultados 400,00 300,00 200,00 384 442 460 429 304 100,00 0,00 Mad Joan Cel Nat Média e Mediana

Discussão Resultados Discussão Podemos verificar que a voz Madalena apresenta resultados globais superiores às outras vozes e inclusive à voz Natural. Estes resultados, contrariam a maioria dos estudos realizados para outras línguas. A voz Natural apresenta resultados muito consistentes e sempre acima dos 55%, independentemente do tamanho dos estímulos apresentados. Ainda relativamente ao tamanho dos estímulos, nas pseudopalavras monossilábicas, todas as vozes sintetizadas conseguem taxas de acerto superiores às da voz natural, o que poderá indicar que segmentalmente as vozes sintetizadas apresentam uma qualidade muito boa.

Discussão A voz Natural apresenta um tempo de reação mais baixo do que qualquer uma das vozes sintetizadas, sendo que este resultado era esperado e verificado em estudos para outras línguas (Rajinder Koul & Dembowski, 2010) Resultados Discussão

Resultados Discussão Conclusões Conclusões As vozes sintetizadas apresentaram resultados bastante próximos da voz natural ( e em alguns casos superiores), pelo que se pode considerar que estas vozes apresentam uma qualidade bastante satisfatória. Os dados preliminares da análise qualitativa do tipo de erro parecem indicar que o acento é o principal fator de erro, com por exemplo as palavras esdrúxulas com uma taxa de erro muito alta. Tendo isto em consideração, o acento será alvo de avaliação mais detalhada em estudos futuros. Poderá haver diferença entre perceção/identificação do local do acento e a correta marcação ortográfica do acento

Resultados Discussão Conclusões Em todos os SSF/vozes a taxa de acerto vai reduzindo conforme aumenta o número de sílabas, o que não sucede com a voz natural. Nos polissílabos isto é notório, sendo que o facto de estes representarem somente cerca de 13% das ocorrências no PE (FrePOP), poderá ter influência nos resultados. Os resultados deste estudos, parecem indicar que a tarefa é mais complexa do que a tarefa utilizada (resposta aberta vs resposta fechada) em estudos anteriores para o PE e mesmo em estudos semelhantes para o Inglês (Ferreira, Laranjeira & Perpétua; 2012)

O instrumento da inteligibilidade de avaliação ainda carece de um estudo mais aprofundado, nomeadamente quanto a valores normativos, pelo que a utilização de mais vozes naturais será um fator a considerar Resultados Discussão Conclusões

Resultados Discussão Conclusões Bibliografia Bibliografia Braga, D., Freitas, D., & Barros, M. J. (2003). A DRT approach for subjective evaluation of intelligibility in European Portuguese synthetic speech. WSEAS Transactions on Computers, 2(2), 510 514. Ferreira, J., Laranjeira, M., & Perpétua, P. (2012). Inteligibilidade da Fala Sintetizada no Português Europeu. Unpublished, 39. Ferreira, J, (2013) Inquérito online à utilização de Sistemas de Síntese de Fala para o Português Europeu em pessoas com Necessidades Complexas de Comunicação, unpublished Frota, S., Vigário, M., Martins, F., & Cruz, M. (2010). FrePOP Database- Frequency of Phonological Objects of Portuguese. Laboratório de Fonética- FLUL- CLUL. Koul, R. (2003). Synthetic Speech Perception in Individuals With and Without Disabilities. Augmentative and Alternative Communication, 19(1), 49 58. doi:10.1080/0743461031000073092 Koul, R., & Clapsaddle, K. C. (2006). Effects of repeated listening experiences on the perception of synthetic speech by individuals with mild-to-moderate intellectual disabilities. Augmentative and alternative communication (Baltimore, Md. : 1985), 22(2), 112 22. doi:10.1080/07434610500389116 Martins, F., Vigário, M., & Frota, S. (2011). FreP- Frequency in Portuguese. Winters, S. J., & Pisoni, D. B. (2004). Perception and Comprehension of Synthetic Speech - Progress Report n o 26 (Vol. 26, pp. 95 138).

Agradecimentos À Susana Correia pela ajuda inicial na montagem da experiência no SuperLab Resultados Aos participantes no estudo Discussão Conclusões Bibliografia