Processamento de texto escrito em Linguagem Natural para um Sistema Conversor Texto-fala. Acadêmico: Thiago M. Oechsler Orientadora: Joyce Martins

Documentos relacionados
PROCESSAMENTO DIRIGIDO DE ROTAS ATRAVÉS DE TEXTO-FALA

PROCESSAMENTO DE TEXTO ESCRITO EM LINGUAGEM NATURAL PARA UM SISTEMA CONVERSOR TEXTO-FALA

Dicionário De Termos Gramaticais

Processamento de rotas por um sistema conversor texto-fala

PLANO DE CURSO Disciplina: LÍNGUA PORTUGUESA Série: 4º ano Ensino Fundamental

Ferramenta de apoio a identificação de eventos utilizando Linguagem Natural. Aluno: Ricardo Tomelin Orientador: Everaldo Artur Grahl

PROTÓTIPO PARA SUMARIZAÇÃO AUTOMÁTICA DE TEXTOS ESCRITOS EM LÍNGUA PORTUGUESA ALEXANDRE BUSARELLO JOYCE MARTINS

Vocal: Assistente para o uso de smartphones operado por voz

SISTEMA PARA AVALIAÇÃO DE MONOGRAFIAS PARA TRABALHOS DE CONCLUSÃO DE CURSO

Língua Portuguesa. (gramática, texto e redação) Professor Guga Valente

REDAÇÃO PARA CONCURSOS

AS IDEIAS ORTOGRÁFICAS EM PORTUGAL

ÍNDICE. Os sons e a escrita As palavras: léxico e morfologia A frase...37

Colégio Nossa Senhora da Piedade

Identificadores Nome de variáveis, constantes, métodos, etc...

Atividades de Ortografia

Revisão dos conteúdos para a 2ª avaliação de Língua Portuguesa. Professora: Daniela Pereira e Patrícia Lopes 6º ano

LÍNGUA PORTUGUESA. Leitura; Alfabeto; Formação de palavras; Autoditado. MATEMÁTICA

Evento: Seleção para o Semestre I das Casas de Cultura Estrangeira PARECER

PLANO DE CURSO Disciplina: LÍNGUA PORTUGUESA Série: 3º ano Ensino Fundamental

PLANO DE CURSO Disciplina: LÍNGUA PORTUGUESA Série: 4º ano Ensino Fundamental

BOLSÃO 2017 / 6º ANO

AVALIAÇÃO INSTRUMENTAL DOS CORRELATOS ACÚSTICOS DE TONICIDADE DAS VOGAIS MÉDIAS BAIXAS EM POSIÇÃO PRETÔNICA E TÔNICA *

LÍNGUA PORTUGUESA MÓDULO 1. Fonética e Fonologia. Professora Rosane Reis

Currículo e Aulas Previstas

PORTUGUÊS. Professor Nei Xavier

PLANO DE CURSO Disciplina: LÍNGUA PORTUGUESA Série: 3º ano Ensino Fundamental

Capítulo 2 - Acentuação gráfica Regras gerais...10 Casos especiais...10 Prosódia...12 Exercícios...14

Planejamento Anual 2012

CONTEÚDOS PARA OS TESTES - 2º BIMESTRE 1º ano

Planejamento Anual 2013

IV.2 Aspectos Léxicos Convencionais

ATITUDE LINGUÍSTICA NO SISTEMA DE CONVERSÃO DE GRAFEMA PARA FONE

GRAMÁTICA MODERNA DA LÍNGUA PORTUGUESA

LÍNGUA PORTUGUESA. Professor Bernardo Augusto. Fonética e Fonologia

Aprendendo Braille: O Ensino do Sistema Braille com o uso do Tagarela

O QUE É FONOLOGIA? Fonologia é o ramo da Linguística que estuda o sistema sonoro de um idioma. Cuida de aspectos relacionados a:

A/ART casa/n caiu/v./. Figura 3.1: Frase com anotação morfossintática.

AVALIAÇÃO DA RELAÇÃO ENTRE TONICIDADE E DISTINÇÃO DE OCLUSIVAS SURDAS E SONORAS NO PB

CONTEÚDOS PARA AS PROVAS - 1º BIMESTRE 1º ano

Sumário. Capítulo 1 Comunicação 1

É importante não confundir letra com fonema. Fonema é som, letra é o sinal gráfico que representa o som.

DISCIPLINA DE LÍNGUA PORTUGUESA - 5.º Ano A 1. COMPETÊNCIAS ESSENCIAIS COMPETÊNCIAS GERAIS COMPETÊNCIAS ESPECÍFICAS

CONTEÚDOS PARA OS TESTES 4º BIMESTRE 1º ano

OBJETIVO GERAL ESPECÍFICOS

CONTEÚDOS PARA AS PROVAS - 4º BIMESTRE 1º ano

INCLUSÃO DO ALGORITMO DE TRANSFORMAÇÃO DE UM AUTÔMATO FINITO EM EXPRESSÃO REGULAR NO AMBIENTE EDITOR DE AUTÔMATOS FINITOS

Compiladores. Introdução

PROF. RENATO PORPINO

Aplicativo para auxiliar crianças autistas no desenvolvimento e aquisição da linguagem

Sumário. Capítulo 1 Comunicação 1

Compiladores. Motivação. Tradutores. Motivação. Tipos de Tradutores. Tipos de Tradutores

Universidade de Santa Cruz do Sul UNISC Departamento de informática COMPILADORES. Introdução. Geovane Griesang

CONTEÚDOS PARA OS TESTES 1º BIMESTRE 1º ANO

Ensino Fundamental 5º Ano. Português. Matemática

aille O a b c Lançado no 15 de Outubro

CONTEÚDOS PARA OS TESTES - 4º BIMESTRE 1º ano

REVISANDO... Articulação de consoantes e articulação de vogais. APOIO PEDAGÓGICO Prof. Cecília Toledo com

Preâmbulo. Ensino do. Português

Fonologia Gerativa. Traços distintivos Redundância Processos fonológicos APOIO PEDAGÓGICO. Prof. Cecília Toledo

PROTÓTIPO DE FERRAMENTA DE CONSULTA DE INFORMAÇÕES BASEADAS EM ONTOLOGIAS PETER ANTONY RAUSCH JOYCE MARTINS

Prefácio Abreviaturas, Símbolos e Siglas 15

CURRÍCULO DA DISCIPLINA DE PORTUGUÊS/ CRITÉRIOS DE AVALIAÇÃO 2013/2014

Compiladores. Conceitos Básicos

O ESTUDO DO VOCABULÁRIO

Conteúdo Programático Concurso de Bolsas

DATA: 06/09/2016 TURMA: 6º ANO A TURNO: MATUTINO. Horário Disciplina Conteúdo Tarefa 2 PORTUGUÊS FONÉTICA E FONOLOGIA SEM DESCRIÇÃO

CONTEÚDO PROGRAMÁTICO BOLSÃO 2017 (5º ANO)

Roteiro para o Teste de Seleção/2013 1º Ano - Ensino Fundamental

Sónia Frota, Fernando Martins & Marina Vigário

AGRUPAMENTO de ESCOLAS Nº1 de SANTIAGO do CACÉM Ano Letivo 2013/2014 PLANIFICAÇÃO ANUAL

AULA 3: ANÁLISE FONÊMICA EM PORTUGUÊS 1. Introdução Fonêmica

O ESTUDO DAS PALAVRAS

CAPÍTULO 1 O ESTUDO DAS PALAVRAS

Introdução: uma palavra inicial para confortar o coração...

Encontro Consonantal

Universidade Estadual da Paraíba - UEPB Curso de Licenciatura em Computação

CURRÍCULO DA DISCIPLINA DE PORTUGUÊS/ CRITÉRIOS DE AVALIAÇÃO 2013/2014

Prefácio índice geral Lista das abreviaturas 14 Lista dos símbolos 16 Introdução geral 17

o verbo "IR" possui uma forma neutra; possui também formas que marcam flexões pessoais que podem ser empréstimos da forma verbal em português,

Sumário. Edital sistematizado Apresentação da Coleção Apresentação Sobre português PARTE 1

PROGRAMAÇÃO DE ESTUDOS 2016

Português - alfabeto; - sequência alfabética; - formação de palavras; - leitura e interpretação (imagem, palavra, frase e texto).

CONTEÚDOS PARA OS TESTES 1º BIMESTRE 1º ano

Plano Curricular de Português 1.º Ano - Ano Letivo 2018/2019

Novo Acordo Ortográfico da Língua Portuguesa

INSTITUTO EDUCACIONAL MANOEL PINHEIRO PROGRAMA DE ATIVIDADES DIAGNÓSTICAS PROCESSO DE ADMISSÃO DE NOVOS ALUNOS 2017

Estudo das características fonético-acústicas de consoantes em coda. silábica: um estudo de caso em E/LE

Conteúdo Programático Conteúdos 2º Período da Educação Infantil 2º Período Educação Infantil

Sumário PARTE 1. MORFOLOGIA Pronomes demonstrativos Pronomes relativos O relativo que O relativo qual O relativo quem...

LÍNGUA PORTUGUESA DISCIPLINA

Normas para redação e apresentação de Teses e Dissertações

Apresentação 11 Lista de abreviações 13. Parte I: NATUREZA, ESTRUTURA E FUNCIONAMENTO DA LINGUAGEM

BLOCOS 1 e 2 COMUNICAÇÃO ORAL E ESCRITA NS SP S SB EXC

SUMÁRIO. Língua Portuguesa

Relacionar o texto com conhecimentos anteriores. Compreender o essencial dos textos escutados e lidos.

Tarefa 01 Professora Lúcia. Tríade da Comunicação: Linguagem, Língua e Fala

Sumário PARTE 1. Gramática

NOÇÕES DE FONÉTICA. Fonemas São as unidades sonoras mais simples da língua, ou seja, os sons distintivos que entram na formação do vocábulo.

Analisador Léxico parte II

Transcrição:

Processamento de texto escrito em Linguagem Natural para um Sistema Conversor Texto-fala Acadêmico: Thiago M. Oechsler Orientadora: Joyce Martins

Roteiro Introdução Objetivos do trabalho Fundamentação teórica Desenvolvimento do protótipo Conclusão Extensões

Introdução Definição: síntese da fala Conversão texto-fala na língua portuguesa e o novo acordo ortográfico Aplicações atuais deste tipo de sistema Pessoas com deficiência visual

Objetivos Desenvolver um protótipo para converter uma entrada em linguagem natural para uma linguagem com gramática formal. processar textos em português observando as normativas da gramática e da reforma ortográfica; processar vocabulário restrito; gerar um arquivo texto com código intermediário em linguagem formal; criar biblioteca de funções.

Fundamentação teórica Fonemas da língua portuguesa e divisão silábica Etapas do sistema de conversão texto-fala Pré-processamento Analisador linguístico Identificador fonético Processador prosódico Trabalhos correlatos

Fundamentação: Fonemas e divisão silábica Tipos de fonemas e lista de fonemas¹ fonema características fonéticas exemplos vogais /ã/ semi-aberta, central, nasal, não arredondada antes, amplo, maçã, âmbito consoantes /p/ oral, oclusiva, bilabial, surda pato semivogais /w/ oral, velar, sonora automático, móvel, pão campeão Método para a divisão silábica e núcleo das sílabas¹ Cam-pe-ão Ca-ma-le-ão

Fundamentação: Pré-processamento Separação das palavras¹ Abreviações ( apto., ex., sr. ) 1. Separação 2. das 3. palavras Algarismos (números)

Fundamentação: Analisador linguístico Classificação gramatical Por comparação (lista) Por regras posicionais¹ verbo Vou colher o milho. A colher de milho. substativo

Fundamentação: Identificador fonético Transformação em cadeia de símbolos¹ campeão = /c/ /ã/ /p/ /e/ /ã/ /w/ Dicionário de exceções Identificação da sílaba tônica

Fundamentação: Processador prosódico Entonação e pontuação Duração dos segmentos

Trabalhos correlatos Sistema de conversão texto-fala para a língua portuguesa utilizando a abordagem de síntese por regras (Leandro de Campos Teixeira Gomes - UNICAMP) Protótipo de um sintetizador de voz utilizando redes neurais (Douglas M. Bento FURB) Interface em linguagem natural. (Jomi Fred Hubner FURB)

Desenvolvimento do protótipo Especificação Requisitos Lista de fonemas Formato de entrada UML Formato de saída Implementação do protótipo

Especificação: Requisitos Funcionais Funcionais disponibilizar uma interface para entrada de texto disponibilizar uma interface para entrada de dados para dicionários criar um arquivo de saída ser transparente, demonstrando os resultados do processamento do texto

Especificação: Requisitos Não-Funcionais Não-funcionais utilizar arquivos texto para dicionário de dados não levar mais de 2 segundos para geração do arquivo de saída implementar em Delphi e funcionar em Windows

Especificação: Lista de Fonemas Lista do Sintetizador Vogais Abertas e fechadas¹ Vogais Nasais² Consoantes³ fonema /k/ /am/ /p/ /e/ /@/ exemplo com campanha pai pêra pão transcrição k am p e @ w k am p e @ w k am p e @ w k am p e @ w k am p e @ w Semi-vogais /w/ mau k am p e @ w Encontros consonantais /nh/ /rr/ galinha torre ga li "nh a "to rr e

Especificação: Formato de Entrada (parte 1) Língua Portuguesa Caracteres Letras do alfabeto Algarismos Sinais de pontuação¹ vírgula ponto e vírgula exclamação interrogação dois pontos reticências ponto final

Especificação: Formato de Entrada (parte 2) Regras sintáticas 01 <frase>::= <romano> <sinal> <frase_> 02 <palavra> <sinal> <frase_> 03 <sigla> <sinal> <frase_> 04 "(" <frase> ")" <sinal> <frase_> 05 <numeral> <sinal> <frase_> ; 06 <frase_>::= î <frase> ; 07 <numeral> ::= numero ; 08 <palavra>::= palavra_simples palavra_composta ; 09 <sinal>::= î pontuacao "."; 10 <sigla> ::= sigla TV PM DVD RW CD PC ; 11 <romano> ::= I II III IV V VI VII VIII IX X;

Especificação: Casos de uso

Especificação: Diagrama de classes

Especificação: Formato de Saída Símbolo do Fonema¹ Tempo² Informação prosódica (Pitch)³ Ex: Ataque! a 100 10 86 90 82 t 100 50 90 a 100 10 86 90 82 k 105 e 90 10 110 _ 5 10 90 _ 400 90 110

Implementação Ferramentas Utilizadas Gals Delphi MBROLA Etapas Pré-processamento Analisador Linguístico Identificador Fonético Processador Prosódico

Implementação: Pré-processamento Prevenir erros léxicos e sintáticos (pontuação agrupada), (formatação de texto inválida) Expandir abreviaturas (sr. / cm / ed ) Símbolos importantes para o contexto (símbolo %, símbolo $)

Implementação: Analisador Linguístico Analisador Léxico e Sintático do Gals Classificação das palavras¹ Separação silábica Tradução de números palavra simples palavra composta sigla sigla de estado brasileiro siglas especiais número número romano pontuação parênteses

Implementação: Identificador Fonético Métodos para cada classe de palavra Regras de transcrição dos fonemas Soletração Encontros consonantais Acentuação Etimológica Regras do novo acordo ortográfico

Identificador Fonético: Acentuação etimológica Pronúncias diferenciadas para palavras construídas com as mesmas vogais¹ Exemplos: Roda, Cola, Porta Boca, Louça, Coxa Toque, Enfoque, Xeque, Moleque Pote, Porre, Jogue, Mole Pele, Fere, Erre Dele, Nele, Esse

Identificador Fonético: Regras do novo acordo Inclusão das letras k, w e y Abolição do trema Ditongos éi e ói Emprego do hífen

Implementação: Processador prosódico Interrogação¹ Exclamação Reticências Frase: Bom dia Com ponto final Com interrogação b 105 50 90 b 105 50 90 om 90 om 90 _ 15 10 90 _ 15 10 90 d 100 50 90 d 100 50 90 i 80 i 80 a 130 10 86 90 82 a 200 10 180 _ 15 10 90 _ 15 10 90 _ 330 10 90 _ 400 10 100 Outras pontuações

Operacionalidade Não preparado para uso por deficientes Entrada do texto Processamento das palavras Transcrição

Resultados e discussão FurbTTS BENTO (1995) GOMES (1998) HUBNER (1992) vocabulário irrestrito conversão para uma linguagem formal aplicação de inteligência artificial síntese de texto sintetizador acústico próprio dicionário de exceções dicionário silábico passível de extensão suporte ao novo acordo ortográfico

Conclusões Objetivos alcançados Regras fonéticas do português Ferramenta completa text-to-speech para sites de Instituições de Ensino Limitações do texto de entrada Limitação de pronúncia Novo acordo ortográfico

Extensões Reduzir limitações do texto de entrada Captura de texto de browsers Refinar regras de pronúncia, aliando técnicas de Inteligência Artificial. Módulo acústico Integrar a biblioteca do protótipo com outras linguagens

Vídeo gravado na ACEVALI

Perguntas.