(11) Número de Publicação: 104697 A (51) Classificação Internacional: G10L 15/26 (2006.01) (12) FASCÍCULO DE PATENTE DE INVENÇÃO (22) Data de pedido: 2009.07.28 (30) Prioridade(s): (43) Data de publicação do pedido: 2011.02.08 (45) Data e BPI da concessão: / (73) Titular(es): INSTITUTO POLITÉCNICO DE LEIRIA RUA GENERAL NORTON DE MATOS, APARTADO 4133 2411-901 LEIRIA INOV INESC INOVAÇÃO - INSTITUTO DE NOVAS TECNOLOGIAS (72) Inventor(es): ANTÓNIO MANUEL DE JESUS PEREIRA ANTÓNIO GOMES LEAL ISABEL PEREIRA MARCELINO ALEXANDRE GONÇALVES GASPAR JOÃO ALBERTO PERES PATRÍCIO (74) Mandatário: (54) Epígrafe: SISTEMA DE COMUNICAÇÃO ASSÍNCRONO DE MENSAGENS DE VOZ E ÁUDIO (57) Resumo: O SISTEMA DE COMUNICAÇÃO ASSÍNCRONO DE MENSAGENS DE VOZ E ÁUDIO É UM SISTEMA DE COMUNICAÇÃO BASEADO NO E-MAIL, QUE PERMITE A TROCA ASSÍNCRONA DE MENSAGENS DE VOZ ATRAVÉS DA INTERNET (7), A PARTIR DE UM COMPUTADOR SEM NECESSIDADE DE UTILIZAR O TECLADO E O RATO, RECORRENDO A COMANDOS DE VOZ (2)(12) E A INTERFACES SIMPLIFICADOS (11)(3). O SISTEMA É IMPLEMENTADO, NO MÍNIMO, POR DOIS CLIENTES, (1) E (13), E PERMITE O ENVIO DE MENSAGENS DE VOZ PARA UM DESTINATÁRIO, A RECEPÇÃO DE MENSAGENS DE VOZ, A IDENTIFICAÇÃO SONORA DO REMETENTE NO MOMENTO DA CHEGADA DE UMA MENSAGEM OU QUANDO O UTILIZADOR PERCORRE A LISTA MENSAGENS RECEBIDAS. O PROCESSO DE COMPOSIÇÃO DAS MENSAGENS É REALIZADO POR VOZ, SENDO APENAS NECESSÁRIO RECORRER A UM ECRÃ SENSÍVEL AO TOQUE PARA ESCOLHER UM CONJUNTO LIMITADO DE OPÇÕES. A INTERFACE GRÁFICA DISPONÍVEL NO ECRÃ SENSÍVEL AO TOQUE É DESENHADA DE FORMA SIMPLIFICADA E DIRECCIONADA PARA UTILIZADORES TECNOLOGICAMENTE EXCLUÍDOS.
RESUMO Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio O Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio é um sistema de comunicação baseado no e-mail, que permite a troca assíncrona de mensagens de voz através da Internet (7), a partir de um computador sem necessidade de utilizar o teclado e o rato, recorrendo a comandos de voz (2)(12) e a interfaces simplificados (11)(3). O sistema é implementado, no mínimo, por dois clientes, (1) e (13), e permite o envio de mensagens de voz para um destinatário, a recepção de mensagens de voz, a identificação sonora do remetente no momento da chegada de uma mensagem ou quando o utilizador percorre a lista mensagens recebidas. O processo de composição das mensagens é realizado por voz, sendo apenas necessário recorrer a um ecrã sensível ao toque para escolher um conjunto limitado de opções. A interface gráfica disponível no ecrã sensível ao toque é desenhada de forma simplificada e direccionada para utilizadores tecnologicamente excluídos.
1 DESCRIÇÃO Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio Domínio técnico da invenção O Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio é um sistema de comunicação assíncrono baseado no e- mail (norma MIME - Extensões Multi função para Mensagens de Internet), vocacionado para o envio e recepção de mensagens de voz utilizando uma interface simplificada. Antecedentes da Invenção As soluções cliente de e-mail mais utilizadas, tanto aquelas que são pessoais como o Microsoft Outlook ou o Mozilla Thunderbird, como as interfaces de correio electrónico acessíveis através da Internet, são vocacionadas para o tratamento de mensagens de texto sendo todas as suas funcionalidades direccionadas para esse fim. Existem, no entanto, algumas soluções que permitem o envio de e-mail de voz, embora nenhuma delas implemente o conceito do sistema de comunicação assíncrono de mensagens de voz e áudio. Foram analisadas e comparadas quatro soluções comerciais: My Voice Email; WaxMail; Vemail; e MailAmp. Os critérios gerais de avaliação foram: a) A solução é Stand Alone ou funciona como aplicativo adicional de um cliente de e-mail standard? b) A solução funciona com comandos de voz? c) Permite o envio de e-mail de texto? d) Permite o envio de e-mail com anexos em voz (remetente, assunto e corpo da mensagem)? e) Na recepção de e-mail, permite a reprodução por voz de: remetente, assunto e mensagem?
2 f) Tem uma interface adequada a pessoas pouco familiarizadas com dispositivos informáticos? No que respeita ao critério a), as soluções My Voice Email e Vemail possuem funcionamento autónomo, enquanto a outras duas funcionam como aplicativo adicional do Outlook da Microsoft. Na interacção por voz com o utilizador, o critério b), nenhuma das soluções disponibiliza tal interface, sendo necessário interagir através do teclado ou rato. As quatro soluções avaliadas permitem o envio de e-mail em formato de texto. Já no que se refere ao envio de mensagens completas de voz, incluindo os campos remetente, assunto e corpo, todas elas permitem apenas o envio do corpo da mensagem como anexo. Na recepção de e-mail, critério e), nenhuma das soluções avaliadas permite a reprodução integrada dos conteúdos de voz, isto é, a mensagem de voz é tratada como um anexo, não existindo o conceito de Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio no assunto e no destinatário. Relativamente ao critério f), nenhuma das soluções apresenta uma interface adequada a pessoas pouco familiarizadas com dispositivos informáticos ou com necessidades especiais. Os mesmos critérios foram ainda analisados na avaliação de algumas patentes existentes na área do e-mail e das interfaces de voz. Os documentos analisados foram US 2007/0127640 e CA 2 527 813 A1, US 2009/024707 A1, US 2005/01 08338 A1, US 2003/083881 A1, US 6 404 859 B1 e US 2004/0019488 A1. No que respeita ao critério a), nenhuma das patentes acima referidas surge com soluções Stand Alone nem funcionam como add-on de um cliente de e-mail standard. Em relação ao critério b) em análise, A solução funciona com comandos de voz?, verificou-se que apenas a patente US 2007/0127640 não contempla esta característica.
3 Na sua generalidade, as patentes supracitadas permitem envios de e-mails de texto (critério c), mas não e-mails com anexo de destinatário, assunto e mensagem em formato de áudio (critérios d e e). Aqui surgem algumas soluções que vão no sentido de converter voz em texto e vice-versa. Por fim, em relação à lista de critérios em análise, verifica-se que em nenhuma das patentes supracitadas está presente a preocupação de disponibilizar interfaces adequadas a pessoas pouco familiarizadas com dispositivos informáticos (critério f). Descrição geral da invenção O Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio é um sistema de comunicação baseado no e-mail, que permite a troca assíncrona de mensagens de voz através da Internet (7), a partir de um computador sem necessidade de utilizar o teclado e o rato, recorrendo a comandos de voz (2)(12) e a interfaces simplificados (11)(3). O sistema é implementado, no mínimo, por dois clientes, (1) e (13), e permite o envio de mensagens de voz para um destinatário, a recepção de mensagens de voz, a identificação sonora do remetente no momento da chegada de uma mensagem ou quando o utilizador percorre a lista mensagens recebidas. O processo de composição das mensagens é realizado por voz, sendo apenas necessário recorrer a um ecrã sensível ao toque para escolher um conjunto limitado de opções. A interface gráfica disponível no ecrã sensível ao toque é desenhada de forma simplificada e direccionada para utilizadores tecnologicamente excluídos. Descrição das Figuras A Figura 1 representa o funcionamento base do Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio,
4 demonstrado pela interacção entre dois utilizadores, cada um deles com um cliente de Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio. O utilizador A (1) emite comandos de voz (2) que são analisados e processados pela aplicação cliente instalada no computador do utilizador A (3). Estando a mensagem completa, com destinatário, assunto e corpo, a aplicação encapsula os dados (4), e utiliza um cliente de e- mail (5) para encaminhar a mensagem, recorrendo ao protocolo SMTP - Protocolo de transferência de correio simples (Simple Mail Transfer Protocol) (6), enviando a mensagem (7). Ao detectar uma nova mensagem recebida através do protocolo IMAP - Internet Message Access Protocol, POP3 - Post Office Protocol ou outro (8), o cliente de e-mail (9) instalado no computador do utilizador B, obtém a mensagem contendo o destinatário, assunto e corpo (10) e emite uma notificação sonora e visual ao utilizador B (11). Este, através de comandos de voz, indica que pretende ouvir a mensagem (12). A Figura 2 representa o diagrama de integração do Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio. O sistema de comunicação surge como uma camada intermédia entre clientes de e-mail (5) e o utilizador (1). O seu funcionamento baseia-se num modelo em 3 sub-camadas: Interface (2), abstracção (3) e Interface com clientes de e- mail (4). A camada de Interface (2) permitirá a comunicação com o utilizador final (1), possibilitando que este envie e receba e-mails apenas com recurso a voz. Como alternativa, o utilizador poderá ainda interagir com a Interface através de toque no dispositivo. A camada de abstracção do sistema (3) surge como uma camada de abstracção onde são definidas as funcionalidades do Sistema de Comunicação Assíncrono de Mensagens de Voz e
5 Áudio, construindo a mensagem de e-mail a enviar, surgindo assim como o core do sistema. A camada Interface com clientes de e-mail (4) permitirá a comunicação com determinados clientes de e-mail específicos (5), servindo de aplicativo adicional, de modo a estender as funcionalidades dos clientes de e-mail e a suportar as especificações definidas pela camada de abstracção do sistema (3). Descrição detalhada da invenção O Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio é um sistema de comunicação assíncrono, de mensagens de voz/áudio, caracterizado pela simplicidade do seu funcionamento, pela utilização do protocolo SMTP - Protocolo de transferência de correio simples (Simple Mail Transfer Protocol) que permite a comunicação através de qualquer servidor de e-mail actual de modo transparente, e que ao nível da utilização possui as características seguintes: 1. Envio de mensagens de voz para um destinatário de forma assíncrona, utilizando uma interface do tipo e- mail. 2. Recepção de mensagens de voz de um determinado destinatário de forma assíncrona, utilizando uma interface do tipo e-mail. 3. Composição das mensagens utilizando voz, sendo apenas necessário recorrer a um ecrã sensível ao toque para escolher um conjunto limitado de opções. 4. Identificação sonora do remetente no momento da chegada de uma mensagem ou quando o utilizador percorre a lista mensagens recebidas. O sistema de comunicação surge como um método simples de comunicação assíncrona, que pode ser utilizado por pessoas
6 com conhecimentos mínimos, ou até mesmo nulos, sobre tecnologias de informação iliteracia informática. O facto de poder ser implementado para qualquer cliente de e-mail torna-o de implementação e utilização quase universal. Por não realizar conversões entre áudio/voz e texto (síntese e reconhecimento de fala) torna-se rápido e simplificado. Esta vantagem poderá ser apontada também como uma desvantagem caso se contemple o tamanho de uma mensagem de texto e uma mensagem de áudio/vídeo na sua transmissão. Contudo, a aplicação de algoritmos de compressão e o aumento progressivo da largura de banda que se tem verificado leva a que não seja um ponto de inviabilização. A principal vantagem a destacar será, portanto, a sua simplicidade, contrastando com os sistemas complexos existentes actualmente. De modo mais detalhado, podemos referir que, a nível de funcionamento, o utilizador A indica que pretende comunicar com o utilizador B; sendo esta indicação realizada através de um comando de voz ( Enviar e-mail ) ou mediante interacção simples com o dispositivo, pressionando o ícone representativo do envio de e-mail. A partir do momento em que o comando é reconhecido pela aplicação, surge um diálogo entre a aplicação e o utilizador A. Ou seja, toda a interacção entre utilizador e aplicação será efectuada por som ou vídeo: a) A aplicação que implementa o conceito de Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio responderá ao utilizador A solicitando o destinatário da mensagem. Esta pergunta será colocada de forma sonora ( Para quem deseja enviar a mensagem? ); O utilizador responderá, com o nome do destinatário; b) A aplicação irá procurar o nome do destinatário na lista de contactos do utilizador A;
7 c) A aplicação perguntará ao utilizador A o assunto da mensagem ( Qual o assunto da mensagem? ); d) O utilizador indicará o assunto da mensagem e a aplicação anexará um ficheiro de som com o assunto da mensagem; e) A aplicação perguntará ao utilizador A o corpo da mensagem ( Qual a mensagem? ); f) O utilizador indicará o corpo da mensagem e a aplicação anexará um ou mais ficheiro de som ou vídeo com o corpo da mensagem; g) A aplicação anexará a fotografia do remetente, encapsulará a mensagem e aplicará algoritmos de compressão sobre a mesma, enviando-a de seguida; h) A aplicação emitirá a mensagem de som: Mensagem enviada com sucesso e exibirá uma imagem correspondente ao envio com sucesso. Ao receber uma mensagem, a aplicação descompacta o seu conteúdo e notifica o utilizador B (visual e sonoramente) da chegada da mensagem. Ou seja: a) A aplicação que implementa o conceito de Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio indicará Chegou uma mensagem de <nome do remetente>, deseja abrir a mensagem? ; b) O utilizador B responderá afirmativamente; c) A aplicação valida a resposta indicada pelo utilizador; d) A aplicação abrirá a mensagem, colocando a fotografia do remetente visível, indicará sonoramente Assunto da mensagem: <assunto enviado> e, posteriormente, mostrará o corpo da mensagem (ou de modo sonoro ou vídeo). Exemplos de aplicação Foi realizada uma demonstração a idosos de um protótipo do sistema de comunicação. A amostra consistiu em 8 idosos, com
8 a média de idades de 81 anos. Importa ainda referir que apenas 1 dos 8 idosos tinha tido alguma interacção com um computador e que 3 dos 8 idosos não sabiam ler. Foram disponibilizados 4 postos de trabalho em salas diferentes, cada um com computador, colunas de som, webcam e microfone. Foi solicitado aos idosos que enviassem e recebessem mensagens através do Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio, recorrendo a comandos de voz. Do decorrer dos testes, concluiu-se que, na generalidade, o sistema agradou aos intervenientes e não foram detectadas dificuldades de interacção significativas. Aplicação industrial A exploração desta invenção poderá fazer-se em duas vertentes distintas: a) Desenvolvimento e comercialização de aplicações cliente de Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio Estas aplicações cliente poderão ser diferenciadas pelas tecnologias utilizadas e funcionalidades disponibilizadas, onde existe uma grande margem de evolução, entre outros, no que se refere à edição simplificada de conteúdos áudio ou à realização de tarefas de pesquisa e ordenação neste tipo de mensagens; b) Utilização do conceito de forma integrada em soluções vocacionadas para pessoas com necessidades especiais e/ou soluções com interfaces inovadoras, designadamente com recurso a técnicas de realidade aumentada, indo ao encontro do conceito de Design Universal. Data: 18 de Janeiro de 2011
1 REIVINDICAÇÕES 1. Sistema de comunicação assíncrono, de mensagens de voz/áudio, que pela utilização do protocolo SMTP - Protocolo de transferência de correio simples (Simple Mail Transfer Protocol) - permite simplicidade do seu funcionamento e a comunicação através de qualquer servidor de e-mail actual de modo transparente, e que ao nível da utilização é caracterizado por: a) Envio de mensagens de voz para um destinatário de forma assíncrona, utilizando uma interface do tipo e-mail; b) Recepção de mensagens de voz de um determinado destinatário de forma assíncrona, utilizando uma interface do tipo e-mail; c) Composição das mensagens utilizando voz, sendo apenas necessário recorrer a um ecrã sensível ao toque para escolher um conjunto limitado de opções; d) Identificação sonora do remetente no momento da chegada de uma mensagem ou quando o utilizador percorre a lista mensagens recebidas. Data: 18 de Janeiro de 2011
1/2 Desenhos Figura 1
Figura 2 2/2