Tecnologia da Linguagem Humana

Documentos relacionados
AFIRMAÇÃO CULTURAL E DE SOBERANIA:

CoNaIISI º Congresso Nacional de Engenharia Informática / Sistemas de Informação

EXCELÊNCIA CONHECIMENTO IMPACTO. Ana Cristina Neves Lisboa 12 dezembro 2013

Portugal 2020: Investigação e Inovação no domínio da Competitividade e Internacionalização

FTTH FORUM Sociedade da Informação Portugal em Mudança CCB, 5 Nov Luis Magalhães UMIC Agência para a Sociedade do Conhecimento

CENTRO UNIVERSITÁRIO ESTÁCIO RADIAL DE SÃO PAULO SÍNTESE DO PROJETO PEDAGÓGICO DE CURSO 1

INOVAÇÃO, INVESTIGAÇÃO & DESENVOLVIMENTO E RELAÇÕES UNIVERSIDADE-EMPRESA.

PROGRAMA OPERACIONAL COMPETITIVIDADE E INTERNACIONALIZAÇÃO

Projeto Pedagógico do Bacharelado em Ciência da Computação. Comissão de Curso e NDE do BCC

ANÚNCIO DE CONCURSOS GERAIS EPSO/AD/ /12 TRADUTORES (ET/GA/LV/PT) (2012/C 204 A/02)

5 DUAS FOTOGRAFIAS IDENTIFICADAS COM NOME E NUMERO DE PRE- REGISTO 2 CI-CEPPQ

AS OPORTUNIDADES PARA AS EMPRESAS NO PORL

CONSELHO SUPERIOR RESOLUÇÃO Nº 144, DE 10 DE SETEMBRO DE 2015.

Laboratório de sistemas de Língua Falada

EFIÊNCIA DOS RECURSOS E ESTRATÉGIA ENERGIA E CLIMA

3º Seminário Blogs: Redes Sociais e Comunicação Digital

RELATÓRIO-SÍNTESE SUL (SUB-PROJECTO 1) Capacidades e competências requeridas nas indústrias da língua e nas profissões relacionadas com as línguas

ANÁLISE SWOT DO ENSINO SUPERIOR PORTUGUÊS

Luxemburgo-Luxemburgo: FL/SCIENT15 Serviços de tradução 2015/S Anúncio de concurso. Serviços

Programa Operacional Regional Alentejo 2014/2020

NOVA PROPOSTA DE MATRIZ CURRICULAR CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS

sistemas de informação nas organizações

COMPETITIVIDADE E INTERNACIONALIZAÇÃO DAS EMPRESAS DA REGIÃO AUTÓNOMA DA MADEIRA

SPEEXX Empowering Communication

Planejamento Anual

Calendário de Concursos

ü Curso - Bacharelado em Sistemas de Informação

LÍNGUAS EM RISCO: UM DESAFIO PARA A TECNOLOGIA DA LINGUAGEM

DIVULGAÇÃO DE TERMINOLOGIAS EM PORTUGÊS E POLÍTICAS LINGUÍSTICAS

Participação Social das Pessoas com Deficiência Inclusão e Acessibilidade Digital

Regulamento do Curso de. Mestrado Integrado em Engenharia Informática

2º CONGRESSO INTERDISCIPLINAR EM SAÚDE E EDUCAÇÃO: MEIO AMBIENTE, CIÊNCIA E QUALIDADE DE VIDA

EMENTAS DAS DISCIPLINAS

Google Site Search Pesquisa de websites do Google para sua organização

Portugal 2020 Oportunidades de financiamento para a Inovação Tecnológica na AP Francisco Nunes

Luxemburgo-Luxemburgo: TM14-EN Serviços de tradução 2014/S Anúncio de concurso. Serviços

Google Site Search Pesquisa de Websites Google para a sua Entidade

O Recurso a Meios Digitais no Contexto do Ensino Superior. Um Estudo de Uso da Plataforma.

Comportamento Humano: Liderança, Motivação e Gestão do Desempenho

Memória descritiva do projecto Sanjonet Rede de Inovação e Competitividade

SESSÕES DE PROMOÇÃO DO BALCÃO DO EMPRESÁRIO

Criar Valor com o Território

Experiência da UFSC com Projetos Apoiados pela Lei 8248

Manual. Por: PET ADM UFMG. Um guia para conhecer melhor a faculdade

... Calendarização: 2 blocos de 90 m Metas/Objetivos Descritores Conceitos/Conteúdos Estratégias/Metodologias Avaliação

(Mex) (Mex) (USA)

1ºANO 2ºANO 3ºANO 3000/ / /3100

PARLAMENTO EUROPEU CONSTITUIÇÃO:

Estratégias regionais, para a investigação e inovação, implementadas nas Regiões. O que foi feito?

São Paulo, 22 a 25 de outubro 2013

na captação de alunos.

XI Jornada Científica. Maria da Graça KRIEGER Universidade do Vale do Rio dos Sinos (UNISINOS), Brasil Grupo TermiLex

Plano de Actividades do CEA para 2006

CURSO DE GRADUAÇÃO TECNOLÓGICA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS. RECONHECIDO conforme PORTARIA nº 295, de 25 de Junho de 2008.

4 Cursos de nível superior no Brasil para formação de Designers de Games

PLANO DE ESTUDOS DE T.I.C. 7.º ANO

Universidade do Minho, Dez 2008

SECRETARIA MUNICIPAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DE NITERÓI EDITAL N 005/2015

Fundos Estruturais e de Investimento

(Mexico City) (El Paso, TX)

Metadados. 1. Introdução. 2. O que são Metadados? 3. O Valor dos Metadados

Comunicações e Informações

Apoios ao Turismo Lições do QREN, desafios e oportunidades

Classificação e Tipologias de Inovação. A Inovação como um Processo Empresarial.

DIRECÇÃO REGIONAL DA CIÊNCIA, TECNOLOGIA E COMUNICAÇÔES

tgs Resumo do Programa Operacional Competitividade e Internacionalização think global. think tgs Qualificação e Internacionalização das PME

Medição das TIC no contexto nacional: o caso do Brasil Maputo, Moçambique 7 de Julho de 2015

ATRATIVIDADE EMPRESARIAL E PROJETOS DE ESTIMULO À ECONOMIA DA EUROREGIÃO

2ª Conferência. Internet, Negócio e Redes Sociais Financiar, Inovar e Empreender. 21 de novembro de 2013 Auditório do ISEGI

Programa Operacional Regional Alentejo 2014/2020. Identidade, Competitividade, Responsabilidade

Agrupamento de Escolas de S. Pedro do Sul Escola-sede: Escola Secundária de São Pedro do Sul

REGULAMENTO DO NÚCLEO DE ESTUDOS E PESQUISAS EM CONTABILIDADE DA UNIVERSIDADE CATÓLICA DE BRASÍLIA (NEPEC/UCB)

EEUM Plano de Atividades e Orçamento Escola de Engenharia

COMUNICADO n o 001/2012 ÁREA DE CIÊNCIA DA COMPUTAÇÃO ORIENTAÇÕES PARA NOVOS APCNS 2012 Brasília, 22 de Maio de 2012

DESPACHO. ASSUNTO: - Regulamento do Gabinete de Apoio ao Estudante e ao Diplomado- GAED

NCE/11/01396 Relatório preliminar da CAE - Novo ciclo de estudos

V - promover a cooperação internacional na área de ciência, tecnologia e inovação;

Plano de Atividades 2015

Coletiva de Imprensa Apresentação de resultados São Paulo, 23 de maio de 2013

CURSO DE GRADUAÇÃO PRESENCIAL SISTEMAS DE INFORMAÇÃO

Seminário Turismo 2020: Fundos Comunitários

Graduação Pitágoras. Gestão da Infraestrutura e Serviços de TI Gestão de Sistemas de Informação. Unidades CST Centro Superior de Tecnologia

O PROJETO PROMOINVEST Município de Vendas Novas

HABILITAÇÃO COMPONENTE TITULAÇÃO

Caracterização. Curso de formação de Línguas Estrangeiras para Fins Específicos. (Francês / Inglês / Alemão / Espanhol / Português p/ Estrangeiros)

1ª Retificação do Edital Nº 024/2015

Plano de Atividades 2014

As Políticas de Divulgação e Internacionalização da Língua Portuguesa O Exemplo do Mercosul. Edgard Fernando Viana da Cruz

Nossa equipe está em constante atualização através de treinamentos rigorosos sobre o cenário dos mais diferentes mercados e culturas.

Bruxelas, COM(2016) 90 final ANNEX 1 ANEXO. Proposta de

Universidade de Coimbra e Empresas Construção de Novas Relações

O Projeto Casa Brasil de inclusão digital e social

TECNOVOZ Tecnologias de Reconhecimento e Síntese de Voz

INICIATIVA ESTRATÉGICA CONHECIMENTO E INOVAÇÃO

PlanodeAção2013. Contexto Externo. Continuação de uma conjuntura socioeconómica muito desfavorável;

Resumo do Acordo de Parceria para Portugal,

Sistemas Distribuídos

Compromissos na educação

Transcrição:

Tecnologia da Linguagem Humana e o processamento computacional da língua portuguesa António Branco

1 1. Que é a tecnologia da linguagem? 2. Como está 3. Como avançar

2 Tecnologia da linguagem Da forma linguística à representação do significado e vice-versa Processamento de fala: Obter uma representação discreta a partir de um sinal analógico Processamento de linguagem: Obter uma representação do significado a partir de uma sequência de símbolos

3 Quebrar a última barreira comunicacional processamento das expressões linguísticas e do seu significado Crucial Interagir com serviços e dispositivos artificiais em linguagem natural desde robôs sofisticados a electrodomésticos banais Comunicar com falantes de outras línguas sem haver língua veicular comum

4 Impactos Económico inovação e internacionalização no mercado digital global Social cidadania plena na sociedade da informação Cultural português, língua internacional de comunicação global

5 Impacto económico e social Dois exemplos: 1.1 mil milhões de euros custo anuais da Comissão Europeia com multilinguismo 8.4 mil milhões de euros in 2008 gastos em localização de software a nível mundial Linguagem natural e barreiras linguísticas grandes oportunidades por explorar em termos de inovação: Tecnologia da linguagem em jogos, pacotes de eutainment, bibliotecas, ambientes de simulação e programas de treino, serviços de informação móveis, software de apoio à aprendizagem de línguas, ambientes de elearning, software para deteção de plagiarismo, extração de opiniões e análise de sentimentos, busca na web avançada

6 Impacto cultural Língua portuguesa 5ª língua em número de falantes no mundo chinês, castelhano, inglês, árabe 236 milhões de falantes em 4 continentes crescimento para 335 milhões em 2050 linguagem de trabalho em 27 organizações internacionais era digital impõe choque tecnológico e necessidade de preparação científica e tecnológica

7 Aplicações atuais Interação homem-máquina Interfaces com dispositivos e agentes artificiais Deteção de linguagem, autor, domínio, Classificação de textos Agrupamento de textos Busca de documentos Extração de informação Interfaces com bases de dados Resposta a perguntas Reconhecimento de fala Síntese de fala... Web Busca web avançada Anotação de metadados Gestão de ontologias Interação multilingue Tradução automática Agentes conversacionais Publicação multilingue... Produção e verificação de linguagem Correção ortográfica Correção gramatical Deteção de plágio Linguagens controladas e sistemas de produção de documentação Localização Legendagem automática Sistemas de ditado Sumarização Geração de relatórios Ambientes de apoio à tradução Simplificação de textos... Aprendizagem da linguagem Avaliação de competências Formação

8 Tecnologia nuclear Ferramentas de processamento Recursos linguísticos Separador de frases Separador de palavras Etiquetador morfossintáctico Lematizador Analisador morfológico Reconhecedor de nomes de entidades Desambiguador de aceções de palavras Analisador de constituência sintáctica Analisador de dependências gramaticais Etiquetador de papéis semânticos Gramática para processamento linguístico profundo (análise semântica) Corpora anotados Corpora paralelos e alinhados Bases de dados de fala Listas de palavras abreviaturas, nomes próprios, palavras funcionais, Vocabulários Léxicos Ontologias lexicais Terminologias Treebanks Propbanks

9 Exemplos LX-Center http://lxcenter.di.fc.ul.pt Demos e serviços linguísticos online Uni de Lisboa, Fac. Ciências, Dep. Informática, Grupo de Fala e Linguagem Natural

10 1. Que é 2. Como está a língua portuguesa preparada para a era digital? 3. Como avançar

11 Livro Branco ebook http://metanet4u.eu/ebook Língua portuguesa 10 coautores; Portugal e Brasil Coleção 30 línguas; 200+ peritos divulgação, avaliação, recomendação Rede europeia de excelência em I&D META-NET; 60 centros; 34 países

12 Preparação tecnológica dos falantes? 5ª língua em nº de utilizadores na internet 5ª língua em nº de falantes no mundo 236 milhões de falantes em 4 continentes crescimento para 335 milhões em 2050 Chinês, Castelhano, Inglês, Árabe 3,8% utilizadores de internet no mundo 3,7% população mundial 34,1% penetração da internet nos países da CPLP 32,7% penetração no mundo 31/12/2012, internet world stats (inglês, chinês, castelhano, japonês)

13 Porém alguns dados perigosamente ilusórios 3ª língua em nº de utilizadores no Twitter inglês e castelhano 31/01/2012, semiocast 3ª língua em nº de utilizadores no Facebook inglês e castelhano 13/11/2012, socialbakers Perigosamente ilusórios estas são tecnologias largamente independentes da linguagem, e facilmente extensíveis a diferentes idiomas apenas reflectem o número de utilizadores que são falantes do português com acesso à internet, não a preparação da língua portuguesa para a era digital

14 Preparação tecnológica da língua? (avaliação qualitativa)

inglês francês alemão castelhano chinês japonês italiano árabe holandês sueco português checo hindu dinamatquês polaco húngaro romeno búlgaro grego galego basco catalão finlandês esloveno estónio coreano lituano letão eslovaco maltês gaélico asturiano São Paulo, 9 maio 2014 15 Preparação tecnológica da língua? (avaliação quantitativa) Esforço de investigação Referências a línguas em artigos científicos da área, 10 conferências de topo, 2010-2012 Basco, Romeno,... Holandês 2 x mais, Italiano 2,5 x, Castelhano 3 x, Alemão e Francês 4 x mais Inglês 22 x mais 1000 900 800 700 600 500 400 300 200 100 0

16 1. Que é 2. Como está 3. Como fazer avançar o processamento computacional da língua portuguesa?

17 Comunidade internacional pilares para I&D número crescente de publicações e doutorandos grupos e centros especializados em: Brasil: Univ São Paulo (Inst Ciências Matemáticas e Computação); Univ Federal São Carlos; PUCRS; UFRGS; Univ Vale do Rio dos Sinos; PUCRJ; Univ Fed Pará; Univ Fed Minas Gerais, Portugal: Univ Lisboa, UNL, Évora, Algarve, Coimbra, Porto, Minho, comunidade internacional de I&D alguns projetos de intercâmbio Conferência bienal, pendular entre Brasil e Portugal PROPOR International Conference on the Computational Processing of Portuguese São Carlos/2014, Coimbra/2012, Porto Alegre/2010, Lisboa/1993

18 Infraestrutura de investigação Infraestrutura de Investigação de Interesse Estratégico CLARIN disponibilizará recursos e tecnologia a investigadores de todas as áreas disciplinares cujos temas de pesquisa, desenvolvimento ou inovação dizem respeito à língua portuguesa Aprovada em fev 2014; 1º sem 2015 início da implementação

19 Tecnologia emergente Ferramentas e recursos Grande complexidade científica e tecnológica Competências de investigação de combinação difícil Custos muito elevados Grande morosidade de construção Potenciar o progresso Transferência de tecnologia entre academia e indústria Plataforma de distribuição de recursos Procurar efeito bola de neve investigação-inovação

Assumir como desafio estratégico prioritário: 20 Processamento computacional da língua portuguesa Importante assegurar cidadania na era digital promover inovação e internacionalização na economia digital global Necessário ninguém fará por nós: investigação com resultados públicos potenciadora de inovação por PMEs Oportuno juntos faremos mais e melhor por um objetivo comum do que isoladamente

21 Estímulo interdisciplinar específico Necessários programas coordenados de estímulo a esta área interdisciplinar Para cobrir: investigação básica desenvolvimento tecnológico empreendedorismo inovador Envolvendo um leque amplo de instrumentos e.g: chamadas de propostas de projetos dirigidas à área bolsas de pós-graduação agrupadas para esta temática... etc

22 Obrigado António Branco