Realiter, Rio de Janeiro 2006
|
|
|
- Lorena Aires Costa
- 8 Há anos
- Visualizações:
Transcrição
1 Sandra Maria Aluísio (ICMC-USP) Ieda Maria Alves (FFLCH-USP) Mariangela de Araujo (FFLCH-USP) Bruno Oliveira Maroneze (PG-FFLCH-USP) Thiago A. S. Pardo (ICMC-USP) Esta exposição tem a finalidade de apresentar os resultados parciais obtidos por uma parceria estabelecida entre pesquisadores do Projeto TermNeo (Projeto Observatório de Neologismos Científicos e Técnicos do Português Brasileiro Contemporâneo) e pesquisadores do NILC (Núcleo Interinstitucional de Lingüística Computacional), da Universidade de São Paulo, com a finalidade de se construir uma ferramenta computacional de extração automática de neologismos. Apresenta-se o Projeto TemNeo e os córpora construídos pelo NILC, a metodologia empregada para a elaboração da ferramenta e os resultados parciais obtidos. 1. Projeto Observatório de Neologismos Científicos e Técnicos do Português Brasileiro Contemporâneo (TermNeo) O Projeto Observatório de Neologismos Científicos e Técnicos do Português Brasileiro Contemporâneo (Projeto TermNeo) tem o objetivo geral de coletar, analisar e difundir aspectos da neologia geral e da neologia científica e técnica do português contemporâneo do Brasil e de elaborar glossários e dicionários terminológicos em algumas das áreas estudadas. No âmbito desse projeto, a Base de Neologismos do Português Brasileiro Contemporâneo, dedicada especialmente ao estudo da neologia geral, cumpre o objetivo de coletar e analisar a neologia do português contemporâneo do Brasil, observada em um córpus jornalístico, fornecendo subsídios para o estudo da evolução do léxico português (variante brasileira) e para a elaboração de 1
2 repertórios de unidades lexicais neológicas. Como objetivos específicos, tem também a finalidade de constituir um córpus para a elaboração de dissertações e teses e, ainda, de fornecer subsídios para a elaboração de dicionários de língua e dicionários neológicos do português brasileiro. Para cumprir esses objetivos, observa-se a neologia do português brasileiro desde janeiro de 1993 por meio de uma coleta sistemática e por amostragem nos veículos: Jornal O Globo (primeiro domingo de cada mês) Revista IstoÉ (segunda semana de cada mês) Jornal Folha de S. Paulo (terceiro domingo de cada mês) Revista Veja (quarta semana de cada mês) A metodologia seguida para o desenvolvimento do Projeto é a da leitura manual para a coleta dos candidatos a neologismos. O caráter neológico dos mesmos tem levado em conta o princípio metodológico do córpus de exclusão, segundo o qual não é neológica a unidade lexical que não está inserida em um conjunto de obras lexicográficas brasileiras, apresentado a seguir: ACADEMIA BRASILEIRA DE LETRAS. Vocabulário ortográfico da língua portuguesa. Rio de Janeiro: Bloch, 1981 (para o córpus correspondente ao período de 1993 a 1998) Vocabulário ortográfico da língua portuguesa. 2 ed. Rio de Janeiro: Academia, ed (para o córpus coletado em 1999) Vocabulário ortográfico da língua portuguesa. 3 ed. Rio de Janeiro: Imprensa Nacional, ed (para o córpus coletado de 2000 a 2004) Vocabulário ortográfico da língua portuguesa. 4 ed. Rio de Janeiro: Imprensa Nacional, ed (para o córpus coletado a partir de 2005) FERREIRA, Aurélio Buarque de Holanda. Novo dicionário da língua portuguesa. 2 ed. Rio de Janeiro: Nova Fronteira, ed (para o córpus correspondente ao período de 1993 a 1999) Novo Aurélio Século XXI: o dicionário da língua portuguesa. 3 ed. Rio de Janeiro: 2
3 Nova Fronteira, ed (para o córpus coletado a partir de 2000) MICHAELIS: moderno dicionário da língua portuguesa. São Paulo: Melhoramentos, (para o córpus coletado a partir de 1999) HOUAISS, Antonio e VILLAR. Mauro. Dicionário Houaiss da língua portuguesa. Rio de Janeiro: Objetiva, 2001 (para o córpus coletado a partir de 2002) Os neologismos coletados filtrados pelo córpus de exclusão são em seguida inseridos em uma base de dados Access, que apresenta os seguintes campos (ou a seguinte configuração): 3
4 Os dados da Base, relativos ao período entre janeiro de 1993 e dezembro de 2000 (cerca de unidades lexicais neológicas), têm possibilitado diversas análises quantitativas e qualitativas. Os dados quantitativos revelam que os estrangeirismos correspondem a 17% dos neologismos coletados e os restantes 83% são representados por processos vernáculos: fonológicos (2%), derivados prefixais (30%), derivados sufixais (10%), compostos (22%), compostos sintagmáticos (13%), semânticos (4%), truncações (2%), outros processos como formações com siglas e reduções (2%). Apesar do auxílio de recursos como textos jornalísticos informatizados disponibilizados pela Internet, dicionários eletrônicos e programas (Folio Builder, Wordsmith Tools) que ajudam na busca de prefixos, sufixos, formações recorrentes, essa metodologia tradicional não permite a análise de um córpus de grandes dimensões. Para os alunos-bolsistas que trabalham no Projeto, dificuldades adicionais são representadas no que concerne ao reconhecimento de neologismos semânticos, de compostos e de derivados prefixais grafados sem hífen (observa-se, por exemplo, nos veículos do córpus, a concorrência entre formas compostas como auxílio moradia / auxílio-moradia e formas prefixadas como não reconhecimento / não-reconhecimento) e de formações sintagmáticas, muitas vezes confundidas com sintagmas livres. 2. Núcleo Interinstitucional de Lingüística Computacional (NILC-USP) Desde 1993, o NILC constrói córpus para contribuir em pesquisas de Processamento de Língua Natural, especialmente do Português Brasileiro. Alguns desses córpus, descritos em Córpus NILC, CórpusDT, córpus paralelos, CórpusGIS, RHETALHO, TeMário, Brazilian Portuguese Treebank, Lácio-Web. O Córpus NILC, que é utilizado para a parceria estabelecida com o Projeto TermNeo, é constituído por 40 milhões de palavras repartidas em 40 textos em prosa divididos em textos corrigidos, textos não-corrigidos e textos 4
5 semicorrigidos. Esse córpus apóia, especialmente, o projeto ReGra (Revisor Gramatical do Português Brasileiro), em constante atualização desde 1993 e constituído por canônicas e entradas (formas flexionadas, palavras compostas e locuções (5.763 das entradas são locuções nominais, prepositivas, adjetivas, adverbiais, conjuntivas)). Os pesquisadores do NILC consideram também, para a parceria com o Projeto TermNeo, os dados do Projeto Unitex-PB ( que integra o Projeto Unitex (França), em parceria com Eric Laporte. Esses dados são representados por um. Dicionário de Palavras Simples para o Português Brasileiro (aproximadamente canônicas associadas a suas regras de flexão), um Dicionário de Palavras Simples Flexionadas para o Português Brasileiro (aproximadamente palavras flexionadas) e um Dicionário de Palavras Compostas Flexionadas para o Português Brasileiro (aproximadamente entradas). Consideram também os dados do REPENTINO ( que consiste em um repositório de entidades nomeadas, do português europeu e do português brasileiro, construído pela Linguateca ( Esse repositório apresenta nomes próprios e locuções nominais, sendo representado por aproximadamente entradas divididas em várias categorias conceituais. 3. Parceria FFLCH-NILC A parceria estabelecida entre o grupo TermNeo e o NILC tem o objetivo de desenvolver uma ferramenta computacional que permita maior automatização na extração de neologismos a partir de córpora textuais. Essa ferramenta visa a permitir, além da diminuição do tempo de coleta (tornando desnecessária a leitura a olho nu ) uma maior precisão (com a eliminação do risco de se deixar passar um neologismo). Além disso, as contagens de freqüência a partir dos córpora 5
6 informatizados possibilitariam a realização de análises quantitativas, além das qualitativas já efetuadas. Do ponto de vista metodológico, o córpus de exclusão deixa de ser o filtro lexicográfico, evitando-se, assim, as arbitrariedades presentes nas obras lexicográficas disponíveis. O córpus de exclusão passa a ser constituído por léxicos extraídos de textos reais, o que tornaria o filtro mais confiável e baseado, efetivamente, no uso. Para os pesquisadores do NILC, os resultados da parceria devem permitir, também, o enriquecimento e atualização dos repositórios lexicais organizados pelo grupo, ao identificar as eventuais lacunas vocabulares existentes nesses repositórios. Desse modo, espera-se conseguir uma sinergia entre os processos lingüístico (identificação de neologismos) e lingüístico-computacional (enriquecimento de repositórios lexicais). Após o encontro entre pesquisadores do NILC e do grupo TermNeo, foi proposta a realização de um teste-piloto. O córpus utilizado para o teste foi constituído pelos textos das quatro edições da revista Veja de agosto de A primeira etapa consistiu no pré-processamento do córpus: cada texto era precedido por um cabeçalho, como o que segue: 29/08/ Veja - Carta ao Leitor - Dicionário Houaiss - Notícias do idioma vivo PUBLICAÇÃO: Veja DATA: 29/08/2001 EDIÇÃO: 1715 PÁG.: 9 RESUMO: A saga da criação do mais completo e moderno dicionário da língua portuguesa é o tema de capa desta edição de Veja. ASSUNTO PRINCIPAL: DICIONÁRIO HOUAISS PALAVRAS- CHAVES: LINGUAGEM; PORTUGUÊS /IDIOMA/; PUBLICAÇÃO Veja Carta ao Leitor 29/08/ Carta ao Leitor Dicionário Houaiss Notícias do idioma vivo Numa de suas odes mais famosas, reproduzida em parte na introdução do Aurélio, o poeta chileno Pablo Neruda diz que o dicionário não é uma tumba de... 6
7 Esse cabeçalho, que contém informações não-relevantes para a extração de neologismos, foi eliminado automaticamente. Além disso, foram resolvidos automaticamente certos problemas de formatação do córpus, como sentenças quebradas. Em seguida, o córpus foi segmentado automaticamente pela ferramenta SENTER ( thiago/senter.html), que, baseada na pontuação, permite identificar o início e o fim de cada sentença. Dessa forma, o resultado é uma sentença por linha. Por fim, dados como números, datas, endereços de sítios da Internet e de correio eletrônico foram substituídos por categorias genéricas, como NÚMERO, DATA etc. Para esse teste-piloto, foram usados como córpus de exclusão os três léxicos do NILC já mencionados: o léxico do NILC, o Unitex-PB e o REPENTINO. Esses léxicos foram pré-processados, em primeiro lugar, para excluir informações irrelevantes para a coleta de neologismos, como informações morfossintáticas. Além disso, as locuções presentes nos léxicos foram segmentadas (por exemplo, Rio de Janeiro foi separado em três unidades), porque, nesse teste-piloto, a preocupação era com a detecção de neologismos de uma única unidade. Finalmente, após o pré-processamento, foi efetuada a filtragem: as palavras do córpus foram comparadas às listas dos três léxicos. Aquelas presentes no córpus, mas que não constavam dos léxicos, foram consideradas candidatas a neologismos. Os resultados obtidos (quantitativamente) foram os seguintes: Léxico do NILC: palavras candidatas (1.7%) / palavras candidatas distintas Unitex-PB palavras candidatas (2.6%) /4.815 palavras candidatas distintas REPENTINO 7
8 palavras candidatas (15.1%)/ palavras candidatas distintas Todos palavras candidatas (0.8%) / palavras candidatas distintas Novamente, o léxico do NILC foi o que possibilitou a melhor filtragem. A porcentagem final de candidatos foi bastante semelhante à do primeiro teste. Os candidatos foram analisados por um lingüista do projeto TermNeo; novamente, a análise levou apenas cerca de 2 horas. Os percentuais foram muito semelhantes. Em primeiro lugar, candidatos (64,6%) foram marcados com talvez seja nome próprio, sobrando 639 candidatos (35,4%) com probabilidade mais alta de serem neologismos. Após a análise pelo lingüista, foram obtidos os seguintes resultados: dentre os prováveis nomes próprios, apenas 164 (14%) eram de fato neologismos, enquanto, dentre os demais, 626 (98%) eram neologismos. No total, 790 (43,8%) foram validados como neologismos. Os dados quantitativos revelaram que a ferramenta detectou os nomes próprios com alta probabilidade de acerto. Além disso, a porcentagem final de neologismos em relação ao tamanho total do córpus ficou em 0,39% em ambos os testes, o que parece revelar que essa deve ser, em média, a quantidade de neologismos presente em córpus do tipo analisado. Foram detectados alguns problemas, que a ferramenta não pôde resolver. Em primeiro lugar, alguns números, datas e endereços da Internet não puderam ser automaticamente eliminados, e foram incorretamente detectados como neologismos. Além disso, a segmentação sentencial é insuficiente, em alguns casos, e pode não permitir a correta identificação do significado e do uso do neologismo. Outros dois problemas que a ferramenta não consegue resolver referem-se a dificuldades já detectadas no processo de leitura tradicional. Em primeiro lugar, há o caso das formações sintagmáticas, que não são unidas por hífen, bem como certas composições e formações prefixais. Para detectar esses casos, foi sugerida a utilização de um analisador sintático automático (parser), que ainda precisa ser testado. Em segundo lugar, há o problema dos neologismos semânticos, para o qual ainda não foram encontradas soluções satisfatórias. Nesse caso, a provável solução será o retorno à leitura tradicional, por 8
9 amostragem. 4. Considerações finais De maneira geral, o resultado dos testes-piloto foi bastante positivo: o tempo de coleta foi significativamente reduzido, o que permitirá a inclusão de mais veículos no córpus (possivelmente a inclusão do jornal O Estado de S. Paulo e da revista Época), bem como o aumento de edições analisadas (todas as edições das revistas semanais e jornais de dois domingos por mês). O ambiente informatizado criado para a extração de neologismos será integralmente disponibilizado para uso por outros pesquisadores que enfrentam o mesmo problema na coleta neológica. No momento, já estão disponibilizadas as ferramentas SENTER, Pre-processing program e Filtering program ( thiago/neologismo.html). 9
ESTUDO DO LÉXICO EM SALA DE AULA: O TRABALHO COM ESTRANGEIRISMOS A PARTIR DE TEXTOS PUBLICITÁRIOS
ESTUDO DO LÉXICO EM SALA DE AULA: O TRABALHO COM ESTRANGEIRISMOS A PARTIR DE TEXTOS PUBLICITÁRIOS Fabiana Kelly de Souza (PG- FALE/UFMG) 1 Introdução As línguas se modificam de acordo com as necessidades
SEMÂNTICA PARTE 3 ANÁLISE SEMÂNTICA 14/06/2012. SCC5908 Tópicos em Processamento de Língua Natural. Até agora, significado da sentença
SEMÂNTICA PARTE 3 SCC5908 Tópicos em Processamento de Língua Natural Thiago A. S. Pardo ANÁLISE SEMÂNTICA Até agora, significado da sentença Rhumba closed. e Closing(e) Closed(e,Rhumba) 2 1 ANÁLISE SEMÂNTICA
Recapitulando... Abordagens: PLN. Abordagens: PLN 29/03/2012. Introdução ao Processamento de Línguas Naturais. Distribuição de palavras
Introdução ao Processamento de Línguas Naturais SCC5908 Introdução ao Processamento de Língua Natural Thiago A. S. Pardo Recapitulando... Abordagens superficiais vs. profundas Simbolismo vs. estatística
O código do modelo de mapeamento sintático-conceitual do sistema ConPor
Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP O código do modelo de mapeamento sintático-conceitual do sistema ConPor Lucia Specia Lucia
Capítulo1. Capítulo2. Índice A LÍNGUA E A LINGUAGEM O PORTUGUÊS: uma língua, muitas variedades... 15
Capítulo1 Capítulo2 A LÍNGUA E A LINGUAGEM............................................. 9 Linguagem: aptidão inata.............................................. 10 Funções.............................................................
ANEXO 1 A Ementário e Quadro de disciplinas por Departamentos/Setores
ANEXO 1 A Ementário e Quadro de disciplinas por Departamentos/Setores LET 1 - DISCIPLINAS DO SETORES DE LÍNGUA PORTUGUESA,LITERATURAS E LATIM Atenção: As disciplinas em negrito são novas disciplinas propostas.
DADOS DO COMPONENTE CURRICULAR
DADOS DO COMPONENTE CURRICULAR Nome: Inglês Instrumental Curso: Licenciatura em Ciências Biológicas Período: Optativa Carga Horária total: 50h Pré-requisito: não possui EMENTA Conscientização do processo
Carmen Lúcia. A soberba não é grandeza, é inchaço. O que incha parece grande, mas não está são. Santo Agostinho LÍNGUA PORTUGUESA CONTEÚDOS
A soberba não é grandeza, é inchaço. O que incha parece grande, mas não está são. Santo Agostinho LÍNGUA PORTUGUESA CONTEÚDOS Livros: 1. Português Linguagens 5 William Cereja e Thereza Cochar 2. Interpretação
Uma avaliação de analisadores morfológicos do português
Uma avaliação de analisadores morfológicos do português Jéssica O. de Souza, André C. Santiago, Katiuscia de M. Andrade, Mardônio J. C. de França, Hélio L. B. Silva, Ananda L. Freire, Leonel F. de Alencar,
Indexação automática. CBD/ECA Indexação: teoria e prática
Indexação automática CBD/ECA Indexação: teoria e prática Indexação documentária Identificar pela análise dos documentos, os seus assuntos extrair os conceitos que indicam o seu conteúdo traduzir os conceitos
O PAVEL: curso interativo de Terminologia
Disponível em:< http://www.termiumplus.gc.ca/didacticiel_tutorial/portugues/lecon1/indexe_p.html> Acesso em: 01/03/2011. O PAVEL: curso interativo de Terminologia Glossário Abreviação Designação formada
Cód. Disciplina Período Créditos Carga Horária D-11 2º 04 Semanal Mensal Nome da Disciplina / Curso LINGUAGEM FORENSE
Cód. Disciplina Período Créditos Carga Horária Curso D-11 2º 04 Semanal Mensal 04 60 Nome da Disciplina / Curso DIREITO LINGUAGEM FORENSE Noções metodológicas de leitura e interpretação de textos técnicos.
O VOCABULÁRIO DE MANOEL DE BARROS: CONSTRUINDO SENTIDOS POR MEIO DA EXPRESSIVIDADE DAS PALAVRAS 1
O VOCABULÁRIO DE MANOEL DE BARROS: CONSTRUINDO SENTIDOS POR MEIO DA EXPRESSIVIDADE DAS PALAVRAS 1 Simone Cristina Spironelli2 A língua é instrumento de comunicação e de interação, mas seu papel ultrapassa
NEOLOGIA E IMPLICAÇÕES TEXTUAIS
1821 NEOLOGIA E IMPLICAÇÕES TEXTUAIS Ieda Maria Alves USP Introdução A neologia lexical, comumente mais estudada no âmbito dos estudos morfológicos, estabelece também relações com os outros níveis de análise
ENTREVISTA. Acta Semiotica et Lingvistica entrevista a Profª Drª Ieda Maria Alves - Universidade de São Paulo USP.
ENTREVISTA Acta Semiotica et Lingvistica entrevista a Profª Drª Ieda Maria Alves - Universidade de São Paulo USP. Professora titular da Faculdade de Filosofia, Letras e Ciências Humanas da Universidade
Análise Sintática de Frases utilizando Gramáticas Livres de Contexto Probabilísticas
Universidade de São Paulo Mestrado em Ciência da Computação Instituto de Matemática e Estatística Disciplina MAC5725 Lingüística Computacional Análise Sintática de Frases utilizando Gramáticas Livres de
Sumário PARTE 1. Gramática
PARTE 1 Gramática Capítulo 1 Fonologia... 25 1. Introdução... 25 1.1 Conceitos básicos da fonologia... 25 1.2 Outros Conceitos Fonológicos... 26 1.3 Polêmicas... 29 2. Divisão silábica... 31 3. Ortografia...
PADRÕES DE VOCABULÁRIO E ENSINO SOBRE LÉXICO E DICIONÁRIOS: APROVEITAMENTO DE JORNAIS POPULARES
XXI Salão de Iniciação Científica UFRGS PADRÕES DE VOCABULÁRIO E ENSINO SOBRE LÉXICO E DICIONÁRIOS: APROVEITAMENTO DE JORNAIS POPULARES Bruna Rodrigues da Silva¹, Maria José Bocorny Finatto ²(orientador)
GERAL Preparar o futuro profissional do direito no sentido de expressar-se com correção, clareza e coerência.
1. IDENTIFICAÇÃO CÓDIGO DA DISCIPLINA: D-07 PERÍODO: 3 CRÉDITO: 04 NOME DA DISCIPLINA: LINGUAGEM FORENSE NOME DO CURSO: DIREITO CARGA HORÁRIA SEMANAL: 04 CARGA HORÁRIA SEMESTRAL: 60 2. EMENTA Noções metodológicas
AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E TEXTOS LITERÁRIOS. Bianca Pasqualini. Doutoranda PPGLet/UFRGS
AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E TEXTOS LITERÁRIOS Bianca Pasqualini Doutoranda PPGLet/UFRGS Orientadora: Profa. Dra. Maria José B. Finatto PRIMEIRO ESTUDO: ANÁLISE DE ÍNDICES
A BUSCA DE EQUIVALENTES PARA OS NEOLOGISMOS LACANIANOS
A BUSCA DE EQUIVALENTES PARA OS NEOLOGISMOS LACANIANOS Paula Fernanda Malaszkiewicz (BIC-UFRGS) Profa. Patricia Chittoni Ramos Reuillard (orientadora) Jacques Lacan (I) Psicanalista francês (1901-1981)
I 1 COMUNICAÇÃO JURÍDICA
Sumário Parte I Introdução à Comunicação 1 COMUNICAÇÃO JURÍDICA 1.1 Conceitos 1.2 Elementos da comunicação 1.3 Funções da linguagem 1.4 Língua oral e língua escrita 1.5 Níveis de linguagem 1.6 O ato comunicativo
Plano de Ensino. Meses Fevereiro Março Abril Maio Junho Julho Aulas Regulares Aulas de
Identificação Plano de Ensino Curso: Direito Disciplina: Língua Portuguesa Ano/semestre: 2012/01 Carga horária: Total: 80h Semanal: 4h Professor: Michelle Teixeira da Silva Período/turno: matutino e noturno
Geração de Modelo para Reconhecimento de Entidades Nomeadas no OpenNLP
Geração de Modelo para Reconhecimento de Entidades Nomeadas no OpenNLP Gabriel C. Chiele 1, Evandro Fonseca 1, Renata Vieira 1 1 Faculdade de Informática Pontifícia Universidade Católica do Rio Grande
6 Atributos. A dívida da empresa subiu.
6 Atributos Para buscar o sentimento de um texto automaticamente precisamos encontrar boas pistas ao longo do discurso. Uma grande variedade de palavras e expressões possui conotação positiva ou negativa,
SUMÁRIO. 2 Vocabulário Jurídico Polissemia e homonímia... 37
SUMÁRIO 1 Língua e Linguagem... 1 1.1. Língua... 1 1.2. Linguagem... 3 1.3. Linguagem verbal... 4 1.3.1. Língua falada... 5 1.3.2. Língua escrita... 7 1.4. Linguagem não verbal... 10 1.4.1. Linguagem corporal...
Antes de iniciar as respostas, faça uma leitura completa da avaliação. Lembre-se:
9º Rasuras serão consideradas erro! Não use corretivo! Não abrevie palavras! Utilize apenas caneta de tinta azul ou preta! Responda ao que foi solicitado de forma coerente e coesa. Boa Sorte! Dar o conceito
Uma ferramenta para expansão do vocabulário com base em coocorrência
Resumos Expandidos: XI Mostra de Estagiários e Bolsistas... 11 Uma ferramenta para expansão do vocabulário com base em coocorrência Exupério Lédo Silva Júnior 1 Roberta Akemi Sinoara 2 Solange Oliveira
PLANO DE DISCIPLINA IDENTIFICAÇÃO EMENTA
PLANO DE DISCIPLINA IDENTIFICAÇÃO CURSO: NEGÓCIOS IMOBILIÁRIOS DISCIPLINA: INGLÊS INSTRUMENTAL UNIDADE CURRICULAR: Obrigatória [X] Optativa [ ] Eletiva [ ] SEMESTRE: 1 CARGA HORÁRIA SEMANAL: 03 HORAS -
Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU
Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Pré-processamento de documentos Organização e Recuperação de Informação(GSI521) Introdução O pré-processamento de
1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a
1 Introdução 1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a partir de dados. Existem diversas aplicações
Introdução ao Processamento de Línguas Naturais. Thiago A. S. Pardo
Introdução ao Processamento de Línguas Naturais Thiago A. S. Pardo Núcleo Interinstitucional de Lingüística Computacional Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo 1 Meta
ABORDAGENS COMPUTACIONAIS da teoria da gramática
1 9 7 2 5 0 ABORDAGENS COMPUTACIONAIS da teoria da gramática 1 9 7 2 5 0 Leonel Figueiredo de Alencar Gabriel de Ávila Othero (organizadores) ABORDAGENS COMPUTACIONAIS da teoria da gramática 1 9 7 2 5
TeMário: Um Corpus para Sumarização Automática de Textos
Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP TeMário: Um Corpus para Sumarização Automática de Textos Thiago Alexandre Salgueiro Pardo
UNIVERSIDADE EÖTVÖS LORÁND FACULDADE DE LETRAS ESCOLA DOUTORAL DAS CIÊNCIAS DA LINGUAGEM PROGRAMA DOUTORAL DE ROMANÍSTICA.
UNIVERSIDADE EÖTVÖS LORÁND FACULDADE DE LETRAS ESCOLA DOUTORAL DAS CIÊNCIAS DA LINGUAGEM PROGRAMA DOUTORAL DE ROMANÍSTICA Márta Csaba Palavras derivadas no PB e no PE Apresentação da tese Budapeste 2 0
O ESTUDO DO VOCABULÁRIO
Sumário Capítulo 1 O ESTUDO DO VOCABULÁRIO Lição 1 Fonética...3 1.1. Fonema e Letra... 3 1.2. Divisão dos Fonemas... 3 1.3. Classificação dos fonemas... 5 1.4. Encontro Vocálico... 7 1.5. Encontro Consonantal...
Ensino Português no Estrangeiro Nível C1 (14C1AA) CRITÉRIOS ESPECÍFICOS DE CLASSIFICAÇÃO
Ensino Português no Estrangeiro Nível C1 (14C1AA) CRITÉRIOS ESPECÍFICOS DE CLASSIFICAÇÃO PARTE I COMPREENSÃO ORAL Grupo Itens Nº Critérios Específicos de Classificação Grupo I 6. : V ou F, de acordo com
ESTUDO LEXICOGRÁFICO A LUZ DA LINGUÍSTICA DE CORPUS: FRASEOLOGISMOS ZOÔNIMOS.
ESTUDO LEXICOGRÁFICO A LUZ DA LINGUÍSTICA DE CORPUS: FRASEOLOGISMOS ZOÔNIMOS. Contextualização. As pesquisas baseadas em corpora têm, cada vez mais, assumido seu espaço dentro do cenário de estudos linguísticos.
O ESTUDO DAS PALAVRAS
Sumário Capítulo 1 O ESTUDO DAS PALAVRAS Lição 1 Fonética...3 1.1. Fonema e letra... 3 1.2. Divisão dos fonemas... 3 1.3. Classificação dos fonemas... 5 1.4. Encontro vocálico... 6 1.5. Encontro consonantal...
Ensino em arquitetura e urbanismo: meios digitais e processos de projeto
PROJETO DE PESQUISA PÓS-DOUTORADO Ensino em arquitetura e urbanismo: meios digitais e processos de projeto Candidata: Mayara Dias de Souza Supervisor: Prof. Associado Dr. Marcelo Tramontano 1 RESUMO Reflexões
P R O G R A M A. O léxico português. Processos de criação e renovação
UNIVERSIDADE FEDERAL DA PARAÍBA CENTRO DE CIÊNCIAS HUMANAS, LETRAS E ARTES DEPARTAMENTO DE LETRAS CLÁSSICAS E VERNÁCULAS DISCIPLINA: LÍNGUA PORTUGUESA II (Red. e Expressão Oral) CARGA HORÁRIA: 45 horas
Plano de Ensino Componente Curricular: Curso: Período: Carga Horária: Docente: Ementa Objetivos Geral Específicos
Plano de Ensino Componente Curricular: Língua Portuguesa e Literatura Brasileira I Curso: Técnico em Química (Integrado) Período: 1º ano Carga Horária: 160 h/a 133 h/r Docente: Anna Giovanna Rocha Bezerra
CAPÍTULO 1 O ESTUDO DAS PALAVRAS
Índice CAPÍTULO 1 O ESTUDO DAS PALAVRAS LIÇÃO 1 FONÉTICA...3 1.1. Fonema e letra... 3 1.2. Divisão dos fonemas... 3 1.3. Classificação dos fonemas... 4 1.4. Encontro vocálico... 5 1.5. Encontro consonantal...
Objeto de avaliação. Caracterização da prova. 1.º Ciclo do Ensino Básico (Decreto-Lei n.º 17/2016, de 4 de abril) Prova
INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA Nº 20/2017 PORTUGUÊS-Prova Escrita Maio de 2017 Prova 41 2017 1.º Ciclo do Ensino Básico (Decreto-Lei n.º 17/2016, de 4 de abril) O presente documento divulga
CARGA HORÁRIA SEMANAL: 03 CRÉDITO: 03 NOME DA DISCIPLINA: LINGUAGEM FORENSE
1. IDENTIFICAÇÃO PERÍODO: 2 e 9 CARGA HORÁRIA SEMANAL: 03 CRÉDITO: 03 NOME DA DISCIPLINA: LINGUAGEM FORENSE CARGA HORÁRIA SEMESTRAL: 45 2. EMENTA Noções metodológicas de leitura e interpretação de textos
INFORMÁTICA APLICADA ÀS ORGANIZAÇÕES. Gabriel Soares de Vasconcelos
INFORMÁTICA APLICADA ÀS ORGANIZAÇÕES Roteiro Redação de textos ABNT Editores de textos MS Word Configuração ABNT no MS Word Redação de textos Definição É todo ato normativo e toda comunicação através da
Dicionario Espanhol Portugues Gratis
Dicionario Espanhol Portugues Gratis 1 / 6 2 / 6 3 / 6 Dicionario Espanhol Portugues Gratis Pesquisar no dicionário Espanhol-Português por letras. Se não encontrar uma palavra em espanhol que queira ver
DISCIPLINA 01 EXPRESSÃO ESCRITA TOTAL 20
DISCIPLINA 01 EXPRESSÃO ESCRITA - 2014 UNIDADES DIDÁTICAS HORAS PÁGINA I. A SELEÇÃO VOCABULAR: CRITÉRIOS E APLICAÇÕES II. GRAMÁTICA DE TEXTO AVALIAÇÃO DA APRENDIZAGEM 10 10-03 05 06 TOTAL 20 Plano de Disciplinas
Universidade de Santa Cruz do Sul UNISC Departamento de informática COMPILADORES. Introdução. Geovane Griesang
Universidade de Santa Cruz do Sul UNISC Departamento de informática COMPILADORES Introdução [email protected] Processadores de linguagem Linguagens de programação são notações para se descrever
Ensino Português no Estrangeiro Nível B2 (13B2AZ) CRITÉRIOS ESPECÍFICOS DE CLASSIFICAÇÃO
Ensino Português no Estrangeiro Nível B2 (13B2AZ) CRITÉRIOS ESPECÍFICOS DE CLASSIFICAÇÃO PARTE I COMPREENSÃO ORAL Grupo Itens Nº Critérios Específicos de Classificação Pontuação Soluções Grupo I 4 pontos
O LÉXICO RELIGIOSO NO NORDESTE DO BRASIL
441 de 664 O LÉXICO RELIGIOSO NO NORDESTE DO BRASIL Geisa Borges da Costa 133 (UFBA/UFRB) RESUMO O estudo descreve o léxico religioso dos falantes das capitais do Nordeste brasileiro. Utilizaram-se inquéritos
Adequação do vocabulário DeCS à nova ortografia da língua portuguesa
Adequação do vocabulário DeCS à nova ortografia da língua portuguesa Arthur Alberto Corrêa Treuherz; Ana Cristina Espindola Campos; Heitor Barbieri; Olga Pedroza Ribeiro. BIREME - OPAS - OMS Centro Latino-Americano
PROVA DE LÍNGUA PORTUGUESA PROVAS ESPECIALMENTE ADEQUADAS DESTINADAS A AVALIAR A CAPACIDADE PARA A FREQUÊNCIA DO ENSINO SUPERIOR DOS MAIORES DE
INSTITUTO POLITÉCNICO DE LISBOA ESCOLA SUPERIOR DE EDUCAÇÃO DE LISBOA 2017 PROVA DE LÍNGUA PORTUGUESA PROVAS ESPECIALMENTE ADEQUADAS DESTINADAS A AVALIAR A CAPACIDADE PARA A FREQUÊNCIA DO ENSINO SUPERIOR
MATRIZ DE EXAME DE EQUIVALÊNCIA À FREQUÊNCIA DO ENSINO BÁSICO / 9º ANO L.E.II - ESPANHOL. Ano Letivo 2011/2012 junho/setembro.
Ano Letivo 2011/2012 junho/setembro MATRIZ DE EXAME DE EQUIVALÊNCIA À FREQUÊNCIA DO ENSINO BÁSICO / 9º ANO Disciplina/Código L.E.II - ESPANHOL Modalidade da Prova Escrita Duração 90 minutos Tolerância
Visualização de Texto e Documento
Visualização de Texto e Documento SCC5836 Visualização Computacional Prof. Fernando V. Paulovich http://www.icmc.usp.br/~paulovic [email protected] Instituto de Ciências Matemáticas e de Computação
EDITOR DE ANOTAÇÃO DE SIMPLIFICAÇÃO: MANUAL DO USUÁRIO
Universidade de São Paulo USP Universidade Federal de São Carlos UFSCar Universidade Estadual Paulista UNESP EDITOR DE ANOTAÇÃO DE SIMPLIFICAÇÃO: MANUAL DO USUÁRIO Helena de Medeiros Caseli Tiago de Freitas
REDAÇÃO PARA CONCURSOS
REDAÇÃO PARA CONCURSOS Sumário Primeira Parte Primeira Lição Poesia matemática Gramática acentuação gráfica Tipos de palavras Regras gerais Dupla prosódia Pronúncia duvidosa Orientação Ortográfica emprego
... Página 1 AGRUPAMENTO DE ESCOLAS ANO LETIVO: 2013/2014 ANO:9º. CURRÍCULO DA DISCIPLINA: Português 1º PERÍODO
AGRUPAMENTO DE ESCOLAS DE VILA POUCA DE AGUIAR SUL (150666) ANO LETIVO: 2013/2014 ANO:9º CURRÍCULO DA DISCIPLINA: Português CONTEÚDOS Unidade 0 Partida largada fugida! Unidade 1 Comunicadores do século
Catálogo Dicionários
Catálogo Dicionários APRESENTAÇÃO Desde sua origem, em 1987, a Editora Unesp, braço editorial da Universidade Estadual Paulista, tem como objetivo desempenhar papel dinamizador da cultura, presumindo-se
PROVA DE LÍNGUA PORTUGUESA (Acesso aos cursos de mestrado profissionalizante 2.ª chamada)
INSTITUTO POLITÉCNICO DE LISBOA ESCOLA SUPERIOR DE EDUCAÇÃO DE LISBOA 2016 PROVA DE LÍNGUA PORTUGUESA (Acesso aos cursos de mestrado profissionalizante 2.ª chamada) CRITÉRIOS DE CLASSIFICAÇÃO I. Leitura
Apresentação 11 Lista de abreviações 13. Parte I: NATUREZA, ESTRUTURA E FUNCIONAMENTO DA LINGUAGEM
Sumário Apresentação 11 Lista de abreviações 13 Parte I: NATUREZA, ESTRUTURA E FUNCIONAMENTO DA LINGUAGEM O homem, a linguagem e o conhecimento ( 1-6) O processo da comunicação humana ( 7-11) Funções da
Por que o dicionário é importante na escola?
Introdução Por que o dicionário é importante na escola? O dicionário é uma obra didática e, como tal, serve para ensinar. Ensina o significado das palavras, sua origem, seu uso, sua grafia. É uma obra
Interpretar discursos orais com diferentes graus de formalidade e complexidade. Registar,
DEPARTAMENTO DE LÍNGUAS PORTUGUÊS º ANO A Ano Letivo: 203 / 204 Introdução /Metas O desenvolvimento do ensino é orientado por Metas Curriculares cuja definição organiza e facilita o ensino, pois fornece
Manual OntoLP. 1-Introdução ao OntoLP Instalação do OntoLP Executando o OntoLP Observação Importante...4
Manual OntoLP Sumário: 1-Introdução ao OntoLP...2 2-Instalação do OntoLP...2 3-Executando o OntoLP...2 4-Observação Importante...4 5-Aba de Carga do Corpus...5 6-Aba de Extração de Termos...7 7- Aba de
Coesão e coerência no jornal Diário Gaúcho: um estudo exploratório
XXII Salão de Iniciação Científica UFRGS Coesão e coerência no jornal Diário Gaúcho: um estudo exploratório Ana Maria Sigas Pichini Graduanda Letras / Bacharelado Voluntária de IC PROPESQ UFRGS Profª Drª
USO DO FUTURO DO PORTUGUÊS BRASILEIRO EM BLOG JORNALÍSTICO: UM ESTUDO PRELIMINAR SOBRE A GRAMATICALIZAÇÃO DO ITEM IR
463 de 663 USO DO FUTURO DO PORTUGUÊS BRASILEIRO EM BLOG JORNALÍSTICO: UM ESTUDO PRELIMINAR SOBRE A GRAMATICALIZAÇÃO DO ITEM IR Milca Cerqueira Etinger Silva 142 (UESB) Gilsileide Cristina Barros Lima
