Programação e Resumos

Documentos relacionados
SEMÂNTICA PARTE 3 ANÁLISE SEMÂNTICA 14/06/2012. SCC5908 Tópicos em Processamento de Língua Natural. Até agora, significado da sentença

TeMário 2006: Estendendo o Córpus TeMário

ABORDAGENS COMPUTACIONAIS da teoria da gramática

Ontologias Linguísticas e Processamento de Linguagem Natural. Ygor Sousa CIn/UFPE

Realiter, Rio de Janeiro 2006

O código do modelo de mapeamento sintático-conceitual do sistema ConPor

Estudo Semântico e Aplicação Computacional de Adjetivos do Português do Brasil

Plano de Trabalho Docente Ensino Técnico

CONTEÚDO ESPECÍFICO DA PROVA DA ÁREA DE LETRAS GERAL PORTARIA Nº 258, DE 2 DE JUNHO DE 2014

Manual OntoLP. 1-Introdução ao OntoLP Instalação do OntoLP Executando o OntoLP Observação Importante...4

Indexação automática. CBD/ECA Indexação: teoria e prática

1 Introdução. (1) a. A placa dos automóveis está amassada. b. O álbum das fotos ficou rasgado.

aplicação computacional no Unidades Lexicais: uma Estrutura Ontológica e domínio da Ecologia Leandro Henrique Mendonça de Oliveira USP/ICMC-NILC

MATRIZ CURRICULAR DO CURSO DE GRADUAÇÃO EM LETRAS PORTUGUÊS E ESPANHOL - LICENCIATURA

6 Atributos. A dívida da empresa subiu.

MATRIZ CURRICULAR DO CURSO DE GRADUAÇÃO EM LETRAS PORTUGUÊS E ESPANHOL - LICENCIATURA

CURSO DE FISIOTERAPIA Autorizado pela Portaria nº 377 de 19/03/09 DOU de 20/03/09 Seção 1. Pág. 09 PLANO DE CURSO

O PAVEL: curso interativo de Terminologia

A construção de wordnets terminológicas com base em corpus

AGRUPAMENTO DE ESCOLAS SEBASTIÃO DA GAMA

Descrição da Escala Língua Portuguesa - 7 o ano EF

Experiências práticas na UFU com a LC

CURSO DE GRADUAÇÃO EM LETRAS PORTUGUÊS E ESPANHOL

ANEXO 1 A Ementário e Quadro de disciplinas por Departamentos/Setores

Realiter, Rio de Janeiro 2006

Descrição da Escala Língua Portuguesa - 7 o ano EF

Os programas das disciplinas em causa preconizam atividades linguísticas, estratégias e tarefas reportadas a usos comunicativos da língua.

Escola Básica e Secundária de Alvide

ESPANHOL INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA. Prova º Ciclo do Ensino Básico AGRUPAMENTO DE ESCOLAS VERGÍLIO FERREIRA

Plano de Trabalho Docente

CURSO DE ENFERMAGEM Reconhecido pela Portaria nº 270 de 13/12/12 DOU Nº 242 de 17/12/12 Seção 1. Pág. 20

Descrição da Escala Língua Portuguesa - 5 o ano EF

COMPREENSÃO DE TEXTOS ESCRITOS

Universidade Estadual de Maringá Centro de Ciências Humanas, Letras e Artes

2. Objeto de avaliação

Linguagens Documentárias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília

PARÁFRASE COMO RECURSO DISCURSIVO NO ENSINO DE CIÊNCIAS. Margarethe Steinberger Elias e Francisco das Chagas Pereira

(2) A rápida publicação deste livro pela editora foi um bom negócio.

Formulário de Projeto

Introdução ao Processamento de Línguas Naturais. Thiago A. S. Pardo

Recapitulando... Abordagens: PLN. Abordagens: PLN 29/03/2012. Introdução ao Processamento de Línguas Naturais. Distribuição de palavras

Inteligência Artificial. Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional

FACULDADE SUMARÉ COORDENAÇÃO DE PESQUISA PROGRAMA DE PESQUISA - INICIAÇÃO CIENTÍFICA EDITAL DE INSCRIÇÃO Nº 01/2017

Ensino em arquitetura e urbanismo: meios digitais e processos de projeto

CONTEÚDOS DIVERSIFICADOS, DE ACORDO COM AS NECESSIDADES LINGUISTICAS, CURRICULARES E DE INTEGRAÇÃO DOS ALUNOS.

OFICINAS. Caderno de resumos das Oficinas do VII ENIEDUC Diversidade: desafios na prática educacional. Campo Mourão: UNESPAR, julho/2017.

Processamento de Linguagem Natural

PoloCLUP Linguateca Belinda Maia

ESCOLA SECUNDÁRIA DR. GINESTAL MACHADO PLANIFICAÇÃO ANUAL DE PORTUGUÊS 11º ANO

Colégio Internato dos Carvalhos

1º, 5º e 7º anos de acordo com o dec. Lei 55/2018 de 6 de julho Os restantes anos de acordo com o dec. Lei 139/2012 de 5 de julho

A/ART casa/n caiu/v./. Figura 3.1: Frase com anotação morfossintática.

Linguística e Língua Portuguesa 2016/01

OS DIFERENTES CRITÉRIOS UTILIZADOS PARA CLASSIFICAÇÃO DE PALAVRAS EM GRAMÁTICAS ESCOLARES

A ELABORAÇÃO DE UM CATÁLOGO: CONSTRUÇÕES RECORRENTES EM TEXTOS DE PEDIATRIA PARA APRENDIZES DE TRADUÇÃO

FACULDADE SETE DE SETEMBRO FASETE

AULA 2. Texto e Textualização. Prof. Daniel Mazzaro Vilar de Almeida 2013/1º

Planejamento do Trabalho Pedagógico: elaboração de plano de curso e plano de aula. Profa. Dra. Hilda Mara Lopes Araujo DMTE/CCE

PLANO DE ENSINO SEMESTRE: 2016_1

EMENTAS DAS DISCIPLINAS DO PROGRAMA DE PÓS- GRADUAÇÃO EM LETRAS MESTRADO E DOUTORADO (Resolução nº 182/2017-CI/CCH 31/10/2017)

DADOS DO COMPONENTE CURRICULAR

6LEM064 GRAMÁTICA DA LÍNGUA ESPANHOLA I Estudo de aspectos fonético-fonológicos e ortográficos e das estruturas morfossintáticas da língua espanhola.

ROTEIRO DE RECUPERAÇÃO 2018

Escola Básica e Secundária de Santa Maria. Ano Letivo 2017/2018. Informação Prova Especial de Avaliação. PROFIJ II Tipo 2 1º ano

INFORMAÇÃO-PROVA DE EQUIVALÊNCIA À FREQUÊNCIA

PALAVRAS-CHAVE: língua Apinayé, sintaxe, educação escolar indígena.

I Atribuições e atividades profissionais relativas à qualificação ou à habilitação profissional, que justificam o desenvolvimento das competências pre

AVALIAÇÃO DE COMPLEXIDADE TEXTUAL EM TEXTOS DE PEDIATRIA E TEXTOS LITERÁRIOS. Bianca Pasqualini. Doutoranda PPGLet/UFRGS

II Simpósio Nacional de Educação em Astronomia

Português - 8º Ano Ano letivo 2014/2015 (Para)Textos 8

ROTEIRO DE RECUPERAÇÃO 2017

Ensino Técnico Integrado ao Médio

Plano de Trabalho Docente 2011

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA Inglês LE I (2 anos) 2016

SUMÁRIO. Língua Portuguesa

AGRUPAMENTO DE ESCOLAS SEBASTIÃO DA GAMA

3º Ciclo do Ensino Baśico (Despacho normativo n.º1-a/2017, de 10 fevereiro)

Processamento de Linguagem Natural

Quando dividimos uma oração em partes para estudar as diferentes funções que as palavras podem desempenhar na oração e entre as orações de um texto, e

PLANIFICAÇÃO ANUAL Português 8ºano Ano Letivo 2016/2017

Informação Prova de Equivalência à Frequência de Inglês. Prova Escrita + Oral

MINISTÉRIO DA EDUCAÇÃO SECRETARIA DE EDUCAÇÃO PROFISSIONAL E TECNOLÓGICA INSTITUTO FEDERAL DO NORTE DE MINAS GERAIS - CAMPUS ARINOS PLANO DE ENSINO

Projeto COMET avanços e carências

Informação Prova de Equivalência à Frequência. (Inglês)

AMBIENTE DIDÁTICO GRÁFICO PARA A COMPREENSÃO DE LÓGICA DE PROGRAMAÇÃO. Rodrigo Ferreira da Silva

PLANO DE ESTUDOS DE PORTUGUÊS 8.º ANO

Dados pessoais. Nome. Apelido. Morada. Estado Civil

Autorizado pela Portaria nº de 04/07/01 DOU de 09/07/01

Construções finais recorrentes em textos de Pediatria e de Econometria

Oral e Escrita de Equivalência à Frequência de Inglês 2018

UNIVERSIDADE FEDERAL DE SANTA CATARINA Pró-Reitoria de Ensino de Graduação Departamento de Administração Escolar

Informação - Prova de Equivalência à Frequência Inglês (Língua Estrangeira I) Código 21

As capacidades lingüísticas da alfabetização

Capítulo1. Capítulo2. Índice A LÍNGUA E A LINGUAGEM O PORTUGUÊS: uma língua, muitas variedades... 15

GENEROS TEXTUAIS E O LIVRO DIDÁTICO: DESAFIOS DO TRABALHO

Informação - Prova de Equivalência à Frequência

4 Metodologia. 4.1 Metodologia naturalista: produção da fala espontânea

Trabalho individual ou de grupo; Diálogo com os alunos; Completamento de tabelas e de espaços com informações recolhidas em textos lidos ou ouvidos;

Letras Língua Portuguesa

Transcrição:

I Seminário de Estudos do Léxico 15 e 16 de outubro de 2009 2009 Departamento de Letras Universidade Federal de São Carlos São Carlos/SP, Brasil Programação e Resumos Organização: Editoração: Ariani Di Felippo Profa. Dra. Lucia Maria de Assunção Barbosa Profa. Dra. Ariani Di Felippo Departamento de Letras Rod. Washington Luís, Km 235 Caixa Postal 676 Fone: (016) 3351-8358 CEP: 13565-905 São Carlos SP Brasil

SELEX 2009 2

Programação do SELEX 09 Quinta (15 set) (Sala de Projeção do DL) 08:30 09:00 SESSÃO 1 - Mesa-redonda Léxico e Cultura Profa. Dra. Lucia Maria de Assunção Barbosa (coord.) 09:00 09:15 Marcela Teodósio (Grad. Letras/UFSCar) 09:15 10:15 SESSÃO 2 Mesa-redonda Lexico e Multiculturalismo Profa. Dra. Maria Sílvia Cintra Martins (coord.) Amanda Cristina Parise (Grad. Letras/UFSCar) Dionísio Pimenta (Grad. Letras/UFSCar) Gabriela Natalia da Silva (Grad. Letras/UFSCar) Maíra Fernandes Laurentino (Grad. Letras/UFSCar) Paula Ferraz Pacheco (Grad. Letras/UFSCar) 10:15 10:30 Intervalo 10:30 11:00 SESSÃO 3 - Mesa-redonda Léxico e Aprendizado de Língua e Designação Profa. Dra. Sandra R. Buttros Gattolin de Paula Profa. Dra. Soeli M. Schreiber da Silva 11:00 11:15 Déborah Nathalia Silva de Jesus (Grad. Letras/UFSCar) 11:15 11:30 SESSÃO 4 Mesa-redonda Léxico e Gramática Prof. Dr. Oto Araújo Vale (coord.) 11:30 11:45 Renata Maria Odorissio (PPGL/UFSCar) 11:45 12:00 Claudia Dias de Barros (PPGL/UFSCar) 12:00 12:15 Roana Rodrigues (Grad. Letras/ UFSCar) 19h00min. Palestra de Abertura: Procurando palavras e termos: a odisseia dos dicionários bilíngues - John Robert Schmitz (Unicamp) Local: Anfiteatro Bento Prado Jr. Sexta (16 set) (Sala de Projeção do DL) SESSÃO 5 Mesa-redonda Processamento Automático das 08:30 09:00 Línguas Naturais e Léxico Profa. Dra. Ariani Di Felippo (coord.) 09:00 09:15 Jackson W. da Cruz Souza (Grad. Linguística/UFSCar) 09:15 09:30 Ana Catarina Gianotti (Grad. Linguística/UFSCar) 09:30 09:45 Arthur Pompilio (Grad. Letras/UFSCar) 09:45 10:00 Ana Paula Silva (Grad. Linguística/UFSCar) 10:00 10:20 Intervalo 10:20 10:50 SESSÃO 6 Mesa-redonda Léxico Especializado Profa. Dra. Gladis M. de Barcellos Almeida (coord.) 10:50 11:10 Joel Sossai Coleti (Grad. Letras/UFSCar) 11:10 11:30 Daniela Ferreira de Mattos (Grad. Letras/UFSCar) 11:30 11:50 Fernando Alves (Grad. Letras/UFSCar) SELEX 2009 3

Quinta, 15 de outubro (Sala de Projeção do DL) SESSÃO 1 Mesa-redonda Léxico e Cultura 08h30min 09h00min: Ensino e aprendizagem de línguas e o conceito de lexicultura Profa. Dra. Lucia Maria de Assunção Barbosa (DL-UFSCar) (coordenadora) O conceito de lexicultura, criado por Robert Galisson, em 1987, privilegia a consubstancialidade do léxico e da cultura e estabelece o valor que certas palavras e expressões adquirem pelo uso que se faz delas. Segundo o autor (1995) tal valor quase nunca é assegurado pelos dicionários. Assim, o objeto de estudo da lexicultura é a cultura depositada em e sob algumas palavras. O procedimento para a sua identificação consiste em atualizar os lugares culturais nos quais essas ocorrências estão presentes. Entre outros aspectos, a lexicultura mostra-nos a singularidade e a diversidade dos contextos em que a cultura pode ser encontrada em uma língua, pois o léxico é o nível de descrição linguística mais diretamente ligado à realidade extralingüística. Trata-se, portanto, do estudo da cultura em qualquer discurso cujo objetivo não seja a análise da cultura por si mesma. Ao invés de isolar a cultura do seu meio natural, o autor propõe sua preservação no interior da sua própria dinâmica. Em um processo de abertura e de complementaridade, o ponto de partida será o discurso do cotidiano e, por conseguinte, trata-se de uma proposta de abordagem discursiva que integra, associa e não separa os componentes da comunicação. Dada a sua vocação voltada mais para a prática e menos para a teoria, a lexicultura apresenta-se como um conceito instrumental. Ao possuir, na sua concepção, a cultura no e pelo léxico, ela faz de seu objeto de estudo um instrumento dirigido para a ação e para a intervenção, colocando a carga cultural ao alcance do aprendente de línguas estrangeiras. A partir da análise de um corpus formado por textos publicitários e de jornais e revistas, pretende-se, nesta comunicação, mostrar como o aprendente pode, não apenas visualizar, mas compreender alguns códigos culturais implícitos presentes no cotidiano em que são veiculados esses dois gêneros discursivos. 09h00min 09h15min: O rap e suas (re) significações Marcela Dias Teodósio (Graduação em Letras /UFSCar) O presente projeto tem como objetivo observar como alguns léxicos são (re)significados nas composições de um estilo musical conhecido como rap, pertencente ao movimento político e cultural hip-hop. O movimento hip-hop surgiu no Brasil no final da década de 80 e se mostra como um espaço de produção em que uma série de práticas de uso da linguagem são mobilizados. Ele é composto das seguintes manifestações artísticas: a dança, o grafite, os DJ.s e o rap.o rap é caracterizado por uma letra que traz à tona questões freqüentes nas grandes periferias brasileiras, entre elas, podemos citar: a violência policial, o racismo/preconceito, a periferia, os jovens, os negros, a pobreza, as relações familiares, a mulher, o homem (pai), as drogas, a violência, o desemprego e escola. Observamos, no entanto, que essas palavras possuem outros sentidos dentro das músicas rap, diferente dos sentidos cristalizados nos dicionários de língua portuguesa. Deste modo, o objetivo desta nossa comunicação é refletir sobre a maneira que os ativistas da cultura hip-hop se apropriam e produzem diferentes sentidos no uso social da língua portuguesa. SELEX 2009 4

SESSÃO 2 Mesa-redonda Léxico e Multiculturalismo 09h15min 10h15min: Discussões sobre Léxico e Cultura Profa. Dra. Maria Sílvia Cintra Martins (DL-UFSCar) (coordenadora), Amanda Cristina Parise (Graduação em Letras/UFSCar), Dionísio Pimenta (Graduação em Letras/UFSCar), Gabriela Natalia da Silva (Graduação em Letras/UFSCar), Maíra Fernandes Laurentino (Graduação em Letras/UFSCar), Paula Ferraz Pacheco (Graduação em Letras/UFSCar) Apresentamos, por um lado, resultados de coleta de dados efetuada no decorrer de pesquisa de caráter participativo, que foi desenvolvida no primeiro semestre letivo de 2009 junto a jovens do Ensino Fundamental. Os dados foram coletados em parte através de visitas realizadas a escola estadual do bairro Monte Carlo, na periferia do município de São Carlos, em parte durante a visita dos mesmos jovens ao campus de nossa universidade. Para a tabulação e análise dos dados, baseamo-nos em enfoque transcategorial, que prevê a inter-relação dos eixos semântico, sintático e pragmático no trabalho com a linguagem. Ao ponderar sobre o eixo pragmático, trazemos para a pauta questões que dizem respeito ao contexto sócioeconômico-cultural, de tal forma que fatores advindos das lutas de poder e por poder, próprias de territórios de etnicidade, são considerados do ponto de vista das pressões que exercem sobre as escolhas sintático-semânticas mais pontuais. Apresentamos, ainda, dados que decorrem de pesquisa sobre Literatura Africana e sobre a utilização de determinados itens lexicais em contextos e formações discursivas específicas, de tal forma a proporcionar maior abrangência à temática do multiculturalismo. 10h15min 10h30min: INTERVALO SESSÃO 3 Mesa-redonda Léxico e Aprendizado de Língua e Designação 10h30min 10h45min: Considerações sobre o papel das escolhas lexicais em um texto opnativo Profa. Dra. Sandra R. Buttros Gattolin de Paula (DL-UFSCar) Uma reflexão sobre diferentes formas de se instituir a pena de morte torna-se possível por meio da análise do léxico selecionado para a produção do texto < Neutralizing the bad guys>. A partir de uma concepção de leitura como prática social e da compreensão de que cabe também ao professor de língua estrangeira permitir aos alunos usar os conhecimentos adquiridos por meio da prática de reflexão sobre a língua para expandirem as possibilidades de uso da linguagem e a capacidade de análise crítica (Brasil, 1997, p. 33), salienta-se o papel da repetição e da coesão lexical como mecanismos de argumentação em nível discursivo. Propõese, especificamente, uma discussão sobre o papel do léxico na construção de sentidos em língua estrangeira e o papel do professor nesse processo. 10h45min 11h00min: O político na designação de ficar Profa. Dra. Soeli M. S. da Silva (DL-UFSCar) Neste texto pretendo mostrar como tratamos do sentido de ficar a partir de uma posição não referencialista, conforme Guimarães (2002). Fazemos isto quando consideramos que a relação fundamental de sentido é uma relação de determinação. Interessa a relação que está fora da linguagem construída em virtude da relação de uma palavra com outra palavra. Consideremos que nenhum elemento determina o outro. Essa relação é construída enunciativamente. O fato de duas expressões serem sinônimas é parte da determinação das palavras envolvidas. A designação de ficar mostra como se dá a significação enquanto algo próprio das relações de linguagem, enquanto uma relação simbólica. Pode-se ver o político na divisão ficar/namorar. SELEX 2009 5

11h00min 11h15min: A construção de listas de palavras para materiais de ensino de inglês como LE: uma proposta para enfatizar o papel do léxico Déborah Nathalia Silva de Jesus (Graduação em Letras/UFSCar) O inglês foi escolhido como idioma oficial da aeronáutica para facilitar a comunicação e garantir a segurança dos vôos e dos equipamentos. Contudo, faltam aos profissionais da área cursos especializados e materiais didáticos que trabalhem bem o vocabulário técnico. Apenas nos últimos vinte anos a questão do vocabulário no ensino foi posta em evidência, após Meara (1980) iniciar um movimento a favor de uma maior atenção ao léxico nas aulas de língua estrangeira. Estudos mais recentes sugerem ainda uma abordagem explícita do vocabulário em sala de aula. Alguns pesquisadores brasileiros, como Scaramucci (1995) e Gattolin (1998), têm investigado o papel do vocabulário no processo de ensino-aprendizagem de Língua Estrangeira e dado sugestões relevantes para a prática em sala. Santos (2000) sugere a construção de listas de palavras de uso freqüente e consideradas úteis como apoio à produção de material didático. Nesse sentido, propomos a construção de uma lista, que poderá servir de base para um material didático, com palavras da área aeronáutica, considerando a sua importância para São Carlos e região e a necessidade de se contribuir para a formação de seus profissionais. A apresentação começa com a justificativa, pressupostos teóricos e segue com explicações sobre a construção da lista. SESSÃO 4 Mesa-redonda Léxico e Gramática 11h15min 11h30min: Léxico e Sintaxe: uma classificação sistemática da estrutura argumental dos verbos do português do Brasil Prof. Dr. Oto Araújo Vale (DL-UFSCar) (coordenador) Nesta comunicação será tratado o estabelecimento de uma classificação sistemática da estrutura argumental dos verbos do português do Brasil. Essa classificação é efetuada de acordo com a metodologia da teoria do Léxico-Gramática em tabelas binárias nas quais as linhas são as entradas e as colunas as propriedades sintáticosemânticas de cada entrada. O projeto leva em conta o fato de já existir para o português do Brasil um bom número de descrições de diversos pontos de vista teóricos sobre a estrutura argumental, tanto dos verbos quanto de outros elementos predicativos. O que se pretende é sistematizar em classes relativamente homogêneas esse conhecimento já desenvolvido para que essa classificação possa ser utilizada tanto na produção de novos trabalhos quanto no processamento de linguagem natural. 11h30min 11h45min: Elaboração de um glossário bilíngue com base no modelo de classe de objetos Renata Maria Odorissio (PPGL/UFSCar) Esta pesquisa tem como objetivo a análise de predicados extraídos dos corpora de francês e de português da culinária para que sejam estabelecidas definições a partir de parâmetros lingüísticos. O modelo de Gaston Gross leva em conta a relação de dependência sintática e semântica entre os elementos da frase, pela qual se dá a formação do sentido do termo. A distribuição dos elementos da sentença, as formas de ocorrência dos predicados e as restrições de seleção semântica diferem de língua para língua, o que enriquece o campo de investigação. São as restrições de ocorrência dos predicados nos servem de parâmetro para a formulação das equivalências, pensando-as num nível mais aproximado. A título de exemplo temos: griller e grelhar como uma equivalência muito próxima ou total; faire revenir e refogar, como parcial e équeuter que não tem nenhum equivalente, mas faz-se uso de predicados inteiros para de traduzir, como retirar o cabo/as folhas. O corpus de francês foi compilado de websites especializados e é formado por mais de 190.000 ocorrências. O corpus de português foi cedido pelos pesquisadores responsáveis pelo projeto COMET, da USP, disponível para consulta na web. Os verbos selecionados do corpus de francês formam uma lista de 176 unidades, dentre elas os gramaticais e os lexicais, os que comporão nosso glossário automático. SELEX 2009 6

11h45min 12h00min: Antonímia nos adjetivos descritivos do português do Brasil: uma proposta de análise Cláudia Dias de Barros (PPGL/UFSCar) A relação semântica mais importante para os adjetivos é a antonímia, ou seja, a oposição dos sentidos (bom/mau). A WordNet, uma base de dados lexicais para o inglês, que estabelece relações semânticas (como sinonímia, hiperonímia, etc.) entre as palavras, apresenta também o conceito de antonímia indireta (via sinonímia: ótimo=bom/mau) para os adjetivos. A representação desse tipo de antonímia ainda é inexistente no projeto WordNet.Br (WN.Br) para o português do Brasil e em sua interface, o Thesaurus Eletrônico para o Português do Brasil (TeP). Portanto, este trabalho tem como objetivo estudar a antonímia nos adjetivos do Português do Brasil (PB), com vistas a uma contribuição para o refinamento da WN.Br. O estudo é feito tendo como base as ocorrências dos cem (100) adjetivos mais frequentes no corpus Mac-Morpho, do projeto LacioWeb, que contém artigos jornalísticos de 10 cadernos da Folha de São Paulo de 1994. Os adjetivos foram extraídos pelo concordanciador Unitex. Visase estabelecer uma rede semântica que possa relacionar a antonímia direta entre adjetivos e a antonímia indireta existente entre os sinônimos de cada adjetivo e seus antônimos, buscando implementá-las no TeP, refinando aí a representação da antonímia. 12h00min 12h15min: Falsos diminutivos no português do Brasil: estudo preliminar Roana Rodrigues (Graduação em Letras/ UFSCar) O fenômeno dos falsos aumentativos e falsos diminutivos no português do Brasil, embora bastante conhecido, nunca foi minuciosamente estudado e, tampouco, descrito para aplicações em PLN (Processamento de Linguagem Natural). Neste trabalho procuraremos estabelecer uma tipologia inicial dos falsos diminutivos nos substantivos, mostrando a extensão desse fenômeno PALESTRA DE ABERTURA DO I SELEX (Anfiteatro Bento Prado Jr.) 19h00min: Procurando palavras e termos: a odisseia dos dicionários bilíngues John Robert Schmitz (Unicamp) Com respeito aos dicionários bilíngües (doravante, DBs), o meu objetivo nesta apresentação é teórico-prático, com maior ênfase na prática. Pretendo comentar como os DBs contribuíram, no meu caso, para a aprendizagem de espanhol, a minha primeira língua estrangeira. Um dicionário de espanhol-inglês e inglês-espanhol, recebido como presente, foi muito útil para adquirir vocábulos novos na língua alvo e satisfazer a curiosidade de saber como se diria, por exemplo, peach, plum e grapefruit em espanhol. Os DBs dos outros idiomas que estudei ao longo dos anos também me ajudaram a ler textos nas diferentes línguas. Acredito que fui um aprendiz disciplinado e dedicado com boa dose paciência necessária para consultar as duas direções dos dicionários. Graças aos DB, cheguei a gostar de todas as obras lexicográficas tais como os dicionários de aprendizes e os dicionários gerais (de padrão) monolíngües. No decorrer deste trabalho, farei uma classificação provisória dos DBs, lembrando, dentro do possível, o que as referidas obras realmente me ensinaram ou não. Levando o meu interesse e a minha paixão pelos dicionários em geral para esta primeira década do século XXI e com base nas inovações e nas mudanças nos DBs nos últimos 20 anos, gostaria de refletir com os especialistas presentes a respeito dos critérios para a dicionarização de verbetes nas obras bilíngues. Quais vocábulos devem ser registrados num DB pequeno, médio e grande? Recorrendo ao Power Point, faço uso de fotografias tiradas (por mim) de situações do dia-adia (por exemplo, como cartazes, anúncios e cardápios) para pensar, junto com os participantes, quais palavras deveriam constar de novos projetos de DB. Por fim, quero também comentar, por um lado, algumas das mudanças significativas na elaboração do DBs e por outro, as falhas que ainda permanecem. SELEX 2009 7

Sexta, 16 de setembro (Sala de Projeção do DL) SESSÃO 5 Mesa-redonda Processamento Automático das Línguas Naturais e Léxico 08h30min 09h00min: O léxico sob o olhar do Processamento Automático das Línguas Naturais e o projeto Terminet Profa. Dra. Ariani Di Felippo (DL-UFSCar) (coordenadora) No Processamento Automático das Línguas Naturais (PLN), busca-se desenvolver sistemas computacionais que processam (interpretam e/ou geram) línguas naturais, como os sistemas de tradução automática. Para o desenvolvimento de vários sistemas de PLN, são necessários certos recursos linguísticos (os lingwares), os quais desempenham papel central na arquitetura desse tipo de sistema. Dentre eles, destaca-se o léxico. O primeiro objetivo desta sessão é o de apresentar a concepção e os vários tipos de léxico do PLN. Dada a necessidade crescente de se processar textos especializados, léxicos especializados (ou terminológicos) passaram a ser desenvolvidos para várias línguas, principalmente no formato wordnet. O segundo objeto desta sessão é, então, o de apresentar o formato wordnet e destacar sua relevância linguística e computacional. Embora exista um número razoável de wordnets terminológicas em diversas línguas, observa-se a carência de uma metodologia suficientemente clara que facilite e, sobretudo, estimule a criação dessas bases. Para o português do Brasil (PB), aliás, não há léxicos especializados no formato wordnet. Diante desse cenário, iniciou-se, em setembro de 2009, o projeto Terminet, que engloba pesquisadores do NILC (Núcleo Interinstitucional de Linguística Computacional/USP) e do GETerm (Grupo de Estudos e Pesquisas em Teminologia/UFSCar) e que objetiva: (i) a instanciação de uma metodologia genérica de pesquisa no PLN para o desenvolvimento de wordnets terminológicas e (ii) a sua aplicação na construção de uma base desse tipo em PB. O terceiro e último objetivo desta sessão é o de apresentar o projeto Terminet e seus subprojetos, que são: Construção do corpus para o desenvolvimento de uma wordnet terminológica em português do Brasil ; Subsídios linguísticos para a extração semi-automática de candidatos a termo e da relação de sinonímia ; Subsídios linguísticos para a extração semi-automática da relação semânticoconceitual da hiperonímia/hiponímia e Investigação de ferramentas computacionais de extração de candidatos a termo e de relações semântico-conceituais. 09h00min 09h15min: Construção do corpus para o desenvolvimento de uma wordnet terminológica em português do Brasil Jackson Wilke da Cruz Souza (Graduação em Linguística/UFSCar/Bolsista PIBIC) Para a construção de uma base de dados no formato wordnet, é necessário um conjunto de dados léxico-conceituais, saber: (i) as unidades lexicais de uma língua ou de uma linguagem de especialidade, (ii) os conjuntos de formas sinônimas ou quase-sinônimas (synonym sets ou synsets), (iii) as relações de antonímia, hiperonímia/hiponímia, holonímia/meronímia, acarretamento e causa que se estabelecem entre os synsets, (iv) as glosas (definições informações dos conceitos subjacentes aos synsets) e (v) as frases-exemplo, que ilustram os contextos de uso das unidades lexicais. Tais dados são comumente extraídos de uma fonte nãoestruturada, ou seja, de um corpus ( uma coleção de textos em formato eletrônico ). A construção de um corpus requer a projeção do mesmo, ou seja, a determinação de sua tipologia, a qual deve ser feita em função da pesquisa linguístico-computacional para qual está sendo feito. Assim, o objetivo deste trabalho é o de projetar (e construir) o corpus para o desenvolvimento de wordnets terminológicas em português do Brasil. SELEX 2009 8

09h15min 09h30min: Subsídios linguísticos para a extração semi-automática de candidatos a termo e da relação de sinonímia Ana Catarina Gianoti (Graduação em Linguística/UFSCar) A construção de uma wordnet terminológica (ou terminet), ou seja, de uma base de dados no formato wordnet que sistematize o léxico de uma linguagem de especialidade x (p.ex.: medicina), requer um conjunto de unidades terminológicas (ou termos) do domínio x organizadas em função da sinonímia. Os candidatos a termo (isto é, possíveis termos que serão validados pelo especialista do domínio x) são comumente extraídos de forma semi-automática a partir de um corpus do domínio x morfossintaticamente anotado, ou seja, cujas palavras foram etiquetadas com rótulos que indicam a sua categoria sintática (p.ex.: bisturi_n(ome)). A extração dos candidatos a termo que comporão a base de dados é feita principalmente por meio de uma abordagem híbrida. Essa abordagem caracteriza-se pela aplicação de filtros linguísticos e medidas estatísticas (p.ex.: frequência) a um corpus etiquetado. Tais filtros podem ser padrões morfossintáticos (p.ex.: [n-adj], [n-prep-n], etc.) e padrões léxico-sintáticos (p.ex.: é um tipo de, etc.). Para a extração semi-automática dos candidatos a sinônimo, utiliza-se a abordagem linguística, que se caracteriza pela busca de padrões léxico-sintáticos no corpus (p.ex.: é similar a, etc.). Tendo em vista que os filtros linguísticos são dependentes de domínio, objetiva-se, neste projeto, investigar na literatura e no corpus do domínio a ser sistematizado pela terminet quais são os filtros linguísticos mais eficazes para a extração de candidatos a termo e de candidatos a sinônimo em português do Brasil (PB). 09h30min 09h45min: Subsídios linguísticos para a extração semi-automática de relações semântico-conceituais Arthur Pompílio (Graduação em Letras/ UFSCar) Na WordNet de Princeton (WN.Pr) a mãe de todas as wordnets, as unidades lexicais (de língua geral) do inglês norte-americano estão divididas em quatro categorias sintáticas: nome, verbo, adjetivo e advérbio. As unidades de cada categoria estão codificadas em synsets (synonym sets), ou seja, em conjuntos de formas sinônimas ou quase-sinônimas que codificam um único conceito. Os synsets, aliás, podem estar relacionados pelas relações de antonímia, hiperonímia/hiponímia, holonímia/meronímia, acarretamento e causa. Em uma wordnet terminológica (ou terminet), apenas as unidades lexicais da categoria sintática dos nomes são armazenadas na base, dada a relevância de tais unidades nas linguagens de especialidade. Os conceitos subjacentes aos synsets constituídos por unidades nominais organizam-se primordialmente por meio das relações de hiperonímia/hiponímia e holonímia/meronímia. Tais relações são comumente extraídas de forma automática a partir de um corpus morfossintaticamente anotado, ou seja, cujas palavras foram etiquetadas com rótulos que indicam a sua categoria sintática (p.ex.: bisturi_n(ome)). A extração automática dessas relações é feita principalmente por meio da abordagem linguística, que se caracteriza pela busca de padrões léxico-sintáticos (p.ex.: é um tipo de, é feito de, tem como partes, etc.) no corpus do domínio que se quer sistematizar por meio de uma terminet. Tendo em vista que tais padrões são dependentes de domínio, objetiva-se, neste projeto, investigar na literatura e no corpus do domínio a ser sistematizado por uma terminet quais são os padrões léxico-sintáticos mais eficazes para a extração das relações de hiperonímia/hiponímia e holonímia/meronímia em corpora do português do Brasil (PB) e aplicá-los na construção de uma wordnet terminológica em PB. 09h45min 10h00min: Investigação de ferramentas computacionais de extração de candidatos a termo e de relações semântico-conceituais Ana Paula Silva (Graduação em Linguística/ UFSCar) Em uma wordnet terminológica (ou terminet), apenas as unidades lexicais da categoria sintática dos nomes são armazenadas na base, dada a relevância de tais unidades nas linguagens de especialidade. Os conceitos subjacentes aos synsets constituídos por unidades nominais organizam-se primordialmente por meio das relações de hiperonímia/hiponímia e holonímia/meronímia. Tais relações são comumente extraídas de forma automática a partir de um corpus morfossintaticamente anotado, ou seja, cujas palavras foram etiquetadas com SELEX 2009 9

rótulos que indicam a sua categoria sintática (p.ex.: bisturi_n(ome)). A extração automática dessas relações é feita principalmente por meio da abordagem linguística, que, no caso, caracteriza-se pela aplicação de padrões léxico-sintáticos (p. ex.: é um tipo de, é feito de, tem como partes, etc.) ao corpus anotado. Além da extração automática baseada na abordagem linguística, tais relações podem ser extraídas por meio de ferramentas computacionais. Neste projeto, investigar-se-á a possibilidade de utilização de algumas ferramentas disponíveis, como o plug-in OntoLP (Ribeiro Jr, 2008), que implementa o método linguístico proposto por Hearst (1992, 1998) em combinação com algumas medidas estatísticas, o BootCaT (ou seja, um extrator automático de corpus e de termos a partir de material disponível na Web) (do inglês, Bootstrapping Corpora and Terms) (Baroni, Bernardini, 2004) e o Corpógrafo (ou seja, um ambiente Web que possibilita a compilação e investigação de corpora especializados) (MAIA et al., 2005). 10h00min 10h20min: INTERVALO SESSÃO 6 Mesa-redonda Léxico Especializado 10h20min 10h50min: Pesquisas sobre o Léxico Especializado: atividades do GETerm Gladis Maria de Barcellos Almeida (DL-UFSCar) (coordenadora) Será apresentado aos participantes o Grupo de Estudos e Pesquisas em Terminologia (GETerm), formado no Departamento de Letras da UFSCar em 1999 e que integra o Diretório dos Grupos de Pesquisa do CNPq. O GETerm tem como objetivos: 1) estudar conteúdos pertinentes à Terminologia e Terminologia Computacional; 2) desenvolver pesquisas que gerem produtos terminológicos em língua portuguesa, tais como: glossários, dicionários, enciclopédias e assemelhados, que satisfaçam demandas reais. O Grupo conta hoje com uma equipe multidisciplinar, envolvendo linguistas, informatas e especialistas de domínio. No momento, vários projetos estão em andamento no GETerm, basta acessar o site www.geterm.ufscar.br e obter maiores informações. É importante lembrar que, desde 2002, o GETerm tem recebido valiosas colaborações de pesquisadores do Núcleo Interinstitucional de Linguística Computacional (NILC), sediado no Instituto de Ciências Matemáticas e da Computação (ICMC) da USP/São Carlos. Nossa meta é aliar a Terminologia à Informática de forma a gerar produtos terminológicos mais confiáveis e em menor tempo, sem desvincularmonos da teoria terminológica descritiva de base linguística que tem sustentado nossas pesquisas. 10h50min 11h10min: A terminologia da Nanociência e Nanotecnologia: descrição e análise morfológica Joel Sossai Coleti (Graduação em Letras/ UFSCar) Esta pesquisa integra o projeto Terminologia em Língua Portuguesa da Nanociência e Nanotecnologia: Sistematização do Repertório Vocabular e Elaboração de Dicionário-Piloto (apoio CNPq, processo 400506/2006-8) desenvolvido, pelo Grupo de Estudos e Pesquisas em Terminologia (GETerm/UFSCar), em parceria com o Núcleo Interinstitucional de Lingüística Computacional (NILC/USP, São Carlos), e se insere nos domínios da Lingüística, nomeadamente na Descrição do Português, nível Morfológico (de perspectiva estruturalista). Aspectos terminológicos (com ênfase para a Teoria Comunicativa da Terminologia) também são tratados, dado que o objeto desta investigação são termos que integram um vocabulário especializado. Compreendendo as unidades da terminologia como unidades do léxico associadas a um valor especializado ativado pelas condições discursivas e pragmáticas (tradução nossa, CABRÉ, 2006), descrevem-se e analisam-se os aspectos morfológicos do conjunto de termos mais freqüentes da terminologia da Nanociência e Nanotecnologia, de forma a se observar: 1) em que medida os morfemas (lexicais) contêm informações semânticas, a ponto de serem eficazes na criação de novas palavras para denominar um novo conhecimento; 2) até que ponto os fenômenos morfológicos próprios de uma linguagem de especialidade assemelham-se àqueles encontrados na língua geral. Espera-se, assim, cooperar SELEX 2009 10

com a fixação e maior compreensão da terminologia da Nanociência e Nanotecnologia, áreas centrais das atividades de pesquisa, desenvolvimento e inovação no mundo todo. 11h10min 11h30min: A redação da definição terminológica: subsídios para o desenvolvimento do Dicionário-Piloto de Nanociência e Nanotecnologia Daniela Ferreira de Mattos (Licenciatura em Letras/DL) Esta pesquisa integra outro projeto maior denominado Terminologia em Língua Portuguesa da Nanociência e Nanotecnologia: Sistematização do Repertório Vocabular e Elaboração de Dicionário-Piloto (apoio CNPq, processo 400506/2006-8) desenvolvido, pelo Grupo de Estudos e Pesquisas em Terminologia (GETerm/UFSCar), em parceria com o Núcleo Interinstitucional de Lingüística Computacional (NILC/USP, São Carlos). O objetivo deste projeto de Iniciação Científica é criar subsídios para a confecção desse dicionário-piloto em língua portuguesa da área de Nanociência e Nanotecnologia (N&N). Para auxiliar a construção de tal dicionário, esse projeto teve como objetivos: elaborar um conjunto de 200 definições e editar os verbetes no formato para a publicação (que pode ser em papel ou Web). Essa pesquisa foi feita com o apoio de outro subprojeto de iniciação científica (FAPESP), denominado A definição terminológica no Dicionário-Piloto da Nanociência e Nanotecnologia, de autoria do aluno Joel Sossai Coleti, também sob a orientação de Gladis Maria de Barcellos Almeida. (Bolsista CNPq) 11h30min 11h50min: Elaboração de corpus e extração semi-automática de termos para o desenvolvimento da terminologia em português dos Biocombustíveis/Biodiesel Fernando Alves (Graduação em Letras/UFSCar/Bolsista FAPESP) Fundamentada em princípios da Lingüística de Corpus e da Terminologia de orientação descritiva e de base lingüística, esta pesquisa tem como principais objetivos a elaboração do corpus em língua portuguesa, variante brasileira, e a subseqüente extração semi-automática de termos para o desenvolvimento, a posteriori, da terminologia em Língua Portuguesa do Biodiesel, um tipo de Biocombustível. A sistematização desse vocabulário promoverá uma comunicação mais eficiente entre usuários e pesquisadores, bem como garantirá o intercâmbio de informações científicas e tecnológicas livre de ruídos. Uma das razões para o empreendimento deste trabalho é o fato de o domínio dos Biocombustíveis/Biodiesel ainda não ter seu repertório terminológico sistematizado, o que significa uma grande lacuna, primeiro porque Energia é um setor estratégico em qualquer país e, segundo, porque o Brasil é detentor do título de país mais competitivo do mundo para a geração de energia a partir da biomassa (ROSCOE, 2006), ou energias renováveis, caso do biodiesel. Aspectos que comprovam a relevância desta pesquisa que ora se apresenta. SELEX 2009 11