I Seminário de Estudos do Léxico 15 e 16 de outubro de 2009 2009 Departamento de Letras Universidade Federal de São Carlos São Carlos/SP, Brasil Programação e Resumos Organização: Editoração: Ariani Di Felippo Profa. Dra. Lucia Maria de Assunção Barbosa Profa. Dra. Ariani Di Felippo Departamento de Letras Rod. Washington Luís, Km 235 Caixa Postal 676 Fone: (016) 3351-8358 CEP: 13565-905 São Carlos SP Brasil
SELEX 2009 2
Programação do SELEX 09 Quinta (15 set) (Sala de Projeção do DL) 08:30 09:00 SESSÃO 1 - Mesa-redonda Léxico e Cultura Profa. Dra. Lucia Maria de Assunção Barbosa (coord.) 09:00 09:15 Marcela Teodósio (Grad. Letras/UFSCar) 09:15 10:15 SESSÃO 2 Mesa-redonda Lexico e Multiculturalismo Profa. Dra. Maria Sílvia Cintra Martins (coord.) Amanda Cristina Parise (Grad. Letras/UFSCar) Dionísio Pimenta (Grad. Letras/UFSCar) Gabriela Natalia da Silva (Grad. Letras/UFSCar) Maíra Fernandes Laurentino (Grad. Letras/UFSCar) Paula Ferraz Pacheco (Grad. Letras/UFSCar) 10:15 10:30 Intervalo 10:30 11:00 SESSÃO 3 - Mesa-redonda Léxico e Aprendizado de Língua e Designação Profa. Dra. Sandra R. Buttros Gattolin de Paula Profa. Dra. Soeli M. Schreiber da Silva 11:00 11:15 Déborah Nathalia Silva de Jesus (Grad. Letras/UFSCar) 11:15 11:30 SESSÃO 4 Mesa-redonda Léxico e Gramática Prof. Dr. Oto Araújo Vale (coord.) 11:30 11:45 Renata Maria Odorissio (PPGL/UFSCar) 11:45 12:00 Claudia Dias de Barros (PPGL/UFSCar) 12:00 12:15 Roana Rodrigues (Grad. Letras/ UFSCar) 19h00min. Palestra de Abertura: Procurando palavras e termos: a odisseia dos dicionários bilíngues - John Robert Schmitz (Unicamp) Local: Anfiteatro Bento Prado Jr. Sexta (16 set) (Sala de Projeção do DL) SESSÃO 5 Mesa-redonda Processamento Automático das 08:30 09:00 Línguas Naturais e Léxico Profa. Dra. Ariani Di Felippo (coord.) 09:00 09:15 Jackson W. da Cruz Souza (Grad. Linguística/UFSCar) 09:15 09:30 Ana Catarina Gianotti (Grad. Linguística/UFSCar) 09:30 09:45 Arthur Pompilio (Grad. Letras/UFSCar) 09:45 10:00 Ana Paula Silva (Grad. Linguística/UFSCar) 10:00 10:20 Intervalo 10:20 10:50 SESSÃO 6 Mesa-redonda Léxico Especializado Profa. Dra. Gladis M. de Barcellos Almeida (coord.) 10:50 11:10 Joel Sossai Coleti (Grad. Letras/UFSCar) 11:10 11:30 Daniela Ferreira de Mattos (Grad. Letras/UFSCar) 11:30 11:50 Fernando Alves (Grad. Letras/UFSCar) SELEX 2009 3
Quinta, 15 de outubro (Sala de Projeção do DL) SESSÃO 1 Mesa-redonda Léxico e Cultura 08h30min 09h00min: Ensino e aprendizagem de línguas e o conceito de lexicultura Profa. Dra. Lucia Maria de Assunção Barbosa (DL-UFSCar) (coordenadora) O conceito de lexicultura, criado por Robert Galisson, em 1987, privilegia a consubstancialidade do léxico e da cultura e estabelece o valor que certas palavras e expressões adquirem pelo uso que se faz delas. Segundo o autor (1995) tal valor quase nunca é assegurado pelos dicionários. Assim, o objeto de estudo da lexicultura é a cultura depositada em e sob algumas palavras. O procedimento para a sua identificação consiste em atualizar os lugares culturais nos quais essas ocorrências estão presentes. Entre outros aspectos, a lexicultura mostra-nos a singularidade e a diversidade dos contextos em que a cultura pode ser encontrada em uma língua, pois o léxico é o nível de descrição linguística mais diretamente ligado à realidade extralingüística. Trata-se, portanto, do estudo da cultura em qualquer discurso cujo objetivo não seja a análise da cultura por si mesma. Ao invés de isolar a cultura do seu meio natural, o autor propõe sua preservação no interior da sua própria dinâmica. Em um processo de abertura e de complementaridade, o ponto de partida será o discurso do cotidiano e, por conseguinte, trata-se de uma proposta de abordagem discursiva que integra, associa e não separa os componentes da comunicação. Dada a sua vocação voltada mais para a prática e menos para a teoria, a lexicultura apresenta-se como um conceito instrumental. Ao possuir, na sua concepção, a cultura no e pelo léxico, ela faz de seu objeto de estudo um instrumento dirigido para a ação e para a intervenção, colocando a carga cultural ao alcance do aprendente de línguas estrangeiras. A partir da análise de um corpus formado por textos publicitários e de jornais e revistas, pretende-se, nesta comunicação, mostrar como o aprendente pode, não apenas visualizar, mas compreender alguns códigos culturais implícitos presentes no cotidiano em que são veiculados esses dois gêneros discursivos. 09h00min 09h15min: O rap e suas (re) significações Marcela Dias Teodósio (Graduação em Letras /UFSCar) O presente projeto tem como objetivo observar como alguns léxicos são (re)significados nas composições de um estilo musical conhecido como rap, pertencente ao movimento político e cultural hip-hop. O movimento hip-hop surgiu no Brasil no final da década de 80 e se mostra como um espaço de produção em que uma série de práticas de uso da linguagem são mobilizados. Ele é composto das seguintes manifestações artísticas: a dança, o grafite, os DJ.s e o rap.o rap é caracterizado por uma letra que traz à tona questões freqüentes nas grandes periferias brasileiras, entre elas, podemos citar: a violência policial, o racismo/preconceito, a periferia, os jovens, os negros, a pobreza, as relações familiares, a mulher, o homem (pai), as drogas, a violência, o desemprego e escola. Observamos, no entanto, que essas palavras possuem outros sentidos dentro das músicas rap, diferente dos sentidos cristalizados nos dicionários de língua portuguesa. Deste modo, o objetivo desta nossa comunicação é refletir sobre a maneira que os ativistas da cultura hip-hop se apropriam e produzem diferentes sentidos no uso social da língua portuguesa. SELEX 2009 4
SESSÃO 2 Mesa-redonda Léxico e Multiculturalismo 09h15min 10h15min: Discussões sobre Léxico e Cultura Profa. Dra. Maria Sílvia Cintra Martins (DL-UFSCar) (coordenadora), Amanda Cristina Parise (Graduação em Letras/UFSCar), Dionísio Pimenta (Graduação em Letras/UFSCar), Gabriela Natalia da Silva (Graduação em Letras/UFSCar), Maíra Fernandes Laurentino (Graduação em Letras/UFSCar), Paula Ferraz Pacheco (Graduação em Letras/UFSCar) Apresentamos, por um lado, resultados de coleta de dados efetuada no decorrer de pesquisa de caráter participativo, que foi desenvolvida no primeiro semestre letivo de 2009 junto a jovens do Ensino Fundamental. Os dados foram coletados em parte através de visitas realizadas a escola estadual do bairro Monte Carlo, na periferia do município de São Carlos, em parte durante a visita dos mesmos jovens ao campus de nossa universidade. Para a tabulação e análise dos dados, baseamo-nos em enfoque transcategorial, que prevê a inter-relação dos eixos semântico, sintático e pragmático no trabalho com a linguagem. Ao ponderar sobre o eixo pragmático, trazemos para a pauta questões que dizem respeito ao contexto sócioeconômico-cultural, de tal forma que fatores advindos das lutas de poder e por poder, próprias de territórios de etnicidade, são considerados do ponto de vista das pressões que exercem sobre as escolhas sintático-semânticas mais pontuais. Apresentamos, ainda, dados que decorrem de pesquisa sobre Literatura Africana e sobre a utilização de determinados itens lexicais em contextos e formações discursivas específicas, de tal forma a proporcionar maior abrangência à temática do multiculturalismo. 10h15min 10h30min: INTERVALO SESSÃO 3 Mesa-redonda Léxico e Aprendizado de Língua e Designação 10h30min 10h45min: Considerações sobre o papel das escolhas lexicais em um texto opnativo Profa. Dra. Sandra R. Buttros Gattolin de Paula (DL-UFSCar) Uma reflexão sobre diferentes formas de se instituir a pena de morte torna-se possível por meio da análise do léxico selecionado para a produção do texto < Neutralizing the bad guys>. A partir de uma concepção de leitura como prática social e da compreensão de que cabe também ao professor de língua estrangeira permitir aos alunos usar os conhecimentos adquiridos por meio da prática de reflexão sobre a língua para expandirem as possibilidades de uso da linguagem e a capacidade de análise crítica (Brasil, 1997, p. 33), salienta-se o papel da repetição e da coesão lexical como mecanismos de argumentação em nível discursivo. Propõese, especificamente, uma discussão sobre o papel do léxico na construção de sentidos em língua estrangeira e o papel do professor nesse processo. 10h45min 11h00min: O político na designação de ficar Profa. Dra. Soeli M. S. da Silva (DL-UFSCar) Neste texto pretendo mostrar como tratamos do sentido de ficar a partir de uma posição não referencialista, conforme Guimarães (2002). Fazemos isto quando consideramos que a relação fundamental de sentido é uma relação de determinação. Interessa a relação que está fora da linguagem construída em virtude da relação de uma palavra com outra palavra. Consideremos que nenhum elemento determina o outro. Essa relação é construída enunciativamente. O fato de duas expressões serem sinônimas é parte da determinação das palavras envolvidas. A designação de ficar mostra como se dá a significação enquanto algo próprio das relações de linguagem, enquanto uma relação simbólica. Pode-se ver o político na divisão ficar/namorar. SELEX 2009 5
11h00min 11h15min: A construção de listas de palavras para materiais de ensino de inglês como LE: uma proposta para enfatizar o papel do léxico Déborah Nathalia Silva de Jesus (Graduação em Letras/UFSCar) O inglês foi escolhido como idioma oficial da aeronáutica para facilitar a comunicação e garantir a segurança dos vôos e dos equipamentos. Contudo, faltam aos profissionais da área cursos especializados e materiais didáticos que trabalhem bem o vocabulário técnico. Apenas nos últimos vinte anos a questão do vocabulário no ensino foi posta em evidência, após Meara (1980) iniciar um movimento a favor de uma maior atenção ao léxico nas aulas de língua estrangeira. Estudos mais recentes sugerem ainda uma abordagem explícita do vocabulário em sala de aula. Alguns pesquisadores brasileiros, como Scaramucci (1995) e Gattolin (1998), têm investigado o papel do vocabulário no processo de ensino-aprendizagem de Língua Estrangeira e dado sugestões relevantes para a prática em sala. Santos (2000) sugere a construção de listas de palavras de uso freqüente e consideradas úteis como apoio à produção de material didático. Nesse sentido, propomos a construção de uma lista, que poderá servir de base para um material didático, com palavras da área aeronáutica, considerando a sua importância para São Carlos e região e a necessidade de se contribuir para a formação de seus profissionais. A apresentação começa com a justificativa, pressupostos teóricos e segue com explicações sobre a construção da lista. SESSÃO 4 Mesa-redonda Léxico e Gramática 11h15min 11h30min: Léxico e Sintaxe: uma classificação sistemática da estrutura argumental dos verbos do português do Brasil Prof. Dr. Oto Araújo Vale (DL-UFSCar) (coordenador) Nesta comunicação será tratado o estabelecimento de uma classificação sistemática da estrutura argumental dos verbos do português do Brasil. Essa classificação é efetuada de acordo com a metodologia da teoria do Léxico-Gramática em tabelas binárias nas quais as linhas são as entradas e as colunas as propriedades sintáticosemânticas de cada entrada. O projeto leva em conta o fato de já existir para o português do Brasil um bom número de descrições de diversos pontos de vista teóricos sobre a estrutura argumental, tanto dos verbos quanto de outros elementos predicativos. O que se pretende é sistematizar em classes relativamente homogêneas esse conhecimento já desenvolvido para que essa classificação possa ser utilizada tanto na produção de novos trabalhos quanto no processamento de linguagem natural. 11h30min 11h45min: Elaboração de um glossário bilíngue com base no modelo de classe de objetos Renata Maria Odorissio (PPGL/UFSCar) Esta pesquisa tem como objetivo a análise de predicados extraídos dos corpora de francês e de português da culinária para que sejam estabelecidas definições a partir de parâmetros lingüísticos. O modelo de Gaston Gross leva em conta a relação de dependência sintática e semântica entre os elementos da frase, pela qual se dá a formação do sentido do termo. A distribuição dos elementos da sentença, as formas de ocorrência dos predicados e as restrições de seleção semântica diferem de língua para língua, o que enriquece o campo de investigação. São as restrições de ocorrência dos predicados nos servem de parâmetro para a formulação das equivalências, pensando-as num nível mais aproximado. A título de exemplo temos: griller e grelhar como uma equivalência muito próxima ou total; faire revenir e refogar, como parcial e équeuter que não tem nenhum equivalente, mas faz-se uso de predicados inteiros para de traduzir, como retirar o cabo/as folhas. O corpus de francês foi compilado de websites especializados e é formado por mais de 190.000 ocorrências. O corpus de português foi cedido pelos pesquisadores responsáveis pelo projeto COMET, da USP, disponível para consulta na web. Os verbos selecionados do corpus de francês formam uma lista de 176 unidades, dentre elas os gramaticais e os lexicais, os que comporão nosso glossário automático. SELEX 2009 6
11h45min 12h00min: Antonímia nos adjetivos descritivos do português do Brasil: uma proposta de análise Cláudia Dias de Barros (PPGL/UFSCar) A relação semântica mais importante para os adjetivos é a antonímia, ou seja, a oposição dos sentidos (bom/mau). A WordNet, uma base de dados lexicais para o inglês, que estabelece relações semânticas (como sinonímia, hiperonímia, etc.) entre as palavras, apresenta também o conceito de antonímia indireta (via sinonímia: ótimo=bom/mau) para os adjetivos. A representação desse tipo de antonímia ainda é inexistente no projeto WordNet.Br (WN.Br) para o português do Brasil e em sua interface, o Thesaurus Eletrônico para o Português do Brasil (TeP). Portanto, este trabalho tem como objetivo estudar a antonímia nos adjetivos do Português do Brasil (PB), com vistas a uma contribuição para o refinamento da WN.Br. O estudo é feito tendo como base as ocorrências dos cem (100) adjetivos mais frequentes no corpus Mac-Morpho, do projeto LacioWeb, que contém artigos jornalísticos de 10 cadernos da Folha de São Paulo de 1994. Os adjetivos foram extraídos pelo concordanciador Unitex. Visase estabelecer uma rede semântica que possa relacionar a antonímia direta entre adjetivos e a antonímia indireta existente entre os sinônimos de cada adjetivo e seus antônimos, buscando implementá-las no TeP, refinando aí a representação da antonímia. 12h00min 12h15min: Falsos diminutivos no português do Brasil: estudo preliminar Roana Rodrigues (Graduação em Letras/ UFSCar) O fenômeno dos falsos aumentativos e falsos diminutivos no português do Brasil, embora bastante conhecido, nunca foi minuciosamente estudado e, tampouco, descrito para aplicações em PLN (Processamento de Linguagem Natural). Neste trabalho procuraremos estabelecer uma tipologia inicial dos falsos diminutivos nos substantivos, mostrando a extensão desse fenômeno PALESTRA DE ABERTURA DO I SELEX (Anfiteatro Bento Prado Jr.) 19h00min: Procurando palavras e termos: a odisseia dos dicionários bilíngues John Robert Schmitz (Unicamp) Com respeito aos dicionários bilíngües (doravante, DBs), o meu objetivo nesta apresentação é teórico-prático, com maior ênfase na prática. Pretendo comentar como os DBs contribuíram, no meu caso, para a aprendizagem de espanhol, a minha primeira língua estrangeira. Um dicionário de espanhol-inglês e inglês-espanhol, recebido como presente, foi muito útil para adquirir vocábulos novos na língua alvo e satisfazer a curiosidade de saber como se diria, por exemplo, peach, plum e grapefruit em espanhol. Os DBs dos outros idiomas que estudei ao longo dos anos também me ajudaram a ler textos nas diferentes línguas. Acredito que fui um aprendiz disciplinado e dedicado com boa dose paciência necessária para consultar as duas direções dos dicionários. Graças aos DB, cheguei a gostar de todas as obras lexicográficas tais como os dicionários de aprendizes e os dicionários gerais (de padrão) monolíngües. No decorrer deste trabalho, farei uma classificação provisória dos DBs, lembrando, dentro do possível, o que as referidas obras realmente me ensinaram ou não. Levando o meu interesse e a minha paixão pelos dicionários em geral para esta primeira década do século XXI e com base nas inovações e nas mudanças nos DBs nos últimos 20 anos, gostaria de refletir com os especialistas presentes a respeito dos critérios para a dicionarização de verbetes nas obras bilíngues. Quais vocábulos devem ser registrados num DB pequeno, médio e grande? Recorrendo ao Power Point, faço uso de fotografias tiradas (por mim) de situações do dia-adia (por exemplo, como cartazes, anúncios e cardápios) para pensar, junto com os participantes, quais palavras deveriam constar de novos projetos de DB. Por fim, quero também comentar, por um lado, algumas das mudanças significativas na elaboração do DBs e por outro, as falhas que ainda permanecem. SELEX 2009 7
Sexta, 16 de setembro (Sala de Projeção do DL) SESSÃO 5 Mesa-redonda Processamento Automático das Línguas Naturais e Léxico 08h30min 09h00min: O léxico sob o olhar do Processamento Automático das Línguas Naturais e o projeto Terminet Profa. Dra. Ariani Di Felippo (DL-UFSCar) (coordenadora) No Processamento Automático das Línguas Naturais (PLN), busca-se desenvolver sistemas computacionais que processam (interpretam e/ou geram) línguas naturais, como os sistemas de tradução automática. Para o desenvolvimento de vários sistemas de PLN, são necessários certos recursos linguísticos (os lingwares), os quais desempenham papel central na arquitetura desse tipo de sistema. Dentre eles, destaca-se o léxico. O primeiro objetivo desta sessão é o de apresentar a concepção e os vários tipos de léxico do PLN. Dada a necessidade crescente de se processar textos especializados, léxicos especializados (ou terminológicos) passaram a ser desenvolvidos para várias línguas, principalmente no formato wordnet. O segundo objeto desta sessão é, então, o de apresentar o formato wordnet e destacar sua relevância linguística e computacional. Embora exista um número razoável de wordnets terminológicas em diversas línguas, observa-se a carência de uma metodologia suficientemente clara que facilite e, sobretudo, estimule a criação dessas bases. Para o português do Brasil (PB), aliás, não há léxicos especializados no formato wordnet. Diante desse cenário, iniciou-se, em setembro de 2009, o projeto Terminet, que engloba pesquisadores do NILC (Núcleo Interinstitucional de Linguística Computacional/USP) e do GETerm (Grupo de Estudos e Pesquisas em Teminologia/UFSCar) e que objetiva: (i) a instanciação de uma metodologia genérica de pesquisa no PLN para o desenvolvimento de wordnets terminológicas e (ii) a sua aplicação na construção de uma base desse tipo em PB. O terceiro e último objetivo desta sessão é o de apresentar o projeto Terminet e seus subprojetos, que são: Construção do corpus para o desenvolvimento de uma wordnet terminológica em português do Brasil ; Subsídios linguísticos para a extração semi-automática de candidatos a termo e da relação de sinonímia ; Subsídios linguísticos para a extração semi-automática da relação semânticoconceitual da hiperonímia/hiponímia e Investigação de ferramentas computacionais de extração de candidatos a termo e de relações semântico-conceituais. 09h00min 09h15min: Construção do corpus para o desenvolvimento de uma wordnet terminológica em português do Brasil Jackson Wilke da Cruz Souza (Graduação em Linguística/UFSCar/Bolsista PIBIC) Para a construção de uma base de dados no formato wordnet, é necessário um conjunto de dados léxico-conceituais, saber: (i) as unidades lexicais de uma língua ou de uma linguagem de especialidade, (ii) os conjuntos de formas sinônimas ou quase-sinônimas (synonym sets ou synsets), (iii) as relações de antonímia, hiperonímia/hiponímia, holonímia/meronímia, acarretamento e causa que se estabelecem entre os synsets, (iv) as glosas (definições informações dos conceitos subjacentes aos synsets) e (v) as frases-exemplo, que ilustram os contextos de uso das unidades lexicais. Tais dados são comumente extraídos de uma fonte nãoestruturada, ou seja, de um corpus ( uma coleção de textos em formato eletrônico ). A construção de um corpus requer a projeção do mesmo, ou seja, a determinação de sua tipologia, a qual deve ser feita em função da pesquisa linguístico-computacional para qual está sendo feito. Assim, o objetivo deste trabalho é o de projetar (e construir) o corpus para o desenvolvimento de wordnets terminológicas em português do Brasil. SELEX 2009 8
09h15min 09h30min: Subsídios linguísticos para a extração semi-automática de candidatos a termo e da relação de sinonímia Ana Catarina Gianoti (Graduação em Linguística/UFSCar) A construção de uma wordnet terminológica (ou terminet), ou seja, de uma base de dados no formato wordnet que sistematize o léxico de uma linguagem de especialidade x (p.ex.: medicina), requer um conjunto de unidades terminológicas (ou termos) do domínio x organizadas em função da sinonímia. Os candidatos a termo (isto é, possíveis termos que serão validados pelo especialista do domínio x) são comumente extraídos de forma semi-automática a partir de um corpus do domínio x morfossintaticamente anotado, ou seja, cujas palavras foram etiquetadas com rótulos que indicam a sua categoria sintática (p.ex.: bisturi_n(ome)). A extração dos candidatos a termo que comporão a base de dados é feita principalmente por meio de uma abordagem híbrida. Essa abordagem caracteriza-se pela aplicação de filtros linguísticos e medidas estatísticas (p.ex.: frequência) a um corpus etiquetado. Tais filtros podem ser padrões morfossintáticos (p.ex.: [n-adj], [n-prep-n], etc.) e padrões léxico-sintáticos (p.ex.: é um tipo de, etc.). Para a extração semi-automática dos candidatos a sinônimo, utiliza-se a abordagem linguística, que se caracteriza pela busca de padrões léxico-sintáticos no corpus (p.ex.: é similar a, etc.). Tendo em vista que os filtros linguísticos são dependentes de domínio, objetiva-se, neste projeto, investigar na literatura e no corpus do domínio a ser sistematizado pela terminet quais são os filtros linguísticos mais eficazes para a extração de candidatos a termo e de candidatos a sinônimo em português do Brasil (PB). 09h30min 09h45min: Subsídios linguísticos para a extração semi-automática de relações semântico-conceituais Arthur Pompílio (Graduação em Letras/ UFSCar) Na WordNet de Princeton (WN.Pr) a mãe de todas as wordnets, as unidades lexicais (de língua geral) do inglês norte-americano estão divididas em quatro categorias sintáticas: nome, verbo, adjetivo e advérbio. As unidades de cada categoria estão codificadas em synsets (synonym sets), ou seja, em conjuntos de formas sinônimas ou quase-sinônimas que codificam um único conceito. Os synsets, aliás, podem estar relacionados pelas relações de antonímia, hiperonímia/hiponímia, holonímia/meronímia, acarretamento e causa. Em uma wordnet terminológica (ou terminet), apenas as unidades lexicais da categoria sintática dos nomes são armazenadas na base, dada a relevância de tais unidades nas linguagens de especialidade. Os conceitos subjacentes aos synsets constituídos por unidades nominais organizam-se primordialmente por meio das relações de hiperonímia/hiponímia e holonímia/meronímia. Tais relações são comumente extraídas de forma automática a partir de um corpus morfossintaticamente anotado, ou seja, cujas palavras foram etiquetadas com rótulos que indicam a sua categoria sintática (p.ex.: bisturi_n(ome)). A extração automática dessas relações é feita principalmente por meio da abordagem linguística, que se caracteriza pela busca de padrões léxico-sintáticos (p.ex.: é um tipo de, é feito de, tem como partes, etc.) no corpus do domínio que se quer sistematizar por meio de uma terminet. Tendo em vista que tais padrões são dependentes de domínio, objetiva-se, neste projeto, investigar na literatura e no corpus do domínio a ser sistematizado por uma terminet quais são os padrões léxico-sintáticos mais eficazes para a extração das relações de hiperonímia/hiponímia e holonímia/meronímia em corpora do português do Brasil (PB) e aplicá-los na construção de uma wordnet terminológica em PB. 09h45min 10h00min: Investigação de ferramentas computacionais de extração de candidatos a termo e de relações semântico-conceituais Ana Paula Silva (Graduação em Linguística/ UFSCar) Em uma wordnet terminológica (ou terminet), apenas as unidades lexicais da categoria sintática dos nomes são armazenadas na base, dada a relevância de tais unidades nas linguagens de especialidade. Os conceitos subjacentes aos synsets constituídos por unidades nominais organizam-se primordialmente por meio das relações de hiperonímia/hiponímia e holonímia/meronímia. Tais relações são comumente extraídas de forma automática a partir de um corpus morfossintaticamente anotado, ou seja, cujas palavras foram etiquetadas com SELEX 2009 9
rótulos que indicam a sua categoria sintática (p.ex.: bisturi_n(ome)). A extração automática dessas relações é feita principalmente por meio da abordagem linguística, que, no caso, caracteriza-se pela aplicação de padrões léxico-sintáticos (p. ex.: é um tipo de, é feito de, tem como partes, etc.) ao corpus anotado. Além da extração automática baseada na abordagem linguística, tais relações podem ser extraídas por meio de ferramentas computacionais. Neste projeto, investigar-se-á a possibilidade de utilização de algumas ferramentas disponíveis, como o plug-in OntoLP (Ribeiro Jr, 2008), que implementa o método linguístico proposto por Hearst (1992, 1998) em combinação com algumas medidas estatísticas, o BootCaT (ou seja, um extrator automático de corpus e de termos a partir de material disponível na Web) (do inglês, Bootstrapping Corpora and Terms) (Baroni, Bernardini, 2004) e o Corpógrafo (ou seja, um ambiente Web que possibilita a compilação e investigação de corpora especializados) (MAIA et al., 2005). 10h00min 10h20min: INTERVALO SESSÃO 6 Mesa-redonda Léxico Especializado 10h20min 10h50min: Pesquisas sobre o Léxico Especializado: atividades do GETerm Gladis Maria de Barcellos Almeida (DL-UFSCar) (coordenadora) Será apresentado aos participantes o Grupo de Estudos e Pesquisas em Terminologia (GETerm), formado no Departamento de Letras da UFSCar em 1999 e que integra o Diretório dos Grupos de Pesquisa do CNPq. O GETerm tem como objetivos: 1) estudar conteúdos pertinentes à Terminologia e Terminologia Computacional; 2) desenvolver pesquisas que gerem produtos terminológicos em língua portuguesa, tais como: glossários, dicionários, enciclopédias e assemelhados, que satisfaçam demandas reais. O Grupo conta hoje com uma equipe multidisciplinar, envolvendo linguistas, informatas e especialistas de domínio. No momento, vários projetos estão em andamento no GETerm, basta acessar o site www.geterm.ufscar.br e obter maiores informações. É importante lembrar que, desde 2002, o GETerm tem recebido valiosas colaborações de pesquisadores do Núcleo Interinstitucional de Linguística Computacional (NILC), sediado no Instituto de Ciências Matemáticas e da Computação (ICMC) da USP/São Carlos. Nossa meta é aliar a Terminologia à Informática de forma a gerar produtos terminológicos mais confiáveis e em menor tempo, sem desvincularmonos da teoria terminológica descritiva de base linguística que tem sustentado nossas pesquisas. 10h50min 11h10min: A terminologia da Nanociência e Nanotecnologia: descrição e análise morfológica Joel Sossai Coleti (Graduação em Letras/ UFSCar) Esta pesquisa integra o projeto Terminologia em Língua Portuguesa da Nanociência e Nanotecnologia: Sistematização do Repertório Vocabular e Elaboração de Dicionário-Piloto (apoio CNPq, processo 400506/2006-8) desenvolvido, pelo Grupo de Estudos e Pesquisas em Terminologia (GETerm/UFSCar), em parceria com o Núcleo Interinstitucional de Lingüística Computacional (NILC/USP, São Carlos), e se insere nos domínios da Lingüística, nomeadamente na Descrição do Português, nível Morfológico (de perspectiva estruturalista). Aspectos terminológicos (com ênfase para a Teoria Comunicativa da Terminologia) também são tratados, dado que o objeto desta investigação são termos que integram um vocabulário especializado. Compreendendo as unidades da terminologia como unidades do léxico associadas a um valor especializado ativado pelas condições discursivas e pragmáticas (tradução nossa, CABRÉ, 2006), descrevem-se e analisam-se os aspectos morfológicos do conjunto de termos mais freqüentes da terminologia da Nanociência e Nanotecnologia, de forma a se observar: 1) em que medida os morfemas (lexicais) contêm informações semânticas, a ponto de serem eficazes na criação de novas palavras para denominar um novo conhecimento; 2) até que ponto os fenômenos morfológicos próprios de uma linguagem de especialidade assemelham-se àqueles encontrados na língua geral. Espera-se, assim, cooperar SELEX 2009 10
com a fixação e maior compreensão da terminologia da Nanociência e Nanotecnologia, áreas centrais das atividades de pesquisa, desenvolvimento e inovação no mundo todo. 11h10min 11h30min: A redação da definição terminológica: subsídios para o desenvolvimento do Dicionário-Piloto de Nanociência e Nanotecnologia Daniela Ferreira de Mattos (Licenciatura em Letras/DL) Esta pesquisa integra outro projeto maior denominado Terminologia em Língua Portuguesa da Nanociência e Nanotecnologia: Sistematização do Repertório Vocabular e Elaboração de Dicionário-Piloto (apoio CNPq, processo 400506/2006-8) desenvolvido, pelo Grupo de Estudos e Pesquisas em Terminologia (GETerm/UFSCar), em parceria com o Núcleo Interinstitucional de Lingüística Computacional (NILC/USP, São Carlos). O objetivo deste projeto de Iniciação Científica é criar subsídios para a confecção desse dicionário-piloto em língua portuguesa da área de Nanociência e Nanotecnologia (N&N). Para auxiliar a construção de tal dicionário, esse projeto teve como objetivos: elaborar um conjunto de 200 definições e editar os verbetes no formato para a publicação (que pode ser em papel ou Web). Essa pesquisa foi feita com o apoio de outro subprojeto de iniciação científica (FAPESP), denominado A definição terminológica no Dicionário-Piloto da Nanociência e Nanotecnologia, de autoria do aluno Joel Sossai Coleti, também sob a orientação de Gladis Maria de Barcellos Almeida. (Bolsista CNPq) 11h30min 11h50min: Elaboração de corpus e extração semi-automática de termos para o desenvolvimento da terminologia em português dos Biocombustíveis/Biodiesel Fernando Alves (Graduação em Letras/UFSCar/Bolsista FAPESP) Fundamentada em princípios da Lingüística de Corpus e da Terminologia de orientação descritiva e de base lingüística, esta pesquisa tem como principais objetivos a elaboração do corpus em língua portuguesa, variante brasileira, e a subseqüente extração semi-automática de termos para o desenvolvimento, a posteriori, da terminologia em Língua Portuguesa do Biodiesel, um tipo de Biocombustível. A sistematização desse vocabulário promoverá uma comunicação mais eficiente entre usuários e pesquisadores, bem como garantirá o intercâmbio de informações científicas e tecnológicas livre de ruídos. Uma das razões para o empreendimento deste trabalho é o fato de o domínio dos Biocombustíveis/Biodiesel ainda não ter seu repertório terminológico sistematizado, o que significa uma grande lacuna, primeiro porque Energia é um setor estratégico em qualquer país e, segundo, porque o Brasil é detentor do título de país mais competitivo do mundo para a geração de energia a partir da biomassa (ROSCOE, 2006), ou energias renováveis, caso do biodiesel. Aspectos que comprovam a relevância desta pesquisa que ora se apresenta. SELEX 2009 11