O Tratamento de Marcadores Discursivos em uma Ferramenta de Apoio à Escrita Acadêmica em Português para Nativos de Espanhol

Documentos relacionados
O Tratamento de Marcadores Discursivos em uma Ferramenta de Apoio à Escrita Acadêmica em Português Para Nativos de Espanhol

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA ENSINO SECUNDÁRIO Ano letivo 2017/ Espanhol (iniciação) 11º ano. 1. Objeto de avaliação

Extração de paráfrases em português a partir de léxicos bilíngues: um estudo de caso

Informação - Prova de Equivalência à Frequência ESPANHOL (iniciação) Código da Prova: º e 11.º Anos de Escolaridade

Informação - Prova de Equivalência à Frequência ESPANHOL Código da Prova: º Ano de Escolaridade

Informação - Prova de Equivalência à Frequência ESPANHOL Código da Prova: º Ano de Escolaridade

AGRUPAMENTO DE ESCOLAS DE BENAVENTE

Realizam a prova alunos autopropostos que se encontram abrangidos pelos planos de estudo instituídos pelo Decreto-Lei n.º 139/2012, de 5 de julho.

2. Objeto de avaliação

Introdução. 3 º Ciclo do Ensino Básico (Decreto-Lei n.º 3/2008, de 7 de janeiro)

Cadernos do CNLF, Vol. XIII, Nº 04

Agrupamento de Escolas de S. Pedro do Sul Escola-sede: Escola Secundária de São Pedro do Sul

O tratamento da partícula se para fins de anotação de papéis semânticos

MATERIAL DE DIVULGAÇÃO DA EDITORA MODERNA

O presente documento dá a conhecer os seguintes aspetos relativos ao exame:

Informação-Prova de Equivalência à Frequência

Componente escrita minutos Componente oral minutos

VERSÃO DE TRABALHO. Prova Final de Português Língua Não Materna (A2) Prova 93 2.ª Fase 3.º Ciclo do Ensino Básico º Ano de Escolaridade

INTRODUÇÃO PROVA ESCRITA DOMÍNIOS

Escrita científica em português por hispano falantes: recursos linguísticos-computacionais baseados em métodos de alinhamento de textos paralelos

Prova Final de Português Língua Não Materna (A2) Prova 93 1.ª Fase 3.º Ciclo do Ensino Básico º Ano de Escolaridade. Critérios de Classificação

VERSÃO DE TRABALHO. Exame Final Nacional de Espanhol Prova ª Fase Ensino Secundário º Ano de Escolaridade Iniciação bienal

Unidade 1 O que é o Celpe-Bras?

FRANCÊS Língua Estrangeira II (Continuação) 2018

AGRUPAMENTO DE ESCOLAS TEMPLÁRIOS

Objeto de avaliação. ENSINO BÁSICO (Decreto-Lei n.º 17/2016, de 4 de abril)

Escola Básica e Secundária de Santa Maria. Ano Letivo 2017/2018. Informação Prova Especial de Avaliação. PROFIJ II Tipo 2 1º ano

368 ESPANHOL (NÍVEL- CONTINUAÇÃO 11.º ano)

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA

INFORMAÇÃO - PROVA DE EQUIVALÊNCIA À FREQUÊNCIA. ESPANHOL Continuação Prova ª e 2.ª Fases. Ensino Secundário

Prova 16 Francês - Prova de Equivalência à frequência 3º ciclo- ensino básico

Informação Prova Prova código 367 de Inglês (LE I)

Título: Curso de Difusão da Cultura Hispânica e da Língua Espanhola. Unidade: Faculdade de Ciências e Tecnologia FCT-CLAE-PROEX

AGRUPAMENTO DE ESCOLAS SEBASTIÃO DA GAMA ESCOLA SECUNDÁRIA DE SEBASTIÃO DA GAMA

Exame Final Nacional de Espanhol Prova ª Fase Ensino Secundário º Ano de Escolaridade Iniciação bienal. Critérios de Classificação

AGRUPAMENTO DE ESCOLAS IBN MUCANA

Oral e Escrita de Equivalência à Frequência de Inglês 2018

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA. Prova

6 Atributos. A dívida da empresa subiu.

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA. Prova

LINGUÍSTICA, LETRAS E ARTES

Agrupamento de Escolas de Sande Ano Letivo 2017/2018. Perfil de Aprendizagens Específicas Inglês 1º ciclo

Prova Escrita de Espanhol

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA ENSINO SECUNDÁRIO Ano letivo 2017/ Espanhol (continuação) 11º Ano. 1. Objeto de avaliação

Prova de Equivalência à Frequência de Espanhol

Plano de Trabalho Docente Ensino Técnico

1. Objeto de avaliação

INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA DE Francês Código

Inglês IV. plano de ensino. Ementa. Objetivos Gerais. UA 01 Company facts. UA 02 Telephoning in English

Escola Secundária Dr. José Afonso

Informação - Prova de Equivalência à Frequência ESPANHOL GERAL INICIAÇÃO Código da Prova: º e 11.º Anos de Escolaridade

INFORMAÇÃO-PROVA COMUM

Exame Final Nacional de Espanhol Prova 547 Época Especial Ensino Secundário º Ano de Escolaridade Iniciação bienal. Critérios de Classificação

Informação-Prova de Equivalência à Frequência

Antes de iniciar as respostas, faça uma leitura completa da avaliação. Lembre-se:

Informação - Prova de Equivalência à Frequência ESPANHOL (Geral Iniciação) Código da Prova: º e 11.º Anos de Escolaridade

INFORMAÇÃO - PROVA DE EQUIVALÊNCIA À FREQUÊNCIA. Tipo de Prova: Escrita e Oral Disciplina: Inglês. 3.º CICLO DO ENSINO BÁSICO 9º Ano 2017

I N F O R M A Ç Ã O P R O V A D E E Q U I V A L Ê N C I A À F R E Q U Ê N C I A

Informação Prova de Equivalência à Frequência

AGRUPAMENTO DE ESCOLAS DE FRAGOSO 90 MINUTOS

A DIVERSIDADE LINGUÍSTICA NA PRÁTICA: TRABALHANDO COM PEÇAS TEATRAIS

Descrição da Escala Língua Portuguesa - 9 o ano EF

ESPANHOL INFORMAÇÃO PROVA DE EQUIVALÊNCIA À FREQUÊNCIA. Prova º Ciclo do Ensino Básico AGRUPAMENTO DE ESCOLAS VERGÍLIO FERREIRA

UNIVERSIDADE PRESBITERIANA MACKENZIE Decanato Acadêmico

A pontualidade e o uso dos conectivos temporais em PL2E: entendendo a cultura para entender a gramática

Escola Básica e Secundária de Alvide

FICHA DE UNIDADE CURRICULAR (UC)

Informação Prova Prova código15 deespanhol (LE II)

INGLÊS Caracterização da prova; Objeto de avaliação; Critérios gerais de classificação; Material; Duração. 1. CARACTERIZAÇÃO DA PROVA

Informação Prova de Equivalência à Frequência 9º Ano

INGLÊS Caracterização da prova; Objeto de avaliação; Critérios gerais de classificação; Material; Duração. 1. CARACTERIZAÇÃO DA PROVA

Análise Sintática de Frases utilizando Gramáticas Livres de Contexto Probabilísticas

Informação Prova Prova código 375 deespanhol I (LE III)

EMENTA OBJETIVO GERAL. Ampliar os conhecimentos gramaticais, utilizando-os de forma apropriada nas práticas de linguagem oral e escrita.

SEJA COMO FOR X NO ENTANTO: REFORMULAÇÃO = CONTRA- ARGUMENTAÇÃO? Daniel Mazzaro Vilar de Almeida

CRITÉRIOS GERAIS DE CLASSIFICAÇÃO

Informação-Prova de Equivalência à Frequência COMPONENTE ESCRITA

Perfil de aprendizagens específicas Português 7ºano Ano letivo: DOMÍNIOS SUBDOMÍNIOS NÍVEL 1 NÍVEL 2 NÍVEL 3 NÍVEL 4 NÍVEL 5

Plano de Trabalho Docente Ensino Técnico

DireçãoGeral de Estabelecimentos Escolares AGRUPAMENTO DE ESCOLAS DE PÓVOA DE LANHOSO

INFORMAÇÃO TESTE INTERMÉDIO INTERNO DISCIPLINA DE PORTUGUÊS /12º Ano de Escolaridade

INFORMAÇÃO Prova de Equivalência à Frequência 3º Ciclo do Ensino Básico Decreto Lei n.º 139/2012, de 5 de julho

Admissão de alunos 2016

Durante. Utilize os conteúdos multimídia para ilustrar a matéria de outras formas.

Informação Prova de Equivalência à Frequência. Ano letivo de

Informação - Prova de Equivalência à Frequência ESPANHOL (iniciação) Código da Prova: º e 11.º Anos de Escolaridade

Os programas das disciplinas em causa preconizam atividades linguísticas, estratégias e tarefas reportadas a usos comunicativos da língua.

COMPREENSÃO DE TEXTOS ESCRITOS

MATERIAL DE DIVULGAÇÃO DA EDITORA MODERNA

Plano de Trabalho Docente Ensino Técnico

AGRUPAMENTO DE ESCOLAS DE GOLEGÃ, AZINHAGA E POMBALINHO. Informação - Prova de Equivalência à Frequência à disciplina de Português

Prova Escrita de ESPANHOL Iniciação

Espanhol-Acadêmico-Br:UM CÓRPUS DE APRENDIZES DE PORTUGUÊS ACADÊMICO PRODUZIDO POR NATIVOS DE ESPANHOL

Informação-Prova de Equivalência à Frequência

A prova é apresentada em formato A4, tipo de letra arial, tamanho 14/16, com espaçamento de 1,5.

Transcrição:

O Tratamento de Marcadores Discursivos em uma Ferramenta de Apoio à Escrita Acadêmica em Português para Nativos de Espanhol Lianet Sepúlveda-Torres, Magali Sanches Duran e Sandra Maria Aluísio lisepul@gmail.com, magali.duran@uol.com.br, sandra@icmc.usp.br Núcleo Interinstitucional de Linguística Computacional (NILC) Instituto de Matemática e Ciências da Computação, Universidade de São Paulo Palavras chaves: marcadores discursivos; corpus de aprendizes; ferramentas de auxílio à escrita 1 Introdução Um ponto de partida para o design de uma ferramenta de apoio à escrita em língua estrangeira é a investigação dos tipos de dificuldades enfrentadas pelos aprendizes nessa atividade e um dos meios de se fazer isso é a análise de um corpus de aprendizes. Os tipos de erros e inadequações detectados servem para inspirar o desenvolvimento das soluções oferecidas pela ferramenta. Espera-se que um texto escrito corretamente não seja apenas um texto livre de erros lexicais e gramaticais, mas também um texto que atenda ao gênero em foco e que apresente as ideias de forma coesa e coerente. Por isso, é importante que o aprendiz utilize corretamente os marcadores discursivos em língua estrangeira. Marcadores discursivos são itens lexicais externos às orações, na sua maioria invariável, que relacionam os enunciados e desempenham um importante papel na coesão dos textos [1,2]. A simples presença dos marcadores nos textos não é, porém, garantia de que o texto seja coerente e mais fácil de ser entendido. Aliás, pode ocorrer o contrário: o uso excessivo e desnecessário dos marcadores pode resultar em um texto com problemas de coerência e coesão [1,2,3]. Entre os problemas relacionados ao uso de marcadores discursivos usualmente relatados em trabalhos que analisam córpus de aprendizes [1,3,4] estão: Emprego incorreto de marcadores discursivos (erros de construção gramatical); Sobreuso de marcadores discursivos (os aprendizes aprendem apenas um marcador para cada função e fazem uso recorrente destes); Uso de marcadores informais na escrita formal e científica e vice-versa (desconhecimento do registro de cada marcador); Uso de marcadores de uma função para outra função (erros de escolha lexical); e Uso de marcadores inexistentes (gerados por transferência da língua materna para a língua-alvo). O trabalho que reportamos aqui tem por objetivo apresentar o módulo de marcadores discursivos do projeto HABLA (Hispanofalantes Adquirindo uma Base Linguística Acadêmica) [5], que visa o desenvolvimento de uma ferramenta de apoio à escrita acadêmica em português para falantes nativos de espanhol. 2 Uso dos marcadores discursivos por aprendizes de português, falantes nativos de espanhol A análise de um corpus de aprendizes constituído de textos acadêmicos escritos em português por falantes nativos do espanhol [5] resultou na identificação de problemas semelhantes aos apontados na literatura e citados acima.

Utilizando um grupo de seis marcadores com a mesma função em português, levantamos suas ocorrências no corpus de aprendizes e em um corpus de referência (Revista Pesquisa Fapesp) [6]. A Figura 1 mostra a distribuição desses marcadores por tipo de uso (no início da sentença e precedido de vírgula), separadamente por nativos e por aprendizes. Fig. 1. Distribuição da posição do uso de marcadores por nativos comparada à de aprendizes Comparando-se a posição de uso de cada marcador, observa-se que os aprendizes utilizam prioritariamente os marcadores em posição inicial, pois é a construção mais simples, ao contrário dos nativos, que usam mais os marcadores entre as duas orações relacionadas. Já na Figura 2, comparamos a frequência de uso dos mesmos marcadores por nativos e aprendizes. Fig. 2. Frequência de uso de marcadores por nativos e aprendizes Observa-se que os aprendizes utilizam mais os marcadores todavia e não obstante do que os nativos, provavelmente porque ambos possuem cognatos no espanhol. Por outro lado, aprendizes usam muito menos porém que os nativos. Embora não constituam erros, essas diferenças de uso marcam o discurso dos aprendizes, distanciando-o do discurso produzido por nativos. A proximidade entre o espanhol e o português torna o problema de interferência da língua materna ainda maior, pois a existência de muitos cognatos entre as duas línguas faz com que os aprendizes arrisquem traduções literais de marcadores discursivos do espanhol para o português. Embora a estratégia funcione em grande parte das vezes, há casos em que ela falha, gerando erros. É extremamente comum, por exemplo, encontrarmos Em concreto..., De uma parte..., de outra parte,... quando os marcadores equivalentes em português são, respectivamente, Na verdade, De/Por um lado..., de/por outro lado,... : A identificação desses falsos cognatos baseada apenas em léxico, contudo, não foi bem sucedida em um teste para identificá-los, pois, se por um lado uma sequência pode ser um falso cognato de marcador, por outro lado pode ser uma sequência perfeitamente correta para outras funções em português, como pode ser visto na Tabela 1: Tabela 1. Identificação de falsos cognatos de marcadores discursivos Verdadeiro Positivo Falso Positivo

Em concreto, aplicamos categorias de análises coerentes com tal perspectiva ao estudo dos processos de construção de conteúdos relativos à contaminação e ao uso da água com uma sala de aula com alunos entre os 15 e os 16 anos. Até hoje, ninguém desenvolveu o produto para aplicação em concreto celular ou para uso como aditivo em argamassa. O desafio, portanto, não é somente apontar um possível falso cognato, mas sim identificar o falso cognato na função de marcador discursivo. Somada a esta, há outra dificuldade para a automação do auxílio aos aprendizes: muitos marcadores apresentam ambiguidade com outros usos do léxico que os compõem [7,8], como os exemplos apresentados na Tabela 2. Tabela 2. Identificação de marcadores discursivos Verdadeiro Positivo Eles vieram, embora não tenham sido convidados. Logo, optar pelo silêncio, esperar pela melhor oportunidade de abordar certo assunto e, assim, atingir seu objetivo sem traumas, é a melhor opção. Falso Positivo Eles vieram embora assim que os chamei. Tão logo começam a andar, os roedores são capazes de reconhecer os sinais deixados no ambiente pelo predador e perceber quando é hora de sumir. A Tabela 2 mostra como o item lexical logo pode ser ora um marcador discursivo, ora um advérbio de tempo, e o item lexical embora ora marcador discursivo, ora advérbio de direção que compõe alguns predicados complexos (ir embora, vir embora, mandar embora). Para identificar os itens lexicais na sua função de marcador discursivo, nós os combinamos com padrões que observamos em um corpus de língua culta do português do Brasil (Revista Pesquisa Fapesp). Esses padrões nos mostram que grande parte dos marcadores discursivos pode ocorrer: a) no início de uma das orações relacionadas, seguido de vírgula; b) entre as duas orações relacionadas, precedido de vírgula ou c) no meio de uma das orações relacionadas, entre vírgulas. (a) Ele estudou, no entanto não foi aprovado no exame. (b) Ele estudou. No entanto, não foi aprovado no exame. (c) Ele estudou. Não foi, no entanto, aprovado no exame. Uma exceção são os marcadores que se juntam à oração que exprime o primeiro fato no tempo: (a) Embora ele tenha estudado, não foi aprovado no exame. (b) Ele não foi aprovado no exame, embora tenha estudado. Para simplificarmos, decidimos utilizar na identificação apenas as características comuns aos dois tipos de marcadores, i.e., para ser considerado marcador, o item lexical tem que estar em início de sentença ou ser precedido de vírgula. Essas duas características serão utilizadas como parâmetro para duas ações que serão implementadas no módulo de marcadores discursivos do HABLA: Apontar marcadores falsos cognatos, apresentando sugestões de equivalentes que possam ser utilizados na correção, como apresentado na Figura 3; Apontar marcadores muito recorrentes (que apresentem mais de duas ocorrências em um texto de 500 palavras), apresentando os sinônimos com a mesma função que podem ser utilizados para melhorar a diversidade lexical do texto, como apresentado na Figura 4. Fig. 3. Tela de sugestão de falso cognato de marcador discursivo no sistema HABLA

Fig. 4. Tela de sugestão de marcador discursivo muito utilizado Em textos de aprendizes, contudo, essas características poderão eventualmente não ser suficientes caso eles não façam uso adequado da vírgula. Aliás, como observamos que em textos bem escritos existem regras no uso da vírgula junto a marcadores discursivos, pretendemos em trabalhos futuros dar suporte ao aprendiz também nesse aspecto. Outra dificuldade que ficou evidente na análise do corpus de aprendizes, mas não relatadas na literatura é o uso incorreto do modo verbal exigido por determinados marcadores discursivos. Por exemplo, os marcadores ainda que e embora exigem que o verbo da oração que os contém esteja no modo subjuntivo (1), enquanto o marcador apesar de exige o verbo no infinitivo pessoal (2): 1. Ainda que tenhamos tentado, não conseguimos marcar nenhum gol. 2. Apesar de termos tentado, não conseguimos marcar nenhum gol. A identificação desse tipo de erro, contudo, exige informações que vão além das etiquetas de anotação morfossintática e por isso serão implementadas em trabalhos futuros. 3 Léxico de marcadores discursivos para uso computacional Apesar da importância dos marcadores na produção escrita, principalmente na escrita acadêmica, estes itens lexicais não estão totalmente inventariados em português e espanhol. A subcategorização dos marcadores lexicais de acordo com sua função, embora reconhecida, varia muito na literatura das duas línguas [2], [9]. Devido ao fato de existirem vários marcadores discursivos para cada função, é muito importante contarmos com uma subcategorização precisa desses itens lexicais por função em ambas as línguas (língua materna do aprendiz e língua-alvo). Isso porque a tradução dos marcadores discursivos não costuma respeitar uma relação de equivalência item a item, mas sim a relação de equivalência entre as subcategorias de função. Fernández [2] desenvolveu um estudo com a finalidade de classificar, analisar e comparar os marcadores discursivos em espanhol e em português em 200 textos do gênero jornalístico a partir de uma perspectiva linguístico-pragmática. A autora fez um levantamento de todos os marcadores presentes no corpus e considera os cinco grupos apresentados por [10]: (i) Estruturadores da informação; (ii) Conectores; (iii) Operadores Argumentativos; (iv) Reformuladores e (v) Conversacionais. O resultado léxico desse estudo, porém, não possui as características necessárias para uso computacional. Para automatização das sugestões é necessário que esse léxico esteja inventariado extensivamente em cada língua, agrupado por funções e que cada grupo de uma língua tenha um grupo equivalente na outra língua, como é mostrado na Figura 5. Fig. 5. Léxico bilíngue de marcadores com uma mesma função

Como nosso foco é viabilizar suporte automático aos aprendizes na escrita em português como língua estrangeira, priorizaremos o design de soluções para uma das classes mais usadas de marcadores: os que têm função de contrapor orações (Figura 5). Desta forma, deixaremos uma estrutura preparada para que outros marcadores sejam também contemplados à medida que novos insumos didáticos sejam produzidos. 4 Considerações Finais Reportamos o projeto do módulo de apoio ao uso de marcadores discursivos na ferramenta de suporte à escrita do projeto HABLA (Hispanofalantes Adquirindo uma Base Linguística Acadêmica). O diagnóstico das dificuldades observadas no corpus de aprendizes mostrou várias possibilidades de auxílio aos aprendizes, duas das quais já estão sendo implementadas. A implementação de todos os possíveis auxílios, contudo, depende da existência de insumos léxicos e pedagógicos, como tabelas de marcadores classificados por função nas duas línguas envolvidas. Por ora, elaboramos um léxico dos marcadores falsos cognatos, gerado a partir de erros de traduções literais dos marcadores de espanhol. O problema da ambiguidade do léxico dos marcadores (e de marcadores falsos cognatos) com outros itens lexicais está sendo contornado pelo uso de duas características: só é considerado marcador ou marcador falso cognato os itens que estiverem na lista de marcadores e ocuparem posição inicial na sentença ou forem precedidos de vírgula. Referências Bibliográficas 1. Aidinlou, N.A., Mehr, H.S.: The Effect of Discourse Markers Instruction on EFL Learners Writing. World Journal of Education. (2012) 2. Fernández, S.I.: Los Marcadores Discursivos en la Argumentación Escrita: Estudio Comparado en el Español de España y en el Portugués de Brasil. Salamanca: Ediciones Universidad de Salamanca. (2005) 3. Casteele, A.V, Collewaert, K.: The Use of Discourse Markers in Spanish Language Learners Written Compositions. Procedia - Social and Behavioral Sciences, vol. 95, pp. 550--556. (2013) 4. Jalilifar, A.R.: Discourse Markers in Composition Writings: The Case of Iranian Learners of English as a Foreign Language. Journal of CCSE, English Language Teaching, vol.1, no.2 (2008) 5. Sepúlveda-Torres, L. Rodrigues, R., Aluísio, S.: Espanhol-Acadêmico-Br: A Corpus of Academic Portuguese Learners Produced by Native Speakers of Spanish, In: Aluisio, S. and Tagnin. S. O. (eds.) New Languages Technologies and Linguistic Research: a Two-Way Road. Cambridge Scholars Publishing. (2014) 6. Aziz, W., Specia, L.: Fully automatic Compilation of a Portuguese-English Parallel Corpus for Statistical Machine Translation. In: The 8 th Brazilian Symposium in Information and Human Language Technology, STIL 2011, Cuiabá, MT. (2011) 7. Heeman, P.A., Byron, D., Allen, J.F.: Identifying Discourse Markers in Spoken Dialog. (1998) 8. Schourup, L.: Discourse Markers. In Lingua, no 107, pp. 227--265. (1998) 9. Shanru, Y.: Discourse Markers? An Area of Confusion. Newcastle University, UK. (2012) 10. Martín, Z.M.A., Portolés, L.J.: Los Marcadores del Discurso. In I. Bosque & V. Demonte (Eds.), Gramática Descriptiva de la Lengua Española. Tercera parte. Entre la oración y el discurso. Morfología. pp. 4051--4213). Madrid: Espasa Calpe. (1999)