Critérios para transcrição da fala espontânea Heloísa Vale Heliana Mello Tommaso Raso UFMG
Visão geral desta apresentação O corpus C-ORAL-BRASIL Originalidade e vantagens da transcrição Alguns fenômenos em processo de gramaticalização e lexicalização Exigências 2
O corpus C-ORAL-BRASIL Corpus de fala espontânea do português do Brasil coletado segundo os mesmos critérios do C-ORAL- ROM (para italiano, francês, espanhol e português europeu). 1 Objetivos principais: estudos sobre a estruturação ilocutória e informacional da fala; estudos sobre fenômenos léxico-morfossintáticos em curso de gramaticalização e lexicalização. 2 1 CRESTI, E.; MONEGLIA, M. (Eds.) (2005) C-Oral-Rom: Integrated Reference Corpora For Spoken Romance Languages. Amsterdam: John Benjamins. 2 RASO, T.; MELLO, H. (no prelo) The C-ORAL-BRASIL corpus. In: Moneglia, M.; Panunzi, A. (Orgs.) Bootstrapping Information from Corpora in a Cross Linguistic Perspective. Florença: Firenze University Press. 3
Originalidade e vantagens da transcrição 1. Estudos da fala com base na prosódia e interface entre locução, ilocução e informação através da segmentação da fala em Enunciados e Unidades Tonais, com base em critérios perceptuais. ENUNCIADO = ATO DE FALA UNIDADE TONAL = UNIDADE INFORMACIONAL 4
ENUNCIADOS SIMPLES: *BEL: sabe que que aconteceu quando eu fui de intercâmbio // *BAL: uhn // ENUNCIADOS COMPLEXOS: *FLA: ô / diz que esse sanduíche é uma delícia // 5
2. Estudos da fala com base numa codificação morfossintática buscando regras internas à própria fala, pela adoção de critérios nãoortográficos. 6
3. Estudos da fala com base em critérios estatísticos usando o tagger Palavras 3 adaptado pelo autor (Eckhard Bick) a esse tipo de transcrição e coadjuvado pela linguagem de programação R. 3 BICK, E. (2000). The Parsing System "Palavras": Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Dr.phil. thesis. Aarhus University. Aarhus, Denmark: Aarhus University. 7
As transcrições são perceptuais. Os fenômenos são registrados com base em hipóteses de mudanças morfossintáticas. 8
Alguns fenômenos Perda da marca de plural nos elementos não em primeira posição de constituinte e marcação até em invariáveis: OS menino bonito QUES menino bonito 9
Perda da morfologia verbal que tende a opor a primeira às outras cinco pessoas: eu FAÇO x você/ele/nós/vocês/eles FAZ 10
Cliticização do pronome sujeito, da negação e das formas SENHOR/SENHORA: CÊ, CÊS (= você, vocês), E, ES, EA, EAS (= ele, eles, ela, elas) NŨ (= não) SIOR, SÔ, SEU (= senhor), SIORA, SIOR, SÁ (= senhora) 11
Perda dos clíticos objeto e na expressão de diátese inacusativa, reflexividade e reciprocidade: COMPREI A BLUSA MAS NÃO USEI, COMPREI A BLUSA MAS NÃO USEI ELA x comprei a blusa mas não a usei O VASO QUEBROU x o vaso se quebrou EU ENXUGUEI x eu me enxuguei ELES BEIJARAM x eles se beijaram 12
Redução das marcas de diminutivos (masculinos) e dos demonstrativos: SOZIM (= sozinho) AQUE, AQUES, AQUEA, AQUEAS (= aquele, aqueles, aquela, aquelas) 13
Lexicalização de formas aferéticas: BRIGADO (= obrigado), PERA (= espera), CABOU (= acabou), GÜENTAR (= agüentar) 14
Questões ligadas ao QUE: em expressão de espanto: QUE ISSO, quando a pronúncia é com e fechada QUE É ISSO, quando a pronúncia é com e aberta em interrogativas e clivadas (QUE QUE, POR QUE QUE, QUANDO QUE, QUANTO QUE etc.): QUE QUE cê faz (= que é que você faz) Maria QUE faz (= Maria é que faz) subentendido, mas não pronunciado: esse tá na sua mão é grande (= esse QUE está na sua mão é grande) 15
Primeira pessoa do plural: EMPURRAMO, EMPURREMO (= empurramos) (O mesmo para SEJE (= seja)). 16
Perífrase EU TENHO QUE + infinitivo e uso de TENHO + objeto na primeira pessoa: EU TEM QUE SAIR AGORA x eu tenho que sair agora EU NÃO TEM VONTADE DE SAIR AGORA x eu não tenho vontade de sair agora 17
Formas aferéticas do verbo ESTAR: TÁ, TAVA, TAR (infinitivo), TÃO, TANDO, TÔ etc. (O mesmo para TEJE (= esteja)). 18
Preposições articuladas: PRA, PA (= para a), PRAS, PRO, PO (= para o), PROS, PRUM, PUM (= para um), PRUNS, PRUMA, PUMA (= para uma), PRUMAS, PR ES (= para eles), PR AQUES (= para aqueles)... NOS, NAS, NUM, NUMA, NES (= neles)... DUM (= de um), DUNS, DUMA (= de uma), DUMAS, DES (= deles), DAQUES (= daqueles)... CO (= com o), COS, CA (= com a), CAS, CUM (= com um), CUNS, CUMA (= com uma), CUMAS, C ES (= com eles), C AQUES (= com aqueles)... 19
Expressões com o verbo OLHAR: A LÁ (= olha lá) A AÍ (= olha aí) 20
Exigências Os fenômenos são escolhidos de modo que: 1. Os textos transcritos sejam legíveis; 2. Os diferentes transcritores possam percebêlos acusticamente de maneira consistente; 3. Não se encubram através da ortografia fenômenos interessantes, impossibilitando estudos futuros sobre a fala. 21
Fim Grata pela atenção. helopv@terra.com.br