X Salão de Iniciação Científica PUCRS PORTUGUÊS POPULAR ESCRITO: O VOCABULÁRIO DO JORNAL DIÁRIO GAÚCHO Bruna Rodrigues da Silva¹, Maria José Bocorny Finatto ²(orientador) ¹ Acadêmica do curso de Letras / Licenciatura em Língua Portuguesa e respectivas literaturas- UFRGS, Monitora SEAD/UFRGS da disciplina Léxico e Dicionários. ²Docente do Instituto de Letras-UFRGS.
Situação Atual A maioria dos estudos de vocabulário da escrita do português do Brasil usa jornais (ênfase em Folha de SP). Os jornais populares não integram esse tipo de estudo, mesmo quando há inclusão de outros jornais (RJ/RS/MG).
Com isso... Aposta: esse material também pode ser útil e importante. Seleção: observação de jornais diários do Brasil no perfil popular (perfil heterogêneo). Escolha: O melhor para estudo é o jornal Diário Gaúcho.
O Diário Gaúcho Lançado no ano 2000. Formato tablóide. Realiza promoções:interage com seu leitor. Circula de segunda a sábado na capital e na região metropolitana. Dedica-se principalmente às classes populares da região metropolitana de Porto Alegre, embora circule em todo o estado. (AMARAL, 2006, p.80)
O porquê da escolha Tipo de texto já tratado em Jornalismo/Comunicação (AMARAL, 2004 e 2006; BERNARDES, 2004), mas POUCO tratado em Letras/Lingüística oferece uma lacuna a explorar. Aceitação Parte dos consumidores do DG não eram leitores de jornal, e após seu lançamento, em 2000, a região metropolitana de Porto Alegre passou a ser a primeira em índice de leitura de jornais no Brasil. (AMARAL, 2006 p.80)
Circulação 164.000 exemplares vendidos por dia! Centrado no seu público Leva em consideração a posição econômica, social e cultural do leitor. (AMARAL, 2006, p.133) Linguagem tradicional em relação a jornais do gênero popular Texto simples não significa texto pobre. (MANUAL DE REDAÇÃO DO DIÁRIO GAÚCHO, p. 06)
Manchete de capa do jornal Meia Hora. Edição de 30 de outubro de 2008.
Objetivos da Pesquisa Caracterizar léxico e linguagem num texto, em tese, simplificado, que visa compreensão facilitada para um determinado grupo social e econômico. Levar dados para a disciplina Léxico e Dicionários do curso de Letras/UFRGS.
Lingüística de Corpus: área que estuda a língua por meio da observação de grandes quantidades de dados lingüísticos reais, isto é, textos falados ou escritos provenientes da comunicação no mundo real (língua em uso), com o auxílio de ferramentas computacionais. Corpus: coletânea de porções de linguagem que são selecionadas e organizadas de acordo com critérios lingüísticos explícitos, a fim de serem usadas como uma amostra da linguagem. (SARDINHA, 2000, p.338)
FLUXO DA PESQUISA ARQUIVOS DG - PDF ARQUIVOS TXT PROCESSAMENTO LARGA E PEQUENA ESCALA FREQÜÊNCIAS DE PALAVRAS PADRÕES DE FRASE EXPRESSÕES/ CONSTRUÇÕES USOS DIVERSOS: DESCRIÇÃO DA LÍNGUA - COMPUTAÇÃO + LINGÜÍSTICA + DICIONÁRIOS DADOS E ATIVIDADES DE ENSINO NA DISCIPLINA LÉXICO E DICIONÁRIOS curso de Letras/UFRGS.
Metodologia Produção e organização do corpus do Diário Gaúcho em formato somente texto,
http://www.ufrgs.br/textquim Produção das listas de palavras,
Observação das palavras mais freqüentes (mês a mês), Janeiro Fevereiro Março 1 6796 de 7105 de 7135 de 2 4807 o 5131 a 5136 a 3 4607 a 5078 o 5081 o 4 3914 e 4205 e 4018 e 5 2675 que 2835 do 2859 que 6 2616 do 2824 que 2671 do 7 2236 da 2366 da 2337 da 8 2020 para 2041 para 1998 com 9 1992 em 2001 com 1951 para 10 1938 com 1939 em 1942 em 11 1730 no 1892 no 1742 no 12 1544 na 1722 na 1587 na 13 1424 um 1412 um 1471 um 14 1179 é 1297 é 1224 é 15 1125 não 1170 não 1185 os 16 1070 os 1041 os 1141 uma 17 993 uma 980 uma 1135 não 18 772 por 873 por 919 por 19 695 as 787 h 772 as 20 679 foi 769 as 697 se
Comparação com dados de padrões de vocabulário colhidos do Banco do Português Trimestre - DG Banco do Português 1 21036 de 6022939 de 2 14966 o 4289463 a 3 14874 a 4135372 o 4 12137 e 2906593 e 5 8358 que 2763756 que 6 8122 do 2433919 do 7 6939 da 2169947 da 8 6012 para 1760984 em 9 5937 com 1403295 para 10 5873 em 123337 no 11 5364 no 1149743 é 12 4853 na 1133466 com 13 4307 um 1084939 os 14 3700 é 1063093 um 15 3430 não 1016223 na 16 3296 os 1006853 não 17 3114 uma 836547 uma 18 2564 por 834435 se 19 2236 as 702611 por 20 2077 foi 675637 dos
Contrastes com padrões de vocabulário do jornal Zero Hora (ZH). Zero Hora Diário Gaúcho 16 3498 é 1141 uma 1 27087 de 7135 de 17 3418 uma 1135 não 2 18506 a 5136 a 18 3218 se 919 por 3 16747 o 5081 o 19 3070 por 772 as 4 12678 e 4018 e 20 2728 dos 697 se 5 11145 do 2859 que 21 2689 as 667 foi 6 9970 que 2671 do 22 2354 r 660 anos 7 8945 da 2337 da 23 2344 ao 659 dos 8 8080 em 1998 com 24 2072 mais 624 h 9 6455 com 1951 para 25 1944 à 617 mais 10 6417 para 1942 em 26 1926 foi 584 ao 11 6088 no 1742 no 27 1850 das 545 vagas 12 4736 na 1587 na 28 1802 como 514 são 13 4438 os 1471 um 29 1505 anos 513 das 14 4190 um 1224 é 30 1452 pelo 441 r 15 3612 não 1185 os
Resultados Iniciais Algumas listas das palavras mais freqüentemente empregadas nos textos produzidos ao longo de 2008. Descrições iniciais da linguagem empregada no jornal. Material para uso em sala de aula.
Diário Gaúcho (mar/2008) Tokens = 160869 Types = 18127 Banco do Português (recorte jornal) Tokens = 223.371.280 Types = 582.372 Zero Hora (mar/2008) Tokens = 557258 Types = 32881 1 7135 de 6022939 de 27087 de 2 5136 a 4289463 a 18506 a 3 5081 o 4135372 o 16747 o 4 4018 e 2906593 e 12678 e 5 2859 que 2763756 que 11145 do 6 2671 do 2433919 do 9970 que 7 2337 da 2169947 da 8945 da 8 1998 com 1760984 em 8080 em 9 1951 para 1403295 para 6455 com 10 1942 em 123337 no 6417 para 11 1742 no 1149743 é 6088 no 12 1587 na 1133466 com 4736 na 13 1471 um 1084939 os 4438 os 14 1224 é 1063093 um 4190 um 15 1185 os 1016223 na 3612 não 16 1141 uma 1006853 não 3498 é 17 1135 não 836547 uma 3418 uma 18 919 por 834435 se 3218 se 19 772 as 702611 por 3070 por 20 697 se 675637 dos 2728 dos
Além do aspecto de descrição do vocabulário, utilizar o jornal DG como fonte de estudo pode ser de grande utilidade para a reflexão sobre a escrita e o ensino, tanto que os dados levantados originaram atividades interessantes de ensino no curso de Letras: Os alunos manipularam os arquivos do jornal e produziram suas listas de palavras. Os alunos foram incentivados a produzirem um glossário esportivo a partir do corpus DG. As atividades foram desenvolvidas na plataforma Moodle e com o apoio das ferramentas do site Textquim.
Bibliografia de Estudo AMARAL, M. F., Jornalismo Popular. São Paulo: Contexto, 2006. BERNARDES, C. B.. As Condições de produção do jornalismo popular massivo: o caso do Diário Gaúcho. Universidade Federal do Rio Grande do Sul. Faculdade de Biblioteconomia e Comunicação. Programa de Pós-Graduação em Comunicação e Informação. Diss. Mestrado, 2004. MANUAL DE REDAÇÃO DO DIÁRIO GAÚCHO. Agosto de 2005. SARDINHA, T. B., Lingüística de Corpus. Barueri-SP: Manole, 2004. SARDINHA, T. B., Lingüística de Corpus: Histórico e Problemática. D.E.L.T.A., Vol. 16, N.º 2, 2000 (323-367)