Rafael Tanizawa

Documentos relacionados
A AVALIAÇÃO EM MATEMÁTICA DO SAETHE GLAUKER AMORIM

MINISTÉRIO DA EDUCAÇÃO INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA DIRETORIA DE AVALIAÇÃO DA EDUCAÇÃO BÁSICA DAEB

A TRI e as proficiências

IV CONBRATRI, 4º Congresso Brasileiro de Teoria da Resposta ao Item, Brasília, DF, 2-4 de Dezembro de 2015

Teorias de Avaliação - CE095

PAINEL DE DISCUSSÃO 4: COMPARABILIDADE ENTRE AVALIAÇÕES. Ruben Klein (Fundação Cesgranrio)

Teorias de Avaliação - CE095

Apresentação. Geek Educacional

O CAEd está organizado em cinco unidades:

9 Uma Análise Comparativa: TCT, TRI e TRIN

Teorias de Avaliação - CE095

MANUAL SOBRE A CONSTRUÇÃO DA NOTA POR TEORIA DA RESPOSTA AO ITEM (TRI)

3 Método Etapa 1 Etapa 2 Etapa 3

Ajuste de um modelo de TRI aos dados do vestibular do curso de Administração Noturno da Universidade Federal de Uberlândia

Avanços na Interpretação de Escalas com a Aplicação da Teoria de Resposta ao Item

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO

Comparações entre a Teoria de Resposta ao Item e a Teoria Clássica de Medidas para Banco de Itens Simulados

6 Atributos. A dívida da empresa subiu.

Prova Brasil, Saresp etc. Heliton Ribeiro Tavares

Avaliações Educacionais e o Ensino de Ciências e Matemática: o Enem: avaliação do desempenho dos estudantes em Ciências da Natureza

A Avaliação Nacional da Alfabetização: compreendendo os resultados. André Jalles

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais

Aula 3. Introduçao à TRI

Utilização de modelos marginais na análise de dados longitudinais irregulares em relação ao tempo

Sumarização Automática para Simplificação de Textos: Experimentos e Lições Aprendidas

Professora Orientadora do Departamento de Ciências Exatas e Engenharias. 4

Avaliaçõe s em Larga Escala O que elas nos ensinam sobre o Ensino de Física

AVALIA MACEIÓ Oficina de Apropriação de Resultados

Metodologia da Pesquisa em Sistemas de Informação. Aula 3. Projeto de Pesquisa. Revisão Sistemática. Profa. Fátima L. S. Nunes

WESAAC 2019 SCRUMIE: JOGO ORIENTADO A AGENTES PARA ENSINO DE SCRUM. Suelen Regina Cordeiro dos Santos

TEORIA DA RESPOSTA AO ITEM (TRI): ESTIMAÇÃO BAYESIANA DA HABILIDADE DE INDIVÍDUOS

4 Metodologia. 1 Recordemos que o Geres é um estudo longitudinal que avalia alunos em Leitura e Matemática do

Uma ontologia para modelagem de conteúdo para Ensino a Distância. An ontology for modeling distance learning contents

Frederico Neves Condé - Efeito dos modelos de teste na habilidade 1

A COMPETÊNCIA DE RESOLUÇÃO DE PROBLEMAS QUE ENVOLVEM O PENSAMENTO ALGÉBRICO: UM EXPERIMENTO NO 9º ANO DO ENSINO

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

6. AVALIAÇÃO DO VCURSO+

manual sobre a atribuicao de notas em provas de multipla escolha utilizando a CGOE TEORIA DA RESPOSTA AO ITEM (TRI)

As Avaliações externas e o acompanhamento pedagógico utilizando indicadores e a as bases do SIGA e do INEP

ANÁLISES ESTATÍSTICAS TRI. CAEd/UFJF (32)

4 Metodologia. 4.1 Metodologia naturalista: produção da fala espontânea

Palavras-chave: Teoria de Resposta ao Item; ENEM; Avaliação na Educação

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS

Comparação entre intervalos de confiança calculados com métodos bootstrap e intervalos assintóticos

AMOSTRAGEM. É a parte da Teoria Estatística que define os procedimentos para os planejamentos amostrais e as técnicas de estimação utilizadas.

Teorias de Avaliação - CE095

Inferência Estatistica

Ferramentas da Moodle: Atividades e Recursos

CONCURSO DE BOLSA 2019

PLATAFORMA DE APOIO AO TREINAMENTO PARA A OLIMPÍADA BRASILEIRA DE INFORMÁTICA

AULA 03 Estimativas e tamanhos amostrais

Aula 2: Planejamento da RS

TeMário 2006: Estendendo o Córpus TeMário

Resposta: Resposta: 4 ou seja, 1.

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Oficina de Apropriação de Resultados para Professores PAEBES Matemática

Coesão e coerência no jornal Diário Gaúcho: um estudo exploratório

Indexação automática. CBD/ECA Indexação: teoria e prática

Biblioteca Central da USP - Campus de Ribeirão Preto: estudo do uso de base de dados por alunos de graduação e pós-graduação

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

PROGRAMA DE PÓS-GRADUAÇÃO EM PSICOLOGIA TEORIA DE RESPOSTA AO ITEM COM R PROF. DR. RICARDO PRIMI 2o Semestre de a feira 9:00-12:00 hs

AVALIAÇÃO NACIONAL DA ALFABETIZAÇÃO (ANA) Profa. Ivana de Oliveira Carvalho FaE/UEMG

Técnico Integrado em Controle Ambiental SÉRIE:

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

9 CONSIDERAÇÕES FINAIS

Tutorial Moodle. Acesso. Página Inicial Preencher perfil. Enviar Mensagem. Recursos. Atividades. Moodle

Evento: XXV SEMINÁRIO DE INICIAÇÃO CIENTÍFICA

Apresentar a Matriz de Referência, analisando os descritores que norteiam a elaboração dos itens presentes nos testes de Língua Portuguesa.

Tópicos em Gestão da Informação II

Influencia de Distribuições a priori na Analise Bayesiana em dados de contagem

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

5 Agregação das Reservas das Entidades

EDITOR DE ANOTAÇÃO DE SIMPLIFICAÇÃO: MANUAL DO USUÁRIO

PROTÓTIPO PARA SUMARIZAÇÃO AUTOMÁTICA DE TEXTOS ESCRITOS EM LÍNGUA PORTUGUESA ALEXANDRE BUSARELLO JOYCE MARTINS

OS DIFERENTES CRITÉRIOS UTILIZADOS PARA CLASSIFICAÇÃO DE PALAVRAS EM GRAMÁTICAS ESCOLARES

Problemas de Escrita. Graça Nunes Thiago Pardo

Oficina de Apropriação de Resultados. Paebes 2013

SisPAE 2015 BREVES METODOLOGIA E PROCEDIMENTOS OFICINA DE DIVULGAÇÃO DE RESULTADOS DO SISPAE 2015

Cerca de um quarto da prova será fácil, dois quartos terão grau

variável dependente natureza dicotômica ou binária independentes, tanto podem ser categóricas ou não estimar a probabilidade associada à ocorrência

Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni

Probabilidade Condicional

Avaliação educacional

847- ESPANHOL (NÍVEL- CONTINUAÇÃO 10.º/ 11.º ANO)

Tutorial de utilização do EAD-IBRAV Treinamentos

Antes de iniciar as respostas, faça uma leitura completa da avaliação. Lembre-se:

Bioestatística Básica RCA 5804 COMPARANDO GRUPOS INDEPENDENTES. Prof. Dr. Alfredo J Rodrigues

Amostragem e distribuições por amostragem

Saeb: Sistema de Avaliação da Educação Básica

O USO DE SOFTWARE LIVRE PELOS TÉCNICOS ADMINISTRATIVOS DO IFSULDEMINAS CAMPUS MACHADO

AULA 02 PLANEJAMENTO ESTATÍSTICO

MATERIAL DE DIVULGAÇÃO DA EDITORA MODERNA

TESTES NÃO PARAMÉTRICOS (para mediana/média)

Modelos Bayesianos. Ernesto F. L. Amaral Magna M. Inácio

Admissão de alunos 2016

Trabalho de Conclusão de Curso APLICATIVO WEB SHINY PARA MODELOS DICOTÔMICOS DA TRI USANDO O PACOTE LTM DO R ANGELA MARIA DA SILVA

O SOFTWARE GEOGEBRA NO ENSINO DA DISTRIBUIÇÃO NORMAL

DESIGN DE INFORMAÇÃO - PICTOGRAMAS E FORMAS PARA A APROFEIRA 1 DESIGN OG INFORMATION - SHAPES AND PICTOGRAMS FOR THE APROFEIRA

Transcrição:

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Relatório Científico 4 Processo nro. 09/50011-3 Bolsa no País Regular Iniciação Científica Maio a Outubro de 2009 Rafael Tanizawa tagui@grad.icmc.usp.br Orientadora Profaª. Draª. Sandra Maria Aluísio sandra@icmc.usp.br Coordenadora do PorSimples Profa. Dra. Sandra Maria Aluísio Outubro de 2009

Avaliação em Larga Escala da Tarefa de Simplificação Textual no PorSimples Sumário...1 Avaliação em Larga Escala da Tarefa de Simplificação Textual no PorSimples...2 1. Introdução...3 2. Atividades Realizadas no Período...4 2.1 Lista de tarefas desenvolvidas até o momento...4 2.2 Descrição detalhada das tarefas realizadas...4 Teoria de Resposta ao Item (TRI)...4 O Teste Cloze...5 A. Criação da prova utilizando o método Cloze e questões de múltiplas escolhas...5 B. Aplicação da prova para 298 pessoas...7 C. Análise estatística da amostra utilizando a Teoria de Resposta ao Item...7 D. Criação de uma página web para o aprimoramento da leitura por analfabetos funcionais.12 2.3 Participação em seminários e submissão de artigos...12 3. Atividades Futuras...13 4. Considerações Finais...13 Referências Bibliográficas...13

1. Introdução É bem sabido que sentenças longas, com vários níveis de subordinação, cláusulas embutidas (relativas), sentenças na voz passiva, uso da ordem não canônica para os componentes de uma sentença, além do uso de palavras de baixa frequência aumentam a complexidade de um texto para leitores com problemas de compreensão como, por exemplo, alfabetizados de nível rudimentar e de nível básico, afásicos e disléxicos [1]. O Projeto PorSimples (Simplificação Textual do Português para Inclusão e Acessibilidade Digital) [2,3] propõe o uso de vários tipos de adaptações textuais, como a sumarização automática, a simplificação linguistica e também a elaboração textual, para facilitar o acesso de alfabetizados de nível rudimentar e de nível básico [4], principalmente, à informação. A simplificação linguística é uma tarefa tratada pela área de pesquisa em Processamento de Língua Natural (PLN) e é definida como qualquer processo que reduza a complexidade léxica ou sintática de um texto enquanto tenta preservar seu significado e informação [5]. A sumarização é também uma forma de simplificação que visa à diminuição do tamanho de um texto [6]. A elaboração textual adiciona informação a um texto, visando esclarecer, elaborar e explicar uma informação implícita e tornar explícitas as conexões entre as idéias [7]. A simplificação linguística se propõe a melhorar a inteligibilidade de um texto, ou seja, a capacidade de um texto de ser lido, que esta esta relacionada ao uso de palavras frequentes para atingir uma gama maior de leitores, e estruturas sintáticas menos complexas para facilitar a sua leitura, não sobrecarregando a memória de curto prazo. Já a elaboração textual ajuda na compreensibilidade de um texto, pois pode adicionar informação extra que seja adequada a uma classe específica de usuários, customizando o texto para as necessidades destes. Para a mensuração e avaliação da inteligibilidade e compreensibilidade de um texto, há algumas alternativas muito usadas e descritas na literatura, tais como o teste Cloze [8] ou provas objetivas com itens de múltiplas escolhas que avaliam habilidades de leitura. Esta última é muito adotada em exames em larga escala da educação no Brasil como, por exemplo, o Sistema de Avaliação de Rendimento Escolar do Estado de São Paulo (SARESP) 1. O objetivo deste projeto de Iniciação Científica é verificar se as operações de simplificação linguística, propostas no projeto PorSimples, melhoram as características de inteligibilidade dos textos e interferem positivamente nas habilidades de leitura, isto é, numa melhora da compreensão do texto. Esta avaliação está sendo realizada tanto através de métodos clássicos como de métodos da Teoria de Resposta ao Item (TRI) unidimensional [9], que exigem um grande número de pessoas, pois os métodos precisam estimar muitos parâmetros. A TRI é um conjunto de modelos matemáticos que representam a probabilidade de um indivíduo dar uma resposta certa a uma questão (item) como função dos parâmetros do item e da habilidade (ou habilidades) do indivíduo. Quanto maior a habilidade, maior a probabilidade de acerto no item. A escolha da TRI neste projeto se alinha ao cenário atual no Brasil de adesão a ela em provas de larga escala como o Sistema de Avaliação da Educação Básica do país (SAEB 2 ), a Avaliação Nacional de Rendimento Escolar (Prova Brasil 3 ), o SARESP, além do Exame Nacional para Certificação de Competências de Jovens e Adultos (Encceja 4 ) e, mais atualmente, o ENEM 5. No período anterior (janeiro a abril de 2009), uma prova foi criada no sistema Moodle 1 http://saresp2009.edunet.sp.gov.br/ 2 http://www.inep.gov.br/basica/saeb/default.asp 3 http://provabrasil.inep.gov.br/ 4 http://encceja.inep.gov.br/ 5 http://www.enem.inep.gov.br/

(Modular Object-Oriented Dynamic Learning Environment) 6 que é uma plataforma de apoio à aprendizagem online. No Moodle, é possível ministrar cursos, realizar avaliações, fornecer material, criar tópicos de discussões, entre outras funcionalidades para o ensino de um curso. Para o escopo do projeto PorSimples, utilizamos as ferramentas de avaliação (testes) da plataforma Moodle. Após a realização de um teste piloto, cuja prova possuía 3 textos e suas questões associadas, que foi realizado com funcionários da limpeza do ICMC-USP, em São Carlos, descobrimos que parte do público alvo da avaliação (adultos e analfabetos funcionais) não tem experiência e familiaridade com o computador. Além disso, a duração da prova foi muito longa para este público. Desta forma, realizar as provas no computador poderia gerar resultados indesejados e dados viciados para nossa análise. Por esses motivos, a prova está sendo aplicada em papel e possui 2 textos e questões associadas; o uso da ferramenta Moodle foi descartado para a nossa avaliação. A Seção 2, lista e detalha cada uma das tarefas desenvolvidas de 01/05/2009 a 31/10/2009. A Seção 3 relata as atividades futuras e a Seção 4 traz considerações sobre o andamento do projeto. 2. Atividades Realizadas no Período 2.1 Lista de tarefas desenvolvidas até o momento Abaixo são listadas as tarefas desenvolvidas pelo bolsista até o momento do envio deste relatório. As mesmas serão descritas pormenorizadamente abaixo: A. Criação da prova para a avaliação da compreensão, utilizando o método Cloze e questões de múltiplas escolhas; B. Aplicação da prova com 298 pessoas; C. Análise estatística da amostra utilizando a Teoria de Resposta ao Item; D. Criação de um site web para o aprimoramento da leitura por analfabetos funcionais engajados em processos de alfabetização/letramento. 2.2 Descrição detalhada das tarefas realizadas Cloze. Antes de proceder à descrição das tarefas, são apresentados conceitos da TRI e do teste Teoria de Resposta ao Item (TRI) A TRI é um modelo matemático que avalia a habilidade de um indivíduo para realizar uma determinada tarefa. Quanto maior a habilidade da pessoa nesse problema, maior é sua probabilidade de sucesso. Cada item de uma prova/avaliação tem seus parâmetros como a dificuldade e a discriminação, que consegue separar o nível de habilidade necessária para atender a tarefa. Quanto maior a dificuldade do item, maior é a habilidade necessária para se obter a resposta correta. Os modelos da TRI representam essa situação por meio da curva característica do item (CCI), que é ilustrada por um gráfico com a probabilidade de acerto em função da habilidade das pessoas que respondem o item. Os parâmetros que utilizamos em nosso modelo são listados abaixo e ilustrados na Figura 1: Parâmetro a: Discriminação do item; 6 http://moodle.org/

Parâmetro b: Dificuldade do item, definido como a habilidade necessária para um indivíduo ter 50% de probabilidade de acertar o item; Parâmetro c: Probabilidade de acerto ao acaso; Parâmetro teta: Habilidade do indivíduo. Figura 1. A curva característica do item. Através da equação da curva característica do item obtém-se uma relação entre a probabilidade de acerto (Pij(θ), probabilidade de acerto do item i pelo indivíduo j), e uma comparação entre a habilidade da pessoa e a dificuldade do item (θ bi). Nessa comparação, se o sujeito acertou o item é porque sua habilidade excedeu à dificuldade do item (θ > bi). Por outro lado, se errou, é porque sua habilidade foi inferior à dificuldade do item (θ < bi). A estimação da habilidade é feita levando em conta a probabilidade acerto e a dificuldade do item, e equilibrando a relação entre os dois, com o valor mais adequado. Um dos aspectos importantes da TRI refere-se às possibilidades de interpretação dos escores. Diferentemente dos processos da psicometria clássica, no cálculo dos escores atribui-se pesos diferentes dependendo da dificuldade dos itens, permitindo estabelecer significados mais claros sobre quais itens o sujeito terá mais chance de acertar, tornando a avaliação qualitativamente mais refinada. O Teste Cloze O teste Cloze é uma técnica para avaliar a inteligibilidade e compreensão da leitura. Seleciona-se um texto com aproximadamente 200 vocábulos que é apresentado ao leitor. Em seguida, o texto deve ser retirado e um teste contendo o mesmo texto, com algumas palavras omitidas, é fornecido. O teste consiste em retirar palavras, mantendo-se apenas a primeira e a última orações na íntegra, e o leitor deve preencher as palavras que foram retiradas do texto. Existem várias formas de se aplicar o Cloze, dentre elas se destacam: o Cloze de razão fixa, no qual se omitem as palavras em intervalos regulares (tradicionalmente 5); o Cloze racional, no qual se escolhe as palavras que se deseja omitir; o Cloze de múltipla escolha que disponibiliza opções de palavras para preencher a lacuna, que são: a resposta correta, uma resposta que é sintaticamente válida, porém sem sentido e uma que não é nem sintática nem semanticamente válida no contexto. A. Criação da prova utilizando o método Cloze e questões de múltiplas escolhas Para avaliar e comparar a compreensão de textos com e sem simplificação linguística, dois

tipos de provas com noticias de jornais e artigos de divulgação científica para crianças foram elaboradas. Uma das provas contém dois textos originais e a outra contém os mesmos textos simplificados, seguindo as operações de simplificação propostas no projeto PorSimples. Em cada uma das 2 provas, os indivíduos tinham que responder 15 ou 18 questões do tipo Cloze 7 (associadas ao primeiro texto) e 6 questões do tipo múltipla escolha (relacionadas ao segundo texto). Os textos são intitulados Feira do Livro de Ribeirão Preto é a maior do estado, retirado da prova do SARESP de 2005 da 5ª série do ensino fundamental, e Árvores por todo o Brasil - Paubrasil, selecionado da prova do SARESP de 2007 da 4ª série do ensino fundamental. A escolha dos textos foi baseada nos melhores parâmetros estimados da TRI das provas dos anos de 2005 e 2007 do SARESP. Embora os textos das provas sejam sintática e lexicalmente diferentes, com textos originais e simplificados, as 6 questões de múltipla escolha são as mesmas para ambas as provas e as questões do Cloze são diferentes, pois adotamos a técnica Cloze de múltiplas escolhas com razão fixa de 10 palavras. Cada avaliação era formada pela prova com 2 textos e ao final respondia-se um questionário sócio-econômico com 14 perguntas. As provas foram realizadas no período de 30 minutos a 1 hora, dependendo da habilidade do avaliando. A amostra será constituída de 600 indivíduos, mas, até o presente momento, foram realizadas 298 avaliações com funcionários da limpeza da USP São Carlos, alunos de 4ª a 8ª séries do Projeto Pequeno Cidadão do mesmo campus e alunos de 5ª serie de uma escola pública da cidade de Barra do Turvo/SP. Desta forma, este artigo apresenta uma análise parcial, com 50% da amostra pretendida, para avaliação em larga escala da tarefa de simplificação linguística do PorSimples. Todas as avaliações em São Carlos foram realizadas por uma pesquisadora do PorSimples (Profa Sandra Aluísio ou Profa Graça Nunes) e por mim; na cidade de Barra do Turvo a avaliação foi aplicada pelo prof. de Português das turmas. Na prova com os textos originais, o teste Cloze gerou um total de 15 lacunas a serem preenchidas, e 18 lacunas na prova simplificada (Tabela 1). A 5ª Feira Nacional do Livro de Ribeirão Preto, que começa hoje e vai até o dia 18, deverá reunir cerca de 300 escritores no centro do município do interior paulista. O evento é um dos maiores do País e (atinge / foge / a) meta da organização é repetir os números de 2004: (corrida / cerca / nenhum) de 290 mil visitantes e venda de 342 mil (livros / reais / foram). Como neste ano São Paulo não teve a (primeira / chance / sua) Bienal Internacional, a feira de Ribeirão Preto, uma das maiores (do / pelo / todo) mundo a céu aberto, torna-se a maior do Estado. (Mais / Um / Foi) dos destaques deste ano é a presença da (emissora / escritora / pouca) Nélida Piñon, a primeira brasileira a ganhar o Prêmio Príncipe (das / pela / menos) Astúrias das Letras. Ela estará no Salão de Idéias (criativas / dia / no) domingo, dia 11, às 19 horas, no Anfiteatro da (esquina / Biblioteca /Museu) Padre Euclides. A 5ª Feira Nacional do Livro de Ribeirão Preto deverá reunir cerca de 300 escritores no centro da cidade. A feira começa hoje e vai até o dia (anterior / 18 / primavera). O evento é um dos maiores do país. A (meta / vantagem /falhas) da organização é repetir os números de 2004: cerca (daqueles / quase / de) 290 mil visitantes e venda de 342 mil livros. (Próximo / Neste / Qual) ano, São Paulo não teve sua Bienal Internacional. Neste (lugar / 2003 / ano), a feira de Ribeirão Preto torna-se a maior do (Estado / Salão / planetas). A feira de Ribeirão Preto é uma das maiores (cujo / com / do) mundo a céu aberto. Um dos destaques deste ano (é / elogia / com) a presença da escritora Nélida Piñon. Nélida Piñon é (bonita / a / uma) primeira brasileira a ganhar o Prêmio Príncipe das Astúrias (com / muitas / das) Letras. Ela estará no Salão de Idéias no domingo, (às / dia / R$) 11, às 19 horas. O Salão de Idéias fica no (Anfiteatro / Quarto / Livros) da Biblioteca Padre Euclides. Tabela 1. Trechos de mesmo conteúdo do teste Cloze da prova com texto original (coluna 1) contendo 5 orações e da 7 O número de questões do Cloze variou, pois os textos simplificados contém sentenças mais curtas, porém extensão maior.

prova com texto simplificado (coluna 2) contendo 11 orações. B. Aplicação da prova para 298 pessoas Dos 298 avaliados, 17,93% estudaram até a 4ª série, 55,17% até a 5ª série, e 24,69% pararam de estudar entre a 6ª série e 8ª série. O público alvo consiste de analfabetos funcionais do nível rudimentar e básico, crianças em processo de letramento, e crianças com problemas de leitura, dado que a escola pública da cidade de Barra do Turvo/SP foi escolhida, pois obteve o menor índice IDEB do estado de São Paulo e os alunos do Pequeno Cidadão vêm de escolas públicas da periferia de São Carlos, que apresentam alto índice de repetência. As provas foram realizadas em 3 grupos, sendo 37 participantes funcionários da limpeza da USP São Carlos, 121 do projeto Pequeno Cidadão e 130 alunos de uma escola pública da cidade Barra do Turvo. C. Análise estatística da amostra utilizando a Teoria de Resposta ao Item Para cada indivíduo, calcula-se a proporção de itens respondidos corretamente. Espera-se que, caso a simplificação ajude na compreensão textual, o percentual de acerto seja maior entre indivíduos que realizaram a prova com os textos simplificados do que entre aqueles que as realizaram com os textos originais. A proporção de acertos, no entanto, não depende apenas da habilidade do leitor, mas também dos itens respondidos, logo não se pode fazer uma equivalência de notas. No caso, não se pode comparar com a psicometria clássica os resultados da prova original com a prova simplificada, pois elas não são diretamente comparáveis. Para poder-se comparar o desempenho nas duas provas, o modelo logístico unidimensional de 3 parâmetros (ML3) da TRI foi adotado para a análise dos dados: com: (i) i = 1, 2,..., I indexando os itens da prova, (ii) j = 1, 2,..., n indivíduos que responderam aos itens, (iii) Xij representando uma variável dicotômica que assume o valor 1 quando o indivíduo j responde corretamente o item i e 0 em caso contrário, (iv) θ j denotando o nível de habilidade (de leitura) do j-ésimo indivíduo, (v) bi indicando o parâmetro de dificuldade do item i, (vi) ai representando a inclinação da função no ponto em que a habilidade é igual a bi, definido como parâmetro de discriminação do item i, (vii) ci o parâmetro do item que representa a probabilidade de indivíduos com baixo nível de habilidade de leitura responderem corretamente ao item i e (viii) D sendo um fator de escala que pode assumir os valores 1 ou 1,7. Quando D é igual a 1,7, a função logística fornece resultados semelhantes ao da função ogiva normal [10]. Foram consideradas seis populações de indivíduos: três delas que responde a prova com os textos originais dos locais avaliados e as outras três que respondem a prova com os textos simplificados. O método bayesiano marginal foi utilizado para estimação dos parâmetros de itens e o bayesiano [11] pela esperança a posteriori, para as habilidades (de leitura) dos indivíduos. O software Multilog [12] foi adotado para a obtenção das estimativas dos parâmetros de itens e indivíduos. Toda a avaliação estatística foi conduzida pela colaboradora do PorSimples Profa.

Mariana Curi, estatística do ICMC-USP, e o design da prova, pilotos e as interpretações e ajustes foram decididos em reuniões semanais comigo e com a minha orientadora. As estimativas do parâmetros de acerto casual (c) variaram de 0,10 a 0,29 com erros padrão de 0,03 a 0,10. Todos os itens apresentaram valores estimados do parâmetro de discriminação adequados, varando de 0,8 a 3,3. Os erros padrão associados às estimativas mais elevadas do parâmetro a apresentam-se muito altos, da ordem de 1,1, aproximadamente. Tal problema deve melhorar com o aumento do tamanho amostral para o pretendido, de 600 indivíduos. A estrutura da prova gerou itens com as classes gramaticais no teste Cloze apresentadas na Tabela 2. Questão Original Simplificado 1 Artigo Numeral 2 Advérbio Substantivo 3 Substantivo Preposição 4 Pronome Pronome 5 Preposição Substantivo 6 Artigo Substantivo 7 Substantivo Preposição 8 Preposição Verbo 9 Preposição Artigo 10 Substantivo Preposição 11 Substantivo Substantivo 12 Numeral Substantivo 13 Artigo Substantivo 14 Conjunção Preposição 15 Preposição Conjunção 16 Substantivo 17 Preposição 18 Verbo Tabela 2. Classes gramaticais das lacunas das provas original e simplificada As proporções de acerto em cada item da prova está ilustrada na Figura 2.

Cloze Original Cloze Simplificado ME Original proporção de acerto dos itens (entre respondentes) 1,0 0,8 0,6 0,4 0,2 0,0 3 - substantivo 11- substantivo 2 - advérbio 7 - substantivo 10 - substantivo 5 - preposição 13 - artigo 15 - preposição 12 - numeral 9 - preposição 6 - artigo 8 - preposição 14 - conjunção 1- Artigo 4 - Pronome 13 - substantivo 1- numeral 16 - substantivo 4 - pronome 17 - preposição 6 - substantivo 7 - preposição 18 - verbo 5 - substantivo 3 - preposição 9 - artigo 14 - preposição 12 - substantivo 2 - substantivo 15 - conjunção 10 - preposição 8 - verbo 11- substantivo 2 1 3 4 6 5 ME Simplificado 2 4 1 3 6 5 Figura 2: Proporção de acerto dos itens. (ME se refere as questões de múltiplas escolhas) Os valores obtidos para os estimadores dos parâmetros de dificuldade (b) e discriminação (a) encontram-se representados na Figura 3 e na Figura 4, respectivamente. Pode-se observar que as duas provas obtiveram itens com uma dificuldade baixa no teste Cloze, e que a prova simplificada gerou itens mais fáceis que a original. 2,5 2,0 11 - substantivo Cloze Original Cloze Simplificado Múltipla Escolha 1,5 5 1,0 4 - pronome b estimado 0,5 0,0-0,5 8 - preposição 13 - artigo 12 - numeral 1- artigo 14 - conjunção 6 - artigo 9 - preposição 5 - preposição 8 - verbo 2 - substantivo 10 - preposição 15 - conjunção 12 - substantivo 5 - substantivo 9 - artigo 14 - preposição 3 - preposição 4 6 3 1-1,0-1,5-2,0 15 - preposição 7 - substantivo 10 - substantivo 11- substantivo 2 - advérbio 3 - substantivo 18 - verbo 6 - substantivo 7 - preposição 17 - preposição 4 - pronome 16 - substantivo 13 - substantivo 1- numeral 2 Figura 3: Dificuldade dos itens

3,5 Cloze Original Cloze Simplificado 3,0 14 - conjunção 13 - artigo Múltipla Escolha 2,5 2 - advérbio 17 - preposição 18 - verbo a estimado 2,0 1,5 1,0 12 - numeral 7 - substantivo 3 - substantivo 8 - preposição 5 - preposição 6 - artigo 9 - preposição 11- substantivo 15 - preposição 1- artigo 4 - pronome 10 - substantivo 13 - substantivo 3 - preposição 7 - preposição 2 - substantivo 12 - substantivo 10 - preposição 14 - preposição 5 - substantivo 9 - artigo 6 - substantivo 8 verbo 16 - substantivo 4 - pronome 15 - conjunção 1- numeral 3 2 4 1 5 6 11- substantivo 0,5 0,0 Figura 4: Discriminação dos itens Para interpretar o resultado do teste Cloze, existem modelos da área de psicometria clássica que avalia o valor dos escores obtidos pela soma das lacunas preenchidas corretamente. O nível de frustração, com até 44% de acerto, significa que o leitor obteve pouco êxito na compreensão da leitura, o nível instrucional, com 44% a 57% de acerto, indica que a compreensão do leitor é suficiente, mas necessita de algum auxílio e o nível independente, com mais de 57% de acerto mostra que o leitor tem autonomia na sua leitura [10]. Pode-se verificar os níveis obtidos nas provas aplicadas até então (Figura 5). Figura 5: Nível de compreensão da leitura Para a avaliação, os itens não respondidos (missing) foram considerados como itens não

apresentados, ou seja, a proporção de acertos é calculada levando-se em conta apenas os itens respondidos. Podemos verificar na Figura 6, a proporção de acerto na prova e a habilidade do indivíduo. Alguns outliers são identificados devido à modelagem utilizada de missing como item não apresentado. 2,0 1,5 1,0 0,5 habilidade estimada 0,0-0,5-1,0-1,5-2,0 0 10 20 30 40 50 60 70 80 90 100-2,5-3,0 % acerto na prova Figura 6: Gráfico da habilidade pela porcentagem de aceto na prova r = 0,91 Original Simplificada A proporção de acertos das provas e as habilidades (theta) com seus respectivos desvios padrões podem ser verificadas na Tabela 3. Para os indivíduos de Barra do Turvo, as médias das habilidades nas provas original e simplificada não diferiram significativamente. O mesmo concluise para os indivíduos do projeto Pequeno Cidadão. Já para os funcionários da USP, as habilidades médias da prova simplificada foram maiores do que as da prova original, indicando que a simplificação facilitou a compreensão do texto. Essa situação é ilustrada na Figura 7. Origem Prova % de acerto Theta Desvio Padrão Barra do Turvo Original 71,4 0,00 1,00 Barra do Turbo Simplificada 68,4-0,36 1,07 Pequeno Cidadão Original 70,8 0,10 1,10 Pequeno Cidadão Simplificada 74,2 0,11 1,04 USP funcionários Original 55,5-1,39 1,07 USP funcionários Simplificada 69,1-0,50 1,31 Tabela 3: Proporção de acerto na prova, habilidade média e seu respectivo desvio padrão de cada grupo.

Figura 7: Gráfico das habilidades +- desvio padrão de cada grupo. Para os indivíduos de Barra do Turvo, as médias das habilidades nas provas original e simplificada não diferiram significativamente. O mesmo conclui-se para os indivíduos do projeto Pequeno Cidadão. Já para os funcionários da USP, as habilidades médias da prova simplificada foram maiores do que as da prova original, indicando que a simplificação facilitou a compreensão do texto. D. Criação de uma página web para o aprimoramento da leitura por analfabetos funcionais Como forma de divulgação do trabalho realizado no PorSimples (as operações de simplificações, o córpus de textos simplificados manualmente e as ferramentas SIMPLIFICA e FACILITA) [13] uma página web será criada com o intuito de ajudar adultos, que sejam analfabetos funcionais, com a leitura simplificada e facilitada. A página mostrará uma coletânea de textos, com as opções de leitura do texto original, simplificado natural, simplificado forte, sumarizado e uma opção de escutar o áudio do texto, seguindo o modelo do site Literacy Works 8 para a língua inglesa. Esse projeto está em fase de modelagem e estará sendo detalhado no próximo período. 2.3 Participação em seminários e submissão de artigos No período a que se refere este relatório foi realizado um seminário pelos participantes do projeto PorSimples, do qual falaram de suas experiências e trabalhos no projeto. O seminário promove um conhecimento entre os pesquisadores do projeto, facilitando a comunicação de conhecimentos e ferramentas. O seminário apresentado por mim encontra-se em http://caravelas.icmc.usp.br/wiki/images/9/9f/porsimples_rafael_reuniao_2009.pdf Durante este período também foi submetido um artigo ao 1 Congresso Brasileiro de Teoria de Resposta ao Item (I CONBRATRI) 9, que será realizado em 9 a 11 de dezembro de 2009 em Florianópolis, com título Avaliação da Simplificação Textual Através da Teoria de Resposta ao Item, e escrito por Mariana Curi, Rafael Tanizawa, Sandra Aluisio. 8 http://literacyworks.org/ 9 http://201.76.53.8:8180/conbratri/

3. Atividades Futuras Para o próximo período serão realizadas as avaliações e a análise estatística restantes para completar com objetivo inicial de 600 avaliados, visando apenas adultos com o perfil do analfabeto funcional nestas avaliações devido à tendência que identificamos na análise parcial dos dados. A criação do site de aprendizado para adultos seguirá para sua fase de implementação no próximo período. 4. Considerações Finais A análise estatística nos mostra um indicativo de que a simplificação realmente ajuda nos aspectos de compreensão do leitor analfabeto funcional. Para garantir a confiabilidade aos dados e podermos concluir algo sobre os efeitos que a simplificação causa no leitor de forma coerente o projeto seguirá para a fase final com 600 participantes. Referências Bibliográficas [1] Klebanov, B.; Knight, K.; Marcu, D. Text Simplification for Information-Seeking Applications. Lecture Notes in Computer Science, V. 3290, Springer-Verlag. 2004. p. 735-747. [2] Aluísio, S., Specia, L., Pardo, T., Maziero, E., Fortes, R. (2008) Towards Brazilian Portuguese Automatic Text Simplification Systems, In the Proceedings of The Eight ACM Symposium on Document Engineering (DocEng 2008), p. 240-248. [3] CANDIDO JR., A. MAZIERO, E. GASPERIN, C. PARDO, T., SPECIA, L. and ALUISIO, S. (2009). Supporting the Adaptation of Texts for Poor Literacy Readers: a Text Simplification Editor for Brazilian Portuguese. In: Proceedings of the NAACL HLT Workshop on Innovative Use of NLP for Building Educational Applications, pages 34 42, Boulder, Colorado, June 2009. [4] INAF (2007). Resultados do Inaf Habilidades de leitura e matemática, 2007. Disponível em http://nsae.acaoeducativa.org.br/portal/images/stories/pdfs/inafresultados2007.pdf [5] Max, A.Writing for language-impaired readers. In the Proceedings of CICLing, 2006. p. 567-570. [6] Margarido, P.; Pardo, T.; Antonio, G.; Fuentes, V.; Aires R.; Aluísio, S.; Fortes, R. Automatic Summarization for Text Simplification: Improving Text Comprehension by Functional Illiteracy Readers. Publicado nos Proceedings Online do TIL 2008. Disponível em: http://nilc.icmc.usp.br/til/til2008/anais.htm [7] URANO, K. Lexical Simplification and Elaboration: A Pilot Study on Sentence Comprehension and Incidental Vocabulary Acquisition. Disponível em http://www2.hawaii.edu/~urano/research/esl672.html. 1998. [8] Stefan Martins e Lucia Filgueiras. Métodos de Avaliação de Apreensibilidade das Informações Textuais: uma Aplicação em Sítios de Governo Eletrônico. Publicado nos Anais do CLIHC 2007. Disponível em http://clihc.org/2007/program.html. [9] Hambleton, R.K., Swaminathan, H. and Rogers, H.J. (1991). Fundamentals of item

response theory, Sage Publications, London. [10] Acácia A. Angeli dos Santos; Ricardo Primi; Fernanda de O. S. Taxa; Claudette M. M. Vendramini. O teste de Cloze na avaliação da compreensão em leitura. In: Psicol. Reflex. Crit. Vol.15 no.3 Porto Alegre 2002. [11] Baker, F.B., Kim, S. (2004). Item response theory - parameter estimation techniques, Marcel Dekker Inc, New York, 2nd edition. [12] Multilog (2003). IRT from SSI: Multilog Scientific Software International (SSI). SSI, Lincolnwood. [13] Arnaldo Candido Jr., Erick Maziero, Caroline Gasperin, Thiago A. S. Pardo, Lucia Specia, and Sandra M. Aluisio (2009). Supporting the Adaptation of Texts for Poor Literacy Readers: a Text Simplification Editor for Brazilian Portuguese. In: Proceedings of the NAACL HLT Workshop on Innovative Use of NLP for Building Educational Applications, pages 34 42. -------------------------------------- Rafael Tanizawa -------------------------------------- Sandra Aluísio