PAINEL DE DISCUSSÃO 4: COMPARABILIDADE ENTRE AVALIAÇÕES. Ruben Klein (Fundação Cesgranrio)

Documentos relacionados
Teorias de Avaliação - CE095

Teorias de Avaliação - CE095

Teorias de Avaliação - CE095

Oficina de Apropriação de Resultados para Professores PAEBES Geografia

Cerca de um quarto da prova será fácil, dois quartos terão grau

ANÁLISES ESTATÍSTICAS TRI. CAEd/UFJF (32)

O CAEd está organizado em cinco unidades:

Palavras-chave: Teoria de Resposta ao Item; ENEM; Avaliação na Educação

Teorias de Avaliação - CE095

A Avaliação Nacional da Alfabetização: compreendendo os resultados. André Jalles

AVALIA MACEIÓ Oficina de Apropriação de Resultados

Metodologia: TCT e TRI Matriz de Referência e Descritores Escala de Proficiência Intepretação Pedagógica de Resultados

Oficina de Apropriação de Resultados para Professores PAEBES Matemática

A AVALIAÇÃO EM MATEMÁTICA DO SAETHE GLAUKER AMORIM

Oficina de Apropriação de Resultados para Professores PAEBES Língua Portuguesa

Apresentação Prof. Hugo Gomes

SisPAE 2015 BREVES METODOLOGIA E PROCEDIMENTOS OFICINA DE DIVULGAÇÃO DE RESULTADOS DO SISPAE 2015

MINISTÉRIO DA EDUCAÇÃO INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA SAEB PRIMEIROS RESULTADOS:

Reestruturação do Exame Nacional do Ensino Médio - Enem

MINISTÉRIO DA EDUCAÇÃO INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA DIRETORIA DE AVALIAÇÃO DA EDUCAÇÃO BÁSICA DAEB

Avaliação aliada ao processo de ensino-aprendizagem.

ESTATÍSTICA EXPERIMENTAL. ANOVA. Aula 05

Processo de Composição da Prova SARESP do 5º EF de Matemática

Aula 3. Introduçao à TRI

Avaliaçõe s em Larga Escala O que elas nos ensinam sobre o Ensino de Física

ANASEM AVALIAÇÃO NACIONAL SERIADA DOS ESTUDANTES DE MEDICINA. Professora Doutora Maria Inês Fini Presidente do Inep. Brasília-DF Agosto 2017

GUIA DEFINITIVO DA TRI PARA EDUCADORES ENTENDA A METODOLOGIA DE CORREÇÃO DO ENEM

manual sobre a atribuicao de notas em provas de multipla escolha utilizando a CGOE TEORIA DA RESPOSTA AO ITEM (TRI)

Avaliações Educacionais e o Ensino de Ciências e Matemática: o Enem: avaliação do desempenho dos estudantes em Ciências da Natureza

Oficina de Apropriação de Resultados Professores SPAECE 2014

Análise estatística do desempenho dos inscritos no ENEM em Campinas- SP: áreas CN, CH, LC e MT dos anos

9 Uma Análise Comparativa: TCT, TRI e TRIN

OFICINA DE DIVULGAÇÃO E APROPRIAÇÃO RESULTADOS SAETHE

Use of Item Response Theory at the Brazilian Assessment System for Basic Education

Estatística Indutiva

2 Avaliação das diferentes abordagens para a associação entre itens e níveis ou pontos de uma escala de proficiência

A Teoria de Resposta ao Item (TRI) e sua aplicação ao ENEM Mauro Luiz Rabelo Decano de Ensino de Graduação Universidade de Brasília

TRANSFORMAÇÕES. 1 Tornar comparáveis descritores medidos em diferentes unidades

3 Teoria da Resposta ao Item (TRI) 3.1 Introdução

Valéria de Souza. -Set Slide 1. Set. 2010

Comparações entre a Teoria de Resposta ao Item e a Teoria Clássica de Medidas para Banco de Itens Simulados

Oficina de Apropriação de Resultados Professores SPAECE 2014

Estimação de Variáveis Instrumentais e Mínimos Quadrados de Dois Estágios. Wooldridge, Cápítulo 15

ANÁLISE DE ITENS DE UMA PROVA DE RACIOCÍNIO PROBABILÍSTICO

TEORIA DA RESPOSTA AO ITEM (TRI): ESTIMAÇÃO BAYESIANA DA HABILIDADE DE INDIVÍDUOS

Um Modelo Inteligente para Seleção de Itens em Testes Adaptativos Computadorizados

Modelos Bayesianos. Ernesto F. L. Amaral Magna M. Inácio

MINISTÉRIO DA EDUCAÇÃO INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA

A TRI e as proficiências

OFICINA DE DIVULGAÇÃO E APR OPR IAÇÃO DE R E S ULTADOS SAERS 20 16

Boletim da Escola CEI. MARILIA / MARILIA Coordenadoria: O SARESP Escola Estadual ANTONIO DEVISATE ETE Diretoria de Ensino / Município:

MÉTODOS DE CALIBRAÇÃO

UNIVERSIDADE FEDERAL DE MINAS GERAIS FACULDADE DE FILOSOFIA E CIÊNCIAS HUMANAS DEPARTAMENTO DE CIÊNCIA POLÍTICA CURSO DE GESTÃO PÚBLICA

CALIBRAÇÃO DE ITENS DO VESTIBULAR NA ESCALA DO ENEM

2 Origem dos dados: Estudo longitudinal da geração escolar 2005 GERES 2.1 Definição e metodologia

Cadernos fgv projetos Nº 25: Concursos Públicos, avaliações e certificações

QUI 154/150 Química Analítica V Análise Instrumental. Aula 1 Estatística (parte 1)

MANUAL SOBRE A CONSTRUÇÃO DA NOTA POR TEORIA DA RESPOSTA AO ITEM (TRI)

Bioestatística e Computação I

PROJETO. Geekie - Caxias do Sul RGE - Governo do Estado do Rio Grande do Sul - Prefeitura de Caxias do Sul - Geekie

Trabalho de Conclusão de Curso APLICATIVO WEB SHINY PARA MODELOS DICOTÔMICOS DA TRI USANDO O PACOTE LTM DO R ANGELA MARIA DA SILVA

OFICINA DE APROPRIAÇÃO DE RESULTADOS 2011

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Modelos Estatísticos para detecção de fraudes e aplicações

JUSCELIA DIAS MENDONÇA ANÁLISE DA EFICIÊNCIA DE ESTIMAÇÃO DE PARÂMETROS DA TRI PELO SOFTWARE ICL

MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL

Comparação da Teoria Clássica dos Testes com a Teoria de Resposta ao Item aplicado ao subteste Semelhanças da WASI

IV CONBRATRI, 4º Congresso Brasileiro de Teoria da Resposta ao Item, Brasília, DF, 2-4 de Dezembro de 2015

AULA 03 Estimativas e tamanhos amostrais

Oficina de Apropriação de Resultados Gestores. SPAECE e SPAECE ALFA 2014

Diretoria de Ciências Exatas. Laboratório de Física. Roteiro 01. Física Geral e Experimental III 2012/1. Experimento: Calibração de um Termômetro

Inferência Estatística: Conceitos Básicos II

ATUALIZAÇÃO DE NORMAS DO RAVEN AVANÇADO: DISCUSSÃO DE MODELOS NORMATIVOS E DESENVOLVIMENTO DO MODELO PONDERADO DE NORMATIZAÇÃO DE ESCORES VIA TRI

NBC TA 520 Procedimentos analíticos

Licenciatura em Ciências Biológicas Universidade Federal de Goiás. Bioestatística. Prof. Thiago Rangel - Dep. Ecologia ICB

Oficina de Apropriação de Resultados Professores PAEBES 2015

4 Metodologia. 1 Recordemos que o Geres é um estudo longitudinal que avalia alunos em Leitura e Matemática do

Inferência Estatistica

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

Prova Brasil, Saresp etc. Heliton Ribeiro Tavares

Tratamento de dados e representação das incertezas em resultados experimentais

Governador de Pernambuco Paulo Câmara. Vice-governador de Pernambuco Raul Henry. Secretário de Educação Frederico Amancio

Bioestatística e Computação I

OFICINA DE APROPRIAÇÃO DE RESULTADOS 2011

Denis da Silva Paranhos PROCESSO DE INCORPORAÇÃO DE ITENS NA ESCALA DO SAEB PARA A CRIAÇÃO DE UM BANCO DE ITENS

Nome: Turma: Data: / /

Delineamento e Análise Experimental Aula 4

RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO

Mais Informações sobre Itens do Relatório

COS767 - Modelagem e Análise Aula 3 - Simulação

AULA 1 - Modelos determinísticos vs Probabiĺısticos

FÍSICA EXPERIMENTAL C ( )

SAEB / Prova Brasil Metodologia, Estratégias e Resultados Matrizes, Itens, Escala e Materiais

PMR2560 ELEMENTOS DE ROBÓTICA 2016 TRABALHO DE VISÃO COMPUTACIONAL CALIBRAÇÃO DE CÂMERAS E VISÃO ESTÉREO

UNIVERSIDADE FEDERAL DO CEARÁ COORDENADORIA DE CONCURSOS CCV

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

GOVERNADOR DE ALAGOAS José Renan Calheiros Filho. SECRETÁRIO DE ESTADO DA EDUCAÇÃO José Luciano Barbosa da Silva

Transcrição:

PAINEL DE DISCUSSÃO 4: COMPARABILIDADE ENTRE AVALIAÇÕES Ruben Klein (Fundação Cesgranrio)

Necessidade de comparabilidade e de fazer julgamento. Diferença entre avaliação de sala de aula e avaliação externa.

Em uma escola, duas turmas de uma mesma série. Provas no mesmo dia. Provas diferentes não são comparáveis. A prova precisa ser a mesma. Não importa se o professor é o mesmo ou não. Na escala do percentual de acerto, a variação é sempre de 0 a 10 ou de 0 a 100. Mas uma turma pode ter uma média de 7 em uma prova fácil e outra turma ter um média de 4 em outra prova difícil. Qual é a melhor turma? Não sabemos.

Com a Teoria Clássica dos Testes (TCT) não é possível aplicar diferentes testes em populações distintas garantindo a comparabilidade É preciso usar a Teoria de Resposta ao Item (TRI)

A TRI modela a probabilidade de resposta ao item em função da proficiência do aluno, uma variável latente (não observável), e de parâmetros (características) do item. As escalas de proficiências são obtidas a partir da calibração dos itens de teste através do modelo da TRI. Em geral, o modelo utilizado é o modelo logístico. No Saeb e no ENEM utiliza-se o modelo de 3 parâmetros, a dificuldade (posição), a discriminação (inclinação da curva) e o a probabilidade de um aluno de baixa habilidade acertar o item (acerto casual).

Calibrar um item de teste significa identificar seus parâmetros, sendo uma das propriedades importantes da TRI o fato dos parâmetros dos itens e as proficiências dos indivíduos serem invariantes. Isso quer dizer que se calibramos o mesmo teste em duas populações diferentes, podemos ir de uma calibração para outra por meio de uma transformação linear como no caso de graus centígrados para graus Fahrenheit. Na TRI, a proficiência e o parâmetro de dificuldade (posição) do item estão na mesma escala.

Banco de itens calibrado na escala. Itens que meçam as habilidades descritas na matriz de referência. Parâmetros de dificuldade distribuídos em um largo espectro da escala de proficiência. A partir desse banco pode-se extrair diferentes testes para a mesma população e para populações diferentes e cujos resultados estarão na mesma escala.

É importante que esse teste meça as diversas habilidades relativas a essa população e que seja adequado para ela, isso é, que contenha informação na região onde se encontra a distribuição de proficiência da população. O conceito de informação de um teste é um conceito estatístico relacionado à precisão da medida da proficiência.

A TRI apresenta a propriedade que a informação do teste é a soma das informações dos itens (um item é um teste com somente um item). Como toda informação é positiva, a informação do teste aumenta com o número de itens e consequentemente o erro padrão da estimativa de decresce. Ao contrário da TCT, o erro padrão da estimativa de proficiência depende da proficiência e sabese também o que acontece com a informação do teste na substituição ou acréscimo de itens.

Itens muito fáceis ou muito difíceis para um aluno fornecem pouca informação para a estimativa de sua proficiência. Itens com parâmetro de dificuldade b próximos da proficiência do aluno fornecem mais informação. O aumento do parâmetro c diminui a informação do item, pois aumenta a chance do acerto casual. Esse resultado permite construir testes adaptados a populações diferentes, desde que se tenha informações a priori sobre a população e se tenha um banco de itens calibrados. É desejável um teste que tenha informação alta em uma boa extensão.

Na prática, para ter testes mais comparáveis para uma mesma população, é preciso ter testes com curvas de informação semelhantes. É preciso calibrar os itens. Pode ser feito no próprio teste ou em pré-testes em populações adequadas. Dada uma escala, em geral, para calibrarmos novos itens nessa escala, precisamos utilizar itens já calibrados (parâmetros conhecidos) no teste ou pré-teste.

Para isso é preciso ter itens não divulgados no banco de itens. É por isso que o SAEB não pode divulgar todos os itens. A TRI tem duas hipóteses que precisam ser verificadas. A uni-dimensionalidade e a independência condicional. Há várias maneiras de se estimar a proficiência e é preciso se estimar sempre da mesma maneira.

Comportamento diferencial do item. O item tem que ter o mesmo comportamento para as diferentes populações. Interpretação da escala.

Para haver comparação precisa haver planejamento e garantir que as condições necessárias sejam satisfeitas. A testagem deve ser feita na mesma época do ano e garantir a presença dos alunos. Decisões sobre quais itens divulgar e quais manter sigilosos para serem usados na calibração de novos itens, na mesma escala.

Itens devem ser pré-testados, preferencialmente em uma amostra com características semelhantes a da população alvo. Todos os itens vêm de um banco calibrado ou ter itens comuns já calibrados no novo teste, para calibrar novos itens na mesma escala. Procedimentos de testagem padronizados Etc.

A qualidade do banco vai depender da calibração se seus itens. Depende do planejamento para efetuar a calibração de itens novos. Que itens comuns devem ser utilizados, a quantidade de itens comuns, a população na qual os itens serão testados, etc.

Desafio: mudança de maneira de avaliar. Testes computadorizados: lineares e adaptativos. Lineares: testes iguais para todos. Mais parecidos com os tradicionais. Adaptativos. Permite escolher itens adequados ao aluno. Aumenta a precisão de sua proficiência. Testes computadorizados permitem a introdução de novos tipos de itens. Pode ser necessária a introdução de novas escalas.

Avaliações estaduais. Colocar na escala SAEB. Grande conquista. Cuidado no planejamento dos testes. Complementaridade com o SAEB. Padronização do nível (ponto da escala) considerado adequado.