PISA 2015 da Avaliação papel-e-lápis à Avaliação em Computador. João Marôco, Ph. D.



Documentos relacionados
O Desafio do PISA 2015

Melhorando a aprendizagem com dados e análise: a experiência da Austrália

Avaliação da Educação Básica. Saeb/Prova Brasil e Ideb

Teorias de Avaliação - CE095

Pisa 2012: O que os dados dizem sobre o Brasil

1. Conceitos Básicos de Avaliação de Projetos 2. Classificação dos Projetos de Investimento 3. Estudos prévios

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

PLANO DE ENSINO. Mestrado em Matemática - Área de Concentração em Estatística

Projeto Supervisionado

PLANEJAMENTO E CONTROLE DE VENDAS

Avaliação da Educação Básica no Brasil. Avaliação Educacional no Brasil Década de 90. Questões Básicas

Vinicius Ribeiro Pereira. Métodos Alternativos no Critério Brasil para Construção de Indicadores Sócio-Econômico: Teoria da Resposta ao Item

Plano de Melhoria. Biénio 2013/2015

AGRUPAMENTO DE ESCOLAS DR. VIEIRA DE CARVALHO

Cursos Cientifico- Humanisticos do Ensino Secundario. Colégio da Rainha Santa Isabel Serviço de Psicologia e Orientação

AGENDA DIÁRIA. Horário Componente Curricular Conteúdo Observação. Atividade caderno Leitura e interpretação de imagens. Trazer a gramática (amanhã).

Engenharia de Software

Geografia COTAÇÕES GRUPO I GRUPO II GRUPO III GRUPO IV. Teste Intermédio de Geografia. Teste Intermédio. Duração do Teste: 90 minutos

Dias 12 e 13 de fevereiro de 2014 João Pessoa - Paraíba

II Congresso Internacional de Educação Cientifica e Tecnológica Santo Ângelo 2012

Evolução numérica do seguro de transportes Francisco Galiza Maio/2007

Cursos Científico- humanísticos do Ensino Secundário. Colégio da Rainha Santa Isabel Serviço de Psicologia e Orientação Ana Isabel Athayde, 2014

PL 8035/2010 UMA POLÍTICA DE ESTADO. Plano Nacional de Educação 2011/2020. Maria de Fátima Bezerra. Deputada Federal PT/RN

Centros para a Qualificação e o Ensino Profissional (CQEP) Estrutura, competências e objetivos

RELATÓRIO FINAL DE AUTOAVALIAÇÃO

Programa de Licenciaturas Internacionais CAPES/ Universidade de Lisboa

Estatística I Aula 1. Prof.: Patricia Maria Bortolon, D. Sc.

NECESSIDADES DE PREVISÃO DA CADEIA DE SUPRIMENTOS. Mayara Condé Rocha Murça TRA-53 Logística e Transportes

Inteligência Computacional: resolvendo problemas difíceis da vida real

Programa Binacional Centros Associados de Pós-graduação Brasil/Argentina - (CAPG/BA) Edital CGCI n. /2008

MATRIZ CURRICULAR CURRICULO PLENO 1.ª SÉRIE CÓDIGO DISCIPLINAS TEOR PRÁT CHA PRÉ-REQUISITO

PAINEL I O crédito doméstico em 2009 dentro do cenário pós crise

Avaliação Interna e Qualidade das Aprendizagens

PLANIFICAÇÃO ANUAL. MACS Matemática Aplicada às Ciências Sociais. Curso de Línguas e Humanidades 2º ANO (11º ANO)

Modelos. O que, por que, quando, qual e como

Aula 04 Método de Monte Carlo aplicado a análise de incertezas. Aula 04 Prof. Valner Brusamarello

O Quadro Nacional de Qualificações e a sua articulação com o Quadro Europeu de Qualificações

Programa CAPES/BRAFITEC. Brasil/França Ingénieur Technologie. Edital CGCI n. 022/2007

Programa de Estudo / Currículo

INVESTIMENTOS NA INDÚSTRIA

NCE/11/01851 Relatório final da CAE - Novo ciclo de estudos

Um modelo de TRI para dados do vestibular da Universidade Federal de Uberlândia

Fórum Crédito e Educação Financeira 25 de Janeiro de António de Sousa

18) MATRIZ CURRICULAR DO CURSO DE GRADUAÇÃO EM PEDAGOGIA LICENCIATURA

PROGRAMA: A FAMÍLIA (1º ano do 1º ciclo)

CRITÉRIOS DE AVALIAÇÃO

Indicadores de transferência e de abandono no ensino superior português

Professor Severino Domingos Júnior Disciplina: Gestão de Compras e Estoques no Varejo

EVENTOS EM POPULAÇÕES DESENHOS DE ESTUDO PARA AVALIAÇÃO DE INTERVENÇÕES EM DOENÇAS TRANSMISSÍVEIS IMPLICAÇÕES DA DEPENDÊNCIA ENTRE EVENTOS

Investigação experimental

Programa UNIBRAL Edital CGCI n. 014 /2007

O investimento público em educação tem aumentado fortemente desde 2000 e é agora um dos mais altos entre os países da OCDE e países parceiros.

Regulamento do NNIES Ninho de Novas Iniciativas Empresariais de Setúbal

Renovação de Credenciamento do curso de pós-graduação em Economia (Mestrado e Doutorado).

RETRATOS DA SOCIEDADE BRASILEIRA

O BDMG tem como visão ser o banco indispensável ao desenvolvimento de Minas Gerais, impulsionando assim o crescimento socioeconômico sustentável do

ORIENTAÇÕES PARA A ELABORAÇÃO DO TRABALHO FINAL. Seminário Temático VII: Comércio Exterior (Total: 60 pts)

Análise Internacional Comparada de Políticas Curriculares

Informações para alunos, pais e responsáveis Avaliação de Aptitudes Básicas (FSA Foundation Skills Assessment): Perguntas e Respostas

Seleção e Monitoramento de Fundos de Investimentos

PEDIDO DE ACREDITAÇÃO PRÉVIA DE NOVO CICLO DE ESTUDOS (PAPNCE) (Ensino Universitário e Politécnico) Guião de apresentação

PREPARANDO O ENADE (PARTE INTEGRANTE DO PROCESSO AVALIATIVO DE CURSOS E IES) Gustavo Monteiro Fagundes

5 Resultados. 1 Os resultados apresentados foram obtidos com 1 rodada do simulador.

Política de Software e Serviços

Relatório de Investigação da Escola julho 2015

(Re)pensar a Formação de Professores no contexto do Processo de Bolonha: Que constrangimentos? Que alternativas?

CARACTERÍSTICAS DE UM PROGRAMA (MESTRADO) NOTA 3

AVALIAÇÃO DA APRENDIZAGEM E DAS PROVAS DO CENTRO DE FORMAÇÃO INTERDISCIPLINAR/UFOPA VIA TEORIA DA RESPOSTA AO ITEM.

Plano Nacional de Educação. Programa Bolsa Família e MDS

Este artigo é uma breve resenha da tese de mestrado em economia de Albernaz,

Prova Nacional de Concurso para o Ingresso na Carreira Docente

Gestão de Projetos Logísticos

INFORMAÇÃO-PROVA DE EQUIVALÊNCIA À FREQUÊNCIA

1º Simpósio Infra-estrutura e Logística no Brasil: Desafios para um país emergente

Cursos Científico-Humanísticos Natureza e Organização

ESTIMAÇÃO DA DISTRIBUIÇÃO ESPACIAL DO RISCO DE ACIDENTES DE TRABALHO EM PIRACICABA SEGUNDO GRAVIDADE.

UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular ANÁLISE E TRATAMENTO DE DADOS Ano Lectivo 2015/2016

ÍNDICE GERAL ÍNDICE DE FIGURAS... ÍNDICE DE QUADROS...


Sumário. 1 Introdução. Demonstrações Contábeis Decifradas. Aprendendo Teoria

INSTITUTO SINGULARIDADES CURSO PEDAGOGIA MATRIZ CURRICULAR POR ANO E SEMESTRE DE CURSO

ENADE 2004/2013. Guia para o registro da situação do aluno no histórico escolar. Pró-Reitoria de Ensino

Introdução aos Sistemas Informáticos Engenharia Informática, Engenharia Mecânica, Engenharia Química, Gestão e Engenharia Industrial

GESTÃO. Gestão dos Processos e Operações: 8.2-Gestão da Qualidade DEG/AB 1

PROCESSO SELETIVO. Edital DG nº PROGRAMA DE INICIAÇÃO À PESQUISA CIENTÍFICA - PIPC

Alguns aspectos da Teoria de Resposta ao Item relativos à estimação das proficiências

ÁREA DE FORMAÇÃO: CONTRAIR CRÉDITO CRÉDITO À HABITAÇÃO

Módulo 2. Identificação dos requisitos dos sistemas de medição, critérios de aceitação e o elemento 7.6 da ISO/TS.

Estudo sobre estratégia Long-Short entre VALE3 e VALE5, realizado em 07/02/2012

Em meu entendimento, ela foi abaixo das expectativas. Prova fácil, cobrando conceitos básicos de Microeconomia, sem muita sofisticação.

Métodos qualitativos: Pesquisa-Ação

MOTIVAÇÕES PARA A INTERNACIONALlZAÇÃO

RECURSOS HUMANOS Avaliação do desempenho

Prepare-se para Faculdade. Leticia Bechara Pedagoga e Coordenadora Trevisan Escola de Negócios

FACULDADE DE TECNOLOGIA IBTA (Código 1853) EDITAL DE PROCESSO SELETIVO 1º TRIMESTRE DE 2014 CURSOS SUPERIORES TRADICIONAIS

A NANOTEC Uma Iniciativa em Nanotecnologia

Brochura - Panorama ILOS

EDITAL DE ABERTURA DE INSCRIÇÕES AO PROCESSO SELETIVO - PPG-EE - 002/2015 PROGRAMA DE ENGENHARIA ELÉTRICA MESTRADO, DOUTORADO E DOUTORADO DIRETO

2 INOVAÇÃO NA PROVISÃO DE SERVIÇOS

Transcrição:

PISA 2015 da Avaliação papel-e-lápis à Avaliação em Computador João Marôco, Ph. D. Seminário Investigação em Educação e os resultados do PISA - CNE, 5 Dez 2014

Introdução Os testes do PISA, iniciados em 2000, aplicados desde então com periodicidade trienal, avaliam os sistemas educativos de vários países de todo o mundo por estimativa da capacidade que alunos de 15 anos têm para mobilizar conhecimentos e competências em Leitura, Ciências e Matemática para resolver problemas do dia-a-dia, fundamentais à plena cidadania nas sociedades contemporâneas.

Introdução 2000 L 2003 M 2006 C 2009 L 2012 M 2000-2012: formato tradicional papel-e-lápis 2015 C 2018 L 2021 2015 - : formato Computer Based Assesment

Introdução 2015 C 2018 M 2021 C 2024 M 2027 2015 - : formato Computer Based Assesment A avaliação em computador tem várias vantagens: Logística Codificação automática Fiabilidade de resultados Disponibilidade de Resultados Itens interativos e simulação de dados Custos financeiros OCDE: Evolução do PISA de PBA CBA CAT

Problemas com o CBA? Invariância de modo? Como ligar os resultados dos ciclos PBA vs. CBA? Testes CBA têm validade e fiabilidade? Os itens/testes em PBA vs. CBA: Têm o mesmo índice de dificuldade? Têm o mesmo índice de discriminação? Existe efeito de modo nos resultados e comparação de países PBA vs. CBA? É possível ligar os resultados (itens trend) dos ciclos PBA com os novos ciclos CBA?

Design (Preferencial) Domínio principal: Ciências 72 Combinações L, M & C Trend AMOSTRA n 2000 25-30 escolas n i 70 alunos/escola New & CPS PBA (23%) CBA (35%) CBA (42 %) 2 salas em simultâneo (PBA+CBA) 1 sala ou outro período do dia.

Resultados Internacionais Base de Dados da OECD: não é do domínio público Teste Piloto PISA 2015 dos 45 Países/territórios que realizaram CBA & PBA 318 itens de Leitura (trend), Matemática (trend) e Ciências (trend & new) n = 120 303 alunos com 15 anos (53 Países/territórios no Piloto) ETS (USA): Outorgante responsável pelo scaling [von Davier & Sakamoto (ETS), Pers. Com., Novembro 2014] Nota: A dimensão das amostras nacionais (n=1000-2000) é demasiado pequena para inferências válidas por país.

Resultados Internacionais Nota: A dimensão das amostras nacionais (n=1000-2000) é demasiado pequena para inferências válidas por país. Taxa de Não Respostas (318 itens, aplicados em 45 países com CBA & PBA): 2015 Média Internacional Formato CBA PBA CBA - PBA % não-respostas 4,7 5,2-0,5 Efeito de Omissão 2,0 2,6-0,6 2015 Formato CBA PBA Nº itens (média/país) com Ef. Om. elevado 32,5 44,5 Efeito de Omissão: P + (calculados com não respostas como errados) P + (não considerando as não respostas ) Efeito de Omissão forte: > 5% (P + : proporção de respostas corretas; ou média relativa [M/maxscore] dos scores nos itens politómicos) CBA: reduz ligeiramente a % não respostas e efeito de omissão.

Resultados Internacionais Nota: A dimensão das amostras nacionais (n=1000-2000) é demasiado pequena para inferências válidas por país. Teoria Clássica de Testes: P + : proporção de respostas corretas; ou média relativa dos scores dos itens politómicos Médias Internacionais Domínio CBA PBA CBA PBA Matemática 0,45 0,47-0,02 Leitura 0,60 0,59-0,01 Ciências-Trend 0,49 0,50-0,01 Ciências-New (FT Test) 0,41 - - CBA ligeiramente mais difícil; diferenças de P + irrelevantes entre os dois modos!

Resultados Internacionais Nota: A dimensão das amostras nacionais (n=1000-2000) é demasiado pequena para inferências válidas por país. Teoria Clássica de Testes: P + Proporção de respostas corretas por posição dos blocos no teste (médias internacionais) CBA (2015) Posição1 Posição2 Posição3 Posição4 Pos.4 Pos.1 Matemática 0,439 0,454 0,432 0,427-0,012 Leitura 0,575 0,580 0,566 0,544-0,031 Ciências 0,409 0,418 0,401 0,385-0,024 PBA (2009) Posição1 Posição2 Posição3 Posição4 Pos.4 Pos.1 Matemática 0,411 0,401 0,384 0,371-0,040 Leitura 0,581 0,557 0,532 0,499-0,083 Ciências 0,490 0,478 0,457 0,435-0,055 CBA reduz efeito da localização dos itens no teste

Resultados Internacionais Nota: A dimensão das amostras nacionais (n=1000-2000) é demasiado pequena para inferências válidas por país. Teoria de Resposta ao Item No estudo Piloto do PISA2015 é seguida uma nova estratégia de scaling : 1. Avaliação da tendência histórica dos dados do PISA de 2000 a 2012 2. Teste a vários modelos de TRI: 2.1. Modelos Mixed Coeficients Multinomial Logit Model (MCMLM): Modelação generalizada do Modelo de Rasch (itens dicotómicos) e Crédito Parcial (PCM) (itens politómicos) em múltiplos grupos (em vigor 2000-2012) 2.2. Modelo de 2 parâmetros (2PL) e Crédito Parcial Generalizado (GPCM) multigrupo com parâmetro de interação entre grupos (países) P[Y=1 q, a,b] Curva Característica do Item (ICC) aq ( -b) e PY ( = 1 qab,, ) = ( ) 1 + aq-b e 1.00 0.75 a a 0.50 0.25 b b 0.00-4 -2 0 2 4 q

Resultados Internacionais Nota: A dimensão das amostras nacionais (n=1000-2000) é demasiado pequena para inferências válidas por país. Teoria de Resposta ao Item Comparação entre os itens trend CBA 2015 e PBA 2000-2012 mixed IRT models (Rasch/PCM, 2PL/GPCM) Domínio RMSD > 0,2 Comparabilidade ICC Fiabilidade Marginal Matemática 2,2% 97,8% 0,83 Leitura 2,7% 97,3% 0,81 Ciências 4,9% 95,1% 0,80 ò RMSD = P q - P q f q q 2 [ ( ) ( )] ( ) O E - Diferença quadrática entre P(Y=1 ) Obs - P(Y=1 ) Exp ponderada pela distribuição das aptidões; - Reflete impacto dos índices de discriminação (a) e dificuldade do item (b) do item; - RMSD > 0,2- Item com mau ajustamento relevante

Resultados Internacionais Nota: A dimensão das amostras nacionais (n=1000-2000) é demasiado pequena para inferências válidas por país. Teoria de Resposta ao Item Comparação entre os itens PBA vs. CBA mixed IRT models (Rasch/PCM, 2PL/GPCM) Discriminação CBA (a) 3 2 1 0 CMC Computer Human SMC 0 1 2 3 Discriminação PBA (a) r ( )=0,89 r ( )=0,89 r ( )=0,90 r ( )=0,94 Dificuldade CBA (b) CMC Computer 3 Human SMC 2 1 0-4 -2 0 2 4-1 -2-3 Dificuldade PBA (b) r ( )=0,94 r ( )=0,96 r ( )=0,94 r ( )=0,93 Correlações fortes entre parâmetros de discriminação (a) e dificuldade (b) das ICC por tipologia de codificação do item

Resultados Internacionais Nota: A dimensão das amostras nacionais (n=1000-2000) é demasiado pequena para inferências válidas por país. Teoria de Resposta ao Item Comparação entre os itens PBA vs. CBA mixed IRT models (Rasch/PCM, 2PL/GPCM) Domínio Parâmetro de Discriminação r(a PBA,a CBA ) Parâmetro de Dificuldade r(b PBA,b CBA ) Matemática 0,91 0,95 Leitura 0,89 0,94 Ciências 0,94 0,93 Todos os domínios 0,91 0,94 Correlações fortes entre parâmetros de discriminação (a) e dificuldade (b) das ICC por domínio

Considerações finais CBA reduz a taxa de não respostas Itens CBA ligeiramente mais difíceis que PBA (diferenças irrelevantes entre P ) CBA reduz Efeito de Omissão CBA reduz Efeito de Posição dos itens/blocos no teste Comparabilidade dos itens trend entre 2000-2012 (PBA) e 2015 (CBA trend) Correlações entre os parâmetros de dificuldade e discriminação das ICC para PBA e CBA elevadas no geral, por tipologia de item e por domínio (r =0,89-0,95) Mixed multigroup IRT (RM/PCM; 2PL/GPCM) permitem manter a continuidade da série PISA (2000-2015- ) Não há efeito de modo de aplicação (PBA vs. CBA) relevante quer de acordo com a TCT quer com a TRI (invariância de modo) Entre PBA e CBA são esperados 75-85% parâmetros comuns por domínio; i. e. ~ 4-5 clusters em 6 clusters trend comuns: uma ligação mais forte do que a observada em ciclos anteriores!

Obrigado pela atenção!... joao.maroco@iave.pt Seminário Investigação em Educação e os resultados do PISA - CNE, 5 Dez 2014