天才一秒记住【热天中文网】地址:https://www.rtzw.net
(二)等值设计与测验组卷
为了保证所有试题参数都建立在同一量尺上,需进行测验等值设计,并据此进行测验组卷。
在实践领域中,目前采用较多的等值设计方案是基于IRT的锚测验(A)非等组设计,即两份不同的测验中有部分相同的试题(锚测验),然后通过锚测验这个中间媒介实现两份测验间的项目参数等值。
(三)测试与参数估计
将经过等值设计并组好的多份试卷对被试进行测试,以获取测试数据。
为了保证IRT分析的科学性,每份试卷测试的被试人数尽量不少于1000人。
然后,采用IRT相关模型对测试数据进行参数估计及IRT分析。
(四)项目分析与筛选
根据上步估计的项目参数(如难度与区分度参数)以及IRT分析(如模型-资料拟合检验分析、DIF分析等),需对项目进行筛选,淘汰不符合测量学要求的试题,符合以下条件之一的试题应考虑淘汰。
·项目测量的维度不符合单维(如项目在多个维度上均具有高的负荷);
·项目区分度过低(如a<0.5);
·项目难度值奇异(如|b|>10);
·模型-资料不拟合;
·存在项目功能差异(DIF);
·其他考察因素。
(五)测验等值
采用IRT的等值方法(如项目特征曲线等值法)实现不同测验间的项目参数等值,从而保证项目参数定义在同一量尺上。
(六)形成正式题库
经以上五步,把最终符合测量学要求且项目参数等值在同一量尺上的试题组成题库。
如果这时题库中的试题数量未达到要求,则应考虑再开发新试题,并经以上五步,直至题库题量符合要求;或者采用项目在线标定(OemCalibration)技术,在实际使用过程中实现题库的自动扩充,关于在线标定技术,读者可参考本书第九章内容。
三、CAT算法确定
实现“因人施测”
的自适应(Adaptive)需要相关的CAT算法为支撑,CAT算法主要包括以下内容。
(一)选题策略
CAT需根据被试特点选择适合被试的项目,在能力测量的CAT中,则需要根据被试能力的高低选择相应难度的题目测量被试,如能力高的被试可以选择难的项目,能力低的被试选择容易的项目,从而达到被试能力水平与难度相匹配的自适应。
目前在CAT领域中,测量学者们开发了大量的选题策略供实际使用者使用。
(二)能力参数估计
由于事先不知道被试的能力水平,所以CAT一般先选择几道中等难度的题目给被试做,并根据被试对这几题的作答情况来估计被试当前的能力值,然后再根据当前估计能力值从题库中选择难度与该能力相匹配的题目给被试,每新做完一题都需要与原来做完的所有题放在一起重新估计被试的能力值,依此循环,直至达到CAT终止的规则。
在这个循环过程中,需要不断估计被试的能力参数,目前使用较多的能力参数估计方法有极大似然估计(MLE)、极大后验估计(MAP)、贝叶斯期望后验估计(EAP)等。
(三)曝光率控制
由于CAT的库题数量有限,当被试越多时,项目被使用的次数就会越多(尤其是高区分度、质量较好的项目),即项目的曝光率也越高。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!