热天中文网

第二 计算机化多阶段自适应测验设计(第1页)

天才一秒记住【热天中文网】地址:https://www.rtzw.net

第二节计算机化多阶段自适应测验设计

banner"

>

MST设计涉及以下几个技术环节:阶段数的确定、每个阶段中模块数的确定、每个模块的项目长度、统计目标与定性规范约束、计分方法(能力估计)、自适应策略与过程、组卷等。

现对以上技术环节一一展开。

一、阶段数的确定

构建MST时,首先考虑需要构建多少个阶段。

大多数研究和应用中,通常使用3~4个阶段。

更多的阶段或每一阶段内更多样化的模块难度会使测验的自适应性和灵活性更佳。

但是增加阶段数会提升组卷的复杂性,却对测验最终的精度没有很大提升(Luegester,1998)。

当测验所含阶段数较少时也会出现问题。

例如,两阶段测验,仅有一个阶段一和一个阶段二。

由于只有一个自适应点,当被试得分处于划界分数附近时,就有更大的可能出现路径错误。

两阶段测验应考虑建立一个“恢复路径(RecoveryRoutine)”

,即被试从前一阶段到下一阶段出错时,应及时改正错误,减少下一阶段模块选择的错误。

使用更多的阶段可以减少出现这种错误的可能性。

Patsula和Hambleton(1999)比较了多种不同的MST设计,他们发现这些设计之间仅有很小的差别。

但是这些测验设计在测量精度和效能方面表现出较大的差别。

测验的阶段数越多就越接近于CAT。

因此构建测验时,测验开发者应选择合适的阶段数。

阶段数过少无法精确测量出被试能力。

阶段数过多不但无法提升测量精度还会加大组卷难度和题目浪费,并面临和CAT同样的问题,如路由出错、多自适应点增长测验时间等。

二、每个阶段中模块数的确定

大多数研究和应用是阶段一使用一个模块,在随后的阶段中增加模块数量。

通常情况,每一阶段的模块数不超过8个,平均值为5个。

随着阶段数的提升,增加更多难度的模块数,可使测验更具有自适应性和灵活性。

同样,增加模块数也增大了组卷复杂性,并对测验最终精度没有很大提升(Luegester,1998)。

一般情况下,每一阶段最多4个模块,并且每个模块3个平行水平,这样的组合比较合适(Armstrong,Jones,Koppel&Pashley,2004)。

因此在构建测验时,测验开发者要合理制定每一阶段内的模块数。

有两种可选择的模块数:一种是随着阶段增加,阶段内的模块数也增加,以此提升能力估计精度;另一种是每一阶段的模块数都相同,这种情况主要用于一致题目曝光率MST的情况(图4-1-2)。

测验开发者可根据自己的需求进行选取。

三、每个模块的项目长度

已有的研究和应用中,模块的题目数为1~90个不等,大多为5个。

不同阶段中模块的长度可根据实际情况而定。

一些测验在阶段一中有较多题目,而随后阶段中题目数量较少。

增加阶段一中模块的长度对减小估计误差有显著效果(Kim&Plake,1993)。

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

您的无限生存游戏已开启逍遥初唐被抛弃的首领受气包她不干了[快穿]从选秀冠军到全球巨星绝品神医都市游回到三国战五胡不会真有人觉得修仙难吧一睁眼,我穿成两个熊孩子后娘快穿之反派也是有骨气的鬼王的前半生流放前我已经富可敌国了开局就是死亡回归长公主病入膏肓后重生香江的导演卖油娘与豆腐郎武侠BOSS之路亚索的英雄联盟重生09做男神我老婆是传奇天后突然成仙了怎么办全球进化:我有属性面板拉仇恨从斗罗开始斗罗之神级选择系统诸天大航海时代