热天中文网

第一 计算机化自适应测验理论基础 项目反应理论(第2页)

天才一秒记住【热天中文网】地址:https://www.rtzw.net

根据3PLM,可得不同能力被试在项目j上的答对概率曲线,即项目特征曲线(ItemCharacteristicCurve,ICC),如图2-1-1所示。

图2-1-13PLM的项目特征曲线(ICC)

(二)多级评分IRT模型

多级评分项目是指被试在项目上的观察反应得分超过两种,即被试在该项目上的得分可以是0分或满分,也可以是介于0分和满分之间的分数,即被试在项目上的得分形式多于两种;而用于分析多级评分项目的数学模型(项目反应模型)称为多级评分项目反应模型。

这种模型适合分析简答题、证明题、作文题、Likert型量表等多级评分的题型。

IRT领域中常用的多级评分IRT模型主要有:

·等级反应模型(GradedResponseModel,GRM)(Samejima,1968);

·分部评分模型(Partial)(Masters,1982);

·拓广分部评分模型(Geial)(Muraki,1992);

·评定量表模型(RatingScaleModel<R**)(Andrich,1978);

·称名反应模型(NominalResponseModel,NRM)(Bock,1972)。

在IRT领域,基于多级评分IRT模型的开发主要有两大思路(Thissen&Steinberg,1986):一种是离差模式(DifferenceModel),另一种是除总模式(Divided-by-totalModel)。

1.基于离差模式的多级评分IRT模型

离差模式中,被试得T分的概率表现为两个累积概率(CumulativeProbability)的离差,如Samejima(1968)的等级反应模型(GRM)属于离差模式。

在GRM中,被试得T分的概率被定义为被试得T分及T分以上的概率减去被试得T+1分及T+1分以上的概率,即

其中

bjt指被试在项目j上得T分的难度。

显然GRM中,如果项目j满分值为mj,则该项目有mj个难度值。

比如mj=3时,则该项目有3个难度,分别为得1分的难度bj1,得2分的难度bj2和得3分的难度bj3。

GRM中的难度参数满足

即被试得越高分的难度是越大的,难度是单调递增的。

为了保证概率P(Xij=t)不为负,GRM限定

即被试得0分及0分以上的概率为1,以及限定

即被试得(满分+1)分以上的概率为0。

这时,GRM满足

当mj=1时,则由公式(2.1.5)和(2.1.6)可得

即当项目满分为1分(或项目为二级评分)时,GRM可以简化为2PLM,也就是说2PLM是GRM的一个特例。

与Logistic模型一样,GRM也可在二维坐标轴上描述不同能力被试在项目各个分数上的概率曲线,即运算特征曲线(CharacteristicCurve,OCC),如图2-1-2所示。

图2-1-2是一个满分为3分的项目,被试在该项目上的得分有四种类型,即T=0、1、2和3分。

图2-1-2可知,能力越高的被试得0分的概率越低,而得满分3分的概率越高;能力越低的被试得0分的概率越高,得满分3分的概率越低;而对于中间段能力的被试,得2分和3分的概率倾向越高。

图2-1-2等级反应模型的运算特征曲线(OCC)

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

我是个么得感情的杀手掌珠令斗破之元素封神被抛弃的首领领到分配的顶流老公后热搜爆了一拳歼星从长生苟到飞升彪悍农女路子野在霍格沃茨淡定地喝红茶古代养娃日常封神之逍遥不二仙神话三国领主开局签到送封号斗罗穿越诸天,开局救下司理理全金属王座一出场就无敌的主角诸天演道炮灰女的另类修仙隐婚成神从种田开始从斗罗世界开始签到只要我死遁够快师兄他会读心我要做球王沙雕攻在虐文世界搞钱