手机浏览器扫描二维码访问
第一节双因子IRT模型简介
banner"
>
尽管项目反应理论(IRT)实现了对被试潜在特质的精确估计,提高了测量的效率,解决了CTT模型的不足,但传统的单维IRT理论也存在一定的不足。
传统的IRT模型对测量变量的维度有所限制,模型一般会假设欲测量的心理特质是单维的,但实际上大量研究表明,这种假设在一些情况下是难以保证的,在数据不满足单维的条件下,强行使用单维的模型,可能会造成很大的测量误差,这种误差不仅在使用IRT模型的纸质测验中存在,在CAT中也同样存在。
Folk和Green(1989)把单维模型用在了两维数据上,比较了这种模型误用对CAT测验和传统测验造成的影响。
结果表明:当次要因子对测验的影响不显著时,传统测验下可以通过假设测验单维,从而采用单维模型;两个潜在维度不相关,且都对数据有显著的影响,使用任何一个维度的参数,均会引起特质参数估计的巨大差异;将单维模型用于多维数据引起的偏差在CAT上更加明显,因为单维模型的参数不仅会用于选题过程中,还会用来进行特质水平估计。
因此,建立被试反应与多种能力及项目特征之间的多维项目反应理论(MIRT)模型成了IRT近40年来研究较为活跃的领域之一(杜文久,肖涵敏,2012)。
正是基于上述的现状,在过去的几十年时间中,许多测量学研究者已经将IRT理论从单维的模型扩展到了多维的模型,并逐渐形成了多维项目反应理论。
例如,Bo(1981)基于以往的研究,将EM算法(EMAlgorithm)扩展到了多维情况中,形成了全息项目因素分析(FIIFA)的雏形。
在接下来的研究中,Bouraki(1988)在Bo的研究基础上正式地提出了全息项目因素分析的方法,从而将IRT模型扩展到了多维的数据中。
与以往的基于单维的IRT模型不同的是,在MIRT模型下,对于被试的潜在特质定位并不是在一个一维的连续体上进行的,而是在多维的空间中进行的(ReIRT能同时估计被试在测验每个维度上的能力水平,实现测验的认知诊断功能;另一方面,MIRT比项目反应理论更适用于分析许多新形式的测验,如认知诊断测验、公务员考试、表现性评估以及写作测验的项目和被试特征(毛秀珍,辛涛,2015)。
虽然多维IRT能够实现对多个维度的测量与评估,但在维度之间存在相关时,人们除了希望了解被试在各个维度上的潜在特质上的水平外,还希望获得对被试整体水平的评估,在这种情况下,如果同时考虑所有维度的信息,就可能会使得测验的估计精度下降。
为了解决这个问题,可以采用双因子模型拟合数据,在这个基础上,Gibbons等人进行了一系列的研究,并提出了全息项目双因子分析(Full-InformatioorAnalysis,FIIBFA),用以解决二值计分、多级计分的双因子数据的参数估计问题(Gibbons&Hedeker,1992)。
全息项目双因子分析将传统的因素分析与项目反应理论相结合,分析所采用的模型可以看成一种多维的IRT模型,或是多维IRT模型的一个特例。
与传统MCAT相比,基于双因子模型开发的计算机自适应测验(BifaputerizedAdaptiveTesting,BCAT)具有一些天然优势:双因子IRT模型通过一般因素和特殊因素的设定,使得待估计参数大大减少,在一定程度上降低了参数估计的难度;同时由于模型本身的特点,不仅可以得到被试在某一具体维度上的表现,同时还能够获取被试在欲测心理品质上的总体水平。
但是总体看来,目前对双因子IRT以及双因子CAT的研究还非常薄弱,当前研究主要是集中在模型的构建以及参数估计方面,部分的研究将双因子IRT的模型用到了CAT中,但这些研究大多是从单维视角来进行的,即一般因素和特殊因素的选题过程及其特质参数估计是分开进行,而不是同时考虑多个维度的信息选题和估计,从这个角度上来看,这一类的双因子CAT并不算是完全意义上的多维CAT。
一、基于探索性因素分析模型的研究现状
传统的项目因素分析方法是基于经典线性因素分析(ClassiearFaalysis,CLFA)进行的,在这种模型下,是从观测变量间的线性相关矩阵或协方差矩阵出发来进行因素分析的。
但是这种方法存在的问题是,当“项目—特质”
回归线不一致,也就是难度、猜测度等项目参数不一致时,会产生虚假因素、高估维度数、低估因子负荷(俞宗火,戴海琦,唐小娟,2006)。
但在实际的心理测验中,项目的难度不一致,往往是一个不可避免的问题,在线性因素分析方法下,可能会产生虚假因素,即使能够估计出恰当的因素,也会导致有偏的因子载荷;除此之外,基于经典线性因素分析在对数据的使用方面也存在不足,由于只采用相关矩阵或协方差矩阵,并没有充分使用到被试的所有作答数据信息,因此,数据信息使用不充分。
针对经典线性因素分析中存在的不足,Bouraki(1988)在前人研究的基础上详细论述了一种基于IRT的题目因素分析方法,即前文提到的全息项目因素分析,这种方法是一种非线性的因素分析,相较于经典线性因素分析,这种方法的优势体现在以下三点。
第一,不需要计算题目之间的相关系数,并且不会受到题目数量的影响。
第二,作为一种非线性的因素分析方法,更符合心理研究中的实际数据非线性的情况。
第三,直接采用被试的作答结果进行估计,因此充分运用了被试作答的所有数据信息。
Bo(1981)在其论文中,根据Thurstoiple-Factor)模型,假设,存在一个由m个因素组成的模型,即
Xji:表示的是一种没办法观测到的“反应过程”
,也就是被试j在做第i题的过程中所需要的各种主要能力或潜在特质相互作用的过程;
θjk:表示的是被试j的第k种能力或是第k中潜在特质;
λik:表示的是第i题在第k种能力或是第k种潜在特质上的因子载荷;
εji:表示不能观测到的随机变量,服从正态分布均值为0,方差为σ2i的正态分布。
公式(8.1.1)反映的是一个补偿型的模型,即在一个维度上有较高的特质水平,能够对其他的特质水平低的维度起到补偿的作用。
除了补偿型的模型,还有其他的模型。
例如,存在交互作用的模型等,具体可以查阅文献。
根据上面的模型,可以得到二级计分题目的FIIFA模型。
被试j答对第i题的概率为
下本开给残疾皇叔冲喜,求预收孟河大队清纯娇媚的村花疯了,口口声声要嫁给下放到村里的活阎王。苏清瑶一觉醒来,回到物资匮乏的七十年代,重活一世她要改变家人悲惨的结局,带着全家过上好日子。至于那个...
从小生活在深山老林里的小道姑下山了。继承了师父的道观,找了亲生父母,考上了大学,一切都朝着幸福的康庄大道上走去。可现实怎么回事?不靠谱的师父留下大额债务?亲爹被一大家子吸血还给哥哥捐了个肾?年轻时还...
步桐身为帝王的第一谋臣,被尊称女诸葛,奈何却过不了情关,落得兔死狗烹的下场,临死前发现,她的头号死敌,手握东厂番子和锦衣卫大权的督主汤玄霖抱着她的尸身痛哭,步桐有幸重生,她决定有仇报仇渣男,一脚踹飞兄长,扶你上位政敌,赏你辞官至于未来的督主大人她直接跑到四皇子府,捏着王府大总管俊朗绝伦的下巴,笑得比桃花还要甜好好记住我,待到本小姐满十八岁,将我娶过门。...
那年,消防还是军营。老兵方淮重回2007,感受消防人的苦痛喜悲。我曾亲历过那些岁月里的许多重大灾难,也在其中与消防一起成长,可我希望,一次也不曾发生过。万里河山壮丽,军人,当为家国天下之坚盾。我愿如此,人人皆然。万家灯火辉映,军人,当为执剑守护之卫士。今夜如此,夜夜皆然。不需要你认识我,不渴望你知道我,我把青春融进,融进祖国的江河。这是个部队的故事,也是人生的故事。...
医学院大三的徐泽,得到了一个来自未来的超级医护兵辅助系统这下好了,一个默默无求,仅仅靠着在外兼职,而企图完成学业以帮助父母支撑家庭的小宅男,有了新的目标。靠着自己的努力和勤奋,在这个...
虚空之杖,又名法穿棒,长度八吋,直径一吋,以扭曲血肉为材质,以虚空之力为杖芯,自带凸起,便于抓握,实在是符文之地居家旅杀人越货的不二良品。并不是每一个穿越者都会拥有系统比如这个倒霉的暗裔棒棒,在长久的封印之后,他成为了别人的系统。奖励任务小黄毛必须死看见那个叫伊泽瑞尔的小黄毛了吗?上吧,拉克丝,痛扁这个小偷一顿,我教你转职大元素使!就你叫伊泽瑞尔啊?拉克丝一键超神符文已装备!...