本文主要是介绍gre cs试题计算机,GRE的“计算机自适应考试”是怎么一回事?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
原标题:GRE的“计算机自适应考试”是怎么一回事?
很多关于GRE考试的介绍里都会提到,GRE采用的是“计算机自适应考试”。那这个“计算机自适应考试”到底是怎么一回事呢?
所谓“计算机自适应考试(Computer-Adaptive Test, CAT)”指的是在机考过程中,计算机会根据考生实际的答题情况来为考生分配接下来的题目。
如果考生之前的题目正确率较高则接下来为考生分配更难的题目;如果考生之前的题目正确率较低则接下来为考生分配更简单的题目。
2011年改革后的新GRE具体采用的是“多阶段计算机自适应考试(Multi-Stage Adaptive Test, MST)”。考试的特点是,每个考生语文和数学部分各考两部分题目(不算加试的情况下),其中语文和数学各自的第一部分为中等难度,而各自第二部分的难度取决于考生在第一部分上的表现。如果考生第一部分正确率较高则第二部分为高难度,反之亦然。而语文和数学两个科目之间在难度上互不影响。
GRE机考的演化
GRE自20世纪90年代初开始大力推行计算机化考试。与纸笔考试相比,机考有着明显的优势。
首先机考可以实现考完当场出分,而笔考的阅卷过程短则一个礼拜长则一个月。其次,机考在时间安排上可以更灵活,每个考生进入考场后可以随时开考,考完自行离场,不必像笔考一样整个考场所有人一起开始一起结束。再次,机考对于纸张和工作人员的需求都小于笔考,有助于降低成本。
最初于1992年推出的GRE机考在考题上与笔考相同,本质上只不过相当于把原本印在纸上的题目显示在了电脑屏幕上。而1993年GRE推出了革命性的CAT考试,从此机考与笔考开始变得完全不同。
与传统考试方式相比,CAT最大的优势在于高效;CAT可以用更少的题目实现更精确地衡量考生的水平。
在传统考试中,为了区分出低中高三种不同水平的考生,试题中要同时包含低中高三种难度水平的题目。正常情况下,考生做对的题目难度越高就说明考生的水平也越高。
然而这一设计在效率上并不理想:由于高水平的考生做低难度的题目正常情况下都可以做对,因此从衡量考生水平的角度而言,让高水平的考生去做低难度的题目是毫无意义的。
反过来,让低水平的考生去做高难度的题目不仅没有任何好处,反而还会增加考生的挫败感,使其在考试接下来的部分承受更大的心理压力,影响发挥。此外,对于每道题目只考一次就作废的考试而言,这种考法对于题目也是一种浪费。
传统考试不同水平考生答题情况示意
而在CAT考试中,系统首先会为考生分配中等难度的题目。如果考生这些题目都能做对则意味着考生水平较高。
于是接下来系统只会为考生分配更高难度的题目以精确测量考生的水平,而不会再为考生分配低难度的题目;系统会默认低难度的题目考生基本都可以做对。
对于低水平的考生情况则正好相反:如果系统发现考生无法做对最初的中等难度题目,则系统会默认高难度的题目该考生也一定做不对,于是接下来只会为考生分配低难度的题目。而在最后打分时系统会综合考虑考生做对的题目数量以及考生的题目难度。
理论上,采用CAT设计的考试可以在不牺牲评价精度的情况下让考生少做至少20%的题目,既帮助考生节约了时间又帮助出题人节省了题目。
GRE机考在采用CAT之后,每个考生在不算加试的情况下语文和数学分别只需要做30和28道题,耗时分别为30和45分钟。而在GRE纸笔考试中,考生语文和数学分别要完成76和60道题(这还不算加试),耗时均为60分钟。
CAT设计
如果我们假定一次考试共包括难度为1-3的题目,考生成绩共分为ABCD四等,则该考试可以采用如图所示的CAT设计,每个考生只需要做两道题。而采用传统考试设计的话每个考生需要做三道题。
采用CAT的另一个好处是,考场上每个考生被分配到的题目都不尽相同,所以考生抄袭的可能性大大降低。
CAT的问题
CAT相比传统考试虽然有显著的优势,但同时也有自己的问题。由于在CAT中从第二题开始每道题都会受到之前题目正确率的影响,因此考生只能按照计算机指定的顺序答题,且考生每道题目答案一旦提交就不可以返回再修改。
从出题人的角度来讲,CAT需要在正式考试前精确测量每道题目的难度,实现起来成本极高而且可靠性差。此外,在实际设计CAT算法时,除了题目的难度以外,还要考虑不同题型题目数量以及题库中每道题目出现率的平衡;
而计算考生正确率时,考生依靠瞎蒙做对题目的可能性也要加以考虑,因此算法要设计得非常复杂。而算法越复杂出问题的可能性自然也就越大。而CAT致命的问题在于,由于整个题目分配过程完全是由计算机自主实时完成的,人类考官难以实行有效的监督和干预。
于是,2011年改革后的GRE用相对折中的多阶段自适应MST取代了CAT。
新GRE的MST设计
新GRE的MST本质上也是CAT的一种,只不过在具体设计上是以section为单位进行难度自适应,而之前GRE采用的是最极端的以单个题目为单位进行的自适应。
在新GRE中每个考生语文和数学各自的第一部分会包含低中高三种不同难度的题目(整个部分平均难度为中等);考生完成第一部分后计算机会根据其正确率来分配不同难度的第二部分。如果考生第一部分正确率较高则第二部分会主要包含高难度题目,反之亦然。
最后计算成绩时系统会综合考虑两部分题目的正确率和难度。题目所在的部分越难则题目分值越高;同一部分内每道题目分值相同。
新GRE的MST设计
新GRE语文成绩和正确题数关系示例(两个部分总题数均为20道)
相比与之前的CAT设计,MST有如下优点:
1、在同一部分之内,考生可以以任意顺序答题,且当前部分已经做过的题目可以返回再修改。
2、考前只需要测定每个部分的整体难度,降低了成本,而且对于单个题目难度测量误差的承受力更强,不会出现CAT中一道题目测量出错会影响到整个考试的情况。
3、每套考题在考前可以人工审核,确保内容质量。
可见,正是因为GRE的计算机自适应考试设计,考生才可以在考场上少做几十道题目。
本文作者:冷楠
新东方武汉学校美研战队长
GER写作&填空主讲老师
毕业院校:华中科技大学
累计授课:5年
成果展示:GER Verbal 满分返回搜狐,查看更多
责任编辑:
这篇关于gre cs试题计算机,GRE的“计算机自适应考试”是怎么一回事?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!