9月11日,本报《87.5%的人认同“四六级考试是一杆假秤”》一文,引起了舆论的广泛关注。公众的矛头几乎一边倒地指向了四六级标准化考试。然而,记者在采访中发现,学术界对此还有另一种声音。为此,本报记者独家专访了我国专门研究语言类标准化考试的教育心理测量学专家谢小庆教授。
“四六级考试确实冲击了大学生的专业学习和母语学习,这是事实,但与考试本身无关”
在美国教育测量中心(ETS)做过一年博士后研究工作的谢小庆教授快人快语——
“我也希望改革高校英语教学、保护学生权利,但我并不认同‘英语四六级考试是假秤’的观点。”
谢小庆认为,考试是衡量人的能力的工具,是一把尺。这个工具的制造不能靠“眉头一皱、计上心来”,而是要有质量标准,使用前要进行质量检验,测量的结果要有可比性。“‘假秤’应该是指没有达到国家或权威部门颁布的具有法律效力的质量标准,而四六级考试恰恰不在此列。从我这个从事教育测量学研究20多年的专业工作者的角度看,四六级考试是合格的达到质量标准的语言类测试。”
“四六级考试确实冲击了大学生的专业学习和母语学习,这是事实,但与考试本身无关。好比说菜刀是用来切菜的,如果有人用菜刀伤了人,要追究用菜刀伤人者的责任,而不是菜刀制造者的责任,也不能将菜刀扔掉不用。”谢小庆认为,考试这杆“秤”是用来测量人的能力的,是区分人的能力差异的,不是用来限制人的权利的,也不是用来制造‘创收’机会的。
他说,在中国应试教育的大环境中,四六级考试被一些不称职的教育行政官员误用、滥用了,造成了对学生的伤害。应该追究的是这些误用者的责任,应该改变的是这种滥用考试的制度性安排,应该反对的是行政权力的寻租和利用公共权力垄断市场,而不是取消废除考试本身。“只要市场存在求职竞争,用人单位存在量才使用,鉴选人才的能力测试就永远需要。”
“考试的质量标准中最重要的就是‘高能高分、低能低分’”
“考试的质量标准中最重要的就是效度标准,简言之,就是‘高能高分、低能低分’。从试题编制程序上看,标准化考试应该是在正式使用之前经过定量的质量检验的考试。
“标准化考试的另一个特点是需要经过公平性检验,保证对于男女考生、城市和农村考生、穷人和富人子女的公平。如果某项考试明显地有利于男性,或有利于城市考生、富人子女,这项考试就不能称为‘标准化考试’。”
对我国目前从事语言类测试的命题员队伍和评分员队伍的现状,谢教授认为,如果有足够高水平的评分队伍,就可以不要客观性试题;如果有足够高水平的命题人员,就可以不要主观性试题。然而,我们面对的现实是既不能保证评分队伍的水平,也缺乏命制客观性试题方面的经验积累。因此,“我们需要用选择题来保证可比性,用作文来保证有效性。在语言文字类测试中,重要的是命题水平,是命题人的水平,而不是题目形式,不是采用选择题还是作文题的问题。”
“标准化考试是专业化分工的产物”
“在没有服装厂之前,我们也穿衣服,并没有赤身裸体。这可以成为反对服装厂标准化、批量化生产服装的理由吗?”谢小庆反问道。
他认为,同样的道理也可以用来解释考试。“过去许多学校、教师及单位人事主管,自己编制考试对学生或求职者进行测试;今天,越来越多的学校、教师及单位人事主管转向借助社会化的考试服务来进行教学成绩检测及人员评价。”
“为什么出现这种变化?道理很简单:分工带来专业化、更高的劳动生产效率和更高的质量。自己做服装,一天不过两三件,质量也参差不齐;专业化分工以后,借助于机器,平均一个人一天可以剪裁成百上千件,也可以整体提升产品质量。对大多数人而言,剪裁衣服是‘业余工作’,而对服装生产者而言,剪裁衣服是职业化的——职业水平当然高于业余水平。”
谢小庆说,标准化考试是专业化分工的产物,是由从事考试研究的专业人员所编制的,是科学研究的成果,要经过多个环节的质量检验。
“标准化考试通常只能用于‘汰劣’而不是‘择优’”
在谢小庆教授看来,即使是标准化考试,也只能满足一定层次的社会需求,通常只能用于“粗筛”,而不能用于“精选”;只能用于“汰劣”,而不能用于“择优”。譬如,当100个求职者竞争10个职位时,标准化考试的作用就是淘汰掉50个明显不行的竞争者。从余下的50人中怎样选出10人?这超出了标准化考试的作用范围。只能再通过档案审查、原单位调查、面试、答辩、同行评议、民意测验等方式来“择优确认”。
作为考试专家,谢小庆教授反复强调,目前还有大量未经质量检验的“非标准化考试”被用于重要的招生、招工决策和人事录用。
“升学权和就业权是公民最基本、最重要的权利。凭借一项不能保证‘高能高分’或与本职工作关系不大的考试(如职称外语考试等),剥夺一些人的升学权和就业权,是对公民基本权利的严重侵害。这才是真正应该呼吁社会公众特别关注的。”