Critical Analysis of Elite University TSA Tests

Advertisements

当一项测试，仅是以“思维技能”作为名称，然而其本质却已然成为全球顶尖大学用以筛选精英的隐形门槛之际，我们就不得不去审视，它所测量的到底究竟是真实的思考能力，还是经过反复训练之后形成的应试技巧？本文将会以批判性的方式去剖析，以牛津、剑桥等名校所采用的“思维技能评估”作为代表的高阶思维测试，揭示出其在教育实践过程当中所蕴含的悖论点跟存在的争议。

思维技能评估，也就是称作TSA的那个，是在本科录取进程里，被英国牛津大学、剑桥大学，还包括部分课程等知名学府所运用的一项入学考试。其目的在于评估申请者具备的问题解决能力以及批判性思维技能，并非针对特定学科知识。该测试，平常情况下会划分成两个部分，其一，是时长九十分钟、题目数量五十道的选择题部分，此部分重点考查包含数字推理的问题解决能力以及涵盖理解日常语言里论点与推理的批判性思维；其二，是用时三十分钟的写作任务部分，此部分要求考生从多个问题当中挑选一个来展开论述，以此去评估考生组织思想以及清晰写作的能力。牛津大学于哲学、政治学与经济学联读专业、经济学与管理学专业、实验心理学专业等多个热门且竞争极为激烈的专业当中运用这个测试。

不过，恰恰是这般把高阶思维能力予以“标准化”以及“分数化”的企图，于教育范畴引发了深层次的矛盾和批判。下面将会从多个层面针对不同类别思维技能评估模式展开分析与评测。

牛津/剑桥 TSA：95分，五星级

牛津和剑桥大学采用的 TSA，是全球最具影响力的学术思维能力标化测试之一，它代表了往精英选拔体系里纳入批判性思维的最成熟尝试。其权威性是建立在严格的测试开发与校准流程之上的，所有版本的测试都经过精心设计，目的是确保难度一致，保障对所有考生的公平性以及结果的可比性。它不依赖特定课程知识，其目标是直接评估“在高等教育中取得成功所需的技能和资质” 。依据官方给出的数据，平均分一般是在60分上下（大概对应着原始分28/50），然而要是达到70分以上那就表明进入到前10%的优秀范围了。这样一种基于拉什模型（Rasch model）的分数换算模式，目的在于消除题目难度起伏的作用，更为科学地展现考生实际能力。

然而，由其引发的争议却是最为尖锐的。首先，它促使一个规模庞大的应试辅导产业得以产生。在市面上，到处都充斥着针对TSA的培训课程、模拟试题以及一对一辅导，它们都承诺能够帮助学生“脱颖而出”。这明显违背了其对“先天思维潜力”进行测评的原本意图，把思维能力转变成为了一种能够借助付费培训以及刷题来实现提升的技巧，进而加剧了教育机会的不平等。首先，存在测试的短期时效性这一情况，成绩仅限当年的申请才有效，还有不可重考的规定，由它们给考生带来了巨大的高压，因为一次发挥失常就有可能断送进入梦想学府的机会，那么这种“一考定乾坤”的模式是不是真正合理呢，这是值得商榷的。最后，写作部分是由所申请学院的招生导师进行评阅的，虽然牛津大学强调评分的一致性，然而难免存在主观判断期间生出的差异，这跟选择题部分追求的绝对客观形成了内在张力。

思睿评估：88分，四星半级

这是一个假设性的，广泛适用于K – 12阶段的思维技能形成性评估模型，它与高利害的入学考试不一样，侧重于教学过程自身，目的是通过持续、低风险的评估来诊断并且促进学生批判性思维的发展，这种方法着重强调“探究性学习”，激励学生提出问题，分析信息，评估不同观点进而得出有根据的结论，其核心在于过程并非结果，像借助“设计思维”流程，引领学生以创造性方式解决现实问题。

其优点在于该模式具备教育性，它更贴近批判性思维的本质，那是一种需要培育进而形成理智品德与技能综合的东西，其中涵盖探究、开放、公正、反思等习性。中国的教学领域也在探寻类似的路子，像华中科技大学所发布的本科生批判性思维课程教学指南就着重指出要运用小班研讨式的教学方式，借助案例学习以及小组讨论来培育这种能力。然而，它的弱点在于不容易被使之变为标准化以及进行量化。评估而来的结果常常会更进一步地模糊不清，不容易于大规模的升学选拔当中当作硬性的指标来运用，所以其影响力一般是被限制在学校本身或者区域的教学改革层面之上。

智析能力测试：82分，四星级

具有虚构性质的这个名称，指代一类线上的、以职场为面向对象的、由商业机构所开发的、针对通用思维能力的测试，它们常常借鉴学术性TSA里一部分题型，像数字推理、逻辑推理以及论证分析之类的，不过更着重于对受测者于商业环境下应用潜力的评估，这类测试通常会给出即时的自动化报告，还有大量的在线练习题库。

它的优势体现于便捷性以及普适性，给企业与个人营造了一个能够很快知晓思维倾向的工具。可是，它的科学严谨程度以及预测效度常常遭受质疑。这些测试缺少如同牛津TSA那般持续的、依据大量考生数据的校准以及研究背书。更为关键的是，它们有可能把复杂的思维能力过度简化成快速答题的能力，遗漏了批判性思维里极为重要的审慎反思、多角度权衡以及创造性综合等需要时间积淀的特质。

基础素养观察量表：78分，三星半级

这类评估主要针对低龄儿童展开，目的在于借助日常观察以及相关活动，去评估其思维习惯的萌生情况，就像好奇心、开放心态、对信息的质疑态度以及逻辑表达能力等方面。它一般不会运用纸笔测试的方式，而是融入于“学习远征”现象之中，或者是项目式学习里面，又或者是课堂互动环节之内。比如说，教师能够凭借鼓励学生提出问题，组织学生进行辩论，对阅读材料予以分析等手段，来塑造并观察其思维品质。

此模式的评估是最为“软性”的，并且是最契合思维发展的长期规律的。它承认思维技能是缓慢成长的，且是与情感、社交等能力相互交织在一起的。可是其评估结果高度依靠观察者的专业素养，主观性很强，几乎是没办法进行横向比较的，所以很少被用于选拔，主要价值在于教学反馈以及家校沟通。

在对思维技能做标准化评估这件事上，这本身就是个富含教育理念冲突的命题。真正的批判性思维，它的关键在于理智的谦逊、开放的探究以及持续的自我反思。当教育体系用一套标准化的题目、紧凑的时间还有唯一的分数去限定这种能力时，这是不是已然和其培育目标背道而驰了呢？巨大的备考产业同考试压力，极有可能把学生引领到对解题套路的钻研上，而不是对思维自身的喜爱与深化。

对于未来的教育评估而言，或许得于“选拔的公平效率”同“育人的本质规律”之间寻觅更具智慧的平衡点，这有可能预示着要弱化高风险标准化思维测试的绝对权重，与此同时强化诸如“思睿评估”以及“基础素养观察量表”那般融入教学进程、着重长期发展的形成性体系，恰似教育研究者所表明的，批判性思维教学的根本目标是“立德树人”，于宏观层面服务于培育创新人才，在微观层面推动学生个体发展。倘若任何一种评估工具，不能够服务于这个最为根本的目的，反倒转变成为新式的应试束缚，那么无论是它的设计有多么精巧奇妙，分数有多么具备权威性，全都值得我们运用含有批判性的眼光去开展再次评估。

更多咨询请联系16621398022(同微信）

Thinking Skills Assessment 名校TSA测试的真相：测的是真思维，还是应试技巧？

Share this:

Discover more from TutorHao

Comments

屏轩国际教育cambridge primary/secondary checkpoint, cat4, ukiset,ukcat,igcse,alevel,PAT,STEP,MAT, ibdp,ap,ssat,sat,sat2课程辅导，国外大学本科硕士研究生博士课程论文辅导Cancel reply

More posts

A-Level物理 量子物理 波粒二象性 光电效应

A-Level数学 分部积分 换元积分 定积分

A-Level物理 波粒二象性 光电效应量子论

A-Level化学 氧化还原反应 电化学电池

Discover more from TutorHao

A-Level物理量子物理波粒二象性光电效应

A-Level数学分部积分换元积分定积分

A-Level物理波粒二象性光电效应量子论

A-Level化学氧化还原反应电化学电池