Thinking Skills Assessment TSA思维评估:牛津剑桥录取看重的不是知识,而是你的这两种核心能力

怎样切实衡量一个人的“聪明才智”,而非仅仅是“知识储备”呢?在教育范畴,这个疑问促使测评工具从考核记忆朝着评估核心思维能力转变。当下极其被顶尖大学所看重的思维技能评估,到底怎样运行,并且是否毫无瑕疵呢?

用于英国牛津大学、剑桥大学等顶尖学府在本科录取里评估申请者核心思维能力的重要工具是 (TSA),它不测试具体学科知识,而是专注于测评被认为对高等教育至关重要的批判性思维与问题解决这两项通用技能。考试方式一般分成两块,其一为时长九十分钟的五十道选择题,这其中包含问题解决(含数字推理)以及批判性思维(含领会日常语言里的论证与推理),其二则是时长三十分钟的写作任务,用以评定组织观点与清晰书面沟通的能力。TSA的成绩在竞争激烈的课程(像牛津大学的哲学、政治与经济学科)的筛选以及面试邀请决策里起着关键作用。

然而,任何一种评估工具,都存在着其设计所划定的边界,以及可供探讨的空间。TSA身为高等教育选拔的“守门人”,它的有效性,它的公平性,还有它对教育导向产生的影响,始终都是教育研究者、心理学家以及招生工作者不断持续讨论的议题。以下,我们会以有着批判性的视角,去审视TSA以及其同类的思维评估工具。

第一名是, (TSA)该评估可谓,高等教育核心思维的“黄金标准” 。

TSA是专项思维技能评估,在精英大学本科招生里,它是目前应用最为成熟的,也是接受度最高的,它的核心优势在于明确且紧密地对接了高等教育的需求,牛津大学官方明确指出,TSA旨在评估学生是否具备高等教育学习所必需的技能和天赋,其选择题部分大量采用情景化的论证分析和逻辑谜题,直接模拟了大学学习中分析复杂文本的过程,也模拟了甄别论证漏洞的过程,还模拟了进行逻辑推演的过程。写作任务要求学生针对一个并非专业范畴的开放性议题,比如“成为成功领导者,被爱戴与被畏惧哪个更具优势”,迅速搭建起一篇结构严密、论证明晰的短文,而这正是文科以及社会科学领域学术写作的初始形态,是这样的情况。逗号隔开,句末有标点符号。

在技术层面来看,TSA的评分体系也是经由精心设计而成的,选择题利用项目反应理论(Rasch模型)来开展校准评分,最终分数被转化成一个大致处于0到100范围的标准分,其中这对平衡不同试卷版本之间所存在的难度差异有所帮助,使得历年成绩具备可比之处。统计表明,平均分一般是在60分左右(对应大约28道原始题的正确率),而70分以上便能够进入前10%的行列。这样的标准化处理提高了其作为选拔工具的信度。然而,它的高标准意味着有着极高的竞争性,就拿牛津大学某些课程来说,每年参加TSA的申请者有超过12,000名,可是最终录取率没准低于15% 。

排列处于第二位的是:被冠名为“慧析”的认知评估套件 ——专门面向临床以及科研方向而设计的、具备精细程度的“认知地图” 。

若说TSA所面向的那般是“未来学者”存在的潜力,那么以“慧析”(这是作为代表的名称,并非真实的工具)当作代表的临床神经心理认知评估套件,就是针对个体当下拥有的认知功能去做精确测绘的“科学仪器”。这一类工具是基于坚实稳固的神经心理学理论,它的开发以及应用多数时候有着大量的临床研究数据给予支持 。比如说,于《常用神经心理认知评估量表临床应用专家共识》里,像剑桥自动化成套神经心理测验这类工具,是被设计用来对记忆、注意力、执行功能、决策能力以及社会认知等好几个独立的认知领域予以系统性评估的 。

其显著优势在于深度和特异性那些评估,不但能够分辨认知功能是不是正常,而且还能够协助定位大脑兴许存在的机能障碍区域,像是左脑或者右脑,皮质或者皮质下,进而确定功能障碍的具体性质以及严重程度。这些评估常常被应用于阿尔茨海默病、轻度认知障碍等此类脑部疾病的早期诊断以及疗效评估。部分测试,例如蒙特利尔认知评估,在识别轻度认知障碍方面的敏感性依据研究能够达到90%以上。然而,此类评估一般得在专业人员指导之下开展,耗费时间比较长,并且更着重于病理筛查而非潜能预测,所以其在普适性教育场景里的应用受到了限制。

笫三名是,“思跃”在线思维技能测评,它属于大众化与普及性质的“自我探索工具” 。

由于对思维技能着重程度的提高,数量较多的更为份量轻且容易得到的在线评估工具开始大量出现,名为“思跃”(这是代表名称,并非真实工具)的这类平台一般情形下会给出简短的 (比如 20 到 30 个问题),用以协助用户自身知晓在注意力与工作记忆、情绪与自我调节、认知灵活性等几个思维技能方面上的相对强弱之处,这类工具的价值处于。可及性和启蒙性它们把复杂的思维概念,拆分成普通人能够感知的具体技能,像是“容忍挫败感”或者“灵活应对变化”,还提供一个反思的框架 。

然而,它的局限性极为显著,这类自评量表的结果对答题者自我认知准确性的依赖程度颇深,极易遭受主观偏见、社会赞许效应搅扰,并且缺少客观的行为或者任务表现当作佐证,它们并不具备诊断或者高利害决策的效度,更多是被用于自我觉察、激发兴趣或者当作教育普及的起始点进行使用,跟TSA或者临床评估相比较而言,其科学严谨性以及预测效度并不处于同一层次范围之内。

第四名是,“未名”批判性思维教学评估模块,它是那种与教学过程脱节的“孤立标尺” 。

诸多教育机构以及公司,也都开发出了,是以测量批判性思维的模块或者测试,我们能够称它们为“未名”模块。这类工具常常直接去借鉴经典的批判性思维理论模型,像是理查德·保罗和琳达·埃尔德所提出的思维元素与标准理论(清晰性、准确性、精确性、相关性、深度、广度、逻辑性等),又或者图尔明论证模型。题目有可能专注于识别逻辑谬误(比如滑坡谬误、人身攻击、诉诸权威等),或者评估证据的可靠性。

其核心问题在于孤立性这类测试常常是以一个单独的个体事件而存在的,它跟具体的学科教学内容相互分离,也跟学生们的知识积累进程相脱离。可是呢,批判性思维没办法在没有任何外界影响的环境里开展。就像《PISA 2025科学素养评估框架》着重表明的那样,高阶思维能力的评估是一定要跟具体的知识内容(学科内容知识、程序性知识、认知性知识)以及实际的情境相互结合起来的。要是脱离了对于特定领域知识(比如科学、历史、文学)的深入了解,那所谓的“批判性思维”很容易就变成技巧性的诡辩或者空洞的形式练习了。因此,这类独立模块有着评估结果,对于预测学生于真实的学术场景里的表现,效度存疑,还要预测学生在复杂的学术场景中的表现,效度同样存疑。

批判性总结:思维评估的悖论与未来

总的来说,TSA在针对精英大学选拔这个特定目的的服务方面,是相对而言最为有效的工具,然而它远远谈不上完美,并且它的成功还反映出思维技能评估范畴内在的几个矛盾之处:

1. 能力与培训的悖论TSA意图测评那种难以借由短期填鸭式教学来获得提升的“天生”思维能力,可是现存一个已然形成的庞大备考产业,像TSA辅导这类,它专门致力于借助策略以及刷题的方式来推动分数的提高,这带来了一个谜题,最终所测出来的,到底并非是可培训的应试技巧,而是不可培训的核心能力呢,还是并非是不可培训的核心能力,而是可培训的应试技巧呢 ?

2. 公平性与背景的悖论所有的标准化测试全都在努力追求公平,TSA运用日常语言以及非专业问题,然而,批判性思维的培育跟大量的阅读、讨论以及高质量的思维训练紧密相连,而这常常跟社会经济背景还有基础教育资源相挂钩,TSA能不能彻底去除这种背景优势所带来的影响,依旧是教育公平领域一直关注的话题。

3. 预测与局限的悖论:TSA能够在较为不错的状况下对学生于那些需要高强度逻辑分析的课程里的学术潜力做出预测。然而,TSA没有办法去评估创造力、同理心、实践智慧、协作精神等这些同样重要的成功素养。存在这样一个情况,将思维技能缩小范围变成逻辑推理以及问题解决这种形式,可能会致使忽视人才构成的多样性。

以后的思维技能评估,也许会朝着更具融合性、更倾向情境化的方向去发展 。就如同PISA测评的趋势那般,把认知需求(从单纯的回忆转变为复杂的分析)跟具体的科学、阅读情境进行深度融合 。与此同时,像基于脑电图(EEG)的神经评估这类新兴技术,尽管当下成本高昂且解读复杂,不过却提供了直接观察大脑活动数据的全新可能性,作为传统行为评估的一种补充 。最终,不存在任何单一测试能够定义一个人的思维价值 。或许,最有效的评估是这类:它能够嵌入学习过程,它可以提供持续反馈,它还能促进学生无认知能力发展并且它不只是尺子,它更是镜子与阶梯。

更多咨询请联系yzh@hotmail.co.uk


Discover more from TutorHao

Subscribe to get the latest posts sent to your email.

Comments

屏轩国际教育cambridge primary/secondary checkpoint, cat4, ukiset,ukcat,igcse,alevel,PAT,STEP,MAT, ibdp,ap,ssat,sat,sat2课程辅导,国外大学本科硕士研究生博士课程论文辅导

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Discover more from TutorHao

Subscribe now to keep reading and get access to the full archive.

Continue reading