Thinking Skills Assessment 思维技能评估是什么?它如何超越传统考试衡量批判性思考

在一种过度着重标准答案的教育体系内里,对学生最为宝贵的品质,也就是独立思考以及理性判断的能力,我们是不是正在进行系统性的“修剪”呢?思维技能评估在这样的背景状况下出现了,它尝试去衡量那些传统考试难以捕捉到的认知能力,像是批判性思维,还有问题解决以及逻辑推理 。本文会朝着深入方向去评测,当前教育领域里面的几种主流的思维技能评估体系,对它们的优点以及缺点展开分析,并且从一个具备批判性的视角去审视,这些工具究竟是怎样真正服务于教育的目标 的。

旨在系统个体高阶认知能力的工具是思维技能评估,它并非只关注“知道什么”,但更为关注“如何思考” ,这类评估一般存在多项选择题、情景判断、写作任务等形式,在限时条件下考查学生的分析、推理、和解决问题的能力。其核心理念是,这些技能是可教、可学且可测的,对学生在高等教育乃至以后社会中的成功十分关键。

于诸多评估工具里头,一种理想的思维技能测评体系应当拥有几个关键属性,首要的是 。信度即测评结果所具备的一致性及其稳定性,一般而言要求内部一致性系数(像是克朗巴哈系数)不得低于0.70,而高利害测试对此的要求是0.80以上。其次便是。效度也就是说,测评是不是精准地测到了它宣称要去测量的思维技能,这包含着内容效度呀,还包含着结构效度呀等等。最后呢是。可用性这里所指的,是工具在课堂环境里对于教育者而言实施起来是否便利,并且能否与现有的课程相互结合。接下来,我会针对几种具备代表性的评估体系展开评测。

TSA思维技能测评体系,是具备综合性的标杆,也是拥有权威性的标杆,是五颗星的标杆 。

被称作 (TSA)的体系,是在本次评测里,综合表现最为具有突出性的体系,该项体系发源于剑桥大学等顶尖学府的入学选拔,如今已经发展成为了一套对批判性思维以及问题解决能力进行评估的标准化工具。 。

TSA 的核心优势在于,其设计具备严谨性,应用拥有广泛性:一套典型的 TSA 包含大约 50 道多项选择题,这些题目全面覆盖了批判性理解、逻辑推理、数据分析以及论证评估等核心维度;此外,许多版本的 TSA 还包含一个 30 分钟的写作任务,此任务用于考察学生组织思想、清晰论证以及得出结论的深度思维能力。这种“选择题 + 写作”的复合模式,拥有既能大规模客观评分,又能捕捉学生主观、创造性的思维过程的特性,进而平衡了测评的效率与深度 。

经研究显示,像这样的标准化思维测试,是能够有效地对学生于高等教育里的学业表现作出预测的。其相应成绩和学术成功之间的相关性,是已经获得好些实证给予支持的。更为关键之处在于,TSA可不单单只是一个“筛选”的工具。借助给出详细的反馈,它能够助力学生以及教育者去识别思维方面的优势与盲点,进而有针对性地予以提升。这就在意为着TSA同时拥有了 。终结性评估(衡量最终水平)和形成性评估(促进学习发展)的功能,契合了现代教育评估的发展趋势。

2. 代表经典技能量表的加利福尼亚批判性思维技能测试,也就是CCTST,有着四颗星半的评级 。

开发加利福尼亚批判性思维技能测试的是法乔恩()等人,它属于国际上使用极为广泛的一种批判性思维标准化测试。这一测试的目的在于借助客观方式测量核心技能,比如分析、评估、推论、演绎以及归纳推理等 。

长期、广泛验证了CCTST的信效度,其内部一致性系数(KR – 20)一般处于0.70到0.84之间,展现出良好信度,在效度方面,CCTST成绩与研究生入学考试(GRE)、学术能力评估测试(SAT)等权威学术能力测试成绩有明显关联,佐证了其预测效度,针对护理专业学生的一项纵向研究表明,CCTST能敏锐捕捉学生在一个学期或一个季度内批判性思维技能的进步。

然而,CCTST也存在一定的局限性。首先,它主要侧重于认知技能有着相关的测量。虽然存在配套的《加利福尼亚批判性思维倾向问卷》(CCTDI)用以测量思维的习惯以及态度,然而这两者却是处于分离状态的。有批评明确指出,这样的分离没办法完整呈现出批判性思维作为一种综合性心理构念的整个面貌。其次,。

3. 沃森格拉泽批判性思维那用于评估的东西,它是企业跟教育领域之间所存在之桥梁,有着四颗星一颗介于四星五星中的半星的评分等级 。

在批判性思维测试当中呢,沃森-格拉泽批判性思维评估属于历史极为久远的那一类,它被广泛运用在企业招聘这一领域,也被广泛运用在人才发展这一领域,还被广泛运用在高等教育领域。它着重针对五个方面所具有的技能展开评估,一方面是推断,一方面是识别假设,一方面是演绎,一方面是解释,还有一方面是论证评估 。

最新版的WGCTA(即WGCTA-FS)有着扎实的心理测量学基础,针对大学生群体进行的测试表明,其内部一致性信度处于0.74到0.92的范围之中,重测信度是0.81,并且和课程成绩存在显著相关性,相关系数处于0.24至0.62之间。这充分显示出它是一个值得信赖且成效显著的测量工具。

WGCTA的特点在于试题情境多关联商业、社会以及生活议题,这致使它对商学院里的学生以及职场中的人士有着特别的吸引力。它作为一个连接学术思维与现实世界决策的桥梁而生。然而,这或许会引发文化偏差方面的问题。题目里的某些社会情境假设或许更契合西方文化背景,对于处于其他文化语境之下的测试者而言可能欠缺公平性,在全球化教育的当下,这是一个需要予以关注的挑战。

4. 康奈尔批判性思维测试,也就是CCTT,此为针对青少年学生所开展的适配性设计,有着三星半的等级。

康奈尔批判性思维测试,是由恩尼斯(Ennis)等人开发的,它有个显著特点,就是针对不同教育阶段设计了不同版本。比如说,X版适用于4 – 14年级的学生,Z版适用于资优高中生、大学生和成人。这种分级设计能让它更好地适应不同年龄段学生的认知发展水平。

能力包括归纳,可信度判断,预测与实验规划,谬误识别以及演绎等,CCTT主要对这些能力进行测量 。有研究表明确切指出,其高级版本也就是Z版,对研究生学业成绩的预测效度,和研究生入学考试也就是GRE,在程度方面等量齐观 。这将批判性思维作为一项基础认知能力的重要之处突出显现了出来 。

同时,CCTT的心理测量学指标的波动情况是相对较大的,其Z版于不同测试群体里的信度估计值处于0.49到0.87之间,这个跨度是比较宽的,尽管和其他批判性思维测试的效标关联效度大概为0.50,属于能够接受的范围,然而相对不够稳定的信度或许意味着测试结果会更容易受到样本或者情境的影响,所以,它更适宜当作低利害的教学诊断工具,而不是高风险的选拔依据 。

5. 对“全景”社会情感学习进行的评估,实现拓展思维技能外延的效果 。

“全景教育”( )的评估平台展现了一种更为广阔的视角,它把思维技能,尤其是批判性思维以及问题解决能力,放置于“社会情感学习”和“人生技能”的宏观架构之内,该平台借助学生自评问卷,去测量成长型思维、自我效能感、自我管理、社会意识这类跟成功紧密关联的软技能。

这样一种评估理念所具备的先进之处在于,它察觉到高效的思维并不是于真空中产生的。坚韧的品格、管理情绪的那种能力、理解他人的视角,这些属于社会情感技能的内容,是批判性思维能够得以有效运用的关键基石。有一项在2011年开展的元分析研究证实了,把社会情感技能发展融入到学校整体环境当中,能够显著地提升项目的效果以及学生各方面的成果。

然而,此类评估大多依靠自我报告法,其不足之处在于极易遭受社会赞许性偏差的作用,也就是学生往往会给出契合社会期望的回答。它所测定的是学生对于自身能力的“感知”,并非客观的“能力”自身。所以,它最为适宜用以作为了解学生自我认知、激发反思的辅助手段,需要跟TSA、CCTST等客观能力测试联合运用,才能够形成更为完整的画像。

批判性审视:评估的效用与教育的异化风险

虽上述评估工具于设计方面日益科学化,然而我们针对思维技能评估所怀有的热忱,必定要伴随以冷静的批判性反思。

“可测量”是否等于“最重要”?现今的标准化测试,为了达成信度以及效率方面的追求,不得不把复杂的、有着情境化特征的思维过程,简化成能够进行量化的选择题或者标准化写作。这极有可能致使教育实践出现“为考而教”这种异化现象:教师们也许会开始特意训练学生去应对特定的题型,像是辨认逻辑谬误的惯用方式。然而这和学生在真实生活里是否养成了质疑、反思以及公正思考的习惯,或许是截然不同的两码事。思维的某些深层次品质,比如求知欲、智慧勇气以及智力正直,要通过选择题去衡量是极其困难的。

是否存在文化偏见?大部分权威的思维评估工具,是在西方学术传统里诞生的。北京大学侯玉波等学者的研究表明,中国人和西方人在批判性思维的基本结构方面有相似之处,也就是都涵盖分析技能、开放性以及运用倾向这三个维度,然而思维的具体表达形式,所依靠的常识与案例背景,不可避免地带有文化特异性。直接运用西方工具的话,有可能低估或者误判在不同文化中成长起来的思考者。

评估是终点,还是起点?评估所具备的真正价值,并非仅仅局限于一个分数或者就应停止。它必然是要能够去提供有效的反馈,而且还要导向教学改进才行。比如说,采用。整体性批判性思维评分量规借助明晰的准则,使得学生确切知晓高质量思维的呈现情形究竟是怎样的,进而引领其展开练习并实现进步,或者,激励学生予以运用 。反思日志和数字档案袋让评估进程转化为持续性的,具备元认知特性的自我提升行程。反之,思维技能评估极有可能变成加剧教育焦虑以及内卷的又一冰冷的衡量标准。

对优秀的思维技能评估而言,像TSA以及CCTST这样,能给我们供给宝贵的诊断性信息。然而,教育者务必要清醒地认知到它们的边界,防止陷入“唯测评论”的圈套。真正的批判性思维教育,其目的并非是让学生在试卷上获取高分,而是培育他们成为在面对繁杂纷扰的世界之际,能够独立自主进行思考,清晰分辨对错黑白,担当责任去做出判断的终身思考之人。工具必须为这个终极目的提供服务,而非使目标屈服于工具。

更多咨询请联系16621398022(同微信)


Discover more from TutorHao

Subscribe to get the latest posts sent to your email.

Comments

屏轩国际教育cambridge primary/secondary checkpoint, cat4, ukiset,ukcat,igcse,alevel,PAT,STEP,MAT, ibdp,ap,ssat,sat,sat2课程辅导,国外大学本科硕士研究生博士课程论文辅导

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Discover more from TutorHao

Subscribe now to keep reading and get access to the full archive.

Continue reading