TopMEDIA 
顶思传播
八轮PISA测试,跨时21年,其变化趋势说明了什么?
来源: | 作者:陆璟 | 发布时间: 2019-06-12 | 1220 次浏览 | 分享到:

PISA测试的一举一动历来颇受关注。就在上个月,上海市教育科学研究院副院长陆璟,在上海市小学学术论坛上,发表了《PISA发展对改进评价的启示》的主题演讲。陆院长从评价21世纪能力、元认知测评、情境设计、能力分类几个维度展开,进行了详细阐述,前沿的观点给大家带来很大启发。

本文为陆璟的现场发言整理,与读者分享。

本文来源:第一教育 ID: (diyijiaoyu)

文 | 陆璟

编 | Luna

上海市教育科学研究院副院长陆璟发表主题演讲

今天我主要讲一讲PISA与21世纪能力评价的关系,然后针对其中的元认知测评、情境设计、能力分类等举一些具体的例子来讲。

PISA测评体现21世纪能力

PISA测评到现在已经做到了第八轮,从2000年开始,每一轮都有阅读、数学和科学三个领域,但是主要的测试领域是变化的。

(点击图片可放大查看)

这里的粗体字就是它的主要领域,比如,2000年的主要领域是阅读,其他的就是次要领域。PISA测评的主要领域是轮的,从阅读到数学到科学。

除了这个主要的测试领域之外,我们看到它对于突破传统的认知能力越来越关注。

比如,2003年增加了问题解决测评,当时只是纸笔测试,到了2009年开始引入数字化的测试,在部分国家做了一个数字阅读的选项;为了了解计算机相关问题,又增加了ICT,就是信息通讯技术熟悉度的背景问卷调查。

到了2012年,我们可以看到,计算机化的测试更加被强化了,增加了计算机化问题解决,这是必试的,只要有条件,是一定要参加的,还有计算机化的阅读和数学,这是可选项,但是建议大多数国家尽量参加,还有一个是财经素养,它是对于跨学科的主题学习的评价,ICT问卷仍然有。

到了2015年,问题解决又深化为协作问题解决,它主要来测评合作能力。学生和计算机当中的模拟人物,通过对话沟通来解决问题。学生掌握一部分信息,机器模拟人物掌握另一部分信息,或者它可以控制另外一些条件,只有通过沟通,共同合作,你们才能够完成解决问题的任务,同时也有财经素养和ICT问卷的选项。

到了2018年,增加了全球胜任力的问卷调查,还增加了幸福感问卷。2015年,已经有幸福感调查,那个时候主要一些问题,还没有专门的系统选项。

2021年,在这个基础上,又将增加创造性思维的评价。

所以从PISA测评整个发展趋势来看,有三个特点:

第一,关注的问题突破了传统的阅读、数学和科学等认知能力的范畴,重视创新思维、问题解决、合作能力、信息素养、财经素养的测评。

第二,开始关注到重要的非认知能力,比如说全球胜任力、幸福感,这些都是采用问卷调查的方式进行测评。

第三,在测试的方式上,从2015年开始,全部采用计算机化的测评,没有纸笔测试了。

从这样的变化过程中,我们可以看到PISA更多体现21世纪能力,在21世纪能力评价上,有很多国际组织关注,其中一个比较有影响力的叫做21世纪技能合作组织,它关注的能力包括表中所列的四大块。

(点击图片可放大查看)

北师大教育创新协会中心刘坚教授牵头做了一个关于21世纪能力的全球比较,叫做面向21世纪的核心素养。他把各个国家做的21世纪能力框架合在一起,总结、梳理出了18种最重要的能力,这里面有14种在PISA测评当中得到了体现。

我们从表的对照可以看到,21世纪技能合作组织关注的很多内容,在PISA测评里面也有体现。

各国所关注的21世纪能力通常有三个特点:跨领域、多维度、高层次。所以我自己界定了21世纪能力,是指将知识和技能迁移或应用到新情境中,解决复杂问题以及有效参与社会的能力,这里面包括了情境的适应,也包括了解决复杂问题的能力,还包括了一些参与社会的态度,社会责任感等非认知能力。

元认知怎么测评?

因为涉及的内容比较多,所以我只举其中一个我们比较关注的部分。21世纪能力是高层次的,也就是我们常常说的高阶思维。什么叫做高阶思维?比较多的研究者会提到布鲁姆的创造、评价、分析、运用、理解、记忆的高阶思维。马扎诺提出了自我系统、元认知系统、认知系统、知识系统,从这个系统来看,布鲁姆的教育目标分类主要涉及到教育和认知,他很少涉及元认知。

(点击图片可放大查看)

但是我们从马扎诺的四大系统来看,他怎么看待一个人解决问题的过程?比如说我们有一个新任务,首先由自我系统来决定我是否要做这个任务,由元认知系统提出相关的目标和策略,接着有由认知系统处理相关的信息,这三个系统的运作都要借助已有存储的知识系统。

我们用通俗的话来解释,自我系统就是判断这个任务重要不重要,做了对我有好处吗?有意义吗?我能不能做,我有没有能力做,我想不想做,我有没有动机来做?如果判断这个任务很重要,而且我有可能做成功,然后我也很想做,能够产生积极效果,我就会把这个任务接下来。决定要做了以后,就要启动元认知系统,元认知系统决定怎么做,我要确定目标、制定计划,分步骤达到这个目标,我采用什么方法和策略达到这个目标,最后评价这个目标有没有实现。

我们的教学首先看大的目标是什么,然后把这个目标分解成一系列的过程,然后研究我们要达成目标的策略,然后是我怎么搜集证据来证明我达到了这个目标,其实这就是元认知。

上海很多学生没有经历这样的环节,可能和老师平时把任务切得太碎了有关系。这个任务能不能完成,取决于他掌握的知识量,知识是很重要的,但是仅有知识是不行的。所以,我理解的高阶思维既包括布鲁姆认知目标分类当中的分析评价和创造,也包括了元认知和自我系统,它并不完全是认知性的,它还涉及到一些非认知,自我态度动机的这些成分。

举一个例子,我们从阅读素养来看一下元认知为什么很重要,并且在PISA测评中,怎样体现元认知。PISA在2000年把阅读素养作为主要框架领域,它的框架里面提到了阅读的参与和元认知,它对阅读素养有很重要的作用,到了2009年的阅读框架里面,更加突出了阅读的参与和元认知,不仅因为它对阅读素养有影响而显得重要,而是它本身就是一个重要的评价内容,所以在PISA2009的学生问卷中调查了学生的元认知策略。PISA2009框架的第二个重大修改涉及纳入数字文本,PISA2009是第一个测评数字阅读能力的大规模国际研究。

到了2018年,这个阅读框架又重新修改了,把阅读过程分成了两个部分,一个叫做文本处理过程,包括怎么查找信息,怎么理解文本,怎么评价反思,另外,还有一个任务管理的过程,现在越来越注重关注多任务的阅读和管理,你要看多个文本以后,才可以得出一个分析和判断。多个文本同时处理或任务目标需要多个步骤,就要涉及到一个任务管理,通过计算机的测评可以搜集学生在后台处理多个文本或多个步骤的一些过程性信息,比如,你是仔细读了题目以后,仔细想了以后再去做的?还是拿上来就做的?

元认知能力怎么测评?PISA采用了两种方法,一种是问卷调查,举一个例子来说,怎么样评价学生是不是知道哪一些方法对阅读成功很重要,其中有一个策略叫做理解和记住信息的策略,测试就给学生一个问题,这个问题列了六个策略,让学生来评价这个策略对你的理解和记住文章是不是有用,最有用的就是6分,没有用的就是1分,学生打完分以后,就把学生的评价和阅读专家的评价去比较,看其中的一致性。如果一致性高,说明这个学生掌握策略程度比较好。

理解和记住信息的策略

你必须理解并记住文章中的信息。对于理解和记住文章而言,你如何评价下列策略的有用性?

A. 我将注意力集中在文章中容易理解的部分

B. 我快速地把文章读两遍

C. 读完文章后,我与别人讨论文章的内容

D. 我划出文章的重要部分

E. 我用自己的话总结文章

F. 我大声地把文章朗读给另一个人听

上海学生在这个上面,刚刚超过OECD平均,掌握程度是中等。还有包括概括信息的策略,监控策略也是元认知。监控策略非常重要,但是我们上海学生的指数显著低于OECD平均。

方法二,就是刚才说到的后台数据分析。我举一个例子,我们有数字阅读的选项,通过学生在计算机上点击的链接可以看到,学生为了完成这个任务,他点过哪一些链接。

(点击图片可放大查看)

左边的这张表就是学生点过的链接数量,我们可以看到,上海的学生和新加坡的学生都排在上半部分,说明大家的积极性都很高,点了很多的链接。右边这张图是评价你点击链接的质量,即你点的链接和你最后解决任务的目标是不是一致的,你点的是否是有用的链接,还是你看到好玩的都尝试一下。我们可以看到新加坡学生点击的链接的质量最高,全部集中在他要解决的目标上,上海学生就是东看看,西看看,走到一半可能都忘记了最后我到底要解决什么问题,说明他头脑中没有这样一个目标认识,在过程当中也不会检查自己有没有朝着这个目标去走,这就是为什么我们纸笔测试成绩远远高于新加坡,但是数字化阅读成绩显著的低于新加坡,通过计算机的测评我们就可以发现这些问题。

情境设计是测评知识迁移能力的关键

我们不能说21世纪能力只关注创造性思维、合作能力等,其实,阅读数学和科学也是最基础的能力。所以,PISA在阅读、数学、科学测评当中,也采用了问题解决的方式来考察在新情境当中的应用。

这是日本借鉴了PISA测评重新设计了他们的评价,数学A卷考知识,B卷靠应用,A卷中这个平行四边形的面积,学生的正确率达到了96%,但是B卷同样用这样一个概念来比较两个公园面积的大小,正确率只有18%。

所以在现实情境当中的应用涉及到了一个转化,要到实际环境当中去找这个高究竟在哪里,这就是一个难点,学生就不会去找。所以我们如果考试只把式子列好给他,或者把最重要的信息挑好给他,没有干扰信息,学生做起来很容易。但是如果现在有很多干扰信息,你要找出哪一个是你需要的,就增加了难度。

还有PISA测试中一道小学水平的数学样题:

艾瑞克是个滑板迷,他到一家名为“滑冰者”的商店看一些商品价格。

在这个店里,你可以买一个完整的滑板,也可以买一个板,一套4个轮子,一套2副转向架,一套配件,再自己组装成滑板。

商店里商品的价格如图所示。

艾瑞克想自己组装滑板。要是在这个店里自己组装滑板,最高价和最低价是多少呢?

这其实就是一个加法。如果你只列一个算式给学生,我估计正确率可以达到95%,但是从全球的情况来看,很多学生可能只能答对其中的一个。

再比如,我们参加PISA测试之前,我拿了一道旋转门的题目,问我们教研室的老师,这样一道题,学生的正确率可以达到多少?老师的判断是70%到80%。实际上,上海学生最后正确率只有14%,由此可见,换了一个生活的情境,其实影响还是挺大的。

PISA测评体现对问题解决过程中不同能力的关注

我们以数学问题为例,他给你的是一个现实背景的问题,然后要把现实问题变成一个数学问题,比如说你要知道,这个是可以列一个方程的,你把这个方程列出来,把现实问题抽象出一个数学模型。你列出了这个数学的式子,或者你找到了数学的方法,然后去解决,这就变成解决数学问题了。

得到了结果以后,你还要解释这个结果在现实当中是什么意义,是不是切实可行?整个过程,PISA测评把它分为三个能力,数学的表述,数学的应用,数学的阐释。

以我们经常会看到的数学试卷为例,一般我们根据题型来分,分为填空题,选择题,文字题,计算题,应用题等,老师讲解的时候,一种是一题一题讲下来,另外有一种,会根据题型,分析每一个大块的得分率是多少,看学生哪一个环节比较薄弱。但是如果你真的要解决学生的问题,你必须对每一个小题,去做这个题目评价了什么能力的细致分析,比如,这几题考查的是估算能力,那几题考查的是概念理解,要根据具体的分析然后重新归类,看看到底是哪一方面的能力不足,因为可能有一些填空题或者选择题,它评价的也是计算的能力。

比如,有些小学数学试卷80%以上的题目评价的都是计算能力,所以如果不用能力的框架对它分析,你测评的内容很可能会有所偏颇。怎么对能力做分析,这个我不是完全根据PISA,我是和实际结合,在高中新课标修订过程中测评学生核心素养的时候,我采用了这样一个框架,我们用题目分析特征的方法分析这个题是考哪一种能力,写出每一个题目的主要解题步骤,看看这里面最难的是哪一个步骤,要求最高的能力就是这一道题目测评的主要能力,如果这样还分不清楚,那就说明你出的这个题太综合了,你要分成若干小题。你命的题指向要清楚,一道题就是评价一个能力,或者一个小题就评价某一方面的能力,这样你最后就可以分析了。然后,还会分析它的情境,是不是熟悉,这就涉及到他是否会在新的情境当中迁移,它的条件线索的明确度就是它的难度,解题方法是不是常规的,这些就涉及到他的创造性。