智力测验发展
-
智力测验的演变和展望
< br>从比纳编制世界上第一个智力测验起,智力测验已历经百年沧桑。在这
百年中,智
力测验从法国传播到了世界上许多国家,从教育行业推广到
军事、商业、管理等诸多领域
,从只针对儿童扩大到面向生命全程的各
个年龄阶段,
从主要诊
断异常儿童拓展到适应正常人和智力落后者的不
同需要。目前,研究者已经开发了多种类
型的智力测验,这些智力测验
蜚声世界,也极大地影响了教育及其他社会领域。然而,随
着传统智力
测验的广泛运用,
它也越来越暴露出一些弊端,
p>
并因此受到人们的批评。
研究者们正在努力改变这种状况,传统的智
力测验正在发生演变,呈现
出新的特点。
一、智力测验的依据:从考
虑项目的鉴别性、区分性到增大理论含
量
在智力测验的依据方面,一些研究者指责传统的智力测
验并没有从
有关智力的基本理论出发,不是心理测量学理论化的结果
[1](P430
—
460)
。确
实,最早的智力测验是为了区分出需要接受特殊
教育的儿童,因此在项目的设置上更多地
是出于特殊需要的考虑。以后
的智力测验大多沿袭了原有的传统,在编制时更多依据项目
的鉴别性、
区分性而非基本理论。因此,这样的测验虽然能够很好地评价智力的个
别差异,却无法使我们更清楚地认识到智力的本质。
基于传统智力测验在理论性上的这种不足,新开发以及
修订的智力
测验有意识地加大了理论含量。
考夫曼首先改变了以
往的智力测验非理
论化的特点,以发展中的智力理论为依据,先后编制了儿童评估量表<
/p>
(
Kaufman Assessment Battery
for Children, K-ABC
)和青少年
—
成人智力量表(
Kaufman Adolescent &
Adult Intelligence,
KAIT
)
[2](P244
—
305)
,其中
K
—
ABC
重点放在信息加工上,分别
考察了系列加工、同时加工、心理加工组合和成
就等级;而由一个晶体
智力量表和一个流体智力量表构成的
KA
IT
则试图整合霍恩和卡特尔的
流体和晶体智力理论以及其他理
论家所提出的成人智力理论。
考夫曼以
理论框架来指导量表项目
编制的努力值得肯定,
但是他所依赖的理论是
否适合于测验目的
、
是否能得到广泛的认同还有待于时间的检验。
另外,
最新修订的斯坦福
—
比纳量表(
Stanford
—
Binet scale
—
IV
,简称
SB
p>
—
IV
)
[3]<
/p>
,其
15
个子测验也按照智力结构的三层
次等级模型组织
起来,
在斯
—
比量表的理论构想中,
g
因素是最一般的能力,
晶体智力、
流体分析智力和短时记忆是三个二级水平因素,
p>
第三级水平也有三个因
素,
即对应于晶体智
力的言语推理和数量推理以及对应于流体智力的抽
象/视觉推理。
有些研究者则尝试了另外一条道路,他们试图建构
一套完整、系统
的智力理论,以便根据智力模型的理论构架来编制智力测验,弥补传统<
/p>
智力测验理论含量的不足。比如戴斯等人在神经生理学基础上,整合了
信息加工心理学和心理测量学理论,提出了智力的
“
计划<
/p>
—
注意
—
同时<
/p>
性加工
—
继时性加工
”
模型(简称
PASS
理论模型)
。依据
PASS
理论
模型,他们在进一
步实验研究的基础上,编制了一个标准化测验
——
戴
斯
—
纳格利尔里的认知评估系统(简称
CAS
)
[4](P12
—
115)
,该测
验面向
5
岁
0
个月至
17
岁
11
个月的个体,目
的是测量与学习有关但
又独立于教育的基本认知机能。全量表由
12
种任务类型构成四个分测
验,每一分测验有三种任务,分别
测量了计划、注意、同时性加工和继
时性加工,测验中既包括言语测验也包含非言语测验
,呈现的形式既有
视觉通道也有听觉通道。经大样本实验发现,
CAS
能够非常有效地鉴
别认知薄弱的儿童,并为未来的干预
提供基础。因此,目前
CAS
已经
开
始在临床研究中使用。
CAS
有比较成熟的理论和实验基础,<
/p>
并且经过
较严格的标准化,
与传统上缺乏
完整理论支持、
针对性较差的量表相比,
CAS
更系统,
评估的能力更广泛,
也更具针对性,
是对传统智力测验的
很好补充,
而戴斯等人的尝
试也为今后智力测验的编制提供了有益的启
示。
二、智力测验的内容:从着眼于学业到测量更广泛内容
在智力测验的内容方面,许多研究者批评传统的智力测
验仅仅着眼
于学业,视野过于狭窄
[5]
。传统智力测验测量的实质是与学业有关的
智力,其内部效度就是力求与学校教育的内
容、方式一致,而外部效度
则追求预测学业成功,表现出明显的学业取向,智力的内涵被
局限于一
个比较狭隘的范围内,应当与现实相联系的部分却被严重忽视。
鉴于传统智力测验在内容上的这种局限,一
些研究者主张从更宽广
的视角看待智力和智力测验,测量更广泛内容。如斯滕伯格强调智
力不
仅仅与儿童、
青少年的学业相联系,
还关系到个体工作以及人生的成功,
并由此提出了成功智力理论
[5]
。成功智力包括三个方面,除了传统智
力测验所测量的
分析性智力,还包括创造性智力和实践性智力。在成功
智力理论的基础上,斯滕伯格和他
的同事经过大量的实验和教育实践,
设计出了成功智力测验,
旨
在评价个体的分析性、
创造性和实践性智力。
该测验由
12
个子测验组成,其中对每种智力的评价包括三个多选测验
(内容分别为语言、数字和图形)和一个问答测验
[5][6]
。斯滕伯格和
他的同事通过研究特别指出,
实践性
智力和创造性智力正是传统智力测
验所忽视的。
比如,
实践性智力主要体现于潜在知识
(
tacit
knowledge
)
中(所谓潜在知识,指个体在一个环境中
为了有效地工作而必须知道、
但又没有明确地被教导过、无法用语言表达的知识),实验
发现,潜在
知识的测验分数与传统智力测验分数不相关,
说明潜
在知识与传统智力
测量的内容不同。而有关研究表明,潜在知识比传统智力测验能够更好
地预测个体在实际工作中的表现。因此,斯滕伯格认为传统的智力测验
< br>不论是在测量的对象、材料的类型还是测量的方式上都不够完善,已经
到了拓展传
统智力测验的时候了
[5]
。
对传统智力测验拓展的另一方向源于毕生发展心理学的
兴起,人们
逐渐重视对成人的研究,认识到开发真正适合于成人的智力测验的必
要。研究发现,传统的用于儿童的智力测量类型并不适合于成人,其中
重
要的原因就是,用于儿童的智力评估标准多与学业成就相联系,而对
成人智力的评估,不
应仅仅着眼于一个狭窄的主流文化中可利用的知
识,还应关注职业成功、工作表现以及一
生知识的获得等等。因此,成
人的智力标准,
无论就其内容而言
还是就其范围而论都应与儿童大不相
同。如埃克曼在其提出的智力发展的加工
—
人格
—
兴趣
—
知识理论(简
称
PPI
K
)中就强调,在成人的智力评估中应当扩展知识的类型,特别
是那些对工作和成人生活成功重要的知识
[7]
。他认为,传统
的评估关
注的是知识的历史成分,它们大部分来自于正规教育,但智力测验还应
注重那些经过努力和相当长的一段时间积累起来的知识,
这些知识是通<
/p>
过成人生活经验包括工作、爱好等获得的。为了更好地测量智力的教育
/文化知识成分,埃克曼等人从大学水平考试中抽取了
20
个知识领域
的主要内容,编制了知识量表,并以此对不同人群进行了研究,发现当
这些知识作为智力评估的核心成分时,智力并没有随着年龄而下降。
另一些研究者在其对成人智力发展的最新观点中也指出
,所谓智力
发展就是不断地整合那些特定领域中的新知识和日益增加的处理信息
的专业化程序,这是整个成人生涯认知发展的核心,由此强调了领域特
异
性知识(
DSK, Domain-Specific Knowledge
)的重要性。同时,
一些对专家
—
新手研究、天才个体研究等的实验也支持了
DSK
对智
力
成绩的作用
[8]
。这些成果提示我
们,扩展成人智力测验的内容是十分
必要的。
斯滕伯格等人为拓展传统智力测验的内容作出了很大的
努力,但其
编制的量表要成为具有普遍意义的智力测验还有一段距离;另外,埃克
曼等人的知识量表的局限在于,
所测量的知识依然主要是通过学业训练
而不是通过非学业经验获得的。
三、智力测验的形式:从静态、回顾性的测验到动态测验
在智力测验的形式上,一些心理学家认为传统的智力测
验是一种静
态、回顾性的智力测验,虽然能够测量儿童已有的能力以及所达到的水
平,但是不能反映儿童学习新知识的能力即学习的潜在能力
[3]
p>
,对智
力发展的前瞻和预期能力不足,
而且
结果常常会受到被试的社会、
经济、
文化、教育等诸因素影响,
因此往往会低估一些儿童的智力水平。
由于传统智力测验更多指向儿童的过去
——
那些已经
发展形成的能
力,
不能很好测量儿童的现在和未来
——
那些正在形成和即将发展的能
力,因此,一些研
究者提出了动态测验的思想,即不仅测量个体已经发
展的能力,也要测量正在发展的能力
[9]
。动态测验由维果斯基最近发
展
区的思想发展而来。所谓最近发展区,代表的是个体实际发展水平和
潜在发展水平之间的
距离,
“
是那些还没有成熟但处在成熟过程中的功
能,它们可能明天就成熟但现在还处在胚胎阶段
”
。
维果斯基认为心理
学家在评估个体的能力时不仅要具有回顾性,还应具有前瞻性,实际发
展水平体现的是已有的心理发展,
而最近发展区则体现了预期的
心理发
展
[10]
。
< br>动态测验就是试图评估个体智力潜能、
测量最近发展区的一种
测验
[11]
。
动态测验常用的范式是将测验与干预结合起来,通常要
求被试在测
验中学习,其程序是:前测
——
教学(训练)
——
后测
[5]
p>
,被试在两
次测验之间的获益代表了其学习潜能。与传统智力测验相
比,动态测验
更多关注学习发展过程,关注主试与被试之间的互动,关注在学习过程
p>
中由主试对被试的学习能力作出评价。已有研究表明,动态测验能够有
效地反映被试已有能力和潜能之间的差异。由于不仅评价儿童现有水
平,还着眼于儿童
的发展潜能即最近发展区,寻求将潜能变为现实的干
预手段,所以动态测验在近二十年来
已经越来越受到重视。例如,研究
发现弗瑞斯坦的学习潜能评估测验
(
Learning Potential Assessment
Device, LPAD
)与传统的智力测验相比能够更好地
预测被试的学习能
力,因此已经开始运用于临床
[3]
。而布朗等人则将实验程序中的干预
和之后的迁移进一步量化和标准化,
大大提高了动态测验的信度、
效度,
也
拓展了其应用范围
[12]
。
动态测验为我们提供了一个看待智力本质以及测量智力
的新视角,
也更丰富了原有的智力理论,是静态智力测验的重要补充。但是,和静
态智力测验一样,动态测验也只是测量了智力的一个方面而已,并不能
就此取代静态智力测验,要全面评价儿童智力,还应当把两类测验结合
起来。另外,目前
的动态测验在理论和操作上还比较模糊,标准化程度
不高,较多依赖于传统的智力测验,
因此还有待于进一步改善。
四、智力测验的编制和实施:克服文化不公平现象
在智力测验的编制和实施上,许多研究者指责传统的智
力测验存在
着文化不公平现象,
即研究者所编制的智力测验主要
测量的是他们所认
同的适合主流文化的技能和知识,
文化偏差造
成了对其他文化的个体智
力低估的现象
[1](P430
—
460)
。在智力测验的施测中也存在着这
样的
问题,施测者与被测者的文化背景不同导致彼此不能很好沟通、反馈和
相互领会,影响了被测者的发挥及其
IQ
分数。
p>
文化不公平现象,是从智力测验
产生伊始就存在的问题,至今仍然
是智力测验领域的一道难题
[
1](P430
—
460)
。为了克服
这个问题,研
究者曾经编制了受文化经验影响较小的智力测验,
例如瑞文图形推理测
验、卡特尔文化公平测验等。由于受心理测量学智力理论的影响,传
统