世界人工智能系统智商测试及智能等级划分理论和方法
-
.
世界人工智能系统智商测试
与智能等级划分理论和方法
本
论
文
英
文
版
(
Intelligence
Quotient
and
Intelligence
Grade
of
Artificial Intelligence
p>
)在数据科学年鉴
2017
年
11
月(
Annals of Data
Science
)发表
作者:中国科学院虚拟经济与数据科学研究中心
锋、
石勇
、颖
一.人工智能系统智商测试
1.
p>
提出标准智能模型,统一描述人工智能系统和人类特征:
2015
年以来,“人工智能”成为科技界和产业界最热门的词语。
p>
智能冰箱、智能空调、智能手表和智能机器人,还有谷歌、百度各自
的人工智能大脑等新产品不断涌现。
但与此同时,
人工智能威胁
论也
甚嚣尘上。
我们能否通过研究人工智能产品和系统的智商发
展水平并
与人类智商进行对比,
从而为解决人工智能威胁论问题
寻找定量的分
析方法呢?
人工智能定
量评测目前面临两个重要挑战:
第一,
人工智能系统
目前没有形成统一的模型;
第二,
人工智能系统与
以人类为代表的生
命体之间目前没有形成统一的模型。
这两个挑战都指向了同一个问题,即对于所有的人工
智能系统
和所有生命体
(特别是以人类为代表的生命体)
需要有一个统一的模
型进行描述,
只有这样才
能在这个模型上建立智力测量方法并进行测
试,从而形成统一的、可进行相互比较的智力
发展水平评价结果。
.
.
从
2014
年开始,针对如何定量分析人工智
能与人类智慧的关系
进行了研究,科学院虚拟经济与数据科学研究中心锋、石勇、颖团队
参考·诺伊曼结构、
戴维·韦克斯勒人类智力模型、
知识管理领域
DIKW
(
Data, Information, Knowledge, Wisdom
,数据
、信息、知识、智
慧)模型体系等。
分别在
2014
年和
2015
年发表论文
提出建立“标准
智能模型”,统一描述人工智能系统和人类的特征和属性。
标准智能系统定义:
即
无论对于人工智能系统,
还以人类为代表
的生命,
如果符合如下特征,
就可以认为这个系统属于标准智能系统
< br>(
Standard Intelligent
System
):
特征
1
能够通过声音、图像、文字等方式(包括但不仅限于这三
< br>种方式)从外界获取数据,信息和知识的能力。
特征<
/p>
2
能够将从外界获取的数据、
信息和知识
转化为系统掌握知
识的能力。
.
.
特征
3
能
够根据外部世界或自身系统发生问题所产生的需求,
通
过运用所
掌握的知识进行创新的能力,这些能力包括但不仅限于联
想、创作、猜测、发现规律等,
这种能力运用的结果是解决问题并形
成自身掌握的新的知识。
特征
4
能够通过声音、图像、文字等方
式(包括但不仅限于这三
种方式)
将系统产生数据,
信息和知识反馈给外界或对外界进行改造。
<
/p>
标准智能系统与外部世界以及相互之间进行数据、
信息、
知识的
交互图示
(本图中为了简化,
把数据、
信息、
知识统一用知识描述)
。
3.
标准智能系统评测模型
.
.
如
果我们希望对一个智能系统进行智能(智力)水平评测,就需
要能够同时对准智能系统四
个特点进行测试。
检验其发展水平,
通过
检测能否将数据,
信息和知识输入到智能系统中检测该系统知识的获
< br>取能力;通过检查智能系统知识库的容量检测该系统知识的掌握能
力;
通过检查智能系统能将多少数据,
信息和知识转化为新的知识库
容从而检测该系统知识的创新能力。
通过检查智能系统能否将掌握的
知识库容根据需求分解为数据,信息和知识向外界传递。
扩展诺依曼架构
.
.
标准智能模型的建立参考了·诺
伊曼架构。·诺伊曼架构由计算
器、逻辑控制装置、存储器、输入系统和输出系统五个部
分构成。通
过对比诺依曼架构和标准智能模型的差别能够发现,·诺伊曼架构可
以补充两个部分。通过这种补充,我们得以将人、机器以及人工智能
系统
用一个更为明晰的方式表示出来。
第一个补充是创新创造功能
,
即能够根据已有的知识,
发现新的
知
识元素和新的规律,使之进入到存储器,供计算机和控制器使用,
并通过输入
/
输出系统与外部进行知识交互。第二个补充是能够进行
< br>知识共享的外部知识库或云存储器,而·诺伊曼架构的外部存储只为
单一系统服务
。因此,对·诺伊曼架构进行扩展,可形成新的架构。
.
.
5.
建立人工智能智商测试量表。
<
/p>
根据标准智能系统模型的特征要点,
从知识的获取能力
(观察能
力)、知识掌握能力、知识创新能力,知识的反馈能力(表达能力
)
等四大方面建立互联网智商评价体系
,
并从这四个方面建立
15
个分
测试,
形成人工智能智商测试量表。
.
.
6.
建立人工智能智商测试题库
p>
-
例
根据人工智
能智商测试量表,可以建立如下互联网智商测试题
库,下面我们从每个分测试的题目中选
取一道题目进行说明。
(
1
)识别文字的能力
.
.
是否能够录入字符串“
1+1
p>
等于多少”,并反馈正确结果。
(
2
)识别声音的能力
声音读出“
9+12
等于多少”,能否识别并反馈正确结果。
(
3
)识别
图形的能力
测试人员在一白纸上画出如图
3-10
所示问题,测试能否识别问
题关联相关图形并反馈
正确结果。
(
4
)掌握常识的能力
世界上最长的河流哪一个?
(
5
)掌握翻译的能力
把“力量”翻译成日文。
(
6
)掌握计算的能力
234568
乘以
678
等于多少?<
/p>
(
7
)掌握排
列的能力
请将大学生、小学生、中学生、博士、硕士按学历从
高到低进行
排列
(
< br>8
)掌握挑选的能力
.