(完整版)手写阿拉伯数字识别开题报告
-
题目类型(打√选择)
设计(
√
)
论文(
)
一、文献综述
手写阿拉伯数字的识别
一直是近年来模式识别及图像处理领域的研究热点,是字符
识别的一个分支
,
问题虽然简单
,
但却有较
大的实用价值。广泛应用于财务,税务,邮政,
科研,
以及大规
模数字统计工作之中。
例如:
目前中国在信函通信时广泛使用了
邮政编码
,
用手写体数字识别技术进行信函的自动分拣对减轻邮
电职工的手工分拣工作有很大意义。
随着我国经济的发展,手写数字识别在经济领域也将
发挥更多的积极作用。
作为光学字符识别的研究方向之一,近
年来,研究者们分别开发出基于结构特征的
研究方法,基于统计特征的研究方法等诸多方
法,取得了不少令人满意的成果。例如组合
结构特征的自由手写体数字识别算法
[5]
,基于骨架结构特征的手写数字识别方法等
[3]
。研
究基于统计特征的方法主要有模版匹配法,
像素点统计分析法,
全局变化及级数展开法等。
有学者提出了基于手写数字图像的空间、旋转、层次和结构特性的特征提取方法
[4]
。
对于手写数字的识别,研究者们分
别提出不同的识别工具,其中支持向量机,隐马
尔可夫模型,以及人工神经网络等模型均
成为研究热点。
支持向量机的方法具有较好的性能及识别率,
也具有较高的识别精度,正成为机器
学习领域中一种新型的热门研究方法。
SVM
学习得到的优化结果是全局最优解,
SVM<
/p>
的
学习结果为支持向量集,充分体现了整个样本集的属性。隐马尔
可夫模型是一种基于马尔
科夫随机过程的统计模型,其善于处理随机信号,在语音识别领
域的应用性较广。
HMM
模型通常有
3
种类型
:
离散隐马尔可夫模型
(DHMM),
连续隐马尔可夫模型
(CHMM
)
和半连
续隐马尔可夫模型
(SCHM
M)
。
DHMM
需要进行矢量量化
(VQ),VQ
会带来一定的误差
,
而
且
VQ
与
HMM
的训练是分离的
,
因而其性能不如其他两个模型
,
但
运算量少
,
计算简单
[1]
。
人工神经网络采用的是人体大脑中的学习反馈
思想,有较高的运行效率,实现方式也相对
简单。误差反向传播神经网络,简称
BP
神经网络,是一种朝着满足给定输入输出关系方
向进行自组织的网络,是应用最为广泛的一种神经网络。
用
BP
网络来识别手写体数字是手写体数字识别的一大进步,将
BP
网络技术和数字
本身的结构特征结
合起来,提出了一种基于结构特征分类
BP
网络的手写体数字识
别新方
法。首先提取点、环等数字特征值,并根据一些特征进行分类;然后再运用
BP
神经网络
识别,以提高网络的识别能力<
/p>
[2]
。
BP
神
经网络具有以下优点
:
(
1)BP
p>
神经网络实质上实现
了一个从输入到输出的映射功能,
数学理论证明三层的神经网络就能够以任意精度逼近任
何非线性连续函数。这
使得其特别适合于求解内部机制复杂的问题,即
BP
神经网络具
有
较强的非线性映射能力。
(
2)BP
神经网络在训练时,
能够通过学习自动提取输出、输出数
据间的“合理规则”,并自适应的将学习内容记忆于网络的权值中,具有高度自学习和自
适应的能力。(
3)BP
神经网络具有将学习
成果应用于新知识的能力。
(4)BP
神经网络在受
到局部损伤时还是可以正常工作的,具有一定的容错能力。基于上述优点拟采用
BP
神经
网络算法实现手写数字的识别。
< br>