一种基于深度学习的古彝文识别方法

TP391; 作为世界六大古文字之一的古彝文记录了几千年来人类的发展历史.通过对古彝文的识别能够将这些珍贵文献资料转换为电子文档,便于保存和传播.由于历史发展、区域限制等原因,针对古彝文识别的研究鲜有成果.本文将当前新颖的深度学习技术应用于古老的文字识别.在四层卷积神经网络(convolutional neural network,CNN)基础上扩展出5个模型,然后利用Alpha-Beta散度作为惩罚项,对5个模型的输出神经元重新进行自编码,接着用2个全连接层完成特征压缩,最后在softmax层对古彝文字符特征进行重新评分,得到其概率分布,选择对应的最高概率作为识别的字符.实验表明,相对于传统...

Full description

Saved in:
Bibliographic Details
Published in浙江大学学报(理学版) Vol. 46; no. 3; pp. 261 - 269
Main Authors 陈善雄, 王小龙, 韩旭, 刘云, 王明贵
Format Journal Article
LanguageChinese
Published 西南大学 计算机与信息科学学院,重庆,400715%贵州工程应用技术学院 彝文研究院,贵州 毕节,551700 01.05.2019
Subjects
Online AccessGet full text
ISSN1008-9497
DOI10.3785/j.issn.1008-9497.2019.03.001

Cover

More Information
Summary:TP391; 作为世界六大古文字之一的古彝文记录了几千年来人类的发展历史.通过对古彝文的识别能够将这些珍贵文献资料转换为电子文档,便于保存和传播.由于历史发展、区域限制等原因,针对古彝文识别的研究鲜有成果.本文将当前新颖的深度学习技术应用于古老的文字识别.在四层卷积神经网络(convolutional neural network,CNN)基础上扩展出5个模型,然后利用Alpha-Beta散度作为惩罚项,对5个模型的输出神经元重新进行自编码,接着用2个全连接层完成特征压缩,最后在softmax层对古彝文字符特征进行重新评分,得到其概率分布,选择对应的最高概率作为识别的字符.实验表明,相对于传统CNN模型,本文方法对古彝文手写体的识别精度更高.
ISSN:1008-9497
DOI:10.3785/j.issn.1008-9497.2019.03.001