一种基于深度学习的古彝文识别方法
TP391; 作为世界六大古文字之一的古彝文记录了几千年来人类的发展历史.通过对古彝文的识别能够将这些珍贵文献资料转换为电子文档,便于保存和传播.由于历史发展、区域限制等原因,针对古彝文识别的研究鲜有成果.本文将当前新颖的深度学习技术应用于古老的文字识别.在四层卷积神经网络(convolutional neural network,CNN)基础上扩展出5个模型,然后利用Alpha-Beta散度作为惩罚项,对5个模型的输出神经元重新进行自编码,接着用2个全连接层完成特征压缩,最后在softmax层对古彝文字符特征进行重新评分,得到其概率分布,选择对应的最高概率作为识别的字符.实验表明,相对于传统...
Saved in:
| Published in | 浙江大学学报(理学版) Vol. 46; no. 3; pp. 261 - 269 |
|---|---|
| Main Authors | , , , , |
| Format | Journal Article |
| Language | Chinese |
| Published |
西南大学 计算机与信息科学学院,重庆,400715%贵州工程应用技术学院 彝文研究院,贵州 毕节,551700
01.05.2019
|
| Subjects | |
| Online Access | Get full text |
| ISSN | 1008-9497 |
| DOI | 10.3785/j.issn.1008-9497.2019.03.001 |
Cover
| Summary: | TP391; 作为世界六大古文字之一的古彝文记录了几千年来人类的发展历史.通过对古彝文的识别能够将这些珍贵文献资料转换为电子文档,便于保存和传播.由于历史发展、区域限制等原因,针对古彝文识别的研究鲜有成果.本文将当前新颖的深度学习技术应用于古老的文字识别.在四层卷积神经网络(convolutional neural network,CNN)基础上扩展出5个模型,然后利用Alpha-Beta散度作为惩罚项,对5个模型的输出神经元重新进行自编码,接着用2个全连接层完成特征压缩,最后在softmax层对古彝文字符特征进行重新评分,得到其概率分布,选择对应的最高概率作为识别的字符.实验表明,相对于传统CNN模型,本文方法对古彝文手写体的识别精度更高. |
|---|---|
| ISSN: | 1008-9497 |
| DOI: | 10.3785/j.issn.1008-9497.2019.03.001 |