基于卷积神经网络的东巴文字图像分类研究

Research on Image Classification of Dongba Pictogram Based on Convolutional Neural Network

下载PDF

导出

摘要针对传统特征提取和分类算法复杂度高、泛化能力差等问题,提出使用卷积神经网络(CNN)对东巴象形文字图像进行特征提取和自动分类。首先,对采集的图像做手动文字分割,并进行归一化、灰度化、滤波去噪、二值化等预处理;其次,对分割的文字图像根据文字形状特征分成18个类别,并进行手动标注;然后,采用卷积神经网络训练分类模型,并用测试样本进行测试。共采集70000个数据样本,按7:2:1的比例划分为训练集、验证集和测试集。为了克服数据样本对分类精度的影响,基于旋转、仿射、缩放、平移等变换对训练样本进行增强,分类的准确率平均达到了99.43%。实验结果表明,所用方法精度高、速度快,具有很高的实际应用价值。 Given the problems of high complexity and poor generalization intraditional feature extraction and classification algorithms,this paper proposes using convolutional neural network(CNN)algorithm to extract features and classify Dongba pictogram automatically.First,the method manually perform text segmentation on the collected images and perform preprocessing normalization,grayscale conversion,filtering and denoising,and binarization.Second,the segmented text images are classified into 18 categories based on their shape features and manually annotated.Thereby,a convolutional neural network is adopted to train the classification model,and the test samples are tested as well.For the data set,a total of 70000 samples are collected in the experiment,which are divided into training set,validation set,and testing set in a ratio of 7:2:1.To overcome the impact of data samples on classification accuracy,training samples are enhanced through the transformations,including rotation,affine,scaling,and translation approaches,resulting in a classification average accuracy of 99.43%.Results of experiments show that the proposed method is capable of achieving high accuracy,and fast speed,which has rich high practical values.

作者张桂莲李世辉谭贵生张榆锋 ZHANG Gui-lian;LI Shi-hui;TAN Gui-sheng;ZHANG Yu-feng(School of Information,Lijiang Culture and Tourism College,Lijiang Yunnan 674199,China;School of Information,Yunnan University,Kunming Yunnan 650500,China)

机构地区丽江文化旅游学院信息学院云南大学信息学院

出处《计算机仿真》 2025年第10期376-381,共6页 Computer Simulation

基金云南省教育厅科学研究基金项目(2023J1458) 学校第三批中青年学术和技术后备人才(2024xshb06)。

关键词东巴象形文字分类图像处理卷积神经网络深度学习 Dongba pictogram Classification Image process Convolution neural network Deep learning

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1杨萌,徐小力,吴国新,左云波.东巴象形文字识别方法[J].北京信息科技大学学报（自然科学版）,2014,29(3):72-76. 被引量：13
2王海燕,王红军,徐小力.基于支持向量机的纳西东巴象形文字符识别[J].云南大学学报（自然科学版）,2016,38(5):730-736. 被引量：19
3徐小力,蒋章雷,吴国新,王红军,王宁.基于拓扑特征和投影法的东巴象形文识别方法研究[J].电子测量与仪器学报,2017,31(1):150-154. 被引量：16
4康厚良,杨玉婷.东巴象形文字特征部件的自动计算与提取算法[J].湖北民族大学学报（自然科学版）,2020,38(2):158-164. 被引量：2
5杨玉婷,康厚良,廖国富.东巴象形文字特征曲线简化算法研究[J].图学学报,2019,40(4):697-703. 被引量：5
6杨玉婷,康厚良.基于网格分解的东巴象形文字分类算法研究[J].软件导刊,2019,18(9):196-198. 被引量：5
7申彤,庄建军,黎文斯,王昀牧,夏一飞,张志俭,张鑫,杨继琼.基于HOG特征提取和支持向量机的东巴文识别[J].南京大学学报（自然科学版）,2020,56(6):870-876. 被引量：16
8谢裕睿,董建娥.基于ResNet网络的东巴象形文字识别研究[J].计算机时代,2021(1):6-10. 被引量：6
9骆彦龙,毕晓君,吴立成,李霞丽.基于改进残差学习的东巴象形文字识别[J].智能系统学报,2022,17(1):79-87. 被引量：4
10喻遂生.《纳西东巴文大字典》编纂的几个问题[J].辞书研究,2020(5):58-70. 被引量：2

二级参考文献57

1和志武.试论纳西象形文字的特点——兼论原始图画字、象形文字和表意文字的区别[J].云南社会科学,1981(3):67-78. 被引量：16
2戈阿干.东巴文化揽胜[J].民族艺术研究,1999,12(2):71-80. 被引量：11
3李伟红,陈伟民,龚卫国.一种人脸特征选择新方法的研究[J].电子测量与仪器学报,2006,20(2):16-20. 被引量：9
4马瑾,陈立潮,张永梅.轮廓跟踪与边沿检测的图像自动识别[J].中北大学学报（自然科学版）,2006,27(5):431-435. 被引量：9
5和金光.纳西族东巴文化研究发展趋势[J].云南民族大学学报（哲学社会科学版）,2007,24(1):81-84. 被引量：17
6LIN X X.A restudy of the nature of Dongba writing[J]. Journal of Yunnan Nationalities University: Social Sci- ences, 2002,19 ( 5 ) : 83-89.
7XU X X,WU G X,WANG H T,et al.Construction of an International IT-Driven sharing platfurm for inheriting and communication of Dongba Manuscripts [ J ]. Applied Mechanics Materials,2014,610:760-763.
8向庚胜.白庚胜纳西学论集[M].北京:民族出版社,2008.
9DAM J,ZHAO J Y, SUO G J, et al.Online handwritten Naxi pictograph digits recognition system using coarse grid[ C ]//CSEEEP artI, CCIS,2011,158 : 390-396.
10GUO H.Research on feature extraction for character rec- ognition of Naxi pictograph [ J ]. Journal of Computers, 2011,6(5) :947-954.

共引文献52

1王娟.《纳西象形文字谱》■(秤)系字订补[J].中国文字研究,2021(2):208-212.
2李志华,徐小力,王宁,吴国新.自适应中值滤波在东巴古籍图像去噪中的应用研究[J].北京信息科技大学学报（自然科学版）,2015,30(5):36-39. 被引量：7
3吴国新,丁春艳,徐小力,李志华.基于分形与小波相结合的东巴经典古籍图像压缩方法研究[J].北京信息科技大学学报（自然科学版）,2017,32(1):9-12. 被引量：3
4赵学梅.“纳西东巴文化大观”网站设计研究[J].丽江师范高等专科学校学报,2017,2(1):17-23.
5刘永革,刘国英.基于SVM的甲骨文字识别[J].安阳师范学院学报,2017(2):54-56. 被引量：18
6赵艺淞,杨昆,王保云,黎晓路.随机森林在城市不透水面提取中的应用研究[J].云南师范大学学报（自然科学版）,2017,37(3):73-78. 被引量：13
7夏欣雨,朱春梅,吴国新.融合小波变换和模糊集的东巴古籍图像增强算法[J].北京信息科技大学学报（自然科学版）,2018,33(3):47-51. 被引量：3
8丁李,曾水玲.基于综合特征矩阵的手写苗文识别研究[J].怀化学院学报,2018,37(5):52-56.
9金东勇,陈俊霞.车载视频交通场景定位与文字识别方法的改进[J].单片机与嵌入式系统应用,2018,18(10):55-58. 被引量：2
10丁李,曾水玲,熊涛.基于BP神经网络的湘西民间方块苗文特征提取方法[J].吉首大学学报（自然科学版）,2018,39(5):14-18. 被引量：2

1和佳蕊.东巴文字与绘本艺术融合的探索性研究[J].品牌研究,2025(2):0016-0018.
2杨杰宏.试论东巴史诗的地位与影响[J].文山学院学报,2025,38(3):20-26.
3和泽宇,和春云.无量河流域东巴动物舞蹈的田野调查[J].剧影月报,2025(5):86-87.
4吴小勐,邹宇,陈军,赵普,许昊,郭海.基于图像处理的自动化监测技术[J].中国高新科技,2025(19):113-115.
5刘峰,贾小林,顾娅军.基于改进PSO优化BP神经网络的RFID室内定位算法[J].计算机仿真,2025,42(10):302-307.

计算机仿真

2025年第10期

浏览历史

内容加载中请稍等...

基于卷积神经网络的东巴文字图像分类研究

参考文献10

二级参考文献57

共引文献52

相关作者

相关机构

相关主题

浏览历史