基于语料库的朝鲜语命名实体结构特征研究

A Corpus⁃based Study on the Structural Features of Named Entities in Korean

导出

摘要本文统计Klue⁃ner和Kochet⁃ner两个命名实体语料库中的新闻、评论和文化遗产文本数据包含的不同类别朝鲜语命名实体。根据统计结果分析朝鲜语命名实体的音节长度特征分布和格词尾结合率。分析结果表明,音节长度和格词尾的使用在命名实体分类中具有一定的规律可循。本文的研究成果可用于命名实体分类工作,同时也可以为朝鲜语命名实体语料库构建提供分布结构建议。 This paper counts the different categories of Korean named entities contained in the news,comments,and cultural heritage text data in the Klue⁃ner and Kochet⁃ner named entity corpora.According to the statistical results,the syllable length feature distribution and case particle combination rate of Korean named entities are analyzed.The results show that the use of syllable length and case particles has certain regularity in named entity classification,which can be used for named entity classification work and can also provide distribution structure suggestions for the construction of Korean named entity corpora.

作者黄政豪金光洙 Huang Zheng-hao;Jin Guang-zhu(Engineering College,Yanbian University,Yanji 133002,China;School of Foreign Languages,Yanbian University,Yanji 133002,China)

机构地区延边大学工学院延边大学外国语学院

出处《外语学刊》北大核心 2025年第1期9-18,共10页 Foreign Language Research

基金国家社科基金重大招标项目“朝鲜汉字资源文献整理与研究”(18ZDA306) 延边大学外国语言文学世界一流学科建设攻关科研项目(18YLGG01)的阶段性成果。

关键词朝鲜语格词尾命名实体识别特征提取名词分类 Korean case particle named entity recognition feature extraction noun classification

分类号 H08 [语言文字—语言学]

引文网络
相关文献

参考文献6

1吴炳潮,邓成龙,关贝,陈晓霖,昝道广,常志军,肖尊严,曲大成,王永吉.动态迁移实体块信息的跨领域中文实体识别模型[J].软件学报,2022,33(10):3776-3792. 被引量：14
2卢星华,金静.朝鲜语口语与书面语实词间相关关系的一元线性回归分析[J].民族语文,2022(5):79-91. 被引量：1
3刘浏,王东波.命名实体识别研究综述[J].情报学报,2018,37(3):329-340. 被引量：167
4华英楠,毕玉德.基于依存树库的朝鲜语依存距离研究[J].外语学刊,2022(6):55-65. 被引量：3
5邓依依,邬昌兴,魏永丰,万仲保,黄兆华.基于深度学习的命名实体识别综述[J].中文信息学报,2021,35(9):30-45. 被引量：50
6毕玉德,赵岩,安帅飞.基于新闻语料库的韩国语汉字词分布特点研究[J].民族语文,2019(4):42-52. 被引量：3

二级参考文献38

1刘海涛,林燕妮.大数据时代语言研究的方法和趋向[J].新疆师范大学学报（哲学社会科学版）,2018,39(1):72-83. 被引量：37
2张晓艳,王挺,陈火旺.命名实体识别研究[J].计算机科学,2005,32(4):44-48. 被引量：69
3孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量：89
4向晓雯,史晓东,曾华琳.一个统计与规则相结合的中文命名实体识别系统[J].计算机应用,2005,25(10):2404-2406. 被引量：37
5刘非凡,赵军,吕碧波,徐波,于浩,夏迎炬.面向商务信息抽取的产品命名实体识别研究[J].中文信息学报,2006,20(1):7-13. 被引量：48
6俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：167
7周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：115
8张晓艳,王挺,陈火旺.基于混合统计模型的汉语命名实体识别方法[J].计算机工程与科学,2006,28(6):135-139. 被引量：22
9刘海涛.泰尼埃的结构句法理论[J].北华大学学报（社会科学版）,2007,8(5):68-77. 被引量：11
10冯元勇,孙乐,李文波,张大鲲.基于单字提示特征的中文命名实体识别快速算法[J].中文信息学报,2008,22(1):104-110. 被引量：25

共引文献230

1陈业明,戴齐,刘捷.融合字位置特征的铁路事故命名实体识别[J].计算机系统应用,2022,31(12):211-219. 被引量：4
2刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：12
3张坤丽,赵旭,关同峰,尚柏羽,李羽蒙,昝红英.面向医疗文本的实体及关系标注平台的构建及应用[J].中文信息学报,2020,34(6):36-44. 被引量：16
4熊奥,高畅,赵明辉,张玲玲.基于知识图谱的核电设备健康管理知识建模与分析[J].科技促进发展,2021,17(4):640-649. 被引量：16
5顾佼佼,翟一琛,姬嗣愚,宗富强.基于BERT和知识蒸馏的航空维修领域命名实体识别[J].电子测量技术,2023,46(3):19-24. 被引量：6
6杨雷,韦韩,龚尚文,赵莺菲.基于LSTM的桥梁养护文本数据的命名实体识别方法[J].公路交通科技,2023,40(S02):187-192.
7李娜.基于条件随机场的方志古籍别名自动抽取模型构建[J].中文信息学报,2018,32(11):41-48. 被引量：30
8高源.自然语言处理发展与应用概述[J].中国新通信,2019,21(2):117-118. 被引量：8
9马孟铖,艾斯卡尔.艾木都拉,吐尔地.托合提.基于条件随机场多特征融合的中文地名、机构名实体识别[J].现代计算机,2019,25(12):13-17. 被引量：5
10侯丽仙,李艳玲,李成城.面向任务口语理解研究现状综述[J].计算机工程与应用,2019,55(11):7-15. 被引量：12

1孙煜.韩国语连接词尾■的用法再考[J].东北亚外语研究,2024,12(4):86-97.
2杨静静.朝鲜语情态语尾“-■■”和汉语语气词的对应研究[J].中国朝鲜语文,2024(5):20-26.
3张璐,马子睿,王岳,马翠玲.面向高中化学试题的命名实体识别[J].吉林大学学报（信息科学版）,2023,41(4):608-620. 被引量：1
4马行荣.《翻译名义集》的编撰缘起与基本体例[J].佛教文化,2023(6):80-85.
5赵昕.元白话句末“有”的两种后续变化[J].语言科学,2024,23(6):643-653.
6王冠宇,罗杨平,黎鑫,李启达.基于深度学习方法分类红团簇星与红巨星分支恒星[J].西华师范大学学报（自然科学版）,2025,46(1):86-94.
7冷本扎西,完么.基于语料库的藏文音节计量研究[J].青海民族大学学报（藏文版）,2024(1):47-60.
8张静,吴安平.高校强化会计人才职业道德素养的路径研究[J].商业会计,2024(24):140-145. 被引量：1

外语学刊

2025年第1期

浏览历史

内容加载中请稍等...

基于语料库的朝鲜语命名实体结构特征研究

参考文献6

二级参考文献38

共引文献230

相关作者

相关机构

相关主题

浏览历史