期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

中文文本自动校对综述被引量：5

A Survey of Automatic Error Correction of Chinese Text

下载PDF

导出

摘要文本校对在新闻发布、书刊出版、语音输入、汉字识别等领域有着极其重要的应用价值,是自然语言处理领域中的一个重要研究方向。该文对中文文本自动校对技术进行了系统性的梳理,将中文文本的错误类型分为拼写错误、语法错误和语义错误,并对这三类错误的校对方法进行了梳理,对中文文本自动校对的数据集和评价方法进行了总结,最后展望了中文文本自动校对技术的未来发展。 Text correction,an important research field in Natural Language Processing(NLP),is of great application value in fields such as news,publication,and text input.This paper provides a systematic overview of automatic error correction technology for Chinese texts.Errors in Chinese texts are divided into spelling errors,grammatic errors and semantic errors,and the methods of error correction for these three types are reviewed.Moreover,datasets and evaluation methods of automatic error correction for Chinese texts are summarized.In the end,prospects for the automatic error correction for Chinese texts are raised.

作者李云汉施运梅李宁田英爱 Li Yunhan;Shi Yunmei;Li Ning;Tian Ying ai(Beijing Information Science and Technology University,Beijing Key Laboratory of Internet Culture Digital Dissemination,Beijing 100101,China;School of Computer,Beijing University of Information Technology,Beijing 100101,China)

机构地区北京信息科技大学网络文化与数字传播北京市重点实验室北京信息科技大学计算机学院

出处《中文信息学报》 CSCD 北大核心 2022年第9期1-18,27,共19页 Journal of Chinese Information Processing

基金国家重点研发计划项目(2018YFB1004100)。

关键词自动校对拼写错误语法错误语义错误数据集评估指标 automatic correction spelling errors grammatical errors semantic errors datasets evaluation indicators

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献17

1徐连诚,石磊.自动文字校对动态规划算法的设计与实现[J].计算机科学,2002,29(9):149-150. 被引量：3
2龚小谨,罗振声,骆卫华.中文文本自动校对中的语法错误检查[J].计算机工程与应用,2003,39(8):98-100. 被引量：15
3张仰森,丁冰青.中文文本自动校对技术现状及展望[J].中文信息学报,1998,12(3):50-56. 被引量：14
4张仰森,俞士汶.文本自动校对技术研究综述[J].计算机应用研究,2006,23(6):8-12. 被引量：39
5姜赢,庄润钹,吴烨凡,朱玲萱.基于描述逻辑本体推理的语义级中文校对方法[J].计算机系统应用,2017,26(4):224-229. 被引量：6
6于勐,姚天顺.一种混合的中文文本校对方法[J].中文信息学报,1998,12(2):31-36. 被引量：23
7张仰森,丁冰青.基于二元接续关系检查的字词级自动查错方法[J].中文信息学报,2001,15(3):36-43. 被引量：29
8李建华,王晓龙.Combining Trigram and Automatic Weight Distribution in Chinese Spelling Error Correction[J].Journal of Computer Science & Technology,2002,17(6):915-923. 被引量：4
9张仰森,曹元大,俞士汶.基于规则与统计相结合的中文文本自动查错模型与算法[J].中文信息学报,2006,20(4):1-7. 被引量：35
10刘亮亮,曹存根.中文“非多字词错误”自动校对方法研究[J].计算机科学,2016,43(10):200-205. 被引量：16

二级参考文献119

1张仰森,曹元大,徐波.基于统计的纠错建议给出算法及其实现[J].计算机工程,2004,30(11):106-109. 被引量：7
2张磊,周明,黄昌宁,潘海华.中文文本自动校对[J].语言文字应用,2001(1):19-26. 被引量：23
3赵明.手写印刷体汉字识别方法综述[J].计算机研究与发展,1993,30(4):59-64. 被引量：14
4曲维光,陈小荷,吉根林.基于框架的词语搭配自动抽取方法[J].计算机工程,2004,30(23):22-24. 被引量：20
5马金山,张宇,刘挺,李生.利用三元模型及依存分析查找中文文本错误[J].情报学报,2004,23(6):723-728. 被引量：7
6全昌勤,何婷婷,姬东鸿,刘辉.从搭配知识获取最优种子的词义消歧方法[J].中文信息学报,2005,19(1):30-35. 被引量：13
7罗振声,郑碧霞.汉语句型自动分析和分布统计算法与策略的研究[J].中文信息学报,1994,8(2):1-19. 被引量：21
8许嘉璐.中文信息处理技术现状及相关语言文字研究[J].软件世界,1996(4):13-16. 被引量：3
9文韬.校对人员的好帮手——方正金山中文校对系统VCorrect试用报告[J].中国计算机用户,1996(10):23-25. 被引量：1
10张仰森,俞士汶.文本自动校对技术研究综述[J].计算机应用研究,2006,23(6):8-12. 被引量：39

共引文献160

1孙瑞.基于英语翻译应用视角下的计算机智能校对系统开发研究[J].微型电脑应用,2020,36(2):145-148. 被引量：6
2张生盛,庞桂娜,杨麟儿,王辰成,杜永萍,杨尔弘,黄雅平.面向汉语作为第二语言学习的个性化语法纠错[J].中文信息学报,2021,35(12):28-35. 被引量：4
3王辰成,杨麟儿,王莹莹,杜永萍,杨尔弘.基于Transformer增强架构的中文语法纠错方法[J].中文信息学报,2020(6):106-114. 被引量：33
4华旦扎西,才智杰,班玛宝.一种基于TC_LSTM的藏文词拼写检查方法[J].中文信息学报,2020,34(5):50-55. 被引量：5
5王子斌,张全,谢聪,余沛,余泓江,李沣庭.基于知识图谱与BERT的安全领域汉字文本纠错模型[J].计算机应用,2023,43(S01):75-80. 被引量：2
6张梅,纪天啸.面向深度学习的高质量纠错语料库自动生成方法研究[J].北方工业大学学报,2024,36(2):127-132.
7张仰森,曹元大,徐波.基于统计的纠错建议给出算法及其实现[J].计算机工程,2004,30(11):106-109. 被引量：7
8张虎,郑家恒,刘江.语料库词性标注一致性检查方法研究[J].中文信息学报,2004,18(5):11-16. 被引量：9
9马金山,张宇,刘挺,李生.利用三元模型及依存分析查找中文文本错误[J].情报学报,2004,23(6):723-728. 被引量：7
10张仰森,俞士汶.文本自动校对技术研究综述[J].计算机应用研究,2006,23(6):8-12. 被引量：39

同被引文献18

1王辰成,杨麟儿,王莹莹,杜永萍,杨尔弘.基于Transformer增强架构的中文语法纠错方法[J].中文信息学报,2020(6):106-114. 被引量：33
2刘亮亮,曹存根.中文“非多字词错误”自动校对方法研究[J].计算机科学,2016,43(10):200-205. 被引量：16
3段建勇,袁阳,王昊.基于Transformer局部信息及语法增强架构的中文拼写纠错方法[J].北京大学学报（自然科学版）,2021,57(1):61-67. 被引量：12
4孙邱杰,梁景贵,李思.基于BART噪声器的中文语法纠错模型[J].计算机应用,2022,42(3):860-866. 被引量：11
5李嘉诚,沈嘉钰,龚晨,李正华,张民.基于指针网络融入混淆集知识的中文语法纠错[J].中文信息学报,2022,36(4):29-38. 被引量：5
6陈子懿.语言能力与二语语言发展——也谈二语写作与二语习得的接口[J].海外英语,2023(14):69-72. 被引量：2
7王树义,张庆薇,张晋.AIGC时代的科研工作流:协同与AI赋能视角下的数字学术工具应用及其未来[J].图书情报知识,2023,40(5):28-38. 被引量：39
8陶媛媛.出版社校对工作的现代化管理与质量保障[J].传播力研究,2023,7(29):139-141. 被引量：1
9王天极,陈柏霖,黄瑞章,任丽娜,陈艳平,秦永彬.基于Electra和门控双线性神经网络的中文语法错误检测模型[J].中文信息学报,2023,37(8):169-178. 被引量：3
10李侗桐,高瑞婧,田佳.ChatGPT在中文科技期刊摘要文字编辑中的实用性测试与分析[J].中国科技期刊研究,2023,34(8):1014-1019. 被引量：42

引证文献5

1赵建辉,林川,任丽娜,黄瑞章.融合位置编码的中文拼写纠错方法[J].计算机工程与设计,2024,45(9):2844-2851. 被引量：2
2徐奇智,罗楚杰,周新喻.生成式人工智能的中文自动编校效果评估与优化研究[J].出版广角,2025(7):77-85. 被引量：2
3句泽东,程春雷,叶青,彭琳,龚著凡.中文语法纠错技术的研究进展综述[J].计算机工程与应用,2025,61(20):36-53.
4张瑜琦,沙灜.基于层次信息增强的中文语义错误识别模型[J].计算机应用,2025,45(12):3771-3778.
5陈晓阳.人智能时代校对人员的危与机[J].传媒论坛,2025,8(19):140-142.

二级引证文献4

1邓佩晨,黑永桦,魏炳生,冯诗宇,万源.基于知识图谱构建和实体校正的查询重写模型[J].计算机应用研究,2025,42(9):2752-2757.
2陶忠娣.基于学术出版智能编校系统优化的应用思考[J].出版广角,2025(10):121-125.
3潘桂妹.基于动态时间规整与Transformer的连续语音识别与发音校正算法[J].现代电子技术,2025,48(24):61-66.
4郑巧兰,江玉霞,王景周.Kimi和DeepSeek诊断生物医学期刊统计学结果错误的效能评估及应用建议[J].中国科技期刊研究,2025,36(11):1470-1477.

1张芙蓉,罗志娟.基于深度学习的语义级中文文本自动校对研究[J].长沙航空职业技术学院学报,2022,22(3):33-37.
2蒋婉婷,王晓静.非英语专业学生英语写作中的词汇错误分析[J].文化创新比较研究,2021,5(6):149-151.
3郑堆.推进藏文化传承弘扬引领藏学高质量发展——中国藏学研究中心科研35周年综述[J].中国藏学,2021(4):11-20. 被引量：1
4卜军钰,何雨谣,吕思毅.民国时期书刊出版数量研究综述[J].文献与数据学报,2022,4(2):100-115. 被引量：1
5张绍纳.校对工作的现代化管理与质量保障[J].新闻文化建设,2022(16):39-41. 被引量：3
6科技前沿·新闻信息[J].上海建材,2022(5):46-48.
7原霞,李金云.功能对等理论视角下旅游景区公示语英译刍议——以桂平西山为例[J].英语广场（学术研究）,2022(26):23-26. 被引量：2
82022年国家统计局主要统计信息发布日程表的补充说明[J].中国经济景气月报,2022(9):252-252.

中文信息学报

2022年第9期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部