基于层叠CRFs的中文句子评价对象抽取被引量：19

Identify Sentiment-Objects from Chinese Sentences Based on Cascaded Conditional Random Fields

下载PDF

导出

摘要中文句子评价对象抽取是指在中文句子中抽取评论所针对的对象或对象的属性。目前国内相关研究工作尚未能有效识别复合词评价对象和未登陆评价对象。针对以上两种情况,该文提出了一种基于层叠条件随机场的中文句子评价对象抽取方法。该方法首先通过低层条件随机场获得候选评价对象集,然后通过降噪模型对噪声进行过滤、补充模型对缺失的候选评价对象进行补充、合并模型对复合短语候选评价对象进行合并,最后由高层模型抽取出评价对象。实验结果显示,与基于线性链条件随机场的识别方法相比,该方法准确率、召回率和F1值分别提升1.62%、5.75%和4.17%,能有效地识别复合词评价对象和未登录评价对象,从而提高中文句子评价对象的识别精度。 Sentiment-objects extraction aims to identify the targets of opinion described in sentiment sentences. How- ever, previous researches fail to extract compound targets and unknown words. In this paper, the cascaded CRFs model is presented to deal with the problem. The method first acquires opinion target set using lower-lever CRFs model, then, middle-lever models is employed to get candidate set by filtering noise, complementing missing candi- date targets, and merging compound noun phrases. Finally, opinion targets set is extract from the higher-lever mod- el using middle-lever model candidate set as input. Experiments show that our method outperforms linear chain CRFs by 1.62~ in precision, 5.75~ in recall, and 4.17~ in F1 measure. Meanwhile, the method is also effective to identify the compound targets and unknown targets.

作者郑敏洁雷志城廖祥文陈国龙

机构地区福州大学物理与信息工程学院福州大学数学与计算机科学学院

出处《中文信息学报》 CSCD 北大核心 2013年第3期69-76,共8页 Journal of Chinese Information Processing

基金福建省自然科学基金资助项目(2010J05133) 福建省科技创新平台计划资助项目(2009J1007) 福州大学科技发展基金资助项目(2010-XQ-22)

关键词评价对象层叠条件随机场降噪模型补充模型 sentiment-objects cascaded conditional random fields~ noise reduction model complement model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献30

1James R Cowie, Wendy G Lehnert. Information ex- traction[J]. Communications of the ACM, 1996, 39 (1) : 80-91.
2Fuchun Peng, Andrew McCallum. Information extrac- tion from research papers using conditional random fields[J]. Information Processing and Management, 2006, 42(4): 963-979.
3Li Zhuang, Feng Jing, Xiao-Yan Zhu. Movie review mining and summarization [C]//Proeeedings of the ACM 15th Conference on Information and Knowledge Management. Arlington, Virginia, USA, 2006: 43- 50.
4Ruifeng Xu, Chunyu Kit. Incorporating Feature-based and Similarity-based Opinion Mining-CTL in NTCIR-8 MOAT [C]//Proceedings of NTCIR-8 Workshop Meeting. Tokyo, Japan, 2010: 276-281.
5Shanzong Zhu, Yuanchao Liu, Ming Liu, et al. Re- search on Feature Extraction from Chinese Text for Opinion Mining[C]//Proeessing of 2009 International Conference on Asian Languages. Singapore, 2009: 7- 10.
6Minqing Hu, Bing Liu. Mining Opinion Features in Customer Reviews[C]//Proeeedings of 19th National Conference on Artificial Intelligence (AAAI-2004). California, USA, 2004: 755-760.
7Minqing Hu, Bing Liu. Mining and summarizing cus- tomer reviews [C]//Proceedings of the 10th ACM SIGKDD International Conference on Knowledge Dis- covery and Data Mining. Seattle, Washington, USA, 2004: 168-177.
8刘鸿宇,赵妍妍,秦兵,刘挺.评价对象抽取及其倾向性分析[J].中文信息学报,2010,24(1):84-88. 被引量：101
9Bin Lu. Identifying Opinion Holders and Targets with Dependency Parser in Chinese News Texts[C]//Pro- ceedings of the NAACL HLT 2010 Student ResearchWorkshop. Los Angeles, California, USA, 2010: 46- 51.
10Tengfei Ma, Xiaojun Wan. Opinion Target Extrac- tion in Chinese News Comments[C]//Proceedings of the 23rd International Conference on Computational Linguistics: Poster Volume. Beijing, China, 2010: 782-790.

二级参考文献104

1刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：201
2赵健,王晓龙,关毅.中文名实体识别中的特征组合与特征融合的比较[J].计算机应用,2005,25(11):2647-2649. 被引量：7
3刘非凡,赵军,吕碧波,徐波,于浩,夏迎炬.面向商务信息抽取的产品命名实体识别研究[J].中文信息学报,2006,20(1):7-13. 被引量：48
4俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：168
5周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：115
6王浩畅,赵铁军.基于SVM的生物医学命名实体的识别[J].哈尔滨工程大学学报,2006,27(B07):570-574. 被引量：18
7李中国,刘颖.边界模板和局部统计相结合的中国人名识别[J].中文信息学报,2006,20(5):44-50. 被引量：13
8陈锦,常致全,许军.基于HMM的生物医学命名实体的识别与分类[J].计算机时代,2006(10):40-42. 被引量：10
9赵世奇,刘挺,李生.一种基于主题的文本聚类方法[J].中文信息学报,2007,21(2):58-62. 被引量：24
10姚天昉,聂青阳,李建超,李林琳,陈柯,付宁.一个用于汉语汽车评论的意见挖掘系统[C]//中文信息处理前沿进展-中国中文信息学会二十五周年学术会议论文集.北京:清华大学出版社,2006:260-281.

共引文献340

1马建红,杨青云.针对专利背景技术的信息三元组抽取方法[J].计算机应用研究,2020,37(S01):247-249. 被引量：2
2吴杭鑫,张云华.基于词嵌入和自注意力机制的方面提取算法[J].智能计算机与应用,2021,11(4):25-29. 被引量：2
3车海燕,孙吉贵,荆涛,白曦.一个基于本体主题的中文知识获取方法[J].计算机科学与探索,2007,1(2):206-215. 被引量：5
4常娥,侯汉清,曹玲.古籍自动校勘的研究和实现[J].中文信息学报,2007,21(2):83-88. 被引量：17
5周顺先,林亚平,王耀南,易叶青.基于二阶隐马尔可夫模型的文本信息抽取[J].电子学报,2007,35(11):2226-2231. 被引量：25
6韦向峰,张全,吴晨,袁毅.中文问答系统中机构名的处理[J].计算机工程与应用,2008,44(7):196-198. 被引量：2
7李军,王丁,王鑫.基于模板匹配的中文机构名识别[J].信息技术,2008,32(6):97-99. 被引量：4
8荆涛,左万利,孙吉贵,车海燕.中文网页语义标注：由句子到RDF表示[J].计算机研究与发展,2008,45(7):1221-1231. 被引量：29
9黄健斌,姬红兵,孙鹤立.基于混合跳链条件随机场的异构Web记录集成方法[J].软件学报,2008,19(8):2149-2158. 被引量：8
10章成志,苏新宁.基于条件随机场的自动标引模型研究[J].中国图书馆学报,2008,34(5):89-94. 被引量：24

同被引文献196

1黄忠廉.小句中枢全译说[J].汉语学报,2005(2):62-69. 被引量：9
2邢福义.小句中枢说[J].中国语文,1995(6):420-428. 被引量：161
3李纲,程明结,寇广增.基于情感倾向识别的汽车评论挖掘系统构建[J].情报学报,2011,30(2):204-211. 被引量：14
4王会珍,朱靖波,季铎,叶娜,张斌.基于反馈学习自适应的中文话题追踪[J].中文信息学报,2006,20(3):92-98. 被引量：17
5丁晟春,李岳盟,甘利人.基于顶层本体的领域本体综合构建方法研究[J].情报理论与实践,2007,30(2):236-240. 被引量：47
6马海兵,刘永丹,王兰成,李荣陆.三种文档语义倾向性识别方法的分析与比较[J].现代图书情报技术,2007(4):43-47. 被引量：15
7王根,赵军.基于多重冗余标记CRFs的句子情感分析研究[J].中文信息学报,2007,21(5):51-55. 被引量：31
8洪宇,张宇,刘挺,李生.话题检测与跟踪的评测及研究综述[J].中文信息学报,2007,21(6):71-87. 被引量：153
9王昊,邓三鸿.HMM和CRFs在信息抽取应用中的比较研究[J].现代图书情报技术,2007(12):57-63. 被引量：12
10谭松波,王素格,廖祥文,等.第五届中文倾向性分析评测总体报告[C]//第五届中文倾向性分析评测研讨会(COAE2013).山西,太原,2013.

引证文献19

1张盛,李芳.基于迭代两步CRF模型的评价对象与极性抽取研究[J].中文信息学报,2015,29(1):163-169. 被引量：3
2徐娟,曹晔,张奇.面向自由文本的中文地址规范化[J].计算机应用与软件,2015,32(8):22-24. 被引量：4
3郝志峰,杜慎芝,蔡瑞初,温雯.基于全局变量CRFs模型的微博情感对象识别方法[J].中文信息学报,2015,29(4):50-58. 被引量：7
4陈锋.细颗粒度观点挖掘中的观点句识别与要素抽取研究综述[J].数字图书馆论坛,2015(10):21-27.
5何炎祥,刘健博,孙松涛,文卫东.基于层叠条件随机场的微博商品评论情感分类[J].山东大学学报（理学版）,2015,50(11):67-73. 被引量：3
6张建华,肖中正.结合词性规则和依存句法分析的评价对象抽取方法[J].计算机与现代化,2016(4):16-20. 被引量：3
7戴丹,胡杨,刘骊,冯旭鹏,刘利军,黄青松.基于层叠条件随机场的微博热点话题跟踪[J].计算机应用与软件,2016,33(4):56-59.
8李情情,鲁燃,朱振方,刘颖莹.基于特定用户角色的热度计算方法及应用[J].计算机工程与设计,2016,37(5):1201-1207. 被引量：5
9冯旭鹏,马震,谢波,刘利军,黄青松.基于评价修饰分布差的评论文本倾向性识别方法[J].计算机工程,2016,42(10):176-180.
10丁晟春,吴婧婵媛,李霄.基于CRFs和领域本体的中文微博评价对象抽取研究[J].中文信息学报,2016,30(4):159-166. 被引量：12

二级引证文献64

1周红照,侯敏,滕永林.评价形容词状语语用指向研究及其自动识别机制[J].语言研究集刊,2023(2):210-224. 被引量：1
2梁艳平,安璐,刘静.同类突发公共卫生事件微博话题共振研究[J].数据分析与知识发现,2020,4(2):122-133. 被引量：18
3马建红,杨青云.针对专利背景技术的信息三元组抽取方法[J].计算机应用研究,2020,37(S01):247-249. 被引量：2
4高继轩.《压力容器安全技术监察规程》问答[J].中国锅炉压力容器安全,2000,16(2):27-29. 被引量：3
5包亮,张莉,许鑫.苏州园林网络评论意见挖掘研究[J].微型机与应用,2016,35(13):86-89. 被引量：1
6汪洋,刘师培,王峥.基于Trie树和有限状态自动机的中文地址解析模型[J].计算机与现代化,2016(7):60-67. 被引量：3
7冯旭鹏,马震,谢波,刘利军,黄青松.基于评价修饰分布差的评论文本倾向性识别方法[J].计算机工程,2016,42(10):176-180.
8裴可锋,陈永洲,马静.基于DTPM模型的话题热度预测方法[J].情报杂志,2016,35(12):52-57. 被引量：14
9张景,牛耘.中文微博评价对象识别研究[J].计算机技术与发展,2017,27(1):6-10.
10李晓林,黄爽,卢涛,李霖.非规范化中文地址的行政区划提取算法[J].计算机应用,2017,37(3):876-882. 被引量：7

1方琼,王耀明.基于多项式拟合的多姿态人脸图像的单视图识别技术[J].福建电脑,2005,21(10):57-58. 被引量：1
2陈卓,程学先,洪帆.基于OOA的应用系统建模研究[J].湖北工学院学报,2002,17(3):16-19.
3郭剑毅,薛征山,余正涛,张志坤,张宜浩,姚贤明.基于层叠条件随机场的旅游领域命名实体识别[J].中文信息学报,2009,23(5):47-52. 被引量：37
4胡广朋,程辉,邵玉宝.基于层叠条件随机场的网络入侵识别[J].江苏科技大学学报（自然科学版）,2008,22(5):63-66. 被引量：4
5马建红,郝亚娟,张亚梅.基于层叠跳跃链条件随机场模型的因果关系标注[J].郑州大学学报（理学版）,2016,48(4):54-59. 被引量：2
6戴丹,胡杨,刘骊,冯旭鹏,刘利军,黄青松.基于层叠条件随机场的微博热点话题跟踪[J].计算机应用与软件,2016,33(4):56-59.
7莫媛媛,郭剑毅,余正涛,蒋年树,线岩团.基于CCRF的领域本体概念上下位关系抽取[J].计算机工程,2014,40(6):138-141. 被引量：3
8王长有,杨增春.一种基于句子结构特征的领域术语上下位关系获取方法[J].重庆邮电大学学报（自然科学版）,2014,26(3):385-389. 被引量：2
9于智娟,古丽拉.阿东别克.基于层叠条件随机场的哈语树库构建技术研究[J].计算机应用与软件,2016,33(3):71-75.
10吴金学.基于梯度自适应函数的彩色图像变分去噪方法[J].微型机与应用,2010,29(2):46-48.

中文信息学报

2013年第3期

浏览历史

内容加载中请稍等...

基于层叠CRFs的中文句子评价对象抽取被引量：19

参考文献30

二级参考文献104

共引文献340

同被引文献196

引证文献19

二级引证文献64

相关作者

相关机构

相关主题

浏览历史

基于层叠CRFs的中文句子评价对象抽取 被引量：19

参考文献30

二级参考文献104

共引文献340

同被引文献196

引证文献19

二级引证文献64

相关作者

相关机构

相关主题

浏览历史

基于层叠CRFs的中文句子评价对象抽取被引量：19