基于最大熵模型的QA系统置信度评分算法被引量：9

A Maximum Entropy Model Based Confidence Scoring Algorithm for QA

下载PDF

导出

摘要置信度指的是一个问题回答系统(QA系统)对其所作回答的自信程度.描述了一种基于最大熵模型的算法.首先,从训练语料中提取若干因素来训练最大熵模型;然后应用训练好的模型在测试集上计算置信度.在2002年度的文本检索会议(TREC)中,QA系统用该算法计算每个问题答案的置信度,并依此排序,获得了显著的成绩. Confidence score describes how confident a question-answering system is about its response. This paper presents a Maximum Entropy Model based algorithm which uses several factors to train an ME model, and then the ME model is used to calculate the confidence of other questions. Efficiency of this method has been proved by the TRECll＇s QA evaluation, where the performance of the system has been improved dramatically after confidence ranking.

作者游斓周雅倩黄萱菁吴立德

机构地区复旦大学计算机科学与工程系

出处《软件学报》 EI CSCD 北大核心 2005年第8期1407-1414,共8页 Journal of Software

基金 No.60435020国家自然科学基金 No.035115028上海市科委重点项目~~

关键词自然语言处理信息检索问答系统最大熵模型置信度 natural language processing information retrieval question-answering system maximum entropy model confidence score

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献6

1Voorhees EM. Overview of the TREC 2002. In: Voorhees EM, Buckland LP, eds. Proc. of the 11th Text Retrieval Conf.(TREC-11). Gaithersburg: NIST Special Publication, 2002. 115-123.
2Soubbotin MM, Soubbotin SM. Use of patterns for detection of likely answer strings: A systematic approach. In: Voorhees EM,Buckland LP, eds. Proc. of the 11th Text Retrieval Conf. (TREC-11). Gaithersburg1: NIST Special Publication, 2002. 325-331.
3Greenwood MA, Roberts I, Gaizauskas R. The University of Sheffield TREC 2002 Q&A system. In: Voorhees EM, Buckland LP,eds. Proc. of the 11 th Text Retrieval Conf. (TREC-11). Gaithersburg: NIST Special Publication, 2002. 823-831.
4Xu J, Licuanan A, May J, Miller S, Weischedel R. TREC 2002 QA at BBN: Answer selection and confidence estimation. In:Voorhees EM, Buckland LP, eds. Proc. of the 11 th Text Retrieval Conf. (TREC-11). Gaithersburg: NIST Special Publication, 2002.96-101.
5Berger AL, Della Pietra SA, Della Pietra VJ. A maximum entropy approach to natural language processing. Computational Linguistics, 1996,22(1):39-71.
6Wu LD, Huang XJ, Niu JY, Xia YJ, Feng Z, Zhou YQ. FDU at TREC2002: Filtering, Q&A, Web and video tasks. In: Voorhees EM,Buckland LP, eds. Proc. of the 11th Text Retrieval Conf. (TREC-11). Gaithersburg: NIST Special Publication, 2002. 232-247.

同被引文献181

1Li Piji,Ma Jun.Use Genetic Programming to Rank Web Images[J].China Communications,2010,7(1):80-92. 被引量：2
2冯惠,王凌.浅谈软件质量度量和软件产品评价[J].计算机应用与软件,2005,22(2):31-32. 被引量：7
3张宇,刘挺,文勖.基于改进贝叶斯模型的问题分类[J].中文信息学报,2005,19(2):100-105. 被引量：47
4吴友政,赵军,段湘煜,徐波.问答式检索技术及评测研究综述[J].中文信息学报,2005,19(3):1-13. 被引量：48
5董祥军,陈建斌,崔林,宋瀚涛,陆玉昌.正、负关联规则间的置信度关系研究[J].计算机应用研究,2005,22(7):34-35. 被引量：7
6钱铁云,冯小年,王元珍.超越支持度-置信度框架的负相关对规则挖掘[J].计算机科学,2005,32(10):124-127. 被引量：6
7骆红波,李舟军,金炳尧,马永进.PowerPoint文档对象分析与自动阅卷的实现[J].计算机与现代化,2006(2):76-78. 被引量：10
8文勖,张宇,刘挺,马金山.基于句法结构分析的中文问题分类[J].中文信息学报,2006,20(2):33-39. 被引量：84
9赵京胜,顾训穰.软件企业实施CMM改进软件过程的研究[J].计算机工程与设计,2006,27(5):806-810. 被引量：5
10杨彩霞,张凌晓,刘克成.基于.NET平台下的Office无纸化考试评分系统的设计与实现[J].计算机与网络,2006,32(6):58-59. 被引量：1

引证文献9

1董燕举,蔡东风,白宇.面向事实性问题的答案选择技术研究综述[J].中文信息学报,2009,23(1):86-94. 被引量：1
2张志昌,张宇,刘挺,李生.开放域问答技术研究进展[J].电子学报,2009,37(5):1058-1069. 被引量：17
3范士喜,王晓龙,王轩,张耀允.面向真实环境的问句分析方法[J].电子学报,2010,38(5):1131-1135. 被引量：10
4杨乘,谢晓尧.基于结果比对和过程特征分析的多线程评分算法的研究[J].煤炭技术,2011,30(9):200-202.
5柴获,闫军,李秦渝.基于置信度的软件质量模糊评价模型研究[J].计算机工程与设计,2012,33(2):607-611. 被引量：9
6Mao Cunli,Chen Fangqiong,Yu Zhengtao,Guo Jianyi,Zong Huanyun.Answer Ranking with Discourse Structure Feature[J].China Communications,2012,9(3):110-123. 被引量：1
7李树青,徐侠,曹杰,庄光光.基于关键词链接网络分析方法的医学文献推荐服务研究[J].情报学报,2017,36(1):61-71. 被引量：2
8杨骏,敬思远,项炜.一种基于卷积神经网络的自动问答系统[J].乐山师范学院学报,2020,35(4):40-44. 被引量：2
9琚江舟,毛云麟,吴震,陈宇飞,戴新宇,陈家骏.多粒度单元格对比的文本和表格数值问答模型[J].软件学报,2025,36(5):2167-2187.

二级引证文献39

1何丽,柳岚清,刘杰,段建勇,王昊.融合问题分类与RoBERTa的答案选择方法[J].数据分析与知识发现,2024,8(8):157-167. 被引量：1
2刘小明,樊孝忠,刘里.融合事件信息的复杂问句分析方法[J].华南理工大学学报（自然科学版）,2011,39(7):140-145. 被引量：7
3杨思春,高超,戴新宇,陈家骏,杨思国.基于词袋绑定的问句新特征自动生成[J].北京理工大学学报,2012,32(6):590-595. 被引量：2
4杨思春,高超,秦锋,戴新宇,陈家骏.融合基本特征和词袋绑定特征的问句特征模型[J].中文信息学报,2012,26(5):46-52. 被引量：8
5杨思春,高超,姚佳岷,戴新宇,陈家骏.Feature combination via importance-inhibition analysis[J].Journal of Southeast University(English Edition),2013,29(1):22-26.
6韩闻文,阙喜戎,宋思奇,田野,王文东.Ranking Potential Reply-Providers in Community Question Answering System[J].China Communications,2013,10(10):125-136. 被引量：4
7侯永帅,张耀允,王晓龙,陈清财,王宇亮,户保田.中文问答系统中时间敏感问句的识别和检索[J].计算机研究与发展,2013,50(12):2612-2620. 被引量：4
8杨思春,高超,戴新宇,尹存燕,陈家骏.基于差异性和重要性的问句特征组合[J].电子学报,2014,42(5):918-924. 被引量：7
9杜金环,彭霞.软件质量模糊综合评价模型与实例分析[J].信息技术,2014,38(7):62-65. 被引量：3
10魏楚元,湛强,张大奎,毛煜,樊孝忠.基于问题语义表征的中文问答系统相似度计算方法[J].情报学报,2014,33(10):1099-1107.

1姚丽娜.基于知识管理的OAS新理念和开发技术分析[J].计算机技术与发展,2006,16(5):204-207.
2许丞,彭瀚,马龙,李双峰.AskTheWeb——一个基于Web的问题回答原型系统[J].华南理工大学学报（自然科学版）,2004,32(z1):11-17. 被引量：1
3王国金,康耀红.基于布尔检索策略的问答系统性能研究[J].科技广场,2005(10):4-7.
4杜永萍,黄萱菁.开放领域的QA系统结构及性能分析[J].模式识别与人工智能,2009,22(4):527-531.
5李季.一个标准中文问答系统的研究与实现[J].计算机系统应用,2004,13(6):17-20. 被引量：1
6李季,迟呈英.中文问答系统的研究[J].鞍山科技大学学报,2003,26(6):437-440. 被引量：1
7李鑫,黄萱菁,吴立德.基于错误驱动算法组合分类器及其在问题分类中的应用[J].计算机研究与发展,2008,45(3):535-541. 被引量：19
8毛新华,张冬茉.基于RST语篇分析方法的问题回答系统的答句生成[J].计算机工程,2004,30(14):32-35. 被引量：1
9粘少杰.基于MAS的有偿交互QA系统的投诉模型分析[J].科技促进发展,2010,6(4):58-58.
10杜永萍,黄萱菁,吴立德.模式学习在QA系统中的有效实现[J].计算机研究与发展,2006,43(3):449-455. 被引量：10

软件学报

2005年第8期

浏览历史

内容加载中请稍等...

基于最大熵模型的QA系统置信度评分算法被引量：9

参考文献6

同被引文献181

引证文献9

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

基于最大熵模型的QA系统置信度评分算法 被引量：9

参考文献6

同被引文献181

引证文献9

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

基于最大熵模型的QA系统置信度评分算法被引量：9