期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于适配器技术的开放域问答及应用
1
作者 宋才华 布力 +1 位作者 关兆雄 林钰杰 《华中师范大学学报(自然科学版)》 北大核心 2026年第1期10-17,共8页
开放域问答技术是自然语言处理领域的重要研究课题,通常采用编码器来学习自然语言问句和段落的密集表示,以进行语义匹配.现有的工作主要通过硬负例挖掘、知识蒸馏或预训练的方式来提高开放域问答系统的性能,但面临参数过多难以进行参数... 开放域问答技术是自然语言处理领域的重要研究课题,通常采用编码器来学习自然语言问句和段落的密集表示,以进行语义匹配.现有的工作主要通过硬负例挖掘、知识蒸馏或预训练的方式来提高开放域问答系统的性能,但面临参数过多难以进行参数高效学习以适应下游推理任务的需求.为了解决此问题,本文提出了一种基于适配器技术的参数高效学习的开放域问答算法(EPLA).首先,通过基于路由的令牌分配策略减少了编码候选片段的计算成本.其次,通过引入基于混合专家的适配器架构,在训练过程中冻结预训练模型的参数,只更新适配器、令牌分配器以及层归一化的参数.最后,通过强化学习的方式构建动态适配器模块,以获得最优的网络架构.验结果表明,EPLA在保持检索性能的同时,能够较大地提升开放域问答算法的效率. 展开更多
关键词 开放域问答 参数微调 预训练模型 自然语言处理
在线阅读 下载PDF
基于聚典数据开放平台的中文事实性幻觉基准测试研究
2
作者 汪琳 刘寅春 毛文涛 《出版与印刷》 2026年第1期12-28,共17页
构造中文事实性幻觉基准测试,对于评估大语言模型生成可靠事实内容的能力,提升大语言模型生成事实内容的准确性,以及构建以可信权威数据为枢纽的人机协同知识治理范式具有重要意义。研究基于聚典数据开放平台构造了包含5200个简洁的中... 构造中文事实性幻觉基准测试,对于评估大语言模型生成可靠事实内容的能力,提升大语言模型生成事实内容的准确性,以及构建以可信权威数据为枢纽的人机协同知识治理范式具有重要意义。研究基于聚典数据开放平台构造了包含5200个简洁的中文事实性问答对的SuperQA基准测试集,并对当前33种主流大语言模型的生成服务进行了系统测评。测评结果显示:(1)通过对比不同基准测评下的事实性幻觉测试结果,验证了本研究测评结果的合理性;(2)模型生成事实内容能力与其全参数大小呈正相关;(3)不同MaaS(模型即服务)厂商模型在事实准确性方面存在差异,部分模型表现较好;(4)相较于Instruct模型,深度思考模型在生成事实性内容时准确性更高;(5)部分模型在保持较低幻觉率的同时参数量较小,具备本地部署成本优势;(6)各模型在文学艺术和历史地理两个学科领域的事实生成能力普遍较弱。通过对测试结果进行分析,提出了今后评估大语言模型生成可靠事实内容能力的改进方向。文章进一步探讨了影响大语言模型生成事实内容准确性的因素,分析了大语言模型产生幻觉的原因,并提出了提升模型生成事实性内容准确性的可行措施。研究认为,出版业积累的高质量数据将成为大语言模型应用的重要基石。 展开更多
关键词 人工智能 大语言模型 事实性幻觉 问答对数据集 基准测试 聚典数据开放平台
在线阅读 下载PDF
基于查询感知和信息压缩的检索增强语言模型 被引量:2
3
作者 何欣洋 何智毅 +1 位作者 任思远 彭程 《计算机应用》 北大核心 2025年第S1期24-29,共6页
检索增强生成(RAG)已经成为了解决大语言模型(LLM)存在幻觉、无法获取最新知识等问题的主要方法。然而,目前的RAG方法普遍将检索到的所有文档一起输入到LLM中,没有对不相关的文档进行识别,并且没有考虑单个文档中的噪声对LLM性能的影响... 检索增强生成(RAG)已经成为了解决大语言模型(LLM)存在幻觉、无法获取最新知识等问题的主要方法。然而,目前的RAG方法普遍将检索到的所有文档一起输入到LLM中,没有对不相关的文档进行识别,并且没有考虑单个文档中的噪声对LLM性能的影响,而这些不相关的文档和文档中的噪声会误导LLM生成错误的答案,降低模型性能,并增加LLM的推理时间。针对上述问题,提出一种基于查询感知和信息压缩的检索增强语言模型。首先,在检索过程完成后,通过信息压缩模块利用关键句抽取模块来选择单个文档中的关键句;其次,通过重排器模块选择文档集中最相关的文档,从而达到去除文档中的噪声和过滤不相关文档的目的;最后,提出基于查询感知的上下文学习(ICL)模块,通过在训练集中检索与输入最相似的示例对并把它们插入到LLM的上下文中,利用LLM的ICL能力来提高模型性能。实验结果显示,相比最好的基线模型REAR(RElevance-Aware Retrieval-augmented framework),所提模型在NQ(Natural Questions)、SQuAD(Stanford Question Answering Dataset)和TQA(TriviaQA)数据集的F1值上分别获得了0.70、0.96、1.23个百分点的提升,在NQ和SQuAD数据集的EM(Exact Match)值上分别获得了1.13和0.82个百分点的提升,证明了所提模型在开放域问答(ODQA)任务上的有效性。此外,由于所提出的模型无需额外训练,降低了对计算资源的需求,并且该模型可以应用到任意LLM中,体现了所提模型广泛的适用性。 展开更多
关键词 检索增强生成 大语言模型 上下文学习 信息压缩 开放域问答
在线阅读 下载PDF
面向LLM开放域问答中多方私有表格筛选:一种MPC可公开聚合审计与动态信誉的增强方法
4
作者 胡睿 吴昊 +3 位作者 潘宇轩 张琳 刘雨 朱孔林 《电子学报》 北大核心 2025年第9期3089-3102,共14页
大语言模型(Large Language Model,LLM)驱动的开放域问答(Open-Domain Question Answering,ODAQ)系统,如GIST(Generating Identifiers and Selecting chunks for Tables)框架,在处理海量表格数据时展现出巨大潜力,受到了广泛关注.然而,... 大语言模型(Large Language Model,LLM)驱动的开放域问答(Open-Domain Question Answering,ODAQ)系统,如GIST(Generating Identifiers and Selecting chunks for Tables)框架,在处理海量表格数据时展现出巨大潜力,受到了广泛关注.然而,当ODQA系统需要整合多方私有表格数据进行Top-K候选筛选等环节时,传统方法需要访问全部原数据,这在数据隐私、计算透明度及参与方行为可信度方面面临挑战.虽然现有研究采用零知识证明和基于权益的机制实现了公开可验证性,但在大规模场景下生成和验证单个证明的开销过高,而传统的基于权益的机制在公平性和对动态环境的适应性方面也存在局限性.对此,本文基于多方安全计算(Multi-Party Computation,MPC)、可公开聚合审计与动态信誉机制,提出了一种面向LLM开放域问答中多方私有表格筛选的增强方法.将Top-K多方私有表格筛选过程通过MPC完成,以保护多方私有数据隐私.同时,引入高效的聚合审计机制,将零知识证明技术与随机抽样、聚合证明构造、基于时间窗口的批处理和错误定位相结合,确保评分与排序过程的正确性可以被批量、公开验证.基于区块链的动态信誉反馈机制的集成也增强了系统的公平性,并约束了恶意行为.实验评估表明,本文的Top-K候选筛选方法在保证隐私的同时与GIST原有筛选方法在结果上达到0.91的Top-50平均召回率和0.83的平均Jaccard指数,具有高度一致性,不会影响ODQA端到端任务性能.同时,大规模任务下可公开审计的证明和验证效率均得到提升,与单独的证明相比节省了约87%的证明时间.反馈机制的适应性和公平性也得到了增强. 展开更多
关键词 开放域问答 大语言模型 多方安全计算 可公开审计 零知识证明 区块链
在线阅读 下载PDF
一种基于领域知识的检索增强生成方法 被引量:1
5
作者 张高飞 李欢 +3 位作者 池云仙 赵巧红 勾智楠 高凯 《河北工业科技》 2025年第2期103-110,196,共9页
为了提高当前大语言模型(large language model,LLM)在利用检索文档生成答案时的准确性,提出一种基于领域知识的检索增强生成(retrieval-augmented generation,RAG)方法。首先,在检索过程中通过问题和领域知识进行第1层的稀疏检索,为后... 为了提高当前大语言模型(large language model,LLM)在利用检索文档生成答案时的准确性,提出一种基于领域知识的检索增强生成(retrieval-augmented generation,RAG)方法。首先,在检索过程中通过问题和领域知识进行第1层的稀疏检索,为后续的稠密检索提供领域数据集;其次,在生成过程中采用零样本学习的方法,将领域知识拼接在问题之前或之后,并与检索文档结合,输入到大语言模型中;最后,在医疗领域和法律领域数据集上使用大语言模型ChatGLM2-6B、Baichuan2-7B-chat进行多次实验,并进行性能评估。结果表明:基于领域知识的检索增强生成方法能够有效提高大语言模型生成答案的领域相关度,并且零样本学习方法相较于微调方法表现出更好的效果;采用零样本学习方法时,融入领域知识的稀疏检索和领域知识前置方法在ChatGLM2-6B上取得了最佳提升效果,与基线方法相比,ROUGE-1、ROUGE-2和ROUGE-L评分分别提高了3.82、1.68、4.32个百分点。所提方法能够提升大语言模型生成答案的准确性,为开放域问答的研究和应用提供重要参考。 展开更多
关键词 自然语言处理 开放域问答 检索增强生成 大语言模型 零样本学习 领域知识
在线阅读 下载PDF
图书馆学科咨询借鉴维基与网络开放问答模式的可行性分析与方案构想 被引量:6
6
作者 肖国华 何雪梅 《图书馆论坛》 CSSCI 北大核心 2007年第5期34-38,共5页
分析学科咨询的现状和维基与国内外主要几种网络开放问答的发展应用状况,认为学科咨询服务借鉴维基和网络开放问答模式在理论上和实际操作上皆具有可行性,并在此基础上从理念原则、基本框架、运行机制等方面提出建立学科咨询开放平台的... 分析学科咨询的现状和维基与国内外主要几种网络开放问答的发展应用状况,认为学科咨询服务借鉴维基和网络开放问答模式在理论上和实际操作上皆具有可行性,并在此基础上从理念原则、基本框架、运行机制等方面提出建立学科咨询开放平台的初步构想。 展开更多
关键词 学科咨询 学科馆员 维基 开放问答 学科平台
在线阅读 下载PDF
开放域问答技术研究进展 被引量:17
7
作者 张志昌 张宇 +1 位作者 刘挺 李生 《电子学报》 EI CAS CSCD 北大核心 2009年第5期1058-1069,共12页
问答技术是信息检索和自然语言理解中的研究热点.本文对开放域问答技术在近年来的研究进展进行了总结.针对不同类型的问题,比较了问答系统中问题分析、文档和句段检索、答案抽取各个部分不同实现方法的特点,讨论了这些技术中存在的不足... 问答技术是信息检索和自然语言理解中的研究热点.本文对开放域问答技术在近年来的研究进展进行了总结.针对不同类型的问题,比较了问答系统中问题分析、文档和句段检索、答案抽取各个部分不同实现方法的特点,讨论了这些技术中存在的不足.最后,对问答技术未来的研究趋势进行了分析与展望. 展开更多
关键词 开放域问答 问题分析 相关文档检索 句段检索 答案抽取
在线阅读 下载PDF
面向开放域问答的问题分类技术研究进展 被引量:7
8
作者 杨思春 戴新宇 陈家骏 《电子学报》 EI CAS CSCD 北大核心 2015年第8期1627-1636,共10页
开放域问答是当前自然语言处理和信息检索领域的研究热点,作为开放域问答系统的重要组成部分,问题分类可以缩小答案的搜索空间并决定答案的选择策略.近年来,基于机器学习的问题分类技术受到广泛的关注,相关研究表明问题分类的准确性直... 开放域问答是当前自然语言处理和信息检索领域的研究热点,作为开放域问答系统的重要组成部分,问题分类可以缩小答案的搜索空间并决定答案的选择策略.近年来,基于机器学习的问题分类技术受到广泛的关注,相关研究表明问题分类的准确性直接影响问答系统的整体性能.本文从分类体系与数据集、特征提取、分类器设计、性能评测等层面,总结了问题分类技术近年的主要研究成果.重点分析了各种基于监督学习的问题分类方法的特点和不足,讨论了核方法、半监督学习、主动学习、迁移学习等在问题分类中的应用,同时对问题分类技术未来研究动向进行了展望. 展开更多
关键词 开放域问答 问题分类 机器学习 特征提取 分类器设计
在线阅读 下载PDF
基于知识库的开放领域问答系统 被引量:13
9
作者 张涛 贾真 +1 位作者 李天瑞 黄雁勇 《智能系统学报》 CSCD 北大核心 2018年第4期557-563,共7页
问答系统能够理解用户问题,并直接返回答案。现有问答系统大多是面向领域的,仅能回答特定领域的问题。文中提出了基于大规模知识库的开放领域问答系统实现方法。该系统首先采用自定义词典分词和CRF模型相结合的方法识别问句中的主体;其... 问答系统能够理解用户问题,并直接返回答案。现有问答系统大多是面向领域的,仅能回答特定领域的问题。文中提出了基于大规模知识库的开放领域问答系统实现方法。该系统首先采用自定义词典分词和CRF模型相结合的方法识别问句中的主体;其次,采用模糊匹配方法将问句中的主体与知识库中实体建立链接;然后,通过相似度计算以及规则匹配等多种方法识别问句中的谓词并与知识库实体的属性建立关联;最后,进行实体消歧和答案获取。该系统平均F-Measure值为0.695 6,表明所提方法在基于知识库的开放领域问答上具有可行性。 展开更多
关键词 问答系统 开放领域 实体识别 实体链接 知识库
在线阅读 下载PDF
多跳机器阅读理解研究进展 被引量:4
10
作者 苏珂 黄瑞阳 +2 位作者 张建朋 余诗媛 胡楠 《计算机工程》 CAS CSCD 北大核心 2021年第9期1-17,共17页
与常规的单跳机器阅读理解相比,多跳机器阅读理解(MHMRC)需要在多个相关文档段落中进行多跳推理以实现对复杂问题的理解和回答,其更接近于人类的语言推理能力,具有广阔的应用前景但也极具挑战性。阐述MHMRC的研究背景,将现有方法根据适... 与常规的单跳机器阅读理解相比,多跳机器阅读理解(MHMRC)需要在多个相关文档段落中进行多跳推理以实现对复杂问题的理解和回答,其更接近于人类的语言推理能力,具有广阔的应用前景但也极具挑战性。阐述MHMRC的研究背景,将现有方法根据适用场景分为封闭集合问答和开放域问答两类,主要包括基于问题分解的方法、基于图神经网络的方法、改进检索的方法、基于推理路径的方法等,分别从模型架构、特点、优劣等方面进行分析。介绍用于多跳推理的非结构化文本数据集和评测指标,对比各模型的性能表现。在此基础上,分析目前MHMRC研究的热点与难点,指出未来发展方向。 展开更多
关键词 机器阅读理解 多跳机器阅读理解 问题分解 图神经网络 开放域问答
在线阅读 下载PDF
论法律解释学视角内外的确定性命题 被引量:9
11
作者 陈洪杰 《法律科学(西北政法大学学报)》 CSSCI 北大核心 2012年第2期30-39,共10页
自德沃金以降的理论方向代表了在法律解释学的向度内建构法律确定性命题的一种极致努力。但当我们把目光重新拉回到中国时,却又可以明显感受到法律解释论路向的限度,原因就在于我国法院判决所缺失的重要维度:权威性与终局性。在判决之... 自德沃金以降的理论方向代表了在法律解释学的向度内建构法律确定性命题的一种极致努力。但当我们把目光重新拉回到中国时,却又可以明显感受到法律解释论路向的限度,原因就在于我国法院判决所缺失的重要维度:权威性与终局性。在判决之终局性成为疑问的背景下,法院在实践操作中不再拘泥于法律解释论上立场的精确阐释,而是侧重于引导当事人达成纠纷解决之合意。在这个过程中,法律确定性命题已经不知不觉地被置换成了裁判的可接受性问题。这一基本事实足以促成我们进行理论视角的转换:由法律的解释论转向法律的商谈论。 展开更多
关键词 法律现实主义 空缺结构 唯一正解 法律商谈
原文传递
开放领域汉语知识问答方法 被引量:3
12
作者 姜吉发 《计算机工程》 EI CAS CSCD 北大核心 2005年第11期1-3,共3页
给出了一种开放领域汉语知识问答中某些问答类型的模式的获取方法和所获取模式的精度计算方法。对几个选定的问答类型,使用该法获取它们各自所对应的浅层文本模式,然后在这些模式的指导下,对各个问答类型下的一些问题进行答案查找。结... 给出了一种开放领域汉语知识问答中某些问答类型的模式的获取方法和所获取模式的精度计算方法。对几个选定的问答类型,使用该法获取它们各自所对应的浅层文本模式,然后在这些模式的指导下,对各个问答类型下的一些问题进行答案查找。结果表明,采用浅层文本模式匹配方法来应对开放领域汉语知识问答是有效的。 展开更多
关键词 开放领域 汉语 知识问答 模式获取 模式匹配
在线阅读 下载PDF
多面Rasch模型在口语主观性试题网上评阅中的应用研究 被引量:3
13
作者 彭恒利 李蕊 《考试研究》 2015年第3期16-26,共11页
选取MHK口语试题实测数据,运用多面Rasch模型的理论和方法对人工评分与计算机自动评分的严厉程度、评分员内部以及各评分员之间的一致性程度进行研究,分析了两种评分方式在严厉度、一致性等方面存在的具体差异,以及不同试题之间是否存... 选取MHK口语试题实测数据,运用多面Rasch模型的理论和方法对人工评分与计算机自动评分的严厉程度、评分员内部以及各评分员之间的一致性程度进行研究,分析了两种评分方式在严厉度、一致性等方面存在的具体差异,以及不同试题之间是否存在难度差异,希望据此为提高MHK阅卷的科学化水平及命题质量提供依据和建议。 展开更多
关键词 口语主观性试题 人工评分 计算机自动评分 严厉度 一致性
在线阅读 下载PDF
文学研究与教育是否该有“标准答案”
14
作者 李铁秀 《哈尔滨学院学报》 2005年第9期39-43,共5页
文章有感于中国文学研究及教育的传统与现状,提出当前文学研究与教育中的一个问题,即究竟(应该)有无“标准答案”的问题,并给出初步的理论上的回答。问题提出的价值在于它的确是个问题。文章重在“解构”,而旨在引起关注并对由此问题必... 文章有感于中国文学研究及教育的传统与现状,提出当前文学研究与教育中的一个问题,即究竟(应该)有无“标准答案”的问题,并给出初步的理论上的回答。问题提出的价值在于它的确是个问题。文章重在“解构”,而旨在引起关注并对由此问题必然而至的文学研究与教育中一系列的具体相关问题进行深入的讨论。 展开更多
关键词 标准答案 解构 开放 对话
在线阅读 下载PDF
对数学问题的解法开放的认识——数学开放题在师专大有作为系列之二
15
作者 邢妍 《保山师专学报》 2001年第4期7-11,共5页
长期以来 ,数学课程总是强调它的“逻辑性”、“演绎性”、“封闭性”……在课堂教学中如何克服已有的机械模式 ,为学生提供一个发现和创新的机会 ,最有效的办法是在现有的课堂教学中 ,渗入开放的观念。观念的开放是让学生在原有数学问... 长期以来 ,数学课程总是强调它的“逻辑性”、“演绎性”、“封闭性”……在课堂教学中如何克服已有的机械模式 ,为学生提供一个发现和创新的机会 ,最有效的办法是在现有的课堂教学中 ,渗入开放的观念。观念的开放是让学生在原有数学问题提出新问题 ,提出新的解法 。 展开更多
关键词 观念开放 解法开放 答案开放 数学问题本身的开放
在线阅读 下载PDF
提高毕业论文质量探讨
16
作者 薛姝 张协奎 《高等建筑教育》 2000年第1期32-34,共3页
本文从遴选毕业论文指导教师、选题紧密结合社会实践、完善管理机制、加强答辩等方面阐述了对提高毕业论文质量的积极作用。
关键词 管理机制 论文评审 公开答辩 毕业论文 高校
在线阅读 下载PDF
面向开放域深度学习的自动问答技术研究 被引量:3
17
作者 莫丽娅 《自动化与仪器仪表》 2023年第5期216-220,共5页
结合聊天机器人背景,提出一个面向开放域深度学习的人机交互英语自动问答系统。首先,通过问答系统子模块建立问答库和收录问题预处理;然后利用机器学习算法进行关键词扩展、问题分类、相似度计算和答案匹配抽取;最后采用基于LSTM的Seq2... 结合聊天机器人背景,提出一个面向开放域深度学习的人机交互英语自动问答系统。首先,通过问答系统子模块建立问答库和收录问题预处理;然后利用机器学习算法进行关键词扩展、问题分类、相似度计算和答案匹配抽取;最后采用基于LSTM的Seq2seq模型实现英语聊天机器人,并在其基础上加入注意力机制和集数搜索算法,以提升系统自动问答质量。结果表明,相较于RNN和GRU神经元生成回复,LSTM神经元的生成回复结果更加准确。且添加注意力机制和集数搜索后,模型收敛速度显著提升。系统测试发现,英语问答系统子模块和英语聊天机器人的问答正确率分别为95.48%和96.52%,系统自动问答正确率为96%。由此可知,本系统可实现人机交互和英语问题的自动问答。 展开更多
关键词 开放域 人机交互 Seq2seq模型 自动问答系统 聊天机器人
原文传递
UTMCQA:融合多任务的复杂问答模型 被引量:4
18
作者 周高峰 高盛祥 +2 位作者 余正涛 宋燃 寇梦珂 《小型微型计算机系统》 CSCD 北大核心 2021年第9期1830-1836,共7页
对复杂问题的处理一直是开放域问答(Open Domain Question Answering,ODQA)的一个难点,回答复杂问题需要分析问题及其相关的词法、句法和语义内容,该过程需要同时建模命名实体识别、句法分析、关系抽取等多项自然语言处理任务,因此如何... 对复杂问题的处理一直是开放域问答(Open Domain Question Answering,ODQA)的一个难点,回答复杂问题需要分析问题及其相关的词法、句法和语义内容,该过程需要同时建模命名实体识别、句法分析、关系抽取等多项自然语言处理任务,因此如何有效地学习这些任务是一个重要技术挑战.本文提出了一种统一的可训练型多任务复杂问答框架UTMCQA(Uniform Trainable M ulti-tasks framew ork for Complex Question Answ ering),该框架融合了复杂问答涉及的上述主要任务,同时利用预训练语言模型(BERT)提供语义支撑,以语义相似作为启发信息从知识库和文本库中获取相关实体,采用图神经网络建模问题与事实之间的关系,并通过队列算法动态扩展问题子图,最后在子图的广度范围内,选择实体集合中的最优实体作为问题的最终答案.在公开的大规模复杂问题数据集ComplexWebQuestion上的实验表明,在不同场景设置下的UTMCQA均能有效提升问答系统的性能. 展开更多
关键词 开放域问答 复杂问题 问答系统
在线阅读 下载PDF
中文开放域问答系统数据增广研究 被引量:3
19
作者 杜家驹 叶德铭 孙茂松 《中文信息学报》 CSCD 北大核心 2022年第11期121-130,共10页
开放域问答是自然语言处理中的重要任务之一。目前的开放域问答模型总是倾向于在问题和文章之间做浅层的文本匹配,经常在一些简单问题上出错。这些错误的原因部分是由于阅读理解数据集缺少一些真实场景下常见的模式。该文提出了几种能... 开放域问答是自然语言处理中的重要任务之一。目前的开放域问答模型总是倾向于在问题和文章之间做浅层的文本匹配,经常在一些简单问题上出错。这些错误的原因部分是由于阅读理解数据集缺少一些真实场景下常见的模式。该文提出了几种能够提高开放域问答鲁棒性的数据增广方法,能有效减少这些常见模式的影响。此外,我们还构造并公开发布了一个新的开放域问答数据集,能够评估模型在真实场景下的实际效果。实验结果表明,该文提出的方法在实际场景下带来了性能提升。 展开更多
关键词 开放域问答 鲁棒性 数据增广
在线阅读 下载PDF
开放领域知识图谱问答研究综述 被引量:31
20
作者 陈子睿 王鑫 +2 位作者 王林 徐大为 贾勇哲 《计算机科学与探索》 CSCD 北大核心 2021年第10期1843-1869,共27页
知识图谱问答是通过处理用户提出的自然语言问题,基于知识图谱的某种形式,从中获取相关答案的过程。由于知识规模、计算能力及自然语言处理能力的制约,早期知识库问答系统被应用于限定领域。近年来,随着知识图谱的发展,以及开放领域问... 知识图谱问答是通过处理用户提出的自然语言问题,基于知识图谱的某种形式,从中获取相关答案的过程。由于知识规模、计算能力及自然语言处理能力的制约,早期知识库问答系统被应用于限定领域。近年来,随着知识图谱的发展,以及开放领域问答数据集的陆续提出,知识图谱已用于开放领域问答研究与实践。以技术发展为主线,对开放领域知识图谱问答进行综述。首先,介绍五种基于规则模板的开放领域知识图谱问答方法:传统语义解析、传统信息检索、三元组匹配、话语模板和查询模板,这类方法主要依赖人工定义的规则模板完成问答工作。其次,描述五种基于深度学习的方法,这类方法采用神经网络模型完成问答过程的各类子任务,包括知识图谱嵌入、记忆网络、基于神经网络的语义解析、基于神经网络的查询图、基于神经网络的信息检索。接着,介绍开放领域知识图谱问答常用的4个通用领域知识图谱和11个开放领域问答数据集。随后,按照问题的难易程度选择3个经典问答数据集比较各问答系统的性能指标,对比不同方法间的性能差异并进行分析。最后,展望开放领域知识图谱问答的未来研究方向。 展开更多
关键词 知识图谱问答(KGQA) 开放领域 深度学习 语义解析 信息检索
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部