期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于聚典数据开放平台的中文事实性幻觉基准测试研究
1
作者 汪琳 刘寅春 毛文涛 《出版与印刷》 2026年第1期12-28,共17页
构造中文事实性幻觉基准测试,对于评估大语言模型生成可靠事实内容的能力,提升大语言模型生成事实内容的准确性,以及构建以可信权威数据为枢纽的人机协同知识治理范式具有重要意义。研究基于聚典数据开放平台构造了包含5200个简洁的中... 构造中文事实性幻觉基准测试,对于评估大语言模型生成可靠事实内容的能力,提升大语言模型生成事实内容的准确性,以及构建以可信权威数据为枢纽的人机协同知识治理范式具有重要意义。研究基于聚典数据开放平台构造了包含5200个简洁的中文事实性问答对的SuperQA基准测试集,并对当前33种主流大语言模型的生成服务进行了系统测评。测评结果显示:(1)通过对比不同基准测评下的事实性幻觉测试结果,验证了本研究测评结果的合理性;(2)模型生成事实内容能力与其全参数大小呈正相关;(3)不同MaaS(模型即服务)厂商模型在事实准确性方面存在差异,部分模型表现较好;(4)相较于Instruct模型,深度思考模型在生成事实性内容时准确性更高;(5)部分模型在保持较低幻觉率的同时参数量较小,具备本地部署成本优势;(6)各模型在文学艺术和历史地理两个学科领域的事实生成能力普遍较弱。通过对测试结果进行分析,提出了今后评估大语言模型生成可靠事实内容能力的改进方向。文章进一步探讨了影响大语言模型生成事实内容准确性的因素,分析了大语言模型产生幻觉的原因,并提出了提升模型生成事实性内容准确性的可行措施。研究认为,出版业积累的高质量数据将成为大语言模型应用的重要基石。 展开更多
关键词 人工智能 大语言模型 事实性幻觉 问答对数据集 基准测试 聚典数据开放平台
在线阅读 下载PDF
动态数据集环境下的强邻近对查询 被引量:9
2
作者 李松 张丽平 郝忠孝 《计算机研究与发展》 EI CSCD 北大核心 2015年第3期749-759,共11页
数据集中的强邻近对查询在空间数据挖掘、大数据处理、空间数据库、地理信息系统、数据的相似分析和推理等方面具有重要的作用.已有的数据查询方法无法有效处理动态数据集中的强邻近对查询问题,针对动态数据集中的强邻近对查询的特点和... 数据集中的强邻近对查询在空间数据挖掘、大数据处理、空间数据库、地理信息系统、数据的相似分析和推理等方面具有重要的作用.已有的数据查询方法无法有效处理动态数据集中的强邻近对查询问题,针对动态数据集中的强邻近对查询的特点和复杂性,基于Voronoi图和R树空间索引结构提出了处理初始数据环境下的双数据集中的强邻近对查询算法VR_SNP.针对分布区域不规则且数据点分布密度差异较大的情况利用Voronoi图进行计算查询,反之,则利用R树进行查询.通过对初始强邻近对集和候选邻近对集进行二次判断计算,筛选出有效结果,给出了数据集动态增加和动态减少环境下的强邻近对查询算法VR_SNP_DA和算法VR_SNP_DE.进一步提出了移动点位置变化情况下的强邻近对查询算法VR_SNP_DL.理论研究和实验比较表明在数据集的数据量、新增点集和删除点集的规模较大、移动点的位置变化次数较多等情况下,所提出的算法具有较为明显的查询优势. 展开更多
关键词 空间数据库 VORONOI图 动态数据集 最近邻查询 强邻近对查询
在线阅读 下载PDF
最近对寻址的专利实体关系抽取方法 被引量:4
3
作者 李成奇 雷海卫 +1 位作者 李帆 呼文秀 《计算机工程与设计》 北大核心 2024年第4期1100-1108,共9页
针对专利领域没有公开数据集的问题,标注一个中文专利实体关系抽取数据集PERD(patent entity relation dataset)。为完成实体关系抽取任务,提出最近对寻址的实体关系抽取模型NPAM(nearest pair addressing entity relationship extracti... 针对专利领域没有公开数据集的问题,标注一个中文专利实体关系抽取数据集PERD(patent entity relation dataset)。为完成实体关系抽取任务,提出最近对寻址的实体关系抽取模型NPAM(nearest pair addressing entity relationship extraction model),实体位置信息获取方法的改进、注意力机制建模矩阵和实体抽取方法的创新,使该模型在PERD上F1值达到72.74%,相比模型PRGC提升12.64个百分点。实验结果验证了该模型的有效性。 展开更多
关键词 实体关系抽取 专利领域 数据集 最近对寻址 注意力机制 关联性矩阵 全词标记
在线阅读 下载PDF
融合知识图谱和语义匹配的医疗问答系统 被引量:5
4
作者 徐若卿 《现代电子技术》 北大核心 2024年第8期49-54,共6页
问答系统是自然语言处理领域中的一项重要任务,常应用于医疗服务。传统的问答系统通过知识图谱的实体关系匹配返回相应的尾实体作为答案,然而,倘若实体或关系无法识别,又或者在知识图谱中并不存在相应的实体关系,问答将无法继续进行。... 问答系统是自然语言处理领域中的一项重要任务,常应用于医疗服务。传统的问答系统通过知识图谱的实体关系匹配返回相应的尾实体作为答案,然而,倘若实体或关系无法识别,又或者在知识图谱中并不存在相应的实体关系,问答将无法继续进行。为了解决这一问题,建立一种融合知识图谱和语义匹配模型的中文医疗问答混合系统。当所提问题无法在知识图谱中进行实体关系匹配时,该模型能继续从问答对数据集中找到最相似的问题,并返回相应结果作为答案。在语义匹配模型方面,结合中文医疗相似问题对,在Sentence-BERT模型上进行微调训练,并引入双曲空间中的距离度量函数对句子对进行相似度度量。结果表明:在整体性能方面,所提模型相较于BERT这类大语言模型精度能提升7.16%;在度量能力方面,双曲度量相较于通用欧氏空间度量,如余弦度量,最高能有2.28%的精度提升和1.58%的F_1值提升。 展开更多
关键词 医疗问答系统 知识图谱 语义匹配 问答对数据集 相似问题对 双曲距离度量
在线阅读 下载PDF
Using LSA and text segmentation to improve automatic Chinese dialogue text summarization 被引量:3
5
作者 LIU Chuan-han WANG Yong-cheng +1 位作者 ZHENG Fei LIU De-rong 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2007年第1期79-87,共9页
Automatic Chinese text summarization for dialogue style is a relatively new research area. In this paper, Latent Semantic Analysis (LSA) is first used to extract semantic knowledge from a given document, all questio... Automatic Chinese text summarization for dialogue style is a relatively new research area. In this paper, Latent Semantic Analysis (LSA) is first used to extract semantic knowledge from a given document, all question paragraphs are identified, an automatic text segmentation approach analogous to Text'filing is exploited to improve the precision of correlating question paragraphs and answer paragraphs, and finally some "important" sentences are extracted from the generic content and the question-answer pairs to generate a complete summary. Experimental results showed that our approach is highly efficient and improves significantly the coherence of the summary while not compromising informativeness. 展开更多
关键词 Automatic text summarization Latent semantic analysis (LSA) Text segmentation Dialogue style COHERENCE question-answer pairs
在线阅读 下载PDF
面向中文微博的情绪-原因对抽取数据集构建及分析研究
6
作者 陈仲豪 朱军楠 +2 位作者 周玉 向露 宗成庆 《中文信息学报》 CSCD 北大核心 2024年第10期135-143,共9页
情绪-原因对抽取(ECPE)任务旨在从给定文档中同步抽取情绪子句及其对应的原因子句,该任务在新闻领域得到了广泛研究。然而,社交媒体领域ECPE任务的研究相对较少,主要原因在于缺少适用的数据集。与新闻领域相比,该领域更具挑战性和实用性... 情绪-原因对抽取(ECPE)任务旨在从给定文档中同步抽取情绪子句及其对应的原因子句,该任务在新闻领域得到了广泛研究。然而,社交媒体领域ECPE任务的研究相对较少,主要原因在于缺少适用的数据集。与新闻领域相比,该领域更具挑战性和实用性:(1)在社交媒体领域,情绪表达更加多样化、非规范化;(2)以往的研究忽略了情绪造成的主观意图,其对于决策分析有很重要的价值。针对以上问题,该文首先构建了一个面向中文微博的情绪原因抽取数据集,并对其中5009条数据进行了人工标注。该数据集具备以下特点:(1)收录了隐喻、反讽等形式的情绪表达,标注了细粒度的情绪类别;(2)定义了三种类型的意图,并标注了意图子句;(3)当前规模最大的中文情绪-原因对抽取数据集。结合数据集特点,该文提出一种融合情绪类别和意图信息的情绪-原因对抽取方法,并将该方法与多个ECPE主流方法进行了比较分析。实验结果表明,该文方法可以更有效提升社交媒体领域情绪-原因对抽取的效果。 展开更多
关键词 情绪-原因对抽取 中文社交媒体 微博数据集
在线阅读 下载PDF
基于语态后门水印的地理问答数据集版权保护
7
作者 陈玮彤 许鑫 +3 位作者 王曙 杨飞 诸云强 赵晨 《地球信息科学学报》 2026年第3期623-635,共13页
【目的】高质量地理问答数据集是地理大语言模型训练与微调的重要基础资源。在实际应用中,数据集一旦被非版权方用于私有模型微调,侵权方往往仅开放模型接口用于商业化服务,从而规避对原始数据来源的审计与追溯。针对这一问题,本文提出... 【目的】高质量地理问答数据集是地理大语言模型训练与微调的重要基础资源。在实际应用中,数据集一旦被非版权方用于私有模型微调,侵权方往往仅开放模型接口用于商业化服务,从而规避对原始数据来源的审计与追溯。针对这一问题,本文提出了一种基于语态后门水印的地理问答数据集版权保护方法。【方法】首先通过微调代理模型的方式,构造获得将部分问答响应改写为具有积极语态特征且语义保持一致的水印响应。随后,在问题文本中嵌入语义自然且低频出现的触发器词汇,构建含水印的地理问答数据集。在版权验证阶段,仅通过黑盒访问嫌疑模型的推理接口,并结合预训练的水印判别器,根据判别器输出的语态特征判定其是否使用了版权方的数据集。【结果】在DeepSeek-Coder、Qwen3和Llama-3共3个主流开源大语言模型上的实验结果表明,在20%水印嵌入率条件下,水印模型在语义一致性和语言流畅性指标上与干净模型基本一致,且水印验证成功率可稳定达到78%以上。此外,在Llama-3模型上的对比实验结果表明,本文方法在中文地理问答数据集上可实现86.75%的水印验证成功率,而对比方法在该场景下难以获得有效的水印检测结果;在Qwen3模型上的鲁棒性实验表明,在30%干净数据子集进行两轮微调后,仍能保持70.21%的水印验证成功率。【结论】该方法供了一种在不访问原始数据集、仅依赖黑盒模型接口条件下的黑盒版权验证解决方案,为地理问答数据集的版权保护提供有效技术支撑。 展开更多
关键词 地理问答数据集 版权保护 后门水印 水印响应 水印触发器 水印问答对 水印判别器
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部