期刊文献+
共找到179篇文章
< 1 2 9 >
每页显示 20 50 100
基于检索增强生成的化工领域大模型智能问答
1
作者 宋凯 陈泽华 +3 位作者 娄娟 陈建 董宇轩 魏啸然 《天津大学学报(自然科学与工程技术版)》 北大核心 2026年第2期212-220,共9页
化工设备设计需要严格依照标准规范.然而标准规范数量多、内容上相互引用,设计人员面对非常规的设计要求或设计问题时很难准确、全面地查找到所有涉及的标准规范条目.利用检索增强生成(RAG)技术结合大语言模型(LLM)可以对设计要求或设... 化工设备设计需要严格依照标准规范.然而标准规范数量多、内容上相互引用,设计人员面对非常规的设计要求或设计问题时很难准确、全面地查找到所有涉及的标准规范条目.利用检索增强生成(RAG)技术结合大语言模型(LLM)可以对设计要求或设计问题进行准确回答的同时分析并提供相应标准规范内容,从而避免遗漏相关的标准规范.然而,由于化工设备设计领域知识库中具有大量公式、图表等复杂数据,如何构建相应的结构化RAG数据库实现LLM在化工设备设计领域的智能问答尚不明确.针对上述问题,本文提出了一种垂直领域的复杂数据智能问答系统构建一体化框架,该框架结合提示工程方法与多个视觉语言模型以实现RAG数据库的构建,采用语义检索与重排序技术,并选取嵌入模型与大语言模型分别作为检索器与生成器,以实现基于RAG的智能问答.基于该框架,本文构建了化工设备设计领域的智能问答系统,并使用Qwen2.5-72b和Qwen2.5-7b模型在以GB/T 150—2011规范为主的压力容器设计问答数据集上进行实验.结果表明,本文所提出的框架在复杂数据提取的准确性上优于现有技术,并通过RAG技术显著提升了问答系统的性能.相比于未结合RAG的技术,Qwen2.5-72b和Qwen2.5-7b模型的准确率分别提高了19.3%和17.7%.此外还对生成器接受的文档块数量对问答系统准确性的影响与设备设计领域数据的泛化性能进行了研究. 展开更多
关键词 大语言模型 检索增强生成 化工设备设计 智能问答 复杂数据信息提取
在线阅读 下载PDF
互动视角下普通话儿童Wh⁃论元问句的习得模式
2
作者 肖洁 揭春雨 胡深爱 《现代外语》 北大核心 2026年第1期35-46,共12页
本研究基于8名1-3岁普通话儿童的自然语料,从提问与回答两个视角,考察了主语和宾语wh-论元问句的习得模式。结果表明,1)习得序列主要由wh-词自身的指别性决定,并受其句法位置和生命度的调控。具体表现为,宾语问句先于主语问句习得,且“... 本研究基于8名1-3岁普通话儿童的自然语料,从提问与回答两个视角,考察了主语和宾语wh-论元问句的习得模式。结果表明,1)习得序列主要由wh-词自身的指别性决定,并受其句法位置和生命度的调控。具体表现为,宾语问句先于主语问句习得,且“什么”问句在宾语问句中最先习得,“谁”问句在主语问句中最先习得。2)问句的回答虽较提问更早且频率更高,但两者的习得特征相似。基于语言发展互动论,我们结合语言模块(如句法、语义和语境)和输入特征(如频率、原型性和复杂性)的多个维度,对普通话儿童早期wh-论元问句的习得进行了系统分析和深入探讨,旨在拓展此类研究的广度,并为后续研究提供新的方法和视角。 展开更多
关键词 普通话儿童 wh-论元问句 自然语料 习得模式 互动
原文传递
污染源自动监控数据智能分析方法研究
3
作者 胡海涛 周黎 《现代信息科技》 2026年第4期133-137,共5页
随着污染源自动监控系统的广泛应用,传统基于固定阈值和静态规则的异常识别方法,在应对“贴限排放”“恒值异常”“排放差距异常”和“标停未停”等复杂规避行为时,存在准确性不足的问题。为此,文章提出融合行为建模与统计特征分析的4... 随着污染源自动监控系统的广泛应用,传统基于固定阈值和静态规则的异常识别方法,在应对“贴限排放”“恒值异常”“排放差距异常”和“标停未停”等复杂规避行为时,存在准确性不足的问题。为此,文章提出融合行为建模与统计特征分析的4类检测算法,分别针对排放值恒定、突发变化、未按规定停运以及持续贴限运行等行为进行建模识别。算法设计采用多窗口对比、趋势分析及区间判定等手段构建规则逻辑。同时,开发了基于大模型调用的自然语言问答模块,实现对污染数据的语义解析与智能查询,增强了数据交互能力。应用结果显示,该方法具有良好的检测准确性,为智能化环境监管提供了技术支撑。 展开更多
关键词 污染源自动监控 异常检测 贴限生产 标停未停 恒值异常 智能问数
在线阅读 下载PDF
证据推理中大数据技术的应用风险及防范机制
4
作者 凌依依 樊传明 《湖南大学学报(社会科学版)》 北大核心 2026年第1期139-146,共8页
将大数据技术应用于证据推理旨在提升事实认定的准确性,具体表现为提炼要件事实、收集可用证据、规范证据标准以及提示合适概括。然而,大数据技术的生成逻辑本身蕴含错误风险,实际应用于证据推理中可能弱化传统的检验与审查机制,进而导... 将大数据技术应用于证据推理旨在提升事实认定的准确性,具体表现为提炼要件事实、收集可用证据、规范证据标准以及提示合适概括。然而,大数据技术的生成逻辑本身蕴含错误风险,实际应用于证据推理中可能弱化传统的检验与审查机制,进而导致错误风险不当转嫁至诉讼某一方。现有的规制理论,如技术性正当程序论和技术辅助论,主要针对数字技术的通用场景进行规范,难以契合证据推理这一特定领域。对此,我国应以论证型式论作为规制框架,从应用限度、核心工具、适用规则和配套机制四个维度,系统构建风险防范机制。 展开更多
关键词 证据推理 大数据技术 论证型式 批判性问题
在线阅读 下载PDF
基于聚典数据开放平台的中文事实性幻觉基准测试研究
5
作者 汪琳 刘寅春 毛文涛 《出版与印刷》 2026年第1期12-28,共17页
构造中文事实性幻觉基准测试,对于评估大语言模型生成可靠事实内容的能力,提升大语言模型生成事实内容的准确性,以及构建以可信权威数据为枢纽的人机协同知识治理范式具有重要意义。研究基于聚典数据开放平台构造了包含5200个简洁的中... 构造中文事实性幻觉基准测试,对于评估大语言模型生成可靠事实内容的能力,提升大语言模型生成事实内容的准确性,以及构建以可信权威数据为枢纽的人机协同知识治理范式具有重要意义。研究基于聚典数据开放平台构造了包含5200个简洁的中文事实性问答对的SuperQA基准测试集,并对当前33种主流大语言模型的生成服务进行了系统测评。测评结果显示:(1)通过对比不同基准测评下的事实性幻觉测试结果,验证了本研究测评结果的合理性;(2)模型生成事实内容能力与其全参数大小呈正相关;(3)不同MaaS(模型即服务)厂商模型在事实准确性方面存在差异,部分模型表现较好;(4)相较于Instruct模型,深度思考模型在生成事实性内容时准确性更高;(5)部分模型在保持较低幻觉率的同时参数量较小,具备本地部署成本优势;(6)各模型在文学艺术和历史地理两个学科领域的事实生成能力普遍较弱。通过对测试结果进行分析,提出了今后评估大语言模型生成可靠事实内容能力的改进方向。文章进一步探讨了影响大语言模型生成事实内容准确性的因素,分析了大语言模型产生幻觉的原因,并提出了提升模型生成事实性内容准确性的可行措施。研究认为,出版业积累的高质量数据将成为大语言模型应用的重要基石。 展开更多
关键词 人工智能 大语言模型 事实性幻觉 问答对数据集 基准测试 聚典数据开放平台
在线阅读 下载PDF
面向民航飞机故障安全诊断的知识图谱构建方法 被引量:2
6
作者 朱江 谢涛 《中国安全生产科学技术》 北大核心 2025年第3期186-194,共9页
为更好地管理和利用民航飞机设备故障维修知识,提高飞机故障安全诊断的决策效率,提出融合数据增强和多尺度注意力机制的飞机设备故障知识图谱构建方法。首先,创建基于语义相似性的实体集构建模式,结合余弦相似度计算扩充数据样本。其次... 为更好地管理和利用民航飞机设备故障维修知识,提高飞机故障安全诊断的决策效率,提出融合数据增强和多尺度注意力机制的飞机设备故障知识图谱构建方法。首先,创建基于语义相似性的实体集构建模式,结合余弦相似度计算扩充数据样本。其次,采用多尺度注意力对BERT-BiLSTM-CRF模型进行优化改进,以提升知识抽取时局部和全局信息的关注度。最后,利用Neo4j图数据库搭建飞机设备故障知识图谱,并辅助开发智能问答系统用于决策推荐。研究结果表明:所提方法有效解决模型在小样本数据上的局限性,且故障文本知识抽取性能较基准模型显著提升,实体识别精确率、召回率和F 1分别达到92.59%,94.68%和93.62%,为搭建知识图谱提供可靠信息。研究结果可为实现飞机故障的高效诊断和预防飞机事故风险提供参考。 展开更多
关键词 飞机设备 故障诊断 数据增强 多尺度注意力 知识图谱 智能问答
在线阅读 下载PDF
材料领域知识图谱构建与应用研究 被引量:4
7
作者 袁扬 刘祺霖 +5 位作者 陈子逸 万萌 李凯 王彦棡 王婧 王宗国 《数据与计算发展前沿(中英文)》 2025年第1期152-162,共11页
【目的】为方便处理大规模非结构化材料科学信息,深入挖掘材料信息数据之间的关系,知识图谱为材料的特性和结构的集成研究提供了技术支持。【方法】本研究提出了一种新的知识图谱构建方式,构建了基于知识图谱的材料知识智能问答及材料... 【目的】为方便处理大规模非结构化材料科学信息,深入挖掘材料信息数据之间的关系,知识图谱为材料的特性和结构的集成研究提供了技术支持。【方法】本研究提出了一种新的知识图谱构建方式,构建了基于知识图谱的材料知识智能问答及材料知识图谱云平台。知识智能问答系统通过BERT+CRF构建,图谱云平台基于B/S框架开发。【结果】本研究构建的系统框架可以实现材料的知识问答,并以云平台的形式为用户提供使用入口,并可直观展示材料知识图谱。以III-V族化合物计算数据集为例,构建了III-V族化合物材料知识图谱。【结论】本研究扩展了知识图谱在材料领域的应用,对加快新材料的发现和挖掘材料的潜在信息具有重要意义。 展开更多
关键词 知识图谱 材料数据 智能问答 云平台
在线阅读 下载PDF
中医古籍方剂数据挖掘与知识问答系统构建 被引量:10
8
作者 李明 罗晓兰 朱邦贤 《图书馆论坛》 北大核心 2025年第4期49-59,共11页
文章以《伤寒论》等中医古籍为数据来源,结合古籍的目录结构,通过ChatGLM提取古籍中的方剂信息,存入MySQL关系型数据库,构建中医古籍方剂检索系统;通过ChatGLM对方剂信息进行解析,利用Apriori、association_rules、community_louvain等... 文章以《伤寒论》等中医古籍为数据来源,结合古籍的目录结构,通过ChatGLM提取古籍中的方剂信息,存入MySQL关系型数据库,构建中医古籍方剂检索系统;通过ChatGLM对方剂信息进行解析,利用Apriori、association_rules、community_louvain等数据挖掘算法,以及Echart、Pyvis等知识图谱工具,实现中医古籍挖掘及知识图谱可视化展示,构建基于LLM的中医古籍方剂数据挖掘系统;以BISHENG平台为工具,以抽取方剂信息为来源,构建基于检索增强生成的中医古籍方剂知识问答系统。研究结果表明:本研究方法提取中医古籍方剂名的召回率为99.19%-100%;除《医学衷中参西录·方剂篇》外,方剂组成、主治、用法抽取准确性的ROUGE-L值为84.29%-97.78%;中药名和剂量识别的准确率大于98.00%,主治解析准确率大于86.00%;数据挖掘结果与已有古籍研究成果相符;知识问答结果符合预期。 展开更多
关键词 大语言模型 检索增强生成 数据挖掘 知识问答 中医古籍
暂未订购
标准驱动的本体质量评估模型研究
9
作者 袁满 刘国娇 +1 位作者 袁靖舒 翟可欣 《吉林大学学报(信息科学版)》 2025年第3期605-614,共10页
针对目前数据治理领域本体质量评估模型普遍缺乏标准化支持的问题,构建一个标准的本体质量评估模型具有极其重要意义。为此,首先研究ISO/IEC 25012数据质量标准对维度的标准化定义;其次采用GQM(Goal-Question-Metric)方法论为指导定义... 针对目前数据治理领域本体质量评估模型普遍缺乏标准化支持的问题,构建一个标准的本体质量评估模型具有极其重要意义。为此,首先研究ISO/IEC 25012数据质量标准对维度的标准化定义;其次采用GQM(Goal-Question-Metric)方法论为指导定义每个维度下的指标,实现指标到维度的映射;然后在W3C(World Wide Web Consortium)提出的DQV(Data Quality Vocabulary)数据质量模型的基础上进行扩展,构建出一个具备可扩展性和鲁棒性的本体质量模型。通过提出的质量评估模型提供统一的、规范的术语体系描述本体质量的各个要素,为本体质量评估提供了一个标准化的质量知识表示模型。最后以本体完整性维度为例,构建相应的质量评估模型,并使用井下作业数据集验证了模型的可行性,有效地解决数据治理领域本体质量评估模型普遍缺乏标准化的问题,为数据治理领域提供了一个统一、规范的术语体系描述本体质量的各个要素。 展开更多
关键词 本体评估 质量维度 质量评估模型 数据质量词汇 质量-目标-指标方法论
在线阅读 下载PDF
基于本地大语言模型和知识图谱的课程设计--以“网络爬虫与商业预测分析”课程为例 被引量:4
10
作者 毛志新 冯睿 +1 位作者 张智 刘文侠 《实验室研究与探索》 北大核心 2025年第5期141-147,共7页
探索融合本地化部署的大语言模型与知识图谱,以提升智能教学设计与支持。以“网络爬虫与商业预测分析”课程为例,开展数据预处理、模型优化、知识图谱构建及应用服务集成,实现知识点结构化表示、动态更新、智能问答与个性化资源推荐。... 探索融合本地化部署的大语言模型与知识图谱,以提升智能教学设计与支持。以“网络爬虫与商业预测分析”课程为例,开展数据预处理、模型优化、知识图谱构建及应用服务集成,实现知识点结构化表示、动态更新、智能问答与个性化资源推荐。构建了学生画像与教师决策支持模块。研究结果显示,本地化部署的大语言模型能够提供实时精准的知识支持,而知识图谱引入优化了资源管理和学习路径规划。这种融合模式提升了学生交互体验和知识获取效率,能够帮助教师更好地把握学生需求,制定针对性教学策略。此外,该模式还强化了数据隐私保护与资源的自主可控性,符合高校数字化转型的安全合规要求。 展开更多
关键词 本地大语言模型 知识图谱 课程设计 智能问答 数据隐私
在线阅读 下载PDF
基于大语言模型的航空发动机领域高质量数据集构建 被引量:5
11
作者 邹冠沄 王存俊 +2 位作者 孔寅豪 马小庆 李丕绩 《数据采集与处理》 北大核心 2025年第3期603-615,共13页
随着人工智能技术的快速发展,大语言模型(Large language models,LLMs)在多个领域的应用日益广泛。然而,航空发动机领域由于缺乏高质量的人工编写问答数据集,限制了专家问答大模型的应用。本文提出了一种基于LLMs的问答数据集自动化构... 随着人工智能技术的快速发展,大语言模型(Large language models,LLMs)在多个领域的应用日益广泛。然而,航空发动机领域由于缺乏高质量的人工编写问答数据集,限制了专家问答大模型的应用。本文提出了一种基于LLMs的问答数据集自动化构建方法,该方法无需人工干预即可生成高质量的开放式问答数据。在数据生成阶段,采用上下文学习方法和输入优先生成策略,增强了生成数据的稳定性;在数据过滤阶段,通过原文相似度的忠实度评估和大模型的语义质量评估,建立了数据质量自动评估机制,有效筛选出受幻觉影响的异常数据,确保数据的事实可靠性。实验结果表明,该方法显著提升了生成数据集的质量,经过指令微调后的模型在航空发动机领域的知识问答表现显著提升。本文的研究成果不仅为航空发动机领域的大模型应用提供了坚实基础,也为其他复杂工程领域的数据集自动化构建提供了参考。 展开更多
关键词 大语言模型 垂直领域大模型 问答数据生成 问答数据质量评估
在线阅读 下载PDF
Ⅰ期临床试验电子数据录入问题分析及对策
12
作者 王丽丽 梁虹 +5 位作者 张菁 王倩倩 何金杰 陈渊成 郁继诚 张骥胤 《中国临床研究》 2025年第1期130-133,137,共5页
目的 分析Ⅰ期临床试验临床研究协调员(CRC)录入电子病历报告表产生数据质疑的原因,提出防范对策。方法 选取复旦大学附属华山医院Ⅰ期临床研究室2019—2022年已完成电子数据录入的3项创新药Ⅰ期临床试验项目,由申办方数据管理部门提供... 目的 分析Ⅰ期临床试验临床研究协调员(CRC)录入电子病历报告表产生数据质疑的原因,提出防范对策。方法 选取复旦大学附属华山医院Ⅰ期临床研究室2019—2022年已完成电子数据录入的3项创新药Ⅰ期临床试验项目,由申办方数据管理部门提供电子数据质疑报表,对数据质疑在试验不同阶段、不同模块的分布,并对错误类型进行分类统计分析,提出相应对策持续改进。结果 (1)临床试验进程中数据质疑最易发生在随访期,占66.78%。(2)系统自动触发型质疑占比最高,人工逻辑核查型质疑最具分析意义。(3)人工逻辑核查型质疑中,文本型错误发生率最高(47.53%),其次为逻辑错误和页面相关错误。发生率最高的三个模块分别为实验室检查(41.25%)、生命体征/心电图(14.64%)、不良事件/合并用药(9.36%)。(4)CRC缺乏责任心、专业能力薄弱是导致质疑产生的最主要因素。结论 数据录入过程中,应重点提高CRC工作责任心,加强其对信息化系统的使用和专业知识的培训,保证试验数据的真实完整,降低CRC数据录入错误的发生率。 展开更多
关键词 临床研究协调员 Ⅰ期临床试验 电子数据 数据质疑
原文传递
基于地名语义的藏文机器阅读理解数据构建
13
作者 杨毛加 官却才让 +1 位作者 柔特 才让加 《计算机仿真》 2025年第6期445-453,共9页
针对藏文机器阅读理解任务中数据需求量大且数据构建效率低的问题,提出了基于深度学习的藏文地名答案和问题自动生成的一种数据构建方法。在答案识别方面,首先利用BERT预训练模型抽取出丰富的文本特征,通过BiLSTM模型进一步提取出地名... 针对藏文机器阅读理解任务中数据需求量大且数据构建效率低的问题,提出了基于深度学习的藏文地名答案和问题自动生成的一种数据构建方法。在答案识别方面,首先利用BERT预训练模型抽取出丰富的文本特征,通过BiLSTM模型进一步提取出地名答案所需的特征信息,最终通过CRF层计算出最优的序列标注,构建适合地名答案识别的模型框架并输出识别结果。在问题生成方面,通过多源编码器学习段落和历史对话中不同轮数间的问答对的依赖关系,加入对话流模块使问题的焦点从段落开头平滑地转移到结尾,再通过带有注意力机制和复制机制的解码器有效提升了问题生成的准确率。最终构建了包含204702个三元组的地名相关阅读理解数据集。 展开更多
关键词 机器阅读理解 地名识别 问题生成 数据集 藏文
在线阅读 下载PDF
RAG数据问答中心管理系统
14
作者 郝尚君 程晓雅 李霄雯 《计算机时代》 2025年第11期61-65,共5页
在数据驱动的智能时代,企业运营和决策高度依赖数据。随着企业业务扩张,数据量呈指数级增长。传统企业各部门间相互独立,数据无法共享,数据管理及处理方式存在效率低、更新慢、准确性差的问题,难以适应企业的发展需求。因此,构建数据问... 在数据驱动的智能时代,企业运营和决策高度依赖数据。随着企业业务扩张,数据量呈指数级增长。传统企业各部门间相互独立,数据无法共享,数据管理及处理方式存在效率低、更新慢、准确性差的问题,难以适应企业的发展需求。因此,构建数据问答中心管理系统,不仅能提高数据管理水平,还可增强企业的市场竞争力。通过分析企业需求,系统采用Dubbo分布式框架,解决了企业各部门数据独立、数据流通受阻及数据孤岛的问题。随着AI技术的发展,RAG框架应运而生,使企业内部问题涉及的私有数据,可通过语言大模型实现智能问答,进而达成智能化、便捷化的数据管理的目标。 展开更多
关键词 数据问答服务 Dubbo RAG 管理系统
在线阅读 下载PDF
数据知识双增强的医学视觉问答网络
15
作者 闫玉静 侯霞 +2 位作者 郭玉婷 张铭梁 宋文凤 《计算机科学》 北大核心 2025年第12期252-259,共8页
医学视觉问答(Medical Visual Question Answering,Med-VQA)旨在正确回答与给定医学图像相关的临床问题,在临床医学智能化中起着至关重要的作用。虽然该领域研究已获得一定进展,但是在文本和图像多模态输入信息的深度提取,以及小规模数... 医学视觉问答(Medical Visual Question Answering,Med-VQA)旨在正确回答与给定医学图像相关的临床问题,在临床医学智能化中起着至关重要的作用。虽然该领域研究已获得一定进展,但是在文本和图像多模态输入信息的深度提取,以及小规模数据集上的有效模型训练方面仍然面临挑战。对此,提出一种数据知识双增强的医学视觉问答网络。针对小规模数据集,设计了多模态条件混合模块对输入的图像和文本进行数据增强,利用问题类别作为约束条件对输入样本对进行线性组合,以提高答案生成的合理性。针对多模态特征提取,设计了一个基于卷积神经网络的图像位置识别器,将其捕获的图像位置特征编码到图像特征和问题特征的融合过程中进行知识增强,可在较少的参数下实现有效的特征提取。在SLAKE和VQA-RAD数据集上的实验结果表明,与基线模型相比,所提模型的性能有明显提升。 展开更多
关键词 视觉问答 医学视觉问答 医学图像 数据增强 计算机视觉
在线阅读 下载PDF
面向智慧教学平台的大数据储存和人机交互功能设计
16
作者 柳菁莹 曹枝霞 《自动化与仪器仪表》 2025年第11期187-191,共5页
智慧教学平台快速兴起,其大数据存储和人机交互能力,显得尤为重要。针对目前智慧教学平台难以高效处理和管理海量数据的问题,研究提出了一种基于Hadoop的智慧教育平台数据云存储系统。并基于痕迹检验知识数据,设计了问答系统。将云存储... 智慧教学平台快速兴起,其大数据存储和人机交互能力,显得尤为重要。针对目前智慧教学平台难以高效处理和管理海量数据的问题,研究提出了一种基于Hadoop的智慧教育平台数据云存储系统。并基于痕迹检验知识数据,设计了问答系统。将云存储系统与其他系统进行性能对比分析,结果发现,该系统平均上传速度和下载速度分别为27.68 MB/s和26.18 MB/s,均优于对比系统。随后,将问答系统进行性能对比分析,结果发现,该系统的精准率为97.28%,均优于对比问答系统。最后,将问答系统进行应用效果分析,结果发现其能准确回答相关问题。以上结果表明,研究提出的数据云存储系统和问答系统,能为智慧教学平台的数据存储和人机交互功能设计提供理论基础。 展开更多
关键词 智慧教学平台 大数据存储 问答系统 HADOOP 人机交互
原文传递
基于知识图谱的电力运维智能问答系统设计
17
作者 吴翰林 张洁 张骞 《电力大数据》 2025年第8期46-57,共12页
在电力运维过程中,存在多源异构数据利用率低、智能问答缺乏闭环管理等问题。针对这些问题,该文提出了一种融合多模态数据的电力运维智能问答解决方案。首先,文章阐述了基于知识图谱的电力运维智能问答系统整体架构与技术研究路径;随后... 在电力运维过程中,存在多源异构数据利用率低、智能问答缺乏闭环管理等问题。针对这些问题,该文提出了一种融合多模态数据的电力运维智能问答解决方案。首先,文章阐述了基于知识图谱的电力运维智能问答系统整体架构与技术研究路径;随后详细讨论了系统的核心功能模块及其实现路径;最后通过设计实验进行了对比验证。该文所构建的智能问答系统能够高效检索多模态数据知识,并验证了结果的准确性,从而实现了对多源异构数据的统一管理以及智能问答流程的闭环控制,为推动电力行业运维知识管理信息化与智能化服务体系建设提供理论支持。 展开更多
关键词 电力运维 知识图谱 多模态数据 智能问答 语义匹配
在线阅读 下载PDF
预训练模型在军营管理决策FAQ中的应用
18
作者 王依科 杨磊 姚添元 《舰船电子工程》 2025年第11期139-143,152,共6页
为满足军营现代化管理辅助决策领域科研或工程人员在知识问答方面的需求,论文构建了面向军营管理决策FAQ(Frequently Ask Question)问答系统。针对传统的FAQ问答系统中相似问题匹配准确率低,以及特定领域的相似问答语料不足的问题,论文... 为满足军营现代化管理辅助决策领域科研或工程人员在知识问答方面的需求,论文构建了面向军营管理决策FAQ(Frequently Ask Question)问答系统。针对传统的FAQ问答系统中相似问题匹配准确率低,以及特定领域的相似问答语料不足的问题,论文构建了基于预训练模型的相似问题匹配算法,并采用复述生成模型对相似问题语料进行数据增强。通过构建军营管理决策的FAQ数据集,验证了模型在该数据集上的性能,并从Spearman相关系数指标上进行分析,该模型能够准确进行相似问题匹配。 展开更多
关键词 问答系统 相似问题匹配 数据增强
在线阅读 下载PDF
面向知识图谱的问答技术研究综述
19
作者 钱慎一 付博文 +1 位作者 李代祎 梁瑶瑶 《计算机工程与应用》 北大核心 2025年第23期1-23,共23页
智能问答是从海量数据中精确、快速获取需求信息的一种关键技术。近年来,智能问答技术发展成果显著,例如,基于问题的信息提取技术、语义理解技术以及向量建模的方法等。然而,随着智能问答技术的迅速发展,人们迫切希望能够对智能问答模... 智能问答是从海量数据中精确、快速获取需求信息的一种关键技术。近年来,智能问答技术发展成果显著,例如,基于问题的信息提取技术、语义理解技术以及向量建模的方法等。然而,随着智能问答技术的迅速发展,人们迫切希望能够对智能问答模型有一个合理的划分方式,以方便不同领域的用户使用。为了合理划分智能问答模型,方便智能问答领域研究者的深度研究,通过对知识图谱问答领域相关文献进行调查,实现了对当前知识图谱问答关键技术的概括,包括实体链接、知识嵌入,并详细介绍了知识图谱问答的相关概念和处理流程。此外,根据方法的不同,将面向知识图谱的问答技术主要分为三大类:基于语义解析方法、基于信息检索方法和基于大语言模型的方法,介绍了其优缺点并分别针对知识图谱问答模型的评价指标进行总结。最后,针对知识图谱问答技术现存的一些问题以及未来发展的方向,提出了一些建议和思考。 展开更多
关键词 知识图谱(KG) 智能问答(QA) 大数据 语义解析 信息检索
在线阅读 下载PDF
基于多特征注意力双向循环神经网络的客观题难度预测模型
20
作者 王煜焜 徐行健 +1 位作者 孟繁军 宋慧媛 《计算机工程》 北大核心 2025年第10期130-139,共10页
由于大多数试题难度预测方案是劳动密集型的,耗时且容易泄漏,或者在某种程度上是主观的,严重影响智能化教育评价体系的进步发展,因此,利用神经网络实现试题难度自动预测具有重要意义。提出一种基于多特征注意力的双向循环神经网络模型(M... 由于大多数试题难度预测方案是劳动密集型的,耗时且容易泄漏,或者在某种程度上是主观的,严重影响智能化教育评价体系的进步发展,因此,利用神经网络实现试题难度自动预测具有重要意义。提出一种基于多特征注意力的双向循环神经网络模型(M-ABRNN)。该模型首先基于多特征任务学习方法,通过检索计算机关联知识以丰富题干信息;其次通过双向循环神经网络挖掘客观题文本数据的逻辑关系并提取语句表征,并利用注意力机制度量关联语句对试题的重要程度;最后将获取的特征输入到模型中进行训练,训练完后模型可以自动预测每个新试题的难度。在大学计算机基础课程数据集上的实验结果表明,所提模型的皮尔逊相关系数(PCC)和一致性(DOA)均有显著提升,可见该模型能够有效地对客观题难度进行预测,实现题目难度的自动化评测。 展开更多
关键词 教育大数据 多任务特征 客观题难度预测 双向循环神经网络 注意力机制
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部