期刊文献+
共找到24,987篇文章
< 1 2 250 >
每页显示 20 50 100
基于大模型检索增强生成的气象数据库问答模型实现 被引量:7
1
作者 江双五 张嘉玮 +1 位作者 华连生 杨菁林 《计算机工程与应用》 北大核心 2025年第5期113-121,共9页
随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索... 随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索智能问答技术实现方案。该方案设计了一种基于关系型数据库(SQL)与文档型数据(NoSQL)的多通道查询路由(multi-channel retrieval router,McRR)方法,为了适配数据库进行大模型查询以及增强大模型对查询表的理解,分别提出指令查询转换方法与数据库表摘要方法DNSUM,提升大模型对数据库的语义理解能力,通过结合问题理解、重排序器和响应生成等关键模块,构建了一个端到端的智能问答模型,可实现多数据源的相关知识检索及答案生成。实验结果显示,该模型可以有效理解用户问题并生成准确的答案,具有良好的检索和响应能力。不仅为气象领域提供了一种智能问答的解决方案,也为气象智能问答技术提供了新的应用实施参考。 展开更多
关键词 数据库查询 数据库问答 大语言模型 检索增强生成 气象问答
在线阅读 下载PDF
基于词典-TextCNN-Word2Vec组合模型的在线评价细粒度情感分析 被引量:7
2
作者 惠调艳 王智 +1 位作者 何振华 秦春秀 《情报理论与实践》 北大核心 2025年第2期168-177,共10页
[目的/意义]线上购物逐渐成为消费主流,在线情感评价成为消费者购买、厂商产品改进的重要决策依据。[方法/过程]深度挖掘商品显性和隐性属性特征,提出了融合词典-TextCNN-Word2Vec的在线评价细粒度情感分析模型。首先,利用Protég&#... [目的/意义]线上购物逐渐成为消费主流,在线情感评价成为消费者购买、厂商产品改进的重要决策依据。[方法/过程]深度挖掘商品显性和隐性属性特征,提出了融合词典-TextCNN-Word2Vec的在线评价细粒度情感分析模型。首先,利用Protégé软件和Pellet推理机推理等,构建了涵盖外观、硬件、软件、价格、质量、物流和服务7大主题维度的领域本体模型,并建立属性特征词典和情感词典;其次,针对三类在线评价,分别应用基于词典的显性属性情感分析模型、基于TextCNN的显性特征情感分类模型、基于Word2Vec的隐性特征情感分析模型,计算属性特征词的情感值;最后,通过词频加权法和熵权法,自下而上计算各层级主题属性的情感值,实现了多层次细粒度的情感挖掘。[结果/结论]综合基于词典、TextCNN和Word2Vec情感属性映射的三种模型的在线情感分析,显著提高了商品属性特征和情感分析的准确性,商品显性和隐性属性特征的总提取率高达93.77%,商品特征情感分析的加权平均准确率为86.78%。该组合模型为数字经济时代商品多属性特征的细粒度在线情感评价提供了创新研究方法。 展开更多
关键词 细粒度情感分析 情感词典 TextCNN Word2Vec
原文传递
自然语言处理研究综述 被引量:11
3
作者 赵铁军 许木璠 陈安东 《新疆师范大学学报(哲学社会科学版)》 北大核心 2025年第2期89-111,F0002,共24页
近年来,自然语言处理因在分析与建模人类语言任务领域取得诸多成果而备受关注。当前,大规模预训练语言模型展现出强大的对话问答和文本生成能力,带来自然语言处理研究的新一轮热潮。自然语言处理在机器翻译、文本摘要、信息抽取等领域... 近年来,自然语言处理因在分析与建模人类语言任务领域取得诸多成果而备受关注。当前,大规模预训练语言模型展现出强大的对话问答和文本生成能力,带来自然语言处理研究的新一轮热潮。自然语言处理在机器翻译、文本摘要、信息抽取等领域应用广泛。文本首先讨论自然语言处理针对语言学四个不同层次文本信息的分析手段,对自然语言处理的基本任务组成进行概述;其次,讨论自然语言处理在具体下游任务中的应用现状,包括自然语言处理在具体任务中的应用历史、当前的研究趋势以及面临的挑战;最后,在大规模预训练语言模型研究对数据集提出更高要求的背景下,对自然语言处理领域已有的数据集及评测基准集等进行讨论。 展开更多
关键词 自然语言处理 句法分析 语义分析 机器翻译 问答系统 信息抽取
原文传递
农用电机故障知识图谱的构建与应用 被引量:2
4
作者 黄友锐 荣雪 +2 位作者 徐善永 韩涛 宋奇 《农业工程学报》 北大核心 2025年第6期216-226,共11页
随着农业机械化和智能化的发展,农用电机作为主要动力来源,显著提升了农业生产效率,并推动农业向绿色化、智能化和高效化方向发展。为解决农用电机的故障可能导致的作物收获延误、经济损失和安全隐患。尽管传统机器学习和深度学习方法... 随着农业机械化和智能化的发展,农用电机作为主要动力来源,显著提升了农业生产效率,并推动农业向绿色化、智能化和高效化方向发展。为解决农用电机的故障可能导致的作物收获延误、经济损失和安全隐患。尽管传统机器学习和深度学习方法在电机故障诊断中展现出潜力,但其解释性不足和高成本限制了其广泛应用,亟需开发一种能够有效挖掘关键信息以指导故障维修的方法。该研究提出了一种基于多源数据异构融合的农用电机故障诊断知识图谱系统,旨在提升故障诊断效率和降低维修成本。通过实体识别与关系抽取,将非结构化数据转化为结构化数据,使用BERTBiLSTM-CRF模型进行实体识别,模型在实体识别任务中的准确率、召回率、F1值分别达到0.952 3、0.915 7、0.933 6,结合模式匹配与正则表达式进行关系抽取,并嵌入GPT模型构建智能问答系统,采用Neo4j图数据库存储电机故障知识,最终形成包含702个故障实体的图谱。研究表明,农用电机故障诊断知识图谱系统能够提升故障诊断效率,降低维修成本,增强农业生产的智能化水平,为农用电机故障诊断提供了一种高效、智能的解决方案,具有重要的应用前景和研究价值。 展开更多
关键词 知识图谱 农用电机 故障诊断 知识抽取 智能问答
在线阅读 下载PDF
基于XLNet和多粒度对比学习的新闻主题文本分类方法 被引量:1
5
作者 陈敏 王雷春 +2 位作者 徐瑞 史含笑 徐渺 《郑州大学学报(理学版)》 CAS 北大核心 2025年第2期16-23,共8页
新闻主题文本内容简短却含义丰富,传统方法通常只考虑词粒度或句粒度向量中的一种进行研究,未能充分利用新闻主题文本不同粒度向量之间的关联信息。为深入挖掘文本的词向量和句向量间的依赖关系,提出一种基于XLNet和多粒度特征对比学习... 新闻主题文本内容简短却含义丰富,传统方法通常只考虑词粒度或句粒度向量中的一种进行研究,未能充分利用新闻主题文本不同粒度向量之间的关联信息。为深入挖掘文本的词向量和句向量间的依赖关系,提出一种基于XLNet和多粒度特征对比学习的新闻主题分类方法。首先,利用XLNet对新闻主题文本进行特征提取获得文本中词、句粒度的特征表示和潜在空间关系;然后,通过对比学习R-Drop策略生成不同粒度特征的正负样本对,以一定权重对文本的词向量-词向量、词向量-句向量和句向量-句向量进行特征相似度学习,使模型深入挖掘出字符属性和语句属性之间的关联信息,提升模型的表达能力。在THUCNews、Toutiao和SHNews数据集上进行实验,实验结果表明,与基准模型相比,所提方法在准确率和F 1值上都有更好的表现,在三个数据集上的F 1值分别达到了93.88%、90.08%、87.35%,验证了方法的有效性和合理性。 展开更多
关键词 自然语言处理 文本分类 新闻主题 XLNet 对比学习
在线阅读 下载PDF
基于全域信息融合和多维关系感知的命名实体识别模型 被引量:1
6
作者 胡婕 武帅星 +1 位作者 曹芝兰 张龑 《计算机应用》 北大核心 2025年第5期1511-1519,共9页
现有的基于双向长短时记忆(BiLSTM)网络的命名实体识别(NER)模型难以全面理解文本的整体语义以及捕捉复杂的实体关系。因此,提出一种基于全域信息融合和多维关系感知的NER模型。首先,通过BERT(Bidirectional Encoder Representations fr... 现有的基于双向长短时记忆(BiLSTM)网络的命名实体识别(NER)模型难以全面理解文本的整体语义以及捕捉复杂的实体关系。因此,提出一种基于全域信息融合和多维关系感知的NER模型。首先,通过BERT(Bidirectional Encoder Representations from Transformers)获取输入序列的向量表示,并结合BiLSTM进一步学习输入序列的上下文信息。其次,提出由梯度稳定层和特征融合模块组成的全域信息融合机制:前者使模型保持稳定的梯度传播并更新优化输入序列的表示,后者则融合BiLSTM的前后向表示获取更全面的特征表示。接着,构建多维关系感知结构学习不同子空间单词的关联性,以捕获文档中复杂的实体关系。此外,使用自适应焦点损失函数动态调整不同类别实体的权重,提高模型对少数类实体的识别性能。最后,在7个公开数据集上将所提模型和11个基线模型进行对比,实验结果表明所提模型的F1值均优于对比模型,可见该模型的综合性较优。 展开更多
关键词 命名实体识别 全域信息融合机制 梯度稳定层 多维关系感知 自适应焦点损失
在线阅读 下载PDF
现代成像技术与机器学习驱动的植物物候观测与预测研究进展 被引量:1
7
作者 张慧春 沈朱豪 边黎明 《农业工程学报》 北大核心 2025年第11期14-25,共12页
植物物候学研究植物生长周期和自然环境周期变化的关联性,传统人工监测效率低,而现代成像传感器技术通过高通量、多尺度的表型数据采集,结合机器学习构建物候模型,可精准识别关键时间节点,实现生长周期预测,为植物监测和良种选育提供技... 植物物候学研究植物生长周期和自然环境周期变化的关联性,传统人工监测效率低,而现代成像传感器技术通过高通量、多尺度的表型数据采集,结合机器学习构建物候模型,可精准识别关键时间节点,实现生长周期预测,为植物监测和良种选育提供技术支持。该研究介绍了人工以及传感器两种物候观测方法,分析了近端感知系统、物候通量塔、无人机平台、卫星遥感平台在物候观测与数据采集的应用,基于机器学习,结合影响因子模型与数据驱动模型,总结了其在种内物候、种间物候、群落物候的应用。研究表明成像技术与机器学习算法的深度耦合正推动植物物候观测的自动化以及预测的精确化。针对数据时空覆盖不足、多模态特征融合困难、模型跨尺度泛化能力弱的挑战,未来植物物候研究将围绕多尺度长周期监测、成像传感器数据融合、空天地平台协同采集、提升预测模型的自学习和优化能力,依托AI大模型实现跨平台的模型校准验证等方面开展,加速植物物候监测的自动化、数字化与信息化进程。 展开更多
关键词 传感器 机器学习 植物物候 表型数据 物候观测平台 群落物候
在线阅读 下载PDF
多域时空层次图神经网络的空气质量预测 被引量:4
8
作者 马汉达 吴亚东 《计算机应用》 北大核心 2025年第2期444-452,共9页
在协同融合气象、空间和时间三大信息的时空混合模型中,时间变化建模通常在一维空间中完成。针对一维序列局限于滑动窗口和缺乏对多尺度特征的灵活提取的问题,提出一种多域时空层次图神经网络(MST-HGNN)模型。首先,构建城市全局尺度和... 在协同融合气象、空间和时间三大信息的时空混合模型中,时间变化建模通常在一维空间中完成。针对一维序列局限于滑动窗口和缺乏对多尺度特征的灵活提取的问题,提出一种多域时空层次图神经网络(MST-HGNN)模型。首先,构建城市全局尺度和站点局部尺度的两级层次图,从而进行空间关系学习;其次,将一维空气质量序列转换为一组基于多个周期的二维张量,并在二维空间上通过多尺度卷积进行周期解耦以捕获频域特征;同时,在一维空间中利用长短期记忆(LSTM)网络拟合时域特征;最后,为避免聚合冗余信息,设计一种门控机制融合模块用于频域和时域特征的多域特征融合。在Urban-Air数据集和长三角城市群数据集上的实验结果表明,相较于多视图多任务时空图卷积网络模型(M2),所提模型在预测第1 h、3 h、6 h、12 h空气质量的平均绝对误差(MAE)和均方根误差(RMSE)均低于对比模型。可见,MST-HGNN能在频域上解耦复杂时间模式,利用频域信息弥补时域特征建模的局限性,并结合时域信息更全面地预测空气质量变化。 展开更多
关键词 空气质量预测 多域特征融合 时空特征 周期解耦 门控机制融合 图神经网络
在线阅读 下载PDF
PCB工艺FMEA领域知识图谱构建与应用 被引量:1
9
作者 叶进 林琦越 +2 位作者 唐欣 王秋祥 胡宁 《计算机工程与应用》 北大核心 2025年第11期227-237,共11页
随着电子产品的快速发展,产业链厂商对印制电路板(PCB)的失效模式和影响分析(FMEA)提出了更高水平要求,传统的FMEA分析方法已经不能满足复杂电子产品的需求。为此提出了一套PCB工艺FMEA知识图谱构建与应用框架,实现端到端的FMEA分析新... 随着电子产品的快速发展,产业链厂商对印制电路板(PCB)的失效模式和影响分析(FMEA)提出了更高水平要求,传统的FMEA分析方法已经不能满足复杂电子产品的需求。为此提出了一套PCB工艺FMEA知识图谱构建与应用框架,实现端到端的FMEA分析新模式。在图谱构建过程中,针对大量实体为复杂句子的特点,训练了一个加入PCB与FMEA特征词典的FLEBERT NER模型,实现对失效数据的实体识别,实验对比证明效果良好;对识别的实体采用Sentence-BERT结合FLEBERT预训练模型进行实体对齐,提升知识的质量;通过Neo4j进行知识存储完成知识图谱构建。基于已构建的知识图谱,搭建了FMEA知识图谱平台,初步实现了知识探索、知识问答和知识推荐的应用,展示了知识图谱技术在PCB工艺FMEA分析领域具备良好的应用前景。 展开更多
关键词 知识图谱 印制电路板(PCB) 失效模式和影响分析(FMEA) 命名实体识别(NER) BERT
在线阅读 下载PDF
面向对话生成和心理疾病检测的心理咨询式人机对话数据集构建 被引量:1
10
作者 徐博 郝德志 +2 位作者 于迩晨 林鸿飞 宗林林 《计算机应用》 北大核心 2025年第5期1395-1402,共8页
针对心理咨询式人机对话中缺乏用于建立有效对话模型的公开数据的问题,构建一个面向对话生成和心理疾病检测的心理医疗咨询对话数据集。首先,通过在线医疗问诊平台获取包含3 268个医生和患者之间的多轮对话数据集,并附有广泛的相关元数... 针对心理咨询式人机对话中缺乏用于建立有效对话模型的公开数据的问题,构建一个面向对话生成和心理疾病检测的心理医疗咨询对话数据集。首先,通过在线医疗问诊平台获取包含3 268个医生和患者之间的多轮对话数据集,并附有广泛的相关元数据,包括就诊医院、就诊科室、疾病类型和患者自我陈述等;其次,提出一个知识增强的对话模型——情感感知双向自回归模型(EmBART),以增强对话模型的共情能力;最后,通过心理医疗响应生成和心理疾病检测进行数据集可用性的实验评估。在心理医疗响应生成中,基于所提数据集训练的EmBART模型在自动评估与人工评估中的各项指标上均表现出色,其中困惑度较基准模型CDial-GPT(Chinese Dialogue Generative Pretrained Transformer)降低了2.31;在心理疾病检测中,基于所提数据集训练的CPT(Chinese Pre-trained unbalanced Transformer)和RoBERTa(Robustly optimized Bidirectional Encoder Representations from Transformers approach)模型具有出色的心理疾病检测能力。实验结果表明,本数据集在生成共情对话和检测心理疾病方面具有较强的实用性,能为未来基于心理咨询式人机对话研究提供数据基础。 展开更多
关键词 心理咨询对话 心理疾病检测 对话生成 共情响应 情感分析
在线阅读 下载PDF
基于开源科技项目数据的多模态知识图谱构建研究 被引量:3
11
作者 窦永香 解哲辉 汤晓芳 《情报理论与实践》 北大核心 2025年第3期32-40,共9页
[目的/意义]在全球科技竞争日益激烈的背景下,开源情报作为研究和预测世界科技发展趋势的重要工具,对于科技情报工作的重要性愈发凸显。科技项目数据作为科技情报的重要数据来源和分析对象,呈现出多源、多模态的特性,对其进行深度分析... [目的/意义]在全球科技竞争日益激烈的背景下,开源情报作为研究和预测世界科技发展趋势的重要工具,对于科技情报工作的重要性愈发凸显。科技项目数据作为科技情报的重要数据来源和分析对象,呈现出多源、多模态的特性,对其进行深度分析和挖掘,并服务于管理与决策活动,是新时期科技资源高效利用的重要途径。[方法/过程]文章将情报工作流程与多模态知识图谱构建流程相融合,提出了基于开源科技项目数据的多模态知识图谱构建框架,包含需求分析、开源情报采集、多模态科技项目知识图谱构建以及知识图谱服务4个关键环节,并详细讨论了每个环节中的核心内容。[结果/结论]以美国情报高级研究计划局(IARPA)公开项目的多模态数据为例,遵循上述框架构建了包含项目、机构、人员、技术、文档、图像、视频7类实体及多种关系的多模态知识图谱。未来,可将多模态知识图谱与问答系统、推荐系统相结合,为科技管理决策提供更加智能化的情报服务。 展开更多
关键词 开源情报 科技项目 多模态知识图谱 科技情报 数据挖掘 科技管理
原文传递
基于知识图谱和大语言模型增强的推荐系统研究 被引量:2
12
作者 王敏 高晓影 +1 位作者 汪诗蕊 向阳 《大数据》 2025年第2期29-46,共18页
推荐系统的核心是用户和商品,用户与商品之间的关系可抽象为图结构,因此图神经网络在推荐领域具有广泛应用。但基于图的推荐交互数据较稀疏,严重依赖于编号信息和图结构信息,忽略了与用户和商品相关的有价值的文本信息,表征信息较少。同... 推荐系统的核心是用户和商品,用户与商品之间的关系可抽象为图结构,因此图神经网络在推荐领域具有广泛应用。但基于图的推荐交互数据较稀疏,严重依赖于编号信息和图结构信息,忽略了与用户和商品相关的有价值的文本信息,表征信息较少。同时,隐式反馈数据中存在一定的噪声和偏差,为推荐系统理解用户行为与偏好带来挑战。为了解决这些问题,提出了一种基于知识图谱和大语言模型增强的推荐系统。知识图谱可以提供商品的结构化信息,使模型能学习商品之间的潜在关系,理解用户行为和偏好。大语言模型具备非常出色的生成与理解能力,可以通过提示工程技术,深入分析并挖掘文本信息,推理获取商品和用户画像特征。所提模型分别将这些辅助信息增强的特征编码,并对表征进行增强以与图神经网络获得的ID表征对齐,完成下游推荐任务。实验结果证明,本文提出的系统可以全面地表征用户和商品,具有较好的性能。 展开更多
关键词 大语言模型 知识图谱 推荐系统 表征学习
在线阅读 下载PDF
隐式关系增强的图神经网络推荐算法 被引量:1
13
作者 熊中敏 张军 《计算机应用研究》 北大核心 2025年第5期1338-1344,共7页
在推荐任务中用户社交网络信息和用户-项目交互信息可以用来提高推荐性能。但现有的社交推荐算法往往仅使用初始的社交图与交互图,未充分挖掘用户间以及项目间潜在的链接关系,同时没有考虑社交关系中的不可靠性。为此,提出融合隐式关系... 在推荐任务中用户社交网络信息和用户-项目交互信息可以用来提高推荐性能。但现有的社交推荐算法往往仅使用初始的社交图与交互图,未充分挖掘用户间以及项目间潜在的链接关系,同时没有考虑社交关系中的不可靠性。为此,提出融合隐式关系的图神经网络推荐算法(IREGraphRec)。首先,在多视角下挖掘实体间潜在信息来获取可靠的用户社交信息及用户项目交互信息,并将其重构为基于用户偏好的异构信息网络,运用图谱嵌入和定义多种元路径方式获得特征向量表示,同时使用注意力机制为其在信息聚合中分配不同的权重。最后,在图神经网络中进行多轮学习来获得最终的预测结果。在Epinions等三个公开的数据集上与S4Rec等传统网络模型进行对比,在MAE上降低了1.65%,在RMSE上降低了2.34%。实验结果和分析证明提出模型更具优势。 展开更多
关键词 图神经网络 社交推荐 知识图谱 元路径 注意力机制
在线阅读 下载PDF
基于大语言模型的中文多义词义项融合技术研究 被引量:1
14
作者 尹宝生 宗辰 《计算机科学》 北大核心 2025年第S1期53-59,共7页
针对中文的一词多义特点,基于现有各类汉语词典资源构建一个义项全面、描述规范的中文多义词知识库,对于汉语语义分析、智能问答、机器翻译以及大语言模型消歧能力调优和评估等具有重要意义。文中针对《现代汉语词典》和《现代汉语规范... 针对中文的一词多义特点,基于现有各类汉语词典资源构建一个义项全面、描述规范的中文多义词知识库,对于汉语语义分析、智能问答、机器翻译以及大语言模型消歧能力调优和评估等具有重要意义。文中针对《现代汉语词典》和《现代汉语规范词典》等资源整合过程中“词条义项含义相同但描述不同”等问题进行了深入分析,并创新性地提出了基于大语言模型和提示学习的多义词义项融合技术,即充分利用大语言模型对常识知识的分析理解和辅助决策能力,通过有效的问题分解策略和提示模版设计,以及义项关系交叉验证等手段完成了多义词义项的自动化融合工作。实验结果表明,在通过正态分布抽取50个多义词共754个义项对的评测数据上,基于上述算法的义项融合的正确率达96.26%,Dice系数为0.973 3。该项研究验证了利用大语言模型开展中文知识资源自动化加工的可行性和有效性,与传统依赖语言专家加工模式相比,在保证较高质量的前提下,显著提升了知识加工效率。 展开更多
关键词 多义词 义项融合 大语言模型 提示学习 中文信息处理
在线阅读 下载PDF
融合超图理论的语义知识图谱知识表示研究 被引量:1
15
作者 宋雪雁 张伟民 张祥青 《情报理论与实践》 北大核心 2025年第3期160-168,共9页
[目的/意义]现有语义知识图谱三元组的知识表示方式对复杂知识表示能力较弱,文章在现有知识图谱语义标准基础上,探索提高知识图谱对复杂知识的表示能力以及知识聚合能力的途径。[方法/过程]分析图、超图、知识图谱以及知识超图之间的联... [目的/意义]现有语义知识图谱三元组的知识表示方式对复杂知识表示能力较弱,文章在现有知识图谱语义标准基础上,探索提高知识图谱对复杂知识的表示能力以及知识聚合能力的途径。[方法/过程]分析图、超图、知识图谱以及知识超图之间的联系,探讨知识表示领域,知识图谱的局限性以及融合超图理论后知识超图在复杂知识表示能力方面的优势。[结果/结论]提出知识超图模型,根据该模型讨论其对复杂知识的表示方式:通过加入空节点或具有实际含义实体的方式,描述实体在某一时刻的属性或状态;将超边具象化为特殊的超边实体,为其连接的实体提供语义环境。足够多的空节点或超边实体即可描述实体或关系从产生到现在(或消亡)的全部状态,从而展现动态、复杂的现实世界。 展开更多
关键词 超图理论 语义知识图谱 知识表示 知识超图
原文传递
基于知识图谱的精密传动部件工艺路线推荐模型 被引量:1
16
作者 刘利军 高亚楼 +1 位作者 曹永鹏 刘凯星 《现代制造工程》 北大核心 2025年第2期26-36,共11页
针对精密传动部件加工过程中普遍存在的工艺路线设计低效、知识重用困难的问题,提出了一种基于知识图谱的精密传动部件工艺路线推荐模型。首先,利用本体方法构建精密传动部件工艺知识模式层;其次,利用Electra+BiLSTM+CRF模型和BiLSTM+Se... 针对精密传动部件加工过程中普遍存在的工艺路线设计低效、知识重用困难的问题,提出了一种基于知识图谱的精密传动部件工艺路线推荐模型。首先,利用本体方法构建精密传动部件工艺知识模式层;其次,利用Electra+BiLSTM+CRF模型和BiLSTM+Self-Attention模型分别实现实体识别和关系抽取,并基于达梅劳编辑距离进行知识融合,完成数据层构建;然后,基于构建的工艺知识图谱,结合部件工艺单元以及工艺路线结构的相似度实现工艺路线推荐;最后,开发工艺路线推荐系统,并以某型号滚珠丝杠为例展示工艺路线推荐功能。经实验验证表明:推荐准确率达到89.5%,证明了该模型的可行性,能够提高知识重用性和工艺路线设计效率,为决策提供更加科学合理的参考。 展开更多
关键词 精密传动部件 知识图谱 工艺设计 工艺路线推荐
在线阅读 下载PDF
基于关键词抽取和混合检索的领域问答对齐优化方法 被引量:3
17
作者 杨冬菊 杨坤 《北方工业大学学报》 2025年第1期52-62,共11页
针对目前基于检索增强生成技术的领域问答任务中由于用户查询和知识库中相关知识的语义差距导致回答效果差的问题,本文提出一种基于关键词抽取和混合检索的对齐优化方法。首先,利用大语言模型抽取用户查询中的关键词;其次,将用户查询拼... 针对目前基于检索增强生成技术的领域问答任务中由于用户查询和知识库中相关知识的语义差距导致回答效果差的问题,本文提出一种基于关键词抽取和混合检索的对齐优化方法。首先,利用大语言模型抽取用户查询中的关键词;其次,将用户查询拼接抽取后的关键词组成组合查询,将组合查询与用户查询分别输入稀疏检索模型和稠密检索模型召回相关文档;然后,将检索模型召回的文档做并集处理并重排;最后,将重排后的相关知识输入文本过滤器提取出关键信息文本,并与用户查询合并输入大语言模型生成答案返回给用户。实验结果表明,所提方法在公开的中医药问答数据集和通用领域问答数据集CMRC2018上相较于基于查询改写的对齐优化方法,Recall-Oriented Understudy for Gisting Evaluation Longest common subsequence(ROUGE-L)指标分别提高了9.9个百分点和2.3个百分点,F1指标分别提高了4.1个百分点和1.7个百分点。本文的实验结果验证了所提方法在提升领域问答准确度的有效性。 展开更多
关键词 检索增强生成 关键词抽取 领域问答 混合检索
在线阅读 下载PDF
融合多维情感特征的中文仇恨言论检测方法
18
作者 但志平 李琳 +2 位作者 余肖生 鲁雨洁 李碧涛 《数据分析与知识发现》 北大核心 2025年第9期102-113,共12页
【目的】针对无法有效识别中文文本中存在的不包含明显恶意词汇的仇恨言论问题,提出一种融合多维情感特征的中文仇恨言论检测方法(RMSF)。【方法】首先,使用RoBERTa提取输入文本的字符及句子级特征,并使用情感词典等工具提取文本的多维... 【目的】针对无法有效识别中文文本中存在的不包含明显恶意词汇的仇恨言论问题,提出一种融合多维情感特征的中文仇恨言论检测方法(RMSF)。【方法】首先,使用RoBERTa提取输入文本的字符及句子级特征,并使用情感词典等工具提取文本的多维度情感特征;其次,将字符特征及情感特征进行拼接后输入BiLSTM网络,学习更深层次的上下文语义信息;最后,将BiLSTM的输出和RoBERTa提取的句子特征拼接,输入MLP层进行处理,并应用Softmax函数进行类别预测。为了解决数据类别不平衡问题,采用焦点损失函数优化模型,从而提升判别输入文本是否为仇恨言论的准确率。【结果】在TOXICN数据集上,RMSF方法的精确率、召回率和F1值分别为82.63%、82.41%和82.45%;在COLDataset数据集上,RMSF方法的精确率、召回率和F1值分别为82.94%、82.96%和82.85%。与现有方法相比,F1值分别提高至少1.85和1.09个百分点。【局限】融合多维情感特征的仇恨言论检测方法依赖情感词典等工具,情感特征的提取受到词典内容的制约。【结论】在中文仇恨言论检测模型中融合多维度情感特征能够有效提高检测的效果。 展开更多
关键词 仇恨言论检测 多维度情感特征 RoBERTa BiLSTM
原文传递
基于改进标签传播算法的舆情社交网络社区发现
19
作者 钱晓东 王卓 《计算机应用研究》 北大核心 2025年第1期48-55,共8页
通过改进的标签传播算法研究了舆情社交网络中的社交主题发现。针对传统算法容易陷入局部最优的问题,依据节点间相似度选择标签传播时的邻居节点;针对传统算法标签更新时的随机性问题,通过结合舆论动力学模型HK的观点交互过程,依据节点... 通过改进的标签传播算法研究了舆情社交网络中的社交主题发现。针对传统算法容易陷入局部最优的问题,依据节点间相似度选择标签传播时的邻居节点;针对传统算法标签更新时的随机性问题,通过结合舆论动力学模型HK的观点交互过程,依据节点影响力的大小更新标签。实验结果表明,该方法在最好情况下(k=0.9)相较于原算法,在稳定性和模块度指标两方面分别提高了31%和78%,并且优于其他几种改进算法。由此可见,该算法相较于原算法及其他改进算法在舆情社交网络的主题社区发现中表现更好。 展开更多
关键词 标签传播算法 舆情社交网络 HK模型 主题社区发现
在线阅读 下载PDF
利用异配及同配关系的社交机器人检测方法
20
作者 罗森林 费泽涛 +1 位作者 潘丽敏 吴舟婷 《北京理工大学学报》 EI CAS 北大核心 2025年第1期77-86,共10页
现有基于图的方法未区分用户间的异配、同配关系,造成用户表示中存在异配边带来的噪声,弱化了社交机器人与人类用户之间的差异性,检测准确率降低;社交机器人持续演化模拟人类用户的关注数、推文发布数等元数据,容易导致较难识别的仿真... 现有基于图的方法未区分用户间的异配、同配关系,造成用户表示中存在异配边带来的噪声,弱化了社交机器人与人类用户之间的差异性,检测准确率降低;社交机器人持续演化模拟人类用户的关注数、推文发布数等元数据,容易导致较难识别的仿真社交机器人比例增加,检测召回率降低.提出一种利用异配及同配关系的社交机器人检测方法,通过记忆网络构建异配、同配关系原型来识别用户关系类型,减少异配边对用户表示的干扰,增加不同类型用户的特征区分性;在损失函数中引入调节因子,提高较难分类用户在模型参数更新过程中的损失贡献,增强了模型对仿真社交机器人的识别效果.实验结果表明,提出的方法优于当前先进方法,此方法通过区分用户间的异配和同配关系,降低异配边的权重,增强了用户表示的类别区分度,即使在低同配性分数的情况下也有效提升了检测准确率. 展开更多
关键词 社交机器人 异配关系 记忆网络
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部