期刊文献+
共找到247篇文章
< 1 2 13 >
每页显示 20 50 100
基于Bert+GCN多模态数据融合的药物分子属性预测 被引量:1
1
作者 闫效莺 靳艳春 +1 位作者 冯月华 张绍武 《生物化学与生物物理进展》 北大核心 2025年第3期783-794,共12页
目的药物研发成本高、周期长且成功率低。准确预测分子属性对有效筛选药物候选物、优化分子结构具有重要意义。基于特征工程的传统分子属性预测方法需研究人员具备深厚的学科背景和广泛的专业知识。随着人工智能技术的不断成熟,涌现出... 目的药物研发成本高、周期长且成功率低。准确预测分子属性对有效筛选药物候选物、优化分子结构具有重要意义。基于特征工程的传统分子属性预测方法需研究人员具备深厚的学科背景和广泛的专业知识。随着人工智能技术的不断成熟,涌现出大量优于传统特征工程方法的分子属性预测算法。然而这些算法模型仍然存在标记数据稀缺、泛化性能差等问题。鉴于此,本文提出一种基于Bert+GCN的多模态数据融合的分子属性预测算法(命名为BGMF),旨在整合药物分子的多模态数据,并充分利用大量无标记药物分子训练模型学习药物分子的有用信息。方法本文提出了BGMF算法,该算法根据药物SMILES表达式分别提取了原子序列、分子指纹序列和分子图数据,采用预训练模型Bert和图卷积神经网络GCN结合的方式进行特征学习,在挖掘药物分子中“单词”全局特征的同时,融合了分子图的局部拓扑特征,从而更充分利用分子全局-局部上下文语义关系,之后,通过对原子序列和分子指纹序列的双解码器设计加强分子特征表达。结果5个数据集共43个分子属性预测任务上,BGMF方法的AUC值均优于现有其他方法。此外,本文还构建独立测试数据集验证了模型具有良好的泛化性能。对生成的分子指纹表征(molecular fingerprint representation)进行t-SNE可视化分析,证明了BGMF模型可成功捕获不同分子指纹的内在结构与特征。结论通过图卷积神经网络与Bert模型相结合,BGMF将分子图数据整合到分子指纹恢复和掩蔽原子恢复的任务中,可以有效地捕捉分子指纹的内在结构和特征,进而高效预测药物分子属性。 展开更多
关键词 Bert预训练 注意力机制 分子指纹 分子属性预测 图卷积神经网络
原文传递
低资源条件下的藏语语音情感识别 被引量:1
2
作者 张维昭 李皓渊 杨鸿武 《信号处理》 北大核心 2025年第9期1558-1569,共12页
近年来,虽然面向主流语言的语音情感识别研究已经取得了较大进展,但是面向低资源语言的语音情感识别研究在数据集构建、特征提取与识别模型设计等方面面临诸多困难。针对低资源条件下的藏语语音情感识别问题,首先通过视频剪辑、音频提... 近年来,虽然面向主流语言的语音情感识别研究已经取得了较大进展,但是面向低资源语言的语音情感识别研究在数据集构建、特征提取与识别模型设计等方面面临诸多困难。针对低资源条件下的藏语语音情感识别问题,首先通过视频剪辑、音频提取与增强、人工标注与校对等步骤,初步构建了藏语情感语音数据集(Tibetan Emotion Speech Dataset-2500,TESD-2500)。该数据集涵盖四种情感类型(生气、悲伤、高兴和中性),共包含2500个语音样本,情感类别与样本数量仍在持续扩充中。然后,设计了一种融合交叉注意力与协同注意力机制的多特征融合语音情感识别模型,采用双向长短期记忆网络(Bidirectional Long Short-Term Memory Network,BiLSTM)对梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient,MFCC)进行时序建模,以提取语音信号中的动态时序表征;利用AlexNet提取语谱图的时频特征,以捕获语音信号的时频联合分布模式,并通过交叉注意力机制计算上述两类异构特征间的相关性权重;引入大规模预训练模型WavLM提取语音信号的深层特征,并以前述交叉注意力计算的结果作为权重向量,通过协同注意力机制对深层特征进行加权重构;将MFCC时序特征、语谱图时频特征和加权的预训练模型深层特征拼接成多层次特征融合表示,通过全连接层映射至情感类别空间,完成藏语语音情感分类任务。最终实验结果表明,所提出的模型在TESD-2500数据集上取得了76.56%的加权准确率和75.42%的未加权准确率,显著优于基线模型。本文还在IEMOCAP和EmoDB数据集上进行了模型泛化能力测试,在IEMOCAP上达到了74.27%的加权准确率和73.60%的未加权准确率,在EmoDB上达到了92.61%的加权准确率和91.68%的未加权准确率。本文的研究方法与结果亦可为其他低资源语言的语音情感识别研究提供参考。 展开更多
关键词 语音情感识别 低资源 多特征融合 预训练模型 藏语
在线阅读 下载PDF
医学GPT研发应用之吾见 被引量:2
3
作者 白春学 《元宇宙医学》 2025年第1期6-14,共9页
在应对医学GPT技术开发过程中的重重挑战与固有限制时,笔者建议采取全面且深入的革新策略,这要求从数据获取到系统运维的每一个环节都进行精细化重塑。数据的收集不再仅仅是量的积累,而是质的飞跃,意味着要从海量的医疗信息中精挑细选,... 在应对医学GPT技术开发过程中的重重挑战与固有限制时,笔者建议采取全面且深入的革新策略,这要求从数据获取到系统运维的每一个环节都进行精细化重塑。数据的收集不再仅仅是量的积累,而是质的飞跃,意味着要从海量的医疗信息中精挑细选,确保每一份数据都具备高度代表性、准确性和可用性。这一过程不仅需要先进的技术手段支持,更需医学专家的深度参与,以实现数据的精准筛选与价值挖掘。在基座模型的选择上,应摒弃传统的简单问答框架,转而探索构建专家数字人分身的可能性。这样的转变能够让患者仿佛直接面对经验丰富的医生,获得更加个性化、专业化的医疗咨询服务,极大地提升了交互体验与信任度。同时,为了确保医疗信息的安全与准确性,建议应用基于AI的智能质量控制机制来替代过往的盲目依赖,通过算法自动审核与人工复核相结合的方式,严把质量关。此外,模型的训练评估与优化也应更加注重实践经验的融合。在循证医学的基础上,倡导将大医的临床智慧与经验融入模型之中,使医学GPT技术不仅能够依据最新的科研成果,还能结合临床实际,为患者提供更为精准、个体化的诊疗建议。简言之,要实现从数据清洗到精选、从简单咨询到专家分身、从盲目信任到质控把关、从单纯循证到结合大医经验的四大转变。 展开更多
关键词 人工智能 生成型预训练变换模型 医学GPT 自然语言处理 公开证据
暂未订购
一种针对混合频谱噪声的主动减振技术
4
作者 钟志 牛国标 +1 位作者 刘磊 单明广 《实验技术与管理》 北大核心 2025年第6期46-54,共9页
在船舶、海洋工程装备等领域,振动噪声工况呈现出复杂的宽-窄带复合噪声的特点。以往主动控制技术只针对单一类型的噪声进行消减,导致整体减振效果不佳。为解决上述问题,设计了一种能够消减宽-窄带复合噪声的混合频谱主动减振(MSN-HVNC... 在船舶、海洋工程装备等领域,振动噪声工况呈现出复杂的宽-窄带复合噪声的特点。以往主动控制技术只针对单一类型的噪声进行消减,导致整体减振效果不佳。为解决上述问题,设计了一种能够消减宽-窄带复合噪声的混合频谱主动减振(MSN-HVNC)算法,并在X型小浮筏配机实验平台进行实验验证。MSN-HVNC算法由窄带噪声控制子系统(NBCS)和宽带噪声控制子系统(WBCS)两个子系统组成,两者协同完成对混合频谱噪声的消减。其中,WBCS采用含有预训练的选择系数模型的滤波x最小均方(FxLMS)算法,来完成宽带噪声消减;NBCS采用自适应陷波技术,对能量集中的窄带线谱噪声进行消减。用减振后的残余振动噪声来衡量减振水平,并作为误差信号更新控制器权重。最后,用X型小浮筏配机结构来搭建实验平台,完成振动噪声的主动控制实验。结果表明,MSN-HVNC算法对单频窄带振动噪声在50、75 Hz工况下的平均减振效果分别为23.6、21.3 dB;MSN-HVNC算法对模拟多源耦合振动场景下,混合激励振动信号的平均减振效果为12.4 dB,均优于传统控制算法,对宽-窄带复合的混合频谱噪声具有良好的消减效果。 展开更多
关键词 主动控制 混合频谱噪声 预训练模型 协同控制
在线阅读 下载PDF
多模态持续学习方法研究进展
5
作者 张伟 钱龙玥 +1 位作者 张林 李腾 《数据采集与处理》 北大核心 2025年第5期1122-1138,共17页
多模态持续学习(Multimodal continual learning,MMCL)作为机器学习和人工智能领域的一个重要研究方向,旨在通过融合多种模态数据(如图像、文本或语音等)来实现持续的知识积累与任务适应。相较于传统单模态学习方法,MMCL不仅能够并行处... 多模态持续学习(Multimodal continual learning,MMCL)作为机器学习和人工智能领域的一个重要研究方向,旨在通过融合多种模态数据(如图像、文本或语音等)来实现持续的知识积累与任务适应。相较于传统单模态学习方法,MMCL不仅能够并行处理多源异构数据,还能在有效保持已有知识的同时适应新任务需求,展现出在智能系统中的巨大应用潜力。本文系统性地对多模态持续学习进行综述。首先,从基本概念、评估体系和经典单模态持续学习方法3个维度阐述了MMCL的基础理论框架。其次,深入剖析了MMCL在实际应用中的优势与挑战:尽管其在多模态信息融合方面具有显著优势,但仍面临模态不平衡、异构性融合等关键挑战,这些挑战既制约了当前方法的性能表现,也为未来研究指明了方向。基于此,本文随后从基于回放、正则化、参数隔离和大模型4个主要方面,全面梳理了MMCL方法的研究现状与最新进展。最后,对MMCL的未来发展趋势进行了前瞻性展望。 展开更多
关键词 多模态持续学习 模态对齐 灾难性遗忘 预训练模型 任务适应性
在线阅读 下载PDF
基于对抗训练和全局指针网络的医疗文本 实体关系联合抽取模型
6
作者 段宇锋 柏萍 《情报科学》 北大核心 2025年第3期47-57,共11页
【目的/意义】在比较分析现有关系抽取方法的基础上,构建适用于医疗文本的关系抽取模型。【方法/过程】构建AGP模型实现关系抽取。该模型将医疗文本的嵌入表示输入Transformer编码器进一步提取文本特征,利用全局指针网络解码。为了提高... 【目的/意义】在比较分析现有关系抽取方法的基础上,构建适用于医疗文本的关系抽取模型。【方法/过程】构建AGP模型实现关系抽取。该模型将医疗文本的嵌入表示输入Transformer编码器进一步提取文本特征,利用全局指针网络解码。为了提高鲁棒性,模型引入了对抗训练。【结果/结论】AGP模型在CMeIE-V1、CMeIE-V2和DiaKG数据集上F1值分别达到0.6190、0.5321和0.5684。实验结果证明AGP模型在医疗文本关系抽取任务上的性能优于基准模型。【创新/局限】本文提出的模型未整合大语言模型。 展开更多
关键词 对抗训练 全局指针网络 关系抽取 预训练模型 医疗文本
原文传递
新质生产力时代康养
7
作者 白春学 张黎川 +1 位作者 朱文思 蔡沁怡 《元宇宙医学》 2025年第1期21-27,共7页
应用物联网、元宇宙和医学GPT赋能康养领域,提升健康照护的质量与效率。物联网技术通过部署传感器和监控设备,实时监控个体健康状况并收集数据,为制定个性化健康计划提供科学依据。元宇宙则构建一个三维立体的虚拟空间,使用户能以虚拟... 应用物联网、元宇宙和医学GPT赋能康养领域,提升健康照护的质量与效率。物联网技术通过部署传感器和监控设备,实时监控个体健康状况并收集数据,为制定个性化健康计划提供科学依据。元宇宙则构建一个三维立体的虚拟空间,使用户能以虚拟身份参与多样化的健康促进活动,享受沉浸式的健康教育体验,如虚拟现实中的运动训练和康复课程。医学GPT利用自然语言处理技术,结合用户的基因、生理指标等信息,提供个性化的健康咨询和预防策略,生成定制化的健康管理计划,并评估健康风险,提供专业咨询与教育。这些技术的结合不仅提升了健康管理的个性化和智能化水平,还扩大了健康教育资源的可及性,使偏远地区居民也能享受优质资源。此外,它们降低了对传统医疗资源的依赖,减少了成本,提高了服务效率,并通过提供互动性强、趣味性高的虚拟现实体验,增强了用户对健康促进活动的参与度和满意度。这些技术有利于推动医疗健康服务的创新,促进健康资源的公平分配,提升全民健康水平。 展开更多
关键词 虚拟现实 增强现实 物联网 生成型预训练变换模型
暂未订购
基于XLNet—BiLSTM—AFF—CRF的谷物收割机械维修知识命名实体识别
8
作者 李先旺 刘赛虎 +1 位作者 黄忠祥 章霞东 《中国农机化学报》 北大核心 2025年第2期319-325,352,共8页
针对谷物收割机械维修实体识别过程中存在上下文语义特征缺失、长距离依赖信息不充足、实体复杂度较高等问题,提出一种引入注意力机制特征融合的谷物收割机械维修知识命名实体识别模型XLNet—BiLSTM—AFF—CRF。该模型采用基于Transfor... 针对谷物收割机械维修实体识别过程中存在上下文语义特征缺失、长距离依赖信息不充足、实体复杂度较高等问题,提出一种引入注意力机制特征融合的谷物收割机械维修知识命名实体识别模型XLNet—BiLSTM—AFF—CRF。该模型采用基于Transformer—XL的广义自回归XLNet预训练模型作为嵌入层提取字向量;然后使用双向长短时记忆网络(BiLSTM)获取上下文语义特征;利用注意力特征融合AFF将XLNet层输出与BiLSTM层输出进行组合,增强序列的语义信息;最后输入条件随机场CRF模型学习标注约束规则生成全局最优序列。在创建的维修语料库上展开试验,结果表明:所提模型的精确率、召回率和F1值分别为98.4%、97.6%和97.9%,均高于对比模型,验证所提模型的有效性。 展开更多
关键词 谷物收割机械 维修 命名实体识别 注意力机制 广义自回归预训练语言模型(XLNet)
在线阅读 下载PDF
基于《中国英语能力等级量表(2024版)》的口译测试自动评分研究
9
作者 王巍巍 张昱琪 王轲 《现代外语》 北大核心 2025年第4期536-546,共11页
本研究从解释性、评估性和概化性三个维度,验证了基于《中国英语能力等级量表(2024版)》开发的口译质量自动评分模型在不同口译测试场景中的信度表现,旨在探讨该模型的评分质量。结果显示:在同质人群和同声传译任务中,该模型与人工评分... 本研究从解释性、评估性和概化性三个维度,验证了基于《中国英语能力等级量表(2024版)》开发的口译质量自动评分模型在不同口译测试场景中的信度表现,旨在探讨该模型的评分质量。结果显示:在同质人群和同声传译任务中,该模型与人工评分具有较高的一致性和相关性,但在异质人群和交替传译任务中,该模型的评分质量仍需进一步提升;自动评分的精确度和可靠性还受语音识别准确性的影响。自动评分技术在语言测试领域拥有广阔的应用前景,但其算法和特征提取模型仍需进一步优化,以提升评分的稳定性。未来研究应依托自动评分技术,推动口译教学中形成性评价的发展,并构建一个形成性评价与终结性评价相结合的综合性测评体系。 展开更多
关键词 《中国英语能力等级量表》 口译质量自动评分模型 口译评分质量 自动评分
原文传递
融合对抗训练和改进BERT的文本分类方法研究
10
作者 吉训生 蔡志万 胡凯 《计算机与数字工程》 2025年第8期2200-2204,2245,共6页
针对中文文本中广泛存在的“一词多义”现象,以及文本不规范导致的分类模型鲁棒性问题,提出一种基于对抗训练和中文预训练模型相结合的AT-NEZHA(Adversarial Training NEZHA)分类模型。一方面通过引入BERT模型的中文改进版NEZHA模型的wo... 针对中文文本中广泛存在的“一词多义”现象,以及文本不规范导致的分类模型鲁棒性问题,提出一种基于对抗训练和中文预训练模型相结合的AT-NEZHA(Adversarial Training NEZHA)分类模型。一方面通过引入BERT模型的中文改进版NEZHA模型的word embedding融合上下文信息解决中文文本中“一词多义”问题,另一方面利用对抗训练算法,对词嵌入层参数矩阵进行梯度扰动来增加训练过程中的损失值,使得模型找到更合适的参数,从而提高模型的鲁棒性。实验结果表明,AT-NEZHA能有效提高文本分类的准确度。 展开更多
关键词 文本分类 安全隐患 对抗训练 预训练模型 鲁棒性
在线阅读 下载PDF
基于RoBERTa模型和知识蒸馏的酒店文本分类
11
作者 喻金平 罗琛 +1 位作者 姚炫辰 李钰 《计算机与数字工程》 2025年第8期2174-2180,共7页
随着互联网和社交媒体的快速发展,人们越来越倾向于在网络上分享的酒店体验,这种信息泛滥给酒店管理带来了很大的挑战。基于深度学习的分文本分类模型较大且复杂,参数众多。为此,提出了一种基于知识蒸馏的方法即将大型模型中的知识压缩... 随着互联网和社交媒体的快速发展,人们越来越倾向于在网络上分享的酒店体验,这种信息泛滥给酒店管理带来了很大的挑战。基于深度学习的分文本分类模型较大且复杂,参数众多。为此,提出了一种基于知识蒸馏的方法即将大型模型中的知识压缩到小型模型中,实现模型的高效精确的预测。针对酒店文本的特点,使用RoBERTa-base模型作为教师模型,从大规模的酒店文本数据集中进行训练,并获得高精度的情感分类结果。使用BiLSTM作为学生模型,并对教师模型的知识进行蒸馏,并将其应用于情感分析任务中。实验结果显示,RoBERTa-base-BiLSTM蒸馏模型在准确率、精确率和综合评价指标上展现出了出色的表现。经过蒸馏的BiLSTM学生模型在准确率方面比原始的BiLSTM模型取得了更高的准确性,准确率提高了5.08%,并且降低了模型的复杂度和预测耗时。实验结果表明该模型可以有效地提高酒店文本情感分析的准确性和效率,对酒店文本分类具有一定的参考价值。 展开更多
关键词 文本情感分类 深度学习 预训练语言处理 知识蒸馏 RoBERTa
在线阅读 下载PDF
基于渐进机器学习的中文问句匹配方法 被引量:2
12
作者 贺学剑 陈安琪 +2 位作者 郭志强 王致茹 陈群 《工程科学学报》 EI 北大核心 2025年第1期79-90,共12页
问句匹配旨在判断不同问句的意图是否相近.近年来,随着大型预训练语言模型的发展,利用其挖掘问句对在语义层面隐含的匹配信息,取得了目前为止最好的性能.然而,由于基于独立同分布假设,在真实场景中,这些深度学习模型的性能仍然受制于训... 问句匹配旨在判断不同问句的意图是否相近.近年来,随着大型预训练语言模型的发展,利用其挖掘问句对在语义层面隐含的匹配信息,取得了目前为止最好的性能.然而,由于基于独立同分布假设,在真实场景中,这些深度学习模型的性能仍然受制于训练数据的充足程度和目标数据与训练数据之间的分布漂移.本文提出一种基于渐进机器学习的中文问句匹配方法.该方法基于渐进机器学习框架,从不同角度提取问句特征,构建融合各类特征信息的因子图,然后通过迭代的因子推理实现从易到难的渐进学习.在特征建模中,设计并实现了两种类型特征的提取:(1)基于TF-IDF(Term frequency-inverse document frequency)的关键词特征;(2)基于DNN(Deep neural network)的深度语义特征.最后,通过通用的基准中文数据集LCQMC和BQ corpus验证了所提方法的有效性.实验表明,相比于单纯的深度学习模型,基于渐进机器学习的方法可以有效提升问句匹配的准确率,且其性能优势随着标签训练数据的减少而增大. 展开更多
关键词 自然语言理解 中文问句匹配 渐进机器学习 自然语言预训练模型 因子图推理
在线阅读 下载PDF
基于迁移学习的变可信度气动力建模方法
13
作者 张俊杰 黄俊 +2 位作者 刘志勤 王庆凤 陈波 《实验流体力学》 北大核心 2025年第4期93-103,共11页
基于离散数据集建立气动模型是飞行器优化设计的重要环节,但建立完备的高精度数值模拟与风洞试验数据集周期长、成本高。为缩短研制周期、节约设计成本,本文基于有限数据集建立高精度的气动力模型,提出一种基于迁移学习的变可信度气动... 基于离散数据集建立气动模型是飞行器优化设计的重要环节,但建立完备的高精度数值模拟与风洞试验数据集周期长、成本高。为缩短研制周期、节约设计成本,本文基于有限数据集建立高精度的气动力模型,提出一种基于迁移学习的变可信度气动力建模方法。该方法结合气动数据融合理论与迁移学习方法,设计了基于长短期记忆(Long Short-Term Memory,LSTM)神经网络的回归网络结构,采用预训练微调的参数调优机制进行迁移训练,以获得高可信度气动力模型。首先,以NACA 2414翼型的XFLR软件计算数据(低精度)与风洞试验数据(高精度)为研究对象,利用小量高精度数据对基于大量低精度数据集训练的模型进行迁移学习,形成高保真气动力预测模型。然后,设计了使用1/2至1/10风洞数据量的建模实验,并与未迁移的LSTM神经网络模型和加法标度函数(Additive Scaling Function Based Multi-fidelity Surrogate,AS-MFS)模型进行对比讨论。实验结果表明:在所有数据量下本文提出的迁移学习模型均获得了更高预测精度,阻力和升阻比的预测精度比未迁移的LSTM神经网络模型平均提升了7.22%和8.85%,比AS-MFS模型平均提升了8.66%和4.36%。 展开更多
关键词 迁移学习 变可信度气动力建模 长短期记忆神经网络 预训练微调
在线阅读 下载PDF
基于双重预训练的商品属性分类方法
14
作者 赵哲宇 王中卿 王红玲 《计算机科学》 北大核心 2025年第S1期204-211,共8页
商品属性分类任务是指对一段商品的描述文字进行属性分析并进而对多个属性进行分类的过程,其有助于人们从多个角度了解商品,为市场营销、产品管理等提供帮助。当前大语言模型的使用也愈加广泛,但在商品属性分类问题上,通用大模型由于缺... 商品属性分类任务是指对一段商品的描述文字进行属性分析并进而对多个属性进行分类的过程,其有助于人们从多个角度了解商品,为市场营销、产品管理等提供帮助。当前大语言模型的使用也愈加广泛,但在商品属性分类问题上,通用大模型由于缺乏领域知识和属性关联等信息,性能不够理想。为此,提出了一个基于双重预训练的商品属性分类方法,旨在通过使用特定的预训练方式提高大语言模型在商品属性分类任务中的性能。在T5模型的基础上,引入了领域内文本预训练和基于属性间关联性的预训练两种方法。在Clothing Fit Data数据集上的实验结果显示,使用了双重预训练的T5模型较未经过预训练的模型以及其他基准模型,在各个属性上的分类效果都取得了一定提升。实验结果证明了所提方法的有效性。 展开更多
关键词 双重预训练 多属性分类 大语言模型 T5 商品属性分类
在线阅读 下载PDF
面向多模态预训练的子图匹配式对比学习方法研究
15
作者 陈公冠 刘慧 +2 位作者 李恒泰 郭强 张彩明 《计算机学报》 北大核心 2025年第4期893-909,共17页
通过图像文本对的联合学习,多模态预训练大模型在各种视觉任务中展现出巨大的潜力,比如在高质量数据集匮乏的医学领域。然而,现有的模态匹配式预训练方法通常使用全局匹配的方式,易受到低质量信息的干扰。尽管少量研究开始关注局部匹配... 通过图像文本对的联合学习,多模态预训练大模型在各种视觉任务中展现出巨大的潜力,比如在高质量数据集匮乏的医学领域。然而,现有的模态匹配式预训练方法通常使用全局匹配的方式,易受到低质量信息的干扰。尽管少量研究开始关注局部匹配,但这些方法仅仅通过简单的池化操作来缩小匹配范围,忽略了跨模态重要对象之间的内在关系以及跨样本对之间同语义表征的获取。鉴于此,本文在多模态大模型的预训练过程中,提出了一种基于图神经网络的消息传递机制,对多模态数据特征进行节点化和子图化,从而将跨模态的匹配方式由全局匹配转变为子图匹配,减少低质量信息的干扰。同时,利用交叉注意力在单一模态内进行子图级别的差异化处理,使其在跨模态学习中建立更细致的关联和语义理解。此外,提出高维空间的样本对聚类方法,以减少多模态大模型对相同语义的无关联错误表达。在涵盖图像分类、病灶区域目标检测和语义分割任务的七个医学图像数据集上进行了大量实验,验证了本文所提出模型的可行性和优越性能。同时在表情识别任务中进行实验,验证了本文模型的泛化性能。 展开更多
关键词 多模态预训练大模型 局部匹配 子图匹配 无关联错误 聚类
在线阅读 下载PDF
一种结合自监督学习与解耦注意力的DGA域名检测方法
16
作者 李子川 罗文华 《小型微型计算机系统》 北大核心 2025年第10期2495-2501,共7页
随着网络空间战略地位的不断提升和网络安全事件的频发,在网络安全领域,检测和分类由域名生成算法(DGA)生成的恶意域名是防范恶意软件和高级持续性威胁的关键挑战.现有检测方法大多依赖人工提取特征或大量带标记数据集,这不仅耗时且容... 随着网络空间战略地位的不断提升和网络安全事件的频发,在网络安全领域,检测和分类由域名生成算法(DGA)生成的恶意域名是防范恶意软件和高级持续性威胁的关键挑战.现有检测方法大多依赖人工提取特征或大量带标记数据集,这不仅耗时且容易受到复杂网络环境的影响,尤其是当攻击者识别并规避这些特征时,检测效果会大打折扣,因此传统检测方法在应对复杂且动态变化的DGA域名时常常表现不佳.为了解决已有方法泛化能力弱的缺点,本文提出了一种基于自监督学习和解耦注意力机制的DGA恶意域名检测系统,该系统基于DeBERTa序列模型,包含自监督预训练和微调两个训练步骤.首先自监督预训练从未标注的大规模数据中自动学习特征表示,减少了对标记数据的依赖.随后,在DGA数据集上对预训练模型进行微调,进一步优化其在异常检测任务中的表现.通过引入解耦注意力机制,模型能够更准确地融合URL中的位置和字符信息,从而提升恶意域名的检测性能.实验结果显示,所提出的基于DeBERTa的自监督预训练模型在DGA检测中的准确率、召回率和F1分数显著优于传统方法,展示了其在复杂网络环境中的卓越性能和鲁棒性.该研究为利用先进的自监督学习技术提升网络安全检测系统的效果提供了重要参考. 展开更多
关键词 自监督学习 解耦注意力 DGA域名检测 异常检测 URL分类 预训练模型 网络安全
在线阅读 下载PDF
基于预训练扩散模型的两阶段高分辨率图像复原方法
17
作者 谢源远 周非 +1 位作者 周志远 张宇曈 《计算机应用研究》 北大核心 2025年第8期2545-2551,共7页
预训练扩散先验图像复原依赖预训练的扩散模型,无须微调即可处理各种经典图像复原任务。然而,目前的预训练扩散先验图像复原方法在处理高分辨率图像时效率低下,并且存在分布外问题(out of distribution,OOD)。针对以上问题,提出了一种... 预训练扩散先验图像复原依赖预训练的扩散模型,无须微调即可处理各种经典图像复原任务。然而,目前的预训练扩散先验图像复原方法在处理高分辨率图像时效率低下,并且存在分布外问题(out of distribution,OOD)。针对以上问题,提出了一种基于预训练扩散模型的两阶段高分辨率图像复原方法,命名为由粗到细(coarse-to-fine,C2F)的方法。首先在预训练模型固定尺寸的coarse阶段得到粗糙的复原结果以保证输出一致性。然后在原尺寸的fine阶段上以coarse阶段结果为起点,使用更短的扩散过程来大幅度提升复原速度与获取一致性结果。在人脸与自然环境等多种场景下,以修复、上色、去模糊三种经典复原任务为目标,两阶段方法在任何尺寸下皆可获得最高水平的输出结果。对于1024尺寸的图像复原,采样次数需求仅需要同类方法的22%,速度达到了同类方法的4.5倍,避免了OOD问题,并且在PSNR与FID指标上达到最高水平。实验表明,所提方法对高分辨率图像的复原速度远高于其他方法,并且避免了OOD问题,具有良好的复原效果。 展开更多
关键词 图像复原 扩散模型 预训练模型
在线阅读 下载PDF
基于结构拆分的议论文生成方法
18
作者 刘田澍 赵铁军 宋雨辰 《中文信息学报》 北大核心 2025年第6期157-167,共11页
自然语言生成是自然语言处理的重要研究方向。该文研究如何使用题目及首尾段关键词生成议论文,并根据议论文特点将该任务进一步转化为基于题目及关键词的议论文首尾段生成、基于题目的论据匹配及论证生成的任务。前者对应议论文的引论... 自然语言生成是自然语言处理的重要研究方向。该文研究如何使用题目及首尾段关键词生成议论文,并根据议论文特点将该任务进一步转化为基于题目及关键词的议论文首尾段生成、基于题目的论据匹配及论证生成的任务。前者对应议论文的引论及结论,后者对应本论。该文提出了使用基于预训练模型并引入句子语义相似度预测任务的方法进行首尾段生成,提出了引入指示编码及软模板匹配度预测任务的重写方法进行论证生成,最后按照“一段引论,三段本论,一段结论”的结构生成完整议论文。实验结果表明,该方法可以生成可读性较好的议论文。 展开更多
关键词 自然语言生成 预训练模型 议论文
在线阅读 下载PDF
多模态深度学习的区块链智能合约漏洞检测方法
19
作者 常萨 冯勇 《小型微型计算机系统》 北大核心 2025年第4期958-965,共8页
智能合约推动了区块链技术的深化发展,然而其存在的安全隐患给区块链应用带来了诸多挑战.在现有研究中,源代码通常被视为序列,以向量形式进行表示,或者被建模为图结构,利用图神经网络进行分析.在此基础上,本文提出了一种基于多模态深度... 智能合约推动了区块链技术的深化发展,然而其存在的安全隐患给区块链应用带来了诸多挑战.在现有研究中,源代码通常被视为序列,以向量形式进行表示,或者被建模为图结构,利用图神经网络进行分析.在此基础上,本文提出了一种基于多模态深度学习的区块链智能合约漏洞检测方法.该方法充分利用智能合约的计算机视觉特征、代码语义特征和图特征进行漏洞检测.具体而言,该方法首先提取智能合约的代码属性图(CPG),并利用计算机视觉模型SwinV2学习CPG图像视觉特征;同时,利用预训练模型UniXcoder学习智能合约源代码的代码语义特征;最后,利用多组交错的GNN块学习CPG的图特征.将这3个特征向量拼接,构建出一个特征向量,实现特征融合.为了验证多模态检测方法的有效性,本文在真实智能合约的数据集上,与多种主流的智能合约漏洞检测方法进行对比实验.实验结果表明,多模态检测方法在检测重入漏洞方面的召回率、准确率和F1值分别可以达到0.94、0.92和0.93. 展开更多
关键词 区块链 智能合约 多模态 预训练模型 漏洞检测
在线阅读 下载PDF
联合预训练模型和层级注意力的知识超图链接预测
20
作者 庞俊 梅杰 +1 位作者 林晓丽 王蒙湘 《计算机工程与应用》 北大核心 2025年第10期133-144,共12页
知识超图(knowledge hypergraph,KHG)是超图结构的知识图谱。现有知识超图链接预测模型主要存在以下不足:模型输入时将实体和关系简单地表示为嵌入层的ID(索引),而没有考虑实体和关系之间复杂的联系和语义;编码时只考虑位置和角色信息,... 知识超图(knowledge hypergraph,KHG)是超图结构的知识图谱。现有知识超图链接预测模型主要存在以下不足:模型输入时将实体和关系简单地表示为嵌入层的ID(索引),而没有考虑实体和关系之间复杂的联系和语义;编码时只考虑位置和角色信息,而忽略了实体邻域结构和多元关系间的联系,导致实体和关系表示能力不足;模型训练时采样的负样本质量不够高,不能帮助模型高效学习样本特征。针对以上问题,提出一种联合预训练模型和层级注意力的知识超图链接预测模型(link prediction in knowledge hypergraph combining pretrained model and hierarchical attention,LPPH)。该模型引入预训练模型和简化的团式展开方法初始化超图嵌入,将实体和关系之间复杂联系和语义融入至实体和关系嵌入中;编码时使用层级注意力机制聚合实体邻域结构信息以增强实体表示,并使用实体-关系融合操作增强关系表示;提出一种基于过滤机制和主动学习的负样本选择策略,实现模型的高效训练。真实数据集上的大量实验结果验证了LPPH能有效提高知识超图链接预测的效果。 展开更多
关键词 知识超图 链接预测 预训练模型 层级注意力
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部