期刊文献+
共找到267篇文章
< 1 2 14 >
每页显示 20 50 100
基于提示的小样本情感分析综述
1
作者 姜鑫 马宏伟 张展峰 《软件导刊》 2026年第1期213-220,共8页
随着多媒体平台和大规模语言模型的迅猛发展,采用基于提示的方法实现小样本情感分析,对用户需求分析和系统服务改进具有重要意义。基于提示的小样本情感分析研究,致力于在不同应用场景中合理利用预训练语言模型理解分类任务,推理情感类... 随着多媒体平台和大规模语言模型的迅猛发展,采用基于提示的方法实现小样本情感分析,对用户需求分析和系统服务改进具有重要意义。基于提示的小样本情感分析研究,致力于在不同应用场景中合理利用预训练语言模型理解分类任务,推理情感类别。首先,阐述了小样本情感分析的问题背景;其次,介绍了使用提示—微调、提示调优和上下文学习的方法步骤;再次,系统对比了近来基于提示的小样本情感分析的主流技术,归纳总结了相关语料库、预训练语言模型与提示模板;最后,对基于提示的小样本情感分析未来可能的研究方向进行展望,为句子级文本分类和提示学习相关领域的研究提供参考。 展开更多
关键词 小样本情感分析 预训练语言模型 提示—微调 提示调优 上下文学习
在线阅读 下载PDF
SRS-Net: Training object detectors from scratch for remote sensing images without pretraining 被引量:2
2
作者 Haining WANG Yang LI +4 位作者 Yuqiang FANG Yurong LIAO Bitao JIANG Xitao ZHANG Shuyan NI 《Chinese Journal of Aeronautics》 SCIE EI CAS CSCD 2023年第8期269-283,共15页
Most of the current object detection algorithms use pretrained models that are trained on ImageNet and then fine-tuned in the network,which can achieve good performance in terms of general object detectors.However,in ... Most of the current object detection algorithms use pretrained models that are trained on ImageNet and then fine-tuned in the network,which can achieve good performance in terms of general object detectors.However,in the field of remote sensing image object detection,as pretrained models are significantly different from remote sensing data,it is meaningful to explore a train-fromscratch technique for remote sensing images.This paper proposes an object detection framework trained from scratch,SRS-Net,and describes the design of a densely connected backbone network to provide integrated hidden layer supervision for the convolution module.Then,two necessary improvement principles are proposed:studying the role of normalization in the network structure,and improving data augmentation methods for remote sensing images.To evaluate the proposed framework,we performed many ablation experiments on the DIOR,DOTA,and AS datasets.The results show that whether using the improved backbone network,the normalization method or training data enhancement strategy,the performance of the object detection network trained from scratch increased.These principles compensate for the lack of pretrained models.Furthermore,we found that SRS-Net could achieve similar to or slightly better performance than baseline methods,and surpassed most advanced general detectors. 展开更多
关键词 Denseconnection Object detection pretraining Remote sensing image Trainfrom scratch
原文传递
一种针对混合频谱噪声的主动减振技术 被引量:1
3
作者 钟志 牛国标 +1 位作者 刘磊 单明广 《实验技术与管理》 北大核心 2025年第6期46-54,共9页
在船舶、海洋工程装备等领域,振动噪声工况呈现出复杂的宽-窄带复合噪声的特点。以往主动控制技术只针对单一类型的噪声进行消减,导致整体减振效果不佳。为解决上述问题,设计了一种能够消减宽-窄带复合噪声的混合频谱主动减振(MSN-HVNC... 在船舶、海洋工程装备等领域,振动噪声工况呈现出复杂的宽-窄带复合噪声的特点。以往主动控制技术只针对单一类型的噪声进行消减,导致整体减振效果不佳。为解决上述问题,设计了一种能够消减宽-窄带复合噪声的混合频谱主动减振(MSN-HVNC)算法,并在X型小浮筏配机实验平台进行实验验证。MSN-HVNC算法由窄带噪声控制子系统(NBCS)和宽带噪声控制子系统(WBCS)两个子系统组成,两者协同完成对混合频谱噪声的消减。其中,WBCS采用含有预训练的选择系数模型的滤波x最小均方(FxLMS)算法,来完成宽带噪声消减;NBCS采用自适应陷波技术,对能量集中的窄带线谱噪声进行消减。用减振后的残余振动噪声来衡量减振水平,并作为误差信号更新控制器权重。最后,用X型小浮筏配机结构来搭建实验平台,完成振动噪声的主动控制实验。结果表明,MSN-HVNC算法对单频窄带振动噪声在50、75 Hz工况下的平均减振效果分别为23.6、21.3 dB;MSN-HVNC算法对模拟多源耦合振动场景下,混合激励振动信号的平均减振效果为12.4 dB,均优于传统控制算法,对宽-窄带复合的混合频谱噪声具有良好的消减效果。 展开更多
关键词 主动控制 混合频谱噪声 预训练模型 协同控制
在线阅读 下载PDF
多模态持续学习方法研究进展 被引量:1
4
作者 张伟 钱龙玥 +1 位作者 张林 李腾 《数据采集与处理》 北大核心 2025年第5期1122-1138,共17页
多模态持续学习(Multimodal continual learning,MMCL)作为机器学习和人工智能领域的一个重要研究方向,旨在通过融合多种模态数据(如图像、文本或语音等)来实现持续的知识积累与任务适应。相较于传统单模态学习方法,MMCL不仅能够并行处... 多模态持续学习(Multimodal continual learning,MMCL)作为机器学习和人工智能领域的一个重要研究方向,旨在通过融合多种模态数据(如图像、文本或语音等)来实现持续的知识积累与任务适应。相较于传统单模态学习方法,MMCL不仅能够并行处理多源异构数据,还能在有效保持已有知识的同时适应新任务需求,展现出在智能系统中的巨大应用潜力。本文系统性地对多模态持续学习进行综述。首先,从基本概念、评估体系和经典单模态持续学习方法3个维度阐述了MMCL的基础理论框架。其次,深入剖析了MMCL在实际应用中的优势与挑战:尽管其在多模态信息融合方面具有显著优势,但仍面临模态不平衡、异构性融合等关键挑战,这些挑战既制约了当前方法的性能表现,也为未来研究指明了方向。基于此,本文随后从基于回放、正则化、参数隔离和大模型4个主要方面,全面梳理了MMCL方法的研究现状与最新进展。最后,对MMCL的未来发展趋势进行了前瞻性展望。 展开更多
关键词 多模态持续学习 模态对齐 灾难性遗忘 预训练模型 任务适应性
在线阅读 下载PDF
基于Bert+GCN多模态数据融合的药物分子属性预测 被引量:1
5
作者 闫效莺 靳艳春 +1 位作者 冯月华 张绍武 《生物化学与生物物理进展》 北大核心 2025年第3期783-794,共12页
目的药物研发成本高、周期长且成功率低。准确预测分子属性对有效筛选药物候选物、优化分子结构具有重要意义。基于特征工程的传统分子属性预测方法需研究人员具备深厚的学科背景和广泛的专业知识。随着人工智能技术的不断成熟,涌现出... 目的药物研发成本高、周期长且成功率低。准确预测分子属性对有效筛选药物候选物、优化分子结构具有重要意义。基于特征工程的传统分子属性预测方法需研究人员具备深厚的学科背景和广泛的专业知识。随着人工智能技术的不断成熟,涌现出大量优于传统特征工程方法的分子属性预测算法。然而这些算法模型仍然存在标记数据稀缺、泛化性能差等问题。鉴于此,本文提出一种基于Bert+GCN的多模态数据融合的分子属性预测算法(命名为BGMF),旨在整合药物分子的多模态数据,并充分利用大量无标记药物分子训练模型学习药物分子的有用信息。方法本文提出了BGMF算法,该算法根据药物SMILES表达式分别提取了原子序列、分子指纹序列和分子图数据,采用预训练模型Bert和图卷积神经网络GCN结合的方式进行特征学习,在挖掘药物分子中“单词”全局特征的同时,融合了分子图的局部拓扑特征,从而更充分利用分子全局-局部上下文语义关系,之后,通过对原子序列和分子指纹序列的双解码器设计加强分子特征表达。结果5个数据集共43个分子属性预测任务上,BGMF方法的AUC值均优于现有其他方法。此外,本文还构建独立测试数据集验证了模型具有良好的泛化性能。对生成的分子指纹表征(molecular fingerprint representation)进行t-SNE可视化分析,证明了BGMF模型可成功捕获不同分子指纹的内在结构与特征。结论通过图卷积神经网络与Bert模型相结合,BGMF将分子图数据整合到分子指纹恢复和掩蔽原子恢复的任务中,可以有效地捕捉分子指纹的内在结构和特征,进而高效预测药物分子属性。 展开更多
关键词 Bert预训练 注意力机制 分子指纹 分子属性预测 图卷积神经网络
原文传递
基于对抗训练和全局指针网络的医疗文本 实体关系联合抽取模型 被引量:2
6
作者 段宇锋 柏萍 《情报科学》 北大核心 2025年第3期47-57,共11页
【目的/意义】在比较分析现有关系抽取方法的基础上,构建适用于医疗文本的关系抽取模型。【方法/过程】构建AGP模型实现关系抽取。该模型将医疗文本的嵌入表示输入Transformer编码器进一步提取文本特征,利用全局指针网络解码。为了提高... 【目的/意义】在比较分析现有关系抽取方法的基础上,构建适用于医疗文本的关系抽取模型。【方法/过程】构建AGP模型实现关系抽取。该模型将医疗文本的嵌入表示输入Transformer编码器进一步提取文本特征,利用全局指针网络解码。为了提高鲁棒性,模型引入了对抗训练。【结果/结论】AGP模型在CMeIE-V1、CMeIE-V2和DiaKG数据集上F1值分别达到0.6190、0.5321和0.5684。实验结果证明AGP模型在医疗文本关系抽取任务上的性能优于基准模型。【创新/局限】本文提出的模型未整合大语言模型。 展开更多
关键词 对抗训练 全局指针网络 关系抽取 预训练模型 医疗文本
原文传递
医学GPT研发应用之吾见 被引量:3
7
作者 白春学 《元宇宙医学》 2025年第1期6-14,共9页
在应对医学GPT技术开发过程中的重重挑战与固有限制时,笔者建议采取全面且深入的革新策略,这要求从数据获取到系统运维的每一个环节都进行精细化重塑。数据的收集不再仅仅是量的积累,而是质的飞跃,意味着要从海量的医疗信息中精挑细选,... 在应对医学GPT技术开发过程中的重重挑战与固有限制时,笔者建议采取全面且深入的革新策略,这要求从数据获取到系统运维的每一个环节都进行精细化重塑。数据的收集不再仅仅是量的积累,而是质的飞跃,意味着要从海量的医疗信息中精挑细选,确保每一份数据都具备高度代表性、准确性和可用性。这一过程不仅需要先进的技术手段支持,更需医学专家的深度参与,以实现数据的精准筛选与价值挖掘。在基座模型的选择上,应摒弃传统的简单问答框架,转而探索构建专家数字人分身的可能性。这样的转变能够让患者仿佛直接面对经验丰富的医生,获得更加个性化、专业化的医疗咨询服务,极大地提升了交互体验与信任度。同时,为了确保医疗信息的安全与准确性,建议应用基于AI的智能质量控制机制来替代过往的盲目依赖,通过算法自动审核与人工复核相结合的方式,严把质量关。此外,模型的训练评估与优化也应更加注重实践经验的融合。在循证医学的基础上,倡导将大医的临床智慧与经验融入模型之中,使医学GPT技术不仅能够依据最新的科研成果,还能结合临床实际,为患者提供更为精准、个体化的诊疗建议。简言之,要实现从数据清洗到精选、从简单咨询到专家分身、从盲目信任到质控把关、从单纯循证到结合大医经验的四大转变。 展开更多
关键词 人工智能 生成型预训练变换模型 医学GPT 自然语言处理 公开证据
暂未订购
低资源条件下的藏语语音情感识别 被引量:1
8
作者 张维昭 李皓渊 杨鸿武 《信号处理》 北大核心 2025年第9期1558-1569,共12页
近年来,虽然面向主流语言的语音情感识别研究已经取得了较大进展,但是面向低资源语言的语音情感识别研究在数据集构建、特征提取与识别模型设计等方面面临诸多困难。针对低资源条件下的藏语语音情感识别问题,首先通过视频剪辑、音频提... 近年来,虽然面向主流语言的语音情感识别研究已经取得了较大进展,但是面向低资源语言的语音情感识别研究在数据集构建、特征提取与识别模型设计等方面面临诸多困难。针对低资源条件下的藏语语音情感识别问题,首先通过视频剪辑、音频提取与增强、人工标注与校对等步骤,初步构建了藏语情感语音数据集(Tibetan Emotion Speech Dataset-2500,TESD-2500)。该数据集涵盖四种情感类型(生气、悲伤、高兴和中性),共包含2500个语音样本,情感类别与样本数量仍在持续扩充中。然后,设计了一种融合交叉注意力与协同注意力机制的多特征融合语音情感识别模型,采用双向长短期记忆网络(Bidirectional Long Short-Term Memory Network,BiLSTM)对梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient,MFCC)进行时序建模,以提取语音信号中的动态时序表征;利用AlexNet提取语谱图的时频特征,以捕获语音信号的时频联合分布模式,并通过交叉注意力机制计算上述两类异构特征间的相关性权重;引入大规模预训练模型WavLM提取语音信号的深层特征,并以前述交叉注意力计算的结果作为权重向量,通过协同注意力机制对深层特征进行加权重构;将MFCC时序特征、语谱图时频特征和加权的预训练模型深层特征拼接成多层次特征融合表示,通过全连接层映射至情感类别空间,完成藏语语音情感分类任务。最终实验结果表明,所提出的模型在TESD-2500数据集上取得了76.56%的加权准确率和75.42%的未加权准确率,显著优于基线模型。本文还在IEMOCAP和EmoDB数据集上进行了模型泛化能力测试,在IEMOCAP上达到了74.27%的加权准确率和73.60%的未加权准确率,在EmoDB上达到了92.61%的加权准确率和91.68%的未加权准确率。本文的研究方法与结果亦可为其他低资源语言的语音情感识别研究提供参考。 展开更多
关键词 语音情感识别 低资源 多特征融合 预训练模型 藏语
在线阅读 下载PDF
一种改进的地球物理测井资料智能化解释评价方法
9
作者 朱剑兵 王继晨 +3 位作者 蔡子健 李长红 李泽瑞 吕文君 《地球物理学进展》 北大核心 2025年第6期2629-2641,共13页
当前,在基于机器学习的测井解释研究领域,由于数据分布存在差异,先前基于已有测井数据训练出的模型难以直接适用于新的测井数据解释.本文专注于地球物理测井智能解释问题,借助机器学习提出了一种半监督框架下的模型微调方法,即Log2FT.... 当前,在基于机器学习的测井解释研究领域,由于数据分布存在差异,先前基于已有测井数据训练出的模型难以直接适用于新的测井数据解释.本文专注于地球物理测井智能解释问题,借助机器学习提出了一种半监督框架下的模型微调方法,即Log2FT.该方法首先在源域上进行模型训练,然后利用目标域中的少量标签进行微调,以提升模型的适应性.为了验证该方法的有效性,我们选取了位于渤海湾盆地济阳坳陷的四口井D、E、F、G,分别进行了D→E,E→D,F→G,G→F四组实验.通过一系列实验设计,包括平行重复实验、对比实验、消融实验以及相关的解释分析,全面验证了本文提出方法的有效性和实用性.最终实验结果表明,这一方法显著提升了测井解释的精度.这项研究有助于克服现有测井解释中存在的数据分布差异性问题,为解释新测井数据提供了一种可行且有效的方法. 展开更多
关键词 测井解释 半监督学习 数据分布差异 预训练模型 微调
原文传递
基于《中国英语能力等级量表(2024版)》的口译测试自动评分研究 被引量:1
10
作者 王巍巍 张昱琪 王轲 《现代外语》 北大核心 2025年第4期536-546,共11页
本研究从解释性、评估性和概化性三个维度,验证了基于《中国英语能力等级量表(2024版)》开发的口译质量自动评分模型在不同口译测试场景中的信度表现,旨在探讨该模型的评分质量。结果显示:在同质人群和同声传译任务中,该模型与人工评分... 本研究从解释性、评估性和概化性三个维度,验证了基于《中国英语能力等级量表(2024版)》开发的口译质量自动评分模型在不同口译测试场景中的信度表现,旨在探讨该模型的评分质量。结果显示:在同质人群和同声传译任务中,该模型与人工评分具有较高的一致性和相关性,但在异质人群和交替传译任务中,该模型的评分质量仍需进一步提升;自动评分的精确度和可靠性还受语音识别准确性的影响。自动评分技术在语言测试领域拥有广阔的应用前景,但其算法和特征提取模型仍需进一步优化,以提升评分的稳定性。未来研究应依托自动评分技术,推动口译教学中形成性评价的发展,并构建一个形成性评价与终结性评价相结合的综合性测评体系。 展开更多
关键词 《中国英语能力等级量表》 口译质量自动评分模型 口译评分质量 自动评分
原文传递
新质生产力时代康养
11
作者 白春学 张黎川 +1 位作者 朱文思 蔡沁怡 《元宇宙医学》 2025年第1期21-27,共7页
应用物联网、元宇宙和医学GPT赋能康养领域,提升健康照护的质量与效率。物联网技术通过部署传感器和监控设备,实时监控个体健康状况并收集数据,为制定个性化健康计划提供科学依据。元宇宙则构建一个三维立体的虚拟空间,使用户能以虚拟... 应用物联网、元宇宙和医学GPT赋能康养领域,提升健康照护的质量与效率。物联网技术通过部署传感器和监控设备,实时监控个体健康状况并收集数据,为制定个性化健康计划提供科学依据。元宇宙则构建一个三维立体的虚拟空间,使用户能以虚拟身份参与多样化的健康促进活动,享受沉浸式的健康教育体验,如虚拟现实中的运动训练和康复课程。医学GPT利用自然语言处理技术,结合用户的基因、生理指标等信息,提供个性化的健康咨询和预防策略,生成定制化的健康管理计划,并评估健康风险,提供专业咨询与教育。这些技术的结合不仅提升了健康管理的个性化和智能化水平,还扩大了健康教育资源的可及性,使偏远地区居民也能享受优质资源。此外,它们降低了对传统医疗资源的依赖,减少了成本,提高了服务效率,并通过提供互动性强、趣味性高的虚拟现实体验,增强了用户对健康促进活动的参与度和满意度。这些技术有利于推动医疗健康服务的创新,促进健康资源的公平分配,提升全民健康水平。 展开更多
关键词 虚拟现实 增强现实 物联网 生成型预训练变换模型
暂未订购
基于XLNet—BiLSTM—AFF—CRF的谷物收割机械维修知识命名实体识别
12
作者 李先旺 刘赛虎 +1 位作者 黄忠祥 章霞东 《中国农机化学报》 北大核心 2025年第2期319-325,352,共8页
针对谷物收割机械维修实体识别过程中存在上下文语义特征缺失、长距离依赖信息不充足、实体复杂度较高等问题,提出一种引入注意力机制特征融合的谷物收割机械维修知识命名实体识别模型XLNet—BiLSTM—AFF—CRF。该模型采用基于Transfor... 针对谷物收割机械维修实体识别过程中存在上下文语义特征缺失、长距离依赖信息不充足、实体复杂度较高等问题,提出一种引入注意力机制特征融合的谷物收割机械维修知识命名实体识别模型XLNet—BiLSTM—AFF—CRF。该模型采用基于Transformer—XL的广义自回归XLNet预训练模型作为嵌入层提取字向量;然后使用双向长短时记忆网络(BiLSTM)获取上下文语义特征;利用注意力特征融合AFF将XLNet层输出与BiLSTM层输出进行组合,增强序列的语义信息;最后输入条件随机场CRF模型学习标注约束规则生成全局最优序列。在创建的维修语料库上展开试验,结果表明:所提模型的精确率、召回率和F1值分别为98.4%、97.6%和97.9%,均高于对比模型,验证所提模型的有效性。 展开更多
关键词 谷物收割机械 维修 命名实体识别 注意力机制 广义自回归预训练语言模型(XLNet)
在线阅读 下载PDF
融合对抗训练和改进BERT的文本分类方法研究
13
作者 吉训生 蔡志万 胡凯 《计算机与数字工程》 2025年第8期2200-2204,2245,共6页
针对中文文本中广泛存在的“一词多义”现象,以及文本不规范导致的分类模型鲁棒性问题,提出一种基于对抗训练和中文预训练模型相结合的AT-NEZHA(Adversarial Training NEZHA)分类模型。一方面通过引入BERT模型的中文改进版NEZHA模型的wo... 针对中文文本中广泛存在的“一词多义”现象,以及文本不规范导致的分类模型鲁棒性问题,提出一种基于对抗训练和中文预训练模型相结合的AT-NEZHA(Adversarial Training NEZHA)分类模型。一方面通过引入BERT模型的中文改进版NEZHA模型的word embedding融合上下文信息解决中文文本中“一词多义”问题,另一方面利用对抗训练算法,对词嵌入层参数矩阵进行梯度扰动来增加训练过程中的损失值,使得模型找到更合适的参数,从而提高模型的鲁棒性。实验结果表明,AT-NEZHA能有效提高文本分类的准确度。 展开更多
关键词 文本分类 安全隐患 对抗训练 预训练模型 鲁棒性
在线阅读 下载PDF
基于RoBERTa模型和知识蒸馏的酒店文本分类
14
作者 喻金平 罗琛 +1 位作者 姚炫辰 李钰 《计算机与数字工程》 2025年第8期2174-2180,共7页
随着互联网和社交媒体的快速发展,人们越来越倾向于在网络上分享的酒店体验,这种信息泛滥给酒店管理带来了很大的挑战。基于深度学习的分文本分类模型较大且复杂,参数众多。为此,提出了一种基于知识蒸馏的方法即将大型模型中的知识压缩... 随着互联网和社交媒体的快速发展,人们越来越倾向于在网络上分享的酒店体验,这种信息泛滥给酒店管理带来了很大的挑战。基于深度学习的分文本分类模型较大且复杂,参数众多。为此,提出了一种基于知识蒸馏的方法即将大型模型中的知识压缩到小型模型中,实现模型的高效精确的预测。针对酒店文本的特点,使用RoBERTa-base模型作为教师模型,从大规模的酒店文本数据集中进行训练,并获得高精度的情感分类结果。使用BiLSTM作为学生模型,并对教师模型的知识进行蒸馏,并将其应用于情感分析任务中。实验结果显示,RoBERTa-base-BiLSTM蒸馏模型在准确率、精确率和综合评价指标上展现出了出色的表现。经过蒸馏的BiLSTM学生模型在准确率方面比原始的BiLSTM模型取得了更高的准确性,准确率提高了5.08%,并且降低了模型的复杂度和预测耗时。实验结果表明该模型可以有效地提高酒店文本情感分析的准确性和效率,对酒店文本分类具有一定的参考价值。 展开更多
关键词 文本情感分类 深度学习 预训练语言处理 知识蒸馏 RoBERTa
在线阅读 下载PDF
多模态深度学习的区块链智能合约漏洞检测方法 被引量:2
15
作者 常萨 冯勇 《小型微型计算机系统》 北大核心 2025年第4期958-965,共8页
智能合约推动了区块链技术的深化发展,然而其存在的安全隐患给区块链应用带来了诸多挑战.在现有研究中,源代码通常被视为序列,以向量形式进行表示,或者被建模为图结构,利用图神经网络进行分析.在此基础上,本文提出了一种基于多模态深度... 智能合约推动了区块链技术的深化发展,然而其存在的安全隐患给区块链应用带来了诸多挑战.在现有研究中,源代码通常被视为序列,以向量形式进行表示,或者被建模为图结构,利用图神经网络进行分析.在此基础上,本文提出了一种基于多模态深度学习的区块链智能合约漏洞检测方法.该方法充分利用智能合约的计算机视觉特征、代码语义特征和图特征进行漏洞检测.具体而言,该方法首先提取智能合约的代码属性图(CPG),并利用计算机视觉模型SwinV2学习CPG图像视觉特征;同时,利用预训练模型UniXcoder学习智能合约源代码的代码语义特征;最后,利用多组交错的GNN块学习CPG的图特征.将这3个特征向量拼接,构建出一个特征向量,实现特征融合.为了验证多模态检测方法的有效性,本文在真实智能合约的数据集上,与多种主流的智能合约漏洞检测方法进行对比实验.实验结果表明,多模态检测方法在检测重入漏洞方面的召回率、准确率和F1值分别可以达到0.94、0.92和0.93. 展开更多
关键词 区块链 智能合约 多模态 预训练模型 漏洞检测
在线阅读 下载PDF
基于渐进机器学习的中文问句匹配方法 被引量:2
16
作者 贺学剑 陈安琪 +2 位作者 郭志强 王致茹 陈群 《工程科学学报》 EI 北大核心 2025年第1期79-90,共12页
问句匹配旨在判断不同问句的意图是否相近.近年来,随着大型预训练语言模型的发展,利用其挖掘问句对在语义层面隐含的匹配信息,取得了目前为止最好的性能.然而,由于基于独立同分布假设,在真实场景中,这些深度学习模型的性能仍然受制于训... 问句匹配旨在判断不同问句的意图是否相近.近年来,随着大型预训练语言模型的发展,利用其挖掘问句对在语义层面隐含的匹配信息,取得了目前为止最好的性能.然而,由于基于独立同分布假设,在真实场景中,这些深度学习模型的性能仍然受制于训练数据的充足程度和目标数据与训练数据之间的分布漂移.本文提出一种基于渐进机器学习的中文问句匹配方法.该方法基于渐进机器学习框架,从不同角度提取问句特征,构建融合各类特征信息的因子图,然后通过迭代的因子推理实现从易到难的渐进学习.在特征建模中,设计并实现了两种类型特征的提取:(1)基于TF-IDF(Term frequency-inverse document frequency)的关键词特征;(2)基于DNN(Deep neural network)的深度语义特征.最后,通过通用的基准中文数据集LCQMC和BQ corpus验证了所提方法的有效性.实验表明,相比于单纯的深度学习模型,基于渐进机器学习的方法可以有效提升问句匹配的准确率,且其性能优势随着标签训练数据的减少而增大. 展开更多
关键词 自然语言理解 中文问句匹配 渐进机器学习 自然语言预训练模型 因子图推理
在线阅读 下载PDF
基于参数高效微调及双流网络的人脸伪造检测 被引量:1
17
作者 陈咏豪 蔡满春 +3 位作者 张溢文 彭舒凡 姚利峰 朱懿 《计算机工程与应用》 北大核心 2025年第10期288-298,共11页
随着深度伪造技术的发展,伪造的人脸图像愈发逼真,深度伪造技术一旦被不法分子滥用将对社会治安和公共安全造成危害,因此如何对深度伪造进行有效检测成为重要的研究课题。现有的深度伪造检测技术普遍存在跨库检测泛化性差、跨压缩率检... 随着深度伪造技术的发展,伪造的人脸图像愈发逼真,深度伪造技术一旦被不法分子滥用将对社会治安和公共安全造成危害,因此如何对深度伪造进行有效检测成为重要的研究课题。现有的深度伪造检测技术普遍存在跨库检测泛化性差、跨压缩率检测鲁棒性差的问题。为解决上述问题,提出了一种基于参数高效微调及双流网络的人脸伪造检测。利用MIM(masked image modeling)自监督方法预训练的ViT作为分支主干,并引入低秩适应(lowrank adaptation,LoRA)进行微调,以保留预训练模型的先验知识并提高在深度伪造检测任务中的适应能力;设计了一种跨域双向适配器BCA(bi-directional cross-modal adapter)和跨域交叉注意力适配器DCA(dual-modal crossattention adapter)用于对两条分支进行微调及信息互补。在双流网络尾部加入多层感知机适配器以完成分类。实验结果表明,在训练参数为3.75×10^(7)的情况下,该方法在六个主流数据集上的平均AUC达到了99.67%,在跨库泛化性实验中平均AUC达到了77.3%,在跨压缩率实验中平均AUC达到了89.5%。 展开更多
关键词 深度伪造检测 双流网络 高效参数微调 高频噪声 自监督预训练
在线阅读 下载PDF
基于迁移学习的变可信度气动力建模方法
18
作者 张俊杰 黄俊 +2 位作者 刘志勤 王庆凤 陈波 《实验流体力学》 北大核心 2025年第4期93-103,共11页
基于离散数据集建立气动模型是飞行器优化设计的重要环节,但建立完备的高精度数值模拟与风洞试验数据集周期长、成本高。为缩短研制周期、节约设计成本,本文基于有限数据集建立高精度的气动力模型,提出一种基于迁移学习的变可信度气动... 基于离散数据集建立气动模型是飞行器优化设计的重要环节,但建立完备的高精度数值模拟与风洞试验数据集周期长、成本高。为缩短研制周期、节约设计成本,本文基于有限数据集建立高精度的气动力模型,提出一种基于迁移学习的变可信度气动力建模方法。该方法结合气动数据融合理论与迁移学习方法,设计了基于长短期记忆(Long Short-Term Memory,LSTM)神经网络的回归网络结构,采用预训练微调的参数调优机制进行迁移训练,以获得高可信度气动力模型。首先,以NACA 2414翼型的XFLR软件计算数据(低精度)与风洞试验数据(高精度)为研究对象,利用小量高精度数据对基于大量低精度数据集训练的模型进行迁移学习,形成高保真气动力预测模型。然后,设计了使用1/2至1/10风洞数据量的建模实验,并与未迁移的LSTM神经网络模型和加法标度函数(Additive Scaling Function Based Multi-fidelity Surrogate,AS-MFS)模型进行对比讨论。实验结果表明:在所有数据量下本文提出的迁移学习模型均获得了更高预测精度,阻力和升阻比的预测精度比未迁移的LSTM神经网络模型平均提升了7.22%和8.85%,比AS-MFS模型平均提升了8.66%和4.36%。 展开更多
关键词 迁移学习 变可信度气动力建模 长短期记忆神经网络 预训练微调
在线阅读 下载PDF
Evaluating chat generative pretrained transformer in answering questions on endoscopic mucosal resection and endoscopic submucosal dissection 被引量:1
19
作者 Shi-Song Wang Hui Gao +3 位作者 Peng-Yao Lin Tian-Chen Qian Ying Du Lei Xu 《World Journal of Gastrointestinal Oncology》 2025年第10期290-303,共14页
BACKGROUND With the rising use of endoscopic submucosal dissection(ESD)and endoscopic mucosal resection(EMR),patients are increasingly questioning various aspects of these endoscopic procedures.At the same time,conver... BACKGROUND With the rising use of endoscopic submucosal dissection(ESD)and endoscopic mucosal resection(EMR),patients are increasingly questioning various aspects of these endoscopic procedures.At the same time,conversational artificial intelligence(AI)tools like chat generative pretrained transformer(ChatGPT)are rapidly emerging as sources of medical information.AIM To evaluate ChatGPT’s reliability and usefulness regarding ESD and EMR for patients and healthcare professionals.METHODS In this study,30 specific questions related to ESD and EMR were identified.Then,these questions were repeatedly entered into ChatGPT,with two independent answers generated for each question.A Likert scale was used to rate the accuracy,completeness,and comprehensibility of the responses.Meanwhile,a binary category(high/Low)was used to evaluate each aspect of the two responses generated by ChatGPT and the response retrieved from Google.RESULTS By analyzing the average scores of the three raters,our findings indicated that the responses generated by ChatGPT received high ratings for accuracy(mean score of 5.14 out of 6),completeness(mean score of 2.34 out of 3),and comprehensibility(mean score of 2.96 out of 3).Kendall’s coefficients of concordance indicated good agreement among raters(all P<0.05).For the responses generated by Google,more than half were classified by experts as having low accuracy and low completeness.CONCLUSION ChatGPT provided accurate and reliable answers in response to questions about ESD and EMR.Future studies should address ChatGPT’s current limitations by incorporating more detailed and up-to-date medical information.This could establish AI chatbots as significant resource for both patients and health care professionals. 展开更多
关键词 Endoscopic submucosal dissection Endoscopic mucosal dissection Artificial intelligence Chat generative pretrained transformer Patient education Google
暂未订购
基于提示词优化的AIGC辅助产品设计方法研究 被引量:1
20
作者 吴京 王沈策 牛虹苏 《包装工程》 北大核心 2025年第16期186-201,共16页
目的针对AIGC技术在产品设计中存在的需求形式化困难、方案质量不稳定及评估标准不完善等问题,探索构建面向产品的生成式人工智能(AIGC)辅助设计方法论。方法构建一种基于提示词优化的AIGC辅助产品设计(POA)框架,通过需求分析、概念生... 目的针对AIGC技术在产品设计中存在的需求形式化困难、方案质量不稳定及评估标准不完善等问题,探索构建面向产品的生成式人工智能(AIGC)辅助设计方法论。方法构建一种基于提示词优化的AIGC辅助产品设计(POA)框架,通过需求分析、概念生成和方案评价的协同迭代提升AIGC辅助设计的质量。首先,基于主成分分析(PCA)的多源数据分析实现设计需求形式化表达,提取外观特征、动力性能等关键主成分;其次,基于对比语言-图像预训练(CLIP)模型构建“基础描述+功能约束+风格定义”的分层提示词架构,通过定向优化与结构化重构提升生成质量;最后,运用改进的属性层次模型-逼近理想解排序法(AHM-TOPSIS)多准则决策方法,建立包含人机工程学、材料选用等多维度量化评估体系。结果以手持式旋耕机设计为例进行验证,结果表明相较于单纯AIGC方法,本文提出的POA方法在需求分析、概念方案生成和迭代优化等方面表现出显著改进且整体设计周期显著缩短,方案创新性和用户满意度均有所提升。结论所提出的基于提示词优化的AIGC辅助产品设计方法,通过需求结构化表达、方案优化及多准则决策,实现了AIGC技术在产品设计领域的标准化应用,为人工智能辅助设计提供新的理论框架与技术路径。 展开更多
关键词 生成式人工智能(AIGC) 提示词优化 CLIP对比语言-图像预训练模型 手持式旋耕机
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部