期刊文献+
共找到374篇文章
< 1 2 19 >
每页显示 20 50 100
PPO算法优化参数的微网接口变换器自抗扰控制
1
作者 周雪松 刘文进 +3 位作者 马幼捷 陶珑 问虎龙 丰美丽 《电力系统保护与控制》 北大核心 2025年第14期90-99,共10页
直流微电网作为新型电力系统的重要环节,因新能源的随机性和不确定性,直流微电网中负载端接口变换器的输出电压容易受到扰动影响,导致输出特性不佳。为有效消除在控制器参数保持恒定时不确定性特征对系统性能产生的不利影响,提出了一种... 直流微电网作为新型电力系统的重要环节,因新能源的随机性和不确定性,直流微电网中负载端接口变换器的输出电压容易受到扰动影响,导致输出特性不佳。为有效消除在控制器参数保持恒定时不确定性特征对系统性能产生的不利影响,提出了一种基于近端策略优化(proximalpolicyoptimization, PPO)算法的自抗扰控制方法。该方法利用PPO智能体与传统自抗扰控制系统环境进行交互,感知环境状态的变化,并依据奖励的反馈来优化控制策略。在训练过程中,智能体通过探索不同的控制动作,实现观测器参数的自适应调整,从而确保了变换器输出电压的稳定。最后,在数字仿真平台上,将PPO-LADRC与传统线性自抗扰控制(linear active disturbance rejection control, LADRC)、双闭环比例-积分控制方法进行了对比分析,验证了该控制策略可以显著提升系统在各种扰动下的动态性能。 展开更多
关键词 直流微电网 接口变换器 深度强化学习 自抗扰控制 自适应调整
在线阅读 下载PDF
弱电网下单相LCL并网逆变器改进电流控制策略 被引量:1
2
作者 李玉东 侯岩 +2 位作者 李佩峰 段乾超 王晓卫 《电气工程学报》 北大核心 2025年第1期119-130,共12页
针对弱电网下电网阻抗宽范围变化降低并网逆变器系统稳定性、电网背景谐波导致并网电流波形畸变以及电压前馈自校正滤波产生正向谐振尖峰的问题,提出一种电压前馈自校正滤波结合逆变器系统并联自适应虚拟阻抗的控制策略。首先建立单相LC... 针对弱电网下电网阻抗宽范围变化降低并网逆变器系统稳定性、电网背景谐波导致并网电流波形畸变以及电压前馈自校正滤波产生正向谐振尖峰的问题,提出一种电压前馈自校正滤波结合逆变器系统并联自适应虚拟阻抗的控制策略。首先建立单相LCL型并网逆变器模型,分析电网阻抗对逆变器系统的影响,通过电压前馈自校正滤波提升逆变器系统的相位裕度,然后采用逆变器并联自适应虚拟阻抗的控制策略,削弱电压前馈自校正滤波产生的正向谐振尖峰,进一步提升逆变器系统的相位裕度,保证逆变器系统具有较好的动稳态性能,降低电网背景谐波对并网电流的影响,提升逆变器系统对弱电网的适应性。最后在Matlab/Simulink中建立仿真模型并搭建DSP电能变换试验平台,验证所提控制策略的有效性与实用性。 展开更多
关键词 弱电网 电网阻抗 电网背景谐波 自校正滤波 自适应虚拟阻抗 系统相位裕度
在线阅读 下载PDF
基于增强检索生成框架的食品安全监管智能问答系统
3
作者 毛典辉 王可浩 +1 位作者 陈俊华 徐静婷 《食品科学》 北大核心 2025年第22期13-22,共10页
为满足食品安全监管问答任务对模型准确性、合规性和可解释性的高要求,解决现有大语言模型(large language model,LLM)在该领域应用面临的知识召回不精准、法规解析能力不足及计算成本高等问题,本研究基于检索增强生成框架提出了一个智... 为满足食品安全监管问答任务对模型准确性、合规性和可解释性的高要求,解决现有大语言模型(large language model,LLM)在该领域应用面临的知识召回不精准、法规解析能力不足及计算成本高等问题,本研究基于检索增强生成框架提出了一个智能问答系统,其核心是食品安全监管大语言模型(food safety regulation large language model,FSR-LLM)。通过优化数据库存储结构、检索策略及生成器,提升食品安全监管问答的质量和效率。首先构建了食品安全知识图谱(knowledge graph,KG)数据库,以结构化方式存储法规条款、食品安全标准等数据,增强模型对食品领域知识的组织与调用能力。此外,在检索阶段,设计一种大模型引导检索策略,利用LLM智能解析查询语句,在食品安全监管KG中准确地提取高度相关的信息,从而减少无关或误导性内容的召回。对于生成器(Generator)模块,基于Qwen-7B-Chat模型采用低秩适应微调,使模型更贴合食品安全监管问答的需求,同时显著降低计算成本,使其能够在单张RTX 4090 GPU上完成训练。在所提食品安全问答数据集上的实验结果表明,FSR-LLM在BLEU-4、Rouge-L和准确率指标上均优于基线模型,展现出更高的精准度和语义连贯性,为食品安全监管智能化提供了一种低成本、高效能、可扩展的解决方案。 展开更多
关键词 食品安全监管 检索增强生成 知识图谱 低秩适应 微调
在线阅读 下载PDF
基于大语言模型的自动答题方法研究
4
作者 孙承杰 谢沛峰 +1 位作者 单丽莉 刘秉权 《软件导刊》 2025年第11期9-14,共6页
作为最前沿的人工智能技术,大语言模型具有卓越的自然语言理解与生成能力,在教育领域有着巨大的应用潜力。但是大语言模型在高等教育计算机学科中的应用模式还有待深入探索。基于国产大语言模型ChatGLM3-6B,提出一种结合高效微调技术和... 作为最前沿的人工智能技术,大语言模型具有卓越的自然语言理解与生成能力,在教育领域有着巨大的应用潜力。但是大语言模型在高等教育计算机学科中的应用模式还有待深入探索。基于国产大语言模型ChatGLM3-6B,提出一种结合高效微调技术和检索增强生成技术的自动答题方法。在构建的操作系统课程数据集上,该方法可以达到54%的正确率,相比直接使用ChatGLM3-6B模型提升了12%,从而展示了大语言模型在课程自动答疑中的应用潜力。 展开更多
关键词 大语言模型 自动答题 低秩自适应微调 检索增强生成 多重查询检索
在线阅读 下载PDF
基于图像内容理解的判别性类别提示学习 被引量:1
5
作者 王楠井 刘阿建 +4 位作者 梁凤梅 张小梅 万军 谢珺 雷震 《电子学报》 北大核心 2025年第2期493-502,共10页
近年来,通过图像与文本的联合表示,基于对比语言-图像预训练(Contrastive Language-Image Pre-training,CLIP)的方法将文本信息作为分类器的权值,在通用图像识别任务中展现出卓越性能.但是现有方法仅单独构建类别文本提示,比如上下文优... 近年来,通过图像与文本的联合表示,基于对比语言-图像预训练(Contrastive Language-Image Pre-training,CLIP)的方法将文本信息作为分类器的权值,在通用图像识别任务中展现出卓越性能.但是现有方法仅单独构建类别文本提示,比如上下文优化(Context Optimization,CoOp)和条件上下文优化(Conditional Context Optimization,CoCoOp)等,没有考虑图像的内容语义信息与类别的重要性,限制了模型对图像类别的理解与判别.为了解决上述问题,本文在CLIP的基础上提出了一种新方法:基于图像内容理解的判别性类别提示学习(Discriminative Category Prompt Learning based on image content understanding,DCPL),借助图像中丰富的内容特征来学习文本提示,提高文本提示对类别的判别性.具体来说,DCPL包含提示生成(Prompt Generation,PG)模块和文本监督(Text Supervision,TS)模块.PG模块将图像特征和初始化的查询向量作为输入,通过自注意力机制和交叉注意力机制使输出的文本提示中包含充分的图像语义信息;TS模块将固定的类别提示模板作为监督,为可学习文本提示在类别层面和logits层面注入类别信息,增强了类别的重要性.最后,DCPL在ImageNet、Caltech101和Oxford-Pets等11个公开分类数据集上的16-shots平均准确率达到了81.84%,较以往最优方法Cross-Modal的平均准确率提升了0.98个百分点. 展开更多
关键词 视觉-语言模型 图像识别 提示调优 注意力机制 文本监督(TS) 适配器微调 TRANSFORMER
在线阅读 下载PDF
面向CNN和Transformer的自注意力机制自适应性提示学习 被引量:1
6
作者 杨鹏跃 王锋 魏巍 《小型微型计算机系统》 北大核心 2025年第1期16-22,共7页
随着大规模预训练模型对视觉领域中的一般性数据的深入研究,当将其应用于特定下游任务时,若模型只训练分类头方法则极其依赖于预训练模型且效果一般;而全面微调预训练模型也因模型参数过大而变得不切实际;另外如VPT等视觉提示学习方法... 随着大规模预训练模型对视觉领域中的一般性数据的深入研究,当将其应用于特定下游任务时,若模型只训练分类头方法则极其依赖于预训练模型且效果一般;而全面微调预训练模型也因模型参数过大而变得不切实际;另外如VPT等视觉提示学习方法在图像数据集具有很大的数据多样性时,每个数据集的通用提示在向原始预训练数据分布转变时会带来极大的挑战.基于以上的种种挑战,本文提出一种新的提示学习方法,即在输入空间中添加特定任务的自注意力机制提示块,并在增强通道间的竞争条件下,引入极小的参数量进行预训练模型的自适应性调整,最终实现将视觉领域中具有一般性的特征信息应用于特定的视觉任务.实验以CNN和Transformer代表性的网络为基础模型并选取CIFAR、Tiny ImageNet等数据集,结果表明本文提出的方法相比常见的微调方法在平均准确率上提高了0.55%、1.86%. 展开更多
关键词 模型的微调 数据多样性 提示学习 自注意力机制提示块 自适应性调整
在线阅读 下载PDF
基于大语言模型的中文实体链接实证研究 被引量:3
7
作者 徐正斐 辛欣 《自动化学报》 北大核心 2025年第2期327-342,共16页
近年来,大语言模型(Large language model,LLM)在自然语言处理中取得重大进展.在模型足够大时,大语言模型涌现出传统的预训练语言模型(Pre-trained language model,PLM)不具备的推理能力.为了探究如何将大语言模型的涌现能力应用于中文... 近年来,大语言模型(Large language model,LLM)在自然语言处理中取得重大进展.在模型足够大时,大语言模型涌现出传统的预训练语言模型(Pre-trained language model,PLM)不具备的推理能力.为了探究如何将大语言模型的涌现能力应用于中文实体链接任务,适配了以下四种方法:知识增强、适配器微调、提示学习和语境学习(In-context learning,ICL).在Hansel和CLEEK数据集上的实证研究表明,基于Qwen-7B/ChatGLM3-6B的监督学习方法超过基于小模型的方法,在Hansel-FS数据集上提升3.9%~11.8%,在Hansel-ZS数据集上提升0.7%~4.1%,在CLEEK数据集上提升0.6%~3.7%.而当模型参数量达到720亿时,Qwen-72B的无监督方法实现与监督微调Qwen-7B相近的结果(-2.4%~+1.4%).此外,大语言模型Qwen在长尾实体场景下有明显的优势(11.8%),且随着参数量的增加,优势会更加明显(13.2%).对错误案例进行分析(以下简称错误分析)发现,实体粒度和实体类别相关错误占比较高,分别为36%和25%.这表明在实体链接任务中,准确划分实体边界以及正确判断实体类别是提高系统性能的关键. 展开更多
关键词 实体链接 大语言模型 知识增强 适配器微调 提示学习 语境学习
在线阅读 下载PDF
基于知识提示微调的标书信息抽取方法 被引量:2
8
作者 孙熠衡 刘茂福 《计算机应用》 北大核心 2025年第4期1169-1176,共8页
当前信息抽取任务主要依赖大语言模型(LLM),而标书信息中广泛存在领域术语,模型缺乏相关先验知识,导致微调效率低且抽取性能不佳。此外,模型的抽取和泛化性能在很大程度上依赖于提示信息的质量和提示模板的构建方式。针对上述问题,提出... 当前信息抽取任务主要依赖大语言模型(LLM),而标书信息中广泛存在领域术语,模型缺乏相关先验知识,导致微调效率低且抽取性能不佳。此外,模型的抽取和泛化性能在很大程度上依赖于提示信息的质量和提示模板的构建方式。针对上述问题,提出一种基于提示学习的标书信息抽取方法(TIEPL)。首先,利用生成式信息抽取的提示学习方法对LLM注入领域知识,以实现预训练和微调阶段的统一优化;其次,以LoRA(Low-Rank Adaption)微调方法为框架,单独设计提示训练旁路,并设计标书场景关键词提示模板,从而增强模型信息抽取与提示的双向关联。在自建的招中标数据集上的实验结果表明,相较于次优的UIE(Universal Information Extraction)方法,TIEPL的ROUGE-L(Recall-Oriented Understudy for Gisting Evaluation)和BLEU-4(BiLingual Evaluation Understudy)分别提高1.05和4.71个百分点,能更准确和完整地生成抽取结果,验证了所提方法在提高标书信息抽取准确性和泛化性方面的有效性。 展开更多
关键词 生成式信息抽取 大语言模型 提示学习 LoRA微调 标书
在线阅读 下载PDF
基于LoRA微调与RAG融合的煤矿专业大模型应用关键技术 被引量:2
9
作者 秦一凡 付翔 +2 位作者 张智星 贾一帆 孙岩 《工矿自动化》 北大核心 2025年第8期34-42,50,共10页
目前煤矿行业大模型仅对用户的提问进行知识问答,未与现场实时数据相关联,无法对煤矿生产运行状况进行实时分析与指导。针对这些问题,提出一种基于大语言模型的低阶适应(LoRA)微调和检索增强生成(RAG)融合的煤矿专业大模型。该模型先运... 目前煤矿行业大模型仅对用户的提问进行知识问答,未与现场实时数据相关联,无法对煤矿生产运行状况进行实时分析与指导。针对这些问题,提出一种基于大语言模型的低阶适应(LoRA)微调和检索增强生成(RAG)融合的煤矿专业大模型。该模型先运用LoRA技术从历史文本语料中抽取出知识实体并定义知识结构输入大模型进行微调,使大模型能够深入理解领域知识,再将实时产生的生产数据、实时更新的作业规程、法规条例等数据经过向量化清洗输入向量数据库,并与RAG的检索机制相结合,确保数据信息的实时性和准确性。实验结果表明:①经LoRA微调后,模型回答可以精准契合某煤矿“一通三防”管理制度汇编,不仅详细阐述了控制瓦斯排放的增阻限风、分风限风、逐段排放等具体方法,还对排放时间计算、传感器设置、图纸绘制及断电撤人等操作细则进行说明,实现了从泛泛而谈到精准定位具体煤矿特定文件内容的跨越。②选取现场143万条液压支架时序数据,分别存入Milvus向量数据库与MySQL关系型数据库,从写入效率与查询性能2个维度进行对比,结果表明:Milvus向量数据库写入速度为MySQL关系型数据库的2.4倍;在向量检索场景方面,Milvus的向量相似度检索延迟稳定在20 ms,在混合查询场景效率方面,MySQL需全表扫描后排序,143万条数据延迟超100 ms,而Milvus将设备ID过滤后的子集输入分层可导航小世界图(HNSW)层,仅读取查询涉及的向量字段,避免了全表扫描。③将本地基于LoRA微调与RAG融合的煤矿专业大模型与本地离线deepseekR1−7b模型进行部署,对多项指标进行测试,结果表明:基于LoRA微调与RAG融合的煤矿专业大模型在煤矿专业领域知识学习性、知识动态化更新时效性、模型泛化与回答精确度方面具有显著优势,为工业级AI落地提供了可行路径。 展开更多
关键词 人工智能 煤矿专业大模型 大语言模型的低阶适应微调 检索增强生成 分层可导航小世界图 LoRA微调 RAG HNSW
在线阅读 下载PDF
一种频率可重构小型化超短波全向天线
10
作者 高雷 李磊 +3 位作者 张辉 张延冬 张培真 徐良 《电波科学学报》 北大核心 2025年第4期784-788,共5页
针对超短波通信设备小型化的发展趋势,设计了一种基于频率可重构技术的小型化超短波全向天线。采用单极天线形式,通过加载电感线圈,控制高频电流分布,从而改善天线的高频辐射性能。同时,创新性地引入可重构控制电路及LC宽带匹配网络,利... 针对超短波通信设备小型化的发展趋势,设计了一种基于频率可重构技术的小型化超短波全向天线。采用单极天线形式,通过加载电感线圈,控制高频电流分布,从而改善天线的高频辐射性能。同时,创新性地引入可重构控制电路及LC宽带匹配网络,利用射频开关进行快速切换,实现了30~512 MHz频段内良好的阻抗调谐匹配,天线高度仅为0.6 m,辐射性能明显优于传统1.3 m宽带天线。该天线和超短波电台联调使用,可实现跳扩频通信,具有小型化、高增益、自适应调谐等优势,为下一代宽频段软件无线便携电台配套天线的设计提供了一种全新的设计思路。 展开更多
关键词 频率可重构 超短波天线 小型化 宽带匹配网络 自适应调谐
在线阅读 下载PDF
输入感知的通用矩阵-向量乘算法在Hygon DCU的自适应性能优化
11
作者 李庆 贾海鹏 +1 位作者 张云泉 张思佳 《计算机科学》 北大核心 2025年第4期291-300,共10页
GEMV(通用矩阵-向量乘法函数)是BLAS(基础线性代数子程序)算法库的核心组成部分,广泛用于计算机科学、工程计算和数学计算等领域。当前,随着国产Hygon DCU版本的不断迭代升级,Hygon DCU与传统GPU生产商之间也存在一定的竞争优势;随着GEM... GEMV(通用矩阵-向量乘法函数)是BLAS(基础线性代数子程序)算法库的核心组成部分,广泛用于计算机科学、工程计算和数学计算等领域。当前,随着国产Hygon DCU版本的不断迭代升级,Hygon DCU与传统GPU生产商之间也存在一定的竞争优势;随着GEMV应用领域的不断扩大,GEMV的输入特征体现出多样化的趋势。在这种背景下,单纯靠一种优化方法,无法实现GEMV算法在GPU计算平台上所有输入情况下的高性能。因此,在访存优化、指令重排、并行规约、共享内存、线程排布等传统优化手段的基础上,提出了一种输入感知的性能自适应优化方法,其能够根据输入矩阵的不同规模和形状自动调整计算kernel的实现方式以达到最佳性能,显著提高了GEMV在Hygon DCU上的性能。实验结果表明,在Hygon DCU Z100SM上,输入感知的通用矩阵-向量乘算法的整体性能明显优于RocBLAS库中的相关算法,对于不同的矩阵输入规模,性能最大提升为RocBLAS库中对应算法的3.0203倍。 展开更多
关键词 通用矩阵-向量乘法 DCU 基础线性代数子程序函数库 自适应调优 性能优化
在线阅读 下载PDF
大语言模型微调方法研究综述 被引量:7
12
作者 吴春志 赵玉龙 +3 位作者 刘鑫 司念文 张鲁飞 范昊 《中文信息学报》 北大核心 2025年第2期1-26,共26页
近年来,大语言模型成为人工智能领域非常受关注的技术,引发了自然语言处理领域新的研究范式。在大语言模型训练实践中,参数微调是其中非常重要的一个环节,它允许用户在资源受限条件下,通过调整少部分参数来提升模型理解用户指令、解决... 近年来,大语言模型成为人工智能领域非常受关注的技术,引发了自然语言处理领域新的研究范式。在大语言模型训练实践中,参数微调是其中非常重要的一个环节,它允许用户在资源受限条件下,通过调整少部分参数来提升模型理解用户指令、解决下游任务的能力。该文全面回顾了2019—2024年间50余种主要的大语言模型微调方法,从全新的角度进行了系统性的整理和概括,分为全参数微调、部分参数微调、新增参数微调和无参数微调方法,对每种方法的原理、微调位置及方法特点作了总结归纳和比较;接着,从计算的视角出发,着重分析比较了各类方法的参数量、内存消耗和计算量;最后,基于该文的微调方法调研及相关的参数微调实践,对大语言模型微调策略给出建议,以促进该领域的发展。 展开更多
关键词 人工智能 大语言模型 微调 ADAPTER LoRA
在线阅读 下载PDF
一种结合自监督预训练与多种注意力适配器微调的伪造语音检测方法
13
作者 曾高俊 任英杰 +3 位作者 芦天亮 陈卓鹏 张溢文 黄万鑫 《小型微型计算机系统》 北大核心 2025年第12期2832-2839,共8页
语音自监督预训练模型可以从大量未标记数据中获取语音任务通用特征表示,从而解决伪造语音检测算法泛化性不高的问题,但全参数微调预训练模型存在参数效率低、训练开销大的问题.因此,本文提出了一种结合自监督预训练模型与多种注意力适... 语音自监督预训练模型可以从大量未标记数据中获取语音任务通用特征表示,从而解决伪造语音检测算法泛化性不高的问题,但全参数微调预训练模型存在参数效率低、训练开销大的问题.因此,本文提出了一种结合自监督预训练模型与多种注意力适配器微调的伪造语音检测方法,以自适应低秩微调方法为基础,设计并引入了基于空间注意力的并行卷积适配器与基于隐藏维度注意力的串行前馈适配器,通过插入这两种轻量级适配器模块来减少微调可训练参数和降低训练开销.同时,这两种适配器可以通过弥补模型在空间位置与隐藏维度关系方面捕捉能力的不足,从而提高模型的检测性能与泛化能力.基于ASVspoof2019 LA、PA数据集的实验证明了所提检测方法的有效性,在LA数据集上将竞赛基线模型的等错误率指标降低了98%,在PA数据集上将竞赛基线模型的等错误率指标降低了91.6%.基于多个数据集的跨数据集测试实验进一步验证了所提检测方法的良好泛化性能. 展开更多
关键词 伪造语音检测 适配器微调 自监督预训练模型 注意力机制
在线阅读 下载PDF
基于奇异值分解的适应微调
14
作者 林志鹏 郭峥嵘 +1 位作者 张伟志 郭躬德 《计算机系统应用》 2025年第1期276-284,共9页
大语言模型的兴起对自然语言处理领域产生了深远影响.随着计算资源的增长和模型规模的扩大,大语言模型在自然语言处理中的应用潜力日益显现.然而,广泛使用的低秩适应微调方法在面对模型规模增大时,遇到了微调效率和存储成本等方面的挑战... 大语言模型的兴起对自然语言处理领域产生了深远影响.随着计算资源的增长和模型规模的扩大,大语言模型在自然语言处理中的应用潜力日益显现.然而,广泛使用的低秩适应微调方法在面对模型规模增大时,遇到了微调效率和存储成本等方面的挑战.为了解决这一问题,本文提出了一种基于奇异值分解的适应微调方法.该方法只需将奇异值分解得到的对角矩阵和缩放向量作为可训练参数,从而在降低训练成本的同时,实现了在多个自然语言处理任务上的性能提升.实验结果显示,基于奇异值分解的适应微调方法在GLUE和E2E基准测试中的性能超越了同等数量级的方法.通过与常用的参数高效微调方法进行比较,发现基于奇异值分解的适应微调方法在减少可训练参数数量和提高微调效率方面具有显著优势,并在可训练参数微调效率实验中实现了最高的性能增益.在未来的研究中,将专注于进一步优化基于奇异值分解的适应微调方法,在更广泛的任务和更大规模的模型中实现更高效的微调. 展开更多
关键词 参数高效微调 生成式大模型 深度学习 领域适配 有限算力
在线阅读 下载PDF
面向函数图像数据的多模态大模型训练策略 被引量:1
15
作者 明一博 陈彦敏 赵嘉璐 《计算机应用研究》 北大核心 2025年第11期3421-3429,共9页
近年来,多模态大语言模型经历了快速发展,并在各种多模态下游任务中展现了卓越的性能。然而,当前主流的多模态大语言模型在函数图像推理任务中的表现仍不尽如人意,这要求模型不仅具备强大的视觉感知能力,还需进行链式思维推理,以准确理... 近年来,多模态大语言模型经历了快速发展,并在各种多模态下游任务中展现了卓越的性能。然而,当前主流的多模态大语言模型在函数图像推理任务中的表现仍不尽如人意,这要求模型不仅具备强大的视觉感知能力,还需进行链式思维推理,以准确理解和解答涉及数学函数的问题。为了解决这些问题,首先构建了一个专门针对函数图像推理任务的指令微调数据集FunctionQA。每条数据除标准问答对外,还包含详细的链式推理过程,确保模型在训练过程中能够学习到复杂的推理步骤。其次,针对函数图像推理任务,设计了一种四阶段微调策略,逐步优化视觉编码器、多模态适配器和大语言模型,并结合LoRA技术以降低训练成本。实验结果表明,基于LLaVA框架构建的mFunction-4B模型,经FunctionQA数据集与四阶段微调策略的优化后,以4B参数量在MathVista testmini FunctionQA子集上达到43.55%的准确率,较基线模型LLaVA-1.5-7B提升14.52%,验证了其方法的可行性和有效性。 展开更多
关键词 多模态大语言模型 链式思维推理 指令微调 LoRA
在线阅读 下载PDF
基于共享提示与Mamba适配器的遥感图像文本检索方法
16
作者 杜文亮 许晓宇 +2 位作者 赵佳琦 刘兵 周勇 《电子学报》 北大核心 2025年第9期3358-3370,共13页
遥感图像文本检索旨在根据给定的图像或文本,从海量遥感图像文本数据库中快速、准确地检索出与之语义匹配的文本或图像.随着对地观测技术的飞速发展,该技术在城市规划、灾害应急响应、环境监测等领域的应用价值日益凸显,已成为当前多模... 遥感图像文本检索旨在根据给定的图像或文本,从海量遥感图像文本数据库中快速、准确地检索出与之语义匹配的文本或图像.随着对地观测技术的飞速发展,该技术在城市规划、灾害应急响应、环境监测等领域的应用价值日益凸显,已成为当前多模态信息处理领域的研究热点.基于通用数据预训练的视觉语言预训练模型,通过实现图像与文本之间的高效语义对齐,为通用图像文本检索任务奠定了技术基础.然而,通用数据与遥感数据之间存在显著的领域鸿沟,导致基于通用数据预训练的视觉语言预训练模型在直接应用于遥感任务时性能受限.因此,需要通过微调使该视觉语言模型适应遥感领域独特的数据分布.然而,现有微调方法应用到遥感领域时面临着两大核心挑战.其一,跨模态对齐不足:现有微调方法缺乏显式的跨模态信息交互机制,难以充分建模图文之间的内在关联;其二,细粒度语义表征困难:现有方法往往难以捕捉遥感图像中目标尺度差异悬殊、地物类别间相似度高、空间拓扑关系复杂等精细化的语义信息.尤其在处理小目标或由相似地物引发的语义混淆问题时性能受限,显著降低了检索准确性.本文针对遥感图像文本检索任务中跨模态对齐不足与细粒度语义表征困难的问题,提出基于共享提示与Mamba适配器的微调方法.该方法首先通过设计跨模态共享提示生成模块,建立图像与文本特征的显式交互机制;然后构建面向遥感场景的图像与文本的双分支Mamba适配器微调模块,分别实现图像与文本特征的细粒度表征;最后,采用对比损失与隶属损失,缓解由遥感图像小目标或相似地物引起的语义混淆问题.实验结果表明,本方法在遥感图像描述数据集(Remote Sensing Image Captioning Dataset,RSICD)和遥感图像文本匹配数据集(Remote Sensing Image-Text Match Dataset,RSITMD)数据集上平均召回率分别达到37.3%和48.05%,相较于当前最优的适配器微调方法分别提升3.68%和1.52%.此外,消融实验验证了共享提示生成模块与Mamba适配器的有效性. 展开更多
关键词 图像文本检索 遥感图像 Mamba适配器 视觉语言模型微调
在线阅读 下载PDF
基于工业大模型的新能源装备健康状态估计方法
17
作者 董芯燚 张泽辉 +5 位作者 左彬 刘洲 徐晓滨 郑梁 侯平智 管聪 《中国舰船研究》 北大核心 2025年第6期126-134,共9页
[目的]针对当前舰船新能源装备健康状态(SOH)估计方法在跨设备泛化能力和模型适配复杂度方面的局限性,提出一种基于工业大模型的新能源装备健康状态估计方法,旨在通过统一框架和参数高效微调策略,快速构建专用估计模型,实现高精度的健... [目的]针对当前舰船新能源装备健康状态(SOH)估计方法在跨设备泛化能力和模型适配复杂度方面的局限性,提出一种基于工业大模型的新能源装备健康状态估计方法,旨在通过统一框架和参数高效微调策略,快速构建专用估计模型,实现高精度的健康状态估计。[方法]基于预训练的Transformer架构构建工业大模型,结合注意力机制和低秩参数微调技术(LoRA),动态调整关键参数以满足不同任务需求。该方法通过滑动窗口注意力机制捕捉局部动态特性,条件化注意力机制融合环境条件影响,并利用LoRA模块快速适配新设备任务。[结果]在锂电池(LIB)和燃料电池(FC)两类典型新能源装备中进行验证实验,结果表明,该方法在锂电池数据集中的平均绝对误差不超过0.0216,决定系数不低于0.9713;在燃料电池数据集中的平均绝对误差不超过0.0033,决定系数不低于0.9197。该工业大模型展现出优异的估计精度和泛化能力。[结论]基于工业大模型的方法能有效提升新能源装备健康状态估计的准确性和可靠性,为设备健康管理提供新的技术手段。未来可在模型优化、跨设备适配和数据处理等方面进一步提升模型性能。 展开更多
关键词 锂电池 燃料电池 设备健康监测 状态估计 工业大模型 深度学习 低秩适配 参数微调 泛化能力 大语言模型
在线阅读 下载PDF
轻量级微调SAM的结肠息肉分割方法SAMCP
18
作者 刘娜 封筠 +2 位作者 霍一儒 王弘扬 杨柳 《计算机应用》 北大核心 2025年第10期3390-3398,共9页
在胃肠道内窥镜图像处理中,精准分割结肠息肉具有重要的临床意义。传统分割方法常因细节捕捉不足和对大规模数据的依赖,在应对复杂形态的息肉时表现不佳。尽管分割一切模型(SAM)在自然图像分割中取得显著进展,但由于自然图像与医学图像... 在胃肠道内窥镜图像处理中,精准分割结肠息肉具有重要的临床意义。传统分割方法常因细节捕捉不足和对大规模数据的依赖,在应对复杂形态的息肉时表现不佳。尽管分割一切模型(SAM)在自然图像分割中取得显著进展,但由于自然图像与医学图像存在域差异,现有的SAM方法在结肠息肉分割任务上仍难以取得理想效果。为解决这一问题,基于SAM架构提出一种轻量级微调结肠息肉分割方法(SAMCP)。该方法引入精简适配器模块,重点关注通道维度信息,采用Dice和交并比(IoU)简化联合损失函数,并在训练时冻结原始图像编码器和提示编码器的参数,以低训练成本提升结肠息肉分割性能。在3个公开数据集上与9种先进方法的对比实验结果表明,相较于SAM方法,SAMCP在Kvasir-SEG数据集上的Dice和IoU值分别提高了56.7%和84.5%,在CVC-ClinicDB数据集上的Dice和IoU值分别提高了46.0%和86.0%,在CVC-ColonDB数据集上的Dice和IoU值分别提高了95.3%和122.2%,超过目前SAM-based类方法的最佳性能。在引入点提示的情况下,即使只使用1次点击,SAMCP仍能优于其他SAM-based方法。以上验证了SAMCP在处理复杂形状和局部细节时表现出色,可为医生提供更精确的分割指导。 展开更多
关键词 结肠息肉分割 分割一切模型 适配器 损失函数 轻量级微调
在线阅读 下载PDF
基于稳定扩散与自适应增强技术的服装模特图像生成方法
19
作者 刘大伟 于碧辉 +4 位作者 石珈维 魏靖烜 史慧洋 靳赫烜 孙林壮 《计算机应用研究》 北大核心 2025年第8期2267-2273,共7页
随着计算机视觉和生成模型的发展,图像生成技术取得了显著突破,已广泛应用在电子商务的产品展示中以增强用户交互体验。逼真服装模特生成是图像生成技术与电子商务业务深度融合的创新应用技术之一。然而,服装模特生成技术在电商应用中... 随着计算机视觉和生成模型的发展,图像生成技术取得了显著突破,已广泛应用在电子商务的产品展示中以增强用户交互体验。逼真服装模特生成是图像生成技术与电子商务业务深度融合的创新应用技术之一。然而,服装模特生成技术在电商应用中仍面临着诸多挑战,尤其在生成高质量、真实感的服装图像方面,难以精确呈现服装的事实一致性、纹理和细节,相比于真实图像的自然度和一致性较差。为了提升服装模特生成技术在电商应用中的效果,提出了一种改进的稳定扩散生成模型LoRA-DAE。通过低秩分解优化跨注意力层和卷积层的权重调整机制,并在生成过程的方向扩散步骤中添加自适应增强模块;采用细粒度的纹理增强策略,动态调整生成过程中的纹理与细节分布,解决了当前主流服装模特图像生成模型的纹理模糊和边缘失真等问题,提升了服装图像的细节表达能力和整体真实感。实验结果表明,LoRA-DAE在Fashion Mannequin数据集上取得了优于主流方法的性能表现,生成的模特图像在感知质量(用户评价)、定量指标(FID、IS、PSNR、SSIM值)和多模态大模型VQA评估上均具有显著提升。 展开更多
关键词 稳定扩散 图像生成 自适应增强 模型微调 多模态评估
在线阅读 下载PDF
液体天线智能化控制算法研究
20
作者 黄杰 胡玥 +2 位作者 蔡强明 陈琦 聂诗良 《现代电子技术》 北大核心 2025年第5期21-29,共9页
针对应急状态下需要快速恢复通信能力的需求,文中设计了一种可重构液体天线模型,并以此为基础对液体天线的设计方法和智能化控制算法进行深入研究。首先利用神经网络算法建立液体天线电磁性能参数与物理参数之间的映射关系,预测在设计... 针对应急状态下需要快速恢复通信能力的需求,文中设计了一种可重构液体天线模型,并以此为基础对液体天线的设计方法和智能化控制算法进行深入研究。首先利用神经网络算法建立液体天线电磁性能参数与物理参数之间的映射关系,预测在设计性能指标下液体天线应具有的液体温度、高度、横截面半径、电导率,以此为可重构物理参数设计仿真控制系统。通过分析系统的运行特点,说明了引入PID算法进行控制的可行性。引入粒子群算法整定PID参数。针对传统粒子群算法的不足,提出LAIPSO算法,该算法在传统粒子群算法的基础上融合ICMIC混沌映射并引入莱维飞行策略,实现了自动更新惯性权重和学习率的自适应。通过选取6个测试函数对LAIPSO算法进行对比实验,说明了此算法在解决单峰与多峰问题的优越性。最后以预测液体天线的物理参数为控制目标进行对比实验,证明了LAIPSO算法对PID参数具有好的整定效果。 展开更多
关键词 液体天线 天线设计 神经网络 改进粒子群算法 PID参数整定 自适应 混沌映射 莱维飞行
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部