期刊文献+
共找到380篇文章
< 1 2 19 >
每页显示 20 50 100
基于大语言模型的钓鱼邮件检测技术研究
1
作者 袁斌 杨克涵 +2 位作者 邹德清 刘勇 张乾坤 《信息安全研究》 北大核心 2026年第2期151-163,共13页
随着钓鱼邮件数量的迅速增加以及对抗技术的不断演进,传统的钓鱼邮件检测方法在效率和准确性方面面临严峻挑战.为此,提出了一种基于大语言模型(large language model,LLM)的钓鱼邮件检测方法,以解决现有系统检测率低、漏报率高及人机交... 随着钓鱼邮件数量的迅速增加以及对抗技术的不断演进,传统的钓鱼邮件检测方法在效率和准确性方面面临严峻挑战.为此,提出了一种基于大语言模型(large language model,LLM)的钓鱼邮件检测方法,以解决现有系统检测率低、漏报率高及人机交互性差等问题.通过全面分析钓鱼邮件的关键特征,包括邮件头部字段、正文内容、URL、二维码、附件及HTML页面,利用特征插入算法构建高质量的训练数据集.基于预训练语言模型LLaMA和低秩自适应微调技术(low-rank adaptation,LoRA),在仅更新0.72%模型参数(约50 MB)条件下实现领域知识迁移,获得钓鱼邮件检测大模型.实验结果显示,与传统方法相比,基于大语言模型的检测方法显著提升了检测的准确性与鲁棒性,整体准确率达到94.5%,有效降低了误报率,增强了钓鱼邮件特征的分类与解释能力,提供了更具实用性和可靠性的钓鱼邮件检测方案. 展开更多
关键词 钓鱼邮件 大语言模型 预训练语言模型 低秩自适应 微调
在线阅读 下载PDF
计算机网络TCP拥塞控制算法的实现与调优
2
作者 张媛 《计算机应用文摘》 2026年第3期182-184,共3页
随着网络带宽和应用场景日益复杂,传统TCP拥塞控制算法在高带宽延迟积(BDP)和动态网络环境中面临显著性能瓶颈。文章提出一种基于网络状态感知的参数动态优化方法,并结合强化学习驱动的自适应调优机制对传统算法进行改进。实验结果表明... 随着网络带宽和应用场景日益复杂,传统TCP拥塞控制算法在高带宽延迟积(BDP)和动态网络环境中面临显著性能瓶颈。文章提出一种基于网络状态感知的参数动态优化方法,并结合强化学习驱动的自适应调优机制对传统算法进行改进。实验结果表明,优化后的算法在高带宽环境下吞吐量提升12.7%,在高延迟场景下延迟降低25%,且在面对丢包率波动时表现出更强的鲁棒性。研究表明,该优化方案为TCP拥塞控制在复杂网络环境中的应用提供了有效的改进路径。 展开更多
关键词 TCP拥塞控制 算法实现 参数优化 自适应调优 网络仿真
在线阅读 下载PDF
一种烟气脱硝系统的控制与整定方法研究
3
作者 朱宏燃 林硕 +3 位作者 韩忠华 臧春华 苏宝玉 李振杰 《化工自动化及仪表》 2026年第2期195-202,共8页
烟气脱硝系统是锅炉等设备控制氮氧化物排放的关键技术,但由于烟气参数随工况波动大、脱硝反应存在滞后等问题,在常规控制方法中极易出现因喷氨量不精确而导致脱硝效率不足、氨逃逸超标等问题。因此提出一种基于化学反应机理与PI串级控... 烟气脱硝系统是锅炉等设备控制氮氧化物排放的关键技术,但由于烟气参数随工况波动大、脱硝反应存在滞后等问题,在常规控制方法中极易出现因喷氨量不精确而导致脱硝效率不足、氨逃逸超标等问题。因此提出一种基于化学反应机理与PI串级控制器相结合的喷氨控制方法,实现精准喷氨与稳定排放。同时通过改进的IMC-PID整定方法,可根据系统误差的大小,自适应调整控制器的比例系数,有效提高系统的响应速度和鲁棒性。结合仿真实验与现场数据验证,该方法可为烟气脱硝系统的稳定排放提供技术支撑。 展开更多
关键词 烟气脱硝系统 PI串级控制器 化学反应机理 内模整定 参数自适应调节
在线阅读 下载PDF
植物病害识别微调模型低秩适配方法
4
作者 黄锦清 叶进 +3 位作者 胡慧琳 阳继辉 兰伟 张艳青 《智慧农业(中英文)》 2026年第1期40-51,共12页
[目的/意义]深度学习应用于植物病害识别任务时,模型微调面临计算资源受限、参数更新开销较大的挑战。传统低秩适配(Low-Rank Adaptation,LoRA)方法虽能有效减少参数开销,但仍可能导致资源浪费或优化受限。[方法]提出一种动态秩分配算法... [目的/意义]深度学习应用于植物病害识别任务时,模型微调面临计算资源受限、参数更新开销较大的挑战。传统低秩适配(Low-Rank Adaptation,LoRA)方法虽能有效减少参数开销,但仍可能导致资源浪费或优化受限。[方法]提出一种动态秩分配算法,旨在提升植物病害分类模型精度的同时,平衡计算资源。通过引入一种基于中心化核对齐的跨层特征相似性度量方法,量化不同层之间的表征相关性;同时基于梯度信息和激活强度构建1个校正因子,用于衡量各层对损失函数的直接影响;考虑训练过程中特征表示变化的影响,提出基于稳定性触发的自适应秩分配表更新策略(Rank Re-Allocation,RRA),在训练过程中监测微调模型参数的收敛状态,在模型趋于稳定时自动更新秩分配表,确保关键层分配更多资源,从而实现参数资源在不同层之间的优化分配。[结果和讨论]在小麦病害数据集、植物病害数据集等公开数据集上使用AlexNet、MobileNetV2、RegNetY和ConvNeXt这4种不同的模型进行测试,该方法与全参数微调相比,在保证平均准确率的基础上,资源消耗分别减少至0.42%,2.46%,3.56%和1.25%。与LoRA方法(R=16)进行对比,AlexNet、MobileNetV2和RegNetY在小麦病害数据集上的准确率分别提高0.38、0.40和0.05个百分点,资源消耗分别减少59.3%、87.4%和50.5%。[结论]低秩自适应微调方法在保证植物病害识别精度的同时,能够显著减少模型训练参数。 展开更多
关键词 低秩自适应微调 特征相似性 秩分配算法 秩分配更新策略
在线阅读 下载PDF
面向频率快速支撑的风电场自适应分层协调控制
5
作者 刘佳怡 杨德健 +3 位作者 牟佳男 陈宁 钱敏慧 严干贵 《太阳能学报》 北大核心 2026年第2期589-598,共10页
为缓解高比例风电联网电力系统快速频率支撑策略参数整定难、功率等值分配易造成低风速机组转子动能释放过度而致失速的复杂问题,提出一种“集中响应+自主执行”模式下风电场自适应频率支撑控制策略。采用分层思想提出“集中响应+自主... 为缓解高比例风电联网电力系统快速频率支撑策略参数整定难、功率等值分配易造成低风速机组转子动能释放过度而致失速的复杂问题,提出一种“集中响应+自主执行”模式下风电场自适应频率支撑控制策略。采用分层思想提出“集中响应+自主执行”模式的风电场频率支撑架构,上层考虑系统扰动动态补偿,基于自抗扰控制器模型搭建频率支撑策略,且针对自抗扰参数整定难的问题,挖掘不同线性自抗扰控制参数对快速频率支撑效果及风电机组运行状态的影响,提出基于粒子群优化算法的线性自抗扰控制器参数整定方法;下层考虑转速失速现象,对于风电场内不同风速风电机组一次调频功率分配的问题,提出通过转子转速自适应动态修正有功功率响应系数的整定方法,机组接收场站有功增量信号后结合有功功率响应系数自主响应快速频率支撑,实现“风电场集中响应+机组自主执行”的控制模式。以含风电场的四机两区系统进行仿真分析,仿真结果验证了所提控制策略对抑制风电机组转速失速的有效性以及频率支撑效果的可行性。 展开更多
关键词 风电场 调频 粒子群优化 参数整定 自抗扰控制 自适应动态补偿
原文传递
基于大语言模型微调的专利文献前沿技术主题识别方法研究
6
作者 张国成 潘挺雷 +3 位作者 周一行 胡畅 郭腾 张泽晖 《中国发明与专利》 2026年第2期4-11,共8页
[目的/意义]技术主题识别是前沿领域挖掘与科技创新监测的重要环节,但传统方法依赖人工特征与规则构建,难以适应跨领域、多层次的复杂文本处理需求。目前,大语言模型在专利文献等领域的应用存在精度不足与领域适配性不强等问题。[方法/... [目的/意义]技术主题识别是前沿领域挖掘与科技创新监测的重要环节,但传统方法依赖人工特征与规则构建,难以适应跨领域、多层次的复杂文本处理需求。目前,大语言模型在专利文献等领域的应用存在精度不足与领域适配性不强等问题。[方法/过程]针对上述不足,本文提出一种基于大语言模型微调的专利文献前沿技术主题识别方法。首先构建涵盖量子科技领域的高质量专利数据集,并设计“专利文献+领域判别指令”的结构化格式;其次,采用监督微调结合低秩适配方法,在Qwen2.5-32B基础模型上进行高效参数优化;最后,通过实证评测方法的有效性。[结果/结论]结果表明,微调后的模型在量子科技领域专利文献技术主题识别任务中的准确率达到97.5%,显著优于基线模型。 展开更多
关键词 大语言模型微调 技术主题识别 低秩适配 监督微调 前沿技术 量子科技
在线阅读 下载PDF
基于TMD控制的二十辊轧机辊系非线性振动分析
7
作者 卜新东 杨可托 +3 位作者 张卫荣 孔祥岚 和东平 刘亚星 《重型机械》 2026年第1期68-77,共10页
针对二十辊轧机在生产极薄带过程中出现的强耦合、非线性振动问题,本文建立了工作辊与第一中间辊的六自由度非线性动力学模型。考虑轧制界面的非线性刚度与阻尼,采用多尺度法求解系统的主共振与内共振幅频特性方程,并分析了不同参数对... 针对二十辊轧机在生产极薄带过程中出现的强耦合、非线性振动问题,本文建立了工作辊与第一中间辊的六自由度非线性动力学模型。考虑轧制界面的非线性刚度与阻尼,采用多尺度法求解系统的主共振与内共振幅频特性方程,并分析了不同参数对幅频特性曲线的影响规律。为进一步控制二十辊轧机的非线性振动,设计了一种调谐质量阻尼器(TMD),并建立了其与轧机系统的耦合动力学模型。分析了质量、刚度和阻尼比对轧机动态放大系数的影响。为最小化动态放大系数的峰值,采用自适应遗传算法对调谐质量阻尼器的参数进行优化,确定了最优的质量、刚度和阻尼比。最后,通过时域图、相位图、频谱图以及Poincaré截面图的仿真对比,验证了TMD控制器在抑制振动方面的可行性和有效性。研究结果对实际生产具有重要的指导意义。 展开更多
关键词 二十辊轧机 非线性振动 主共振 调谐质量阻尼器(TMD) 自适应遗传算法
在线阅读 下载PDF
面向遥感图像解译的参数高效微调研究综述
8
作者 陈诗琪 杨学 +2 位作者 朱荣强 廖宁 赵卫伟 《中国图象图形学报》 北大核心 2026年第1期212-242,共31页
海量遥感数据的获取和AI大模型的发展极大程度地推动了智能化遥感图像解译的下游应用落地。“预训练+微调”是视觉语言基础大模型适配下游领域的经典范式,能有效将基础模型的知识迁移至新任务中。尽管遥感大模型发展如火如荼且在下游任... 海量遥感数据的获取和AI大模型的发展极大程度地推动了智能化遥感图像解译的下游应用落地。“预训练+微调”是视觉语言基础大模型适配下游领域的经典范式,能有效将基础模型的知识迁移至新任务中。尽管遥感大模型发展如火如荼且在下游任务中表现突出,扩展的模型规模和高昂的训练成本使其难以适用于资源受限、标签不足、需求动态的实际应用场景。为使模型快速适应特定下游任务且有效避免额外训练资源消耗,参数高效微调方法得以广泛研究,并逐渐应用于遥感图像解译当中,成为当下的研究热点。本文面向不同类型的参数高效微调方法和解译任务,对提示词微调、适配器微调和低秩自适应微调三大类方法展开调研并梳理了现有研究工作。此外,本文收集归纳并总结了多个代表性数据集上30余种用于遥感图像解译任务的参数高效微调方法的性能,并从模型精度、训练参数量和推理耗时角度综合评估了方法性能,有助于启发研究者提出新方法并进行公平比较。最后,本文结合当前现状从多模态生成式任务、模型可解释性、边缘端部署应用的角度,展望并讨论了该交叉领域的未来研究方向,旨在为打造“AI+遥感”的下游应用生态提供理论参考与研究思路。 展开更多
关键词 视觉语言大模型 参数高效微调(PEFT) 遥感图像解译 提示词 适配器 低秩自适应
原文传递
基于增强检索生成框架的食品安全监管智能问答系统 被引量:1
9
作者 毛典辉 王可浩 +1 位作者 陈俊华 徐静婷 《食品科学》 北大核心 2025年第22期13-22,共10页
为满足食品安全监管问答任务对模型准确性、合规性和可解释性的高要求,解决现有大语言模型(large language model,LLM)在该领域应用面临的知识召回不精准、法规解析能力不足及计算成本高等问题,本研究基于检索增强生成框架提出了一个智... 为满足食品安全监管问答任务对模型准确性、合规性和可解释性的高要求,解决现有大语言模型(large language model,LLM)在该领域应用面临的知识召回不精准、法规解析能力不足及计算成本高等问题,本研究基于检索增强生成框架提出了一个智能问答系统,其核心是食品安全监管大语言模型(food safety regulation large language model,FSR-LLM)。通过优化数据库存储结构、检索策略及生成器,提升食品安全监管问答的质量和效率。首先构建了食品安全知识图谱(knowledge graph,KG)数据库,以结构化方式存储法规条款、食品安全标准等数据,增强模型对食品领域知识的组织与调用能力。此外,在检索阶段,设计一种大模型引导检索策略,利用LLM智能解析查询语句,在食品安全监管KG中准确地提取高度相关的信息,从而减少无关或误导性内容的召回。对于生成器(Generator)模块,基于Qwen-7B-Chat模型采用低秩适应微调,使模型更贴合食品安全监管问答的需求,同时显著降低计算成本,使其能够在单张RTX 4090 GPU上完成训练。在所提食品安全问答数据集上的实验结果表明,FSR-LLM在BLEU-4、Rouge-L和准确率指标上均优于基线模型,展现出更高的精准度和语义连贯性,为食品安全监管智能化提供了一种低成本、高效能、可扩展的解决方案。 展开更多
关键词 食品安全监管 检索增强生成 知识图谱 低秩适应 微调
在线阅读 下载PDF
PPO算法优化参数的微网接口变换器自抗扰控制
10
作者 周雪松 刘文进 +3 位作者 马幼捷 陶珑 问虎龙 丰美丽 《电力系统保护与控制》 北大核心 2025年第14期90-99,共10页
直流微电网作为新型电力系统的重要环节,因新能源的随机性和不确定性,直流微电网中负载端接口变换器的输出电压容易受到扰动影响,导致输出特性不佳。为有效消除在控制器参数保持恒定时不确定性特征对系统性能产生的不利影响,提出了一种... 直流微电网作为新型电力系统的重要环节,因新能源的随机性和不确定性,直流微电网中负载端接口变换器的输出电压容易受到扰动影响,导致输出特性不佳。为有效消除在控制器参数保持恒定时不确定性特征对系统性能产生的不利影响,提出了一种基于近端策略优化(proximalpolicyoptimization, PPO)算法的自抗扰控制方法。该方法利用PPO智能体与传统自抗扰控制系统环境进行交互,感知环境状态的变化,并依据奖励的反馈来优化控制策略。在训练过程中,智能体通过探索不同的控制动作,实现观测器参数的自适应调整,从而确保了变换器输出电压的稳定。最后,在数字仿真平台上,将PPO-LADRC与传统线性自抗扰控制(linear active disturbance rejection control, LADRC)、双闭环比例-积分控制方法进行了对比分析,验证了该控制策略可以显著提升系统在各种扰动下的动态性能。 展开更多
关键词 直流微电网 接口变换器 深度强化学习 自抗扰控制 自适应调整
在线阅读 下载PDF
弱电网下单相LCL并网逆变器改进电流控制策略 被引量:2
11
作者 李玉东 侯岩 +2 位作者 李佩峰 段乾超 王晓卫 《电气工程学报》 北大核心 2025年第1期119-130,共12页
针对弱电网下电网阻抗宽范围变化降低并网逆变器系统稳定性、电网背景谐波导致并网电流波形畸变以及电压前馈自校正滤波产生正向谐振尖峰的问题,提出一种电压前馈自校正滤波结合逆变器系统并联自适应虚拟阻抗的控制策略。首先建立单相LC... 针对弱电网下电网阻抗宽范围变化降低并网逆变器系统稳定性、电网背景谐波导致并网电流波形畸变以及电压前馈自校正滤波产生正向谐振尖峰的问题,提出一种电压前馈自校正滤波结合逆变器系统并联自适应虚拟阻抗的控制策略。首先建立单相LCL型并网逆变器模型,分析电网阻抗对逆变器系统的影响,通过电压前馈自校正滤波提升逆变器系统的相位裕度,然后采用逆变器并联自适应虚拟阻抗的控制策略,削弱电压前馈自校正滤波产生的正向谐振尖峰,进一步提升逆变器系统的相位裕度,保证逆变器系统具有较好的动稳态性能,降低电网背景谐波对并网电流的影响,提升逆变器系统对弱电网的适应性。最后在Matlab/Simulink中建立仿真模型并搭建DSP电能变换试验平台,验证所提控制策略的有效性与实用性。 展开更多
关键词 弱电网 电网阻抗 电网背景谐波 自校正滤波 自适应虚拟阻抗 系统相位裕度
在线阅读 下载PDF
基于大语言模型的自动答题方法研究
12
作者 孙承杰 谢沛峰 +1 位作者 单丽莉 刘秉权 《软件导刊》 2025年第11期9-14,共6页
作为最前沿的人工智能技术,大语言模型具有卓越的自然语言理解与生成能力,在教育领域有着巨大的应用潜力。但是大语言模型在高等教育计算机学科中的应用模式还有待深入探索。基于国产大语言模型ChatGLM3-6B,提出一种结合高效微调技术和... 作为最前沿的人工智能技术,大语言模型具有卓越的自然语言理解与生成能力,在教育领域有着巨大的应用潜力。但是大语言模型在高等教育计算机学科中的应用模式还有待深入探索。基于国产大语言模型ChatGLM3-6B,提出一种结合高效微调技术和检索增强生成技术的自动答题方法。在构建的操作系统课程数据集上,该方法可以达到54%的正确率,相比直接使用ChatGLM3-6B模型提升了12%,从而展示了大语言模型在课程自动答疑中的应用潜力。 展开更多
关键词 大语言模型 自动答题 低秩自适应微调 检索增强生成 多重查询检索
在线阅读 下载PDF
基于图像内容理解的判别性类别提示学习 被引量:1
13
作者 王楠井 刘阿建 +4 位作者 梁凤梅 张小梅 万军 谢珺 雷震 《电子学报》 北大核心 2025年第2期493-502,共10页
近年来,通过图像与文本的联合表示,基于对比语言-图像预训练(Contrastive Language-Image Pre-training,CLIP)的方法将文本信息作为分类器的权值,在通用图像识别任务中展现出卓越性能.但是现有方法仅单独构建类别文本提示,比如上下文优... 近年来,通过图像与文本的联合表示,基于对比语言-图像预训练(Contrastive Language-Image Pre-training,CLIP)的方法将文本信息作为分类器的权值,在通用图像识别任务中展现出卓越性能.但是现有方法仅单独构建类别文本提示,比如上下文优化(Context Optimization,CoOp)和条件上下文优化(Conditional Context Optimization,CoCoOp)等,没有考虑图像的内容语义信息与类别的重要性,限制了模型对图像类别的理解与判别.为了解决上述问题,本文在CLIP的基础上提出了一种新方法:基于图像内容理解的判别性类别提示学习(Discriminative Category Prompt Learning based on image content understanding,DCPL),借助图像中丰富的内容特征来学习文本提示,提高文本提示对类别的判别性.具体来说,DCPL包含提示生成(Prompt Generation,PG)模块和文本监督(Text Supervision,TS)模块.PG模块将图像特征和初始化的查询向量作为输入,通过自注意力机制和交叉注意力机制使输出的文本提示中包含充分的图像语义信息;TS模块将固定的类别提示模板作为监督,为可学习文本提示在类别层面和logits层面注入类别信息,增强了类别的重要性.最后,DCPL在ImageNet、Caltech101和Oxford-Pets等11个公开分类数据集上的16-shots平均准确率达到了81.84%,较以往最优方法Cross-Modal的平均准确率提升了0.98个百分点. 展开更多
关键词 视觉-语言模型 图像识别 提示调优 注意力机制 文本监督(TS) 适配器微调 TRANSFORMER
在线阅读 下载PDF
基于大语言模型的中文实体链接实证研究 被引量:4
14
作者 徐正斐 辛欣 《自动化学报》 北大核心 2025年第2期327-342,共16页
近年来,大语言模型(Large language model,LLM)在自然语言处理中取得重大进展.在模型足够大时,大语言模型涌现出传统的预训练语言模型(Pre-trained language model,PLM)不具备的推理能力.为了探究如何将大语言模型的涌现能力应用于中文... 近年来,大语言模型(Large language model,LLM)在自然语言处理中取得重大进展.在模型足够大时,大语言模型涌现出传统的预训练语言模型(Pre-trained language model,PLM)不具备的推理能力.为了探究如何将大语言模型的涌现能力应用于中文实体链接任务,适配了以下四种方法:知识增强、适配器微调、提示学习和语境学习(In-context learning,ICL).在Hansel和CLEEK数据集上的实证研究表明,基于Qwen-7B/ChatGLM3-6B的监督学习方法超过基于小模型的方法,在Hansel-FS数据集上提升3.9%~11.8%,在Hansel-ZS数据集上提升0.7%~4.1%,在CLEEK数据集上提升0.6%~3.7%.而当模型参数量达到720亿时,Qwen-72B的无监督方法实现与监督微调Qwen-7B相近的结果(-2.4%~+1.4%).此外,大语言模型Qwen在长尾实体场景下有明显的优势(11.8%),且随着参数量的增加,优势会更加明显(13.2%).对错误案例进行分析(以下简称错误分析)发现,实体粒度和实体类别相关错误占比较高,分别为36%和25%.这表明在实体链接任务中,准确划分实体边界以及正确判断实体类别是提高系统性能的关键. 展开更多
关键词 实体链接 大语言模型 知识增强 适配器微调 提示学习 语境学习
在线阅读 下载PDF
面向CNN和Transformer的自注意力机制自适应性提示学习 被引量:1
15
作者 杨鹏跃 王锋 魏巍 《小型微型计算机系统》 北大核心 2025年第1期16-22,共7页
随着大规模预训练模型对视觉领域中的一般性数据的深入研究,当将其应用于特定下游任务时,若模型只训练分类头方法则极其依赖于预训练模型且效果一般;而全面微调预训练模型也因模型参数过大而变得不切实际;另外如VPT等视觉提示学习方法... 随着大规模预训练模型对视觉领域中的一般性数据的深入研究,当将其应用于特定下游任务时,若模型只训练分类头方法则极其依赖于预训练模型且效果一般;而全面微调预训练模型也因模型参数过大而变得不切实际;另外如VPT等视觉提示学习方法在图像数据集具有很大的数据多样性时,每个数据集的通用提示在向原始预训练数据分布转变时会带来极大的挑战.基于以上的种种挑战,本文提出一种新的提示学习方法,即在输入空间中添加特定任务的自注意力机制提示块,并在增强通道间的竞争条件下,引入极小的参数量进行预训练模型的自适应性调整,最终实现将视觉领域中具有一般性的特征信息应用于特定的视觉任务.实验以CNN和Transformer代表性的网络为基础模型并选取CIFAR、Tiny ImageNet等数据集,结果表明本文提出的方法相比常见的微调方法在平均准确率上提高了0.55%、1.86%. 展开更多
关键词 模型的微调 数据多样性 提示学习 自注意力机制提示块 自适应性调整
在线阅读 下载PDF
基于知识提示微调的标书信息抽取方法 被引量:3
16
作者 孙熠衡 刘茂福 《计算机应用》 北大核心 2025年第4期1169-1176,共8页
当前信息抽取任务主要依赖大语言模型(LLM),而标书信息中广泛存在领域术语,模型缺乏相关先验知识,导致微调效率低且抽取性能不佳。此外,模型的抽取和泛化性能在很大程度上依赖于提示信息的质量和提示模板的构建方式。针对上述问题,提出... 当前信息抽取任务主要依赖大语言模型(LLM),而标书信息中广泛存在领域术语,模型缺乏相关先验知识,导致微调效率低且抽取性能不佳。此外,模型的抽取和泛化性能在很大程度上依赖于提示信息的质量和提示模板的构建方式。针对上述问题,提出一种基于提示学习的标书信息抽取方法(TIEPL)。首先,利用生成式信息抽取的提示学习方法对LLM注入领域知识,以实现预训练和微调阶段的统一优化;其次,以LoRA(Low-Rank Adaption)微调方法为框架,单独设计提示训练旁路,并设计标书场景关键词提示模板,从而增强模型信息抽取与提示的双向关联。在自建的招中标数据集上的实验结果表明,相较于次优的UIE(Universal Information Extraction)方法,TIEPL的ROUGE-L(Recall-Oriented Understudy for Gisting Evaluation)和BLEU-4(BiLingual Evaluation Understudy)分别提高1.05和4.71个百分点,能更准确和完整地生成抽取结果,验证了所提方法在提高标书信息抽取准确性和泛化性方面的有效性。 展开更多
关键词 生成式信息抽取 大语言模型 提示学习 LoRA微调 标书
在线阅读 下载PDF
基于LoRA微调与RAG融合的煤矿专业大模型应用关键技术 被引量:5
17
作者 秦一凡 付翔 +2 位作者 张智星 贾一帆 孙岩 《工矿自动化》 北大核心 2025年第8期34-42,50,共10页
目前煤矿行业大模型仅对用户的提问进行知识问答,未与现场实时数据相关联,无法对煤矿生产运行状况进行实时分析与指导。针对这些问题,提出一种基于大语言模型的低阶适应(LoRA)微调和检索增强生成(RAG)融合的煤矿专业大模型。该模型先运... 目前煤矿行业大模型仅对用户的提问进行知识问答,未与现场实时数据相关联,无法对煤矿生产运行状况进行实时分析与指导。针对这些问题,提出一种基于大语言模型的低阶适应(LoRA)微调和检索增强生成(RAG)融合的煤矿专业大模型。该模型先运用LoRA技术从历史文本语料中抽取出知识实体并定义知识结构输入大模型进行微调,使大模型能够深入理解领域知识,再将实时产生的生产数据、实时更新的作业规程、法规条例等数据经过向量化清洗输入向量数据库,并与RAG的检索机制相结合,确保数据信息的实时性和准确性。实验结果表明:①经LoRA微调后,模型回答可以精准契合某煤矿“一通三防”管理制度汇编,不仅详细阐述了控制瓦斯排放的增阻限风、分风限风、逐段排放等具体方法,还对排放时间计算、传感器设置、图纸绘制及断电撤人等操作细则进行说明,实现了从泛泛而谈到精准定位具体煤矿特定文件内容的跨越。②选取现场143万条液压支架时序数据,分别存入Milvus向量数据库与MySQL关系型数据库,从写入效率与查询性能2个维度进行对比,结果表明:Milvus向量数据库写入速度为MySQL关系型数据库的2.4倍;在向量检索场景方面,Milvus的向量相似度检索延迟稳定在20 ms,在混合查询场景效率方面,MySQL需全表扫描后排序,143万条数据延迟超100 ms,而Milvus将设备ID过滤后的子集输入分层可导航小世界图(HNSW)层,仅读取查询涉及的向量字段,避免了全表扫描。③将本地基于LoRA微调与RAG融合的煤矿专业大模型与本地离线deepseekR1−7b模型进行部署,对多项指标进行测试,结果表明:基于LoRA微调与RAG融合的煤矿专业大模型在煤矿专业领域知识学习性、知识动态化更新时效性、模型泛化与回答精确度方面具有显著优势,为工业级AI落地提供了可行路径。 展开更多
关键词 人工智能 煤矿专业大模型 大语言模型的低阶适应微调 检索增强生成 分层可导航小世界图 LoRA微调 RAG HNSW
在线阅读 下载PDF
一种频率可重构小型化超短波全向天线
18
作者 高雷 李磊 +3 位作者 张辉 张延冬 张培真 徐良 《电波科学学报》 北大核心 2025年第4期784-788,共5页
针对超短波通信设备小型化的发展趋势,设计了一种基于频率可重构技术的小型化超短波全向天线。采用单极天线形式,通过加载电感线圈,控制高频电流分布,从而改善天线的高频辐射性能。同时,创新性地引入可重构控制电路及LC宽带匹配网络,利... 针对超短波通信设备小型化的发展趋势,设计了一种基于频率可重构技术的小型化超短波全向天线。采用单极天线形式,通过加载电感线圈,控制高频电流分布,从而改善天线的高频辐射性能。同时,创新性地引入可重构控制电路及LC宽带匹配网络,利用射频开关进行快速切换,实现了30~512 MHz频段内良好的阻抗调谐匹配,天线高度仅为0.6 m,辐射性能明显优于传统1.3 m宽带天线。该天线和超短波电台联调使用,可实现跳扩频通信,具有小型化、高增益、自适应调谐等优势,为下一代宽频段软件无线便携电台配套天线的设计提供了一种全新的设计思路。 展开更多
关键词 频率可重构 超短波天线 小型化 宽带匹配网络 自适应调谐
在线阅读 下载PDF
输入感知的通用矩阵-向量乘算法在Hygon DCU的自适应性能优化
19
作者 李庆 贾海鹏 +1 位作者 张云泉 张思佳 《计算机科学》 北大核心 2025年第4期291-300,共10页
GEMV(通用矩阵-向量乘法函数)是BLAS(基础线性代数子程序)算法库的核心组成部分,广泛用于计算机科学、工程计算和数学计算等领域。当前,随着国产Hygon DCU版本的不断迭代升级,Hygon DCU与传统GPU生产商之间也存在一定的竞争优势;随着GEM... GEMV(通用矩阵-向量乘法函数)是BLAS(基础线性代数子程序)算法库的核心组成部分,广泛用于计算机科学、工程计算和数学计算等领域。当前,随着国产Hygon DCU版本的不断迭代升级,Hygon DCU与传统GPU生产商之间也存在一定的竞争优势;随着GEMV应用领域的不断扩大,GEMV的输入特征体现出多样化的趋势。在这种背景下,单纯靠一种优化方法,无法实现GEMV算法在GPU计算平台上所有输入情况下的高性能。因此,在访存优化、指令重排、并行规约、共享内存、线程排布等传统优化手段的基础上,提出了一种输入感知的性能自适应优化方法,其能够根据输入矩阵的不同规模和形状自动调整计算kernel的实现方式以达到最佳性能,显著提高了GEMV在Hygon DCU上的性能。实验结果表明,在Hygon DCU Z100SM上,输入感知的通用矩阵-向量乘算法的整体性能明显优于RocBLAS库中的相关算法,对于不同的矩阵输入规模,性能最大提升为RocBLAS库中对应算法的3.0203倍。 展开更多
关键词 通用矩阵-向量乘法 DCU 基础线性代数子程序函数库 自适应调优 性能优化
在线阅读 下载PDF
大语言模型微调方法研究综述 被引量:13
20
作者 吴春志 赵玉龙 +3 位作者 刘鑫 司念文 张鲁飞 范昊 《中文信息学报》 北大核心 2025年第2期1-26,共26页
近年来,大语言模型成为人工智能领域非常受关注的技术,引发了自然语言处理领域新的研究范式。在大语言模型训练实践中,参数微调是其中非常重要的一个环节,它允许用户在资源受限条件下,通过调整少部分参数来提升模型理解用户指令、解决... 近年来,大语言模型成为人工智能领域非常受关注的技术,引发了自然语言处理领域新的研究范式。在大语言模型训练实践中,参数微调是其中非常重要的一个环节,它允许用户在资源受限条件下,通过调整少部分参数来提升模型理解用户指令、解决下游任务的能力。该文全面回顾了2019—2024年间50余种主要的大语言模型微调方法,从全新的角度进行了系统性的整理和概括,分为全参数微调、部分参数微调、新增参数微调和无参数微调方法,对每种方法的原理、微调位置及方法特点作了总结归纳和比较;接着,从计算的视角出发,着重分析比较了各类方法的参数量、内存消耗和计算量;最后,基于该文的微调方法调研及相关的参数微调实践,对大语言模型微调策略给出建议,以促进该领域的发展。 展开更多
关键词 人工智能 大语言模型 微调 ADAPTER LoRA
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部