期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
LoRA/QLoRA微调技术在DeepSeek大模型问答系统中的应用 被引量:1
1
作者 林晓淅 《信息记录材料》 2025年第10期205-207,共3页
针对大模型在问答系统中面临的全量微调资源消耗高以及垂直领域适应性不足的问题,本研究提出了一种基于低秩自适应/量化低秩自适应(LoRA/QLoRA)技术的创新解决方案。以深度求索(DeepSeek-R1)为基础模型,结合其动态激活特性,通过LoRA和4... 针对大模型在问答系统中面临的全量微调资源消耗高以及垂直领域适应性不足的问题,本研究提出了一种基于低秩自适应/量化低秩自适应(LoRA/QLoRA)技术的创新解决方案。以深度求索(DeepSeek-R1)为基础模型,结合其动态激活特性,通过LoRA和4位量化QLoRA实现参数高效微调,突破传统方法的资源限制。在医疗问诊、金融数据分析场景中,验证了LoRA/QLoRA的性能与效率平衡能力。实验结果表明:在保持高精度的同时,该方法将参数量和训练时间显著降低至全量微调的极小比例,有效提升了垂直领域任务的专业性能,并支持在消费级硬件上完成大模型微调。该方法有效解决了通用模型在专业场景中的适应性问题,为大模型在资源受限场景的实现提供了新的解决方法。 展开更多
关键词 低秩自适应(LoRA)技术 量化低秩自适应(qlora)技术 深度求索(DeepSeek)大模型 参数高效微调
在线阅读 下载PDF
中文农机大语言模型耒耜构建方法
2
作者 栗晓宇 王玉聪 +3 位作者 杜岳峰 李国润 刘磊 宋正河 《农业机械学报》 北大核心 2026年第5期387-397,共11页
大语言模型拥有强大的生成、学习和推理能力,是加快现代农机装备绿色、智能和高效发展的强力助手。然而,由于缺乏用于训练的农业机械相关数据集,极大限制了大模型在农机研发、制造和推广。因此,面向农机装备科研人员、设计制造工程师、... 大语言模型拥有强大的生成、学习和推理能力,是加快现代农机装备绿色、智能和高效发展的强力助手。然而,由于缺乏用于训练的农业机械相关数据集,极大限制了大模型在农机研发、制造和推广。因此,面向农机装备科研人员、设计制造工程师、用户等不同群体具体需求,提出了中文农机大模型——耒耜。首先,提出了耒耜大模型总体架构设计方案,包括耒耜·薪火、耒耜·匠心和耒耜·耕耘3个版本,旨在为目标群体提供农机专业知识问答、设计制造建议和田间作业管控等多样化、定制化服务;其次,构建了国内首个中文农机数据集,并以耒耜·薪火大模型为例,阐明了模型训练和评估方法,分别以LLaMA 3.1-8B-Instruct、Mistral-7B-Instruct-v0.3和Qwen 2.5-7B-Instruct为基座模型进行监督式微调,利用ROUGE和BLEU作为评价指标评估微调后模型性能;最后,采用人工评估对LLaMA 3.1、GPT-4o、Mistral、Qwen 2.5和薪火大模型的问答结果进行评价,自动评估和人工评估结果表明薪火大模型在准确性、专业性和可用性等方面表现最优。研究成果为农机装备全生命周期管控及智慧农业发展提供了有力工具和手段。 展开更多
关键词 大语言模型 农机装备 Qwen 2.5 qlora 微调
在线阅读 下载PDF
基于检索增强生成的某型火炮故障诊断问答系统研究
3
作者 田佳瑞 王建国 +2 位作者 侯麒麟 冀慧君 田慧芳 《火力与指挥控制》 北大核心 2026年第2期174-180,共7页
传统数据库和知识图谱驱动的火炮故障诊断系统在多跳推理和数据完整性方面存在不足,使用检索增强生成与大语言模型构建某型火炮故障诊断问答系统,可以提升复杂故障推理能力以及诊断的准确性。通过QLoRA方法对Qwen2.5:7B模型进行微调,根... 传统数据库和知识图谱驱动的火炮故障诊断系统在多跳推理和数据完整性方面存在不足,使用检索增强生成与大语言模型构建某型火炮故障诊断问答系统,可以提升复杂故障推理能力以及诊断的准确性。通过QLoRA方法对Qwen2.5:7B模型进行微调,根据某型火炮装备故障相关数据检索增强生成,结合提示词工程,构建一个交互性强的火炮智能问答系统。实验结果表明,与传统系统相比,引入大语言模型以及增强检索生成技术后能实现故障的高效检索,提升交互性的同时能够快速辅助人员进行火炮故障诊断。 展开更多
关键词 大语言模型 检索增强生成 qlora 问答系统 故障诊断 火炮
在线阅读 下载PDF
基于大语言模型的材料科学信息抽取
4
作者 时宗彬 乐小虬 《软件导刊》 2026年第1期1-9,共9页
科学文献因具备特有的专业术语和复杂的语义关系,使得直接利用已有的大语言模型(LLM)从中提取专业领域知识充满挑战。针对LLM在材料科学领域知识抽取性能不足的问题,提出一种通过领域对齐微调提升抽取效果的方法,并展示了如何利用微调后... 科学文献因具备特有的专业术语和复杂的语义关系,使得直接利用已有的大语言模型(LLM)从中提取专业领域知识充满挑战。针对LLM在材料科学领域知识抽取性能不足的问题,提出一种通过领域对齐微调提升抽取效果的方法,并展示了如何利用微调后的LLM提取材料文献中的关键信息。首先,通过具备较强语言能力的LLM结合提示工程,辅助人工标注材料领域的数据集。其次,在具有7B参数的LLM上采用QLoRA技术进行指令微调,使模型在微调后能够根据指令从材料科学文献中准确提取信息。微调后的LLM在多个任务上表现优异:材料实体识别的F1值达到0.94,材料类型识别的准确率达到0.91,材料属性数值抽取的准确率达到0.89。实验结果表明,该方法在处理材料科学文献中的复杂术语和语义关系方面表现出色,并展现出较强的泛化能力,为材料科学领域的知识抽取提供了一种新的解决思路。 展开更多
关键词 大语言模型 提示工程 qlora 指令微调 信息抽取
在线阅读 下载PDF
面向初中生物学科问答的大模型低资源适配方法研究
5
作者 熊旭辉 万桃 +1 位作者 覃守垣 汤智豪 《湖北师范大学学报(自然科学版)》 2026年第1期15-23,共9页
在面向学科知识问答应用中,基础教育场景对学科准确性要求高,需要消除通用大语言模型所存在的事实性错误与“知识幻觉”。同时,普通学校或教育机构难以承受高昂的大语言模型运行成本。在消费级GPU环境下,基于自建的初中生物高质量问答... 在面向学科知识问答应用中,基础教育场景对学科准确性要求高,需要消除通用大语言模型所存在的事实性错误与“知识幻觉”。同时,普通学校或教育机构难以承受高昂的大语言模型运行成本。在消费级GPU环境下,基于自建的初中生物高质量问答数据集,采用QLoRA方法对Chat GLM3-6B量化模型进行参数高效微调,注入领域知识,优化模型。实验结果表明,该方法使模型训练过程中的GPU显存占用降低超过50%,微调后的模型在初中生物学知识问答中的事实准确性与专业性显著提升。 展开更多
关键词 大语言模型 参数高效微调 ChatGLM qlora
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部