期刊文献+
共找到346篇文章
< 1 2 18 >
每页显示 20 50 100
Multi-Expert Collaboration Based Information Graph Learning for Anomaly Diagnosis in Smart Grids
1
作者 Zengyao Tian Li Lv Wenchen Deng 《Computers, Materials & Continua》 2025年第12期5359-5376,共18页
Accurate and reliable fault diagnosis is critical for secure operation in complex smart power systems.While graph neural networks show promise for this task,existing methods often neglect the long-tailed distribution ... Accurate and reliable fault diagnosis is critical for secure operation in complex smart power systems.While graph neural networks show promise for this task,existing methods often neglect the long-tailed distribution inherent in real-world grid fault data and fail to provide reliability estimates for their decisions.To address these dual challenges,we propose a novel multi-expert collaboration uncertainty-aware power fault recognition framework with cross-view graph learning.Its core innovations are two synergistic modules:(1)The infographics aggregation module tackles the long-tail problem by learning robust graph-level representations.It employs an information-driven optimization loss within a contrastive graph architecture,explicitly preserving global invariance and local structural information across diverse(including rare)fault states.This ensures balanced representation learning for both the head and tail classes.(2)The multi-expert reliable decision module addresses prediction uncertainty.It trains individual expert classifiers using the Dirichlet distribution to explicitly model the credibility(uncertainty)of each expert’s decision.Crucially,a complementary collaboration rule based on evidence theory dynamically integrates these experts.This rule generates active weights for expert participation,prioritizing more certain experts and fusing their evidence to produce a final decision with a quantifiable reliability estimate.Collaboratively,these modules enable reliable diagnosis under data imbalance:The Infographics Module provides discriminative representations for all fault types,especially tail classes,while the Multi-Expert Module leverages these representations to make decisions with explicit uncertainty quantification.This synergy significantly improves both the accuracy and the reliability of fault recognition,particularly for rare or ambiguous grid conditions.Ultimately,extensive experiment evaluations on the four datasets reveal that the proposed method outperforms the state-of-the-art methods in the fault diagnosis of smart grids,in terms of accuracy,precision,f score and recall. 展开更多
关键词 Power system fault diagnosis information graph aggregation multi-expert reliable decision
在线阅读 下载PDF
Unsupervised Multi-Expert Learning Model for Underwater Image Enhancement 被引量:1
2
作者 Hongmin Liu Qi Zhang +2 位作者 Yufan Hu Hui Zeng Bin Fan 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2024年第3期708-722,共15页
Underwater image enhancement aims to restore a clean appearance and thus improves the quality of underwater degraded images.Current methods feed the whole image directly into the model for enhancement.However,they ign... Underwater image enhancement aims to restore a clean appearance and thus improves the quality of underwater degraded images.Current methods feed the whole image directly into the model for enhancement.However,they ignored that the R,G and B channels of underwater degraded images present varied degrees of degradation,due to the selective absorption for the light.To address this issue,we propose an unsupervised multi-expert learning model by considering the enhancement of each color channel.Specifically,an unsupervised architecture based on generative adversarial network is employed to alleviate the need for paired underwater images.Based on this,we design a generator,including a multi-expert encoder,a feature fusion module and a feature fusion-guided decoder,to generate the clear underwater image.Accordingly,a multi-expert discriminator is proposed to verify the authenticity of the R,G and B channels,respectively.In addition,content perceptual loss and edge loss are introduced into the loss function to further improve the content and details of the enhanced images.Extensive experiments on public datasets demonstrate that our method achieves more pleasing results in vision quality.Various metrics(PSNR,SSIM,UIQM and UCIQE) evaluated on our enhanced images have been improved obviously. 展开更多
关键词 multi-expert learning underwater image enhancement unsupervised learning
在线阅读 下载PDF
基于BERT-MHA的深度语义增强专家推荐算法
3
作者 申彦 王倩 《科学技术与工程》 北大核心 2025年第25期10810-10820,共11页
针对现有的专家推荐算法忽略了用户评论中蕴含的情感表达对专家专长表征的影响,从而导致推荐准确度不高的问题,提出基于双向编码器表示-多头注意力机制(bidirectional encoder representations from transformers-multi-head attention,... 针对现有的专家推荐算法忽略了用户评论中蕴含的情感表达对专家专长表征的影响,从而导致推荐准确度不高的问题,提出基于双向编码器表示-多头注意力机制(bidirectional encoder representations from transformers-multi-head attention,BERT-MHA)的深度语义增强专家推荐算法。该算法基于预训练BERT模型,融合MHA机制,自动调整用户评论对专家历史回答问题的情感注意力权重,获取专家动态专长表征,并与静态专长联合以实现专家特征文本的语义增强,表征专家综合专长;通过注意力机制识别用户问题特征;采用多层感知机建模专家综合专长与用户问题间的非线性交互,预测推荐专家的匹配度。利用好大夫网站(haodf.com)的数据进行了不同参数配置及不同算法的对比实验,实验结果表明该算法在准确率(accuracy,ACC)和曲线下的面积(area under curve,AUC)指标下明显优于其他算法,能有效提高在线问答社区的专家推荐准确度。 展开更多
关键词 BERT 多头注意力 语义增强 专家推荐 深度学习
在线阅读 下载PDF
PMoE:在P-tuning中引入混合专家的参数高效微调框架 被引量:4
4
作者 王浩 王珺 +3 位作者 胡海峰 周飞飞 龚锐 张索非 《计算机应用研究》 北大核心 2025年第7期1956-1963,共8页
大语言模型(LLM)在推理和生成任务中的表现显著提升,但现有的开源LLM在处理专业领域问题时仍存在知识不足,亟需针对特定任务进行微调。传统微调方法在多任务学习中难以兼顾低成本与高效性。为此,提出了一种名为PMoE的参数高效微调框架... 大语言模型(LLM)在推理和生成任务中的表现显著提升,但现有的开源LLM在处理专业领域问题时仍存在知识不足,亟需针对特定任务进行微调。传统微调方法在多任务学习中难以兼顾低成本与高效性。为此,提出了一种名为PMoE的参数高效微调框架。该框架基于P-tuning方法,并引入混合专家机制,在保持低成本微调的同时增强多任务处理能力。PMoE在Transformer模块的每一层构建可训练的专家模块,以替代P-tuning中的提示词模块,并采用路由机制根据输入任务特征动态分配任务。此外,PMoE的专家模块支持拆卸,实现不同任务场景下的模型复用,进一步降低计算成本。实验结果表明,PMoE在中国医学领域数据集上相较于P-tuning方法性能提升6.24%,并在多任务处理和迁移学习方面表现优越,验证了其高效性与广泛适用性。 展开更多
关键词 大语言模型 参数高效微调 P-tuning 混合专家 多任务学习
在线阅读 下载PDF
基于多任务学习的可泛化NeRF三维场景重建
5
作者 张宜春 王淳 +1 位作者 金羽萌 贾菁 《信息传播研究》 2025年第3期34-45,共12页
基于神经辐射场(NeRF, neural radiance field)的场景重建技术可构建物理世界的连续隐式表征,支持任意视点的视觉查询和高保真视图合成,在三维建模及推理、数字孪生等领域具有重要研究及应用价值。本文针对基于Transformer的可泛化神经... 基于神经辐射场(NeRF, neural radiance field)的场景重建技术可构建物理世界的连续隐式表征,支持任意视点的视觉查询和高保真视图合成,在三维建模及推理、数字孪生等领域具有重要研究及应用价值。本文针对基于Transformer的可泛化神经辐射场(GNT, generalizable NeRF transformer)模型进行研究,聚焦于提升现有可泛化NeRF模型对几何外观、瞬态运动、高级语义、空间结构等多种信息的感知与学习能力,提出了一种基于多任务学习的可泛化NeRF模型MT-GNT。MT-GNT将大语言模型领域的LoRA-MoE结构定制至光线渲染Transformer前馈层,以较少参数量实现稀疏混合专家模型注入,基于共享视觉表示建立多任务NeRF框架;并在MT-GNT中引入语义和光流引导策略,构建了增强版本MT-SGNT、MT-AGNT。相较集成语义头的GNT,MT-GNT在ScanNet场景上的视图合成PSNR和LPIPS提升4.3%,语义分割mIoU和总准确率分别提升5.4%和6.0%。MT-SGNT、MT-AGNT在视图合成和语义预测方面均优于S-Ray等方法。 展开更多
关键词 神经辐射场 多视图重建 混合专家模型
在线阅读 下载PDF
基于门控混合专家网络的实时相关推荐方法
6
作者 李鹏 管紫薇 杭帆 《计算机工程与设计》 北大核心 2025年第2期515-522,共8页
针对传统推荐模型难以实现对同一个主题的文章连续扩展的问题,提出一种基于门控混合专家网络的实时相关推荐方法。从低维稠密向量交互、语义特征相似性和不同特征字段之间的依赖程度等多个维度捕获特征作为专家网络;通过多门控制的混合... 针对传统推荐模型难以实现对同一个主题的文章连续扩展的问题,提出一种基于门控混合专家网络的实时相关推荐方法。从低维稠密向量交互、语义特征相似性和不同特征字段之间的依赖程度等多个维度捕获特征作为专家网络;通过多门控制的混合专家策略和分层注意力机制,综合考虑这些专家网络;利用最终学习到的深层特征,预测推荐评分和项目点击概率,获得用户对项目的满意度。实验结果表明,与其它基线模型对比,AUC指标最多可提高0.35%,Logloss指标最多可降低0.76%,消融实验也验证了各个部分的有效性,说明了该模型的可行性与准确性。 展开更多
关键词 实时推荐算法 多门控制的混合专家策略 注意力机制 卷积神经网络 挤压激励网络 门控网络 语义特征相似性
在线阅读 下载PDF
黄瓜病害智能识别技术研究进展 被引量:1
7
作者 杨振东 骆巍 +9 位作者 罗晨 姜鸿勋 张英 宋淑敏 史一鸣 于艳玲 杨田亮 马中杰 冯晓 杨凡 《河南农业科学》 北大核心 2025年第4期1-10,共10页
利用智能识别技术及时、准确识别黄瓜病害,进而积极防治、合理施药对于保障黄瓜高质量生产及生态环境安全具有重要意义。黄瓜病害智能识别主要采用基于传统专家系统和知识图谱的专家知识,以及基于传统机器学习和深度学习的可见光图像处... 利用智能识别技术及时、准确识别黄瓜病害,进而积极防治、合理施药对于保障黄瓜高质量生产及生态环境安全具有重要意义。黄瓜病害智能识别主要采用基于传统专家系统和知识图谱的专家知识,以及基于传统机器学习和深度学习的可见光图像处理、叶绿素荧光和高光谱等光谱分析、多模态数据融合技术。综述了基于上述技术的黄瓜病害智能识别研究进展,以及当前研究中存在的问题与不足,并展望了黄瓜病害智能识别技术的发展趋势,旨在为黄瓜病害智能识别的应用研究提供参考。 展开更多
关键词 黄瓜病害 计算机视觉 多模态数据融合 专家知识 智能识别 大模型
在线阅读 下载PDF
甲状腺乳头状癌(初诊)一体化诊疗路径——中山大学附属第三医院甲状腺多学科诊疗中心专家共识 被引量:3
8
作者 中山大学附属第三医院甲状腺多学科诊疗中心 吴涛 +14 位作者 郭月飞 邬杰忠 姜华 王志远 李海凤 李建芳 邓洪容 李星 任杰 胡昆鹏 刘仁斌 叶进 邵春奎 程木华 曾龙驿 《新医学》 2025年第2期109-123,共15页
近年,我国甲状腺乳头状癌发病率显著增高,因此进行规范化诊治和随访十分必要。中山大学附属第三医院甲状腺多学科诊疗中心(包含超声科、甲状腺乳腺外科、耳鼻咽喉头颈外科、内分泌科、核医学科、肿瘤内科、病理科、放射科)参照2015年美... 近年,我国甲状腺乳头状癌发病率显著增高,因此进行规范化诊治和随访十分必要。中山大学附属第三医院甲状腺多学科诊疗中心(包含超声科、甲状腺乳腺外科、耳鼻咽喉头颈外科、内分泌科、核医学科、肿瘤内科、病理科、放射科)参照2015年美国甲状腺学会《成人甲状腺结节与分化型甲状腺癌诊治指南》《2021年中国临床肿瘤学会甲状腺指南》《中国抗癌协会甲状腺癌整合诊治指南(2022年精简版)》等,结合临床一线工作经验,针对甲状腺乳头状癌的术前诊断流程、细针穿刺病理报告标准,初诊甲状腺乳头状癌手术治疗的开放手术、腔镜手术、热消融治疗等根治性治疗的适应证、并发症管理,131I治疗的清甲治疗、辅助治疗、清灶治疗的标准和流程,术后动态评估和促甲状腺激素抑制治疗等,建立甲状腺乳头状癌(初诊)一体化诊疗路径,现予以发布。 展开更多
关键词 甲状腺乳头状癌 初诊 多学科诊疗 专家共识
暂未订购
基于液体活检技术的多癌种联合筛查专家共识(2025版) 被引量:1
9
作者 陈万青 陈可欣 +10 位作者 贺宇彤 贾卫华 刘芝华 马红霞 缪小平 潘凯枫 吴晨 夏昌发 邢金良 许永杰 基于液体活检技术的多癌种联合筛查专家共识制定工作组 《中国肿瘤临床》 北大核心 2025年第14期727-742,共16页
恶性肿瘤是全球重大公共卫生挑战,筛查是降低其死亡率的关键手段。然而,目前仅少数癌种有适宜的筛查方法,且传统单癌筛查方法存在侵入性强、准确性低、依从性差等弊端。基于液体活检技术的多癌种早期检测(MCED),通过检测血液等体液中的... 恶性肿瘤是全球重大公共卫生挑战,筛查是降低其死亡率的关键手段。然而,目前仅少数癌种有适宜的筛查方法,且传统单癌筛查方法存在侵入性强、准确性低、依从性差等弊端。基于液体活检技术的多癌种早期检测(MCED),通过检测血液等体液中的细胞游离DNA、细胞游离RNA、蛋白质和代谢物等标志物,实现了无创、高效的多癌种联合早期检测,显著拓展了可筛查癌种范围及筛查人群覆盖率,展现出改善当前癌症筛查策略的巨大潜力。基于液体活检技术多癌种联合筛查专家共识(2025版)系统梳理了基于液体活检技术的MCED进展、标志物选择与检测技术、癌种选择、研究设计与临床效用评估以及实施路径等内容,旨在为MCED的深入研究与广泛应用提供科学指导,推动恶性肿瘤筛查策略的持续优化。 展开更多
关键词 恶性肿瘤 液体活检 多癌种联合筛查 肿瘤标志物 专家共识
暂未订购
基于激光雷达的多目标路径规划算法
10
作者 韩慧妍 郑心怡 +2 位作者 况立群 杨晓文 韩燮 《激光与红外》 北大核心 2025年第7期1029-1037,共9页
随着人工智能技术的发展和机器人技术的进步,路径规划问题受到越来越多的关注。强化学习由于无需训练数据、泛化能力强,被广泛应用于移动机器人目标路径规划,虽然取得了一些成果,仍存在一系列挑战,包括多目标路径规划算法较少、有效经... 随着人工智能技术的发展和机器人技术的进步,路径规划问题受到越来越多的关注。强化学习由于无需训练数据、泛化能力强,被广泛应用于移动机器人目标路径规划,虽然取得了一些成果,仍存在一系列挑战,包括多目标路径规划算法较少、有效经验利用率低、环境奖励稀疏和模型收敛困难,为了解决这些问题,本文首次将柔性动作-评价算法(Soft Actor-Critic,SAC)应用于多目标路径规划,并提出了一种基于优先经验回放和专家经验柔性动作评价的多目标路径规划方法。基于优先经验回放的策略提高了有效数据的采样效率。通过优化奖励函数使机器人在执行每个动作后都能从环境中得到及时合理的反馈,解决SAC算法易陷入局部最优的问题。基于专家经验进行模仿学习,提高强化学习的训练效率,提升模型收敛速度。最后,在ROS平台上进行多目标路径规划仿真,结果表明,相较于多目标SAC算法,本文提出的算法在包含障碍物的简单和复杂环境中都可以加速收敛,且能够生成更短、更平滑、无碰撞的路径。 展开更多
关键词 路径规划 多目标 优先经验回放 专家经验
在线阅读 下载PDF
基于注意力机制的多视图图神经网络社区问答专家推荐模型
11
作者 吴丽萍 熊玮楠 +1 位作者 苏磊 王瑞 《中文信息学报》 北大核心 2025年第4期105-116,共12页
社区问答专家推荐模型包括目标问题信息提取和专家信息提取两个子任务,现有研究通过计算目标问题与专家信息之间的相关性得分来为目标问题推荐合适的专家回答者。然而,现有研究通常在单一的问题标题视图上展开,往往忽略了问题标签、正... 社区问答专家推荐模型包括目标问题信息提取和专家信息提取两个子任务,现有研究通过计算目标问题与专家信息之间的相关性得分来为目标问题推荐合适的专家回答者。然而,现有研究通常在单一的问题标题视图上展开,往往忽略了问题标签、正文视图所蕴含的互补信息,并且没有从专家信息中学习出对应于目标问题的知识能力。为了充分计算目标问题与专家信息之间的相关性,该文提出了一种基于注意力机制的多视图图神经网络社区问答专家推荐模型,使用多视图图神经网络学习目标问题集和专家问题集的多视图表示,使用注意力机制学习专家对应于目标问题的知识能力。实验结果表明,在两个公开数据集上,该文提出的方法均优于基准方法。 展开更多
关键词 社区问答 专家推荐 多视图图神经网络 注意力机制
在线阅读 下载PDF
肿瘤免疫检查点抑制剂引起皮肤不良反应多学科专家共识(2025版) 被引量:7
12
作者 《肿瘤免疫检查点抑制剂引起皮肤不良反应多学科专家共识(2025版)》编写委员会 杨骥 孙毅 《中国临床医学》 2025年第2期306-320,F0003,共16页
在肿瘤免疫治疗中,免疫检查点抑制剂引起的免疫相关皮肤不良反应是最早出现和最常出现的不良反应,给患者身体和心理带来很大痛苦,处理不及时和不规范甚至会危及生命。免疫相关皮肤不良反应临床表现多样复杂,诊疗存在诸多问题,包括需要... 在肿瘤免疫治疗中,免疫检查点抑制剂引起的免疫相关皮肤不良反应是最早出现和最常出现的不良反应,给患者身体和心理带来很大痛苦,处理不及时和不规范甚至会危及生命。免疫相关皮肤不良反应临床表现多样复杂,诊疗存在诸多问题,包括需要决定是否应停用肿瘤免疫治疗。本共识从免疫相关皮肤不良反应分类、临床表现、治疗以及是否停用免疫治疗等多方面系统分析、综合评价和建议,希望对免疫相关皮肤不良反应的规范诊疗提供帮助,同时强调免疫相关不良反应是多器官多系统受累,需同时关注皮肤、心脏、肺、内分泌和消化系统等损伤。 展开更多
关键词 肿瘤 免疫疗法 药物毒性 免疫检查点抑制剂 免疫相关皮肤不良反应 多学科专家共识
暂未订购
多中心临床研究认可牵头机构伦理审查结论实施的专家共识 被引量:1
13
作者 河北省医学伦理学会 北京医学伦理学会 +4 位作者 天津市医学伦理学会 赵增仁 刘芳 苏振兴 赵媛媛 《中国医学伦理学》 北大核心 2025年第8期1087-1092,F0003,共7页
如何实现多中心临床研究伦理审查的提质增效,是当前伦理审查委员会、申办者等临床研究相关方共同面对的现实问题。《多中心临床研究认可牵头机构伦理审查结论实施的专家共识》依据《关于深化审评审批制度改革鼓励药品医疗器械创新的意... 如何实现多中心临床研究伦理审查的提质增效,是当前伦理审查委员会、申办者等临床研究相关方共同面对的现实问题。《多中心临床研究认可牵头机构伦理审查结论实施的专家共识》依据《关于深化审评审批制度改革鼓励药品医疗器械创新的意见》《涉及人的生命科学和医学研究伦理审查办法》以及《涉及人的临床研究伦理审查委员会建设指南》(2023版)等相关文件要求,倡导认可牵头机构伦理审查结论。牵头机构的伦理审查委员会采用会议审查形式对临床研究项目进行伦理审查,参与机构伦理审查委员会可采用简易程序审查对审查结论进行确认,并对该项研究在本机构的可行性进行审查。在此过程中,明确各方职责,规范伦理审查流程,优化关联程序,在切实保护研究参与者合法权益的基础上,避免重复审查,提升伦理审查效率,促进生命科学和医学研究健康发展。 展开更多
关键词 多中心临床研究 伦理审查 专家共识 牵头机构 参与机构
暂未订购
基于多门控混合专家网络的社交机器人检测
14
作者 臧威龙 余正涛 +2 位作者 高盛祥 谭凯文 张勇丙 《厦门大学学报(自然科学版)》 北大核心 2025年第4期629-641,共13页
[目的]针对社交机器人模仿真实用户特征伪装自身及不同社区用户行为差异显著使得检测难度提升的问题进行研究.[方法]提出基于多门控混合专家网络的社交机器人检测模型(multi-gated mixture of experts network bot detection,MGEBot).... [目的]针对社交机器人模仿真实用户特征伪装自身及不同社区用户行为差异显著使得检测难度提升的问题进行研究.[方法]提出基于多门控混合专家网络的社交机器人检测模型(multi-gated mixture of experts network bot detection,MGEBot).该方法首先将用户元数据与推文数据编码为序列信息,并对关系数据进行图结构编码,实现多角度用户信息表征.随后,将信息输入多门控混合专家网络,学习不同社区用户群体的独有特征,以应对社区差异性问题.最终,融合3种模态的表征进行检测.[结果]在Cresci-15、TwiBot-20和TwiBot-223个主流数据集上,MGEBot在F_(1)等指标上均超越现有基准模型.在泛化性与鲁棒性实验中,MGEBot表现出更好的稳定性与适应性.分析实验表明门控数量增加可显著提升性能,但存在饱和点;专家数量并非越多越好,需寻求最优配置.[结论]MGEBot能有效应对社区差异性挑战,其多源信息融合与多门控混合专家网络机制提升了检测精度和泛化能力,适用于多样化真实场景的社交机器人检测任务. 展开更多
关键词 社交机器人检测 社区群体差异性 多门控专家混合网络
在线阅读 下载PDF
用于手卫生评估的多专家对比学习方法
15
作者 涂子健 王梓 汤进 《计算机与现代化》 2025年第12期88-96,共9页
手卫生是预防医院感染的最有效手段之一,但医务人员的依从性普遍较低。基于计算机视觉的手卫生评估方法可以对手卫生动作进行分步骤评分,但在对微小动作的感知与评估方面仍然存在不足。为了解决这一问题,提出一种基于多专家对比学习的... 手卫生是预防医院感染的最有效手段之一,但医务人员的依从性普遍较低。基于计算机视觉的手卫生评估方法可以对手卫生动作进行分步骤评分,但在对微小动作的感知与评估方面仍然存在不足。为了解决这一问题,提出一种基于多专家对比学习的手卫生评估方法,采用多专家分割模块和动作对比评估模块,通过两阶段的评估流程,提升微小动作的分割与评估能力,实现更精准的手卫生动作评价。具体来说,首先利用多专家分割模块学习每个手卫生有效动作的特点,依赖特点信息进行高精度的动作分割推理;其次,动作对比评估模块基于对比学习方法,利用模版动作与当前动作的差异信息计算动作预测分数;最后,提出的方法输出每个有效动作的预测得分,综合计算后得到最终的预测总分。本文方法在手卫生评估数据集HHA300上取得的动作分割精度为91.4%,动作质量评估的相关系数为0.864,均优于现有的手卫生评估方法。多个对比实验与消融实验验证了本文方法中各个模块的有效性,说明本文方法能够使手卫生评估过程更加规范,实现手卫生动作的有效监管。 展开更多
关键词 手卫生 动作质量评估 动作分割 计算机视觉 多专家 对比学习
在线阅读 下载PDF
DeepSeek-R1是怎样炼成的? 被引量:72
16
作者 张慧敏 《深圳大学学报(理工版)》 北大核心 2025年第2期226-232,共7页
简述DeepSeek系列模型在大模型训练中的创新和优化.DeepSeek系列模型的突破主要体现在模型架构、算法创新、软硬件协同优化及整体训练效率的提升.DeepSeek-V3模型采用混合专家(mixture of experts,MoE)模型架构,通过细粒度设计和共享专... 简述DeepSeek系列模型在大模型训练中的创新和优化.DeepSeek系列模型的突破主要体现在模型架构、算法创新、软硬件协同优化及整体训练效率的提升.DeepSeek-V3模型采用混合专家(mixture of experts,MoE)模型架构,通过细粒度设计和共享专家策略,实现计算资源的高效利用;MoE模型架构中的稀疏激活机制和无损负载均衡策略显著提高了模型训练的效率和性能;多头潜在注意力(multi-head latent attention,MLA)机制通过减少内存使用和加速推理过程,降低了模型训练和推理成本;通过引入多token预测(multi-token prediction,MTP)和8位浮点数(floating point 8-bit,FP8)混合精度训练技术,提升了模型的上下文理解能力和训练效率;采用优化并行线程执行(parallel thread execution,PTX)代码显著提高了图形处理器(graphics processing unit,GPU)的计算效率;所提群体相对策略优化(group relative policy optimization,GRPO)对DeepSeek-R1-Zero模型进行纯强化学习训练,跳过了传统的监督微调和人类反馈阶段,显著提升了模型的推理能力.总体而言,DeepSeek系列模型通过多项创新,在人工智能领域取得了显著优势,树立了行业新标杆. 展开更多
关键词 人工智能 DeepSeek 大语言模型 混合专家模型 多头潜在注意力机制 多token预测 混合精度训练 群体相对策略优化
在线阅读 下载PDF
脓毒症胃肠功能障碍多民族医诊疗专家共识
17
作者 中国民族医药学会急诊医学分会 郝浩 +3 位作者 林鑫 田正云 毕倩宇 刘委宏 《中国中医急症》 2025年第12期1813-1820,共8页
胃肠功能障碍是脓毒症患者常见的并发症,也是脓毒症防治的核心环节之一。我国地域广阔,民族众多,各民族医药对脓毒症胃肠功能障碍治疗各有特色,但目前缺乏统一的诊疗规范或标准。为了更好地发挥民族医药在脓毒症胃肠功能障碍诊治中的优... 胃肠功能障碍是脓毒症患者常见的并发症,也是脓毒症防治的核心环节之一。我国地域广阔,民族众多,各民族医药对脓毒症胃肠功能障碍治疗各有特色,但目前缺乏统一的诊疗规范或标准。为了更好地发挥民族医药在脓毒症胃肠功能障碍诊治中的优势,中国民族医药学会牵头专家组对多民族医药在脓毒症胃肠功能障碍的临床应用进行梳理总结,代表性选取了中医、藏医、蒙医、维医、壮医5个民族医学领域权威单位及专家,编制了《脓毒症胃肠功能障碍多民族医诊疗专家共识》,适用于指导脓毒症胃肠功能障碍的多民族医药诊疗活动。 展开更多
关键词 脓毒症 胃肠功能障碍 多民族医 专家共识
暂未订购
HS-MoE和MH-MoE模型在电池SOH和RUL预测中的对比研究 被引量:1
18
作者 常伟 胡志超 +1 位作者 潘多昭 师继文 《科技和产业》 2025年第13期122-132,共11页
电池的健康状态(SOH)和剩余使用寿命(RUL)是评估电池性能退化和潜在使用期限的核心指标。在实际应用中,准确预测电池的SOH和RUL至关重要。为了捕捉电池性能的变化并做出预测,通常依赖于电池的运行数据来训练机器学习算法,如神经网络或... 电池的健康状态(SOH)和剩余使用寿命(RUL)是评估电池性能退化和潜在使用期限的核心指标。在实际应用中,准确预测电池的SOH和RUL至关重要。为了捕捉电池性能的变化并做出预测,通常依赖于电池的运行数据来训练机器学习算法,如神经网络或深度学习算法。然而,传统的机器学习模型往往采用单一架构来适应整个数据集,这在处理复杂且异质性强的大数据时显得不足,这类模型普遍存在泛化能力不足和过拟合的风险,且在大数据处理上效率低下。为此,采用多层稀疏混合专家模型(HS-MoE)和多头混合专家模型(MH-MoE)分别构建电池SOH和RUL的预测模型。在NASA (美国国家航空和宇宙航行局)和EIS(电化学阻抗谱)公开的数据集上进行对比实验,结果显示在两个数据集上,MH-MoE模型在预测SOH和RUL方面的表现均优于HS-MoE模型。 展开更多
关键词 混合专家模型(MoE) 多层稀疏混合专家模型(HS-MoE) 多头混合专家模型(MH-MoE) 电池的健康状态(SOH) 剩余使用寿命(RUL)
在线阅读 下载PDF
一种紧凑的多专家协同大语言模型框架
19
作者 周鸿祎 黄绍莽 +2 位作者 潘剑锋 彭敏 郑涵中 《计算》 2025年第3期40-48,共9页
近年来,大语言模型(large language models,LLMs)在自然语言处理等领域展现出卓越性能。然而,在显存受限的工业环境中,将LLMs扩展至多个下游任务时常难以兼顾资源消耗与性能表现之间的平衡,进而限制了其更广泛的应用。为此,提出了一种... 近年来,大语言模型(large language models,LLMs)在自然语言处理等领域展现出卓越性能。然而,在显存受限的工业环境中,将LLMs扩展至多个下游任务时常难以兼顾资源消耗与性能表现之间的平衡,进而限制了其更广泛的应用。为此,提出了一种结构紧凑的多专家协同架构(compact llm with collaboration of experts,CCoE)。该架构采用模块化设计,能够高效且灵活地将多个领域专家集成至统一的LLMs中,在保证性能的同时显著降低多专家部署的显存开销。此外,CCoE通过引人基于规则的门控机制与专家规划模块,实现了任务的精准分配与专家间的协同,从而有效支持复杂推理任务。在5个领域数据集上的实验证明,CCoE在各项任务中均达到了与现有垂类LLMs相当的表现。此外,相比于现有模型集成方法,CCoE在保持性能的前提下将显存占用量降低了61.3%,并较参数高效的多专家集成方法提升了76.4%的推理吞吐量。 展开更多
关键词 大语言模型 自然语言处理 多专家协同 显存受限环境 模块化设计 专家规划 模型集成
在线阅读 下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部