期刊文献+
共找到140,914篇文章
< 1 2 250 >
每页显示 20 50 100
安全通用人工智能大模型的内涵与理论框架
1
作者 廖慧敏 闫政睿 +2 位作者 王秉 王渊洁 任才清 《灾害学》 北大核心 2026年第1期40-45,共6页
通用人工智能已成为科技领域的研究焦点,为人工智能时代日益复杂的安全问题提供了新解决思路。基于普通安全学与通用人工智能理论,该文分析安全通用人工智能大模型内涵,初步构建并解析其理论框架。结果表明,该模型是适用于多类安全场景... 通用人工智能已成为科技领域的研究焦点,为人工智能时代日益复杂的安全问题提供了新解决思路。基于普通安全学与通用人工智能理论,该文分析安全通用人工智能大模型内涵,初步构建并解析其理论框架。结果表明,该模型是适用于多类安全场景、融合跨领域安全知识、服务于多安全任务的通用人工智能大模型,具备通用性、多元性、灵活性、记忆性、经济性、私密性、兼容性和可信性等属性,其功能路径包括安全数据收集与预处理、安全态势感知、风险识别评估、决策生成与优化、执行与反馈。其理论框架由环境层、技术层、交互层与核心层构成,以期为人工智能大模型技术在安全领域的研究与实践提供思路和方法参考。 展开更多
关键词 安全 通用人工智能 人工智能大模型 安全通用人工智能大模型
在线阅读 下载PDF
基于内窥镜视觉的机器人辅助手术中力估计方法
2
作者 邢元 王建敏 +3 位作者 马剑雄 唐吉思 马志康 史靖 《天津大学学报(自然科学与工程技术版)》 北大核心 2026年第1期99-110,共12页
在机器人辅助微创手术中,精确的力反馈对于提高手术操作的安全性与质量至关重要.然而,现有的解决方案在实际应用场景中仍面临着如小型化、精准化和普适性等多重挑战,限制了其在复杂临床场景中的广泛应用.因此,如何实现高精度、低成本且... 在机器人辅助微创手术中,精确的力反馈对于提高手术操作的安全性与质量至关重要.然而,现有的解决方案在实际应用场景中仍面临着如小型化、精准化和普适性等多重挑战,限制了其在复杂临床场景中的广泛应用.因此,如何实现高精度、低成本且适用于多种组织类型的力估计成为研究重点.为此,基于手术机器人配备的内窥镜系统,构建了包含多种材料和丰富力学信息数据集,并提出了结合注意力机制的深度学习模型,以优化内窥镜视觉信息的特征提取,从而提升力估计的准确性和鲁棒性.模型以材料变形的内窥镜图像作为输入,结合卷积神经网络的特征提取能力和循环神经网络的时序建模能力,实现对手术器械与组织之间交互力的精确估计.此外,为进一步探究注意力机制在力估计任务中的作用和优化策略,提出了3种不同的注意力模块引入方案.实验结果表明:采用DenseNet-BiLSTM结构并引入SENet模块的模型在3种材料上取得了最佳性能,显著提升了模型的整体表现;同时,注意力模块的位置对不同组织材料的力估计效果具有差异性影响.研究验证了基于内窥镜视觉的深度学习方法在精确估计手术过程中器械与组织间的交互力方面的有效性和可行性,为未来机器人辅助微创手术系统的发展和优化提供了新的方向与理论依据. 展开更多
关键词 机器人辅助微创手术 视觉反馈 交互力估计 注意力机制 深度学习
在线阅读 下载PDF
基于多方位感知深度融合检测头的目标检测算法
3
作者 包晓安 彭书友 +3 位作者 张娜 涂小妹 张庆琪 吴彪 《浙江大学学报(工学版)》 北大核心 2026年第1期32-42,共11页
针对传统目标检测头难以有效捕捉全局信息的问题,提出基于多方位感知深度融合检测头的目标检测算法.通过在检测头部分设计高效双轴窗口注意力编码器(EDWE)模块,使网络能够深度融合捕获到的全局信息与局部信息;在特征金字塔结构之后使用... 针对传统目标检测头难以有效捕捉全局信息的问题,提出基于多方位感知深度融合检测头的目标检测算法.通过在检测头部分设计高效双轴窗口注意力编码器(EDWE)模块,使网络能够深度融合捕获到的全局信息与局部信息;在特征金字塔结构之后使用重参化大核卷积(RLK)模块,减小来自主干网络的特征空间差异,增强网络对中小型数据集的适应性;引入编码器选择保留模块(ESM),选择性地累积来自EDWE模块的输出,优化反向传播.实验结果表明,在规模较大的MS-COCO2017数据集上,所提算法应用于常见模型RetinaNet、FCOS、ATSS时使AP分别提升了2.9、2.6、3.4个百分点;在规模较小的PASCAL VOC2007数据集上,所提算法使3种模型的AP分别实现了1.3、1.0和1.1个百分点的提升.通过EDWE、RLK和ESM模块的协同作用,所提算法有效提升了目标检测精度,在不同规模的数据集上均展现了显著的性能优势. 展开更多
关键词 检测头 目标检测 Transformer编码器 深度融合 大核卷积
在线阅读 下载PDF
大模型赋能岩体力学教学改革:创新路径与实践探索
4
作者 陈绍杰 王蕊 +1 位作者 马宏发 屈晓 《高教学刊》 2026年第2期1-4,共4页
该文探讨大模型在岩体力学教学改革中的创新应用路径与实践策略。通过分析现行教学体系,结合大模型技术特征与教育创新理论,构建“技术赋能-教学重构-评价革新”三位一体教改框架。该模型可深度融入知识传授、实验模拟、案例分析和学习... 该文探讨大模型在岩体力学教学改革中的创新应用路径与实践策略。通过分析现行教学体系,结合大模型技术特征与教育创新理论,构建“技术赋能-教学重构-评价革新”三位一体教改框架。该模型可深度融入知识传授、实验模拟、案例分析和学习评价全流程,有效解决传统教学中抽象概念理解难、工程实践不足、个性化学习缺失等问题。该文阐述智能备课助手、虚拟实验系统等应用场景的设计与实现,提出教师角色转型等配套措施,为新时代岩土工程人才培养提供理论参考与实践范式。 展开更多
关键词 大模型 岩体力学 教学改革 教育智能化 工程教育
在线阅读 下载PDF
融合DeepSeek-R1和RAG技术的先秦文化元典智能问答研究
5
作者 张强 高颖 +2 位作者 任豆豆 韩牧哲 包平 《现代情报》 北大核心 2026年第1期173-186,共14页
[目的/意义]先秦文化元典是中华文明的源头文献,对其进行知识组织与智能应用,可以为建设中华民族现代文明提供历史依据和价值判断,增强国家文化软实力。本研究旨在基于检索增强生成(RAG)技术的先秦文化元典智能问答系统,推动相关知识的... [目的/意义]先秦文化元典是中华文明的源头文献,对其进行知识组织与智能应用,可以为建设中华民族现代文明提供历史依据和价值判断,增强国家文化软实力。本研究旨在基于检索增强生成(RAG)技术的先秦文化元典智能问答系统,推动相关知识的智能化应用与传承。[方法/过程]以中华书局出版的《春秋》三传为研究对象,构建先秦文化元典本体模型,采用DeepSeek-R1进行知识抽取并构建知识图谱。基于LangChain框架,运用GraphRAG、NaiveRAG、LightRAG、HybridRAG这4种RAG方法对大语言模型进行检索增强,并从定量和混合两方面评估问答能力。[结果/结论]研究结果显示,DeepSeek-R1抽取效果良好,生成的三元组能有效覆盖关键知识且质量较高。在智能问答评估中,不同RAG方法各有优劣。GraphRAG在各类问题和评估维度上表现较佳,尤其在考证溯源型、应用实践型等问题上表现突出;NaiveRAG在事实知识型问题上表现较好。综合定量与混合评估来看,根据实际应用场景选择合适的RAG技术至关重要。 展开更多
关键词 先秦文化元典 大语言模型 DeepSeek 检索增强生成 智能问答
在线阅读 下载PDF
LDD-YOLO:改进YOLOv8的轻量级密集行人检测算法
6
作者 杨迪 张喜龙 王鹏 《计算机科学与探索》 北大核心 2026年第1期251-265,共15页
针对当前行人检测算法在密集场景中由于遮挡和尺度变化导致的漏检、误检,以及模型计算复杂度高等问题,提出了一种基于YOLOv8的轻量级密集行人检测方法(LDD-YOLO),以实现检测效率与精度的平衡。设计了一种重参数化层聚合网络RELAN,融合... 针对当前行人检测算法在密集场景中由于遮挡和尺度变化导致的漏检、误检,以及模型计算复杂度高等问题,提出了一种基于YOLOv8的轻量级密集行人检测方法(LDD-YOLO),以实现检测效率与精度的平衡。设计了一种重参数化层聚合网络RELAN,融合了重参数化卷积和多分支结构,分别在训练阶段和推理阶段强化特征表达能力与模型推理效率。引入了分离式大卷积核注意力机制的空间金字塔池化模块SPPF-LSKA,结合分离式大卷积核操作以扩大感受野,增强对密集目标的特征捕获能力,抑制背景干扰。为解决YOLOv8在特征处理中未能充分挖掘局部与全局信息的局限性,提出了一种改进的多尺度特征融合模块FFDM,通过融合多尺度特征信息,提升模型密集行人检测的特征表达能力。设计了一种轻量化的特征对齐检测头LSCSBD,利用不同特征层级之间的共享卷积层,提高参数利用效率并减少冗余计算。在CrowdHuman与WiderPerson数据集上的对比实验结果表明,LDD-YOLO在总体性能上优于对比模型,实现了精度与效率的平衡。 展开更多
关键词 密集行人检测 YOLO 重参数化 可分离大核注意力机制 多尺度特征融合 轻量化
在线阅读 下载PDF
环形弹簧-质量系统的变形及动态特性的数值研究
7
作者 霍银磊 冯一帆 《包装工程》 北大核心 2026年第1期261-269,共9页
目的基于数值方法研究环形弹簧缓冲器的非线性大变形特性,为其缓冲或隔振设计与应用提供理论参考。方法针对环形弹簧-质量组成的基本弹性系统,基于Euler-Bernoulli梁理论,以环形弹簧的半径及截面角为基本参数推导了弹簧的大变形控制方... 目的基于数值方法研究环形弹簧缓冲器的非线性大变形特性,为其缓冲或隔振设计与应用提供理论参考。方法针对环形弹簧-质量组成的基本弹性系统,基于Euler-Bernoulli梁理论,以环形弹簧的半径及截面角为基本参数推导了弹簧的大变形控制方程及质量的运动方程,考虑环形弹簧的大变形特性,给出环形弹簧平衡方程的边界条件。考虑系统运动方程与弹簧的平衡方程的动态耦合,利用两点边值问题的数值解法研究系统的非线性平衡问题、平衡点处的微幅振动特性及冲击响应特性。结果得到了系统的静态力-变形曲线、频率变化曲线以及冲击加速度变化曲线。环形弹簧-质量系统的力-变形曲线具有明显的分段非线性特性,两非线性阶段连续且在其节点处弹簧与支撑由点接触转变为线接触;系统基于平衡位置的小幅振动频率的突变及系统冲击加速度时程曲线的拐点进一步证明了系统的分段非线性特性;小幅振动频率存在较大的低频区,不同质量系统的冲击加速度响应具有明显的极小值。结论基于数值方法对环形弹簧缓冲器的非线性特性分析结果与相应试验测得的试验结果吻合性较好,证明了该数值计算方法的可靠性,相关结论可为其缓冲或隔振设计与应用提供指导。 展开更多
关键词 环形弹簧 大变形 低频隔振 缓冲性能
在线阅读 下载PDF
谁更像“人”?模型类型与人格设定对大语言模型复刻传播学实验准确率的影响
8
作者 曾秀芹 陈珂璐 《新闻与传播评论》 北大核心 2026年第1期25-39,共15页
以ChatGPT-4o、DeepSeek-R1、豆包-1.5、Kimi-K1.5四种主流大语言模型为对象,采用2(有vs.无大五人格设定)×4(模型类型)实验设计,构建虚拟被试资料以复刻新闻传播学实验。结果显示,各模型拟合表现存在差异:DeepSeek-R1在模拟真人平... 以ChatGPT-4o、DeepSeek-R1、豆包-1.5、Kimi-K1.5四种主流大语言模型为对象,采用2(有vs.无大五人格设定)×4(模型类型)实验设计,构建虚拟被试资料以复刻新闻传播学实验。结果显示,各模型拟合表现存在差异:DeepSeek-R1在模拟真人平均趋势与行为变异性方面最优;ChatGPT-4o的总体方差拟合偏差较大,但主效应、间接效应复刻的准确性与稳定性较为突出。人格设定的影响方面,无大五人格组描述性统计更贴近真人,而有大五人格组因果效应复刻更稳定,唯一完整复刻两个主效应的模型即来自该组。中介效应复刻成功率偏低,但人格设定可在一定程度上缓解模型输出的方向与效应偏离趋势。此外,研究基于ChatGPT-4o进一步发现,实验对象类型(真人组vs.无大五人格组vs.有部分大五人格组vs.有全部大五人格组)对主效应与中介机制部分产生显著调节作用,其中大五人格设定可一定程度抑制模型极端响应。研究实现多模型横向比较与人格设定控制下的复刻实验,验证了大五人格设定对提升模型模拟精度的积极作用,同时指出模型复刻复杂心理机制的局限性,推动传播学实验向“人机共演”的新范式转变,也拓展“媒介即延伸”在智能传播语境下的现实外延。 展开更多
关键词 大语言模型 大五人格 复刻研究 硅基被试
在线阅读 下载PDF
从认知哲学审视DeepSeek——兼验证“人工智能的适应性表征认知理论”
9
作者 魏屹东 《山西师大学报(社会科学版)》 2026年第1期35-46,共12页
大语言模型(LLM)尤其是DeepSeek的问世和应用,对人类智能产生了极大冲击。LLM能够代替人类做任何智力方面的事情?如果它能够做一般的智力工作甚至抽象的数学计算和逻辑推理,而且比普通人还做得好,但能够做创造性和洞察性的智力工作吗?... 大语言模型(LLM)尤其是DeepSeek的问世和应用,对人类智能产生了极大冲击。LLM能够代替人类做任何智力方面的事情?如果它能够做一般的智力工作甚至抽象的数学计算和逻辑推理,而且比普通人还做得好,但能够做创造性和洞察性的智力工作吗?做哲学就是对它的考验。从认知哲学出发,围绕人工认知、人工意识和适应性表征方法论等哲学问题对DeepSeek进行测试,结果表明:该模型是一个很有用的智能软件或工具,但与意识、情感、道德几乎不沾边,所谓的“对齐”只是人们的执念,而决定LLM智能水平和AI向善的最终还是人类设计者。 展开更多
关键词 大语言模型 DeepSeek 哲学问题 适应性表征
在线阅读 下载PDF
人工智能在教育领域的发展与应用
10
作者 杨正 陶德超 孙超 《科技风》 2026年第1期140-142,共3页
近年来,伴随技术飞速发展以及政策的推动,人工智能在教育领域的广泛应用正逐步革新传统教育的模式。本文介绍了人工智能与教育融合的核心技术,详细阐述了人工智能如何从学、教、评、管四个维度推动传统教育的变革,特别是在大语言模型和... 近年来,伴随技术飞速发展以及政策的推动,人工智能在教育领域的广泛应用正逐步革新传统教育的模式。本文介绍了人工智能与教育融合的核心技术,详细阐述了人工智能如何从学、教、评、管四个维度推动传统教育的变革,特别是在大语言模型和多模态技术出现后,教育模式的个性化、混合化、精准化、终身化能力得到快速提升。同时探讨了人工智能在教育领域面临的挑战及未来展望,期望人工智能与教育的本质深度融合,实现“人的全面发展”。 展开更多
关键词 人工智能 教育 大语言模型 个性化 多模态
在线阅读 下载PDF
垂直轴风力机大型化研究进展
11
作者 李银然 柳银环 +1 位作者 张苏彩 魏魁 《液压气动与密封》 2026年第1期17-24,共8页
确定垂直轴风力机(Vertical-axis Wind Turbines,VAWTs)的放大准则是研发大型垂直轴风力机和预测性能的关键技术。首先,分析了采用单一无量纲参数恒定的放大准则(叶尖速比恒定、雷诺数恒定)研发大型机组的研究现状,讨论了此准则在放大... 确定垂直轴风力机(Vertical-axis Wind Turbines,VAWTs)的放大准则是研发大型垂直轴风力机和预测性能的关键技术。首先,分析了采用单一无量纲参数恒定的放大准则(叶尖速比恒定、雷诺数恒定)研发大型机组的研究现状,讨论了此准则在放大过程中的不足;其次,基于理论分析梳理了双参数耦合恒定的放大准则,并分析了采用雷诺数-叶尖速比耦合恒定、叶尖速比-雷诺数耦合恒定的放大准则在风力机放大过程中所取得的研究成果,进一步探讨了耦合恒定放大准则的准确性及局限性,发现耦合恒定的放大准则可以获得气动性能相似性较高的大型垂直轴风力机。 展开更多
关键词 大型化 垂直轴风力机 无量纲参数 放大准则
在线阅读 下载PDF
基于LLM与改进熵权法的飞机货舱配载方案综合评估
12
作者 张长勇 吴仪 《包装工程》 北大核心 2026年第1期122-131,共10页
目的针对飞机货舱配载方案评估中多属性决策的复杂性,以及现有评估方法在权重确定上过度依赖专家经验导致的主观偏差,或单纯依赖客观数据忽略决策者偏好的局限性,提出一种融合主观先验与客观数据驱动的混合赋权评估模型,以提供更为合理... 目的针对飞机货舱配载方案评估中多属性决策的复杂性,以及现有评估方法在权重确定上过度依赖专家经验导致的主观偏差,或单纯依赖客观数据忽略决策者偏好的局限性,提出一种融合主观先验与客观数据驱动的混合赋权评估模型,以提供更为合理、可靠的配载方案择优决策支持。方法首先,引入大型语言模型(Large language model,LLM),构建“虚拟专家委员会”,通过精心设计的提示词工程,获取多维度、多情境下的主观权重。其次,针对传统熵权法对数据分布敏感、难以有效区分指标优劣等问题,提出一种改进的数据预处理熵权法(Improved data preprocessing entropy weighting method,IDPEW),该方法结合指标值的辨识度和信息熵的均衡性来确定客观权重。最后,将LLM生成的主观权重与IDPEW计算的客观权重进行加权组合,构建综合评价函数,对飞机货舱配载方案进行全面评估和排序。结果实验结果表明,LLM模拟专家意见时最关注“装载率”(主观权重0.2250),而IDPEW方法从数据中识别出“横向不平衡度”最具区分力(客观权重0.2481)。混合赋权模型(α=0.5)有效平衡了主客观偏好,在24个方案中精准识别出综合性能最优的方案,验证了模型在复杂情境下的稳定性。结论创新性地利用LLM低成本构建“虚拟专家”获取先验知识,并通过耦合指标辨识度与均衡性的IDPEW方法,提升了客观赋权精度。该模型克服了单一赋权的局限,为飞机货舱配载方案的科学评估提供了一种兼具可解释性和实用性的新范式。 展开更多
关键词 飞机货舱配载 多属性决策 大型语言模型 主观赋权 熵权法 混合赋权
在线阅读 下载PDF
凝聚青年力量 共话信息未来——记江苏省研究生第一届信息资源管理学术创新论坛
13
作者 刘琼 刘桂锋 《图书情报研究》 2026年第1期90-96,共7页
2025年11月7日至9日,“江苏省研究生第一届信息资源管理学术创新论坛”在江苏大学成功召开。论坛聚焦信息资源管理学科的前沿发展,旨在推动学科交叉融合与学术创新。会议共设置五场主旨报告,内容涵盖信息资源管理的学科属性与范式演进... 2025年11月7日至9日,“江苏省研究生第一届信息资源管理学术创新论坛”在江苏大学成功召开。论坛聚焦信息资源管理学科的前沿发展,旨在推动学科交叉融合与学术创新。会议共设置五场主旨报告,内容涵盖信息资源管理的学科属性与范式演进、高质量数据集建设、知识产权情报的学科体系、大语言模型在科技文献分析中的应用、数字人文中的语义表征问题等关键方向。与会专家指出,面对从“图书情报与档案管理”向“信息资源管理”乃至“数字文明”的学科转型,青年学者既迎来研究疆域的拓展,也面临学术身份与学科方向的深层拷问。在技术洪流奔腾的今天,论坛不仅搭建了学术交流的平台,更激发了对学科本质与未来路径的深刻反思。 展开更多
关键词 信息资源管理 图书情报与档案管理 学科更名 数据集 大语言模型 数字人文 语义表征
在线阅读 下载PDF
开放环境下无监督跨模态概念自动提取
14
作者 海峻嘉 景丽萍 +1 位作者 刘华锋 于剑 《计算机科学与探索》 北大核心 2026年第1期154-168,共15页
随着机器学习模型的复杂性不断增加,对其决策过程的可解释性需求也日益增长。概念学习作为一种能够提升模型透明度和可理解性的手段,在机器学习领域变得越来越重要,通过概念来帮助解释大语言模型等黑盒模型的推理过程也随之发展,如何准... 随着机器学习模型的复杂性不断增加,对其决策过程的可解释性需求也日益增长。概念学习作为一种能够提升模型透明度和可理解性的手段,在机器学习领域变得越来越重要,通过概念来帮助解释大语言模型等黑盒模型的推理过程也随之发展,如何准确、自动地提取概念是在这一解释过程中最为关键的一环。针对现有的概念提取方法中存在的依赖人工标注、粒度不一致、扩展性差等问题,设计了一套跨模态视觉概念自动提取框架。基于多模态大模型的问询方式,实现了图像中目标对象的自动提取,并通过CLIP模型和目标检测模型实现了区域对应机制,提高了提取的准确性。采用基于文本分割的大语言模型来提取目标对象的属性和关系,确保了概念与数据的一致性。引入ConceptNet概念网络扩展了提取到的概念的语义信息,增强了框架的灵活性和适用性。通过实现这些技术,展示了该框架在三种不同场景下的实际应用效果,证明了其在提升概念提取效率和准确性以及可扩展性方面的潜力。 展开更多
关键词 大语言模型 可解释性 概念提取 自动化 可扩展性
在线阅读 下载PDF
护理科研中应用大语言模型的伦理风险与应对策略
15
作者 金孔军 孙一勤 +1 位作者 徐水琴 李辞 《护理研究》 北大核心 2026年第1期102-107,共6页
系统概述大语言模型在护理学术科研中的应用现状,分析其可能会对科研过程带来的伦理风险,从技术、制度和使用者3个层面列举伦理风险出现的影响因素,并从技术研发者角度、使用者角度、管理者角度、社会角度4个层面提出伦理应对策略,从而... 系统概述大语言模型在护理学术科研中的应用现状,分析其可能会对科研过程带来的伦理风险,从技术、制度和使用者3个层面列举伦理风险出现的影响因素,并从技术研发者角度、使用者角度、管理者角度、社会角度4个层面提出伦理应对策略,从而促进大语言模型在护理科研中规范化应用。 展开更多
关键词 大语言模型 护理 伦理 护理科研 应对策略
暂未订购
CompuDEX:基于区块链的大模型微调算力共享平台
16
作者 张凌浩 谭海波 +3 位作者 赵赫 陈中 程昊天 马志宇 《浙江大学学报(工学版)》 北大核心 2026年第1期1-18,共18页
利用分布在世界各地的闲置算力对大语言模型进行训练,有望提供全新的算力供应模式和削减训练成本.针对此方法存在的隐私风险、恶意攻击和信任缺失问题,提出基于区块链的大模型微调算力共享平台CompuDEX.充分利用区块链技术去信任、匿名... 利用分布在世界各地的闲置算力对大语言模型进行训练,有望提供全新的算力供应模式和削减训练成本.针对此方法存在的隐私风险、恶意攻击和信任缺失问题,提出基于区块链的大模型微调算力共享平台CompuDEX.充分利用区块链技术去信任、匿名的特性,提供无需信任中介且保护用户隐私的交易平台.利用智能合约和密码学工具促使算力提供者公平竞争,以进一步降低训练成本.基于零知识证明设计“红气球”激励机制与安全性方案,用于识别算力提供者的恶意行为并追责.通过对微调方法 LoRA的结构进行拆分,在不增加额外计算开销的前提下保护训练过程中的数据隐私.实验结果表明,在微调的前向传播阶段,计算成本仅为国内主流云服务提供商的8%~14%.通过增加并行节点的数量,运行时间可以从本地训练所需时间的175%显著减少到20%,甚至更低. 展开更多
关键词 区块链 大模型 微调 外包计算 隐私保护
在线阅读 下载PDF
基于小规模异构语言模型一致性委员会的数据剪枝方法
17
作者 王凯文 王蕴哲 +3 位作者 谈威 傅启明 陆悠 陈建平 《计算机应用研究》 北大核心 2026年第1期110-119,共10页
大型语言模型(LLMs)的微调效果高度依赖于训练数据的质量,但现有的基于单模型困惑度的数据评估方法存在困惑度偏差(低困惑度样本可能仍被错误预测)和跨模型分歧(不同模型对同一样本的困惑度不一致)的局限性。为此,该研究提出了一种基于... 大型语言模型(LLMs)的微调效果高度依赖于训练数据的质量,但现有的基于单模型困惑度的数据评估方法存在困惑度偏差(低困惑度样本可能仍被错误预测)和跨模型分歧(不同模型对同一样本的困惑度不一致)的局限性。为此,该研究提出了一种基于异构小语言模型委员会一致性的方法,从两个方面评估数据价值:一方面计算多模型对同一数据样本的困惑度的变异系数来量化模型间分歧;另一方面结合预测结果与基准答案的相似性来计算预测难度。综合这两方面的评估结果,提出MMCS(多模型一致性)指标,用于高质量训练数据筛选。实验结果表明,基于MMCS筛选的数据在两种主流LLM和三个公开数据集上的微调性能优于传统方法,在36次对比实验中有27次取得最优效果,为高效数据剪枝提供了新的思路,证实了基于多模型分歧的评估方法在提升数据边际效益方面的有效性。 展开更多
关键词 大语言模型 数据修剪 多模型委员会 困惑度
在线阅读 下载PDF
腰椎融合联合单侧固定治疗腰椎退行性疾病:生物力学、技术演化及临床应用 被引量:1
18
作者 张先绪 马忠 +3 位作者 刘欣 黄磊 沈文翔 罗志强 《中国组织工程研究》 北大核心 2026年第9期2334-2342,共9页
背景:腰椎退行性疾病是一种中老年人常见疾病,临床表现主要为腰背部疼痛和下肢功能障碍。传统上使用腰椎融合联合双侧椎弓根螺钉固定进行外科干预,但存在创伤大、并发症多等问题。而腰椎融合联合单侧椎弓根螺钉固定是一种新兴的微创治... 背景:腰椎退行性疾病是一种中老年人常见疾病,临床表现主要为腰背部疼痛和下肢功能障碍。传统上使用腰椎融合联合双侧椎弓根螺钉固定进行外科干预,但存在创伤大、并发症多等问题。而腰椎融合联合单侧椎弓根螺钉固定是一种新兴的微创治疗方式,具有较小的创伤和较低的并发症风险,已逐渐成为腰椎退行性疾病治疗的新选择。目的:探讨腰椎融合联合单侧椎弓根螺钉固定治疗腰椎退行性疾病的效果及优势。方法:通过检索中国知网和PubMed数据库2010年1月至2025年1月发表的相关文献,总结腰椎融合联合单侧椎弓根螺钉固定的临床研究及生物力学特点,以“腰椎融合术,单侧固定,双侧固定,生物力学,腰椎退行性疾病”为中文检索词,以“lumbar fusion,unilateral fixation,bilateral fixation,biomechanics,degenerative disease of the lumbar spine”为英文检索词,最终纳入70篇文献进行综述。结果与结论:①腰椎融合联合单侧椎弓根螺钉固定能有效减少手术创伤和术中失血量,提供与双侧椎弓根螺钉固定相似的生物力学稳定性,并降低邻近节段退变的风险;②单侧椎弓根螺钉固定在单节段及双节段腰椎退行性疾病治疗中已获得广泛认可,但在多节段腰椎退行性疾病中的应用效果仍需进一步研究;③腰椎融合联合单侧椎弓根螺钉固定为腰椎退行性疾病治疗提供了微创、安全的选择,未来需要更多高质量的研究验证其在复杂病例中的应用和长期疗效,进一步优化临床应用。 展开更多
关键词 腰椎退行性疾病 腰椎融合 单侧椎弓根螺钉固定 双侧椎弓根螺钉固定 微创手术 生物力学 邻近节段退变
暂未订购
保守治疗与微创钻孔引流术治疗尿毒症脑出血的临床疗效分析
19
作者 项莹 马世原 +2 位作者 乔洪波 王秋杰 鲁新 《中国实用医药》 2026年第4期31-34,共4页
目的分析尿毒症脑出血(ICH)患者采用保守治疗与微创钻孔引流术治疗的效果。方法选取69例尿毒症ICH患者,根据患者意愿不同分为对照组(n=32)和观察组(n=37)。对照组应用保守治疗,观察组在对照组基础上同时行微创钻孔引流术治疗。比较两组... 目的分析尿毒症脑出血(ICH)患者采用保守治疗与微创钻孔引流术治疗的效果。方法选取69例尿毒症ICH患者,根据患者意愿不同分为对照组(n=32)和观察组(n=37)。对照组应用保守治疗,观察组在对照组基础上同时行微创钻孔引流术治疗。比较两组手术效果,手术指标(住院时间、意识恢复时间、住院总费用),美国国立卫生研究院卒中量表(NIHSS)评分、格拉斯哥昏迷评分(GCS评分)及并发症发生情况。结果观察组总有效率94.59%比对照组的62.50%高(P<0.05);观察组住院时间(15.21±2.13)d、意识恢复时间(4.15±2.31)d均比对照组的(28.53±2.51)、(8.71±2.33)d短,住院总费用(12556.5±4.13)元比对照组的(15567.2±12.63)元少(P<0.05);术后6个月,两组NIHSS、GCS评分均较术前明显改善,且观察组NIHSS评分(3.85±2.63)分比对照组的(6.31±1.39)分低,GCS评分(14.83±0.11)分比对照组的(10.62±1.91)分高(P<0.05);观察组并发症发生率5.41%(2/37)比对照组的37.50%(12/32)低(P<0.05)。结论尿毒症ICH患者采取保守治疗与微创钻孔引流术治疗能够获得较好效果,优化临床指标,同时也可以改善神经功能,减少住院时间,另外该术式并发症少,安全性高,可推荐。 展开更多
关键词 微创钻孔引流术 尿毒症 脑出血 神经功能 手术效果
暂未订购
大语言模型压缩综述
20
作者 郭晋阳 贺昌义 +1 位作者 杨戈 刘祥龙 《计算机科学与探索》 北大核心 2026年第1期1-20,共20页
大语言模型由于强大的认知能力,在多个领域得到了广泛应用,成为人工智能领域的研究热点。然而,大语言模型对计算、存储资源的巨大需求,使其难以在资源受限的情境下使用。模型压缩与加速技术成为解决这一问题的关键手段,旨在保持模型性... 大语言模型由于强大的认知能力,在多个领域得到了广泛应用,成为人工智能领域的研究热点。然而,大语言模型对计算、存储资源的巨大需求,使其难以在资源受限的情境下使用。模型压缩与加速技术成为解决这一问题的关键手段,旨在保持模型性能的前提下,降低计算复杂度和存储成本。基于此,对大语言模型压缩与加速技术的前沿研究进行了全面的综述,旨在把握整个领域的发展现状与未来趋势,推动大语言模型压缩与加速技术的发展,助力其在工业界和学术界的应用落地。系统阐述了大语言模型在计算资源和存储成本方面面临的挑战;从模型剪枝、模型量化、知识蒸馏、低秩分解四个关键技术路径出发,梳理了各类方法的基本原理、典型方法和最新进展,并对主流技术进行了系统对比与总结。从推理效率、精度保持、部署难度等多个维度构建了评价体系,深入探讨了大语言模型压缩的评估指标和实验基准。最后,结合当前技术瓶颈,展望了大语言模型压缩的未来研究方向,为后续相关研究与工程实践提供了系统性参考。 展开更多
关键词 人工智能 大语言模型 模型压缩与加速
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部