期刊文献+
共找到934篇文章
< 1 2 47 >
每页显示 20 50 100
“数据-知识-模型”协同递归的智能化地理建模 被引量:2
1
作者 秦承志 朱良君 +8 位作者 陈子越 王祎杰 王玉靖 武成龙 樊星辰 赵芳鹤 任应超 朱阿兴 周成虎 《地球信息科学学报》 北大核心 2025年第5期1027-1040,共14页
[意义]地理建模是解决地理学相关的各种复杂实际问题的科学手段,但执行过程导向的传统地理建模方式给建模者(尤其是非专业用户)实际应用时带来沉重的建模负担。[方法]本文提出了智能化地理建模应该从用户的建模目标出发,形式化为初始的... [意义]地理建模是解决地理学相关的各种复杂实际问题的科学手段,但执行过程导向的传统地理建模方式给建模者(尤其是非专业用户)实际应用时带来沉重的建模负担。[方法]本文提出了智能化地理建模应该从用户的建模目标出发,形式化为初始的建模问题单元,以递归求解的思路逐步解决当前的建模问题单元,之后上溯推理形式化新的建模问题单元、相应求解出适用的地理模型(或其组成部分),从而实现根据用户实际应用问题的场景自动构建出合适的地理模型工作流。[进展]本文介绍了在此基本思想指导下,作者近年来开展的一系列智能化地理建模的方法研究工作,旨在有效降低实际应用中非专业用户的地理建模难度,同时保障所建模型的准确性。基于上述方法研究工作,可实现领域建模知识(尤其是案例化的应用场景知识)驱动、“数据-知识-模型”协同递归的智能化地理建模计算应用模式,基于此开发了原型系统——地理空间智能计算系统(EGC)。[展望]本文最后重点讨论了上述方法研究与当前兴起的利用大语言模型进行地理建模研究工作之间的关系,并讨论了下一步研究方向。 展开更多
关键词 地理建模 工作流 智能化地理建模 建模知识 应用场景知识 案例推理 地理计算
原文传递
人工智能大模型接地的凸显:理解的语境—情境关联
2
作者 王天恩 王金伟 《贵州大学学报(社会科学版)》 2025年第4期1-9,共9页
从大型语言模型ChatGPT发展到文生视频模型Sora,人工智能大模型接地成了重要话题。大模型接地构成了机器理解研究的巨大张力,空前凸显了语境和情境的关联。而探索和建立语境和情境之间的内在关联,已是人工智能大模型接地的关键环节。人... 从大型语言模型ChatGPT发展到文生视频模型Sora,人工智能大模型接地成了重要话题。大模型接地构成了机器理解研究的巨大张力,空前凸显了语境和情境的关联。而探索和建立语境和情境之间的内在关联,已是人工智能大模型接地的关键环节。人工智能理解能力的发展不仅必须基于人类语境的研究,而且必须从人类语境深入机器情境,建立起作为理解前提性基础的语境和情境内在关联。从大模型与自动驾驶汽车结合及以Sora为标志的文生视频模型到斯坦福人工智能小镇实验,系统凸显了语境和情境之间的关系。由此深入探索个中重要关联,不仅对人工智能大模型的接地具有重要意义,而且对人类理解研究的深化也具有特殊价值。作为与物理世界和社会行为的对接,大模型接地必须建立在语境—情境内在关联的基础之上。 展开更多
关键词 人工智能大模型 语境 情境 机器理解 接地
在线阅读 下载PDF
新医科背景下儿科学课程O-PIRTAS教学模式创新与实践
3
作者 李凤艳 靳培娜 +4 位作者 袁文华 牛杰朝 王怀立 魏二虎 禚志红 《卫生职业教育》 2025年第13期36-40,共5页
新医科的发展对医学教育提出了较高的实践性和综合性要求,儿科学课程因其独特的学科特点,需要创新课程教学模式。因此,本研究探讨基于O-PIRTAS教学模式的儿科学教学路径,分析O-PIRTAS教学模式7个环节在课程教学中的具体应用,包括目标设... 新医科的发展对医学教育提出了较高的实践性和综合性要求,儿科学课程因其独特的学科特点,需要创新课程教学模式。因此,本研究探讨基于O-PIRTAS教学模式的儿科学教学路径,分析O-PIRTAS教学模式7个环节在课程教学中的具体应用,包括目标设定、课前准备、教学视频、课堂回顾、知识测试、课堂活动、总结提升7个环节,通过教学实践验证其效果,并提出优化建议,为推动儿科学教学质量的提高提供理论与实践依据。 展开更多
关键词 新医科 儿科学 O-PIRTAS教学模式
在线阅读 下载PDF
基于CIPP模型的高校服务全民终身学习情况评价体系研究——以高职院校为例
4
作者 刘文胜 《长江工程职业技术学院学报》 2025年第4期47-52,共6页
高职院校是高校的重要组成部分,高校在建设服务全民终身学习的现代教育体系中具有不可替代的重要作用。新时代教育评价改革对探索开展高校服务全民终身学习情况评价提出了明确要求。为解决过往评价中存在的评价主体较为单一、社会服务... 高职院校是高校的重要组成部分,高校在建设服务全民终身学习的现代教育体系中具有不可替代的重要作用。新时代教育评价改革对探索开展高校服务全民终身学习情况评价提出了明确要求。为解决过往评价中存在的评价主体较为单一、社会服务评价指标不全、反馈与激励联动不佳、数字化评价能力不足等问题,基于CIPP评价模型,按照分类评价原则,构建了高职院校服务全民终身学习情况评价体系。 展开更多
关键词 教育评价改革 CIPP评价模型 全民终身学习 评价体系
在线阅读 下载PDF
基于提示生成和重排序的知识图谱补全研究
5
作者 王昊 范安宇 +1 位作者 谭思莹 段建勇 《北方工业大学学报》 2025年第2期13-26,共14页
知识图谱补全旨在利用现有数据推理并填补知识图谱中的缺失实体与关系。部分研究表明通过引入外部知识辅助推理的方法可以有效处理图谱补全中的长尾实体问题,然而现有的方法对支撑文本利用率低导致长尾实体推理能力不足。为此,本文提出... 知识图谱补全旨在利用现有数据推理并填补知识图谱中的缺失实体与关系。部分研究表明通过引入外部知识辅助推理的方法可以有效处理图谱补全中的长尾实体问题,然而现有的方法对支撑文本利用率低导致长尾实体推理能力不足。为此,本文提出一种基于预训练语言模型的自动提示生成方法,以帮助模型更好地利用知识图谱以及支撑文本。同时,为解决模型在专业领域存在的领域适应问题,本文设计了一种预测结果重排序方法,借助类比示例和相关语料辅助大型语言模型实现精准预测。实验结果表明,该模型显著提升了知识图谱补全性能,相较于基线模型的Hits@5和Hits@10评分在FB60K-NYT10数据集上分别提升了2.84%和3.50%,在UMLS-PubMed数据集上分别提升了1.59%和3.01%。 展开更多
关键词 知识图谱补全 大型语言模型 上下文学习 提示生成 重排序
在线阅读 下载PDF
基于医疗情境的O-PIRTAS教学模式对护生学习能力、自我效能及同理心的影响
6
作者 梁青 黄艳 陈江琼 《卫生职业教育》 2025年第15期77-81,共5页
目的 探讨基于医疗情境的O-PIRTAS教学模式对护生学习能力、自我效能及同理心的影响。方法 采用自身前后对照方法,选取进行内科护理学课程学习的2020级护理专业258名学生为研究对象,实施基于医疗情境的O-PIRTAS教学模式,对比教学前后护... 目的 探讨基于医疗情境的O-PIRTAS教学模式对护生学习能力、自我效能及同理心的影响。方法 采用自身前后对照方法,选取进行内科护理学课程学习的2020级护理专业258名学生为研究对象,实施基于医疗情境的O-PIRTAS教学模式,对比教学前后护生的自主学习能力、自我效能感以及同理心水平,评价教学效果。结果 教学后护生自主学习能力、自我效能感以及同理心水平均高于教学前,差异有统计学意义(P<0.05);相关性分析发现,是否曾担任班干部对护生自主学习能力、自我效能感以及同理心水平均有影响,且三者之间存在显著正相关关系(P<0.05)。结论 基于医疗情境的O-PIRTAS教学模式能够有效提高护生自主学习能力、自我效能感及同理心水平,在教学实践中应充分发挥班干部的模范作用,进一步提升教学效果。 展开更多
关键词 O-PIRTAS教学模式 医疗情境 自主学习能力 自我效能 同理心
在线阅读 下载PDF
基于大模型的医患对话摘要生成系统实现
7
作者 张旭 张丽 《中国数字医学》 2025年第4期47-54,共8页
目的:构建基于大模型的医患对话摘要生成系统,在无需任何标注数据的情况下,自动提取和总结医患对话中的关键医学信息。方法:借助规模较大的大语言模型对医患对话数据进行预标注,然后基于这批伪平行数据对参数规模较小的大语言模型进行训... 目的:构建基于大模型的医患对话摘要生成系统,在无需任何标注数据的情况下,自动提取和总结医患对话中的关键医学信息。方法:借助规模较大的大语言模型对医患对话数据进行预标注,然后基于这批伪平行数据对参数规模较小的大语言模型进行训练;推理阶段引入语境学习方法,提供少量示例结合指令工程,使大语言模型能更精准地理解医患对话,生成最终的摘要。结果:该研究构建的系统在保留关键医疗信息方面显著优于现有的无监督摘要生成技术及大语言模型。结论:使用大参数大语言模型对医患对话进行预标注,利用知识蒸馏方法可以实现小参数模型对大参数模型的能力继承,以降低对训练数据的依赖,提升模型通用性和可移植性。 展开更多
关键词 医患对话 摘要生成 语境学习 大语言模型
在线阅读 下载PDF
融合骨架大核算子和全局上下文信息的图卷积网络
8
作者 吴志泽 万龙 +4 位作者 洪芳华 汤正道 孙斐 邹乐 王晓峰 《中国图象图形学报》 北大核心 2025年第11期3604-3616,共13页
目的骨架数据不仅体量轻巧,而且其内在的拓扑结构与图卷积网络(graph convolution network,GCN)高度契合,基于图卷积网络的骨架人体行为识别技术在行为识别领域得到广泛关注。然而,传统图卷积难以有效建模远距离节点关系,从而限制了其... 目的骨架数据不仅体量轻巧,而且其内在的拓扑结构与图卷积网络(graph convolution network,GCN)高度契合,基于图卷积网络的骨架人体行为识别技术在行为识别领域得到广泛关注。然而,传统图卷积难以有效建模远距离节点关系,从而限制了其在复杂动作识别中的表现,针对这一问题,提出一种融合骨架大核算子和上下文信息的骨架图卷积网络(skeleton large-kernel and contextual GCN,SLK-GCN)。方法该方法从两种不同的角度实现空间特征的增强。首先设计一种新颖的骨架大核卷积算子(skeleton-large kernel convolution,SLKC),通过扩大感受野并增强通道适应性,以增强空间特征提取能力。具体而言,SLKC通过引入大核卷积网络,模拟节点之间的远程依赖关系,从而提升模型在处理空间复杂性时的表现。同时,SLKC利用扩展的感受野捕捉更多的全局信息,增强特征提取的深度和广度。此外,引入轻量级的全局上下文建模模块(global context modeling,GCM),该模块能够自动学习和适应骨架拓扑结构,并从全局视角整合上下文特征。GCM通过捕捉不同节点之间的全局关系,进一步提升了模型的表征能力和鲁棒性。结果所提出的SLK-GCN在NTU RGB+D、NTU RGB+D 120和Northwestern-UCLA数据集上的准确率分别为96.8%(最高)、91.0%和96.8%(最高),实验结果表明,SLK-GCN在人体行为识别任务中表现出了显著的优势。结论SLKC与GCM的引入和结合,使得SLK-GCN在处理复杂骨架数据时能够更加有效地提取和利用空间特征。 展开更多
关键词 人体骨架 行为识别 图卷积网络(GCN) 上下文建模 大核卷积
原文传递
说话者特征融合的对话情感识别模型 被引量:2
9
作者 刘欣雨 夏鸿斌 刘渊 《小型微型计算机系统》 北大核心 2025年第3期571-577,共7页
对话情感识别旨在预测对话中话语的情感.目前的方法大多只针对上下文信息进行建模,忽略了对说话者的建模.同时,语境在对话情感识别中起着至关重要的作用.为此,本文提出了说话者特征融合的对话情感识别模型.首先,将说话者名字作为标签进... 对话情感识别旨在预测对话中话语的情感.目前的方法大多只针对上下文信息进行建模,忽略了对说话者的建模.同时,语境在对话情感识别中起着至关重要的作用.为此,本文提出了说话者特征融合的对话情感识别模型.首先,将说话者名字作为标签进行特征提取,并在构造图结构时为说话者设置单独的节点.其次,分别构建全局对话、说话者在对话中对自己的情感影响和对其他说话者情感影响的图结构.然后,通过多头注意力获得体现对话语境的全局特征,将其与图卷积及门控循环单元融合获得分类特征.最后,通过前馈网络对话语情感进行分类.在IEMOCAP、MELD、EmoryNLP这3个基准数据集上的实验结果表明,该模型在性能指标上较其他基线模型均有一定提升. 展开更多
关键词 对话情感识别 上下文建模 说话者建模 图卷积网络 注意力机制
在线阅读 下载PDF
以AI塑形智慧图书馆:基于智能体的下一代图书馆服务平台 被引量:5
10
作者 刘炜 张磊 +1 位作者 嵇婷 陈晓扬 《农业图书情报学报》 2025年第5期15-26,共12页
[目的/意义]云计算时代提出的图书馆服务平台(LSP)未能实现其成为图书馆统一解决方案的承诺,在智慧图书馆时代又面临新的发展瓶颈。其相对刚性的架构、孤岛化的数据模型和有限的智能水平,难以满足现代用户对新型资源生态的获取,及主动... [目的/意义]云计算时代提出的图书馆服务平台(LSP)未能实现其成为图书馆统一解决方案的承诺,在智慧图书馆时代又面临新的发展瓶颈。其相对刚性的架构、孤岛化的数据模型和有限的智能水平,难以满足现代用户对新型资源生态的获取,及主动式服务的迫切需求。本文旨在提出一种基于大语言模型(LLM)智能体(Agent)的下一代LSP架构A-LSP,以解决现有LSP的局限性,并推动图书馆服务平台向人工智能时代转型。[方法/过程]该架构引入了一个新的3层概念模型,包括实现标准化工具集成的MCP市场、负责编排调度的智能体中间件,以及支持功能扩展的智能体应用生态层。同时,文章面向未来图书馆提出了“五大中心”的建设需求框架,即智慧资源中心、智慧服务中心、智慧学习中心、智慧学术交流中心与智慧文化传承中心,以构建图书馆技术与业务融合的蓝图。[结果/结论]研究提出的A-LSP架构通过基于模型上下文协议(MCP)的API封装,确保了对现有系统的后向兼容性,能够在不替换原有系统的基础上实施新的平台战略。这一基于智能体的图书馆服务平台可以看成是现有LSP的重要升级,将驱动其从以资源管理为中心转向以智能体服务为中心,成为人工智能时代的图书馆服务平台。 展开更多
关键词 智能体 智慧图书馆 图书馆服务平台 大语言模型 多智能体系统 模型上下文协议
在线阅读 下载PDF
基于大语言模型的配电主站日志异常检测 被引量:1
11
作者 王申 魏兴慎 +2 位作者 朱卫平 朱道华 关志涛 《电力系统自动化》 北大核心 2025年第11期178-188,共11页
日志异常检测是监控配电主站系统运行并识别异常行为的关键技术之一。已有的基于深度学习的日志异常检测方法依赖于大量带标注的训练数据,而在配电主站系统中缺少带标注训练数据,这会导致日志异常检测性能显著下降。文中基于大语言模型... 日志异常检测是监控配电主站系统运行并识别异常行为的关键技术之一。已有的基于深度学习的日志异常检测方法依赖于大量带标注的训练数据,而在配电主站系统中缺少带标注训练数据,这会导致日志异常检测性能显著下降。文中基于大语言模型的上下文推理特性,提出了一种无须训练的配电主站日志异常检测方案LogAdapt。所设计的上下文学习示例筛选算法针对不同的在线日志,从少量带标注的本地日志中动态筛选出若干高质量的上下文学习示例;结合任务描述和人类经验知识,自动构建出文本提示,以指导大语言模型完成配电主站日志异常检测任务。实验结果表明,所提方案相比现有方案性能更优。 展开更多
关键词 日志 异常检测 配电主站 大语言模型 上下文学习 深度学习
在线阅读 下载PDF
高不确定情境下的生态型商业模式创新战略--基于商业模式韧性视角的嵌入式案例比较研究 被引量:3
12
作者 李鸿磊 王红玉 赵阳阳 《管理学报》 北大核心 2025年第1期22-31,53,共11页
基于商业模式韧性视角,对两家中国大型成熟电商企业以及分别嵌套在其生态型商业模式中的两家成熟物流企业展开嵌入式案例比较研究。研究发现:在高不确定情境下,生态型商业模式价值主张实现方式的多样性越高,其商业模式韧性越强;生态型... 基于商业模式韧性视角,对两家中国大型成熟电商企业以及分别嵌套在其生态型商业模式中的两家成熟物流企业展开嵌入式案例比较研究。研究发现:在高不确定情境下,生态型商业模式价值主张实现方式的多样性越高,其商业模式韧性越强;生态型商业模式关键利益相关者的鲁棒性越强,其商业模式韧性越强;生态型商业模式价值活动系统的本地集群化程度越高,其商业模式韧性越强;生态型商业模式跨生态位价值活动的内聚化程度越高,其商业模式韧性越强。基于上述研究命题,提出了高不确定情境下生态型商业模式创新战略。 展开更多
关键词 高不确定情境 商业模式 生态型商业模式 商业模式韧性 商业模式创新战略
在线阅读 下载PDF
基于掩码区域一致性的半监督语义分割
13
作者 黄新桃 张鸿 《计算机技术与发展》 2025年第11期46-52,共7页
现有的半监督语义分割方法主要依赖单像素或全局特征进行监督,但对局部区域的空间结构利用较为有限,导致模型在区分外观相似类别时存在一定局限性。为此,该文提出了一种基于掩码区域一致性的半监督语义分割方法(MaskMatch),通过引入掩... 现有的半监督语义分割方法主要依赖单像素或全局特征进行监督,但对局部区域的空间结构利用较为有限,导致模型在区分外观相似类别时存在一定局限性。为此,该文提出了一种基于掩码区域一致性的半监督语义分割方法(MaskMatch),通过引入掩码区域一致性模块,将无标签数据中的空间关系作为额外监督信号,增强模型对局部结构的感知能力。此外,为进一步提升该模块的性能,提出了一种不确定性驱动的重采样策略,在训练过程中优先关注预测不确定性较高的无标签样本,以增强模型对困难实例的学习能力。具体而言,该方法在无标签图像上随机遮蔽部分区域,并通过约束模型预测结果与完整图像的伪标签保持一致,使模型能够利用上下文信息推理掩码区域的语义类别,从而提升特征表达的鲁棒性。在Pascal和Cityscapes两个基准数据集上进行了大量实验,结果表明该方法在多个标签比例设置下均能有效提升分割性能,验证了其有效性和优越性。 展开更多
关键词 半监督语义分割 空间上下文建模 掩码区域一致性 重采样 伪标签
在线阅读 下载PDF
多情景模拟下福州市土地利用变化对生态系统服务价值的影响 被引量:2
14
作者 刘凡可 肖桂荣 《国土与自然资源研究》 2025年第3期26-30,共5页
本文以福州市为研究区,基于四期土地利用数据和生态系统服务价值评估模型,设定耕地保护、城市发展、生态保护和自然发展4种情景,运用MCCA模型模拟出2035年不同情景下土地利用变化对福州市生态系统服务价值的影响。结果表明,建设用地显... 本文以福州市为研究区,基于四期土地利用数据和生态系统服务价值评估模型,设定耕地保护、城市发展、生态保护和自然发展4种情景,运用MCCA模型模拟出2035年不同情景下土地利用变化对福州市生态系统服务价值的影响。结果表明,建设用地显著增加会导致耕地、林地和草地总量降低,造成ESV降低。生态保护情景放缓了建设用地扩展速率,林地资源的恢复使其ESV出现了上涨,是最符合福州市未来国土空间规划的土地利用优化最优情景。林地和水域是影响生态质量最显著的两种地类,未来规划过程中应加大对林地和水域的保护与治理。研究结果可为福州市土地利用格局完善和生态环境质量提高提供参考依据。 展开更多
关键词 土地利用模拟 MCCA模型 多情景 生态系统服务价值 福州市
在线阅读 下载PDF
基于大语言模型(LLM)与模型上下文协议(MCP)驱动的智能音频制作系统研发 被引量:1
15
作者 郑嘉庆 杨璨 《现代电影技术》 2025年第7期24-32,共9页
本研究基于影视与游戏音频制作领域的实际需求,针对传统音频检索繁琐、数字音频工作站(DAW)操作自动化水平不足等问题,提出了一种智能化音频制作系统。该系统依托大语言模型(LLM)与模型上下文协议(MCP),结合数字音频工作站REAPER的开放... 本研究基于影视与游戏音频制作领域的实际需求,针对传统音频检索繁琐、数字音频工作站(DAW)操作自动化水平不足等问题,提出了一种智能化音频制作系统。该系统依托大语言模型(LLM)与模型上下文协议(MCP),结合数字音频工作站REAPER的开放式脚本框架ReaScript与Python扩展,实现了音频素材的智能检索与指令驱动的自动化操作。系统以模型上下文协议为底层架构,有效打通了自然语言交互与数字音频工作站自动化控制之间的桥梁。在“夏日雨后校园”音频场景下开展的实验表明,本系统能够通过模糊查找和联想式搜索准确找到所需音频素材,指令式操作方式显著降低了音频制作的技术门槛。相较于传统流程,艺术工作者可更加专注于创意表达而非繁琐操作。未来,本系统将进一步扩展对多种音频数据流及主流数字音频工作站的适配,并持续丰富音频素材数据库,为智能化音频生产提供坚实的技术保障。 展开更多
关键词 大语言模型 模型上下文协议 影视声音制作 游戏声音制作 REAPER
在线阅读 下载PDF
支持上下文感知的图结构混合访问控制模型
16
作者 陈函 袁凌云 +2 位作者 张黔会 戴晖 保昊辰 《计算机应用研究》 北大核心 2025年第5期1490-1499,共10页
针对现有访问控制模型在高负载情况下性能不足、缺乏对上下文信息的综合考虑等问题,提出一种支持上下文感知的图结构访问控制模型G-RABAC(graph-based role and attribute-based access control)。首先,G-RABAC结合RBAC(role-based acce... 针对现有访问控制模型在高负载情况下性能不足、缺乏对上下文信息的综合考虑等问题,提出一种支持上下文感知的图结构访问控制模型G-RABAC(graph-based role and attribute-based access control)。首先,G-RABAC结合RBAC(role-based access control)与ABAC(attribute-based access control)模型,将基于ABAC的访问控制策略可视化为授权图,定义角色间的关系为特殊的主体属性,实现了属性和上下文信息的高效管理。其次,构建了基于G-RABAC的访问控制框架,并设计了基于上下文的访问控制决策算法和风险感知算法,实现了支持多维上下文感知的访问控制。在此基础上,集成区块链和G-RABAC模型,设计了用户身份合法性验证合约,结合Web3.0技术有效监控和处理用户访问行为,提升了访问控制的安全性和透明性。实验结果表明,G-RABAC模型的访问控制效率显著提升,与所选基线方案相比,访问控制时间开销基本维持在230 ms以内,且能够在多用户并发场景中支持安全且细粒度的访问控制,具备更高的灵活性和扩展性。 展开更多
关键词 混合访问控制 图模型 上下文感知 区块链
在线阅读 下载PDF
基于图文对比融合的图像人物情感识别
17
作者 田雨乐 王一丁 《计算机应用研究》 北大核心 2025年第7期1972-1977,共6页
基于上下文背景识别图像中人物情感是近年来越来越受欢迎的一项任务,在许多领域都具有应用价值。现有的大部分方法只是分别编码人物主体与背景,提取出孤立的特征进行简单交互,缺乏有效的主体与上下文背景的特征融合机制,为了解决复杂背... 基于上下文背景识别图像中人物情感是近年来越来越受欢迎的一项任务,在许多领域都具有应用价值。现有的大部分方法只是分别编码人物主体与背景,提取出孤立的特征进行简单交互,缺乏有效的主体与上下文背景的特征融合机制,为了解决复杂背景与人物主体的交互关系问题,提出了一种基于图文对比融合的图像人物情感识别网络。首先充分利用视觉语言大模型广泛的社会背景信息与推理能力,设计提示词提取上下文背景与目标人物主体之间情感状态的文本描述;其次提出了一个图文对比融合模块,将裁剪出的目标人物主体图像特征和依据提示词获取的文本描述特征通过该模块进行融合;最后,融合算法引入对比损失函数,对图像编码和文本编码统一表示,在融合时可以更准确地捕捉到有效的情感表达。实验结果表明,该网络能够学习到更有效的情感特征表示,在EMOTIC数据集上取得了优越的结果,mAP达到37.30%。该方法更好地结合了图像人物与背景特征,提高了图像人物情感识别的准确率。 展开更多
关键词 情感识别 视觉语言模型 情境感知 多模态融合
在线阅读 下载PDF
大语言模型长文本推断优化技术综述
18
作者 陶伟 王健宗 +1 位作者 张旭龙 瞿晓阳 《大数据》 2025年第6期72-94,共23页
随着大语言模型技术的快速发展,其处理长文本输入的需求日益增加,但长文本推断面临内存消耗大和时延高的问题。为提高大语言模型在长文本推断中的效率,对现有优化技术进行了全面回顾和分析。首先,揭示了影响效率的三大关键因素:一是庞... 随着大语言模型技术的快速发展,其处理长文本输入的需求日益增加,但长文本推断面临内存消耗大和时延高的问题。为提高大语言模型在长文本推断中的效率,对现有优化技术进行了全面回顾和分析。首先,揭示了影响效率的三大关键因素:一是庞大的模型体量,二是具有二次计算复杂度的注意力机制操作,三是自回归式的解码策略。这些因素共同制约了模型的整体性能表现。随后,提出了一种分类方法,将优化技术分为模型优化、计算优化和系统优化,并详细介绍了量化、稀疏注意力、算子融合等关键技术。研究结果表明,这些优化技术能有效提升长文本推断的性能。最后,展望了未来研究方向,强调了进一步优化大语言模型长文本推断的重要性,以满足不断增长的长文本推断需求。 展开更多
关键词 大语言模型 长文本推断 模型优化 计算优化 系统优化
在线阅读 下载PDF
基于查询感知和信息压缩的检索增强语言模型 被引量:2
19
作者 何欣洋 何智毅 +1 位作者 任思远 彭程 《计算机应用》 北大核心 2025年第S1期24-29,共6页
检索增强生成(RAG)已经成为了解决大语言模型(LLM)存在幻觉、无法获取最新知识等问题的主要方法。然而,目前的RAG方法普遍将检索到的所有文档一起输入到LLM中,没有对不相关的文档进行识别,并且没有考虑单个文档中的噪声对LLM性能的影响... 检索增强生成(RAG)已经成为了解决大语言模型(LLM)存在幻觉、无法获取最新知识等问题的主要方法。然而,目前的RAG方法普遍将检索到的所有文档一起输入到LLM中,没有对不相关的文档进行识别,并且没有考虑单个文档中的噪声对LLM性能的影响,而这些不相关的文档和文档中的噪声会误导LLM生成错误的答案,降低模型性能,并增加LLM的推理时间。针对上述问题,提出一种基于查询感知和信息压缩的检索增强语言模型。首先,在检索过程完成后,通过信息压缩模块利用关键句抽取模块来选择单个文档中的关键句;其次,通过重排器模块选择文档集中最相关的文档,从而达到去除文档中的噪声和过滤不相关文档的目的;最后,提出基于查询感知的上下文学习(ICL)模块,通过在训练集中检索与输入最相似的示例对并把它们插入到LLM的上下文中,利用LLM的ICL能力来提高模型性能。实验结果显示,相比最好的基线模型REAR(RElevance-Aware Retrieval-augmented framework),所提模型在NQ(Natural Questions)、SQuAD(Stanford Question Answering Dataset)和TQA(TriviaQA)数据集的F1值上分别获得了0.70、0.96、1.23个百分点的提升,在NQ和SQuAD数据集的EM(Exact Match)值上分别获得了1.13和0.82个百分点的提升,证明了所提模型在开放域问答(ODQA)任务上的有效性。此外,由于所提出的模型无需额外训练,降低了对计算资源的需求,并且该模型可以应用到任意LLM中,体现了所提模型广泛的适用性。 展开更多
关键词 检索增强生成 大语言模型 上下文学习 信息压缩 开放域问答
在线阅读 下载PDF
基于全局体素特征交互的3D目标检测算法
20
作者 刘明杰 魏宇 +2 位作者 陈俊生 刘平 朴昌浩 《仪器仪表学报》 北大核心 2025年第9期146-158,共13页
针对当前多数基于激光雷达的3D目标检测方法中因局部感受野限制无法建模特征远距离依赖,以及对点云数据的窗口划分策略导致的拓扑结构破坏等问题,提出了一种基于全局体素特征交互的3D点云目标检测网络。首先,设计基于希尔伯特空间曲线和... 针对当前多数基于激光雷达的3D目标检测方法中因局部感受野限制无法建模特征远距离依赖,以及对点云数据的窗口划分策略导致的拓扑结构破坏等问题,提出了一种基于全局体素特征交互的3D点云目标检测网络。首先,设计基于希尔伯特空间曲线和Mamba的长距离上下文特征提取模块,通过对体素空间进行希尔伯特曲线序列化并保持体素间的空间局部性,利用Mamba处理长序列的优势提取具有长距离依赖的点云上下文特征,显著提升算法对长程依赖的建模能力。其次,设计基于特征图响应强度的自适应体素扩散模块,进行体素之间大规模的长程特征交互,通过动态生成扩散体素对目标中心体素的语义表达能力进行增强。此外,提出了一种空间特征恢复算子,通过子流形卷积的局部结构保持能力和Mamba的全局建模特性,对局部和全局特征表达进一步进行协同优化,用于补充序列化和体素聚合过程引入的信息损失。在KITTI数据集进行了实验,结果表明,方法达到了先进的3D目标检测性能,在汽车、行人和骑行者这3种类别的中等检测难度下精度分别达到了82.36%、61.96%、66.05%,同时推理速度达到19 fps,相比于基准模型,该方法较好地保持了精度和效率间的平衡。同时,在实际道路场景中进行了可视化对比分析,该方法表现出较强的泛化能力和实际应用潜力。 展开更多
关键词 目标检测 激光雷达 体素特征交互 Mamba模型 全局上下文
原文传递
上一页 1 2 47 下一页 到第
使用帮助 返回顶部