期刊文献+
共找到580,566篇文章
< 1 2 250 >
每页显示 20 50 100
基于图神经网络和注意力的点击率预测模型
1
作者 张峰 张涛 +2 位作者 花强 董春茹 朱杰 《河北大学学报(自然科学版)》 北大核心 2026年第1期93-103,共11页
为了充分利用特征间的高阶交互以提升点击率预测模型的预测精度,提出了一种基于图神经网络和注意力的点击率预测模型VBGA (vector-wise and bit-wise interaction model based on GNN and attention),该模型借助图神经网络和注意力机制... 为了充分利用特征间的高阶交互以提升点击率预测模型的预测精度,提出了一种基于图神经网络和注意力的点击率预测模型VBGA (vector-wise and bit-wise interaction model based on GNN and attention),该模型借助图神经网络和注意力机制,为每个特征分别学习一个细粒度的权重,并将这种细粒度的特征权重输入到向量级交互层和元素级交互层联合预测点击率.VBGA模型主要由向量级交互层和元素级交互层构成,其中向量级交互层采用有向图来构建向量级的特征交互,实现无重复的显式特征交互,在减少计算量的同时,还可以实现更高阶的特征交叉,以获得更准确的预测精度.此外,本文还提出了一种交叉网络用于构建元素级特征交互.在Criteo和Avazu数据集上,与其他几种最先进的点击率预测模型进行了比较,实验结果表明,VBGA可以获得良好的预测结果. 展开更多
关键词 点击率预测 注意力机制 图神经网络 多阶特征交互
在线阅读 下载PDF
一种用于口罩佩戴检测的轻量级YOLOv5s改进算法
2
作者 沈记全 马帅 +1 位作者 罗军伟 张霄宏 《河南理工大学学报(自然科学版)》 北大核心 2026年第1期153-160,共8页
目的为了在公共场所准确地检测口罩佩戴并根据检测结果进行人性化提醒,提出一种轻量化的YOLOv5s网络结构,并以此为基础构建一种快速的口罩佩戴检测方案,以应对真实场景中对口罩佩戴检测速度和准确性的双重要求。方法首先,对快速空间金... 目的为了在公共场所准确地检测口罩佩戴并根据检测结果进行人性化提醒,提出一种轻量化的YOLOv5s网络结构,并以此为基础构建一种快速的口罩佩戴检测方案,以应对真实场景中对口罩佩戴检测速度和准确性的双重要求。方法首先,对快速空间金字塔池化进行改进,用深度卷积替换原来的卷积,以达到对快速空间金字塔池化进行轻量化的目的;其次,提出自校准通道注意力机制,它由两级通道交互构成,第一级交互用于获取邻近通道之间的相关性并根据相关性计算通道权重,第二级交互用于在更大的通道范围内对第一级交互得到的通道权重进行校准,该机制已经应用在网络的Neck部分;再次,对加权双向特征金字塔网络进行改进,增加大尺度特征图和小尺度特征图的融合路径,以丰富融合后的小尺度特征图中包含的细节信息;最后,利用GhostConv模块和C3Ghost模块分别替换Backbone和Neck部分的Conv模块和C3模块,从而降低网络的计算量和参数量,达到对Backbone和Neck进行轻量化的目的。结果在自制数据集和公共数据集Moxa3K上的实验结果表明,所提方法与YOLOv5s相比,mAP分别提高了3.1%和2.9%,参数量分别降低了46.8%和46.8%,检测速度分别提升了25%和29.1%。结论实验结果证明了所提方法的有效性。 展开更多
关键词 口罩佩戴检测 YOLOv5 轻量化 注意力机制 双向特征融合
在线阅读 下载PDF
融合主题和实体嵌入的双向提示调优事件论元抽取
3
作者 陈千 成凯璇 +3 位作者 郭鑫 张晓霞 王素格 李艳红 《计算机科学》 北大核心 2026年第1期278-284,共7页
近年来,提示学习在自然语言处理领域得到了广泛应用。据调研,论元角色与文本中的主题往往有高度的语义相关性,且现有的提示调优方法忽略了实体信息和论元之间的交互。为此,提出一种融合主题和实体嵌入的双向提示调优事件论元抽取模型(TE... 近年来,提示学习在自然语言处理领域得到了广泛应用。据调研,论元角色与文本中的主题往往有高度的语义相关性,且现有的提示调优方法忽略了实体信息和论元之间的交互。为此,提出一种融合主题和实体嵌入的双向提示调优事件论元抽取模型(TEPEAE)。首先,使用主题模型提取主题特征并进行主题嵌入化表示;其次,基于触发词、论元和实体信息构建提示模板,并将主题嵌入融入模板;然后,利用掩码语言模型预测每个实体的角色标签;最后,将标签从标签词空间映射到论元角色空间。在ACE2005-EN和ERE-EN数据集上的实验结果表明,TEPEAE优于基线模型,F1值分别达到79.53%和78.60%,验证了TEPEAE的有效性。此外,其在低资源场景下依然展现出卓越的性能,进一步证明其具有更强的鲁棒性。 展开更多
关键词 提示学习 事件论元抽取 实体嵌入 主题嵌入 注意力机制
在线阅读 下载PDF
面向高光谱遥感图像的MMRI-Boruta特征选择算法
4
作者 张婧 孔霄 +2 位作者 曹峰 张超 李德玉 《郑州大学学报(理学版)》 北大核心 2026年第1期72-77,共6页
高光谱遥感图像特征选择旨在从高维光谱特征集中选择最优光谱特征子集,以消除冗余光谱特征来提高高光谱遥感图像分析的效率和精度。由此提出了一种混合型特征选择算法MMRI-Boruta,该算法首先对过滤式MRI特征选择算法进行改进,通过引入... 高光谱遥感图像特征选择旨在从高维光谱特征集中选择最优光谱特征子集,以消除冗余光谱特征来提高高光谱遥感图像分析的效率和精度。由此提出了一种混合型特征选择算法MMRI-Boruta,该算法首先对过滤式MRI特征选择算法进行改进,通过引入方差定义新的特征重要性评价指标,然后利用封装式的Boruta算法实现特征子集的进一步优化。所提算法结合了过滤式和封装式两种特征选择算法的优点,更易于获取最优特征子集。为了验证该算法的有效性,使用了两个经典的高光谱遥感图像数据集Indian Pines和Salinas对算法的性能进行了测试,实验结果表明该算法优于对比算法。 展开更多
关键词 高光谱遥感图像 特征选择 互信息 相关性
在线阅读 下载PDF
LDD-YOLO:改进YOLOv8的轻量级密集行人检测算法
5
作者 杨迪 张喜龙 王鹏 《计算机科学与探索》 北大核心 2026年第1期251-265,共15页
针对当前行人检测算法在密集场景中由于遮挡和尺度变化导致的漏检、误检,以及模型计算复杂度高等问题,提出了一种基于YOLOv8的轻量级密集行人检测方法(LDD-YOLO),以实现检测效率与精度的平衡。设计了一种重参数化层聚合网络RELAN,融合... 针对当前行人检测算法在密集场景中由于遮挡和尺度变化导致的漏检、误检,以及模型计算复杂度高等问题,提出了一种基于YOLOv8的轻量级密集行人检测方法(LDD-YOLO),以实现检测效率与精度的平衡。设计了一种重参数化层聚合网络RELAN,融合了重参数化卷积和多分支结构,分别在训练阶段和推理阶段强化特征表达能力与模型推理效率。引入了分离式大卷积核注意力机制的空间金字塔池化模块SPPF-LSKA,结合分离式大卷积核操作以扩大感受野,增强对密集目标的特征捕获能力,抑制背景干扰。为解决YOLOv8在特征处理中未能充分挖掘局部与全局信息的局限性,提出了一种改进的多尺度特征融合模块FFDM,通过融合多尺度特征信息,提升模型密集行人检测的特征表达能力。设计了一种轻量化的特征对齐检测头LSCSBD,利用不同特征层级之间的共享卷积层,提高参数利用效率并减少冗余计算。在CrowdHuman与WiderPerson数据集上的对比实验结果表明,LDD-YOLO在总体性能上优于对比模型,实现了精度与效率的平衡。 展开更多
关键词 密集行人检测 YOLO 重参数化 可分离大核注意力机制 多尺度特征融合 轻量化
在线阅读 下载PDF
融合生成扩散模型的不完全多模态情绪识别
6
作者 马飞 王玉婷 +1 位作者 杨飞霞 徐光宪 《计算机科学与探索》 北大核心 2026年第1期206-216,共11页
人类多模态情绪识别将文本、视觉和声音等各种异构模态数据用于感知并理解人类情感。与单一模态相比,多模态数据中的互补信息有助于更稳健地理解情感。然而,在实际多模态场景中常存在不完全或缺失模态信息,严重阻碍对多模态特征的理解,... 人类多模态情绪识别将文本、视觉和声音等各种异构模态数据用于感知并理解人类情感。与单一模态相比,多模态数据中的互补信息有助于更稳健地理解情感。然而,在实际多模态场景中常存在不完全或缺失模态信息,严重阻碍对多模态特征的理解,从而导致情绪识别精度下降。针对以往的多模态情绪识别方法未能有效地处理模态在不完全或缺失情况下产生的识别精度下降的问题,提出了一种融合生成扩散模型的不完全多模态情绪识别方法,通过重构不完全模态数据信息,以提升情绪识别的精度。构建基于跨模态条件随机微分方程的生成扩散模型,在逆扩散过程中将可用模态信息通过可学习投影转化为漂移项的动态约束,生成不完全模态信息特征;构建不完全模态生成网络与融合重构模块的双向协同优化框架,利用联合目标函数实现生成质量与特征融合的梯度反向传播交互,通过分层注意力机制建立补全的不完全模态特征与真实特征的情感语义一致性约束。经过几组数据集测试结果表明,所提出的多模态情绪识别方法在多种不完全模态场景中取得了优越的情绪识别性能。 展开更多
关键词 多模态情绪识别 得分网络补全 融合重构
在线阅读 下载PDF
Informer-LSTM融合算法在蓝莓基质温湿度预测中的研究与应用
7
作者 胡玲艳 陈鹏宇 +6 位作者 郭占俊 徐国辉 秦山 付康 盖荣丽 汪祖民 张雨萌 《郑州大学学报(理学版)》 北大核心 2026年第1期78-86,共9页
为了精准预测温室蓝莓基质的温湿度变化趋势,提出一种融合Informer-LSTM算法的温湿度预测方法。以温室蓝莓现场环境数据为研究对象,使用LSTM算法捕捉时间序列数据中的依赖关系并与自注意力机制相结合,使模型在聚焦自注意力特征的同时兼... 为了精准预测温室蓝莓基质的温湿度变化趋势,提出一种融合Informer-LSTM算法的温湿度预测方法。以温室蓝莓现场环境数据为研究对象,使用LSTM算法捕捉时间序列数据中的依赖关系并与自注意力机制相结合,使模型在聚焦自注意力特征的同时兼顾LSTM特征,以增强其长期记忆力。在生成初步预测序列后,再应用LSTM算法修正模型的短期注意力,提高模型的反应速度。实验结果显示,Informer-LSTM预测模型在预测准确率、鲁棒性和响应速度等方面都有显著的优势。当温度湿度等时序输入数据发生明显变化时,模型能快速捕获短期内输入数据的动态模式变化。该模型在智慧温室管理中,对辅助人工决策及实现智能化控制具有较高实际价值。 展开更多
关键词 智慧农业 温室蓝莓 Informer模型 LSTM模型 温湿度预测
在线阅读 下载PDF
基于多方位感知深度融合检测头的目标检测算法
8
作者 包晓安 彭书友 +3 位作者 张娜 涂小妹 张庆琪 吴彪 《浙江大学学报(工学版)》 北大核心 2026年第1期32-42,共11页
针对传统目标检测头难以有效捕捉全局信息的问题,提出基于多方位感知深度融合检测头的目标检测算法.通过在检测头部分设计高效双轴窗口注意力编码器(EDWE)模块,使网络能够深度融合捕获到的全局信息与局部信息;在特征金字塔结构之后使用... 针对传统目标检测头难以有效捕捉全局信息的问题,提出基于多方位感知深度融合检测头的目标检测算法.通过在检测头部分设计高效双轴窗口注意力编码器(EDWE)模块,使网络能够深度融合捕获到的全局信息与局部信息;在特征金字塔结构之后使用重参化大核卷积(RLK)模块,减小来自主干网络的特征空间差异,增强网络对中小型数据集的适应性;引入编码器选择保留模块(ESM),选择性地累积来自EDWE模块的输出,优化反向传播.实验结果表明,在规模较大的MS-COCO2017数据集上,所提算法应用于常见模型RetinaNet、FCOS、ATSS时使AP分别提升了2.9、2.6、3.4个百分点;在规模较小的PASCAL VOC2007数据集上,所提算法使3种模型的AP分别实现了1.3、1.0和1.1个百分点的提升.通过EDWE、RLK和ESM模块的协同作用,所提算法有效提升了目标检测精度,在不同规模的数据集上均展现了显著的性能优势. 展开更多
关键词 检测头 目标检测 Transformer编码器 深度融合 大核卷积
在线阅读 下载PDF
基于多尺度滑窗注意力时序卷积网络的脑电信号分类
9
作者 李宪华 杜鹏飞 +2 位作者 宋韬 邱洵 蔡钰 《浙江大学学报(工学版)》 北大核心 2026年第2期370-378,共9页
为了提升运动想象脑电(MI-EEG)信号的分类精度,提出多尺度滑窗注意力时序卷积网络(MSWATCN),充分挖掘MI-EEG信号的时空信息.结合多尺度双流分组卷积、滑动窗口多头注意力机制和窗口化时间卷积模块,实现对MI-EEG信号复杂时空特性的精准解... 为了提升运动想象脑电(MI-EEG)信号的分类精度,提出多尺度滑窗注意力时序卷积网络(MSWATCN),充分挖掘MI-EEG信号的时空信息.结合多尺度双流分组卷积、滑动窗口多头注意力机制和窗口化时间卷积模块,实现对MI-EEG信号复杂时空特性的精准解码.利用多尺度卷积模块提取信号的底层时空特征,通过滑动窗口注意力机制聚焦局部关键特征,突出对分类任务重要的信息.窗口化时间卷积模块通过建模时间序列中的长期依赖关系,增强模型处理时序信息的能力.实验结果表明,MSWATCN在BCI Competition IV 2a和2b数据集上的分类准确率和一致性优于对比网络和基准模型. 展开更多
关键词 运动想象 多尺度卷积 多头注意力机制 滑动窗口 时序卷积网络
在线阅读 下载PDF
面向视觉算法的知识蒸馏研究综述
10
作者 潘海为 于丰铭 +3 位作者 张可佳 兰海燕 孟庆宇 李哲 《计算机研究与发展》 北大核心 2026年第1期90-122,共33页
知识蒸馏作为深度学习中的关键技术,通过将大型教师模型的知识传递给较小的学生模型,实现了模型的压缩与加速。在保证性能的前提下,显著减少了计算资源和存储需求,促进了高性能模型在资源受限的边缘设备上的部署。围绕知识蒸馏的最新研... 知识蒸馏作为深度学习中的关键技术,通过将大型教师模型的知识传递给较小的学生模型,实现了模型的压缩与加速。在保证性能的前提下,显著减少了计算资源和存储需求,促进了高性能模型在资源受限的边缘设备上的部署。围绕知识蒸馏的最新研究进展进行了系统性的综述,从知识类型和师生模型架构2个角度对知识蒸馏进行分类,详细汇总了输出特征知识、中间特征知识、关系特征知识3种典型知识类型的蒸馏方法,以及卷积架构到卷积架构、卷积架构到ViT(vision Transformer)架构、ViT架构到卷积架构和ViT架构到ViT架构的蒸馏方法;探讨了离线蒸馏、在线蒸馏、自蒸馏、无数据蒸馏、多教师蒸馏和助理蒸馏的学习方式;归纳了基于蒸馏过程、知识结构、温度系数及损失函数的蒸馏优化方法,分析了对抗性技术、自动机器学习、强化学习和扩散模型对蒸馏的改进,并总结了蒸馏技术在常见应用中的实现。尽管知识蒸馏取得了显著进展,但在实际应用和理论研究中仍面临诸多挑战。最后,对这些问题进行了深入分析,并对未来发展方向提出了见解。 展开更多
关键词 知识蒸馏 模型压缩 深度学习 卷积神经网络 视觉Transformer
在线阅读 下载PDF
基于多模态语义信息的文本生成图像方法
11
作者 杨冰 周家辉 +1 位作者 姚金良 向学勤 《浙江大学学报(工学版)》 北大核心 2026年第2期360-369,共10页
针对文本语义与图像语义不一致以及图像细节表现不足的问题,提出新的文本生成图像方法.基于多模态语义信息建立鉴别依据,在文本语义基础上引入真实图像语义,以解决文本描述信息密度低的问题,有效缓解生成图像细节缺失或失真的现象.在生... 针对文本语义与图像语义不一致以及图像细节表现不足的问题,提出新的文本生成图像方法.基于多模态语义信息建立鉴别依据,在文本语义基础上引入真实图像语义,以解决文本描述信息密度低的问题,有效缓解生成图像细节缺失或失真的现象.在生成器中集成可变形卷积和星模块卷积,增强生成器表达能力,提高生成图像的细节表现和整体质量.为了验证所提方法的有效性,在CUB数据集和COCO数据集上进行模型训练及评估.与生成式对抗对比语言-图像预训练模型(GALIP)相比,所提方法在保证高效生成的同时,在细节表现、语义一致性及整体质量上具有显著优势. 展开更多
关键词 文本生成图像 多模态语义 可变形卷积 星模块卷积 语义对齐鉴别器
在线阅读 下载PDF
用户数据驱动的App消退功能研究
12
作者 贾经冬 侯鑫 +1 位作者 王哲 黄坚 《计算机科学》 北大核心 2026年第1期262-270,共9页
为有效促进App功能迭代,现有大量研究通过挖掘用户评论来改善或增加新功能以促进版本更新,但忽视了从用户评论中识别应该消退的功能。针对此问题,提出了用户数据驱动的App消退功能分析方法。首先从应用市场采集用户评论,构建关键字模板... 为有效促进App功能迭代,现有大量研究通过挖掘用户评论来改善或增加新功能以促进版本更新,但忽视了从用户评论中识别应该消退的功能。针对此问题,提出了用户数据驱动的App消退功能分析方法。首先从应用市场采集用户评论,构建关键字模板过滤出含消退功能的评论,应用语法范式从中挖掘功能短语,并训练分类器识别功能短语以提取出待研究的消退功能,从而构建消退功能数据集。根据版本更新日志和用户评论回溯找到消退功能的生命周期。然后进行消退功能生命周期的用户评论分析。基于文本情感分析,提出字数权重阈值法对虚假评分进行检测和更正,运用BERT进行评论文本分类,提出BERTopic-Corex主题模型产生主题词,结合之前的分析结果和评论字数识别出关键用户评论,实现了从用户评论中有效分析和识别消退功能。实验结果和实例证明了所提方法的可行性和有效性。 展开更多
关键词 消退功能 用户评论 评论分类 虚假评分 主题模型
在线阅读 下载PDF
基于关系一致性的多分支对比学习算法
13
作者 冯慧敏 吕巧莉 陈俊芬 《河北大学学报(自然科学版)》 北大核心 2026年第1期104-112,共9页
传统对比学习算法进行实例判别时容易引入虚假负样本,导致模型收敛于次优解,影响下游任务性能.为此,提出一种基于关系一致性的多分支对比学习算法.该算法在分支网络中挖掘近邻集,提供语义一致的正样本,避免产生假的负样本.结合数据增强... 传统对比学习算法进行实例判别时容易引入虚假负样本,导致模型收敛于次优解,影响下游任务性能.为此,提出一种基于关系一致性的多分支对比学习算法.该算法在分支网络中挖掘近邻集,提供语义一致的正样本,避免产生假的负样本.结合数据增强的多分支网络,最小化KL散度拉近语义一致性的正样本推开负样本,提升网络的特征表达能力.不同分支的温度控制输出分布的平滑性,保证特征表示的真实可靠性.最后在5个数据集上测试所提算法,并与其他先进方法进行对比,均获得令人满意的结果. 展开更多
关键词 对比学习 关系一致性 特征表示 假负样本对 数据增强
在线阅读 下载PDF
基于脑电多尺度特征和图神经网络的紧急制动行为识别
14
作者 闫光辉 黄霄 常文文 《浙江大学学报(工学版)》 北大核心 2026年第2期404-414,共11页
现有技术主要依赖传统的时频域特征,对脑活动空间域特征的研究不足.为了实现对紧急制动意图和正常驾驶的分类识别,提出融合多尺度卷积、脑功能网络和图卷积神经网络的新模型.利用多尺度卷积提取时频域融合的多尺度特征;基于脑功能连接... 现有技术主要依赖传统的时频域特征,对脑活动空间域特征的研究不足.为了实现对紧急制动意图和正常驾驶的分类识别,提出融合多尺度卷积、脑功能网络和图卷积神经网络的新模型.利用多尺度卷积提取时频域融合的多尺度特征;基于脑功能连接测量矩阵构建脑功能网络,得到空间图结构信息;采用图卷积神经网络融合多尺度特征和空间图结构信息,实现对紧急制动脑电信号的分类识别.实验结果表明,所提模型在公开数据集上多被试的准确率均超过93.00%,最高达到95.60%;在单被试条件下,准确率均超过92.00%,最高达到98.94%.消融实验验证了所提模型各模块均对模型性能的提升具有显著贡献.在相同数据集下,所提模型比已有的6种脑电信号分类算法更具优势. 展开更多
关键词 紧急制动 脑电信号(EEG) 多尺度特征 脑功能网络 图卷积神经网络
在线阅读 下载PDF
动态场景下基于跨域掩膜分割的视觉SLAM算法
15
作者 亢洁 徐婷 +4 位作者 王佳乐 郭进 赫轩 王沫 夏宇 《陕西科技大学学报》 北大核心 2026年第1期178-185,193,共9页
针对动态场景下视觉SLAM(Simultaneous Localization and Mapping)系统中深度学习分割网络实时性不足,以及相机非期望运动导致位姿估计偏差的问题,提出一种基于跨域掩膜分割的视觉SLAM算法.该算法采用轻量化YOLO-fastest网络结合背景减... 针对动态场景下视觉SLAM(Simultaneous Localization and Mapping)系统中深度学习分割网络实时性不足,以及相机非期望运动导致位姿估计偏差的问题,提出一种基于跨域掩膜分割的视觉SLAM算法.该算法采用轻量化YOLO-fastest网络结合背景减除法实现运动物体检测,利用深度图结合深度阈值分割构建跨域掩膜分割机制,并设计相机运动几何校正策略补偿检测框坐标误差,在实现运动物体分割的同时提升处理速度.为优化特征点利用率,采用金字塔光流对动态特征点进行帧间连续跟踪与更新,同时确保仅由静态特征点参与位姿估计过程.在TUM数据集上进行系统性评估,实验结果表明,相比于ORB-SLAM3算法,该算法的绝对位姿误差平均降幅达97.1%,与使用深度学习分割网络的DynaSLAM和DS-SLAM的动态SLAM算法相比,其单帧跟踪时间大幅减少,在精度与效率之间实现了更好的平衡. 展开更多
关键词 视觉SLAM 动态场景 YOLO-Fastest 金字塔光流 深度阈值分割
在线阅读 下载PDF
基于知识图谱和大模型的车辆决策系统
16
作者 吴绍斌 姜皓舰 +2 位作者 黄凯宇 黄宇 褚云峰 《北京理工大学学报》 北大核心 2026年第1期29-37,共9页
车辆在复杂环境中的决策是无人驾驶技术的关键环节.针对传统决策方法泛化性差、环境适应能力不足等问题,本文构建了一种“知识图谱+大语言模型(LLM)”协同的智能决策框架.系统首先借助CARLA仿真平台采集车辆及环境的动态数据,并与专家... 车辆在复杂环境中的决策是无人驾驶技术的关键环节.针对传统决策方法泛化性差、环境适应能力不足等问题,本文构建了一种“知识图谱+大语言模型(LLM)”协同的智能决策框架.系统首先借助CARLA仿真平台采集车辆及环境的动态数据,并与专家预定义的静态知识图谱融合,形成可持续更新的综合知识图谱,统一存储于图数据库Neo4j中.随后,通过Cypher规则推理快速生成先验决策候选;在此基础上,引入LLM进行知识增强检索与链式思维推理,实现对策略的优化与解释生成.试验结果表明:在仿真城市环境下,知识图谱决策的综合决策准确率达95%以上,平均响应时延小于60 ms;在越野实车实验中,与仅使用知识图谱或仅使用LLM的基线相比,所提方法准确率有所提升.验证了知识图谱结构化知识与LLM推理能力的互补优势,为无人车辆高可靠决策提供了一条可行路径. 展开更多
关键词 知识图谱 大语言模型(LLM) CARLA仿真 无人车辆 智能决策
在线阅读 下载PDF
基于多注意力机制的脊柱病灶MRI影像识别模型
17
作者 周慧 宋新景 《计算机科学与探索》 北大核心 2026年第1期291-300,共10页
人工检测脊柱病变是一项耗时的工作,并且高度依赖于该领域的专家,因此脊柱病灶的自动识别是非常必要的。然而,因为脊柱病灶的大小、位置和结构存在着广泛的差异,同时脊柱肿瘤与稀有病布鲁氏菌在影像上高度相似,所以脊柱病灶的准确定位... 人工检测脊柱病变是一项耗时的工作,并且高度依赖于该领域的专家,因此脊柱病灶的自动识别是非常必要的。然而,因为脊柱病灶的大小、位置和结构存在着广泛的差异,同时脊柱肿瘤与稀有病布鲁氏菌在影像上高度相似,所以脊柱病灶的准确定位和分类是一项具有挑战性的工作。为了应对这些挑战,提出了一种改进的脊柱病灶MRI影像识别模型。引入以ResNet-101为基础的双向特征金字塔主干网络,利用可变卷积在不同层替代传统的卷积神经网络,从特征层中获得更多的特征信息。在不同的模块中加入了多重注意力,包括自注意力机制和柔性注意力机制,有效地融合特征中贡献较大的部分。为了克服脊柱肿瘤、感染性病变、稀有病布鲁氏菌的数据不平衡问题,引入了改进的平衡交叉熵损失函数。在大连某医院提供的临床数据集上进行验证,识别精确率达到了94.2%,识别召回率达到90.8%。与其他识别模型进行对比实验,结果说明了该方法相对于其他模型识别性能更好。 展开更多
关键词 脊柱病灶识别 双向特征金字塔 多注意力机制 可变卷积 多特征融合
在线阅读 下载PDF
深度学习在皮肤病变图像分割中的研究综述
18
作者 孟祥福 李佳讯 +1 位作者 俞纯林 鲁蕴萱 《计算机科学与探索》 北大核心 2026年第1期21-39,共19页
皮肤病变种类繁多,临床表现复杂,涵盖从良性病变到恶性黑色素瘤等多种类型。这些病变的早期检测和准确分割对于皮肤癌的诊断和治疗至关重要,尤其是在恶性黑色素瘤等高风险病变的早期识别和定位中,能够显著提高患者的生存率。近年来,深... 皮肤病变种类繁多,临床表现复杂,涵盖从良性病变到恶性黑色素瘤等多种类型。这些病变的早期检测和准确分割对于皮肤癌的诊断和治疗至关重要,尤其是在恶性黑色素瘤等高风险病变的早期识别和定位中,能够显著提高患者的生存率。近年来,深度学习技术在皮肤病变图像分割领域取得了显著进展,极大地提高了分割的准确性和速度。对深度学习在皮肤病变图像分割中的研究展开综述。介绍了多种皮肤病变成像方式及常用的公开数据集,并对常用的评价指标进行了归纳。针对图像普遍存在的噪声和伪影问题,详细探讨了多种图像预处理和增强技术。深入阐述了基于深度学习的皮肤病变分割方法,涵盖了U-Net、Transformer、SAM、Mamba以及多网络融合模型。同时,综合对比了各网络模型的主要结构设计、优势、局限性及其分割性能。对该领域当前所面临的挑战和问题进行了剖析,并对未来的研究方向提出了展望,以期为皮肤病变图像分割领域的进一步发展提供参考。 展开更多
关键词 皮肤病变分割 深度学习 医学图像 卷积神经网络
在线阅读 下载PDF
融合用户属性的多层次对比学习知识感知推荐方法
19
作者 曹春萍 温昕瑜 《计算机应用研究》 北大核心 2026年第1期76-82,共7页
现有基于知识图谱的推荐模型在用户属性利用与高阶信息建模方面存在不足,易受到冗余信号干扰,从而影响推荐效果。针对上述问题,提出一种融合用户属性的对比学习推荐模型MACRec。首先,通过构建属性视图引入用户侧特征,提升节点表示的多... 现有基于知识图谱的推荐模型在用户属性利用与高阶信息建模方面存在不足,易受到冗余信号干扰,从而影响推荐效果。针对上述问题,提出一种融合用户属性的对比学习推荐模型MACRec。首先,通过构建属性视图引入用户侧特征,提升节点表示的多样性与准确性;其次,设计基于元图引导的领域构建策略,对高阶邻居进行筛选,以增强结构建模能力;再次,提出同阶与跨阶的对比机制,在协同信号与图谱信号之间实现平衡;最后,在MovieLens-1M与Book-Crossing两个公开数据集上开展实验。结果显示该模型在多项指标上均优于主流方法,证明了融合用户属性的对比学习方法在推荐准确性与泛化能力方面的有效性。 展开更多
关键词 推荐系统 知识图谱 对比学习 图神经网络
在线阅读 下载PDF
LightRAG框架下AI答疑系统的设计与实现
20
作者 罗小娟 程奕豪 《实验室研究与探索》 北大核心 2026年第1期8-14,共7页
针对传统教育答疑效率低下以及现有大模型易产生幻觉的问题,构建了一种基于检索增强生成(RAG)技术的智能答疑系统,旨在提升知识检索准确性与答疑响应效率。该系统采用LightRAG框架,融合知识图谱与向量数据库构建高效检索模块,并通过增... 针对传统教育答疑效率低下以及现有大模型易产生幻觉的问题,构建了一种基于检索增强生成(RAG)技术的智能答疑系统,旨在提升知识检索准确性与答疑响应效率。该系统采用LightRAG框架,融合知识图谱与向量数据库构建高效检索模块,并通过增量更新机制保障知识的时效性。以“电路原理”课程为应用案例,优化了知识库构建流程,完成了嵌入模型筛选与提示词模板改进;引入基于RoBERTa架构的重排序模型,对检索结果进行语义层面的精准排序;基于Gradio搭建可视化交互平台,支持多模式查询与知识库信息的可视化展示。实验验证表明,该系统能够有效降低大模型的幻觉发生率,且具备响应迅速、答案准确、快速适配知识更新迭代的优势:与现有基于GraphRAG的系统相比,其答疑响应时间平均缩短6%,显著提升了学习效率。此外,系统创新性融合了多源检索与语义重排序技术,大幅提高了教育问答的可靠性、具备良好的推广应用价值。 展开更多
关键词 AI答疑系统 LightRAG框架 检索增强生成 教育人工智能
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部