期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
隐式多尺度对齐与交互的文本-图像行人重识别方法
1
作者 孙锐 杜云 +1 位作者 陈龙 张旭东 《软件学报》 北大核心 2025年第10期4846-4863,共18页
文本-图像行人重识别旨在使用文本描述检索图像库中的目标行人,该技术的主要挑战在于将图像和文本特征嵌入到共同的潜在空间中以实现跨模态对齐.现有的许多工作尝试利用单独预训练的单峰模型来提取视觉和文本特征,再利用切分或者注意力... 文本-图像行人重识别旨在使用文本描述检索图像库中的目标行人,该技术的主要挑战在于将图像和文本特征嵌入到共同的潜在空间中以实现跨模态对齐.现有的许多工作尝试利用单独预训练的单峰模型来提取视觉和文本特征,再利用切分或者注意力机制来获得显式的跨模态对齐.然而,这些显式对齐方法通常缺乏有效匹配多模态特征所需的底层对齐能力,并且使用预设的跨模态对应关系来实现显式对齐可能会导致模态内信息失真.提出了一种隐式多尺度对齐与交互的文本-图像行人重识别方法.首先利用语义一致特征金字塔网络提取图像的多尺度特征,并使用注意力权重融合包含全局和局部信息的不同尺度特征.其次,利用多元交互注意机制学习图像和文本之间的关联.该机制可以有效地捕捉到不同视觉特征和文本信息之间的对应关系,缩小模态间差距,实现隐式多尺度语义对齐.此外,利用前景增强判别器来增强目标行人,提取更纯洁的行人特征,有助于缓解图像与文本之间的信息不平等.在3个主流的文本-图像行人重识别数据集CUHK-PEDES、ICFG-PEDES及RSTPReid上的实验结果表明,所提方法有效提升了跨模态检索性能,比SOTA算法的Rank-1高出2%–9%. 展开更多
关键词 文本-图像行人重识别 隐式对齐 多尺度融合 多元交互注意力 语义对齐
在线阅读 下载PDF
基于隐式对齐的视频超分辨率模型
2
作者 王凤玲 魏爱敏 +2 位作者 庞雄文 李智 谢景明 《计算机科学》 北大核心 2025年第8期232-239,共8页
视频帧之间不仅具有空间相关性,还存在时间相关性。根据低分辨率视频重建高分辨率视频时,可以利用相邻的多帧信息对齐到目标帧,以指导当前帧的恢复。相邻帧之间的对齐一般采用光流指导的可变形卷积进行显式对齐,这种方法克服了可变形卷... 视频帧之间不仅具有空间相关性,还存在时间相关性。根据低分辨率视频重建高分辨率视频时,可以利用相邻的多帧信息对齐到目标帧,以指导当前帧的恢复。相邻帧之间的对齐一般采用光流指导的可变形卷积进行显式对齐,这种方法克服了可变形卷积的不稳定性,但会影响帧中高频信息的恢复,降低对齐信息的准确性并放大伪影。为解决上述问题,提出了一种基于隐式对齐的视频超分模型IAVSR(Implicit Alignment Video Super-Resolution)。IAVSR通过偏移量和原始值将光流编码到特定像素位置,以此计算光流预对齐的信息而不是利用插值函数插值获得,随后利用光流指导的可变形卷积对计算后的预对齐特征进行重对齐,以帮助高频信息的恢复。在双向传播中利用前两帧传播的信息进行对齐来指导当前帧的恢复,并引入残差网络结构,在提高对齐信息准确性的同时避免引入过多的参数。在REDS4公开数据集上的实验结果表明,IAVSR的峰值信噪比(PSNR)比基准模型提高了0.6 dB,且模型训练时的收敛速度提升了20%。 展开更多
关键词 视频超分辨率 可变形卷积 重采样 隐式对齐 光流
在线阅读 下载PDF
提升隐式场景下短语视觉定位的因果建模方法
3
作者 赵嘉宁 王晶晶 +1 位作者 罗佳敏 周国栋 《软件学报》 北大核心 2025年第9期4207-4222,共16页
短语视觉定位是多模态研究中一个基础且重要的研究任务,旨在预测细粒度的文本短语与图片区域的对齐关系.尽管已有的短语视觉定位方法已经取得了不错的进展,但都忽略了文本中的短语与其对应图片区域的隐式对齐关系(即隐式短语-区域对齐关... 短语视觉定位是多模态研究中一个基础且重要的研究任务,旨在预测细粒度的文本短语与图片区域的对齐关系.尽管已有的短语视觉定位方法已经取得了不错的进展,但都忽略了文本中的短语与其对应图片区域的隐式对齐关系(即隐式短语-区域对齐关系),而预测这种关系可以有效评估模型理解深层多模态语义的能力.因此,为了有效建模隐式短语-区域对齐关系,提出一种隐式增强的因果建模短语视觉定位方法.该方法使用因果推理中的干预策略来缓解浅层语义所带来的混淆信息.为评估模型理解深层多模态语义的能力,标注一个高质量的隐式数据集,并进行大量实验.多组对比实验结果表明,所提方法能够有效建模隐式短语-区域对齐关系.此外,在这个隐式数据集上,所提方法的性能优于一些先进的多模态大语言模型,这将进一步促进多模态大模型更多的面向隐式场景的研究. 展开更多
关键词 隐式短语-区域对齐关系 因果推理 短语视觉定位
在线阅读 下载PDF
基于通道隐式对齐的视频超分辨率方法
4
作者 李迪 冯迎宾 《工业控制计算机》 2025年第5期115-117,共3页
视频超分辨率(VSR)任务由于引入了时间维度的信息,需要利用相邻帧之间的高相关性来重建当前帧,如何对齐相邻帧并提取帧间的高相关性信息,是VSR任务的难点。针对上述问题,提出了一种基于通道隐式对齐的VSR模型。首先,引入多帧密集注意力... 视频超分辨率(VSR)任务由于引入了时间维度的信息,需要利用相邻帧之间的高相关性来重建当前帧,如何对齐相邻帧并提取帧间的高相关性信息,是VSR任务的难点。针对上述问题,提出了一种基于通道隐式对齐的VSR模型。首先,引入多帧密集注意力结构提取低分辨率视频帧(LR)的深层特征。其次,通过隐式对齐的方法来估计视频帧间的相似性,并融入CA模块来增强特征的表达。最后,在重建特征聚合时融入初始视频帧的像素信息,赋予图像丰富的特征细节。实验结果表明,该方法可以更好地利用连续帧间的特征信息来恢复高频信息,在公开数据集上有着良好的表现。 展开更多
关键词 视频超分辨率 深度学习 多帧自注意力机制 隐式帧对齐
在线阅读 下载PDF
输变电设备多源异构测量数据语义对齐方法
5
作者 范士锋 付鑫 +1 位作者 刘新 姚洪磊 《国外电子测量技术》 2025年第6期255-260,共6页
由于输变电设备多源异构测量数据在语义、单位、精度等方面具有较大的差异性,导致在将不同数据源的数据进行对齐时,易出现数据不匹配、不同数据源之间存在冲突问题。为此,提出对输变电设备多源异构测量数据语义对齐方法。将多源异构测... 由于输变电设备多源异构测量数据在语义、单位、精度等方面具有较大的差异性,导致在将不同数据源的数据进行对齐时,易出现数据不匹配、不同数据源之间存在冲突问题。为此,提出对输变电设备多源异构测量数据语义对齐方法。将多源异构测量数据的特征映射到一个公共子空间,根据映射结果的总均方误差对输变电设备多源异构测量数据完成主成分分析,利用联邦加权平均算法对其完成特征级融合。再结合自然语言处理技术和机器学习算法,计算变电设备多源异构测量数据的字符串间相似度,以此作为关联度评判标准,解析数据的语义内容,从而实施对多源异构测量数据的隐式语义迁移。基于此,生成语义对齐模糊规则,定义权限区域内数据,迭代计算语义对齐正确决策概率,更新模糊规则,从而实现对输变电设备多源异构测量数据的语义对齐。实验结果表明:该方法对输变电设备多源异构测量数据语义对齐精度可以达到96%以上。 展开更多
关键词 多源异构 语义对齐 特征级融合 隐式语义迁移 输变电设备
原文传递
基于元胞自动机的肿瘤生长形态动态模拟 被引量:3
6
作者 甘建红 彭强 +2 位作者 戴培东 张天宇 王正敏 《计算机应用》 CSCD 北大核心 2009年第7期1906-1909,共4页
为了模拟肿瘤生长和附近组织发生机械作用过程以及自身所发生形变,研究了肿瘤生长过程形态的连续性,穿透深度的计算以及肿瘤的真实感绘制。用元胞自动机模拟肿瘤动态生长过程,并在模型每次发生形变后对元胞状态进行更新,以增强肿瘤生长... 为了模拟肿瘤生长和附近组织发生机械作用过程以及自身所发生形变,研究了肿瘤生长过程形态的连续性,穿透深度的计算以及肿瘤的真实感绘制。用元胞自动机模拟肿瘤动态生长过程,并在模型每次发生形变后对元胞状态进行更新,以增强肿瘤生长形态的连续性;模型顶点穿透深度的准确性直接影响力学模型计算形变结果的合理性、准确性,采用基于隐式曲面的方法计算穿透深度的大小和方向;为了增强肿瘤模型的真实感,采用隐式曲面的方法渲染每个生长时刻的肿瘤形态。实验结果表明:该方法能得到形态较连续的生长过程;改进后的穿透深度计算方法能得到一致性较好的深度矢量;基于模型表面点集隐式曲面绘制的肿瘤模型具有平滑表面,有较好的仿真效果。 展开更多
关键词 元胞自动机 隐式曲面 八叉树 肿瘤模型 轴向包围盒
在线阅读 下载PDF
类比的图式驱动效应 被引量:1
7
作者 王亚同 吕惠玲 《心理科学》 CSSCI CSCD 北大核心 2008年第6期1398-1401,共4页
本研究采用了两个实验探讨了类比的图式驱动效应即类比的映射不仅是一种外显的推理过程而且也是一种内隐的推理过程,这一内隐过程具有图式驱动效应。实验1要求被试者首先阅读基础课文和目标课文然后回答问题,结果表明在课文阅读过程中... 本研究采用了两个实验探讨了类比的图式驱动效应即类比的映射不仅是一种外显的推理过程而且也是一种内隐的推理过程,这一内隐过程具有图式驱动效应。实验1要求被试者首先阅读基础课文和目标课文然后回答问题,结果表明在课文阅读过程中存在着内隐推理。实验2采用更加复杂的实验方法检验了影响内隐推理的图式驱动效应,结果发现被试者的类比内隐推理主要受图式驱动或者结构排列的影响而很少受到语义激活或者启动效应的影响。最后,在结构排列理论与图式理论的框架中讨论了本研究的结果。 展开更多
关键词 类比 图式 内隐推理 结构排列
原文传递
类似性比较对3~5岁儿童内隐推理的影响
8
作者 王亚同 叶培龙 王娟 《心理科学》 CSSCI CSCD 北大核心 2007年第3期569-573,共5页
本研究以三个实验探讨了3~5岁儿童词汇学习的内隐推理过程。实验1首先让被试者看一个熟悉物体的标准图片,分别以熟悉的或者不熟悉的名词命名,然后要求从两个选项中选择一个图片与标准图片匹配。结果表明3~4岁儿童可以不熟悉名词完成... 本研究以三个实验探讨了3~5岁儿童词汇学习的内隐推理过程。实验1首先让被试者看一个熟悉物体的标准图片,分别以熟悉的或者不熟悉的名词命名,然后要求从两个选项中选择一个图片与标准图片匹配。结果表明3~4岁儿童可以不熟悉名词完成词汇扩展作业,但是只有5岁儿童可以熟悉名词完成词汇扩展作业,这表明5岁儿童可能有一个内隐推理加工过程。实验2以不熟悉物体作为标准图片,以熟悉名词与指代词分别作为指导语进一步测试5岁儿童的内隐推理过程,结果表明这个年龄阶段儿童的类概念形成有一种自上而下加工的内隐推理过程。实验3呈现基本概念的图片检验什么因素影响3~5岁儿童词汇学习的内隐推理过程,结果表明在类似性比较条件下与3~4岁儿童相比,5岁儿童更加明显地表现了内隐推理的加工过程。最后以类似性理论讨论了本研究的结果。 展开更多
关键词 内隐推理 词汇扩展 结构排列 类似性
在线阅读 下载PDF
国际结构启动研究的知识图谱分析(1986—2017) 被引量:1
9
作者 王敏 甘桥 《北京第二外国语学院学报》 2019年第5期18-37,共20页
结构启动(又称句法启动)是指人们在产出中倾向于重复使用先前使用或接触过的语言结构。经过30多年的发展,结构启动成为语言科学研究的热点之一。前人研究表明,结构启动既能够反映抽象表征,是研究语言加工机制的重要工具,又能够促进内隐... 结构启动(又称句法启动)是指人们在产出中倾向于重复使用先前使用或接触过的语言结构。经过30多年的发展,结构启动成为语言科学研究的热点之一。前人研究表明,结构启动既能够反映抽象表征,是研究语言加工机制的重要工具,又能够促进内隐学习和成功交际,对语言习得、语言交际、双语研究等具有很强的启发和借鉴意义。本文基于CiteSpace生成的可视化知识图谱,对国际结构启动研究文献进行了计量分析,系统考察了从1986年至2017年间结构启动论文发文量的变化、发文期刊、核心研究机构和高产作者的地区分布等,基于高共被引论文和关键词梳理了研究的核心议题及动态变化,并指出未来研究发展的趋势和方向。 展开更多
关键词 结构启动 知识图谱 语言表征 协同 内隐学习
在线阅读 下载PDF
语言层面的协同:显性与隐性
10
作者 张晓 《语言教育》 2017年第4期50-55,共6页
社会认知视角是近年来二语习得研究中的新兴视角,社会认知理论认为语言、语言习得和其他方面的社会活动密不可分,语言是社会中的语言。研究语言习得应该在社会环境中研究,不应忽视社会认知因素的影响,也不应忽视语言和社会认知因素的相... 社会认知视角是近年来二语习得研究中的新兴视角,社会认知理论认为语言、语言习得和其他方面的社会活动密不可分,语言是社会中的语言。研究语言习得应该在社会环境中研究,不应忽视社会认知因素的影响,也不应忽视语言和社会认知因素的相互作用。协同是社会认知视角下二语习得研究中的重要概念,以Atkinson为代表的研究者强调语言使用和语言学习中的互动与协同,以Pickering和Garrod为代表的研究者则强调协同是人际对话顺利进行的机制。本文对这两种观点的理论及相关实证研究进行了概述和评价,并在此基础上提出了关于语言层面的协同的认识和观点。 展开更多
关键词 社会认知 协同 互动 显性协同 隐性协同
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部