期刊文献+
共找到414篇文章
< 1 2 21 >
每页显示 20 50 100
基于跨模态多头注意力的交通量音视融合检测方法
1
作者 马庆禄 吴斐斐 +2 位作者 吴跃川 张丽 张埂 《重庆交通大学学报(自然科学版)》 北大核心 2026年第1期95-105,共11页
针对传统视觉或音频信号在交通量检测中均无法充分捕捉时域和频域细节信息的问题,提出了基于跨模态多头注意力的交通量音视融合检测方法。该方法通过构建一种跨音视频模态的交通量检测模型,获取高质量的交通视觉模态表征和声音模态表征... 针对传统视觉或音频信号在交通量检测中均无法充分捕捉时域和频域细节信息的问题,提出了基于跨模态多头注意力的交通量音视融合检测方法。该方法通过构建一种跨音视频模态的交通量检测模型,获取高质量的交通视觉模态表征和声音模态表征并进行高效融合。首先,采用Res2Net网络与DCNv3网络对音视频数据进行特征提取,通过双向长短期记忆网络对时间序列特征处理,分别分析了音视频中复杂行为序列,获取丰富性和连贯性的交通信息描述;其次,在跨模态融合中将交叉注意力与多头注意力结合,利用多个子空间进行合并输出,进行多头注意力跨模态融合;最后,将交叉熵损失和一致性损失联合应用,加强对不同模态信息的协调解析,确保多模态数据在分类和识别任务中的一致性表现。实验结果表明在交通量检测场景下笔者方法分别比单一音频、视频与AVSS(audio-visual speech separation,AVSS)中的融合方法的平均车辆检测准确率提高了2.57%、1.70%、0.95%,车辆平均分类准确率分别提高了4.72%、1.78%、1.62%,总体交通量平均检测准确率分别提高了4.41%、2.96%、1.46%,且在4种不同场景下表现稳定。 展开更多
关键词 交通工程 交通量检测 音视融合 跨模态 注意力机制
在线阅读 下载PDF
通感隐喻视角下音乐信息与色彩映射关系探索
2
作者 李金鑫 姜在新 《上海包装》 2026年第1期100-102,共3页
以通感隐喻为视角,探索音乐信息与色彩的映射关系。对通感、隐喻及通感隐喻核心概念进行了界定,并梳理了文化语境中情感与色彩的联结规律;基于音乐信息与色彩的一对一、多对一、模糊的映射方式,分析了音乐信息与色彩的感知共通性与文化... 以通感隐喻为视角,探索音乐信息与色彩的映射关系。对通感、隐喻及通感隐喻核心概念进行了界定,并梳理了文化语境中情感与色彩的联结规律;基于音乐信息与色彩的一对一、多对一、模糊的映射方式,分析了音乐信息与色彩的感知共通性与文化变异性;揭示了通感隐喻的中介转换作用,以此构建“信息层—感知层—符号层”的三维认知模型并开展设计实践。研究表明,二者映射具有经验一致性与文化关联性,可为音乐可视化设计等跨媒介创作提供理论与实践框架。 展开更多
关键词 通感隐喻 音乐信息 色彩映射 跨感官认知 音乐可视化
在线阅读 下载PDF
基于ArcGIS-Google Earth的地理可视化跨单元教学研究
3
作者 赵伟 王凯 孙兆阳 《天津科技》 2026年第S1期103-105,109,共4页
受中学软硬件限制,地理实践课程“地理信息技术的应用”多以理论讲授为主,对学生实践力的培养不足;且自然地理现象难以直观呈现,教师依托动画、地图等辅助教学,效果欠佳。信息技术可为自然地理教学提供更多展示方式,自然地理的研究与实... 受中学软硬件限制,地理实践课程“地理信息技术的应用”多以理论讲授为主,对学生实践力的培养不足;且自然地理现象难以直观呈现,教师依托动画、地图等辅助教学,效果欠佳。信息技术可为自然地理教学提供更多展示方式,自然地理的研究与实践也能为信息技术提供应用场景。以“地理信息系统(GIS)操作实践+全球板块划分”为范例,通过构建跨单元教学模式,既落实地理实践力培养,又为自然地理学习搭建真实情境。 展开更多
关键词 ARCGIS Google Earth 高中地理 可视化教学 跨单元教学
在线阅读 下载PDF
数字化壮锦在东盟视觉传播中的研究探索
4
作者 赵安琪 陈树莲 《西部皮革》 2026年第1期141-144,共4页
文章旨在探索数字化技术背景下,国家级非物质文化遗产壮锦在东盟地区的创新传播路径。研究通过符号解构与重构、动态交互设计及在地化场景适配,结合全链条数字化技术支撑,构建了壮锦的跨文化数字创作逻辑与视觉特征。进一步提出“线上... 文章旨在探索数字化技术背景下,国家级非物质文化遗产壮锦在东盟地区的创新传播路径。研究通过符号解构与重构、动态交互设计及在地化场景适配,结合全链条数字化技术支撑,构建了壮锦的跨文化数字创作逻辑与视觉特征。进一步提出“线上轻量化渗透—线下沉浸体验—产业价值转化”的三维传播体系。研究表明,数字化手段能有效打破传统壮锦的传播壁垒,提升其在东盟地区的文化认同与影响力,为非遗文化的国际传播与活态传承提供了实践参考。 展开更多
关键词 数字化壮锦 东盟 视觉传播 跨文化转译 非物质文化遗产 沉浸式体验
在线阅读 下载PDF
基于多维空间视觉感知的仓库盘点方法
5
作者 钟诚 田殿雄 +3 位作者 赵文炎 卢泽钰 张良安 李勇 《山东科技大学学报(自然科学版)》 北大核心 2026年第1期122-130,共9页
传统人工仓库物资盘点方式效率低下,难以满足现代智慧仓储对物资精准管理的需求。现有的自动识别技术存在易受环境干扰、成本高昂以及在复杂场景下稳定性不足等局限,尤其在动态仓库环境中,物资盘点本质上是一个多维时空信息处理问题,需... 传统人工仓库物资盘点方式效率低下,难以满足现代智慧仓储对物资精准管理的需求。现有的自动识别技术存在易受环境干扰、成本高昂以及在复杂场景下稳定性不足等局限,尤其在动态仓库环境中,物资盘点本质上是一个多维时空信息处理问题,需要有效融合时间、空间与距离等不局限于三维物理结构的高维度抽象特征,同时还需应对遮挡、光线变化和小目标检测等挑战。针对上述问题,本研究提出一种基于多维空间视觉感知的仓库盘点方法(MDSVP-WIM)。该方法通过混合高斯模型动态更新背景来抑制环境干扰,结合二维卷积与图像分割技术提升小目标识别精度,并引入跨帧追踪-联合投票机制,增强系统在动态场景中的稳定性与鲁棒性。在WareSegNet与SpatioTrack-360数据集上的实验表明,本研究方法的平均精度均值(mAP)分别达到0.97和0.96,F1值为0.94和0.93,性能显著优于FCN、PSPNet等基准模型,为复杂仓储环境下的物资自动化盘点提供了一种高效、稳定的方案。 展开更多
关键词 智慧仓储 物资盘点 视觉感知 混合高斯模型 跨帧追踪
在线阅读 下载PDF
多模态协同框架下英语影视翻译视听符号转译策略优化
6
作者 檀锐 《中国科技术语》 2026年第1期81-83,共3页
文章聚焦多模态协同框架下英语影视翻译中视听符号的转译问题。从符号学机理出发,分析影视符号的模态构成、转译约束及跨文化意义重构机制,指出当前翻译存在模态协同缺失、文化模因适配失衡、受众认知负荷调控不足等问题。据此提出构建... 文章聚焦多模态协同框架下英语影视翻译中视听符号的转译问题。从符号学机理出发,分析影视符号的模态构成、转译约束及跨文化意义重构机制,指出当前翻译存在模态协同缺失、文化模因适配失衡、受众认知负荷调控不足等问题。据此提出构建模态适配度评估体系、实施文化模因多模态锚定、建立受众认知导向调控机制等优化策略,旨在通过多模态协同提升英语影视翻译的准确性与跨文化传播效果。 展开更多
关键词 多模态协同 英语影视翻译 视听符号 转译策略 跨文化传播
在线阅读 下载PDF
面向遥感视觉问答的跨模态知识引入与提示推理框架
7
作者 董欣 俞鹏飞 顾晶晶 《计算机科学与探索》 北大核心 2026年第3期760-772,共13页
随着遥感技术的快速发展,遥感视觉问答(RSVQA)作为一种结合语言与视觉交互的新兴技术,显著提升了地球观测、环境监测等领域中遥感图像信息的解读效率和交互能力。然而,RSVQA仍面临遥感图像信息复杂度高、遥感图像-文本对齐数据稀缺,以... 随着遥感技术的快速发展,遥感视觉问答(RSVQA)作为一种结合语言与视觉交互的新兴技术,显著提升了地球观测、环境监测等领域中遥感图像信息的解读效率和交互能力。然而,RSVQA仍面临遥感图像信息复杂度高、遥感图像-文本对齐数据稀缺,以及文本问题表达形式多样等挑战。为了应对这些挑战,提出一种面向RSVQA的跨模态知识引入与提示推理框架(CMKIP)。针对遥感图像的高复杂度,CMKIP为大语言模型LLaMA构建可学习的图像特征适配器,以具备对复杂图像的表征能力;针对遥感图像-文本对齐数据稀缺问题,构建自动化数据生成管道,从公开遥感数据集中生成高质量的图像-文本对,实现高效的遥感领域知识注入;针对问题表达的多样性,创新性地提出一种大小模型协同推理机制,利用小模型进行知识库检索与中间推理校正,显著提升大语言模型对多样化问题的理解能力与推理准确性。此外,CMKIP支持根据任务需求灵活更换小模型,可广泛应用于遥感领域的多项下游任务。实验结果表明,CMKIP在RSVQA基准数据集上的性能显著优于现有方法,特别是在低样本场景下表现尤为突出,展示了其在RSVQA任务中的有效性和泛化性。 展开更多
关键词 遥感视觉问答 大语言模型 跨模态扩展 遥感微调指令集 轻量级模型 提示推理
在线阅读 下载PDF
跨界融合视角下电影艺术表达与广告设计融合策略研究
8
作者 冯小航 樊小爽 《鞋类工艺与设计》 2026年第5期78-80,共3页
当前电影不再只是叙事载体,广告亦不再仅为销售工具,两者在视觉语言、情绪表达与文化建构上的互动日益频繁,构成当代视觉传播体系的重要交汇点。从跨界融合的视角出发,系统梳理电影艺术表达与广告设计的基本特征,分析二者在叙事结构、... 当前电影不再只是叙事载体,广告亦不再仅为销售工具,两者在视觉语言、情绪表达与文化建构上的互动日益频繁,构成当代视觉传播体系的重要交汇点。从跨界融合的视角出发,系统梳理电影艺术表达与广告设计的基本特征,分析二者在叙事结构、镜头语言、情感逻辑方面的耦合机制,提出以项目统筹方式重构内容生产流程、建立多元指标体系评估融合成果、推动媒介平台参与内容共建策略,旨在为品牌传播提供创新思路,也为视觉文化研究提供理论补充。 展开更多
关键词 跨界融合 电影艺术表达 广告设计 视觉传播 创作机制
在线阅读 下载PDF
建筑内基于虚拟仿真的跨视域行人监测研究
9
作者 陶振翔 李滢 +3 位作者 黄绪勃 王一森 张平 杨锐 《中国安全科学学报》 北大核心 2025年第5期161-168,共8页
为解决高层建筑楼宇或复杂开放建筑环境中多路视频数据采集成本高、长时间高质量标注难等问题,实现跨视域多路视频数据的生成与行人图像的自动标注,首先,设计虚拟现实场景,模拟行人运动并自动获取标记数据;其次,研究无监督领域自适应方... 为解决高层建筑楼宇或复杂开放建筑环境中多路视频数据采集成本高、长时间高质量标注难等问题,实现跨视域多路视频数据的生成与行人图像的自动标注,首先,设计虚拟现实场景,模拟行人运动并自动获取标记数据;其次,研究无监督领域自适应方法,降低源域数据与目标域数据的特征分布差异,使模型泛化至目标建筑场景;最后,验证模型泛化能力。研究结果表明:构建的虚拟现实场景能有效克服跨视域视频数据采集与高质量标注的困难;无监督领域自适应方法将平均首位命中率从22.02%提升至45.48%;结合源域风格转换、数据增广和目标域伪标签生成,首位命中率提升20%,降低了分布偏差,有助于实现模型在不同建筑场景中的泛化。 展开更多
关键词 建筑场景 虚拟仿真 跨视域 行人运动 自动标注
原文传递
文化出海:中国科幻电影海外演映的海报设计问题与对策
10
作者 徐允 万木春 +1 位作者 许问一 张志鹏 《现代广告》 2025年第11期48-57,共10页
《流浪地球》系列电影的全球传播现象,标志着中国科幻电影已经进入跨文化传播的战略机遇期。本文聚焦中国科幻电影在国际市场推广过程中的海报设计问题,以跨文化传播和视觉修辞学作为研究框架,对比分析中外科幻电影海报设计的视觉语法... 《流浪地球》系列电影的全球传播现象,标志着中国科幻电影已经进入跨文化传播的战略机遇期。本文聚焦中国科幻电影在国际市场推广过程中的海报设计问题,以跨文化传播和视觉修辞学作为研究框架,对比分析中外科幻电影海报设计的视觉语法与审美、图像叙事策略以及文化符号编码逻辑,探讨了当前中国科幻电影海外海报设计存在的文化符号转译失准、视觉语言文化适应性不足、海报设计与目标受众认知图式结构性错位等问题。在此基础上,本文提出了差异化区域(区域分异型视觉)设计策略以及相应的营销策略建构、文化符号创造性转化、基于受众心理的设计路径等应对方案,以期为中国科幻电影更好地“走出去”提供视觉传达设计层面的理论参考与实践指导。 展开更多
关键词 中国科幻电影 海报设计 跨文化传播 视觉修辞 文化符号
在线阅读 下载PDF
国内跨区域治理回顾与展望——基于知网数据库CiteSpace的可视化分析
11
作者 汪振双 柏昊然 赵宁 《大连大学学报》 2025年第4期73-83,共11页
跨区域治理是加快实现区域高质量协调发展新格局的重要途径。本文利用CiteSpace工具以2014—2024年知网数据库中北大核心与中文社会科学引文索引(CSSCI)来源期刊的930篇跨区域治理文献为样本进行知识图谱分析。结果表明,跨区域治理经历... 跨区域治理是加快实现区域高质量协调发展新格局的重要途径。本文利用CiteSpace工具以2014—2024年知网数据库中北大核心与中文社会科学引文索引(CSSCI)来源期刊的930篇跨区域治理文献为样本进行知识图谱分析。结果表明,跨区域治理经历了快速发展期和相对平缓期两个主要阶段;研究主要集中在区域协同与空间治理、环境与生态保护、教育与社会发展三大方面;中国城市规划学会等机构在近年来展现出较为紧密的合作关系;“协同治理”“京津冀”依然是学者们研究的焦点,“数字经济”和“跨界治理”成为近期学者们关注的新热点,其中“黄河流域数字经济驱动下的都市圈发展与共同富裕实现路径研究”或将成为国内未来研究的焦点。未来还需要关注跨区域治理的理论框架完善、实践模式创新、技术手段更新、国际合作拓展,以及绩效评估完善。 展开更多
关键词 跨区域治理 CITESPACE 文献计量 可视化分析 演进趋势
在线阅读 下载PDF
基于对比学习的跨模态实体链接模型 被引量:3
12
作者 王苑铮 孙文祥 +2 位作者 范意兴 廖华明 郭嘉丰 《计算机研究与发展》 北大核心 2025年第3期662-671,共10页
图文跨模态实体链接是对传统实体链接任务的扩展,其输入为包含实体的图像,目标是将其链接到文本模态的知识库实体上.现有模型通常采用双编码器架构,将图像、文本模态的实体分别编码为向量,利用点乘计算两者的相似度,从而链接到与图像实... 图文跨模态实体链接是对传统实体链接任务的扩展,其输入为包含实体的图像,目标是将其链接到文本模态的知识库实体上.现有模型通常采用双编码器架构,将图像、文本模态的实体分别编码为向量,利用点乘计算两者的相似度,从而链接到与图像实体相似度最高的文本实体.其训练过程通常采用基于Info NCE损失的对比学习任务,即提高一个实体某模态与自身另一模态的向量相似度,降低与其他实体另一模态的向量相似度.然而此模型忽视了图文2个模态内部表示难度的差异:图像模态中的相似实体,通常比文本模态中的相似实体更难以区分,导致外观相似的图像实体很容易链接错误.因此,提出2个新的对比学习任务来提升向量的判别能力.一个是自对比学习,用于提升图像向量之间的区分度;另一个是难负例对比学习,让文本向量更容易区分几个相似的图像向量.在开源数据集Wiki Person上进行实验,在12万规模的实体库上,相比于采用Info NCE损失的最佳基线模型,模型正确率提升了4.5个百分点. 展开更多
关键词 实体链接模型 多模态 跨模态 对比学习 视觉信息
在线阅读 下载PDF
基于跨模态对齐的食谱-图像检索研究综述
13
作者 张贤坤 蒲臻 夏志鸿 《天津科技大学学报》 2025年第5期1-12,共12页
随着全球肥胖问题的日益严重,食物计算作为提升人类健康的重要研究方向,已成为多领域研究的热点。跨模态食谱检索作为食物计算与跨模态检索领域的交叉前沿,具有独特的研究价值。然而,由于食谱与图像之间存在显著语义鸿沟以及在食材种类... 随着全球肥胖问题的日益严重,食物计算作为提升人类健康的重要研究方向,已成为多领域研究的热点。跨模态食谱检索作为食物计算与跨模态检索领域的交叉前沿,具有独特的研究价值。然而,由于食谱与图像之间存在显著语义鸿沟以及在食材种类、烹饪方法和文本描述等方面的复杂性,给跨模态食谱检索任务带来挑战。随着数据集规模的扩大和技术的发展,基于双编码器、生成对抗网络(GAN)、视觉语言预训练模型(VLP)的方法逐渐成为食谱检索领域的主流技术。本文综述了基于跨模态对齐的食谱-图像检索技术的最新进展,分析不同方法的优势与局限性,并对未来的发展方向进行展望。 展开更多
关键词 食物计算 跨模态检索 食谱检索 视觉语言预训练
在线阅读 下载PDF
CATrans:基于跨尺度注意力Transformer的高分辨率遥感影像土地覆盖语义分割框架 被引量:1
14
作者 陈丽佳 陈宏辉 +3 位作者 谢艳秋 何天友 叶菁 吴林煌 《地球信息科学学报》 北大核心 2025年第7期1624-1637,共14页
【目的】高分辨率遥感影像语义分割通过精准提取地物信息,为城市规划、土地分析利用提供了重要的数据支持。当前分割方法通常将遥感影像划分为标准块,进行多尺度局部分割和层次推理,未充分考虑影像中的上下文先验知识和局部特征交互能力... 【目的】高分辨率遥感影像语义分割通过精准提取地物信息,为城市规划、土地分析利用提供了重要的数据支持。当前分割方法通常将遥感影像划分为标准块,进行多尺度局部分割和层次推理,未充分考虑影像中的上下文先验知识和局部特征交互能力,影响了推理分割质量。【方法】为了解决这一问题,本文提出了一种联合跨尺度注意力和语义视觉Transformer的遥感影像分割框架(Cross-scale Attention Transformer,CATrans),融合跨尺度注意力模块和语义视觉Transformer,提取上下文先验知识增强局部特征表示和分割性能。首先,跨尺度注意力模块通过空间和通道两个维度进行并行特征处理,分析浅层-深层和局部-全局特征之间的依赖关系,提升对遥感影像中不同粒度对象的注意力。其次,语义视觉Transformer通过空间注意力机制捕捉上下文语义信息,建模语义信息之间的依赖关系。【结果】本文在DeepGlobe、Inria Aerial和LoveDA数据集上进行对比实验,结果表明:CATrans的分割性能优于现有的WSDNet(Discrete Wavelet Smooth Network)和ISDNet(Integrating Shallow and Deep Network)等分割算法,分别取得了76.2%、79.2%、54.2%的平均交并比(Mean Intersection over Union,mIoU)和86.5%、87.8%、66.8%的平均F1得分(Mean F1 Score,mF1),推理速度分别达到38.1 FPS、13.2 FPS和95.22 FPS。相较于本文所对比的最佳方法WSDNet,mIoU和mF1在3个数据集中分别提升2.1%、4.0%、5.3%和1.3%、1.8%、5.6%,在每类地物的分割中都具有显著优势。【结论】本方法实现了高效率、高精度的高分辨率遥感影像语义分割。 展开更多
关键词 高分辨率 语义分割 跨尺度注意力 视觉Transformer 上下文先验 空间注意力 语义信息
原文传递
DINO-MSRA:用于无人机与卫星影像跨视角图像检索定位的新型网络架构 被引量:2
15
作者 平一凡 卢俊 +4 位作者 郭海涛 侯青峰 朱坤 桑泽豪 刘彤 《地球信息科学学报》 北大核心 2025年第7期1608-1623,共16页
【目的】跨视角图像地理定位是指通过将待查询影像与不同视角且具备精确位置信息的参考影像进行匹配从而推断其地理位置的一门技术。该技术已经广泛应用于无人机导航、目标定位等现实任务中。当前基于深度学习的无人机-卫星跨视角图像... 【目的】跨视角图像地理定位是指通过将待查询影像与不同视角且具备精确位置信息的参考影像进行匹配从而推断其地理位置的一门技术。该技术已经广泛应用于无人机导航、目标定位等现实任务中。当前基于深度学习的无人机-卫星跨视角图像检索定位方法大多依赖监督学习,但高质量标注样本的稀缺导致监督学习模型的泛化能力受限。同时,由于现有方法对空间布局特征的建模缺失,使得跨视角影像间的显著域差异难以弥补。【方法】针对上述问题,本文提出了一个基于无人机-卫星影像的跨视角图像检索定位新架构——DINO-MSRA,该架构首先利用经Conv-LoRA微调后的Dinov2大模型作为特征编码器,旨在利用较少的参数量增强模型的特征提取能力。其次,设计了一个基于Mamba模块的空间关系感知特征聚合器(MSRA)用于聚合图像特征,通过将空间配置特征嵌入到全局描述符中,为跨视角匹配定位任务带来了显著的性能增益。最后,采用InfoNCE损失函数对模型进行训练。【结果】本文在Univerisity-1652和SUES-200数据集上进行了大量对比实验和消融实验,实验结果表明,当分别面向无人机定位任务和无人机导航任务时,本文方法在Univeirity-1652数据集上的R@1精度达到95.14%、97.29%,相比于目前最优算法CAMP分别提升0.68%、1.14%;在SUES-200数据集上150 m高度的R@1精度分别达到97.2%、98.75%,相较于CAMP提升1.8%、2.5%,并且所需参数量也明显少于现有算法,仅为Sample4Geo的19.2%;【结论】DINO-MSRA在跨视角图像匹配方面优于目前最先进的方法,实现了更高的精度,更快的推理速度,证明了其在具有挑战性的场景中的鲁棒性和实际应用潜力。 展开更多
关键词 跨视角图像定位 视觉基础模型 微调 特征聚合 无人机影像 卫星影像
原文传递
镜鉴与实践:面向“语图混融”的民族口传文学跨媒介创作探赜
16
作者 滕兆媛 《艺术传播研究》 2025年第5期131-144,共14页
跨语言和图像的文艺创作在跨媒介文艺创作中具有基础性和代表性,对“图像”和“语象”之联系的探究也是国内外跨媒介文艺理论及批评的重点之一。当前媒介技术的迅速发展给语象和图像在跨媒介创作中的“混融”即“语图混融”提供了很大... 跨语言和图像的文艺创作在跨媒介文艺创作中具有基础性和代表性,对“图像”和“语象”之联系的探究也是国内外跨媒介文艺理论及批评的重点之一。当前媒介技术的迅速发展给语象和图像在跨媒介创作中的“混融”即“语图混融”提供了很大的空间,也让各种“泛艺术”与语图文本频繁交叉,这要求传统意义上的图像表意研究对此继续深化——于民族口传文学的当代传播而言,这方面的研究尤具突出价值。以《罕力毛与鹿姑娘》的混融创作试验为例,可见出一种独特的叙事和表达方式(或说有效范式):从语言描述到视觉图像的比象(互仿)、从视觉图像到象征符号的淬砺(意叙)、从视觉图像与象征符号到媒介的递归(融合)。这三种模式的转捩与交织,不仅会推进对民族口传文学之意义世界的“语—图”叙事协同,还有利于激发讲述者、文本与解读者之间的互动,从而更好地塑造集体记忆和文化记忆,凸显民族口传文学语境下“符号—媒介—意义”的生产如何折射出跨媒介文艺创作之于人文历史传播的深远意义。 展开更多
关键词 “语图混融” 民族口传文学 跨媒介 创作实践
原文传递
AIGC驱动下两岸客家社区文化元素视觉重构设计研究
17
作者 张松涛 《网印工业》 2025年第7期76-78,共3页
在全球数智化浪潮背景下,传统社区营造面临空间视觉表达趋同的挑战。两岸客家社区在城乡变迁中亟需实现“旧土新生”。以“两岸客家社区营造”为研究核心,聚焦人工智能辅助设计在社区视觉系统构建中的应用价值,构建集“文化挖掘—视觉... 在全球数智化浪潮背景下,传统社区营造面临空间视觉表达趋同的挑战。两岸客家社区在城乡变迁中亟需实现“旧土新生”。以“两岸客家社区营造”为研究核心,聚焦人工智能辅助设计在社区视觉系统构建中的应用价值,构建集“文化挖掘—视觉再生—共创传播”于一体的设计路径,探索社区营造的创新范式。 展开更多
关键词 两岸客家社区 AIGC 文化认同 视觉重构 创新范式
在线阅读 下载PDF
抗战宣传中木刻版画民族精神的另类视觉表达与情感传播 被引量:2
18
作者 张彪 《深圳大学学报(人文社会科学版)》 北大核心 2025年第3期151-160,共10页
抗战时期的木刻版画以其独特的视觉符号和社会功能成为传播民族精神的重要媒介。凭借黑白对比的强烈视觉冲击、简便易行的制作工艺以及低成本的传播特性,这一艺术形式在战时条件下被广泛应用,通过城乡传播路径的协同作用连接知识阶层与... 抗战时期的木刻版画以其独特的视觉符号和社会功能成为传播民族精神的重要媒介。凭借黑白对比的强烈视觉冲击、简便易行的制作工艺以及低成本的传播特性,这一艺术形式在战时条件下被广泛应用,通过城乡传播路径的协同作用连接知识阶层与基层民众。木刻版画的情感传播机制构建了从愤怒到同情再到爱国的情感递进结构,推动了个体情绪向社会认同的转化,并进一步实现了民族精神的塑造与社会动员。其符号体系通过具象与抽象的多重表达层次,结合英雄人物与普通民众的形象塑造,实现了艺术表现与社会功能的有机结合。在传播模式上,木刻版画通过报刊连载、展览活动和公共张贴等形式,在城市和乡村中展现出传播策略的差异化与适应性。城市传播注重思想深度和艺术表现力,而乡村传播则通过直观易懂的视觉语言实现了广泛动员,构建了全民抗战的叙事体系。 展开更多
关键词 抗战时期 木刻版画 民族精神 情感传播 视觉符号 跨文化传播
原文传递
引入全局感知与细节增强的非对称遥感建筑物分割网络
19
作者 徐胜军 刘雨芮 +3 位作者 刘二虎 刘俊 史亚 李小晗 《中国图象图形学报》 北大核心 2025年第8期2866-2883,共18页
目的针对遥感图像分割的区域连续性差、边界消失和尺度变化大等导致建筑物分割精度低的问题,提出一种基于全局感知与细节增强的非对称遥感建筑物分割网络(global perception and detail enhancement asymmetric-UNet,GPDEA-UNet)。方法... 目的针对遥感图像分割的区域连续性差、边界消失和尺度变化大等导致建筑物分割精度低的问题,提出一种基于全局感知与细节增强的非对称遥感建筑物分割网络(global perception and detail enhancement asymmetric-UNet,GPDEA-UNet)。方法在U-Net网络基础上,首先构建了一个基于选择性状态空间的特征编码器模块,以视觉状态空间(visual state space,VSS)作为基础单元,结合动态卷积分解(dynamic convolution decomposition,DCD)捕捉遥感图像中的复杂特征和上下文信息;其次通过引入多尺度双交叉融合注意力模块(multi-scale dual cross-attention,MDCA)解决多尺度编码器特征间的通道与空间依赖性问题,并缩小编解码器特征之间的语义差距;最后设计了一个细节增强解码器模块,使用DCD与级联上采样(cascade upsampling,CU)模块恢复更丰富的语义信息,保留特征细节与语义完整,最终确保分割结果的精确性与细腻度。结果实验在WHU Aerial Imagery Dataset和Massachusetts Building Dataset数据集上与多种方法进行了比较,实验结果表明,所提出的GPDEA-UNet的交并比、精确度、召回率和F1分数在WHU Aerial Imagery Dataset数据集上分别为91.60%、95.36%、95.89%和95.62%,在Massachusetts Building Dataset数据集上分别为72.51%、79.44%、86.81%和82.53%。结论所提出的基于全局感知与细节增强的非对称遥感建筑物分割网络,可以有效提高遥感影像建筑物的分割精度。 展开更多
关键词 遥感图像 建筑物分割 视觉状态空间 动态卷积分解(DCD) 交叉注意力 细节增强
原文传递
基于交叉模态注意力特征增强的医学视觉问答 被引量:1
20
作者 刘凯 任洪逸 +2 位作者 李蓥 季怡 刘纯平 《计算机工程》 北大核心 2025年第6期49-56,共8页
医学视觉问答(Med-VQA)需要对医学图像内容与问题文本内容进行理解与结合,因此设计有效的模态表征及跨模态的融合方法对Med-VQA任务的表现至关重要。目前,Med-VQA方法通常只关注医学图像的全局特征以及单一模态内注意力分布,忽略了图像... 医学视觉问答(Med-VQA)需要对医学图像内容与问题文本内容进行理解与结合,因此设计有效的模态表征及跨模态的融合方法对Med-VQA任务的表现至关重要。目前,Med-VQA方法通常只关注医学图像的全局特征以及单一模态内注意力分布,忽略了图像的局部特征所包含的医学信息与跨模态间的交互作用,从而限制了图像内容理解。针对以上问题,提出一种交叉模态注意力特征增强的Med-VQA模型(CMAG-MVQA)。基于U-Net编码有效增强图像局部特征,从交叉模态协同角度提出选择引导注意力方法,为单模态表征引入其他模态的交互信息,同时利用自注意力机制进一步增强选择引导注意力的图像表征。在VQA-RAD医学问答数据集上的消融与对比实验表明,所提方法在Med-VQA任务上有良好的表现,相比于现有同类方法,其在特征表征上性能得到较好改善。 展开更多
关键词 跨模态交互 注意力机制 医学视觉问答 特征融合 特征增强
在线阅读 下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部