期刊文献+
共找到487篇文章
< 1 2 25 >
每页显示 20 50 100
从次生文本到复合文本:重审当代电影海报的体裁边界与文化属性
1
作者 马睿 杨眉 《上海大学学报(社会科学版)》 北大核心 2026年第1期63-73,共11页
在视觉传播媒介谱系中,电影海报有其独特的文本属性和功能定位。传统的电影海报作为一种次生文本,其创作是通过平面设计构建一个以电影本体为元文本、以海报为载体的跨媒介表意系统。随着数字化传播生态的成型,视觉传达呈现出以话题为... 在视觉传播媒介谱系中,电影海报有其独特的文本属性和功能定位。传统的电影海报作为一种次生文本,其创作是通过平面设计构建一个以电影本体为元文本、以海报为载体的跨媒介表意系统。随着数字化传播生态的成型,视觉传达呈现出以话题为聚集点,跨媒介、多平台、线上线下联动共生的样态。身处其中的电影海报,其生产方式和文本形态正在发生显著变化。以电影海报自身发展脉络和媒介技术演进为双重参照系,当前的电影海报日益发展出复合文本的样态,集多主体协同、多媒介融合、多功能整合和多样化表达于一体,旨在创造一个以传递电影信息为起点,以视觉感知和共享话题为纽带,吸纳观众参与,具有复合性文化功能的开放性话语空间。 展开更多
关键词 电影海报 复合文本 媒介演进 视觉文化
在线阅读 下载PDF
视觉语言模型驱动的目标计数
2
作者 曹锋 张孝文 +2 位作者 岳子杰 李莉 史淼晶 《中国图象图形学报》 北大核心 2026年第1期289-302,共14页
目的大型视觉语言模型的进展给解决基于文本提示的目标计数问题带来新的思路。然而,现有方法仍面临类别语义错位与解码器架构局限两大挑战。前者导致模型易将相似背景或无关类别误检为目标,后者依赖单一卷积神经网络(convolutional neur... 目的大型视觉语言模型的进展给解决基于文本提示的目标计数问题带来新的思路。然而,现有方法仍面临类别语义错位与解码器架构局限两大挑战。前者导致模型易将相似背景或无关类别误检为目标,后者依赖单一卷积神经网络(convolutional neural network,CNN)架构的局部特征提取,可能引发全局语义与局部细节的割裂,严重制约复杂场景下的计数鲁棒性。针对上述问题,提出跨分支协作对齐网络(cross-branch cooperative alignment net⁃work,CANet)。方法其核心包括:1)双分支解码器架构:通过并行Transformer分支(建模全局上下文依赖)与CNN分支(提取细粒度局部特征),结合信息互馈模块实现跨分支的特征交互和密度图预测;2)视觉—文本类别对齐损失:通过约束图像与文本特征的跨模态对齐,迫使模型区分目标与干扰语义,实现对类别的准确检测。结果在5个基准数据集上与先进的4种基于文本的目标计数方法进行比较实验。在FSC-147(few-shot counting-147)数据集上,CANet相较于性能第2的模型,在测试集上的平均绝对误差(mean absolute error,MAE)和均方根误差(root mean squared error,RMSE)分别降低1.22和8.45;在CARPK(car parking lot dataset)和PUCPR+(Pontifical Catholic Univer⁃sity of Parana+dataset)数据集的交叉验证实验上,相较于性能第2的模型,MAE分别降低0.08和3.58;在SHA(ShanghaiTech part-A)和SHB(ShanghaiTech part-B)数据集的交叉验证实验上,相较于性能第2的模型,MAE分别降低了47.0和9.8。同时也在FSC-147数据集上进行丰富的消融实验以验证算法的有效性,消融实验结果表明提出的方法针对两个问题做出了有效改进。结论本文方法能够解决现有方法所面临的两个问题,使计数结果更加准确。本文方法在4个数据集的交叉验证实验均取得SOTA(state-of-the-art)的性能,表明了CANet在零样本目标计数任务中的强大泛化能力。 展开更多
关键词 目标计数 视觉语言模型(VLM) 文本提示 双分支解码器 信息互馈
原文传递
基于文献计量和文本挖掘的中国数字体育研究可视化分析
3
作者 伍锦乐 王晓玲 《体育科技文献通报》 2026年第1期305-310,共6页
目的:对2014—2024年中国数字体育领域的相关文献展开文献计量与文本挖掘分析,系统梳理该领域的研究现状、热点主题及发展趋势,以期为我国数字体育的高质量发展提供理论参考。方法:检索中国知网(CNKI)数据库中2014—2024年数字体育领域... 目的:对2014—2024年中国数字体育领域的相关文献展开文献计量与文本挖掘分析,系统梳理该领域的研究现状、热点主题及发展趋势,以期为我国数字体育的高质量发展提供理论参考。方法:检索中国知网(CNKI)数据库中2014—2024年数字体育领域核心期刊文献共314篇,研究从宏观与微观双维度展开分析:宏观层面采用VOSviewer与CiteSpace可视化分析软件,通过作者、机构及关键词共现分析,系统把握该领域研究脉络与整体发展态势;微观角度借助ROSTCM6与Netdraw文本挖掘工具,开展高频词提取与语义网络分析,深度揭示文本集合中潜在的主题关联逻辑。结论:我国数字体育领域的发文量整体呈现持续增长态势,核心作者群体尚未形成,机构间合作交流相对较少;研究热点围绕“产业发展”“技术赋能”“场景应用”三大核心模块展开;研究趋势可以归纳为技术融合与数字转型升级、数字经济与产业生态构建、公共服务与治理体系优化、国家战略与文化价值融合4个方向,划分为概念引入与初步探索期、技术应用与产业转型加速期、体系深化与多元创新期3个阶段。建议:加强学术交流与合作,优化资源配置与引导,深化技术融合与应用创新。 展开更多
关键词 数字体育 文献计量 文本挖掘 可视化分析
在线阅读 下载PDF
数字人文视角下空间表达的新路径
4
作者 庄良 叶超 《热带地理》 北大核心 2026年第1期98-109,共12页
可视化分析技术作为数字人文研究的核心方法,可以将计算模型与人文数据深度匹配,构建起跨学科研究的桥梁。数字人文视角下空间表达的技术内核在于运用图形化映射机制,将体现文本意义、地理场所、关系联接的多源异构数据转化为具备认知... 可视化分析技术作为数字人文研究的核心方法,可以将计算模型与人文数据深度匹配,构建起跨学科研究的桥梁。数字人文视角下空间表达的技术内核在于运用图形化映射机制,将体现文本意义、地理场所、关系联接的多源异构数据转化为具备认知适配性的视觉表征,从而突破传统人文研究的分析局限。基于人文地理学的空间转向,当代数字人文的空间表达主要形成了文本可视化、地理可视化、关系可视化三大支柱,分别对应空间生产理论中关于概念空间、经验空间与生活空间的三元辩证关系。在数字人文范式下,可视化技术不仅革新了释义、情境、结构的空间化方法,更通过人机协同的交互式探索机制,推动形成了数据驱动与人文阐释相结合的创新模式。文章系统解析了典型可视化技术的设计原则与实现路径,并揭示其在数字人文前沿领域中的方法论价值。空间表达的新路径是对地理学三元空间的数字化转译,旨在构建多维人文空间解释框架以便型塑空间融合的研究新范式。在此过程中必须同时警惕技术工具主义与视觉中心主义,进而为数字人文的范式转型与学科建设提供积极参考。 展开更多
关键词 数字化 人文科学 文本可视化 地理可视化 关系可视化
在线阅读 下载PDF
海外敦煌医学多模态研究与中医药文化国际传播
5
作者 张曼玉 王明强 《南京中医药大学学报(社会科学版)》 2026年第1期24-32,共9页
基于跨文化传播与多模态研究框架,系统梳理19世纪末以来海外敦煌医学研究的整体脉络,涵盖欧美、东亚、东南亚及大洋洲等多地学术成果,剖析其地域特征与贡献。发现海外敦煌医学研究呈现三大特征:其一,以文献形态考辨、文本训释、图像视... 基于跨文化传播与多模态研究框架,系统梳理19世纪末以来海外敦煌医学研究的整体脉络,涵盖欧美、东亚、东南亚及大洋洲等多地学术成果,剖析其地域特征与贡献。发现海外敦煌医学研究呈现三大特征:其一,以文献形态考辨、文本训释、图像视觉研究为核心,形成多模态交织互证研究路径;其二,依托多学科交叉协作模式;其三,彰显东西方医学的文明对话特质。海外敦煌医学多模态研究推动中医药文化国际传播在内容、路径与视野方面实现三重进阶,为中医药文化国际传播提供了建构中医药文化多维阐释体系,深化中医药文化价值共鸣、情感认同及重塑中医药话语体系与国际形象的启示,既可为中医药的全球表达提供思路,也可为传统医学的全球共享与国际传播提供实践指引。 展开更多
关键词 敦煌医学 多模态 文献形态 文本内容 图像视觉 中医药文化 国际传播
在线阅读 下载PDF
视觉-语言模型研究综述
6
作者 马翌硕 张光南 +4 位作者 刘亚婷 闫迪 陈冬 刘星愿 郭帅 《计算机技术与发展》 2026年第3期1-10,共10页
近年来,随着多模态学习的快速发展,视觉-语言模型(Visual-Language Models,VLMs)通过结合视觉和语言信息,凭借着其能利用来自互联网的几乎无限的大规模图像-文本对进行预训练,在图像描述和视觉问答等跨模态任务中展现了显著的性能优势,... 近年来,随着多模态学习的快速发展,视觉-语言模型(Visual-Language Models,VLMs)通过结合视觉和语言信息,凭借着其能利用来自互联网的几乎无限的大规模图像-文本对进行预训练,在图像描述和视觉问答等跨模态任务中展现了显著的性能优势,成为该领域的研究热点。然而,关于VLMs的系统性综述,特别是那些包含性能比较、分析和按照从头训练流程进行全面回顾的研究,仍然较为欠缺。因此,该文对截至2025年VLMs的最新进展进行了全面回顾,具体包括:文本与图像原始特征处理方法的分类与讨论;主流模态交互策略的分类与回顾;经典与前沿模型架构的回顾与讨论;流行VLMs的系统性总结;VLMs的预训练任务、迁移学习策略的详细分类与回顾;现有迁移学习方法在性能表现、领域泛化的基准测试与讨论。提出三个未来研究方向。 展开更多
关键词 视觉语言模型 图像文本预训练 视觉语言学习 多模态 迁移学习
在线阅读 下载PDF
用于高质量胸片数据合成的医学潜在扩散模型
7
作者 刘佳霖 孙丽萍 +1 位作者 韩力 杜慧江 《电子科技》 2026年第3期65-74,共10页
针对现有医学影像合成技术在准确捕捉复杂解剖结构和病理状态方面存在不足,从而生成低质量且与实际情况不符的胸片问题,文中提出了一种创新性的医学潜在扩散模型Chest-Chat。基于先前研究结果改进了所提模型,引入一种多模态文本编码器Me... 针对现有医学影像合成技术在准确捕捉复杂解剖结构和病理状态方面存在不足,从而生成低质量且与实际情况不符的胸片问题,文中提出了一种创新性的医学潜在扩散模型Chest-Chat。基于先前研究结果改进了所提模型,引入一种多模态文本编码器MedA-BERT(Medical Attention Strategy Pre-training of Deep Bidirectional Transformers for Language Understanding)。采用跨模态视觉-语言预训练策略构建该编码器并强化胸片影像与对应文本报告间的深刻语义联系,结合双向交叉注意力机制和对比学习显著增强了模型对医学影像报告语义的理解和处理能力。将MedA-BERT与潜在扩散模型的视觉模块相结合,使Chest-Chat能够生成具有详细解剖和病理描述的高质量胸片。在CheXpert和MIMIC-CXR(Chest X-ray)两个公开数据集上进行了广泛评估。实验结果表明,Chest-Chat的FID InceptionV3(Fréchet Inception Distance)、FID XRV和MS-SSIM(Multi-Scale Structural Similarity)分别为58.38、3.69和0.12±0.11,其表现优于现有方法。 展开更多
关键词 胸片 图像生成 多模态文本编码器 视觉-语言预训练 注意力机制 对比学习 潜在扩散模型 条件生成
在线阅读 下载PDF
基于大模型的供电系统跨模态数据协同分析与可视化交互研究
8
作者 余芸 张喜铭 +2 位作者 林志达 梁寿愚 赵翔宇 《自动化与仪器仪表》 2026年第1期336-340,共5页
为解决供电系统中跨模态数据图像块特征与文本特征无法对齐的问题,提出一种基于大模型的多层级特征对齐的图文检索方法(TFPN)。首先,确定图文检索的目标函数;然后以ViT模型作为视觉基础,采用单独抽取的全局特征对特征学习的文本信息进... 为解决供电系统中跨模态数据图像块特征与文本特征无法对齐的问题,提出一种基于大模型的多层级特征对齐的图文检索方法(TFPN)。首先,确定图文检索的目标函数;然后以ViT模型作为视觉基础,采用单独抽取的全局特征对特征学习的文本信息进行引导,之后采用分流拼接注意力机制进行跨模态数据协同与特征交互;最后基于全局图像特征与句子级文本特征的相似度进行图文检索。结果表明,在CCKS2018_Task3数据集下,本方法在文本检索和图像检索中的R@1和R@10指标分别为77.44、95.18和55.27、96.01,均高于基于位置信息图推理和文本指导特征选择的图文检索方法、Transformer-GAN的图文检索方法和基于模态内细粒度特征关系提取的图像文本检索方法。综合分析说明,本方法可实现多层级文本特征金字塔和图像块特征的多阶段融合,从而进一步提升供电系统跨模态数据协同分析效果和可视化交互能力,具备有效性。 展开更多
关键词 跨模态数据 图文检索 分流拼接注意力机制 协同分析 可视化交互
原文传递
面向零样本分类的遥感视觉语言模型综述
9
作者 檀晓萌 席博博 +2 位作者 薛长斌 李云松 徐海涛 《遥感学报》 北大核心 2026年第2期279-295,共17页
经过大规模通用数据的训练,视觉语言模型具备了一定的图文理解能力,在零样本分类、小样本分类、图文检索、图像字幕、视觉问答和视觉定位等多种任务上的性能优异,但在处理遥感等特殊领域图像时,其常因领域分布差异导致性能大幅下降。近... 经过大规模通用数据的训练,视觉语言模型具备了一定的图文理解能力,在零样本分类、小样本分类、图文检索、图像字幕、视觉问答和视觉定位等多种任务上的性能优异,但在处理遥感等特殊领域图像时,其常因领域分布差异导致性能大幅下降。近两年,不少学者对视觉语言模型的遥感领域专用化进行了研究。构建了多个大规模遥感图像文本对数据集,以实现视觉语言模型的遥感领域微调,使其具备地理感知能力。本文以零样本分类任务为主线,重点筛选并分析了支持该任务的遥感视觉语言模型相关研究,采用对比分析法,从遥感图文数据集构建、模型微调策略及架构改进3个维度总结了遥感视觉语言模型的发展。结果表明,用于零样本分类的遥感域视觉语言模型性能高度依赖于大规模高质量标注遥感图文数据对,且受限于高性能算力。此外,当前模型的发展较为分散多样,这使得遥感视觉语言模型的统一基准评价难以建立。未来研究应聚焦于开发融合地理空间先验知识的轻量化架构,并建立统一的遥感视觉语言模型基准评价体系。 展开更多
关键词 遥感智能解译 视觉语言模型 遥感视觉语言模型 模型微调技术 多模态学习 图文对齐 零样本 分类 遥感数据集构建
原文传递
符号互文、数据重组与拟像再现——Sora影像叙事的修辞学建构及其审美逻辑 被引量:4
10
作者 张伟 《云南社会科学》 北大核心 2025年第1期162-170,共9页
视觉修辞作为一种认识论的理论属性为考察Sora的先锋艺术实践提供了契机,也使得从宏观、整体性立场审视Sora成为可能。“图—文”关系作为视觉修辞符号层级的审美实践成为Sora文生视频的修辞参照,Sora对语言文本指令的修正与丰富架构了... 视觉修辞作为一种认识论的理论属性为考察Sora的先锋艺术实践提供了契机,也使得从宏观、整体性立场审视Sora成为可能。“图—文”关系作为视觉修辞符号层级的审美实践成为Sora文生视频的修辞参照,Sora对语言文本指令的修正与丰富架构了影像叙事的时空框架,使得由之形成的影像更具“故事性”。Sora对庞大视觉数据的学习与处理铺垫了其影像生成的深层路径,对视觉数据元素的提取与重组及其形成的互文关系成为其视觉叙事的另一修辞表征。“真实感”作为视觉修辞的内在意指为审视Sora的“形象”构建提供了理论合法性,一定程度上也揭示了Sora社会影响力的成因。符号表征、文本构建与传播效应是视觉修辞切入Sora影像叙事的三个视点,它在深度揭示人工智能视觉生产审美本质的同时,也加持了人们审视人类视觉表征场域这一非人化行动者的理性立场。 展开更多
关键词 视觉修辞 SORA “图—文”关系 互文 拟像
在线阅读 下载PDF
绘本视角下的《动画分镜头设计》课程教学策略研究——以马鞍山职业技术学院动漫专业为例 被引量:2
11
作者 任莹莹 刘颖 《安徽冶金科技职业学院学报》 2025年第1期65-68,共4页
本研究通过案例分析和教学实践,探索绘本资源在动画分镜头设计教学中的应用价值。绘本与动画分镜头在叙事逻辑、视觉语言构建及情感表达机制上具有显著共性,基于高职院校学情特点通过“视觉修辞迁移”“绘本项目贯穿式教学”方法将绘本... 本研究通过案例分析和教学实践,探索绘本资源在动画分镜头设计教学中的应用价值。绘本与动画分镜头在叙事逻辑、视觉语言构建及情感表达机制上具有显著共性,基于高职院校学情特点通过“视觉修辞迁移”“绘本项目贯穿式教学”方法将绘本作为动画分镜头设计教学的载体,有效解决高职专业动画分镜头教学的难题,同时该模式能提升学生的艺术感知力和创意表现能力。 展开更多
关键词 绘本 动画分镜头设计 教学策略 图文叙事
在线阅读 下载PDF
基于DBNet与SVTR的轮胎压印字符识别方法
12
作者 康朝海 蔡成颖 +1 位作者 孙行衍 任伟建 《自动化与仪表》 2025年第9期89-93,98,共6页
为解决汽车智能制造行业高效读取轮胎胎面信息的问题,针对轮胎压印字符识别研究存在的难点,构建了一种基于DBNet与SVTR的压印字符识别模型。首先改进梯度Hough变换和极坐标转换将胎面弯曲文本展平;然后利用模板匹配依据相对位移定位ROI... 为解决汽车智能制造行业高效读取轮胎胎面信息的问题,针对轮胎压印字符识别研究存在的难点,构建了一种基于DBNet与SVTR的压印字符识别模型。首先改进梯度Hough变换和极坐标转换将胎面弯曲文本展平;然后利用模板匹配依据相对位移定位ROI区域;最后基于DBNet检测字符、SVTR识别字符。实验表明,所提方法的检测Hmean达97.24%,识别准确率达99.22%,能有效解决轮胎压印字符识别的实际应用问题。 展开更多
关键词 轮胎压印字符 DBNet SVTR 字符识别
在线阅读 下载PDF
基于文本-视觉和信息熵最小化的对比学习模型
13
作者 蔡晓东 董丽芳 +1 位作者 黄业洋 周丽 《华南理工大学学报(自然科学版)》 北大核心 2025年第3期50-56,共7页
当前的无监督对比学习方法主要依赖纯文本信息来构建句子嵌入,在全面理解句子所表达的深层含义时存在局限性。同时,传统的对比学习方法过于注重最大化文本正实例之间的互信息,忽视了句子嵌入中潜在的噪声干扰。为了既能保留文本中的有... 当前的无监督对比学习方法主要依赖纯文本信息来构建句子嵌入,在全面理解句子所表达的深层含义时存在局限性。同时,传统的对比学习方法过于注重最大化文本正实例之间的互信息,忽视了句子嵌入中潜在的噪声干扰。为了既能保留文本中的有用信息,又能有效地剔除文本嵌入中的噪声干扰,该文提出了一种基于文本-视觉和信息熵最小化的对比学习模型。首先,将文本与对应的视觉信息在对比学习的框架下进行深度融合,共同映射到一个统一的地面空间,并确保它们的表示在该空间中保持一致,从而克服了仅依赖纯文本信息进行句子嵌入学习的限制,使得对比学习过程更加全面且精确;然后,遵循信息最小化原则,在最大化文本正实例间互信息的同时,基于信息熵最小化对文本正实例进行重构。在标准语义文本相似度(STS)任务上的实验结果表明,所提出的模型在Spearman相关系数评价指标上取得了显著提升,相较于现有先进方法具有显著的优势,同时也证明了该模型的有效性。 展开更多
关键词 无监督对比学习 互信息 文本-视觉 信息熵最小化 语义文本相似度
在线阅读 下载PDF
多粒度文本感知分层特征交互的视觉定位方法
14
作者 才华 冉越 +3 位作者 付强 李军龑 张晨洁 孙俊喜 《电子与信息学报》 北大核心 2025年第11期4594-4605,共12页
现有视觉定位方法在文本引导目标定位和特征融合方面存在显著不足,主要表现为未能充分利用文本信息,并且整体性能过于依赖特征提取后的融合过程。针对这一问题,该文提出一种多粒度文本感知分层特征交互的视觉定位方法。该方法在图像分... 现有视觉定位方法在文本引导目标定位和特征融合方面存在显著不足,主要表现为未能充分利用文本信息,并且整体性能过于依赖特征提取后的融合过程。针对这一问题,该文提出一种多粒度文本感知分层特征交互的视觉定位方法。该方法在图像分支中引入分层特征交互模块,利用文本信息增强与文本相关的图像特征;多粒度文本感知模块深入挖掘文本语义内容,生成具有空间和语义增强的加权文本。在此基础上,采用基于哈达玛积的初步融合策略融合加权文本和图像,为跨模态特征融合提供更为精细的图像表示。利用Transformer编码器进行跨模态特征融合,通过多层感知机回归定位坐标。实验结果表明,该文方法在5个经典视觉定位数据集上均取得了显著的精度提升,成功解决了传统方法过度依赖特征融合模块而导致的性能瓶颈问题。 展开更多
关键词 视觉定位 多粒度 文本感知 分层特征交互 自适应文本加权 哈达玛积
在线阅读 下载PDF
基于深度跨域中介模块的英文翻译
15
作者 黄笑菡 程时伟 张纪林 《计算机工程与设计》 北大核心 2025年第9期2502-2508,共7页
为促进文本域与视觉域之间的语义关联,提高英文翻译的准确性,提出一种基于深度跨域中介模块(deep crossdomain intermediary module,DCIM)的英文翻译方法,区别于传统的联合空间学习方法,DCIM作为中介模块指导图像中感兴趣区域与源词之... 为促进文本域与视觉域之间的语义关联,提高英文翻译的准确性,提出一种基于深度跨域中介模块(deep crossdomain intermediary module,DCIM)的英文翻译方法,区别于传统的联合空间学习方法,DCIM作为中介模块指导图像中感兴趣区域与源词之间的交互。通过强化文本编码器和视觉编码器提取的表征之间的语义关联,使视觉表征在语义上得到增强并演化为跨域表征。通过双重注意力解码器,利用两种独立的注意力机制分别处理文本和跨域表征的上下文,预测目标词汇。实验结果表明,集成DCIM的模型在两种英文翻译任务中基于Meteor和Ribes指标取得了最佳翻译准确性和鲁棒性。 展开更多
关键词 深度跨域中介模块 英文翻译 双重注意力解码器 文本域 视觉域 神经网络 自然语言处理
在线阅读 下载PDF
视觉传达设计中的文字设计研究
16
作者 成怡 《上海包装》 2025年第4期183-185,共3页
作为视觉传达设计的核心元素之一,文字不仅承担着信息传递的功能,更是塑造设计整体形象和氛围的关键。阐述了文字在视觉传达设计中的作用,分析了视觉传达设计中的文字要素,探讨了视觉传达设计中的文字设计方法,以期为品牌传播和文化交... 作为视觉传达设计的核心元素之一,文字不仅承担着信息传递的功能,更是塑造设计整体形象和氛围的关键。阐述了文字在视觉传达设计中的作用,分析了视觉传达设计中的文字要素,探讨了视觉传达设计中的文字设计方法,以期为品牌传播和文化交流提供有力支持。 展开更多
关键词 视觉传达设计 文字设计 信息传达
在线阅读 下载PDF
幕墙媒体立面特性对文字显示影响研究
17
作者 何荥 吴广远 +1 位作者 任宣霖 鲍文浩 《照明工程学报》 2025年第6期70-78,共9页
近年来,媒体立面凭借其直观的信息传递和强烈视觉冲击力,深刻改变城市夜间形象的同时,成为城市景观照明中重要元素,并被广泛用于广告及信息传播。但由于媒体立面建筑结构及照明设置限制,部分显示文字存在辨识困难的问题,影响了信息传递... 近年来,媒体立面凭借其直观的信息传递和强烈视觉冲击力,深刻改变城市夜间形象的同时,成为城市景观照明中重要元素,并被广泛用于广告及信息传播。但由于媒体立面建筑结构及照明设置限制,部分显示文字存在辨识困难的问题,影响了信息传递效果。为此,了解媒体立面特性对文字显示的影响,对媒体立面设置运营与管理具有重要的意义。因此,本研究通过对媒体立面类型、结构特性、照明设置及照明参数调研分析,获取典型媒体立面形式。在此基础上,设置开展媒体立面文字易读性及主观舒适度评价实验,获取典型媒体立面特性、亮度对文字显示影响评价。结果显示,500 m以上的视看距离可以较好辨识出文字,视距越远,文字越容易辨识且视觉感知越舒适,亮度对比度越大越容易辨识。用于文字呈现的光源灯带大于12条则能满足基本的辨识要求,相同灯带间隔下,竖向光源布局显示效果优于横向光源布局。 展开更多
关键词 媒体立面 幕墙建筑 文字辨识 视觉舒适度 视距
在线阅读 下载PDF
多模态文本视觉大模型机器人地形感知算法研究 被引量:2
18
作者 孙浩 谢滔 +5 位作者 何龙 郭文忠 虞永方 吴其军 王建伟 东辉 《图学学报》 北大核心 2025年第3期558-567,共10页
为提升机器人在动态复杂环境下对地形的智能感知能力,提出了一种基于多模态文本视觉大模型信息融合地形分割算法,集成了SLIC图像数据预处理、CLIP和SAM掩码生成模块、Dice系数后处理。首先,对原始输入图像进行SLIC预处理,得到图像分割子... 为提升机器人在动态复杂环境下对地形的智能感知能力,提出了一种基于多模态文本视觉大模型信息融合地形分割算法,集成了SLIC图像数据预处理、CLIP和SAM掩码生成模块、Dice系数后处理。首先,对原始输入图像进行SLIC预处理,得到图像分割子块,通过增加提示点提高后续掩码质量,可显著提高地形分类准确度。然后,通过文本-图像预训练大模型CLIP,将输入视觉图像和预设地形文本信息进行匹配,并借助其可解释性和零次学习,生成各地形提示点集合。由SAM大模型接受上述集合生成带有语义标签的掩码数据,并通过Dice系数后处理筛选可用掩码。以Cityscapes数据集为地形分割样本,验证了该算法相较于监督和无监督学习框架下主流分割算法的优越性,在无需标记数据的情况下,实现了76.58%的有效掩码生成率,IoU达到90.14%。针对四足机器人地形感知任务,添加U-net编/解码器网络量化验证模块。以生成掩码作为数据集,构建轻量化地形分割模型,部署在四足机器人的边缘计算设备,并在真实环境中开展地形分割实验。实验结果表明,2种掩码优化方法分别使模型MIo U提升了2.36%和2.56%,最终轻量化模型MIoU达到96.34%,地形分割精度可靠,该算法有效指导了机器人快速地从起点安全行进到目标地,并有效避开草地等非几何障碍物。 展开更多
关键词 深度学习 文本视觉大模型 足式机器人 地形感知 计算机视觉
在线阅读 下载PDF
提要式书目的人物信息挖掘 被引量:1
19
作者 卢子言 肖卓 +1 位作者 颜欣杰 徐健 《图书馆论坛》 北大核心 2025年第2期10-21,共12页
古籍提要是对其内容、著者、版本、评价等方面的简要介绍。目前对提要式书目的研究聚焦于少量提要书籍的定性分析,得到的信息有限。对此,文章首先采用文本挖掘等方法,抽取各类书目中的人物基本信息,分析高频人物的特征;其次,从提要人物... 古籍提要是对其内容、著者、版本、评价等方面的简要介绍。目前对提要式书目的研究聚焦于少量提要书籍的定性分析,得到的信息有限。对此,文章首先采用文本挖掘等方法,抽取各类书目中的人物基本信息,分析高频人物的特征;其次,从提要人物评价视角切入,剖析人物整体评价和人物写作风格评价信息;然后基于学术流派对评价进行对比,分析不同文学流派的评价。研究发现:高频文献作者往往具有高科名、广泛学术影响力、朝代分布相对集中三类显著特征;提要撰写者最倾向于关注文献作者的个人喜好、教育经历和擅长领域;提要撰写者倾向于从文学作品主要构成角度来描述人物的写作风格,《四库全书》涉及的朝代跨度最广,提要书目中的评价情感以正向和中性为主,特别是清朝、周朝和民国时期的评价更偏向正向;提要撰写者对各学术流派的评价以中性为主,对于宋明理学流派,多本提要书目的撰写者均有提及,评价较客观和正面,相较之下,对明代七子派的评价大多源于四库馆臣,评价明显更为苛刻。这些人物信息不仅多角度地展现了人物特征和人物评价的特点,还揭示了古籍提要书目中存在的人文特征和社会规律,为古籍和历史人物研究提供了新的分析视角。 展开更多
关键词 古籍提要 文本挖掘 可视化
在线阅读 下载PDF
日本画家富冈铁斋《东坡笠屐图》的中国范式与创新意趣
20
作者 衣若芬 《三苏学刊》 2025年第3期390-399,共10页
画家富冈铁斋被誉为日本最后的文人画家,他自青年时期开始学习绘画便兼顾日本和中国的美术技法。由于相隔八百年后,与苏东坡同日生,富冈铁斋热衷于收集苏东坡的相关文物、书籍和图像。他晚年绘制了大量苏东坡题材的作品,其中之一就是《... 画家富冈铁斋被誉为日本最后的文人画家,他自青年时期开始学习绘画便兼顾日本和中国的美术技法。由于相隔八百年后,与苏东坡同日生,富冈铁斋热衷于收集苏东坡的相关文物、书籍和图像。他晚年绘制了大量苏东坡题材的作品,其中之一就是《东坡笠屐图》。《东坡笠屐图》描述谪居海南岛的苏东坡一日出门遇雨,向农家借木屐和斗笠穿戴而归,引起妇人小孩笑看、小狗狂吠的故事。文章选取六件富冈铁斋的《东坡笠屐图》,考察其图像范式的中国根源以及富冈铁斋独创的造型风格所构设的知识场景与艺术趣味。 展开更多
关键词 《东坡笠屐图》 富冈铁斋 图像范式 创新意趣 文图学
在线阅读 下载PDF
上一页 1 2 25 下一页 到第
使用帮助 返回顶部