期刊文献+
共找到636篇文章
< 1 2 32 >
每页显示 20 50 100
Natural Scene Classification Inspired by Visual Perception and Cognition Mechanisms
1
作者 ZHANG Rui 《重庆理工大学学报(自然科学)》 CAS 2011年第7期24-43,共20页
The process of human natural scene categorization consists of two correlated stages: visual perception and visual cognition of natural scenes.Inspired by this fact,we propose a biologically plausible approach for natu... The process of human natural scene categorization consists of two correlated stages: visual perception and visual cognition of natural scenes.Inspired by this fact,we propose a biologically plausible approach for natural scene image classification.This approach consists of one visual perception model and two visual cognition models.The visual perception model,composed of two steps,is used to extract discriminative features from natural scene images.In the first step,we mimic the oriented and bandpass properties of human primary visual cortex by a special complex wavelets transform,which can decompose a natural scene image into a series of 2D spatial structure signals.In the second step,a hybrid statistical feature extraction method is used to generate gist features from those 2D spatial structure signals.Then we design a cognitive feedback model to realize adaptive optimization for the visual perception model.At last,we build a multiple semantics based cognition model to imitate human cognitive mode in rapid natural scene categorization.Experiments on natural scene datasets show that the proposed method achieves high efficiency and accuracy for natural scene classification. 展开更多
关键词 natural scene classification visual perception model visual cognition model
在线阅读 下载PDF
Introduction to Visual Surveillance of Dynamic Scenes
2
作者 Steve Maybank 《自动化学报》 EI CSCD 北大核心 2003年第3期319-320,共2页
关键词 of Introduction to visual Surveillance of Dynamic scenes
全文增补中
照度条件自适应的粒度渐进多模态图像融合方法 被引量:1
3
作者 王传云 孙冬冬 +3 位作者 周明奇 王田 高骞 李照奎 《工程科学学报》 北大核心 2025年第6期1257-1271,共15页
为应对光照条件复杂多变下的多场景视觉感知挑战,本文提出了一种照度条件自适应的粒度渐进多模态图像融合方法.首先,设计了基于大模型的场景信息嵌入模块,通过预训练的图像编码器对输入的可见光图像进行场景建模,并利用不同的线性层对... 为应对光照条件复杂多变下的多场景视觉感知挑战,本文提出了一种照度条件自适应的粒度渐进多模态图像融合方法.首先,设计了基于大模型的场景信息嵌入模块,通过预训练的图像编码器对输入的可见光图像进行场景建模,并利用不同的线性层对场景向量进行处理.随后,利用处理后的场景向量对图像重建阶段的图像特征在通道维度上进行调控,使得融合模型能够根据不同的场景光照生成不同风格的融合图像.其次,为了解决现有特征提取模块在特征表达上的不足,本文设计了基于状态空间方程的特征提取模块,以线性复杂度实现全局特征感知,减少了信息传输过程中的信息丢失,提升了融合图像的视觉效果.最后,设计了粒度渐进融合模块,利用状态空间方程对多模态特征进行全局聚合,并引入跨模态坐标注意力机制对聚合后的特征进行精细调优,从而实现多模态特征从全局到局部的多阶段融合,增强了网络的信息整合能力.在训练过程中,本文采用先验知识生成增强图像作为标签,并根据不同环境构建同源与异构的损失函数,以实现场景自适应的多模态图像融合.实验结果显示,本文方法在暗光场景数据集MSRS和LLVIP、混合光照数据集TNO、连续场景数据集RoadScene以及雾霾场景数据集M3FD上的表现均优于11种先进算法,在定量和定性对比中取得了更好的视觉效果和更高的定量指标.所提出的方法在自动驾驶、军事侦察和环境监控等任务中展现出较大的潜力. 展开更多
关键词 视觉感知优化 图像融合 多模态 场景自适应 状态空间模型 跨模态注意力机制
在线阅读 下载PDF
基于多语义关联与融合的视觉问答模型
4
作者 周浩 王超 +1 位作者 崔国恒 罗廷金 《计算机应用》 北大核心 2025年第3期739-745,共7页
弥合视觉图像和文本问题之间的语义差异是提高视觉问答(VQA)模型推理准确性的重要方法之一。然而现有的相关模型大多数基于低层图像特征的提取并利用注意力机制推理问题的答案,忽略了高层图像语义特征如关系和属性特征等在视觉推理中的... 弥合视觉图像和文本问题之间的语义差异是提高视觉问答(VQA)模型推理准确性的重要方法之一。然而现有的相关模型大多数基于低层图像特征的提取并利用注意力机制推理问题的答案,忽略了高层图像语义特征如关系和属性特征等在视觉推理中的作用。为解决上述问题,提出一种基于多语义关联与融合的VQA模型以建立问题与图像之间的语义联系。首先,基于场景图生成框架提取图像中的多种语义并把它们进行特征精炼后作为VQA模型的特征输入,从而充分挖掘图像场景中的信息;其次,为提高图像特征的语义价值,设计一个信息过滤器过滤图像特征中的噪声和冗余信息;最后,设计多层注意力融合和推理模块将多种图像语义分别与问题特征进行语义融合,以强化视觉图像重点区域与文本问题之间的语义关联。与BAN(Bilinear Attention Network)和CFR(Coarse-to-Fine Reasoning)模型的对比实验结果表明,所提模型在VQA2.0测试集上的准确率分别提高了2.9和0.4个百分点,在GQA测试集上的准确率分别提高了17.2和0.3个百分点。这表明所提模型能够更好地理解图像场景中的语义并回答组合式视觉问题。 展开更多
关键词 多语义特征融合 视觉问答 场景图 属性注意力 关系注意力
在线阅读 下载PDF
基于深度学习的动态场景视觉SLAM算法
5
作者 王晓栋 陈援峰 杨伟高 《广州城市职业学院学报》 2025年第3期95-100,共6页
同时定位与地图构建(SLAM)技术是无人机或机器人在未知复杂环境中进行自主探索的关键研究方向。借助该技术,机器人能够通过其传感器获取的数据,实时计算自身的位姿,同时构建外部环境的高精度地图。基于这些信息,机器人不仅能够制定路径... 同时定位与地图构建(SLAM)技术是无人机或机器人在未知复杂环境中进行自主探索的关键研究方向。借助该技术,机器人能够通过其传感器获取的数据,实时计算自身的位姿,同时构建外部环境的高精度地图。基于这些信息,机器人不仅能够制定路径规划,还可以动态修正位姿误差,从而显著提升在未知环境中导航的准确性和稳定性。在使用视觉传感器的SLAM系统中,位姿解算通常依赖于几何算法和特征匹配技术。这些方法通常假设外部环境由静止的物体构成,即基于场景静态化的前提。然而,在实际应用中,动态物体如行人和车辆经常出现,这对系统的性能和鲁棒性提出了严峻的挑战。因此,引入深度学习技术与视觉SLAM算法相结合,在现有的ORB-SLAM2算法框架上新增一个动态目标检测线程,用于识别动态物体,并在里程计的计算中剔除动态点,以减少动态目标对系统定位精度的影响。实验结果表明,该方法能够显著降低绝对轨迹误差,提升SLAM算法在动态场景下的适用性和稳定性。 展开更多
关键词 视觉SLAM 动态场景 深度学习 目标检测
在线阅读 下载PDF
建筑内基于虚拟仿真的跨视域行人监测研究
6
作者 陶振翔 李滢 +3 位作者 黄绪勃 王一森 张平 杨锐 《中国安全科学学报》 北大核心 2025年第5期161-168,共8页
为解决高层建筑楼宇或复杂开放建筑环境中多路视频数据采集成本高、长时间高质量标注难等问题,实现跨视域多路视频数据的生成与行人图像的自动标注,首先,设计虚拟现实场景,模拟行人运动并自动获取标记数据;其次,研究无监督领域自适应方... 为解决高层建筑楼宇或复杂开放建筑环境中多路视频数据采集成本高、长时间高质量标注难等问题,实现跨视域多路视频数据的生成与行人图像的自动标注,首先,设计虚拟现实场景,模拟行人运动并自动获取标记数据;其次,研究无监督领域自适应方法,降低源域数据与目标域数据的特征分布差异,使模型泛化至目标建筑场景;最后,验证模型泛化能力。研究结果表明:构建的虚拟现实场景能有效克服跨视域视频数据采集与高质量标注的困难;无监督领域自适应方法将平均首位命中率从22.02%提升至45.48%;结合源域风格转换、数据增广和目标域伪标签生成,首位命中率提升20%,降低了分布偏差,有助于实现模型在不同建筑场景中的泛化。 展开更多
关键词 建筑场景 虚拟仿真 跨视域 行人运动 自动标注
原文传递
MR技术嵌入电子实验教学探索
7
作者 高玄怡 杨惠霞 +3 位作者 陈威 乔婧思 卢继华 王业亮 《实验室研究与探索》 北大核心 2025年第5期111-115,共5页
针对传统电子实验教学中学生对元器件内部构造机理的动态变化过程缺乏深入理解,导致实验调试时盲目操作的问题,提出一种基于混合现实(MR)技术的实验教学新模式,以“火灾报警电路综合设计实验”为例,展示MR技术在虚实结合场景中的应用。... 针对传统电子实验教学中学生对元器件内部构造机理的动态变化过程缺乏深入理解,导致实验调试时盲目操作的问题,提出一种基于混合现实(MR)技术的实验教学新模式,以“火灾报警电路综合设计实验”为例,展示MR技术在虚实结合场景中的应用。通过三维可视化技术,直观“透视”晶体管内部构造及载流子运行状态。实验结果表明,MR嵌入实验教学促进学生快速掌握和应用电子学知识,激发学生形象思维和创造力,培养学生深入探索的高阶思维,实现传统电子实验教学从单一模式向多维交互形式的转变,为实验教学与数字化技术的深度融合提供新的实践路径。 展开更多
关键词 混合现实技术 实验教学新模式 虚实场景 三维可视化
在线阅读 下载PDF
无人机景象匹配导航技术研究综述
8
作者 王小攀 李建胜 +3 位作者 王安成 武燕 杨子迪 郭雨岩 《测绘科学技术学报》 2025年第3期221-229,共9页
拒止环境下的自主导航是未来无人机在各领域应对复杂环境时务必要解决的首要问题。目前,无人机导航和定位主要依赖全球卫星导航系统(GNSS)和惯性导航系统(INS),GNSS具有高精度特点,但容易受到外部复杂环境干扰;INS抗干扰能力较强,但其... 拒止环境下的自主导航是未来无人机在各领域应对复杂环境时务必要解决的首要问题。目前,无人机导航和定位主要依赖全球卫星导航系统(GNSS)和惯性导航系统(INS),GNSS具有高精度特点,但容易受到外部复杂环境干扰;INS抗干扰能力较强,但其定位误差会随时间慢慢累积。景象匹配导航技术(SMN)具有长时自主性、可视性、高精度、抗干扰性强、智能化等优点,更适合拒止环境下作为辅助GNSS和INS的自主导航手段为无人机飞行提供服务。该文聚焦无人机景象匹配导航技术系统原理,介绍了无人机景象匹配导航关键技术组成,并对该领域近十年的发展现状进行了梳理总结,最后对无人机景象匹配导航技术未来发展趋势进行了展望。 展开更多
关键词 拒止环境 自主导航 景象匹配 惯性 视觉导航
在线阅读 下载PDF
基于DBNet与SVTR的轮胎压印字符识别方法
9
作者 康朝海 蔡成颖 +1 位作者 孙行衍 任伟建 《自动化与仪表》 2025年第9期89-93,98,共6页
为解决汽车智能制造行业高效读取轮胎胎面信息的问题,针对轮胎压印字符识别研究存在的难点,构建了一种基于DBNet与SVTR的压印字符识别模型。首先改进梯度Hough变换和极坐标转换将胎面弯曲文本展平;然后利用模板匹配依据相对位移定位ROI... 为解决汽车智能制造行业高效读取轮胎胎面信息的问题,针对轮胎压印字符识别研究存在的难点,构建了一种基于DBNet与SVTR的压印字符识别模型。首先改进梯度Hough变换和极坐标转换将胎面弯曲文本展平;然后利用模板匹配依据相对位移定位ROI区域;最后基于DBNet检测字符、SVTR识别字符。实验表明,所提方法的检测Hmean达97.24%,识别准确率达99.22%,能有效解决轮胎压印字符识别的实际应用问题。 展开更多
关键词 轮胎压印字符 DBNet SVTR 字符识别
在线阅读 下载PDF
动态场景下基于深度学习的MR VSLAM综述
10
作者 高春艳 郭超阳 +1 位作者 孙凌宇 张明路 《计算机仿真》 2025年第3期466-471,共6页
视觉同时定位与地图构建(VSLAM)在动态场景中性能下降和缺乏鲁棒性已成为其实际应用的主要障碍。为应对复杂场景及其参数高度动态的挑战,将深度学习网络与VSLAM系统相结合,分割出场景中的静态背景和动态目标,实现移动机器人的精准定位... 视觉同时定位与地图构建(VSLAM)在动态场景中性能下降和缺乏鲁棒性已成为其实际应用的主要障碍。为应对复杂场景及其参数高度动态的挑战,将深度学习网络与VSLAM系统相结合,分割出场景中的静态背景和动态目标,实现移动机器人的精准定位。介绍已经用于VSLAM系统的深度学习网络,综合分析动态场景下基于深度学习的移动机器人VSLAM系统的研究进展,从动态目标删除与静态背景重建、动态目标跟踪与重建两方面进行综述,并对其深入应用做出展望。 展开更多
关键词 移动机器人 视觉同时定位与地图构建 深度学习 动态场景
在线阅读 下载PDF
景象匹配无人机视觉定位 被引量:3
11
作者 袁媛 孙柏 刘赶超 《自动化学报》 北大核心 2025年第2期287-311,共25页
无人机因其高度的灵活性,在临地安防、灾后救援、地质勘测、农业植保等领域发挥着重要作用,因此受到越来越多的关注.定位导航作为无人机中的关键技术,对于无人机能否顺利执行任务至关重要.当前主要的定位导航算法包括全球导航卫星系统... 无人机因其高度的灵活性,在临地安防、灾后救援、地质勘测、农业植保等领域发挥着重要作用,因此受到越来越多的关注.定位导航作为无人机中的关键技术,对于无人机能否顺利执行任务至关重要.当前主要的定位导航算法包括全球导航卫星系统、惯性定位以及景象匹配定位导航等.首先,景象匹配定位导航方法利用计算机视觉技术,对无人机飞行时采集的航空影像进行数字化特征编码;随后,通过构建相似性度量与检索模型,将航空影像特征与预先获取的遥感地图库特征进行相似性度量,从而完成景象匹配;最后,根据无人机航空影像与遥感卫星地图的匹配结果,获取相应的地理位置信息,并将其更新为无人机的定位结果.景象匹配定位导航方法摆脱了定位系统对定位信号的依赖,实现了无人机飞行定位的自主化.鉴于此,以景象匹配算法中的特征提取方式为线索,分别针对基于模板匹配、基于手工特征以及基于度量学习的景象匹配,梳理其发展过程,并总结景象匹配定位导航方法中的关键问题.最后,针对景象匹配算法的发展现状,总结无人机景象匹配定位方法中亟待解决的问题. 展开更多
关键词 临地安防 无人机 视觉定位 景象匹配 度量学习 多视角变化
在线阅读 下载PDF
融合视觉显著性的无人机SLAM导航定位
12
作者 黄龙杨 王致远 +2 位作者 屈若锟 熊乾凯 李诚龙 《计算机工程与设计》 北大核心 2025年第2期562-569,共8页
为解决无人机在室外复杂环境中飞行利用单目视觉同时定位与地图构建算法进行导航定位时选取特征点质量不高、噪声干扰,存在位姿估计误差过大的问题,提出一种加入图像多尺度分解进行双向迭代的视觉显著性处理线程,引入特征点稀疏性约束... 为解决无人机在室外复杂环境中飞行利用单目视觉同时定位与地图构建算法进行导航定位时选取特征点质量不高、噪声干扰,存在位姿估计误差过大的问题,提出一种加入图像多尺度分解进行双向迭代的视觉显著性处理线程,引入特征点稀疏性约束提高选取特征点的质量来提高计算精度。通过仿真实验分析该算法的鲁棒性与实时性。将无人机室外飞行实验结果与其它算法进行比较,验证了该算法在室外复杂环境中大幅提高了无人机位姿估计的准确度。 展开更多
关键词 无人机视觉导航定位 同步定位与地图构建 视觉显著性 稀疏性约束 单目视觉 室外场景 噪声干扰 算法鲁棒性
在线阅读 下载PDF
一种道路注记与实景三维模型的融合显示方法 被引量:1
13
作者 钟娜娜 周圣川 +2 位作者 赵军 王海银 乔新 《测绘通报》 北大核心 2025年第1期165-169,共5页
为了提高道路注记在三维地理信息系统中的视觉表现和用户体验,本文提出了一种将道路注记与实景三维模型融合显示的方法。通过道路数据显示规则设计、预处理生成路名注记点、查询服务接口封装、实景三维客户端实时分析融合显示的流程方法... 为了提高道路注记在三维地理信息系统中的视觉表现和用户体验,本文提出了一种将道路注记与实景三维模型融合显示的方法。通过道路数据显示规则设计、预处理生成路名注记点、查询服务接口封装、实景三维客户端实时分析融合显示的流程方法,有效地将文字信息嵌入三维场景中,保证了用户在不同视角和缩放级别下的阅读舒适度和信息获取准确性,具有立体美观、计算高效、不压盖、兼容超大范围实景三维应用等特点,为实景三维补充了重要的语义数据,有效提升了实景三维的应用效果。 展开更多
关键词 实景三维 道路 注记 融合可视化 三维场景
原文传递
视觉感知导向的实景三维建筑场景LOD自适应可视化 被引量:1
14
作者 林浩嘉 郭仁忠 +3 位作者 贺彪 蒯希 马丁 李程鹏 《测绘学报》 北大核心 2025年第6期1054-1070,共17页
三维模型多分辨率表征(LOD)是三维场景可视化的重要技术。然而,对于具有真实程度高、尺度跨度大、数据规模大等特点的实景三维建筑场景可视化,仍存在可视化质量度量不准确、层次切换不连续、渲染效率不稳定等问题,难以在视点变换过程中... 三维模型多分辨率表征(LOD)是三维场景可视化的重要技术。然而,对于具有真实程度高、尺度跨度大、数据规模大等特点的实景三维建筑场景可视化,仍存在可视化质量度量不准确、层次切换不连续、渲染效率不稳定等问题,难以在视点变换过程中保持视觉舒适性。本文提出了视觉感知导向的三维建筑场景LOD自适应可视化方法。首先,综合考虑三维渲染与视觉感知的过程与机理,对LOD可视化的视觉感知过程与特性进行归纳总结;然后,基于“三维空间-屏幕空间-视觉感知”的变换过程,对LOD可视化中简化模型误差的视觉感知进行量化表征,提出了基于视觉感知的LOD可视化质量度量方法;最后,将LOD可视化质量度量运用至LOD调度,综合考虑视觉关注和视点运动对可视化质量度量的影响,建立LOD层次选择准则,结合多线程调度技术,提出了顾及视觉感知特性的LOD自适应调度方法。试验结果表明,本文方法可以保持LOD切换过程的视觉舒适性,在可视化质量与效率之间保持动态平衡,实现了符合人眼视觉感知的三维建筑场景LOD自适应调度与渲染。 展开更多
关键词 视觉感知 LOD 多尺度表达 三维可视化 实景三维
在线阅读 下载PDF
基于熵权法的革命遗址纪念馆室内光环境优化设计研究
15
作者 侯万钧 申开兴 +1 位作者 席晖 暴磊 《家具与室内装饰》 北大核心 2025年第5期98-105,共8页
光环境作为建筑室内重要的物理环境,在展览类建筑室内设计中必不可少,为了提高革命遗址建筑室内光环境的舒适性,探究天然光与人工光相互影响下灯具参数与室内光环境质量、展品呈现效果之间的关系;以涉县一二九师司令部旧址为例,基于DIA... 光环境作为建筑室内重要的物理环境,在展览类建筑室内设计中必不可少,为了提高革命遗址建筑室内光环境的舒适性,探究天然光与人工光相互影响下灯具参数与室内光环境质量、展品呈现效果之间的关系;以涉县一二九师司令部旧址为例,基于DIALux对天然采光和人工照明的动态交互响应,结合熵权法建立室内混合光环境(由天然光和人工光共同作用的光环境)质量评价模型,筛选出最优的灯具功率、光束角和瞄准点位置参数组合方案。在此基础上对不同色温场景的视觉舒适性和场景还原度进行主观评价,结果表明:不同季节旧址纪念馆室内灯具影响混合光环境质量的参数优先级为:瞄准点位置>光束角>功率,且当灯具功率大小为24 W,光束角为36°,瞄准点位置为展品表面中心时光环境质量最佳;优化模型照度均匀度U0、照度平均值Eav和综合评分Si与基准模型相比标准化后分别提升了41.49%、16.11%和25.55%;同时,当光源色温为3400K-4000K时被试者视觉舒适性、场景还原度及呈现效果评价较高,并在3600K时呈现效果综合满意度最大。研究将不同参数分阶段组合并进行主客观协同评价,为革命遗址纪念馆室内光环境的改造与设计提供了理论支持。 展开更多
关键词 熵权法 灯具参数 视觉舒适性 场景还原度 协同评价
在线阅读 下载PDF
基于YOLOv8的室内动态场景下视觉SLAM方法研究
16
作者 黄钰洲 柯福阳 《南京信息工程大学学报》 北大核心 2025年第5期670-678,共9页
针对在室内动态环境中,传统视觉SLAM算法受到大量无意义信息的影响,导致定位精度下降、鲁棒性差的问题,提出一种基于YOLOv8的室内动态场景视觉SLAM——PLYO-SLAM算法.该算法在ORB-SLAM3算法跟踪线程引入EDLines线段检测算法,并新增动态... 针对在室内动态环境中,传统视觉SLAM算法受到大量无意义信息的影响,导致定位精度下降、鲁棒性差的问题,提出一种基于YOLOv8的室内动态场景视觉SLAM——PLYO-SLAM算法.该算法在ORB-SLAM3算法跟踪线程引入EDLines线段检测算法,并新增动态区域检测线程.动态区域检测线程由YOLOv8nseg实例分割网络组成,实例分割赋予动态场景语义信息并生成动态掩码,同时剔除动态区域点线特征,利用几何约束进一步过滤分割掩码外缺失的动态点特征.使用公开数据集TUM进行实验验证,结果表明,相较于ORB-SLAM3算法,PLYO-SLAM算法在动态环境下的绝对轨迹均方根误差平均降低了75.98%,最高降低96.75%. 展开更多
关键词 视觉SLAM 动态场景 YOLOv8n EDLines算法
在线阅读 下载PDF
基于视觉对比注意力的隐式文本图像细粒度匹配
17
作者 殷亚珏 王晶晶 《计算机应用与软件》 北大核心 2025年第7期148-154,160,共8页
文本图像细粒度匹配任务旨在对齐图片和文本中的细粒度实体部分(例如:对齐图片中的目标对象与文本中涉及的短语)。与以往研究不同,该文提出一种新的面向隐式场景的文本图像细粒度匹配任务,该任务专注于处理需要依赖上下文语境或更多外... 文本图像细粒度匹配任务旨在对齐图片和文本中的细粒度实体部分(例如:对齐图片中的目标对象与文本中涉及的短语)。与以往研究不同,该文提出一种新的面向隐式场景的文本图像细粒度匹配任务,该任务专注于处理需要依赖上下文语境或更多外部知识才能够识别出细粒度匹配关系的文本-图片对。特别地,针对该新任务,制定相应的语料标注规范,并标注一个面向隐式场景的文本图像细粒度匹配数据集。在此基础上,提出一种基于视觉对比注意力的方法,用于缓解该新任务存在的语义匹配信息稀疏问题。实验结果表明,提出的视觉对比注意力的方法在隐式匹配任务上取得了显著的性能提升。 展开更多
关键词 细粒度 隐式场景 视觉对比注意力
在线阅读 下载PDF
叙事工坊:交互式叙事场景的自动生成
18
作者 朱晗希 高可隽 +5 位作者 陈小雨 李怡珂 覃诗睿 赵乐朋 张少魁 张松海 《计算机学报》 北大核心 2025年第7期1517-1528,共12页
近年来,随着交互式数字环境的快速进步,现代技术使用户能够完全沉浸在交互式叙事场景和游戏体验中。尽管静态3D场景构建技术已相当成熟,但人们对于叙事场景中能够增强叙事体验的需求却日益增长。本文提出了一种创新方法,通过将构成叙事... 近年来,随着交互式数字环境的快速进步,现代技术使用户能够完全沉浸在交互式叙事场景和游戏体验中。尽管静态3D场景构建技术已相当成熟,但人们对于叙事场景中能够增强叙事体验的需求却日益增长。本文提出了一种创新方法,通过将构成叙事情节的单个事件(故事点)巧妙地融入场景中,从而构建出引人入胜的叙事场景。本方法通过优化故事点的空间和时间布局,综合考虑视觉显著性、叙事节奏和场景布局合理性,从而构建一个动态且交互性强的场景。这不仅使用户能够更有效地探索、交互叙事场景,还极大地增强了沉浸的故事体验。 展开更多
关键词 场景合成 叙事场景 视觉显著点 模拟退火算法 交互式3D体验
在线阅读 下载PDF
视觉感知人景互影响的人体动作预测方法
19
作者 李沁 陈飞扬 +3 位作者 彭晗 王勇 刘利枚 张伟 《智能系统学报》 北大核心 2025年第4期1010-1023,共14页
场景信息驱动人类调整动作轨迹,对人体动作预测影响较大。当前研究仅捕获场景信息更新动作特征,忽略了场景与动作的互影响关系。为此,提出一种视觉感知人景互影响的人体动作预测方法。提取动作特征和场景特征,然后循环执行场景信息捕获... 场景信息驱动人类调整动作轨迹,对人体动作预测影响较大。当前研究仅捕获场景信息更新动作特征,忽略了场景与动作的互影响关系。为此,提出一种视觉感知人景互影响的人体动作预测方法。提取动作特征和场景特征,然后循环执行场景信息捕获单元和场景适应度增强单元。前者捕获影响动作的场景信息,后者利用该信息更新动作特征以增强场景适应性。完成循环后,得到场景适应型动作特征。基于该特征执行噪声逆扩散完成动作预测。在3个数据集上进行实验,结果表明本文方法的预测误差低于当前主流方法,验证了其有效性。本文方法将为真实场景中的人体动作预测提供更加可靠的解决方案。 展开更多
关键词 人体动作预测 场景信息 视觉感知 动作特征 场景特征 人景互影响 场景适应性 噪声逆扩散
在线阅读 下载PDF
火场三维建模在火灾视频光影分析中的应用 被引量:1
20
作者 王晓军 宋丞玉 +1 位作者 杨天乐 王鑫 《消防科学与技术》 北大核心 2025年第6期862-868,876,共8页
以两起火灾事故调查为例,介绍了火灾现场三维建模在火灾视频光影分析中的应用。通过火场三维建模技术与几何作图法的结合,分析了一起民房火灾起火过程中火光光源位置的变化和火灾的蔓延过程。通过火场三维建模技术在光影分析中的独立应... 以两起火灾事故调查为例,介绍了火灾现场三维建模在火灾视频光影分析中的应用。通过火场三维建模技术与几何作图法的结合,分析了一起民房火灾起火过程中火光光源位置的变化和火灾的蔓延过程。通过火场三维建模技术在光影分析中的独立应用,分析了一起客厅火灾中起火初期火光光源的位置。在此基础上,分析了火场三维建模技术在火灾视频光影分析中的优势和实践中应注意的事项,为火场三维建模在火灾视频光影分析中的应用提供了方法参考。 展开更多
关键词 三维建模 现场可视化 火灾视频 光影分析 火灾调查
在线阅读 下载PDF
上一页 1 2 32 下一页 到第
使用帮助 返回顶部