期刊文献+
共找到349篇文章
< 1 2 18 >
每页显示 20 50 100
Bubble behavior characteristics based on virtual binocular stereo vision 被引量:3
1
作者 薛婷 徐灵双 张尚臻 《Optoelectronics Letters》 EI 2018年第1期44-47,共4页
The three-dimensional(3D) behavior characteristics of bubble rising in gas-liquid two-phase flow are of great importance to study bubbly flow mechanism and guide engineering practice. Based on the dual-perspective ima... The three-dimensional(3D) behavior characteristics of bubble rising in gas-liquid two-phase flow are of great importance to study bubbly flow mechanism and guide engineering practice. Based on the dual-perspective imaging of virtual binocular stereo vision, the 3D behavior characteristics of bubbles in gas-liquid two-phase flow are studied in detail, which effectively increases the projection information of bubbles to acquire more accurate behavior features. In this paper, the variations of bubble equivalent diameter, volume, velocity and trajectory in the rising process are estimated, and the factors affecting bubble behavior characteristics are analyzed. It is shown that the method is real-time and valid, the equivalent diameter of the rising bubble in the stagnant water is periodically changed, and the crests and troughs in the equivalent diameter curve appear alternately. The bubble behavior characteristics as well as the spiral amplitude are affected by the orifice diameter and the gas volume flow. 展开更多
关键词 Bubble behavior characteristics based on virtual binocular stereo vision
原文传递
QoE Assessment of Will Transmission Using Vision and Haptics in Networked Virtual Environment
2
作者 Pingguo Huang Yutaka Ishibashi 《International Journal of Communications, Network and System Sciences》 2014年第8期265-278,共14页
In this paper, we handle collaborative work in which two users move an object together to eliminate a target in a 3-D virtual space. In the work, the users transmit their wills about movement direction of the object t... In this paper, we handle collaborative work in which two users move an object together to eliminate a target in a 3-D virtual space. In the work, the users transmit their wills about movement direction of the object to each other by only haptics and by haptics and vision (including with/ without drawing an arrow to indicate the direction of force applied to the object by the other user). We carry out QoE (Quality of Experience) assessment subjectively and objectively to investigate the influence of network delay on will transmission. As a result, we clarify the effects of vision on the transmissibility of haptic will transmission. 展开更多
关键词 NETWORKED virtual Environment vision Haptics WILL TRANSMISSION Network DELAY QOE
暂未订购
应用IMAQ Vision的齿轮测量技术 被引量:5
3
作者 雷振山 刘兆妮 《制造技术与机床》 CSCD 北大核心 2005年第2期53-56,共4页
应用IMAQVision将机器视觉技术和虚拟仪器技术相结合,可以快速、准确地进行齿轮在线测量。介绍了基于IMAQVision,应用图像直方图分析和LUT变换、几何变换、边缘检测、亚像素精度、模式匹配等图像处理技术的齿轮几何参数测量方法,分析了... 应用IMAQVision将机器视觉技术和虚拟仪器技术相结合,可以快速、准确地进行齿轮在线测量。介绍了基于IMAQVision,应用图像直方图分析和LUT变换、几何变换、边缘检测、亚像素精度、模式匹配等图像处理技术的齿轮几何参数测量方法,分析了其中主要IMAQVision函数的算法。在LabVIEW平台上开发了实用的齿轮测量机器视觉系统。 展开更多
关键词 机器视觉系统 模式匹配 LABVIEW平台 边缘检测 亚像素 算法 图像 齿轮测量 几何参数 精度
在线阅读 下载PDF
基于LabVIEW Vision的无人机自主着降系统设计与实现 被引量:4
4
作者 张佳 《计算机测量与控制》 2017年第8期252-254,293,共4页
四旋翼无人机具有低成本、垂直起降、机动性好等优点,在民用领域诸如航拍、植保、物流、电力巡线等场合得到了广泛的关注和应用;随着四旋翼无人机应用的普及,一些新的问题也随之出现,其中一个厄待解决的问题是如何提高无人机的降落精度... 四旋翼无人机具有低成本、垂直起降、机动性好等优点,在民用领域诸如航拍、植保、物流、电力巡线等场合得到了广泛的关注和应用;随着四旋翼无人机应用的普及,一些新的问题也随之出现,其中一个厄待解决的问题是如何提高无人机的降落精度和可靠性,特别在超视距应用场景下,这一需求尤为突出;通过采用机器视觉技术,利用LabVIEW Vision编制视觉识别软件,可以控制四旋翼无人机实现高精度的自主降落。 展开更多
关键词 无人机 虚拟仪器 机器视觉 自主降落
在线阅读 下载PDF
基于NI Vision的汉信码图像处理技术 被引量:1
5
作者 何成平 蒋珍琦 《工业控制计算机》 2013年第7期79-80,共2页
介绍了一种基于NI Visoin汉信码图像处理系统,该系统采用LabVIEW开发平台,对系统的实现进行了详细的讨论,给出了图像采集模块的部分G语言代码。实验结果表明,该系统具有较高的测试精度和效率,操作简便。
关键词 汉信码 NI Vison 图像处理 虚拟仪器 机器视觉
在线阅读 下载PDF
基于LabVIEW Vision的航空炮弹缺陷检测方案设计 被引量:1
6
作者 蔺佳哲 王茜 耿广龙 《火力与指挥控制》 CSCD 北大核心 2017年第7期129-132,138,共5页
航空炮弹在勤务保障过程中,容易受到环境和外力的破坏而造成表面的损伤,影响正常的飞行训练甚至危及载机安全。采用虚拟仪器平台提供的LabVIEW Vision视觉开发工具包,结合灰度直方图筛选、Saturation分量图像提取、灰度形态学Erode和Dil... 航空炮弹在勤务保障过程中,容易受到环境和外力的破坏而造成表面的损伤,影响正常的飞行训练甚至危及载机安全。采用虚拟仪器平台提供的LabVIEW Vision视觉开发工具包,结合灰度直方图筛选、Saturation分量图像提取、灰度形态学Erode和Dilate变换以及最大熵阈值分割的图像处理等技术手段,对待测航空炮弹图像进行分析处理,精确判断炮弹锈蚀和划痕缺陷问题。试验结果表明,系统具有较高的可行性和可靠性,可以实现炮弹缺陷的快速鲁棒检测,提高了炮弹检测的效率和精度,对于提升航空弹药保障信息化、智能化水平具有重要意义。 展开更多
关键词 LABVIEW vision 虚拟仪器技术 航空炮弹 缺陷检测
在线阅读 下载PDF
Training and Testing Object Detectors With Virtual Images 被引量:10
7
作者 Yonglin Tian Xuan Li +1 位作者 Kunfeng Wang Fei-Yue Wang 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2018年第2期539-546,共8页
In the area of computer vision, deep learning has produced a variety of state-of-the-art models that rely on massive labeled data. However, collecting and annotating images from the real world is too demanding in term... In the area of computer vision, deep learning has produced a variety of state-of-the-art models that rely on massive labeled data. However, collecting and annotating images from the real world is too demanding in terms of labor and money investments, and is usually inflexible to build datasets with specific characteristics, such as small area of objects and high occlusion level. Under the framework of Parallel Vision, this paper presents a purposeful way to design artificial scenes and automatically generate virtual images with precise annotations.A virtual dataset named Parallel Eye is built, which can be used for several computer vision tasks. Then, by training the DPM(Deformable parts model) and Faster R-CNN detectors, we prove that the performance of models can be significantly improved by combining Parallel Eye with publicly available real-world datasets during the training phase. In addition, we investigate the potential of testing the trained models from a specific aspect using intentionally designed virtual datasets, in order to discover the flaws of trained models. From the experimental results, we conclude that our virtual dataset is viable to train and test the object detectors. 展开更多
关键词 Index Terms--Deep learning object detection parallel vision virtual dataset
在线阅读 下载PDF
Three-Dimensional Kinematics Simulation of Robot Fighting Platform in Virtual Environment 被引量:1
8
作者 王建中 朱礼尧 《Journal of Beijing Institute of Technology》 EI CAS 2010年第2期165-169,共5页
A method of 3 D kinematics simulation of robot fighting platform (RFP) in virtual environment is proposed with the aim of enhancing vision telepresence. Based on the theory of space coordinate transformation, kinema... A method of 3 D kinematics simulation of robot fighting platform (RFP) in virtual environment is proposed with the aim of enhancing vision telepresence. Based on the theory of space coordinate transformation, kinematics equat!ons of RFP are formulated; followed by applying a method of modeling using 3DMAX software to build an RFP's 3D geometric model before a 3D kinematics simulation system of RFP is completed based on virtual reality technology and Open Inventor VC + +. Test results have indicated that this system can perform RFP's kinematics simulation in virtual environment. It can also imitate RFP's motion states and environmental features well. Moreover, not only can better real-time performances and interactions be achieved but also operator's vision telepresence be enhanced, therefore this approach may help lay the foundation for the realization of RFP's teleoperation with vision telepresence. 展开更多
关键词 robot fight platform (RFP) kinematic model virtual reality vision telepresence
在线阅读 下载PDF
Apple Vision Pro在元宇宙医学中的应用 被引量:1
9
作者 王源 杨达伟 《元宇宙医学》 2024年第2期27-32,共6页
Apple Vision Pro利用虚拟现实和增强现实技术,能够为医学教育、临床诊断与治疗以及医疗管理等领域带来革命性的变革和贡献,推动元宇宙医学的发展和应用。然而,实际应用Apple Vision Pro的过程中也需要解决技术和伦理挑战,包括数据隐私... Apple Vision Pro利用虚拟现实和增强现实技术,能够为医学教育、临床诊断与治疗以及医疗管理等领域带来革命性的变革和贡献,推动元宇宙医学的发展和应用。然而,实际应用Apple Vision Pro的过程中也需要解决技术和伦理挑战,包括数据隐私、安全性问题、医疗责任和法律法规考虑等。本文旨在探索Apple Vision Pro在元宇宙医学场景中的应用,以期推广Apple Vision Pro在医学领域的应用,促进医学教育、临床实践和医疗管理的全面进步。 展开更多
关键词 Apple vision Pro 虚拟现实 增强现实 医疗
暂未订购
MODELING OF MICROMANIPULATION ROBOT IN VIRTUAL ENVIRONMENT
10
作者 F.S.Tan L.N.Sun +1 位作者 W.B.Rong J.Zhu Robotic Research Institute,Harbin Institute of Technology,Harbin 150001,China 《Acta Metallurgica Sinica(English Letters)》 SCIE EI CAS CSCD 2004年第2期194-198,共5页
Micromanipulation has been recognized to be very difficult due to the inefficiency oftraditional micromanipulation methods. The paper present a general framework formicromanipulation robot based on virtual reality tec... Micromanipulation has been recognized to be very difficult due to the inefficiency oftraditional micromanipulation methods. The paper present a general framework formicromanipulation robot based on virtual reality technology. The significance of in-troducing virtual reality into micromanipulation is analyzed, and the current researchin this field is reviewed. Based on this, we propose a micromanipulation system thatintegrates virtual environment with vision feedback and force feedback. The systemrealizes vision close-loop control and force close-loop control to enhance the perfor-mance of micromanipulation device. A graphics modelling method is proposed for amicroassembly task. Hardware and software implementation is described and discus-sion about the research is presented. 展开更多
关键词 micromaniqulation virtual reality vision feedback force feedback MICROASSEMBLY
在线阅读 下载PDF
Experiment Research on Binocular Perceptual Characteristics around Peripheral Vision for Development of Head Mounted Display with Wide View
11
作者 Li Xiao-guang Wu Jing-long Kawamura Sadao 《Journal of Bionic Engineering》 SCIE EI CSCD 2005年第1期47-56,共10页
The head mounted display (HMD) is widely used in virtual reality technology. In common HMD, however, the binocular disparity is set to an equal fixed value in the entire range of view. Such HMD systems have several ... The head mounted display (HMD) is widely used in virtual reality technology. In common HMD, however, the binocular disparity is set to an equal fixed value in the entire range of view. Such HMD systems have several shortcomings when used for wide views. In this study, in order to realize a natural stereo sensation of HMD with wide view, we measure the characteristics of binocular stereo perception and binocular light perception. Results show that both the stereoacuity and light sensitivity decrease as the retina's eccentricity increases from fovea to periphery. However, the decrease of the stereoacuity is more rapid than that of the light sensitivity. These results suggest that the binocular disparity at the peripheral field should be small, otherwise double images would be observed instead of a stereo view. Based on the results we develop a relative binocular stereoacuity model which can be applied for the design of HMD systems with wide view. 展开更多
关键词 peripheral vision binocular perception virtual reality head mounted display with wide view
在线阅读 下载PDF
Virtual reality training improves balance function 被引量:25
12
作者 Yurong Mao Peiming Chen +1 位作者 Le Li Dongfeng Huang 《Neural Regeneration Research》 SCIE CAS CSCD 2014年第17期1628-1634,共7页
Virtual reality is a new technology that simulates a three-dimensional virtual world on a com- puter and enables the generation of visual, audio, and haptic feedback for the full immersion of users. Users can interact... Virtual reality is a new technology that simulates a three-dimensional virtual world on a com- puter and enables the generation of visual, audio, and haptic feedback for the full immersion of users. Users can interact with and observe objects in three-dimensional visual space without limitation. At present, virtual reality training has been widely used in rehabilitation therapy for balance dysfunction. This paper summarizes related articles and other articles suggesting that virtual reality training can improve balance dysfunction in patients after neurological diseases. When patients perform virtual reality training, the prefrontal, parietal cortical areas and other motor cortical networks are activated. These activations may be involved in the reconstruction of neurons in the cerebral cortex. Growing evidence from clinical studies reveals that virtual reality training improves the neurological function of patients with spinal cord injury, cerebral palsy and other neurological impairments. These findings suggest that virtual reality training can acti- vate the cerebral cortex and improve the spatial orientation capacity of patients, thus facilitating the cortex to control balance and increase motion function. 展开更多
关键词 nerve regeneration brain injury spinal cord injury stroke virtual reality balance dysfunction mechanism sensorimotor function neural plasticity vision VESTIBULE PROPRIOCEPTION SOMATOSENSORY BALANCE reviews rehabilitation NSFC grant neural regeneration
暂未订购
融合视觉特征增设虚拟残点的InSAR相位解缠方法
13
作者 李鹏飞 李志伟 +6 位作者 蒋弥 朱焱 李杰 张燕娜 许耀宗 李培桢 李淑瑾 《地球物理学报》 北大核心 2025年第12期4589-4604,共16页
相位解缠作为InSAR技术中至关重要的一环,直接决定着InSAR地表形变监测与地形高程测量的准确性.受复杂噪声的影响,低相干性区域的相位解缠面临严峻挑战,时常会形成解缠误差并传播到周边区域,造成区域解缠失败.针对这一问题,本文提出了... 相位解缠作为InSAR技术中至关重要的一环,直接决定着InSAR地表形变监测与地形高程测量的准确性.受复杂噪声的影响,低相干性区域的相位解缠面临严峻挑战,时常会形成解缠误差并传播到周边区域,造成区域解缠失败.针对这一问题,本文提出了一种通过视觉特征增设虚拟残点的相位解缠方法.首先,该方法将计算机视觉领域中的轮廓特征引入到InSAR相位解缠过程中,自适应地确定虚拟残点的增设位置;其次,增设虚拟残点,平衡低相干性区域中的孤立残点,从而抑制低相干性区域中解缠误差的形成与传播,提高整体区域的相位解缠准确性.本文采用模拟数据与真实数据验证了该方法的有效性,并开展了相关分析讨论.研究结果表明,本文方法相较于经典最小费用流方法,相位标准偏差(PSD)降低了33.00%,实现了更高精度的相位保真,提高了后续地形测量与形变监测的准确性与可信度. 展开更多
关键词 相位解缠 低相干性区域 虚拟残点 计算机视觉 轮廓特征
在线阅读 下载PDF
基于图像的虚拟试衣综述——从深度学习到扩散模型 被引量:1
14
作者 杨浩哲 郭楠 《计算机工程与应用》 北大核心 2025年第10期19-35,共17页
基于图像的虚拟试衣作为虚拟试衣领域经济便利的一种技术形式,旨在通过模特图像与服装图像来合成逼真的试穿效果,其在网购、服装设计、动画等领域受到重点关注。近年来,以扩散模型为代表的生成式大模型凭借相比传统深度学习方法更强大... 基于图像的虚拟试衣作为虚拟试衣领域经济便利的一种技术形式,旨在通过模特图像与服装图像来合成逼真的试穿效果,其在网购、服装设计、动画等领域受到重点关注。近年来,以扩散模型为代表的生成式大模型凭借相比传统深度学习方法更强大的生成能力,推动了该领域的突破与变革。然而领域内缺乏对大模型时代下基于图像的虚拟试衣研究的进一步分析与全面概述。对基于图像的虚拟试衣进行汇总,按照数据预处理、翘曲生成和试穿结果生成这三步基线技术流程,对主流技术方法进行了划分和解析,对该领域代表性文献所用的实现方案进行了详细分析,并对主要流程方法进行了总结与对比。介绍了基于图像的虚拟试衣的常用数据集、评价指标与损失函数。最后结合所引的领域代表性文献,对大模型时代下基于图像的虚拟试衣存在的困难与不足进行了详细分析与分类,并据此对相关技术的未来发展与改进方向进行了概括与展望。 展开更多
关键词 计算机视觉 虚拟试衣 翘曲处理 图像合成 扩散模型
在线阅读 下载PDF
基于迭代计算的透明液体剖面线重建算法优化
15
作者 王明远 冯诗愚 +2 位作者 付子祺 王晨臣 范菊莉 《航空动力学报》 北大核心 2025年第8期493-500,共8页
对单视角下透明液体剖面线的重建算法进行了研究,通过在迭代计算误差产生的计算步骤引入修正因子来对重建过程进行修正。对修正因子的影响因素进行探究,给出了修正因子确定方法。对算法有效性进行了验证,并应用优化后的算法对多个的液... 对单视角下透明液体剖面线的重建算法进行了研究,通过在迭代计算误差产生的计算步骤引入修正因子来对重建过程进行修正。对修正因子的影响因素进行探究,给出了修正因子确定方法。对算法有效性进行了验证,并应用优化后的算法对多个的液面剖面线及三维液面进行重建分析。结果表明:修正因子的添加应根据曲线的曲率及重建过程底部特征点布置步长来分段确定,分段修正后整体精度提升30.88%,最大误差降低45.72%。优化后的算法提高了同步长特征点下的重建精度,对于所重建的标准液面剖面线和标准三维液面,在达到同样精度的前提下将特征点布置分别减少38.46%和20%;在累积误差控制方面具有良好的效果,且具有普遍适用性。 展开更多
关键词 液面重建 修正因子 计算机视觉 折射定律 虚拟实验
原文传递
基于RobotStudio的相机仿真研究 被引量:1
16
作者 凌旭 邹冲 +1 位作者 戴俊良 彭木荣 《机械工程与自动化》 2025年第3期9-11,17,共4页
工件的无序摆放导致工业机器人无法正确抓取,通过工业相机的使用,将工件的位置信息获得并发送到工业机器人中,从而进行精确抓取。基于RobotStudio软件进行工业机器人虚拟仿真,完成工业机器人的抓取、放置动作的运动规划。利用C#语言编... 工件的无序摆放导致工业机器人无法正确抓取,通过工业相机的使用,将工件的位置信息获得并发送到工业机器人中,从而进行精确抓取。基于RobotStudio软件进行工业机器人虚拟仿真,完成工业机器人的抓取、放置动作的运动规划。利用C#语言编程获取虚拟相机图像,再利用VisionPro软件对图像进行数据处理,计算出工件偏移位置、角度等数据。将获得的图像特征数据发送至工业机器人,机器人根据偏移信息引导抓取,最终在RobotStudio的虚拟环境下实现无序摆放工件的精确抓取。通过虚拟相机仿真技术的应用,可有效地节约机器视觉技术的开发时间,降低研发成本。 展开更多
关键词 工业机器人 虚拟相机 机器视觉 精确抓取
在线阅读 下载PDF
建筑地震响应的视觉监测与虚拟现实验证
17
作者 李金珂 李慷 +1 位作者 李胜利 赵雪峰 《防灾减灾工程学报》 北大核心 2025年第6期1383-1396,共14页
为解决地震期间缺乏建筑结构振动实测数据的问题,本文提出一种基于虚拟现实与计算机视觉的建筑地震响应可视化监测与验证方法。首先,利用虚幻引擎构建室内建筑模型,并通过蓝图系统导入OpenSees计算的地震响应时程,实现结构构件的非线性... 为解决地震期间缺乏建筑结构振动实测数据的问题,本文提出一种基于虚拟现实与计算机视觉的建筑地震响应可视化监测与验证方法。首先,利用虚幻引擎构建室内建筑模型,并通过蓝图系统导入OpenSees计算的地震响应时程,实现结构构件的非线性协调变形,从而获得逼真的地震作用场景。其次,采用深度学习模型实现对墙、梁、楼板等构件的实例分割,并提取边缘线段特征。再基于摄影测量原理建立图像边缘点的空间几何关系,计算构件的三维位移与层间位移角时程。考虑实际监控摄像头的微小振动,进一步分析了平动、光轴位移与转角扰动对层间位移角识别结果的影响规律。结果表明,本文方法识别的层间位移角与虚幻引擎的输入高度一致,最大百分误差仅为0.28%;摄像头平移抖动在层间差分中可完全抵消,光轴微动和转角扰动引起的误差影响较小。研究表明,本文方法能够在虚拟环境中以低成本实现视觉监测算法的验证,并为实际建筑地震响应的视觉识别提供可行技术路径。 展开更多
关键词 虚拟现实 图像实例分割 深度学习 地震响应 计算机视觉
原文传递
夜视模拟训练系统的设计与实现
18
作者 赵超 赵良玉 +3 位作者 王加丽 王燕 杨洪岳 崔建飞 《医疗卫生装备》 2025年第3期21-26,共6页
目的:设计一种夜视模拟训练系统,以为飞行员提供夜视镜使用的实践性训练。方法:该系统硬件主要由驾驶杆、油门杆、方向舵踏板、平视显示器、控制盒、计算机、投影机和屏幕组成,其中平视显示器、控制盒采用夜视兼容照明技术设计,用于模... 目的:设计一种夜视模拟训练系统,以为飞行员提供夜视镜使用的实践性训练。方法:该系统硬件主要由驾驶杆、油门杆、方向舵踏板、平视显示器、控制盒、计算机、投影机和屏幕组成,其中平视显示器、控制盒采用夜视兼容照明技术设计,用于模拟飞行员使用夜视镜飞行时的环境光。软件主要由视景仿真软件、仪表仿真软件、飞行性能仿真软件、综合管理控制软件和座舱管理软件组成,采用C++编程语言开发。采集不同亮度典型场景的夜视图像及计算机渲染图像,将对比度、亮度等客观图像评价指标作为输入,将主观评价数据作为输出,构建支持向量机模型并进行训练。在模型验证和优化的基础上,选取30个夜视训练的典型场景对该系统进行光学逼真度评价。结果:30个夜视训练典型场景的逼真度评价平均得分为8.05分,表明该系统能够较为逼真地模拟不同光照环境、不同气象条件下夜间飞行时的地形、地貌,以及空中、地面、海面的静态和动态目标。结论:该系统达到了预期使用要求,可为飞行员提供夜视训练。 展开更多
关键词 飞行员 夜视镜 夜视训练 视景图像仿真 飞行模拟器
暂未订购
基于虚拟视点的大规模室内视觉重定位
19
作者 张家辉 师晨光 +1 位作者 方川 石珉 《计算机系统应用》 2025年第8期25-32,共8页
视觉重定位一直是三维视觉领域广泛讨论的问题,该问题解决在给定先验地图的情况下,估计出查询图像的6DOF相机位姿.在大规模室内环境中进行重定位是增强现实和机器人导航等应用的关键,然而当相机移动时,场景外观会快速变化,这对重定位系... 视觉重定位一直是三维视觉领域广泛讨论的问题,该问题解决在给定先验地图的情况下,估计出查询图像的6DOF相机位姿.在大规模室内环境中进行重定位是增强现实和机器人导航等应用的关键,然而当相机移动时,场景外观会快速变化,这对重定位系统来说非常具有挑战性.为了解决这个问题,本文提出了一种基于虚拟视图合成的方法,旨在特定场景下,丰富查询数据库并优化位姿估计.与基于渲染真实图像的虚拟视图合成方法不同,其无需高质量的三维模型.本文方法选择直接渲染虚拟视点下的全局和局部特征,并将它们分别应用于后续的图像检索和特征匹配操作.所提方法可以在大规模室内环境中大幅提高重定位性能,例如在InLoc数据集上取得了7.1%和12.2%的提升. 展开更多
关键词 三维视觉 视觉重定位 虚拟视点 视图合成 位姿优化
在线阅读 下载PDF
平行智能范式视角下的视觉-语言-动作模型发展现状与展望 被引量:3
20
作者 李柏 郝金第 +4 位作者 孙跃硕 孟雨晴 黄峻 田永林 贺正冰 《智能科学与技术学报》 2025年第3期290-303,共14页
视觉-语言-动作模型是一类面向具身智能的综合性建模方法,它将视觉感知、自然语言理解和动作执行在统一框架下进行表征与学习,旨在实现从环境感知到任务规划再到动作控制的连续闭环。视觉-语言-动作模型的运行逻辑与21世纪初提出的平行... 视觉-语言-动作模型是一类面向具身智能的综合性建模方法,它将视觉感知、自然语言理解和动作执行在统一框架下进行表征与学习,旨在实现从环境感知到任务规划再到动作控制的连续闭环。视觉-语言-动作模型的运行逻辑与21世纪初提出的平行智能范式存在呼应。平行智能通过“人工系统、计算实验和平行执行”的三元架构,强调虚拟建模、可复现推演以及虚实交互的闭环机制,这些理念与视觉-语言-动作模型的发展路径在不同阶段形成了对应关系:早期的多模态探索可视为人工系统中的原型实践,随后的大规模模型与跨域训练扩展了计算实验的能力,近年来的分层控制和虚实闭环则体现了平行执行强调的反馈修正与规范指导。在这一框架下,视觉-语言-动作模型呈现出语义与动作深度耦合、虚拟与现实双向循环和可验证性增强等特征,但也存在泛化不足、语义对齐不稳、安全与解释机制薄弱以及部署效率受限等问题。未来研究可聚焦任务语义的契约化表达、长时序规划的可修复性、世界模型的工程化使用、多层次反馈与安全治理,以及跨平台迁移和人机协作等方向。以平行智能为参照重新审视视觉-语言-动作模型,不仅有助于厘清发展脉络,也为其在真实场景中的可信应用提供了方法论支持。 展开更多
关键词 平行智能 视觉-语言-动作模型 具身智能 多模态融合 虚实交互
原文传递
上一页 1 2 18 下一页 到第
使用帮助 返回顶部