摘要
在当今数字化与智能化快速发展的时代,计算机视觉技术已成为众多领域的关键支撑,如自动驾驶、智能安防等。然而,单一模态的数据处理在面对复杂场景时往往存在局限性,多模态融合识别技术应运而生,其通过整合不同模态的信息,显著提升了计算机视觉任务在目标识别、图像理解等方面的性能。该技术的核心方法涵盖基于特征层和决策层的融合,其中特征层融合关注不同模态特征提取及融合策略,决策层融合则聚焦于各模态决策结果获取与融合方法。尽管该技术在多个领域展现出巨大潜力,但仍面临数据获取与标注困难、模态间差异大导致融合困难以及计算资源需求高等挑战。未来,与新兴技术结合及在新兴领域的应用拓展将成为其重要发展趋势,有望进一步推动计算机视觉领域的发展。[1][5]
出处
《中国建筑》
2025年第22期51-54,共4页
Chinese Architecture