基于对比迁移模型的栅格化建筑物形状识别方法

Shape Recognition Method for Rasterized Buildings Based on a Contrastive Transfer Model

导出

摘要【目的】建筑物是地图上的重要组成要素,其形状识别既是空间认知和相似关系领域的研究热点和难点,也可以为地图制图综合的自动化实现提供技术支持。针对目前基于监督学习的栅格化建筑物形状识别方法需要大量标注样本的缺陷,本文融合了对比学习的自监督特征提取策略和迁移学习的监督分类技术,提出了一种基于对比迁移模型(Contrastive Learning Transfer Model,CLTM)的栅格化建筑物形状识别方法。【方法】首先,提取建筑物的形状并对其进行二值化和尺寸标准化处理,消除尺度与像素等因素的干扰;然后,构建对比学习模型对建筑物形状进行编码,获得高维特征向量,利用设计的对比损失函数优化模型;最后,以对比损失进行梯度更新,使用迁移参数预测建筑物形状以验证模型性能。【结果】实验结果表明,该方法的建筑物形状分类准确率达到93.79%,高于AlexNet方法的93.11%,但低于ResNet50方法的96.10%。在形状识别应用中运用t-SNE可视化技术,清晰展示了不同形状类别在特征空间中的聚类趋势,直观显示了形状识别效果,进一步验证了模型的有效性。【结论】尽管该方法的分类准确率低于监督的ResNet50方法,但该模型显著减少了分类准确率对大量标注数据的依赖,同时降低了人工视觉偏差的影响,是一种有效可靠的建筑物识别方法。 [Objectives]Buildings are fundamental elements on maps.In the fields of similarity relations and geospatial cognition,detecting building shapes presents both a significant challenge and a key research focus.Moreover,it has the potential to support cartographic generalization technologically.However,existing supervised learning methods for grid-based building shape recognition require a large number of labeled samples.To address this limitation,this paper proposes a Shape Recognition Method for Rasterized Buildings Based on a Contrastive Transfer Model.This approach combines transfer learning techniques with self-supervised feature extraction strategies.The goal is to extract shape features during a self-supervised learning phase,followed by supervised learning for shape classification,thereby minimizing labeling effort and reducing training costs.[Methods]In this study,the Contrastive Learning-based Transfer Model(CLTM)is applied for shape recognition focused on raster data.The process is as follows:First,the shapes of rasterized buildings are extracted through pre-processing.These shapes are binarized and standardized in size to eliminate the effects of pixel noise and size differences.Second,a high-dimensional feature vector is generated by encoding the building shapes using a contrastive learning model.This step extracts the unique characteristics of each shape and optimizes the model via a contrastive loss function.Finally,the model parameters are updated,and transfer learning is used to evaluate model performance through a downstream shape prediction task.[Results]Experimental results indicate that the classification accuracy of the proposed method reaches 93.79%,which is slightly higher than the AlexNet method but lower than ResNet50.In the shape recognition application,t-SNE visualization is used to clearly display the clustering trends of different shape categories in two-dimensional space.The clustering results indicate that shapes of the same category are closely grouped,while dissimilar shapes are well separated.This confirms the model's effectiveness,as it can accurately distinguish between similar and dissimilar shapes.[Conclusions]The proposed method performs well in building shape classification by leveraging data augmentation and a contrastive loss function to train the model and extract useful features from unlabeled data.This significantly reduces the need for manual data annotation and mitigates the influence of human visual bias.Compared to fully supervised methods,it offers distinct advantages,exhibiting strong shape recognition capabilities and providing an efficient and reliable approach for analyzing geospatial elements.

作者李文德师尚杰闫浩文 LI Wende;SHI Shangjie;YAN Haowen(Faculty of Geomatics,Lanzhou Jiaotong University,Lanzhou 730070,China;National-Local Joint Engineering Research Center of Technologies and Applications for National Geographic State Monitoring,Lanzhou 730070,China;Key Laboratory of Science and Technology in Surveying&Mapping Gansu Province,Lanzhou 730070,China)

机构地区兰州交通大学测绘与地理信息学院地理国情监测技术应用国家地方联合工程研究中心甘肃省测绘科学与技术重点实验室

出处《地球信息科学学报》北大核心 2025年第7期1582-1595,共14页 Journal of Geo-information Science

基金国家自然科学基金项目(42301513) 甘肃省高等学校青年博士支持项目(2023QB-043) 地理信息工程国家重点实验室、测绘科学与地球空间信息技术自然资源部重点实验室联合资助基金项目(2023-02-08)。

关键词地图制图综合栅格数据建筑物形状识别对比学习迁移学习自监督学习 cartographic generalization raster data building shape recognition contrastive learning transfer learning self-supervised learning

分类号 P283 [天文地球—地图制图学与地理信息工程]

引文网络
相关文献

参考文献10

1武芳,巩现勇,杜佳威.地图制图综合回顾与前望[J].测绘学报,2017,46(10):1645-1664. 被引量：102
2闫浩文.空间相似关系的理论体系与潜在研究方向[J].测绘学报,2023,52(11):1962-1973. 被引量：9
3王树根.基于认知心理学的模式识别模型框架[J].武汉大学学报（信息科学版）,2002,27(5):543-547. 被引量：20
4刘鹏程,艾廷华,胡晋山,成晓强.基于原型模板形状匹配的建筑多边形化简[J].武汉大学学报（信息科学版）,2010,35(11):1369-1372. 被引量：20
5晏雄锋,艾廷华,杨敏.居民地要素化简的形状识别与模板匹配方法[J].测绘学报,2016,45(7):874-882. 被引量：28
6于洋洋,贺康杰,武芳,许俊奎.面状居民地形状分类的图卷积神经网络方法[J].测绘学报,2022,51(11):2390-2402. 被引量：16
7师尚杰,李文德,闫浩文,马鸿.图对比学习支撑下的矢量建筑物形状相似性度量[J].地球信息科学学报,2024,26(12):2659-2672. 被引量：1
8张付兵,孙群,马京振,孙士杰,温伯威.融合全局和局部特征的建筑物形状智能分类方法[J].测绘学报,2024,53(9):1842-1852. 被引量：4
9焦洋洋,刘平芝,刘爱龙,刘松林.AlexNet支持下的地图建筑物形状分类方法[J].地球信息科学学报,2022,24(12):2333-2341. 被引量：7
10鲍宗泛,李红华.关于图像边缘检测的 Laplace算子的改进[J].中国计量学院学报,2000,11(2):169-172. 被引量：28

二级参考文献174

1齐清文,姜莉莉.面向地理特征的制图综合指标体系和知识法则的建立与应用研究[J].地理科学进展,2001,20(S1):1-13. 被引量：16
2艾廷华,帅赟,李精忠.基于形状相似性识别的空间查询[J].测绘学报,2009,38(4):356-362. 被引量：49
3钱海忠,武芳.地图自动综合中的监控Agent模型构造[J].测绘学院学报,2004,21(3):211-214. 被引量：4
4侯璇,武芳,刘芳,邓红艳.基于弹性力学思想的居民地点群目标位移模型[J].测绘科学,2005,30(2):44-47. 被引量：10
5宋鹰,何宗宜,粟卫民.基于Rough集的居民地属性知识约简与结构化选取[J].武汉大学学报（信息科学版）,2005,30(4):329-332. 被引量：6
6钱海忠,武芳,邓红艳.基于CIRCLE特征变换的点群选取算法[J].测绘科学,2005,30(3):83-85. 被引量：16
7谭笑,武芳,黄琦,邓红艳.主流识别的多准则决策模型及其在河系结构化中的应用[J].测绘学报,2005,34(2):154-160. 被引量：16
8刘颖,翟京生,陆毅,王明涛.数字海图水深注记的自动综合研究[J].测绘学报,2005,34(2):179-184. 被引量：20
9闫浩文,王家耀.基于Voronoi图的点群目标普适综合算法[J].中国图象图形学报（A辑）,2005,10(5):633-636. 被引量：47
10谭国真,高文,张田文.多边形表示的相似度量[J].计算机辅助设计与图形学学报,1995,7(2):96-102. 被引量：8

共引文献198

1魏泓丞,张立华,唐露露,史岩.基于复杂度的等深线综合方法研究[J].中国水运（下半月）,2020,20(12):146-148. 被引量：1
2高晓蓉,闫浩文,禄小敏,王中辉.利用“计算区”进行建筑物短边结构识别和渐进式化简[J].武汉大学学报（信息科学版）,2021,46(11):1782-1790. 被引量：6
3孟妮娜,高晨博,王正阳,李金秋.面向建筑物数据的密度聚类算法研究[J].测绘科学,2022,47(11):204-214. 被引量：6
4陈小方.地图制图与计算机技术应用[J].区域治理,2018,0(21):214-214.
5王琳,毛谦敏,汪祥.字符形态特征的机械仪表判读算法[J].中国计量学院学报,2010,21(4):337-341.
6邢维慧,袁建敏.用户信息服务的认知心理分析[J].情报科学,2004,22(11):1404-1408. 被引量：14
7高阳,张科,李言俊.低信噪比红外图像的快速统计法边缘提取[J].红外与激光工程,2005,34(4):459-463. 被引量：8
8曹锦丹,齐艳丽,刘春艳.网络空间信息表征与用户认知的交互作用机制[J].图书情报工作,2005,49(8):19-22. 被引量：3
9高阳,张科,李言俊.面元法的红外制导图像边缘检测[J].火力与指挥控制,2005,30(8):20-22. 被引量：1
10甘利人,李恒.科技用户信息搜寻过程中的问题解决机制解释[J].情报学报,2006,25(4):441-450. 被引量：17

1云晓洁.基于触觉感知的泥塑手工艺品包装设计研究[J].中国包装,2025,45(6):76-78.
2蔡朝阳,周黎婧.认知心理学视角下学习迁移与能力生成研究[J].教育进展,2025,15(1):1226-1237. 被引量：2
3聂勇军,刘志军,唐振宇.应用ISight的船舶中大型弯管环焊缝焊接协同控制系统[J].舰船科学技术,2021(20):214-216. 被引量：1
4赵乾,李伟程,李瑜,孙佳琦,钟智,张和平.母乳源表皮葡萄球菌比较基因组学[J].微生物学报,2025,65(5):2072-2090.
5刘锐,刘旋,刘丽婷.青藏高原1961~2020年气温和降水变化特征分析[J].地球科学前沿(汉斯),2025,15(7):1025-1042.
6赖诗琪,安敏,安慧,宋孟斐,吴海林.长江经济带地级市农业面源污染来源解析[J].中国农业资源与区划,2025,46(5):63-73.
7张振坤,王翔,吕栢庆,王鹏.“无辜”病名考释[J].中华中医药杂志,2025,40(6):3044-3047.
8焦泽瑞,屈磊,王多全,张仪,吕山.2000—2019年我国白纹伊蚊时空分布及其影响因素评估[J].中国血吸虫病防治杂志(中英文),2025,37(3):268-275. 被引量：2

地球信息科学学报

2025年第7期

浏览历史

内容加载中请稍等...

基于对比迁移模型的栅格化建筑物形状识别方法

参考文献10

二级参考文献174

共引文献198

相关作者

相关机构

相关主题

浏览历史