期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
基于自监督学习的智能体自我学习能力
在线阅读
下载PDF
职称材料
导出
摘要
自监督学习作为近年来兴起的一种有效的学习范式,能够通过构建伪标签引导模型从海量无标注数据中提取有用表示,为智能体的自我学习提供了新思路。本文从自监督学习原理出发,系统研究了其在智能体自我学习中的应用机制,提出了一种融合对比学习和预测性编码的智能体自我学习框架,并通过在多个标准环境上的实验验证了其在迁移学习、探索能力和样本效率等方面的优势。
作者
田黎
机构地区
广东机电职业技术学院
出处
《数字技术与应用》
2025年第7期195-197,共3页
Digital Technology & Application
关键词
自监督学习
智能体
自我学习
对比学习
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
引文网络
相关文献
节点文献
二级参考文献
20
参考文献
3
共引文献
105
同被引文献
0
引证文献
0
二级引证文献
0
参考文献
3
1
张睿,杨义鑫,李阳,王家宝,苗壮,李航,王梓祺.
自监督学习下小样本遥感图像场景分类[J]
.中国图象图形学报,2022,27(11):3371-3381.
被引量:12
2
杜威,丁世飞.
多智能体强化学习综述[J]
.计算机科学,2019,46(8):1-8.
被引量:55
3
陶超,阴紫薇,朱庆,李海峰.
遥感影像智能解译:从监督学习到自监督学习[J]
.测绘学报,2021,50(8):1122-1134.
被引量:42
二级参考文献
20
1
张兵.
遥感大数据时代与智能信息提取[J]
.武汉大学学报(信息科学版),2018,43(12):1861-1871.
被引量:113
2
何国金,王力哲,马艳,张兆明,王桂周,彭燕,龙腾飞,张晓美.
对地观测大数据处理:挑战与思考[J]
.科学通报,2015,60(5):470-478.
被引量:55
3
杜培军,夏俊士,薛朝辉,谭琨,苏红军,鲍蕊.
高光谱遥感影像分类研究进展[J]
.遥感学报,2016,20(2):236-256.
被引量:276
4
李德仁,王密,沈欣,董志鹏.
从对地观测卫星到对地观测脑[J]
.武汉大学学报(信息科学版),2017,42(2):143-149.
被引量:116
5
张文旭,马磊,王晓东.
基于事件驱动的多智能体强化学习研究[J]
.智能系统学报,2017,12(1):82-87.
被引量:10
6
刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.
深度强化学习综述[J]
.计算机学报,2018,41(1):1-27.
被引量:547
7
席磊,陈建峰,黄悦华,徐艳春,张赟宁.
基于具有时间隧道思想的多智能体强化学习的智能发电控制方法[J]
.中国科学:技术科学,2018,48(4):441-456.
被引量:22
8
杨文臣,张轮,Zhu Feng.
多智能体强化学习在城市交通网络信号控制方法中的应用综述[J]
.计算机应用研究,2018,35(6):1613-1618.
被引量:32
9
赵星宇,丁世飞.
深度强化学习研究综述[J]
.计算机科学,2018,45(7):1-6.
被引量:66
10
陈军,陈晋.
GlobeLand30遥感制图创新与大数据分析[J]
.中国科学:地球科学,2018,48(10):1391-1392.
被引量:18
共引文献
105
1
李茹杨,彭慧民,李仁刚,赵坤.
强化学习算法与应用综述[J]
.计算机系统应用,2020,29(12):13-25.
被引量:61
2
谢育星,陆屹,管聪,纪德东.
协同空战与多智能体强化学习下的关键问题[J]
.飞机设计,2023,43(1):6-10.
被引量:2
3
马红,刘超祥,王大涛.
基于像控网的实景三维快速更新方法研究与应用[J]
.测绘通报,2024(S02):151-155.
被引量:2
4
王万富,王琢,刘佳鑫,韩亚辉,李春波.
基于Qt/Embedded的农林智能装备导航定位算法研究及软件设计[J]
.国外电子测量技术,2022,41(3):63-68.
被引量:6
5
刘专,肖海,彭能舜,胡赛花,潘栋.
湖南省"1+N"卫星监测体系构建[J]
.国土资源导刊,2022,19(3):61-65.
被引量:5
6
王毅然,经小川,贾福凯,孙宇健,佟轶.
基于多智能体协同强化学习的多目标追踪方法[J]
.计算机工程,2020,46(11):90-96.
被引量:10
7
李斌,刘全.
基于最小二乘的双权重学习法[J]
.计算机科学,2020,47(12):210-217.
被引量:1
8
李军予,闫国瑞,李志刚,白照广.
智能遥感星群技术发展研究[J]
.航天返回与遥感,2020,41(6):34-44.
被引量:17
9
高昂,董志明,李亮,宋敬华,段莉.
MADDPG算法并行优先经验回放机制[J]
.系统工程与电子技术,2021,43(2):420-433.
被引量:9
10
李文韬,谢小红,孙晓燕.
基于深度强化学习的无人驾驶优化评价方法[J]
.现代计算机,2021,27(11):4-10.
被引量:1
1
陈衍,丁松令,臧震宇,董群力,张恒.
基于深度学习的无人机安防系统应用[J]
.电子技术(上海),2025,54(3):196-197.
2
黄鸣.
老板的六项修炼[J]
.光彩,2025(7):8-8.
3
向巴仁青.
新课标和核心素养背景下初中数学教学探究[J]
.山海经(中旬),2024(20):0124-0126.
4
甘露,蔡真妮,陈传飞.
聚焦学习:名师工作室教师专业学习自组织的形成与发展机制[J]
.课程教学研究,2025(6):92-105.
数字技术与应用
2025年 第7期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部