期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
Imaginary filtered hindsight experience replay for UAV tracking dynamic targets in large-scale unknown environments 被引量:4
1
作者 Zijian HU Xiaoguang GAO +2 位作者 Kaifang WAN Neretin EVGENY Jinliang LI 《Chinese Journal of Aeronautics》 SCIE EI CAS CSCD 2023年第5期377-391,共15页
As an advanced combat weapon,Unmanned Aerial Vehicles(UAVs)have been widely used in military wars.In this paper,we formulated the Autonomous Navigation Control(ANC)problem of UAVs as a Markov Decision Process(MDP)and ... As an advanced combat weapon,Unmanned Aerial Vehicles(UAVs)have been widely used in military wars.In this paper,we formulated the Autonomous Navigation Control(ANC)problem of UAVs as a Markov Decision Process(MDP)and proposed a novel Deep Reinforcement Learning(DRL)method to allow UAVs to perform dynamic target tracking tasks in large-scale unknown environments.To solve the problem of limited training experience,the proposed Imaginary Filtered Hindsight Experience Replay(IFHER)generates successful episodes by reasonably imagining the target trajectory in the failed episode to augment the experiences.The welldesigned goal,episode,and quality filtering strategies ensure that only high-quality augmented experiences can be stored,while the sampling filtering strategy of IFHER ensures that these stored augmented experiences can be fully learned according to their high priorities.By training in a complex environment constructed based on the parameters of a real UAV,the proposed IFHER algorithm improves the convergence speed by 28.99%and the convergence result by 11.57%compared to the state-of-the-art Twin Delayed Deep Deterministic Policy Gradient(TD3)algorithm.The testing experiments carried out in environments with different complexities demonstrate the strong robustness and generalization ability of the IFHER agent.Moreover,the flight trajectory of the IFHER agent shows the superiority of the learned policy and the practical application value of the algorithm. 展开更多
关键词 Artificial intelligence Autonomous navigation control Deep reinforcement learning hindsight experience replay UAV
原文传递
Hindsight Bias in Cause Analysis of Accident
2
作者 Atsuo Murata Yasunari Matsushita 《Psychology Research》 2014年第11期843-851,共9页
It is suggested that hindsight becomes an obstacle to the objective investigation of an accident, and that the proper countermeasures for the prevention of such an accident is impossible if we view the accident with h... It is suggested that hindsight becomes an obstacle to the objective investigation of an accident, and that the proper countermeasures for the prevention of such an accident is impossible if we view the accident with hindsight. Therefore, it is important for organizational managers to prevent hindsight from occurring so that hindsight does not hinder objective and proper measures to be taken and this does not lead to a serious accident. In this study, a basic phenomenon potentially related to accidents, that is, hindsight was taken up, and an attempt was made to explore the phenomenon in order to get basically insights into the prevention of accidents caused by such a cognitive bias. 展开更多
关键词 hindsight COGNITIVE bias OVERESTIMATION of probability crucial ACCIDENT
在线阅读 下载PDF
Prioritization Hindsight Experience Based on Spatial Position Attention for Robots
3
作者 Ye Yuan Yu Sha +3 位作者 Feixiang Sun Haofan Lu Shuiping Gou Jie Luo 《Machine Intelligence Research》 2025年第1期160-175,共16页
Sparse rewards pose significant challenges in deep reinforcement learning as agents struggle to learn from experiences with limited reward signals.Hindsight experience replay(HER)addresses this problem by creating“sm... Sparse rewards pose significant challenges in deep reinforcement learning as agents struggle to learn from experiences with limited reward signals.Hindsight experience replay(HER)addresses this problem by creating“small goals”within a hierarchical decision model.However,HER does not consider the value of different episodes for agent learning.In this paper,we propose SPAHER,a framework for prioritizing hindsight experiences based on spatial position attention.SPAHER allows the agent to prioritize more valuable experiences in a manipulation task.It achieves this by calculating transition and trajectory spatial position functions to determine the value of each episode for experience replays.We evaluate SPAHER on eight robot manipulation tasks in the Fetch and Hand environments provided by OpenAI Gym.Simulation results show that our method improves the final mean success rate by an average of 3.63%compared to HER,especially in challenging Hand environments.Notably,these improvements are achieved without any increase in computation time. 展开更多
关键词 hindsight experience replay spatial position attention sparse reward deep reinforcement learning prioritization hindsight experience
原文传递
美国国防部检验基础科学:争议、影响及现实启示
4
作者 穆蕴秋 江晓原 《自然辩证法通讯》 北大核心 2025年第6期89-96,共8页
论文考察了美国基础科学政策转变过程中一个不同寻常的事件:1965年,美国国防部启动“回顾”项目对基础科学与应用技术的关系展开定量研究,结论与布什报告“科学:无尽的前沿”中有关基础科学的结论完全背道而驰。此项研究随即引发广泛关... 论文考察了美国基础科学政策转变过程中一个不同寻常的事件:1965年,美国国防部启动“回顾”项目对基础科学与应用技术的关系展开定量研究,结论与布什报告“科学:无尽的前沿”中有关基础科学的结论完全背道而驰。此项研究随即引发广泛关注和讨论。论文考察了“回顾”项目引发的争议,以及该项目对国防部基础科学资助政策制定产生的直接影响,并结合当下国内学界对科学与技术关系认识的实际情况,从三方面总结了重要启示。 展开更多
关键词 美国国防部 美国国家科学基金会 “回顾”项目 应用技术 基础科学
原文传递
基于TD3-RRT的特殊环境下USV路径规划算法研究
5
作者 陈际同 周佳加 +1 位作者 吴迪 江海龙 《系统仿真学报》 北大核心 2025年第11期2888-2903,共16页
面对多障碍、大尺寸障碍、狭窄通道等特殊环境下的USV路径规划问题,快速扩展随机树算法(rapidly-exploring random trees,RRT)存在采样基数大、规划成功率低、规划路径曲折等缺点。基于双延迟深度确定性策略梯度(twin delayed deep dete... 面对多障碍、大尺寸障碍、狭窄通道等特殊环境下的USV路径规划问题,快速扩展随机树算法(rapidly-exploring random trees,RRT)存在采样基数大、规划成功率低、规划路径曲折等缺点。基于双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)提出一种全局路径规划算法(TD3-RRT)。结合RRT算法与深度强化学习建立USV路径搜索模型,利用前视探测感知环境以自适应调整扩展步长,通过策略网络输出路径搜索方向,解决RRT算法扩展盲目的问题;改进后见经验回放策略,通过重选虚拟目标、双经验回放池采样等策略以增强复杂环境下路径搜索能力;通过奖励函数提高规划路径质量,加快路径搜索速度。实验结果表明:不同环境下TD3-RRT相比当前主流算法能够有效提高规划成功率,优化转向角度、路径长度和规划时间,证明了改进算法能有效加快路径搜索速度并提高路径质量,且对不同环境具有良好适应性。 展开更多
关键词 双延迟深度确定性策略梯度算法 路径规划 特殊环境 快速扩展随机树算法 USV 后见经验回放
原文传递
基于事后筛选经验回放的机器人深度强化学习跟踪控制
6
作者 易佳豪 王福杰 +2 位作者 胡锦涛 李醒 罗俊轩 《计算机应用研究》 北大核心 2025年第3期834-839,共6页
针对机械臂轨迹跟踪问题,提出了一种结合事后筛选经验回放(selective hindsight experience replay,SHER)的深度强化学习(deep reinforcement learning,DRL)控制方法。此算法将SHER与深度确定性策略(deep deterministic policy gradient... 针对机械臂轨迹跟踪问题,提出了一种结合事后筛选经验回放(selective hindsight experience replay,SHER)的深度强化学习(deep reinforcement learning,DRL)控制方法。此算法将SHER与深度确定性策略(deep deterministic policy gradient,DDPG)结合进行机械臂的轨迹跟踪控制。SHER算法将智能体探索的经验进行随机抽取,然后筛选有用经验修改奖励函数,通过提高对正确动作的奖励评分加强对智能体正确动作的正反馈强度从而提高智能体探索效率。为了验证方法的有效性,通过欧拉-拉格朗日建模二自由度机械臂并在具有干扰的复杂环境下进行仿真实验对比。实验结果表明,所提算法在机械臂轨迹跟踪任务中收敛速度以及收敛稳定性与对比算法相比最优,并且训练出来的模型与对比算法相比在轨迹跟踪任务中表现最好,验证了算法的有效性。 展开更多
关键词 事后筛选经验回放 深度确定性策略 深度强化学习 轨迹跟踪 机械臂 经验池优化
在线阅读 下载PDF
事后聪明式偏差的理论模型及影响因素 被引量:9
7
作者 龚梦园 徐富明 方芳 《心理科学进展》 CSSCI CSCD 北大核心 2009年第2期325-333,共9页
事后聪明式偏差是指人们在得知事件结果后,会因记忆扭曲、对自身预测能力或事件发生必然性的需要的诱发,而表现出过高估计自己在事前预测能力的现象。许多研究表明,该偏差普遍存在于实验和真实情境中,很难通过实施策略而减小。该现象的... 事后聪明式偏差是指人们在得知事件结果后,会因记忆扭曲、对自身预测能力或事件发生必然性的需要的诱发,而表现出过高估计自己在事前预测能力的现象。许多研究表明,该偏差普遍存在于实验和真实情境中,很难通过实施策略而减小。该现象的理论模型主要基于认知过程和社会性动机,影响因素有研究方法、个人特质、能力变量、年龄因素、个人相关度和事件效价,在未来研究中应注重对理论的整合以及校正策略在应用中的探索。 展开更多
关键词 事后聪明式偏差 认知过程 社会性动机 校正策略
在线阅读 下载PDF
司法过程中的经验推定与认知偏差 被引量:20
8
作者 陈林林 何雪锋 《浙江社会科学》 CSSCI 北大核心 2015年第8期26-32,共7页
法官在运用经验法则认定案件事实时,容易出现认知偏差,对彭宇案判决书的分析证明了这一事实。实验研究进一步证明,经验推定作为一种思维活动,受制于法官作为普通人所存在的两种认知偏差:代表性启发式和后见偏见。改善经验推定,需要在司... 法官在运用经验法则认定案件事实时,容易出现认知偏差,对彭宇案判决书的分析证明了这一事实。实验研究进一步证明,经验推定作为一种思维活动,受制于法官作为普通人所存在的两种认知偏差:代表性启发式和后见偏见。改善经验推定,需要在司法制度中引入"普通人"视角,即对法官进行统计学和决策理论训练以抑制代表性启发式的影响,并引进法官之间的个案分工协作制以防范后见偏见。 展开更多
关键词 经验推定 认知偏差 代表性启发式 后见偏见
在线阅读 下载PDF
基于年鉴问题的事后聪明式偏差及其相关因素 被引量:2
9
作者 龚梦园 徐富明 +2 位作者 王伟 李宏瑜 方芳 《中国临床心理学杂志》 CSSCI CSCD 2009年第4期411-413,共3页
目的:考察中国被试的事后聪明式偏差程度及其与惊奇程度和过度自信之间的关系。方法:采用假想设计的范式,选取138人进行年鉴问题的问卷调查,其中92人参与一周后的过度自信的问卷评估,另有74人参与惊奇程度的问卷评估。结果:①中国被试... 目的:考察中国被试的事后聪明式偏差程度及其与惊奇程度和过度自信之间的关系。方法:采用假想设计的范式,选取138人进行年鉴问题的问卷调查,其中92人参与一周后的过度自信的问卷评估,另有74人参与惊奇程度的问卷评估。结果:①中国被试在年鉴问题上普遍存在事后聪明式偏差。②被试对惊奇程度高的年鉴问题的事后聪明式偏差程度要小于对惊奇程度低的年鉴问题的事后聪明式偏差程度,且与前人的研究结果相比,中国被试对问卷中年鉴问题的反馈结果表现出较小的惊奇感。③被试的事后聪明式偏差程度与其过度自信水平存在显著的负相关。结论:被试的事后聪明式偏差程度与其过度自信水平以及对年鉴问题的惊奇程度均存在显著的相关关系。 展开更多
关键词 事后聪明式偏差 惊奇程度 过度自信水平
原文传递
元认知能力对初中生事后偏差的影响 被引量:4
10
作者 陈英和 赵浡含 赖颖慧 《心理科学》 CSSCI CSCD 北大核心 2010年第6期1368-1374,共7页
采用问卷情景导入,通过真实事件材料考察了初中生的元认知能力对其产生事后偏差的影响,及此影响是否仅存于假设型范式中。结果发现:在两种范式下,元认知能力较高的初中生所表现出的事后偏差均显著低于元认知能力较低者。在不同范式下,... 采用问卷情景导入,通过真实事件材料考察了初中生的元认知能力对其产生事后偏差的影响,及此影响是否仅存于假设型范式中。结果发现:在两种范式下,元认知能力较高的初中生所表现出的事后偏差均显著低于元认知能力较低者。在不同范式下,起显著预测作用的元认知能力成分有所不同。在回忆型范式中,初中生的元认知技能和元认知体验能力越强,其事后偏差越小;而在假设型范式中,初中生的元认知知识和元认知技能越强,其事后偏差越小。 展开更多
关键词 元认知能力 事后偏差 回忆型范式 假设型范式 初中生
原文传递
后见偏差两种实验范式的初步探究 被引量:3
11
作者 彭慰慰 肖晶 钟毅平 《中国临床心理学杂志》 CSSCI CSCD 2009年第2期185-187,共3页
目的:探讨两种实验范式中的后见偏差效应。方法:实验一采用单因素两水平被试间实验设计,随机挑选80名高校在校男大学生进行后见偏差的假定型实验。将他们分成先见组和后见组,每组40人。用自制问卷测查不同组别的后见偏差效应。实验二采... 目的:探讨两种实验范式中的后见偏差效应。方法:实验一采用单因素两水平被试间实验设计,随机挑选80名高校在校男大学生进行后见偏差的假定型实验。将他们分成先见组和后见组,每组40人。用自制问卷测查不同组别的后见偏差效应。实验二采用单因素两水平被试内实验设计,随机挑选高校在校男大学生67名进行后见偏差的记忆型实验。用相同自制问卷比较同一被试的初始判断与知道调查结果后的回忆判断。结果:实验一:质量因素在F组与H组中,所占百分比分别为25.38%和52.32%,Z=-4.902,P<0.001,两者有显著统计学意义。实验二:一周前与一周后质量因素的百分比分别为37.73%和51.12%,F=16.393,P<0.001,两者有显著差异。结论:两种试验范式都证明了后见效应现象的存在。 展开更多
关键词 后见偏差 假定型实验 记忆型实验
原文传递
听觉后见之明偏差的实验研究 被引量:5
12
作者 庞爱莲 李晓东 《心理科学》 CSSCI CSCD 北大核心 2010年第1期104-107,共4页
后见之明偏差是一种人类认知自我中心。后见之明偏差的研究具有重大的理论价值和应用价值,尤其是其应用价值更不容低估。研究1采用回忆型和假定型研究范式考察听觉领域是否存在后见之明偏差;研究2采用回忆型研究范式,从需要角度考察奖... 后见之明偏差是一种人类认知自我中心。后见之明偏差的研究具有重大的理论价值和应用价值,尤其是其应用价值更不容低估。研究1采用回忆型和假定型研究范式考察听觉领域是否存在后见之明偏差;研究2采用回忆型研究范式,从需要角度考察奖励性动机对去除听觉后见之明偏差的作用。研究发现:听觉领域存在后见之明偏差;两种研究范式的后见之明偏差不存在差异;奖励性动机并不能消除听觉后见之明偏差。 展开更多
关键词 听觉后见之明偏差 回忆型范式 假定型范式 奖励性动机
原文传递
法律决策中事件结果对后见偏差的影响 被引量:4
13
作者 钟毅平 彭慰慰 《心理科学》 CSSCI CSCD 北大核心 2010年第4期994-996,共3页
初步探讨法律决策中不同事件结果对后见偏差的影响。实验采用单因素三水平(中立结果组、积极结果组、消极结果组)被试间设计。采用自编的两个案例及问卷测查不同事件结果中后见效应的差异。实验结果发现,模拟法官在事件消极结果情境下... 初步探讨法律决策中不同事件结果对后见偏差的影响。实验采用单因素三水平(中立结果组、积极结果组、消极结果组)被试间设计。采用自编的两个案例及问卷测查不同事件结果中后见效应的差异。实验结果发现,模拟法官在事件消极结果情境下对案件做出的决策比中立结果情境下所做的案件决策产生出了更大的后见偏差,而在事件积极结果情境下所做出的决策结果则出现了更少的后见偏差。 展开更多
关键词 后见偏差 法律决策 事件结果 处罚性赔偿金
原文传递
中国证券监管者非理性行为关联性研究 被引量:2
14
作者 郝旭光 于海娇 张士玉 《北京工商大学学报(社会科学版)》 CSSCI 北大核心 2012年第3期80-86,共7页
通过对证券监管部门进行问卷调研,并结合统计学中列联表的Kendall相关分析方法,对监管者自我服务偏见、后视偏见和推卸责任效应进行分析,检验监管者的自我服务偏见和后视偏见之间、后视偏见和推卸责任效应之间以及推卸责任效应和后视偏... 通过对证券监管部门进行问卷调研,并结合统计学中列联表的Kendall相关分析方法,对监管者自我服务偏见、后视偏见和推卸责任效应进行分析,检验监管者的自我服务偏见和后视偏见之间、后视偏见和推卸责任效应之间以及推卸责任效应和后视偏见之间的关联性。研究发现,监管者存在不同程度的自我服务偏见、后视偏见和推卸责任效应,且这三者之间两两存在关联。监管者应认识到自身存在的非理性认知偏差,并且在纠正这些偏差时注意不同偏差之间的关联。 展开更多
关键词 证券监管者 自我服务偏见 后视偏见 推卸责任效应
在线阅读 下载PDF
模拟法官决策中心理控制源对后见偏差的影响 被引量:8
15
作者 彭慰慰 《心理科学》 CSSCI CSCD 北大核心 2012年第2期498-502,共5页
考察模拟法官决策中心理控制源对后见偏差的影响。实验采用2(心理控制源:外控型、内控型)×3(有无策略:后见组、分散注意组、指导组)两因素被试间实验设计。采用自编两个案例及问卷测查模拟法官决策中后见效应的差异。实验结果发现... 考察模拟法官决策中心理控制源对后见偏差的影响。实验采用2(心理控制源:外控型、内控型)×3(有无策略:后见组、分散注意组、指导组)两因素被试间实验设计。采用自编两个案例及问卷测查模拟法官决策中后见效应的差异。实验结果发现,心理控制源是导致模拟法官决策中后见偏差存在差异的影响因素。同时,两种策略能够有效减少模拟法官决策中的后见偏差。 展开更多
关键词 法官决策 后见偏差 心理控制源 消除策略
原文传递
后见之明研究综述 被引量:4
16
作者 杜建政 《心理科学进展》 CSSCI CSCD 北大核心 2002年第4期382-387,共6页
后见之明指后见判断(可得益于事件结果反馈的判断)与先见判断(不知晓事件结果时的判断)的系统差异,其研究范式大体可分为两类,假定型设计和记忆型设计。后见效应的研究,具有重大的理论价值和应用价值。文章对后见效应的研究范式、研究... 后见之明指后见判断(可得益于事件结果反馈的判断)与先见判断(不知晓事件结果时的判断)的系统差异,其研究范式大体可分为两类,假定型设计和记忆型设计。后见效应的研究,具有重大的理论价值和应用价值。文章对后见效应的研究范式、研究结果、及其有关理论进行了简要综述,并对其应用价值加以评述。 展开更多
关键词 后见之明 假定型设计 记忆型设计 早知如此效应
在线阅读 下载PDF
商业判断规则的法经济学分析 被引量:2
17
作者 谢晓如 杨晓密 《特区经济》 北大核心 2008年第11期245-246,共2页
由于董事商业决策的结果具有不确定性,法律机制介入董事商业决策既不准确而且成本高昂。商业判断规则作为董事决策行为的"安全港",在制度设计上应将司法审查限制在决策程序而非内容上,使董事拥有充分的决策自由裁量权,增进整... 由于董事商业决策的结果具有不确定性,法律机制介入董事商业决策既不准确而且成本高昂。商业判断规则作为董事决策行为的"安全港",在制度设计上应将司法审查限制在决策程序而非内容上,使董事拥有充分的决策自由裁量权,增进整个市场的经济效率。 展开更多
关键词 商业判断规则 本人困境 事后偏见 成本 效益
原文传递
员工“后见之明”认知偏差对组织绩效的双重效用机制——一项中国本土化的探索性实证研究 被引量:1
18
作者 何轩 朱丽娜 《华东经济管理》 CSSCI 2014年第11期93-98,共6页
中国管理学者在根据主要源自西方管理的理论进行研究时,经常会遇到一些在西方文化背景下行之有效的管理模式,在中国情景下出现"水土不服"。这是因为不同文化背景下思维模式的差异总是被忽视,但这些差异不论在本土化管理学理... 中国管理学者在根据主要源自西方管理的理论进行研究时,经常会遇到一些在西方文化背景下行之有效的管理模式,在中国情景下出现"水土不服"。这是因为不同文化背景下思维模式的差异总是被忽视,但这些差异不论在本土化管理学理论探索,还是在中国企业管理实践中都是非常重要的元素。中国传统整体性思维所产生的"后见之明"认知偏差,是国际管理学界正在激烈争鸣的领域。作者认为西方学者片面地强调和放大了整体性思维的弊端,而忽视其存在的正向作用。文章以"互动公平与员工承诺"的员工激励机制为基础模型,在加入"后见之明"认知偏差作为关键调节变量之后,论证了"事后诸葛"并非一无是处,它其实在某些情况下反而可以成为组织的润滑剂。文章也在此基础上,讨论了在中国文化背景下,构建本土管理学理论的必要性和可行性。 展开更多
关键词 认知偏差 后见之明 整体性思维 分析性思维
在线阅读 下载PDF
法律决策中消极程度及消除策略对后见偏差的影响 被引量:1
19
作者 彭慰慰 钟毅平 《心理学探新》 CSSCI 2010年第4期54-57,共4页
该研究考察法律决策中消极结果严重程度及消除策略对后见偏差的影响。实验采用3(严重程度:轻微损害、中度损害、严重损害)×3(有无策略:后见组、分散注意组、指导组)两因素被试间设计。采用自编两个案例及问卷测查法律决策中后见效... 该研究考察法律决策中消极结果严重程度及消除策略对后见偏差的影响。实验采用3(严重程度:轻微损害、中度损害、严重损害)×3(有无策略:后见组、分散注意组、指导组)两因素被试间设计。采用自编两个案例及问卷测查法律决策中后见效应的差异,实验结果发现,后见偏差的强度随着事件消极结果严重程度的增加而显著增强。在消极结果的严重损害程度下,产生出最大的后见偏差。同时,两种策略指导都能够有效减少法律决策中的后见偏差。 展开更多
关键词 法律决策 后见偏差 严重程度 消除策略
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部