首先,基于CNKI(中国知网)与WOS(Web of Science)核心数据库文献并运用CiteSpace软件,系统分析了国内外城市社区更新的研究热点和发展趋势;然后,结合现有文献,对社区更新的理论与实践两方面展开了综述;最后,立足于城市更新与高质量发展背...首先,基于CNKI(中国知网)与WOS(Web of Science)核心数据库文献并运用CiteSpace软件,系统分析了国内外城市社区更新的研究热点和发展趋势;然后,结合现有文献,对社区更新的理论与实践两方面展开了综述;最后,立足于城市更新与高质量发展背景,对城市社区更新研究未来研究方向进行了展望。分析发现:1)国内研究强调政府主导空间改造与居民参与治理,且争议聚焦于环境治理与产权分配;国外研究则主要侧重多元协作和环境正义;2)国内研究逐渐从物质空间改造转向对人本需求的关注,国外则从注重管理方式、经济发展转向协同规划与可持续发展;3)国内城市社区更新研究在跨学科整合、居民参与、社会组织与市场力量激活等方面仍有不足。展开更多
在连续且密集奖励的任务中,离线强化学习取得了显著的效果.然而由于其训练过程不与环境交互,泛化能力降低,在离散且稀疏奖赏的环境下性能难以得到保证.扩散模型通过加噪结合样本数据邻域的信息,生成贴近样本数据分布的动作,强化智能体...在连续且密集奖励的任务中,离线强化学习取得了显著的效果.然而由于其训练过程不与环境交互,泛化能力降低,在离散且稀疏奖赏的环境下性能难以得到保证.扩散模型通过加噪结合样本数据邻域的信息,生成贴近样本数据分布的动作,强化智能体的学习和泛化能力.针对以上问题,提出一种扩散模型期望最大化的离线强化学习方法(offline reinforcement learning with diffusion models and expectation maximization,DMEM).该方法通过极大似然对数期望最大化更新目标函数,使策略具有更强的泛化性.将扩散模型引入策略网络中,利用扩散的特征,增强策略学习数据样本的能力.同时从高维空间的角度看期望回归更新价值函数,引入一个惩戒项使价值函数评估更准确.将DMEM应用于一系列离散且稀疏奖励的任务中,实验表明,与其他经典的离线强化学习方法相比,DMEM性能上具有较大的优势.展开更多
文摘首先,基于CNKI(中国知网)与WOS(Web of Science)核心数据库文献并运用CiteSpace软件,系统分析了国内外城市社区更新的研究热点和发展趋势;然后,结合现有文献,对社区更新的理论与实践两方面展开了综述;最后,立足于城市更新与高质量发展背景,对城市社区更新研究未来研究方向进行了展望。分析发现:1)国内研究强调政府主导空间改造与居民参与治理,且争议聚焦于环境治理与产权分配;国外研究则主要侧重多元协作和环境正义;2)国内研究逐渐从物质空间改造转向对人本需求的关注,国外则从注重管理方式、经济发展转向协同规划与可持续发展;3)国内城市社区更新研究在跨学科整合、居民参与、社会组织与市场力量激活等方面仍有不足。
文摘在连续且密集奖励的任务中,离线强化学习取得了显著的效果.然而由于其训练过程不与环境交互,泛化能力降低,在离散且稀疏奖赏的环境下性能难以得到保证.扩散模型通过加噪结合样本数据邻域的信息,生成贴近样本数据分布的动作,强化智能体的学习和泛化能力.针对以上问题,提出一种扩散模型期望最大化的离线强化学习方法(offline reinforcement learning with diffusion models and expectation maximization,DMEM).该方法通过极大似然对数期望最大化更新目标函数,使策略具有更强的泛化性.将扩散模型引入策略网络中,利用扩散的特征,增强策略学习数据样本的能力.同时从高维空间的角度看期望回归更新价值函数,引入一个惩戒项使价值函数评估更准确.将DMEM应用于一系列离散且稀疏奖励的任务中,实验表明,与其他经典的离线强化学习方法相比,DMEM性能上具有较大的优势.