期刊文献+
共找到115篇文章
< 1 2 6 >
每页显示 20 50 100
2024年度三维视觉前沿趋势与十大进展
1
作者 刘烨斌 苏昊 +23 位作者 高林 弋力 王鹤 廖依伊 施柏鑫 曹炎培 洪方舟 董豪 张举勇 王鑫涛 许华哲 杨蛟龙 康炳易 楚梦渝 孙赫 陈文拯 马月昕 张鸿文 郭裕兰 周晓巍 章国锋 韩晓光 戴玉超 陈宝权 《中国图象图形学报》 北大核心 2025年第6期1717-1743,共27页
三维视觉作为计算机视觉、图形学、人工智能与光学成像的交叉学科,是构建具身通用智能与元宇宙的核心基石。2024年,以神经辐射场和高斯泼溅为代表的可微表征技术持续发展和完善并逐渐突破传统三维重建边界,无论从微观细胞组织到宏观物... 三维视觉作为计算机视觉、图形学、人工智能与光学成像的交叉学科,是构建具身通用智能与元宇宙的核心基石。2024年,以神经辐射场和高斯泼溅为代表的可微表征技术持续发展和完善并逐渐突破传统三维重建边界,无论从微观细胞组织到宏观物理天体,还是从静态场景到动态人体,均取得显著的精度提升;在生成式人工智能技术和大模型规模定律(scaling law)的推动下,三维视觉迎来从优化到可泛化前馈生成的范式跃迁,并在可控数字内容生成方向取得重要进展和突破;具身智能持续备受关注,研究者逐渐意识到三维虚拟仿真数据和三维人体运动数据的捕捉和生成,是训练具身智能的核心关键;随着世界模型和空间智能的概念成为科技界热议的焦点,对物理世界进行建模、对空间关系进行理解、对未来状态进行预测成为重要研究方向,而这些都离不开三维视觉技术的支撑;此外,计算成像技术的革新则通过非传统视觉传感器与新型重建算法,突破了传统三维重建的物理限制与性能瓶颈。这些技术突破正推动着三维视觉进入“感知—建模—生成—交互”全链路智能化、规模化学习的新阶段。为促进学术交流,本文分析总结三维视觉领域前沿趋势,并遴选年度十大研究进展,为学术界与产业界提供参考观点。 展开更多
关键词 三维视觉 具身智能 三维表征 三维生成 三维重建
原文传递
类型偏好注意的序列推荐算法
2
作者 邹宗政 李东胜 +2 位作者 张鹏 顾宁 卢暾 《小型微型计算机系统》 北大核心 2025年第8期1793-1800,共8页
序列推荐根据用户的历史交互物品,预测用户的下一个交互物品.现有基于物品序列的自注意力序列推荐模型,在进行物品预测时并没有充分考虑到用户在类型维度上的复杂偏好.为了解决这一局限性,本文提出了类型偏好注意的序列推荐算法CASRec.... 序列推荐根据用户的历史交互物品,预测用户的下一个交互物品.现有基于物品序列的自注意力序列推荐模型,在进行物品预测时并没有充分考虑到用户在类型维度上的复杂偏好.为了解决这一局限性,本文提出了类型偏好注意的序列推荐算法CASRec.该算法首先设计了类型兴趣编码器模块以预测编码用户的综合类型偏好,然后设计类型信息感知的预测器模块来根据此类型偏好构建物品依赖关系,并利用集成嵌入的物品表示生成对于用户下一个交互物品的预测.此外,为了更深入地利用物品类型信息来帮助物品预测,额外的物品类型预测任务被引入以激活物品与类型的关系.在3个公开数据集上的广泛实验验证了CASRec性能的优越性和各个模块设计的有效性. 展开更多
关键词 序列推荐 注意力机制 多任务学习 类型偏好
在线阅读 下载PDF
价值观罗盘评估中心:面向人机交互的大模型价值观评测平台
3
作者 姚菁 矣晓沅 谢幸 《计算》 2025年第2期38-46,共9页
随着大语言模型(large language models,LLMs)日益融入人类生活,成为人机交互中的关键对象,如何准确评测其价值观已经成为重要的研究课题。这不仅能够衡量其安全性,保障其在交互场景中负责任地发展,还能够帮助用户发现与其个人价值观更... 随着大语言模型(large language models,LLMs)日益融入人类生活,成为人机交互中的关键对象,如何准确评测其价值观已经成为重要的研究课题。这不仅能够衡量其安全性,保障其在交互场景中负责任地发展,还能够帮助用户发现与其个人价值观更契合的模型,同时可以为实现人机交互中模型与人类价值观对齐提供关键指导信号。然而,价值观评测面临三大复杂挑战:如何定义合适的评测目标,以准确地揭示交互中复杂、多元的人类价值观;如何确保评测的有效性,现有的静态开源数据集存在数据污染风险且原本有效的测试样本随着大模型的快速演进容易失效。此外,许多现有工作只衡量模型对价值观的知识掌握,而非其在实际人机交互场景中的价值观践行能力,这导致评测结果难以真实反映用户对模型能力的需求;如何科学地度量评测结果,价值观评测通常是多维度的,评测时需要在不同价值维度间进行加权整合,并考虑不同的价值优先级。为了应对以上挑战,我们团队研究并搭建了价值观罗盘评估中心(Value Compass Benchmarks),通过3个创新模块实现科学的价值观评测。首先,基于社会科学中的人类基本价值观来定义评测目标,通过有限的核心价值维度全面揭示价值观;其次,设计了生成式动态演进评测框架,通过动态问题生成器实时生成评测样本,并采用生成式评测方法,分析模型在真实情境中的价值观体现;最后,提出一-种评测指标,通过加权整合各维度的价值观,支持个性化定制权重。我们期望该平台能够提供科学、系统的价值观评测服务,同时促进模型价值观对齐研究的发展。 展开更多
关键词 大语言模型 价值观评测 价值观对齐 生成式评测 评价基准 动态演进评测 基本价值观 大模型文化对齐
在线阅读 下载PDF
A criterion for selecting the appropriate one from the trained models for model-based offline policy evaluation
4
作者 Chongchong Li Yue Wang +1 位作者 Zhi-Ming Ma Yuting Liu 《CAAI Transactions on Intelligence Technology》 2025年第1期223-234,共12页
Offline policy evaluation,evaluating and selecting complex policies for decision-making by only using offline datasets is important in reinforcement learning.At present,the model-based offline policy evaluation(MBOPE)... Offline policy evaluation,evaluating and selecting complex policies for decision-making by only using offline datasets is important in reinforcement learning.At present,the model-based offline policy evaluation(MBOPE)is widely welcomed because of its easy to implement and good performance.MBOPE directly approximates the unknown value of a given policy using the Monte Carlo method given the estimated transition and reward functions of the environment.Usually,multiple models are trained,and then one of them is selected to be used.However,a challenge remains in selecting an appropriate model from those trained for further use.The authors first analyse the upper bound of the difference between the approximated value and the unknown true value.Theoretical results show that this difference is related to the trajectories generated by the given policy on the learnt model and the prediction error of the transition and reward functions at these generated data points.Based on the theoretical results,a new criterion is proposed to tell which trained model is better suited for evaluating the given policy.At last,the effectiveness of the proposed criterion is demonstrated on both benchmark and synthetic offline datasets. 展开更多
关键词 offline policy evaluation reinforcement learning model based
在线阅读 下载PDF
Low-temperature replacement construction of three-dimensional corrosion-resistant interface for deeply rechargeable Zn metal batteries
5
作者 Jinze Li Daniel Rohrens +8 位作者 Gianluca Dalfollo Xiaochao Wu Ziheng Lu Qiang Gao Bo Han Ruimin Sun Chenggang Zhou Jindi Wang Zhao Cai 《Nano Materials Science》 EI CAS CSCD 2024年第3期329-336,共8页
Aqueous Zn batteries are promising candidates for grid-scale renewable energy storage.Foil electrodes have been widely investigated and applied as anode materials for aqueous Zn batteries,however,they suffer from limi... Aqueous Zn batteries are promising candidates for grid-scale renewable energy storage.Foil electrodes have been widely investigated and applied as anode materials for aqueous Zn batteries,however,they suffer from limited surface area and severe interfacial issues including metallic dendrites and corrosion side reactions,limiting the depth of discharge(DOD)of the foil electrode materials.Herein,a low-temperature replacement reaction is utilized to in-situ construct a three-dimensional(3D)corrosion-resistant interface for deeply rechargeable Zn foil electrodes.Specifically,the deliberate low-temperature environment controlled the replacement rate between polycrystalline Zn metal and oxalic acid,producing a Zn foil electrode with distinct 3D corrosion-resistant interface(3DCI-Zn),which differed from conventional two-dimensional(2D)protective structure and showed an order of magnitude higher surface area.Consequently,the 3DCI-Zn electrode exhibited dendrite-free and anticorrosion properties,and achieved stable plating/stripping performance for 1000 h at 10 mA cm^(-2)and 10 mAh cm^(-2)with a remarkable DOD of 79%.After pairing with a MnO2cathode with a high areal capacity of 4.2 mAh cm^(-2),the pouch cells delivered 168 Wh L^(-1)and a capacity retention of 89.7%after 100 cycles with a low negative/positive(N/P)ratio of 3:1. 展开更多
关键词 Aqueous batteries Foil electrodes Depth of discharge DENDRITES Corrosion side reactions
在线阅读 下载PDF
生成式对抗网络:从生成数据到创造智能 被引量:40
6
作者 王坤峰 左旺孟 +3 位作者 谭营 秦涛 李力 王飞跃 《自动化学报》 EI CSCD 北大核心 2018年第5期769-774,共6页
技术创新是社会经济发展的核心驱动力.继以物联网、云计算、大数据和移动互联网为代表的信息技术之后,以深度学习为代表的人工智能技术蓬勃发展,被公认是社会经济发展的新动能和新引擎,有望在农业生产、工业制造、经济金融、社会管理等... 技术创新是社会经济发展的核心驱动力.继以物联网、云计算、大数据和移动互联网为代表的信息技术之后,以深度学习为代表的人工智能技术蓬勃发展,被公认是社会经济发展的新动能和新引擎,有望在农业生产、工业制造、经济金融、社会管理等众多领域产生颠覆性变革. 展开更多
关键词 生成式对抗网络 生成数据 创造智能
在线阅读 下载PDF
基于大数据的软件项目知识图谱构造及问答方法 被引量:8
7
作者 邹艳珍 王敏 +1 位作者 谢冰 林泽琦 《大数据》 2021年第1期22-36,共15页
随着软件规模的不断扩大、软件演化周期的不断延长,构建软件项目知识图谱对软件维护、软件开发的意义越来越重大。如何基于软件项目开发过程中产生的源代码、邮件列表、缺陷报告等多源异构大数据,快速构建语义关联丰富的软件知识图谱,... 随着软件规模的不断扩大、软件演化周期的不断延长,构建软件项目知识图谱对软件维护、软件开发的意义越来越重大。如何基于软件项目开发过程中产生的源代码、邮件列表、缺陷报告等多源异构大数据,快速构建语义关联丰富的软件知识图谱,是软件工程领域亟待解决的关键问题。提出了以代码结构为核心的软件知识图谱模型,建立了“知识抽取-知识融合”两层软件知识图谱构造框架,该框架支持软件项目知识图谱的自动构造以及基于知识图谱的软件项目智能问答,有效提高了软件项目理解和软件复用的效率。目前,软件项目知识图谱已经在Apache开源社区以及国内著名软件企业成功展开应用实践。 展开更多
关键词 软件复用 软件知识图谱 软件知识抽取 知识问答
在线阅读 下载PDF
前言
8
作者 史忠植 张长水 +3 位作者 邓立 陈松灿 张军 彭宇新 《计算机研究与发展》 EI CSCD 北大核心 2014年第9期1889-1890,共2页
深度学习是机器学习研究中的一个新的领域,其核心思想在于模拟人脑的层级抽象结构,通过无监督的方式分析大规模数据,发掘大数据中蕴藏的有价值信息.深度学习应大数据而生,给大数据提供了一个深度思考的大脑.深度学习是一种研究信... 深度学习是机器学习研究中的一个新的领域,其核心思想在于模拟人脑的层级抽象结构,通过无监督的方式分析大规模数据,发掘大数据中蕴藏的有价值信息.深度学习应大数据而生,给大数据提供了一个深度思考的大脑.深度学习是一种研究信息的最佳表示及其获取方法的技术,在神经网络或信念网络的情况下是对基于深层结构或网络表示的输入输出间映射进行机器学习的过程. 展开更多
关键词 机器学习 大规模数据 抽象结构 获取方法 数据提供 输入输出 深层结构 信念网络
在线阅读 下载PDF
语言建模中最小化样本风险算法的研究和改进
9
作者 袁伟 高剑峰 步丰林 《软件学报》 EI CSCD 北大核心 2007年第2期196-204,共9页
目前,一些主流的判别学习算法只能优化光滑可导的损失函数,但在自然语言处理(natural language processing,简称NLP)中,很多应用的直接评价标准(如字符转换错误数(character error rate,简称CER))都是不可导的阶梯形函数.为解决此问题,... 目前,一些主流的判别学习算法只能优化光滑可导的损失函数,但在自然语言处理(natural language processing,简称NLP)中,很多应用的直接评价标准(如字符转换错误数(character error rate,简称CER))都是不可导的阶梯形函数.为解决此问题,研究了一种新提出的判别学习算法——最小化样本风险(minimum sample risk,简称MSR)算法.与其他判别训练算法不同,MSR算法直接使用阶梯形函数作为其损失函数.首先,对MSR算法的时空复杂性作了分析和提高;同时,提出了改进的算法MSR-II,使得特征之间相关性的计算更加稳定.此外,还通过大量领域适应性建模实验来考察MSR-II的鲁棒性.日文汉字输入实验的评测结果表明:(1)MSR/MSR-II显著优于传统三元模型,使错误率下降了20.9%;(2)MSR/MSR-II与另两类主流判别学习算法Boosting和Perceptron表现相当;(3)MSR-II不仅在时空复杂度上优于MSR,特征选择的稳定性也更高;(4)领域适应性建模的结果证明了MSR-II的良好鲁棒性.总之,MSR/MSR-II是一种非常有效的算法.由于其使用的是阶梯形的损失函数,因此可以广泛应用于自然语言处理的各个领域,如拼写校正和机器翻译. 展开更多
关键词 语言建模 判别训练算法 输入法编辑器 最小化样本风险 领域适应性建模
在线阅读 下载PDF
自适应深度残差椒盐噪声滤除算法 被引量:11
10
作者 邓森 徐进轩 +6 位作者 梁鹿鸣 杨珉 谢浩然 王富利 汪俊 魏明强 郭延文 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2020年第8期1248-1257,共10页
为了在去除图像中椒盐噪声的同时最大程度地避免产生色彩失真与边缘模糊等瑕疵,提出基于深度残差网络的椒盐噪声自适应滤除算法.将图像去噪分解为2步.首先,为了让网络模型能够处理不同尺度密度的椒盐噪声,提高网络模型的鲁棒性,先对图... 为了在去除图像中椒盐噪声的同时最大程度地避免产生色彩失真与边缘模糊等瑕疵,提出基于深度残差网络的椒盐噪声自适应滤除算法.将图像去噪分解为2步.首先,为了让网络模型能够处理不同尺度密度的椒盐噪声,提高网络模型的鲁棒性,先对图像进行自适应预处理以去除高频信息;其次,构建深度残差网络模型,训练出能将预处理后的图像映射到干净图像的函数.大量实验结果表明,文中算法不仅在保留图像边缘细节和去除高密度椒盐噪声方面均优于传统和基于机器学习的椒盐噪声去除技术,可有效地避免出现色彩失真和条纹等瑕疵.同时,其在BSD300数据集上去噪效果优于其他算法. 展开更多
关键词 椒盐噪声 残差网络 图像去噪
在线阅读 下载PDF
一种低频词词向量优化方法及其在短文本分类中的应用 被引量:7
11
作者 程婧 刘娜娜 +3 位作者 闵可锐 康昱 王新 周扬帆 《计算机科学》 CSCD 北大核心 2020年第8期255-260,共6页
众多自然语言处理(Natural Language Processing,NLP)任务受益于在大规模语料上训练的词向量。由于预训练的词向量具有大语料上的通用语义特征,因此将这些词向量应用到特定的下游任务时,往往需要通过微调进行一定的更新和调整,使其更适... 众多自然语言处理(Natural Language Processing,NLP)任务受益于在大规模语料上训练的词向量。由于预训练的词向量具有大语料上的通用语义特征,因此将这些词向量应用到特定的下游任务时,往往需要通过微调进行一定的更新和调整,使其更适用于目标任务。但是,目标语料集中的低频词由于缺少训练样本,导致在微调过程中无法获得稳定的梯度信息,使得词向量无法得到有效更新。而在短文本分类任务中,这些低频词对分类结果同样有着重要的指示性。因此,在具体的短文本分类任务上获得一个更好的低频词词向量表示是有必要的。针对这个问题,文中提出了一种与下游任务模型无关的低频词词向量更新算法,通过基于K近邻的词向量偏移计算方法,利用通用词向量中与低频词相似的高频词所获得的任务特征信息,来指导低频词的信息更新,从而获得更准确的且适用于当前任务语境的低频词词向量表示;并以TextCNN作为基准模型,基于word2vec和GloVe得到的两个通用预训练词向量,在3个公开的短文本数据集上进行了优化算法的效果验证。实验结果表明,使用优化算法更新低频词词表示后,模型分类准确率能达到84.3%~94%,较更新前提升了0.4%~1.4%,体现了优化算法的有效性,也进一步证明了短文本分类任务中低频词对分类结果的影响,为短文本分类的研究工作提供了一定的借鉴。 展开更多
关键词 词向量 低频词 微调 短文本分类
在线阅读 下载PDF
预训练语言模型的可解释性研究进展 被引量:5
12
作者 郝雅茹 董力 +1 位作者 许可 李先贤 《广西师范大学学报(自然科学版)》 CAS 北大核心 2022年第5期59-71,共13页
基于深度神经网络的大型预训练语言模型在众多自然语言处理任务上都取得了巨大的成功,如文本分类、阅读理解、机器翻译等,目前已经广泛应用于工业界。然而,这些模型的可解释性普遍较差,即难以理解为何特定的模型结构和预训练方式如此有... 基于深度神经网络的大型预训练语言模型在众多自然语言处理任务上都取得了巨大的成功,如文本分类、阅读理解、机器翻译等,目前已经广泛应用于工业界。然而,这些模型的可解释性普遍较差,即难以理解为何特定的模型结构和预训练方式如此有效,亦无法解释模型做出决策的内在机制,这给人工智能模型的通用化带来不确定性和不可控性。因此,设计合理的方法来解释模型至关重要,它不仅有助于分析模型的行为,也可以指导研究者更好地改进模型。本文介绍近年来有关大型预训练语言模型可解释性的研究现状,对相关文献进行综述,并分析现有方法的不足和未来可能的发展方向。 展开更多
关键词 语言模型 预训练 可解释性 自然语言处理 神经网络
在线阅读 下载PDF
检索式聊天机器人技术综述 被引量:11
13
作者 吴俣 李舟军 《计算机科学》 CSCD 北大核心 2021年第12期278-285,共8页
随着自然语言处理技术的飞速发展以及互联网上对话语料的不断积累,闲聊导向对话系统(简称聊天机器人)取得了令人瞩目的进展,受到了学术界的广泛关注,并在产业界进行了初步的尝试。当前,聊天机器人分为检索式聊天机器人和生成式聊天机器... 随着自然语言处理技术的飞速发展以及互联网上对话语料的不断积累,闲聊导向对话系统(简称聊天机器人)取得了令人瞩目的进展,受到了学术界的广泛关注,并在产业界进行了初步的尝试。当前,聊天机器人分为检索式聊天机器人和生成式聊天机器人,而检索式聊天机器人由于其生成的回复流畅且计算资源消耗小,仍然是目前工业界聊天机器人的主要实现手段。文中首先简要介绍了检索式聊天机器人的研究背景、基本架构以及组成模块,重点阐述了回复选择模块的约束要求和相关数据集;然后,针对检索式聊天机器人中最为核心的回复选择技术,进行了深入分析与详细梳理。文中将近年来经典的回复选择技术归纳为如下4类:基于统计模型的方法、基于表示的神经网络模型的方法、基于交互的神经网络模型的方法以及基于预训练技术的方法,并指出了这4类方法的优点和不足。在此基础上,分析了目前检索式聊天机器人技术研究所面临的问题,并对其未来的发展趋势进行了展望。 展开更多
关键词 自然语言处理 聊天机器人 文本匹配 回复选择 预训练技术
在线阅读 下载PDF
当深度学习遇到大视频数据 被引量:1
14
作者 曾文军 罗翀 《中兴通讯技术》 2017年第4期44-46,共3页
视频信号是大数据中的大数据,这种海量视频数据带来了存储、传输、处理、管理等方面的挑战,同时也提供了大量有价值的信息和商业机会。认为深度学习颠覆了视觉理解的进程,从图像分类到物体检测、语义分割等更细更复杂的任务,从视频里物... 视频信号是大数据中的大数据,这种海量视频数据带来了存储、传输、处理、管理等方面的挑战,同时也提供了大量有价值的信息和商业机会。认为深度学习颠覆了视觉理解的进程,从图像分类到物体检测、语义分割等更细更复杂的任务,从视频里物体的检测与跟踪到物体属性和行为的分析,特别是关于人和车的理解技术。指出随着计算能力和大数据持续快速增长,加上深度学习、主动学习、迁移学习、无监督学习、强化学习等强大机器学习技术继续发展,让机器可以像人一样看到并理解世界的前景是乐观的。 展开更多
关键词 深度学习 大视频数据 人工智能
在线阅读 下载PDF
基于短语成分表示的中文关系抽取 被引量:1
15
作者 刘娜娜 程婧 +3 位作者 闵可锐 康昱 王新 周扬帆 《数据采集与处理》 CSCD 北大核心 2020年第3期449-457,共9页
关系抽取是自然语言处理的重要研究内容,短语成分结构则是学界普遍认为能对关系抽取有重要影响的特征信息。然而目前短语成分应用于关系抽取任务时没有明显效果。这主要有两个原因:短语成分分析模型的泛化能力较差,会在关系抽取上造成... 关系抽取是自然语言处理的重要研究内容,短语成分结构则是学界普遍认为能对关系抽取有重要影响的特征信息。然而目前短语成分应用于关系抽取任务时没有明显效果。这主要有两个原因:短语成分分析模型的泛化能力较差,会在关系抽取上造成错误传播,从而影响了它对关系抽取的有效性;关系抽取任务上使用短语成分特征的方式存在缺陷,即丧失短语成分分析学习到的句子结构信息,或者加大其对关系抽取的错误影响。本文在提升短语成分分析效果的基础上,提出了基于短语成分表示的中文关系抽取方法。该方法将短语成分分析模型学习到的文本表示嵌入到关系抽取模型中,从而提升关系抽取的性能。本文在公开的中文关系抽取数据集上验证了该方法的有效性。 展开更多
关键词 短语成分表示 中文关系抽取 特征融合 短语成分分析
在线阅读 下载PDF
单帧图像下的环境光遮蔽估计 被引量:3
16
作者 郭雨潇 陈雷霆 董悦 《计算机研究与发展》 EI CSCD 北大核心 2019年第2期385-393,共9页
环境光遮蔽(ambient occlusion)被广泛用于近似计算低频全局光照、消除间接光照和阴影等计算机图形学和视觉应用中.已有算法直接通过场景的3维几何,或不同光照下的多幅图像计算每个点的环境光遮蔽,存在着对光照和输入图像数量要求高等问... 环境光遮蔽(ambient occlusion)被广泛用于近似计算低频全局光照、消除间接光照和阴影等计算机图形学和视觉应用中.已有算法直接通过场景的3维几何,或不同光照下的多幅图像计算每个点的环境光遮蔽,存在着对光照和输入图像数量要求高等问题.针对以上不足,提出了一种基于单张图像的环境光遮蔽估计算法.算法利用一个在大量仿真图像数据集上训练的卷积神经网络,直接从自然光照条件下场景的单张图像中恢复每个点的环境光遮蔽.提出并比较了3种不同的神经网络结构设计,实验分析验证了端到端的设计方案可以获得最佳的结果.和已有的环境光遮蔽算法方法比较,所提出的方法不仅计算速度快,而且在数值和视觉上具有更好的结果. 展开更多
关键词 环境光遮蔽 本征图像 自然光照 卷积神经网络 自动编码器
在线阅读 下载PDF
基于共享GPU的深度学习训练性能实证研究 被引量:4
17
作者 徐涣霖 顾嘉臻 +1 位作者 康昱 周扬帆 《计算机应用与软件》 北大核心 2022年第12期152-158,共7页
深度学习应用的训练过程是计算密集型的,它通常依靠图形处理单元(Graphics Processing Unit, GPU)来加速训练过程。然而深度学习开发框架往往会独占GPU,造成计算资源的浪费。针对该问题,该实证研究对两个深度学习应用共享GPU训练的可行... 深度学习应用的训练过程是计算密集型的,它通常依靠图形处理单元(Graphics Processing Unit, GPU)来加速训练过程。然而深度学习开发框架往往会独占GPU,造成计算资源的浪费。针对该问题,该实证研究对两个深度学习应用共享GPU训练的可行性进行讨论,系统地分析了有代表性的深度学习模型的静态和运行时特性,展示了共享GPU训练两个模型时,不同的模型组合和特征对整体性能的影响。根据实验结果所总结的原则可以作为提高调度效率和改善GPU云资源利用率的指导方针。 展开更多
关键词 性能分析 GPU应用程序 深度学习 实证研究
在线阅读 下载PDF
大模型道德价值观对齐问题剖析 被引量:62
18
作者 矣晓沅 谢幸 《计算机研究与发展》 EI CSCD 北大核心 2023年第9期1926-1945,共20页
探讨了以大语言模型(large language model,LLM)为代表的大模型(big model)时代人工智能(artificial intelligence,AI)发展面临的新挑战:道德价值观对齐问题.大模型的崛起极大地提升了AI理解、生成和控制信息与内容的能力,从而赋能了丰... 探讨了以大语言模型(large language model,LLM)为代表的大模型(big model)时代人工智能(artificial intelligence,AI)发展面临的新挑战:道德价值观对齐问题.大模型的崛起极大地提升了AI理解、生成和控制信息与内容的能力,从而赋能了丰富的下游应用.然而,随着大模型成为与人类生活方方面面深度交融的基础,其内在的道德价值观和潜在的价值倾向对人类社会带来不可预测的风险.首先对大模型面临的风险和挑战进行了梳理,介绍了当下主流的AI伦理准则和大模型的局限性对应的道德问题.随后提出从规范伦理学的角度重新审视近年来不断提出的各类规范性准则,并倡导学界共同协作构建统一的普适性AI道德框架.为进一步探究大模型的道德倾向,基于道德基础理论体系,检验了当下主流大语言模型的道德价值倾向,梳理了现有的大模型对齐算法,总结了大模型在道德价值观对齐上所面临的独特挑战.为解决这些挑战,提出了一种新的针对大模型道德价值观对齐的概念范式,从对齐维度、对齐评测和对齐方法3个方面展望了有潜力的研究方向.最后,倡导以交叉学科为基础,为将来构建符合人类道德观的通用AI迈出了重要一步. 展开更多
关键词 大模型 人工智能伦理 价值观对齐 负责任的人工智能
在线阅读 下载PDF
Progress in Neural NLP:Modeling,Learning,and Reasoning 被引量:17
19
作者 Ming Zhou Nan Duan +1 位作者 Shujie Liu Heung-Yeung Shum 《Engineering》 SCIE EI 2020年第3期275-290,共16页
Natural language processing(NLP)is a subfield of artificial intelligence that focuses on enabling computers to understand and process human languages.In the last five years,we have witnessed the rapid development of N... Natural language processing(NLP)is a subfield of artificial intelligence that focuses on enabling computers to understand and process human languages.In the last five years,we have witnessed the rapid development of NLP in tasks such as machine translation,question-answering,and machine reading comprehension based on deep learning and an enormous volume of annotated and unannotated data.In this paper,we will review the latest progress in the neural network-based NLP framework(neural NLP)from three perspectives:modeling,learning,and reasoning.In the modeling section,we will describe several fundamental neural network-based modeling paradigms,such as word embedding,sentence embedding,and sequence-to-sequence modeling,which are widely used in modern NLP engines.In the learning section,we will introduce widely used learning methods for NLP models,including supervised,semi-supervised,and unsupervised learning;multitask learning;transfer learning;and active learning.We view reasoning as a new and exciting direction for neural NLP,but it has yet to be well addressed.In the reasoning section,we will review reasoning mechanisms,including the knowledge,existing non-neural inference methods,and new neural inference methods.We emphasize the importance of reasoning in this paper because it is important for building interpretable and knowledgedriven neural NLP models to handle complex tasks.At the end of this paper,we will briefly outline our thoughts on the future directions of neural NLP. 展开更多
关键词 Natural language processing Deep learning Modeling learning and reasoning
在线阅读 下载PDF
基于优化反馈的组合在线学习 被引量:1
20
作者 孔芳 杨悦然 +1 位作者 陈卫 李帅 《大数据》 2021年第5期111-130,共20页
组合在线学习问题研究如何在与环境的交互过程中学习未知参数,逐步找到最优的目标组合。该问题有丰富的应用场景,如广告投放、搜索和推荐等。首先阐述了组合在线学习问题的定义及其框架——组合多臂老虎机问题,归纳了此框架下的经典算... 组合在线学习问题研究如何在与环境的交互过程中学习未知参数,逐步找到最优的目标组合。该问题有丰富的应用场景,如广告投放、搜索和推荐等。首先阐述了组合在线学习问题的定义及其框架——组合多臂老虎机问题,归纳了此框架下的经典算法和研究进展;然后具体介绍了该问题的两个实际应用——在线影响力最大化和在线排序学习问题,以及其研究进展;最后展望了组合在线学习问题的未来研究方向。 展开更多
关键词 组合多臂老虎机 在线学习 在线影响力最大化 在线排序学习
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部