期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
数据库内AI模型优化 被引量:9
1
作者 钮泽平 李国良 《软件学报》 EI CSCD 北大核心 2021年第3期622-635,共14页
在大量变化着的数据中,数据分析师常常只关心预测结果为特定值的少量数据.然而,利用机器学习模型进行推理的工作流程中,由于机器学习算法库默认数据以单表方式组织,用户必须先通过SQL语句查询出全部数据,即使随后在模型推理过程中会将... 在大量变化着的数据中,数据分析师常常只关心预测结果为特定值的少量数据.然而,利用机器学习模型进行推理的工作流程中,由于机器学习算法库默认数据以单表方式组织,用户必须先通过SQL语句查询出全部数据,即使随后在模型推理过程中会将大量数据丢弃.指出了在这个过程中,如果可以预先从模型中提取信息,就有望能在数据获取阶段快速排除不需要的数据,从而降低数据获取过程中的多表连接代价、进程间通信代价以及模型预测代价,进而加速整个工作流程.以决策树模型为例,首先提出一种预筛选+验证的执行方法对查询过程进行优化,之后给出了从决策树中提取用于预筛选谓词的离线算法,最后在真实数据集上进行测试.实验结果表明,所提出的方法能够对借助决策树模型推理结果对数据进行筛选的应用场景起到较好的加速效果. 展开更多
关键词 SQL 数据库 决策树 db4ai
在线阅读 下载PDF
DB4Trans:数据库内置知识图谱嵌入模型训练引擎 被引量:4
2
作者 柳鹏凯 王鑫 +2 位作者 刘宝珠 蔡顺汀 李思卓 《计算机学报》 EI CAS CSCD 北大核心 2022年第9期1969-1982,共14页
知识图谱嵌入技术将知识图谱中的实体和关系嵌入到连续的向量空间中,在简化图谱操作的同时保留知识图谱的固有结构,并有助于完成诸如图谱补全、链接预测等下游任务.随着基于知识的人工智能的日益普及和应用,知识图谱的数据规模正在急剧... 知识图谱嵌入技术将知识图谱中的实体和关系嵌入到连续的向量空间中,在简化图谱操作的同时保留知识图谱的固有结构,并有助于完成诸如图谱补全、链接预测等下游任务.随着基于知识的人工智能的日益普及和应用,知识图谱的数据规模正在急剧增加.然而,大部分的知识图谱嵌入工作主要关注模型训练的结果,忽略了对于数据规模的可扩展性,在处理大规模知识图谱时表现出较差的性能.近年来的一些研究工作将数据库技术应用于机器学习算法的优化,同时提供了用于数据库内机器学习的各类工具.通过将知识图谱嵌入模型与数据库在数据管理上的优势进行有效的结合,能够在保证知识图谱嵌入模型训练的准确率和效率的同时,提供更好的可扩展性以支持大规模知识图谱数据的训练.基于此,本文提出一种数据库内置知识图谱嵌入模型训练引擎DB4Trans.首先,设计了一种用于知识图谱嵌入模型训练的数据存储方案,对实体和关系进行编码并建立索引结构,以实现模型训练过程中对中间结果的快速访问和更新;其次,提出了一种数据库内置的模型训练优化算法,对数据库与内存间的数据批量交换方案进行设计以支持大规模数据的训练与存储;最后,在不同数据集上进行了测试,比较了模型训练与预测的时间、模型训练的准确率、存储时间和空间效率并验证了方法的可扩展性.实验结果表明,所提出的方法能够在不影响模型训练效率和准确率的同时,通过内存与数据库间的数据交换,支持在数据库内完成大规模知识图谱的训练过程. 展开更多
关键词 数据库 知识图谱嵌入 模型训练引擎 db4ai TransE
在线阅读 下载PDF
Learning database optimization techniques:the state-of-the-art and prospects
3
作者 Shao-Jie QIAO Han-Lin FAN +4 位作者 Nan HAN Lan DU Yu-Han PENG Rong-Min TANG Xiao QIN 《Frontiers of Computer Science》 2025年第12期115-138,共24页
Artificial intelligence-enabled database technology,known as AI4DB(Artificial Intelligence for Databases),is an active research area attracting significant attention and innovation.This survey first introduces the bac... Artificial intelligence-enabled database technology,known as AI4DB(Artificial Intelligence for Databases),is an active research area attracting significant attention and innovation.This survey first introduces the background of learning-based database techniques.It then reviews advanced query optimization methods for learning databases,focusing on four popular directions:cardinality/cost estimation,learningbased join order selection,learning-based end-to-end optimizers,and text-to-SQL models.Cardinality/cost estimation is classified into supervised and unsupervised methods based on learning models,with illustrative examples provided to explain the working mechanisms.Detailed descriptions of various query optimizers are also given to elucidate the working mechanisms of each component in learning query optimizers.Additionally,we discuss the challenges and development opportunities of learning query optimizers.The survey further explores text-to-SQL models,a new research area within AI4DB.Finally,we consider the future development prospects of learning databases. 展开更多
关键词 AI4DB cardinality/cost estimation join order selection end-to-end optimizer Text-to-SQL
原文传递
Intelligent Storage System of Machine Learning Model Based on Task Similarity
4
作者 Shuangshuang Cui Hongzhi Wang +1 位作者 Yuntian Xie Haiyao Gu 《国际计算机前沿大会会议论文集》 2021年第1期119-124,共6页
With the closer integration of database and machine learning, machinelearning task in database can reduce the data transmission, thus dramatically boostingthe runtime performance of the whole task. Moreover, if there ... With the closer integration of database and machine learning, machinelearning task in database can reduce the data transmission, thus dramatically boostingthe runtime performance of the whole task. Moreover, if there is a chance ofstoring machine learning models involved in similar tasks in the system intelligently,the computation resource and time cost of repeated training will be greatlyreduced. However, the intelligent storage system of machine learning model hasnot been developed yet. In order to achieve this goal, a method is proposed tomeasure the similarity of machine learning tasks. Second, the intelligent storagesystem of machine learning model was designed to manage models. Finally, itintroduced the overall architecture and key technologies of intelligent storage systemof machine learning model based on task similarity (ISSMLM), and describethree demonstration scenarios of the system. The results show the validity of theproposed method. 展开更多
关键词 db4ai Model management Task similarity
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部