期刊文献+
共找到466篇文章
< 1 2 24 >
每页显示 20 50 100
GoVector:I/O-高效的高维向量近邻查询缓存策略
1
作者 周依杰 林圣原 +4 位作者 巩树凤 余松 范书豪 张岩峰 于戈 《软件学报》 北大核心 2026年第3期1021-1036,共16页
基于图结构的高维向量索引(索引图)因其高效的近似最近邻搜索能力,已成为大规模向量检索的主流方法.索引图执行近似最近邻搜索(approximate nearest neighbor search,ANNS)的过程分为两个阶段:第1阶段从入口点出发快速定位到查询向量附... 基于图结构的高维向量索引(索引图)因其高效的近似最近邻搜索能力,已成为大规模向量检索的主流方法.索引图执行近似最近邻搜索(approximate nearest neighbor search,ANNS)的过程分为两个阶段:第1阶段从入口点出发快速定位到查询向量附近区域;第2阶段在查询向量附近搜索离其最近的k个向量.然而,由于索引图需存储大量邻接关系,导致内存开销大,因此实际部署时通常需将其存储于外存.当执行近似最近邻搜索时,按需加载索引图和向量数据会导致频繁发生I/O操作,并成为检索性能的主要瓶颈(I/O时间占90%以上).现有系统利用入口点及其附近邻居被高频访问的特性,采用静态缓存策略将入口点及其若干跳邻居预先缓存在内存中,以减少第1阶段的I/O访问.然而分析发现,第2阶段为了获取更高精度的检索结果,需访问大量与查询向量相关的图顶点,成为I/O开销的主要来源.由于第2阶段的访问顶点随查询向量动态变化,现有静态缓存策略难以有效命中,导致其在此阶段几乎失效.针对此问题,设计了一个静态-动态混合缓存策略GoVector,其核心设计体现在:(1)静态缓存区预加载入口点及其高频近邻;(2)动态缓存区自适应地缓存第2阶段中空间局部性高的顶点.为了进一步适配第2阶段中以向量相似性为导向的搜索过程,设计了基于向量空间相似性磁盘布局策略,通过重排顶点存储顺序,使相似向量在物理存储上聚集于相同或相邻磁盘页,从而显著提升数据访问的局部性.这种双重优化机制使得缓存命中率得到显著提升,有效降低了整体I/O开销.在多个公开数据集上的实验结果表明,当召回率为90%时,相较于当前最先进的基于磁盘的索引图系统,GoVector实现I/O次数平均降低46%、查询吞吐率提升1.73倍、延迟下降42%. 展开更多
关键词 高维向量 近似最近邻搜索 索引图
在线阅读 下载PDF
Multi-Class Support Vector Machine Classifier Based on Jeffries-Matusita Distance and Directed Acyclic Graph 被引量:1
2
作者 Miao Zhang Zhen-Zhou Lai +1 位作者 Dan Li Yi Shen 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2013年第5期113-118,共6页
Based on the framework of support vector machines (SVM) using one-against-one (OAO) strategy, a new multi-class kernel method based on directed aeyclie graph (DAG) and probabilistic distance is proposed to raise... Based on the framework of support vector machines (SVM) using one-against-one (OAO) strategy, a new multi-class kernel method based on directed aeyclie graph (DAG) and probabilistic distance is proposed to raise the multi-class classification accuracies. The topology structure of DAG is constructed by rearranging the nodes' sequence in the graph. DAG is equivalent to guided operating SVM on a list, and the classification performance depends on the nodes' sequence in the graph. Jeffries-Matusita distance (JMD) is introduced to estimate the separability of each class, and the implementation list is initialized with all classes organized according to certain sequence in the list. To testify the effectiveness of the proposed method, numerical analysis is conducted on UCI data and hyperspectral data. Meanwhile, comparative studies using standard OAO and DAG classification methods are also conducted and the results illustrate better performance and higher accuracy of the orooosed JMD-DAG method. 展开更多
关键词 multi-class classification support vector machine directed acyclic graph Jeffries-Matusitadistance hyperspcctral data
在线阅读 下载PDF
A Binary Vulnerability Similarity Detection Model Based on Deep Graph Matching
3
作者 Yangzhi Zhang 《Journal of Electronic Research and Application》 2025年第5期291-298,共8页
To enhance network security,this study employs a deep graph matching model for vulnerability similarity detection.The model utilizes a Word Embedding layer to vectorize data words,an Image Embedding layer to vectorize... To enhance network security,this study employs a deep graph matching model for vulnerability similarity detection.The model utilizes a Word Embedding layer to vectorize data words,an Image Embedding layer to vectorize data graphs,and an LSTM layer to extract the associations between word and graph vectors.A Dropout layer is applied to randomly deactivate neurons in the LSTM layer,while a Softmax layer maps the LSTM analysis results.Finally,a fully connected layer outputs the detection results with a dimension of 1.Experimental results demonstrate that the AUC of the deep graph matching vulnerability similarity detection model is 0.9721,indicating good stability.The similarity scores for vulnerabilities such as memory leaks,buffer overflows,and targeted attacks are close to 1,showing significant similarity.In contrast,the similarity scores for vulnerabilities like out-of-bounds memory access and logical design flaws are less than 0.4,indicating good similarity detection performance.The model’s evaluation metrics are all above 97%,with high detection accuracy,which is beneficial for improving network security. 展开更多
关键词 Network security Word vectors graph vector matrix Deep graph matching Vulnerability similarity
在线阅读 下载PDF
基于图论算法与蚁群优化支持向量机的数控机床故障智能诊断
4
作者 迟玉伦 戴顺达 朱文博 《计算机集成制造系统》 北大核心 2026年第2期706-719,共14页
针对传统数控机床故障诊断方法耗时且精度不足、无法满足快速诊断需求的问题,提出一种基于图论算法和蚁群优化支持向量机(ACO-SVM)的方法实现机床故障的快速精确诊断。首先,通过故障历史数据建立数控机床故障传播模型,利用图论算法进行... 针对传统数控机床故障诊断方法耗时且精度不足、无法满足快速诊断需求的问题,提出一种基于图论算法和蚁群优化支持向量机(ACO-SVM)的方法实现机床故障的快速精确诊断。首先,通过故障历史数据建立数控机床故障传播模型,利用图论算法进行分析,得到故障的风险影响度排序确定故障的优先级;然后,针对优先级较高的故障,利用传感器采集加工信号提取特征值构建特征向量;进一步,利用蚁群算法优化支持向量机参数,构建ACO-SVM故障诊断模型实现机床故障精确诊断;最后,通过实验对某公司轴承磨床磨削烧伤故障进行验证,结果表明:基于图论算法可对故障进行定位排序,利用ACO-SVM模型的诊断平均准确率达到99.378%,对提升数控机床故障快速维修及机床可靠性具有重要意义。 展开更多
关键词 支持向量机 图论算法 蚁群算法 故障诊断
在线阅读 下载PDF
大模型重构数字教材:图谱向量融合增强与创新应用
5
作者 詹泽慧 钟超诚 邝志杨 《广西师范大学学报(哲学社会科学版)》 2026年第2期91-102,共12页
数字教材经历了从1.0到5.0的发展演进,生成式人工智能的迅猛发展为数字教材变革带来新的技术可供性。然而,现有数字教材存在知识呈现线性化、学习支持同质化及评价反馈滞后等结构性问题。一种面向人机协同的AI数字教材开发概念框架和图... 数字教材经历了从1.0到5.0的发展演进,生成式人工智能的迅猛发展为数字教材变革带来新的技术可供性。然而,现有数字教材存在知识呈现线性化、学习支持同质化及评价反馈滞后等结构性问题。一种面向人机协同的AI数字教材开发概念框架和图谱向量融合增强的大模型嵌入式方案或能解决这一问题。该方案立足“多维表征—智能服务—协同应用”三层技术架构:在知识表征层,采用知识图谱与语义向量数据库相结合的混合表征,通过三元组抽取与向量化编码技术实现教材多模态数据融合;在智能服务层,设计基于大模型智能体的集群化服务系统,整合课程设计、学习诊断、对话引导等专业化智能体,形成模块化服务单元;在应用协同层,构建“人类主导—智能增强”的双向互动模型,提出教师与AI协同教学设计、学生与AI认知伙伴等三维应用场景。展望未来,构建教育专属大模型、重塑教材编制业态、加强人机协同伦理规制的发展路径,可为大语言模型赋能数字教材创新应用、推动教育高质量发展提供参考。 展开更多
关键词 数字教材 知识图谱 大语言模型 图谱向量融合
在线阅读 下载PDF
面向批量更新的向量索引召回率优化
6
作者 王可 胡思劼 +4 位作者 胡卉芪 赵明昊 魏星 屠要峰 周烜 《软件学报》 北大核心 2026年第3期1084-1103,共20页
近似最近邻搜索(approximate nearest neighbor search,ANNS)是支撑向量数据库、推荐系统及大语言模型等上层应用的关键技术.其中,分层可导航小世界(hierarchical navigable small world,HNSW)图索引通过构建层级化结构,迅速定位结果至... 近似最近邻搜索(approximate nearest neighbor search,ANNS)是支撑向量数据库、推荐系统及大语言模型等上层应用的关键技术.其中,分层可导航小世界(hierarchical navigable small world,HNSW)图索引通过构建层级化结构,迅速定位结果至目标区域,从而以较低的计算成本实现较高的检索召回率.然而,现有HNSW算法主要面向静态数据检索场景而设计,而忽略了数据更新对检索性能的影响.通过对现实数据集的研究发现,向量数据库中的数据通常以批量方式进行更新,其相似特性会削弱HNSW算法中启发式剪枝的有效性,并诱发相似向量连接的稀疏化问题,共同造成查询召回率的显著下降.针对上述问题,提出一种基于图结构局部调整的自适应细粒度剪枝策略,构建了融合识别与修复机制的优化方案.首先,在识别阶段,通过计算区域邻居距离量化局部拓扑密度,从而精准定位待干预的致密区域.其次,在修复阶段,针对处于致密区域的枢纽节点,采用双重剪枝的邻居选择策略:协同应用原生的与修正的启发式剪枝规则,合并两种规则的结果集以在保证检索精度的同时提升邻居连接的多样性,有效缓解过度剪枝与连接稀疏化问题.在多个公开数据集上的实验结果表明,所提方法对数据更新频繁的场景具备良好的适应性,在维持查询延迟和吞吐量稳定的前提下,实现了1%–4%的召回率提升. 展开更多
关键词 近似最近邻搜索 向量检索 图向量索引
在线阅读 下载PDF
基于层次图卷积网络的草图语义分割方法
7
作者 金佳惠 吴子朝 王毅刚 《软件工程》 2026年第1期38-43,共6页
基于图卷积的草图语义分割方法在图构建与传播过程中是扁平化的,邻域聚集的图卷积无法获得足够的全局信息。提出基于层次图卷积网络的草图语义分割方法,构建不同层次的图对节点特征传播或聚合。另外,为了缓解由于过多的图卷积模块导致... 基于图卷积的草图语义分割方法在图构建与传播过程中是扁平化的,邻域聚集的图卷积无法获得足够的全局信息。提出基于层次图卷积网络的草图语义分割方法,构建不同层次的图对节点特征传播或聚合。另外,为了缓解由于过多的图卷积模块导致训练过程过平滑的问题,引入了随机缩放特征和梯度的正则化方法。与基准的图卷积模型相比,改进的模型在Creative Setchk数据集上比次优的Sketch GNN模型,P-Metric平均高出1.42个百分点,C-Metric平均高出2.87个百分点。研究结果表明,该模型可以有效提高分割准确率。 展开更多
关键词 矢量草图 图节点分类 图神经网络 层次图卷积 语义分割
在线阅读 下载PDF
用于行人轨迹预测的多头注意力增强图网络
8
作者 张霄雁 张萌 +2 位作者 周宗润 孟祥福 方金凤 《计算机科学与探索》 北大核心 2026年第4期1134-1146,共13页
行人轨迹预测对自动驾驶与智能交通系统至关重要,其预测精度受到人类行为的高度随机性、动态交互性及多模态分布等因素的显著影响。为应对上述挑战,提出一种基于多头注意力增强图网络的行人轨迹预测框架,通过动态交互建模与多阶段优化... 行人轨迹预测对自动驾驶与智能交通系统至关重要,其预测精度受到人类行为的高度随机性、动态交互性及多模态分布等因素的显著影响。为应对上述挑战,提出一种基于多头注意力增强图网络的行人轨迹预测框架,通过动态交互建模与多阶段优化实现高精度预测。该方法以构建多关系时空图(MR-Graph)为基础,利用多头注意力机制(MHA)显式分离社交、运动与环境交互特征,从而提升了模型对复杂场景的建模能力。为进一步提高预测的多样性与合理性,设计了一种控制点驱动的高斯剪枝策略,通过混合密度网络生成多模态终点假设,并结合置信度动态剪枝机制,有效抑制了异常行为的影响。此外,轨迹优化被设计为“假设-引导-修正”三阶段轨迹优化机制,融合社交感知插值与时空修正向量场,实现了平滑且符合物理约束的高质量轨迹生成。基于ETH/UCY等公开数据集的实验结果表明,所提方法在建模复杂交互关系和生成符合社会规范的轨迹方面展现出明显优势,特别是在处理密集人群场景和突发行为预测时表现突出,为智能系统的安全决策提供了可靠的技术支持。 展开更多
关键词 多头注意力机制 控制点预测 多关系图卷积网络 轨迹优化 时空修正向量场
在线阅读 下载PDF
面向计算机网络领域的意图驱动图谱问答系统
9
作者 顾健 祁云嵩 《电子设计工程》 2026年第2期1-6,共6页
针对大语言模型在计算机网络问答中存在知识覆盖不足与术语匹配不精的问题,该文提出一种意图驱动的图谱增强问答系统。该系统通过语料分块与大模型三元组抽取构建结构化知识图谱,并结合意图识别机制,引导关键词与语义向量融合检索,动态... 针对大语言模型在计算机网络问答中存在知识覆盖不足与术语匹配不精的问题,该文提出一种意图驱动的图谱增强问答系统。该系统通过语料分块与大模型三元组抽取构建结构化知识图谱,并结合意图识别机制,引导关键词与语义向量融合检索,动态生成针对性子图及Prompt,以驱动回答的生成。结合《计算机网络》教材与RFC文档开展实验,结果显示该文方法在F1值上相较Baseline提升13.6%,相较语义RAG提升8.8%。系统在问答准确率、语义一致性与结构定位能力方面均表现出优势,特别是在多实体、多跳推理任务中展现出较高的稳定性,具备良好的专业适应性与部署可行性。 展开更多
关键词 大规模语言模型 知识图谱 语义向量检索 问答系统
在线阅读 下载PDF
GPU加速的高维向量聚类算法
10
作者 李忠根 龚盛豪 +3 位作者 于浩然 朱轶凡 柳晴 高云君 《软件学报》 北大核心 2026年第3期1037-1057,共21页
聚类是大规模高维向量数据分析的关键技术之一.近年来,基于密度的聚类算法DBSCAN(density-based spatial clustering of applications with noise)因其无须预先指定聚类数量、能够发现复杂聚类结构并有效识别噪声点的特性,在数据分析领... 聚类是大规模高维向量数据分析的关键技术之一.近年来,基于密度的聚类算法DBSCAN(density-based spatial clustering of applications with noise)因其无须预先指定聚类数量、能够发现复杂聚类结构并有效识别噪声点的特性,在数据分析领域得到了广泛应用.然而,现有的基于密度的聚类算法在处理高维向量数据时将产生极高的时间代价且面临维度灾难等问题,难以在实际场景中部署应用.此外,随着信息技术的发展,高维向量数据规模急剧增加,使用CPU进行高维向量聚类在时间代价和可扩展性等方面将面临更大的挑战.为此,提出一种GPU加速的高维向量聚类算法,通过引入K近邻(K-nearest neighbor,KNN)图索引加速DBSCAN的计算.首先,设计了GPU加速的并行K近邻图构建算法,显著降低了K近邻图索引的构建开销.其次,提出了基于层间并行的K-means树分区算法及基于广度优先搜索和核心近邻图的并行聚类算法,改进了DBSCAN算法的计算流程,实现了高并发向量聚类.最后,在真实向量数据集上进行了大量实验,并将所提出的方法与现有方法进行了性能对比.实验结果表明,所提方法在保证聚类精度的前提下,将大规模向量聚类的效率提高了5.7–2822.5倍. 展开更多
关键词 基于密度的聚类 高维向量 GPU加速 并行计算 K近邻图
在线阅读 下载PDF
A Fast Algorithm for Support Vector Clustering
11
作者 吕常魁 姜澄宇 王宁生 《Journal of Southwest Jiaotong University(English Edition)》 2004年第2期136-140,共5页
Support Vector Clustering (SVC) is a kernel-based unsupervised learning clustering method. The main drawback of SVC is its high computational complexity in getting the adjacency matrix describing the connectivity for ... Support Vector Clustering (SVC) is a kernel-based unsupervised learning clustering method. The main drawback of SVC is its high computational complexity in getting the adjacency matrix describing the connectivity for each pairs of points. Based on the proximity graph model [3], the Euclidean distance in Hilbert space is calculated using a Gaussian kernel, which is the right criterion to generate a minimum spanning tree using Kruskal's algorithm. Then the connectivity estimation is lowered by only checking the linkages between the edges that construct the main stem of the MST (Minimum Spanning Tree), in which the non-compatibility degree is originally defined to support the edge selection during linkage estimations. This new approach is experimentally analyzed. The results show that the revised algorithm has a better performance than the proximity graph model with faster speed, optimized clustering quality and strong ability to noise suppression, which makes SVC scalable to large data sets. 展开更多
关键词 Support vector machines Support vector clustering Proximity graph Minimum spanning tree
在线阅读 下载PDF
一种基于图结构的相似图书内容推荐方法
12
作者 王莉军 王淑君 高影繁 《情报科学》 北大核心 2025年第5期199-205,共7页
【目的/意义】利用图书文本内容实现相似图书推荐,海量图书数据环境下提高图书相似度计算效率。【方法/过程】构建了一种基于图结构的相似图书内容推荐方法,在图书的文本内容进行短语抽取后计算短语网络中的TextRank值获得图书关键词,... 【目的/意义】利用图书文本内容实现相似图书推荐,海量图书数据环境下提高图书相似度计算效率。【方法/过程】构建了一种基于图结构的相似图书内容推荐方法,在图书的文本内容进行短语抽取后计算短语网络中的TextRank值获得图书关键词,进而建立图书向量并结合层次可导航小世界算法(Hierarchcal Navigable Small World,HNSW)得到目标图书和推荐图书之间的相似度。【结果/结论】利用基于内容的相似图书推荐方法得到的用户评价平均准确率达到0.807,客观平均准确率显著高于TF-IDF和TextRank的文本表示方法,可以实现较好的图书推荐效果,HNSW算法将计算效率缩小到对数级别,对大数据环境下的相似图书计算效率起到一定的优化作用。【创新/局限】本研究创新性地结合图结构和HNSW算法提高了图书推荐的准确性和计算效率,但受限于对腾讯词典的依赖,影响了向量表达的普适性和跨语言适应性。 展开更多
关键词 图书文本向量 图结构 HNSW Word2vec 图书推荐
原文传递
一种向量索引支持的时态知识图谱高效搜索方法
13
作者 朱红 胡新雨 +3 位作者 高莉莎 张强 徐晓轶 朱盟盟 《计算机技术与发展》 2025年第2期138-145,共8页
知识图谱嵌入(Knowledge Graph Embedding,KGE)将实体和关系表示为低维、连续的向量,使机器学习模型能够轻松适应知识图谱(Knowledge Graph,KG)的搜索任务。然而,在大规模知识库(Knowledge Base,KB)的搜索密集型应用中,现有的模型大多... 知识图谱嵌入(Knowledge Graph Embedding,KGE)将实体和关系表示为低维、连续的向量,使机器学习模型能够轻松适应知识图谱(Knowledge Graph,KG)的搜索任务。然而,在大规模知识库(Knowledge Base,KB)的搜索密集型应用中,现有的模型大多侧重于提高在静态KG上搜索的准确性,忽略了在动态时态知识图谱(Temporal Knowledge Graph,TKG)上搜索的时间效率。为此,提出了一种向量索引支持的TKG高效搜索方法,以提高在TKG上的搜索效率。具体来说,首先,将实体,关系和时间信息映射到向量空间,并利用长短期记忆神经网络(Long Short-Term Memory,LSTM)学习关系类型的时间感知,从而建立了具有时间信息感知与关系联合编码的TKG向量库。然后,利用向量数据库建立大规模TKG的向量索引库(IndexIVFFlat)。注意,该索引通过聚类操作来划分搜索空间,以提高知识的搜索效率。最后,在拥有高效索引的TKG上通过相似度计算执行近似性搜索与实验评估。结果显示,该方法在时间效率上优于未建立索引的方法,且在搜索准确度上优于一些强相关的方法。表明,该向量索引库的建立在保证了搜索准确性的前提下提高了在TKG上的搜索效率。 展开更多
关键词 知识图谱嵌入 时态知识图谱 索引 搜索 向量数据库 机器学习
在线阅读 下载PDF
多尺度特征融合和随机森林优化的点云分类
14
作者 张坤祥 夏永华 +2 位作者 伍福万 王帅 刘瑜安 《应用激光》 北大核心 2025年第11期196-205,共10页
针对现实场景复杂空间导致的点云地物分类精度低的问题,提出一种耦合多尺度特征和随机森林模型优化的三维点云分类方法。该方法首先基于水平格网化对地物点进行归一化处理,选取多维特征向量并使用随机森林模型获取地物点的初始分类,然... 针对现实场景复杂空间导致的点云地物分类精度低的问题,提出一种耦合多尺度特征和随机森林模型优化的三维点云分类方法。该方法首先基于水平格网化对地物点进行归一化处理,选取多维特征向量并使用随机森林模型获取地物点的初始分类,然后采用最大流/最小割算法寻求图割能量模型最优超参数,优化识别点云各地物分类边界,实现复杂区域点云数据的多元精准分类。实验表明:相比传统随机森林算法,研究提出的点云分类方法更为优异,总体分类精度和Kappa系数分别为90.06%和86.5%,具有良好的点云地物分类效果,在处理复杂点云数据时表现更为准确、可靠。 展开更多
关键词 地物点 三维点云 水平格网 特征向量 随机森林 图割
原文传递
基于知识图谱的电子产品调试工艺路线推荐方法研究 被引量:1
15
作者 肖武龙 王燕君 +4 位作者 肖勇 张世龙 代尹翘 翟雅徽 熊鹰 《现代电子技术》 北大核心 2025年第8期13-18,共6页
电子产品的调试步骤繁多,导致不同产品的调试工艺路线设计复杂,且工艺路线的确定本身具有极强的经验性和复杂性。为实现电子产品调试工艺路线的快速、规范、便捷化设计,提出一种基于知识图谱的电子产品调试工艺路线推荐方法。首先,通过... 电子产品的调试步骤繁多,导致不同产品的调试工艺路线设计复杂,且工艺路线的确定本身具有极强的经验性和复杂性。为实现电子产品调试工艺路线的快速、规范、便捷化设计,提出一种基于知识图谱的电子产品调试工艺路线推荐方法。首先,通过分层规划构建了电子产品模型和调试工艺路线模型,定义两者之间的属性关系,完成本体模型构建;然后,使用TranSparse模型获取知识图谱中的全部实体和关系,并进行低维向量表示,由此进行知识推理,得到定性的调试工艺路线,同时计算属性之间的语义相似度,得到更准确的推荐模型;最后,以某一电子产品为实例,验证所提方法的研究思路及相关算法的合理性和科学性,可应用在工艺知识残缺的情况下,电子产品调试领域工艺路线的快速设计。 展开更多
关键词 电子产品 工艺路线 知识图谱 本体构建 低维向量 语义相似度
在线阅读 下载PDF
基于知识图谱的城轨大模型RAG检索增强知识库构建研究 被引量:12
16
作者 于松伟 刘巍 +3 位作者 夏秀江 邵昕 韩德志 韩晓艺 《都市快轨交通》 北大核心 2025年第2期1-7,共7页
当前,数据是城轨大模型落地的关键和核心养料,检索增强生成(retrieval-augmented generation,RAG)技术是城轨行业大模型建设和解决大模型幻觉问题的重要手段之一,但却因行业知识库的缺失难以充分发挥效用。本研究通过实体分类表、术语... 当前,数据是城轨大模型落地的关键和核心养料,检索增强生成(retrieval-augmented generation,RAG)技术是城轨行业大模型建设和解决大模型幻觉问题的重要手段之一,但却因行业知识库的缺失难以充分发挥效用。本研究通过实体分类表、术语词典、属性库、实体关系表,创建分类骨架-语义基准-特征规则-逻辑关系四维架构,尤其新增实体的行业属性,突破传统知识图谱的实体A-关系-实体B三元组架构,从而形成标准化与立体化的行业知识体系。基于此构建的高质量行业知识库作为RAG技术的核心组件,通过数据采集→结构化→向量化→知识化的链路,为大模型提供标准、可信、可溯的领域知识,显著提升城轨大模型生成内容的的可靠性和专业性,为城轨行业迈向数据驱动与知识驱动的新阶段提供核心支撑。 展开更多
关键词 城市轨道交通 人工智能 大模型 DeepSeek RAG 知识库 知识图谱 向量数据库 数据标注
在线阅读 下载PDF
结合向量匹配的图数据库智能问答智能体设计与实现
17
作者 周学文 王俊强 江荣 《信息与电脑》 2025年第23期51-53,共3页
在自然语言交互日益普及的背景下,知识图谱问答系统常因用户表达的口语化、别名使用或语义模糊,导致实体匹配失效,进而影响查询准确性。文章提出了一种融合大语言模型、语义向量匹配与图数据库的智能问答系统,通过语义嵌入实现柔性实体... 在自然语言交互日益普及的背景下,知识图谱问答系统常因用户表达的口语化、别名使用或语义模糊,导致实体匹配失效,进而影响查询准确性。文章提出了一种融合大语言模型、语义向量匹配与图数据库的智能问答系统,通过语义嵌入实现柔性实体对齐,并结合ReAct智能体框架构建“思考—执行—反馈”闭环,支持动态意图解析与工具调用。案例分析表明,该系统能准确理解自然语言模糊查询,自动映射实体并生成结果,验证了语义对齐与自主决策机制的有效性。 展开更多
关键词 向量匹配 图数据库 智能问答 ReAct框架 语义嵌入 大语言模型
在线阅读 下载PDF
基于成对关系向量卷积的知识图谱补全研究
18
作者 张宇晨 朱晓旭 李培峰 《计算机科学与探索》 北大核心 2025年第10期2782-2792,共11页
知识图谱补全旨在依据知识图谱中已知三元组推理出缺失的三元组,以解决知识图谱的不完整性问题。现有方法大多将实体和关系直接融合提取特征,忽略了三元组中之间的共性特征和具体属性。为此,提出了一种基于成对关系向量的卷积神经网络模... 知识图谱补全旨在依据知识图谱中已知三元组推理出缺失的三元组,以解决知识图谱的不完整性问题。现有方法大多将实体和关系直接融合提取特征,忽略了三元组中之间的共性特征和具体属性。为此,提出了一种基于成对关系向量的卷积神经网络模型ConvPair,通过成对关系建模、特征融合优化和关系感知卷积操作,提升知识图谱补全的链接预测性能。ConvPair模型的核心思想是将关系r拆分为头关系rh和尾关系rt,rh与头实体h融合后,通过共性特征编码模块得到共性特征实体f。接着,f与rt进行融合,通过具体属性提取模块来预测尾实体t。在实体与关系的融合方面,对h和rh的向量表示进行棋盘重塑操作,以充分融合特征;同时,直接拼接f和rt的向量表示,保留在提取具体属性时的三元组翻译特性。最后,设计关系感知卷积核,有效处理了复杂关系并提取关系的特定特征。实验结果表明,ConvPair在FB15k-237、WN18RR、YAGO3-10等数据集上优于现有先进模型,展现了卓越的性能和泛化能力。 展开更多
关键词 知识图谱补全 成对关系向量 卷积神经网络 链接预测
在线阅读 下载PDF
基于大语言模型的企业异构数据融合查询 被引量:1
19
作者 吴春龙 汪敏 陈智超 《科技创新与应用》 2025年第10期1-5,共5页
大语言模型在智能问答、文本生成、语言翻译、辅助编程等创造性的场景应用十分广泛,但是在需求精确性的场景下应用却受到诸多限制。该文主要研究采用大语言模型,在知识图谱和向量知识库的加持下,结合Prompt提示工程、微调、LangChain等... 大语言模型在智能问答、文本生成、语言翻译、辅助编程等创造性的场景应用十分广泛,但是在需求精确性的场景下应用却受到诸多限制。该文主要研究采用大语言模型,在知识图谱和向量知识库的加持下,结合Prompt提示工程、微调、LangChain等技术,融合结构化数据和非结构化数据,实现在限定知识范围内的精确查询,探索大语言模型应用的新方式。 展开更多
关键词 大语言模型 异构数据 知识图谱 向量知识库 融合查询
在线阅读 下载PDF
基于几类包含关系构造距离半正则图
20
作者 贾冬冬 刘鸣 张更生 《河北师范大学学报(自然科学版)》 2025年第6期552-559,共8页
距离半正则图是距离正则图的一类推广,具有一定的正则性和对称性.具有二分类P∪L的连通二部图称为关于P的距离半正则图,如果对于任意一对距离为i的顶点x∈P和y∈P∪L,与x的距离分别为i-1和i的y的邻近点的个数都只跟i有关系,与顶点x和y... 距离半正则图是距离正则图的一类推广,具有一定的正则性和对称性.具有二分类P∪L的连通二部图称为关于P的距离半正则图,如果对于任意一对距离为i的顶点x∈P和y∈P∪L,与x的距离分别为i-1和i的y的邻近点的个数都只跟i有关系,与顶点x和y的选取无关.分别利用向量空间,辛空间以及横截设计等构型中2类组合对象间的包含关系定义关联关系构造出距离半正则图,给出图的参数,并给出这些距离半正则图是距离双正则图的条件. 展开更多
关键词 二部图 距离双正则图 向量空间 全迷向子空间 横截设计
在线阅读 下载PDF
上一页 1 2 24 下一页 到第
使用帮助 返回顶部