期刊文献+
共找到93篇文章
< 1 2 5 >
每页显示 20 50 100
A graph-based sliding window multi-join over data stream 被引量:1
1
作者 ZHANG Liang Byeong-Seob You +2 位作者 GE Jun-wei LIU Zhao-hong Hae-Young Bae 《重庆邮电大学学报(自然科学版)》 2007年第3期362-366,共5页
Join operation is a critical problem when dealing with sliding window over data streams. There have been many optimization strategies for sliding window join in the literature, but a simple heuristic is always used fo... Join operation is a critical problem when dealing with sliding window over data streams. There have been many optimization strategies for sliding window join in the literature, but a simple heuristic is always used for selecting the join sequence of many sliding windows, which is ineffectively. The graph-based approach is proposed to process the problem. The sliding window join model is introduced primarily. In this model vertex represent join operator and edge indicated the join relationship among sliding windows. Vertex weight and edge weight represent the cost of join and the reciprocity of join operators respectively. Then good query plan with minimal cost can be found in the model. Thus a complete join algorithm combining setting up model, finding optimal query plan and executing query plan is shown. Experiments show that the graph-based approach is feasible and can work better in above environment. 展开更多
关键词 数据流 查询优化 图论 可调整窗口
在线阅读 下载PDF
结合对比学习和双流网络融合知识图谱摘要模型 被引量:3
2
作者 赵霞 王钊 《计算机应用研究》 北大核心 2025年第3期720-727,共8页
提出了一种融合对比学习与双流网络的新型知识图谱摘要模型(KGDR-CLSUM),旨在解决现有模型在生成摘要时存在的事实性错误和信息提取不足的问题。该模型通过设计双流网络同时处理文本特征和知识图谱特征,并采用对比学习来强化这两类特征... 提出了一种融合对比学习与双流网络的新型知识图谱摘要模型(KGDR-CLSUM),旨在解决现有模型在生成摘要时存在的事实性错误和信息提取不足的问题。该模型通过设计双流网络同时处理文本特征和知识图谱特征,并采用对比学习来强化这两类特征的有效融合。此外,引入动量蒸馏策略以降低知识图谱中的数据噪声,从而提升摘要生成的质量和准确性。在CNN/Daily Mail数据集上,KGDR-CLSUM相较于基线模型PEGASUS BASE,在ROUGE-1、ROUGE-2和ROUGE-L指标上分别提升了3.03%、3.42%和2.56%,在XSum数据集上更是达到了7.54%、8.78%和8.51%的显著提升。此外,人工评分显著高于ChatGPT,进一步证明了该模型的优越性能。结果表明,KGDR-CLSUM在生成摘要时,尤其在短文本生成任务中,能够有效降低错误信息,并显著提高摘要的质量。 展开更多
关键词 文本摘要 知识图谱 动量蒸馏 对比学习 双流网络
在线阅读 下载PDF
Theoretical design for a class of chaotic stream cipher based on nonlinear coupled feedback
3
作者 HuGuojie WangLin FengZhengjin 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2005年第1期155-159,共5页
A class of chaotic map called piecewise-quadratic-equation map to design feedback stream cipher is proposed. Such map can generate chaotic signals that have uniform distribution function, δ-like autocorrelation funct... A class of chaotic map called piecewise-quadratic-equation map to design feedback stream cipher is proposed. Such map can generate chaotic signals that have uniform distribution function, δ-like autocorrelation function. Compared with the piecewise-linear map, this map provides enhanced security in that they can maintain the original perfect statistical properties, as well as overcome the defect of piecewise-linearity and expand the key space. This paper presents a scheme to improve the local complexity of the chaotic stream cipher based on the piecewise-quadratic-equationmap. Both the theoretic analysis and the results of simulation show that this scheme improves the microstructure of the phase-space graph on condition that the good properties of the original scheme are remained. 展开更多
关键词 CHAOS stream cipher nonlinear-coupled feedback phase-space graph.
在线阅读 下载PDF
随时间持续演化的流图神经网络
4
作者 郭虎升 张旭飞 +1 位作者 孙玉杰 王文剑 《计算机科学》 北大核心 2025年第8期118-126,共9页
流图在现实应用中广泛存在,其节点特征和结构特征会随时间推移而动态变化。尽管图神经网络在静态图节点分类中表现卓越,但其难以直接应用于流图,流图的持续演化会导致信息滞后和遗漏问题,所以模型难以准确提取流图特征。针对上述挑战,... 流图在现实应用中广泛存在,其节点特征和结构特征会随时间推移而动态变化。尽管图神经网络在静态图节点分类中表现卓越,但其难以直接应用于流图,流图的持续演化会导致信息滞后和遗漏问题,所以模型难以准确提取流图特征。针对上述挑战,提出了一种随时间持续演化的流图神经网络(Continuously Evolution Streaming Graph Neural Network,CESGNN),以解决流图节点分类问题。该方法首先通过持续更新的图卷积网络(Continuous Updates Graph Convolutional Network,CU-GCN)增量地更新参数,以适应流图节点特征的变化,缓解信息滞后问题,然后自适应扩展的图神经网络(Adaptive Deepening Graph Neural Network,AD-GNN)通过将聚合和更新操作解耦,以挖掘流图深层特征,从而缓解信息遗漏问题。CESGNN通过有机地融合原始特征、CU-GCN提取的浅层特征和AD-GNN提取的深层特征,获得更准确、全面的流图特征表示。实验结果表明,CESGNN模型对流图具有良好的适应性和稳定性,提高了流图节点分类的准确率。 展开更多
关键词 流图 图神经网络 增量更新 聚合与更新解耦 特征融合
在线阅读 下载PDF
持续记忆的流图神经网络
5
作者 郭虎升 孙玉杰 王文剑 《小型微型计算机系统》 北大核心 2025年第4期818-824,共7页
流图的节点和边以流的形式持续产生,导致整个图结构随着时间推移而不断演化.图神经网络作为图嵌入技术的一种,在捕获流图的动态信息以及快速适应流图持续演化等方面仍然面临着巨大的挑战.为解决这些问题,本文提出了持续记忆的流图神经网... 流图的节点和边以流的形式持续产生,导致整个图结构随着时间推移而不断演化.图神经网络作为图嵌入技术的一种,在捕获流图的动态信息以及快速适应流图持续演化等方面仍然面临着巨大的挑战.为解决这些问题,本文提出了持续记忆的流图神经网络(CMSGNN).该模型能够根据流图持续的演化充分学习历史信息,通过增量学习的方式更新已记忆的历史信息,并且能够自适应地调整模型以适应流图的变化程度,以获得更符合当前信息的流图嵌入.该模型将历史信息与当前信息相结合使得模型能够获得更准确的流图嵌入,从而提高下游任务的准确率.实验结果表明,本文提出的CMSGNN在现实生活中的多个数据集上执行多个任务上均有更好的性能. 展开更多
关键词 流图 图神经网络 历史信息 增量更新 当前信息 自适应聚合
在线阅读 下载PDF
融合局部感知增强的投篮上肢动作分解与高精度识别算法
6
作者 任宇飞 刘海林 《现代电子技术》 北大核心 2025年第18期119-124,共6页
为解决传统动作识别算法在处理篮球训练图像时存在的关节遮挡、感受野过大等问题,提出一种融合局部感知增强的高精度上肢动作分解识别模型。该模型通过轻量级HRNet分支提取人体全局结构特征,结合双流金字塔模块增强局部关节感知能力。... 为解决传统动作识别算法在处理篮球训练图像时存在的关节遮挡、感受野过大等问题,提出一种融合局部感知增强的高精度上肢动作分解识别模型。该模型通过轻量级HRNet分支提取人体全局结构特征,结合双流金字塔模块增强局部关节感知能力。空间流采用空洞卷积扩大手部感受野,时间流利用光流捕捉球员上肢的相对运动情况,显著提升了遮挡场景下的手部定位精度。同时,模型中还设计了时空分解模块进行空间与时序特征分析,强制网络聚焦并学习帧间的运动一致性,使数据处理的过程更具鲁棒性。最后引入自适应加权单元,最终输出高精度的关节点坐标。实验测试结果表明:所提模型的mAP@0.5达到86.9%,动作分类的F1值为95.3%,均优于目前的主流算法;且关键帧检出率为91.1%,帧率达到47 f/s,实时性良好,充分证明了该模型能够为篮球训练与赛事智能化分析提供可靠的技术手段。 展开更多
关键词 HRNet模型 双流金字塔 图卷积网络 时间卷积网络 人体动作识别 图像分析
在线阅读 下载PDF
高精度滑动窗口模型下的图流三角形近似计数算法
7
作者 苟向阳 邹磊 于旭 《软件学报》 北大核心 2025年第9期4349-4372,共24页
近年来,图流分析在研究领域和工业领域都变得愈发重要.图流是从数据源持续高速到达的边序列,这些边组成了一个不断变化的动态图.在图流上可以进行多种不同的分析,而三角形计数是其中最基础的操作之一.由于图流数据规模大,更新速度高,在... 近年来,图流分析在研究领域和工业领域都变得愈发重要.图流是从数据源持续高速到达的边序列,这些边组成了一个不断变化的动态图.在图流上可以进行多种不同的分析,而三角形计数是其中最基础的操作之一.由于图流数据规模大,更新速度高,在图流上进行精确三角形计数效率较低,而且并不必要.因为大部分三角形计数应用都允许一定的误差,所以,图流上的近似三角形计数一直都是研究热点之一.研究基于采样的滑动窗口模型下的图流近似三角形计数.滑动窗口模型只关注最近到达的图流数据,较早的图流数据被认定为过期.它被广泛应用于不同的工业场景和研究工作中.将一种“采样前计数”的方法与该问题场景下最新的算法结合,并提出一套策略以应对由于边过期产生的困难.使用真实数据集展开广泛的实验以测试提出的CBS算法.实验结果表明,CBS相比目前最好的工作,估算误差降低了70%以上. 展开更多
关键词 图流 三角形计数 近似算法
在线阅读 下载PDF
一种带缓冲区的分布式流式图划分算法
8
作者 史惠康 王泽胜 +2 位作者 胡克坤 董刚 赵有健 《计算机研究与发展》 北大核心 2025年第7期1805-1815,共11页
图划分是大图并行处理关键技术之一.现有图划分算法存在划分质量和效率难以平衡的问题,主要体现在离线划分算法划分质量高但耗时长;在线(也称流式)划分算法相对高效但划分质量不理想.为此,提出一种带缓冲区的分布式流式划分算法.该算法... 图划分是大图并行处理关键技术之一.现有图划分算法存在划分质量和效率难以平衡的问题,主要体现在离线划分算法划分质量高但耗时长;在线(也称流式)划分算法相对高效但划分质量不理想.为此,提出一种带缓冲区的分布式流式划分算法.该算法采用多加载器-多划分器架构,多个加载器并行读取图数据,提高图数据加载效率;每个划分器维护一个缓冲区,缓存相应加载器发来的图顶点,并按顶点度数高低排序,为划分器提供更多决策依据.划分器预置有4条流式启发式规则,围绕不同目标,对缓冲区中的顶点实施并行划分,并借助重流机制微调划分结果,改进划分质量.分布式系统环境下的划分质量与性能实验表明:提出算法的划分质量(割边比)比当前最好的在线划分算法改善超过18.8个百分点,并将图数据加载时间在划分总时间的占比,从单划分器-单加载器架构流式划分算法的平均30.8%缩减至平均20.1%. 展开更多
关键词 大图 流式划分 分布式 缓冲 重流
在线阅读 下载PDF
面向周期边查询的高效图流概要技术
9
作者 李卓 刘帅君 刘开华 《浙江大学学报(工学版)》 北大核心 2025年第1期70-78,共9页
当前图流概要技术不能在小内存下实现高效准确的图流测量,也无法完成周期边查询,为此提出面向周期边查询的图流概要技术——周期交互矩阵(PIM).PIM为混合结构,由存储重边的二维邻接矩阵和存储轻边的三维邻接矩阵组成,提高了内存效率.二... 当前图流概要技术不能在小内存下实现高效准确的图流测量,也无法完成周期边查询,为此提出面向周期边查询的图流概要技术——周期交互矩阵(PIM).PIM为混合结构,由存储重边的二维邻接矩阵和存储轻边的三维邻接矩阵组成,提高了内存效率.二维邻接矩阵保留重边标识、权重和时间戳,实时完成包括周期边查询在内的多种查询任务.设计基于权重和时间的替换策略,使用共享哈希技术以提高查询精度和插入查询效率.实验结果表明,PIM在小内存下实时高效地完成了多种图流查询任务,能够准确地召回所有频繁边、频繁点和周期边.对比当前图流概要技术,PIM将查询任务的平均相对误差降低了91.41%~99.54%. 展开更多
关键词 图流 图流概要 周期边测量 实时查询 邻接矩阵
在线阅读 下载PDF
时序图流上的快速子图近似计数算法
10
作者 王晶晶 王延昊 +2 位作者 姜文君 曾一夫 祝团飞 《计算机研究与发展》 北大核心 2025年第3期709-719,共11页
图数据中包含丰富的时间信息,其拓扑结构随时间动态演变,通常建模为时序图流.时序图流由一组节点和一系列带时间戳的有向边组成,节点、时序边随时间动态增加.其中时序子图是由传统子图模式推广而来,不仅考虑拓扑结构,同时将时序边的顺... 图数据中包含丰富的时间信息,其拓扑结构随时间动态演变,通常建模为时序图流.时序图流由一组节点和一系列带时间戳的有向边组成,节点、时序边随时间动态增加.其中时序子图是由传统子图模式推广而来,不仅考虑拓扑结构,同时将时序边的顺序和持续时间纳入考量.在时序图流中计算时序子图的出现次数是时序图研究中的一个基础问题.然而,传统流式子图计数方法不支持时序匹配,仅适用于不包含时间信息的简单无向图或有向图;并且,现有时序子图计数算法在不断产生新数据的时序图流场景下效率不高.因此,对时序图流上时序子图近似计数问题进行了研究,提出了基于蓄水池采样的流式边采样(streaming edge sampling, SES)算法,并从期望、方差、时间复杂度3个方面对SES算法进行了理论分析.最后,在4个真实数据集上进行了大量实验.实验结果表明,与基线方法相比,SES虽然返回的计数相对误差略大,但计算效率取得了最高3个数量级的大幅提升. 展开更多
关键词 时序子图 子图计数 时序图流 随机采样 图算法
在线阅读 下载PDF
基于多尺度可变形图卷积的双人交互行为识别
11
作者 王丽 曹江涛 +1 位作者 谢帅 姬晓飞 《电子测量与仪器学报》 北大核心 2025年第10期61-69,共9页
基于骨架序列数据的双人交互行为识别具有广阔的应用前景,针对目前识别模型中存在双人交互特征表示不充分、动作类内特征表示冗余等问题,提出了一种基于多尺度可变形图卷积网络(multi-scale deformable graph convolutional network, MD... 基于骨架序列数据的双人交互行为识别具有广阔的应用前景,针对目前识别模型中存在双人交互特征表示不充分、动作类内特征表示冗余等问题,提出了一种基于多尺度可变形图卷积网络(multi-scale deformable graph convolutional network, MD-GCN)的双人交互行为识别方法。首先,构建双人交互超图,包括双人超图以及双人交互关系矩阵。与传统图不同,该超图能够更好地表达两人之间的交互关系,充分捕捉双人之间的交互特征。其次,将3流输入分支分别进行数据预处理和特征提取,然后将这些特征信息融合后送入以多尺度可变形图卷积网络为主的主分支中,最后进行动作分类。该网络能够多模态地学习可变形的采样位置,捕捉具有显著交互特征的关键信息,有效避免了特征冗余以及信息丢失。所提出的MD-GCN,在NTU RGB+D 60和NTU RGB+D 120数据集中的26类交互动作的识别任务中,准确率最高达到98.41%,有效地解决了双人交互行为识别中特征表示的挑战。实验结果表明,该方法在保持识别准确率的同时,显著减小了模型运算成本,模型推理性能达到了良好的平衡,具有较高的应用价值。 展开更多
关键词 交互行为识别 骨架序列 图卷积 可变形卷积 多流输入
原文传递
基于图结构的概念漂移检测
12
作者 周彦冰 马士伦 文益民 《山东大学学报(工学版)》 北大核心 2025年第2期88-96,共9页
为了解决传统的概念漂移检测方法,仅依赖错误率进行漂移检测不可靠的问题,提出一种基于图结构的概念漂移检测方法。该方法使用k关联最优图表示当前数据分布,定义样本的漂移率表示分类器与当前数据分布的不一致性,利用漂移率形成比特流,... 为了解决传统的概念漂移检测方法,仅依赖错误率进行漂移检测不可靠的问题,提出一种基于图结构的概念漂移检测方法。该方法使用k关联最优图表示当前数据分布,定义样本的漂移率表示分类器与当前数据分布的不一致性,利用漂移率形成比特流,使用概念漂移检测器在比特流上检测概念漂移。通过与传统的使用错误率的概念漂移检测方法的对比和分析,结果表明在人工数据集上基分类器的准确率提高1%~5%,在真实数据集上提高1%~2%。所提出的方法有效提高概念漂移检测的准确性,帮助基分类器更好适应概念漂移。 展开更多
关键词 数据挖掘 数据流 概念漂移 图结构 k关联最优图
原文传递
面向复杂环境的人机协作装配意图识别方法
13
作者 何家威 张朝阳 +2 位作者 叶子健 史天佑 郑坤明 《西安交通大学学报》 北大核心 2025年第12期44-57,共14页
针对复杂环境中人机协作装配系统存在的识别装配动作准确率较低、动作相似度高时无法准确感知装配者意图,以及由此导致的机器人配合操作者的装配效率较低的问题,从装配动作信息和装配零件信息之间的联系出发,建立了面向复杂环境的人机... 针对复杂环境中人机协作装配系统存在的识别装配动作准确率较低、动作相似度高时无法准确感知装配者意图,以及由此导致的机器人配合操作者的装配效率较低的问题,从装配动作信息和装配零件信息之间的联系出发,建立了面向复杂环境的人机协作装配意图识别融合模型。基于骨架特征,采用双流自适应图卷积神经网络(2S-AGCN)模型针对装配进行动作识别;提出改进的YOLOV8模型,以提高装配零件在无序和遮挡环境下的识别准确率;结合当前装配任务,设计了包含装配动作和装配零件信息的装配推理规则,规划装配顺序。在装配动作数据集以及装配泵体零件数据集上对所提方法进行了验证。实验结果表明:交并比为0.50~0.95时,YOLOV8模型对零件识别的平均准确率达到88.361%;所提出的融合模型对于操作者装配意图的识别准确率达到96.66%,验证了人机协作系统识别操作者装配意图的可行性和有效性。将装配动作信息与装配零件信息相结合,有助于在复杂的人机协作环境中准确地识别出操作者的装配意图。 展开更多
关键词 人机协作 动作识别 双流自适应图卷积神经网络 YOLOV8模型 意图识别融合模型
在线阅读 下载PDF
直播电商供应链渠道冲突分析及关键因素识别
14
作者 张智超 陈璐 魏玉环 《宜宾学院学报》 2025年第6期15-23,共9页
为解决直播电商供应链中普遍存在的冲突问题,基于冲突分析图模型(GMCR)研究框架,应用大数据技术处理客观数据,通过分析直播电商模式下商品评价信息数据来识别冲突主体、冲突策略及其策略偏好信息,构建多个决策主体参与的冲突分析模型.... 为解决直播电商供应链中普遍存在的冲突问题,基于冲突分析图模型(GMCR)研究框架,应用大数据技术处理客观数据,通过分析直播电商模式下商品评价信息数据来识别冲突主体、冲突策略及其策略偏好信息,构建多个决策主体参与的冲突分析模型.将大数据技术分析得出的结果引入决策主体的偏好声明中,对偏好信息进一步分析,给出决策主体及其策略间的相互关系;基于冲突分析图模型4种稳定性概念,分析冲突的稳定性结果,解析出有利于各个决策主体策略的行为选择;利用构建的模型进一步分析直播电商渠道冲突主体能够达到的均衡解,从而得到适合决策主体在冲突状态下的有效解决方案. 展开更多
关键词 直播电商 渠道冲突 大数据 冲突分析图模型 稳定性分析
在线阅读 下载PDF
新型数据管理系统研究进展与趋势 被引量:35
15
作者 崔斌 高军 +3 位作者 童咏昕 许建秋 张东祥 邹磊 《软件学报》 EI CSCD 北大核心 2019年第1期164-193,共30页
随着各类新型计算技术和新兴应用领域的浮现,传统数据库技术面临新的挑战,正在从适用常规应用的单一处理方法逐步转为面向各类特殊应用的多种数据处理方式.分析并展望了新型数据管理系统的研究进展和趋势,涵盖分布式数据库、图数据库、... 随着各类新型计算技术和新兴应用领域的浮现,传统数据库技术面临新的挑战,正在从适用常规应用的单一处理方法逐步转为面向各类特殊应用的多种数据处理方式.分析并展望了新型数据管理系统的研究进展和趋势,涵盖分布式数据库、图数据库、流数据库、时空数据库和众包数据库等多个领域.具体而言:分布式数据管理技术是支持可扩展的海量数据处理的关键技术;以社交网络为代表的大规模图结构数据的处理需求带来了图数据库技术的发展;流数据管理技术用来应对数据动态变化的管理需求;时空数据库主要用于支持移动对象管理;对多源、异构而且劣质数据源的集成需求催生出新型的众包数据库技术.最后讨论了新型数据库管理系统的未来发展趋势. 展开更多
关键词 分布式数据库 图数据库 流数据库 时空数据库 众包数据库
在线阅读 下载PDF
基于边图的线性流重叠社区发现算法 被引量:5
16
作者 王斌 李强 +1 位作者 盛津芳 孙泽军 《计算机工程与应用》 CSCD 北大核心 2019年第2期60-66,共7页
重叠网络的社区发现是复杂网络研究中的重要问题。为了提高网络中重叠社区发现的时间效率,提出一种基于边图的线性流重叠社区发现算法LBSA。算法首先对于边图网络中的边进行随机的依次处理,完成节点的初步社区划分,再将其中重叠小社区... 重叠网络的社区发现是复杂网络研究中的重要问题。为了提高网络中重叠社区发现的时间效率,提出一种基于边图的线性流重叠社区发现算法LBSA。算法首先对于边图网络中的边进行随机的依次处理,完成节点的初步社区划分,再将其中重叠小社区合并到相似度最大的其他大社区中得到最终的社区。通过以上步骤,算法能够以接近线性的时间复杂度得到网络的重叠结构。从最终的实验结果来看,与其他算法相比,该算法能够在更短的时间有质量地发现网络中的重叠社区。 展开更多
关键词 流式图 重叠社区发现 边聚类系数 边图 社区相似度
在线阅读 下载PDF
多源网络安全数据时序可视分析方法研究 被引量:13
17
作者 赵颖 樊晓平 +2 位作者 周芳芳 杨梦洁 黄叶子 《小型微型计算机系统》 CSCD 北大核心 2014年第4期906-910,共5页
网络安全可视化通过提供有效的信息可视化工具,提升网络安全分析师在解决网络安全问题过程中的认知能力,从而更高效地识别网络异常和分析安全趋势.堆叠流图是一种新颖的可视化技术,它优美地展示了多时间序列数据在时间线上的相互关系与... 网络安全可视化通过提供有效的信息可视化工具,提升网络安全分析师在解决网络安全问题过程中的认知能力,从而更高效地识别网络异常和分析安全趋势.堆叠流图是一种新颖的可视化技术,它优美地展示了多时间序列数据在时间线上的相互关系与发展趋势.本文将堆叠流图引入网络安全可视化中,并根据网络安全事件的多源关联性,提出了擅长多时序对比分析的堆叠流图设计方法,研究了传统堆叠流图和对比堆叠流图在实现过程中堆叠基准函数计算、曲线插值、排序和标签布局算法等问题,最后通过实验验证了基于对比堆叠流图的多源网络安全数据时序可视分析方法的有效性. 展开更多
关键词 可视化 可视分析 网络安全 堆叠流图
在线阅读 下载PDF
大规模网络安全数据协同可视分析方法研究 被引量:12
18
作者 赵颖 樊晓平 +2 位作者 周芳芳 黄伟 汤梦姣 《计算机科学与探索》 CSCD 2014年第7期848-857,共10页
网络安全可视化是近年来网络安全研究的热点,它通过提供有效的信息可视化工具,提升网络安全分析师在解决网络安全问题过程中的感知和认知能力,从而发现模式、识别异常和掌握趋势。为了应对大规模、多数据源的网络安全协同可视分析需求,... 网络安全可视化是近年来网络安全研究的热点,它通过提供有效的信息可视化工具,提升网络安全分析师在解决网络安全问题过程中的感知和认知能力,从而发现模式、识别异常和掌握趋势。为了应对大规模、多数据源的网络安全协同可视分析需求,研究了基于统一格式的事件元组和统计元组的数据融合模型,并提出了擅长事件关联分析的雷达图和擅长统计时序对比分析的对比堆叠流图的设计方法。最后使用该原型系统对2013国际可视分析挑战赛(visual analytics science and technology challenge,VAST Challenge)中网络安全数据可视分析竞赛提供的数据集进行了分析,通过实验和讨论验证了该网络安全数据协同可视分析方法的有效性。 展开更多
关键词 信息可视化 可视分析 网络安全 数据融合 堆叠流图 雷达图
在线阅读 下载PDF
基于Multi-GPU平台的大规模图数据处理 被引量:8
19
作者 张珩 张立波 武延军 《计算机研究与发展》 EI CSCD 北大核心 2018年第2期273-288,共16页
在GPU高性能节点上构建高效的大规模图数据的算法和系统已经日益成为研究热点,以GPU协处理器为计算核心不仅能够提供大规模线程的并行环境,也能提供高吞吐的内存和缓存访问机制.随着图的规模增大,相对大小局限的GPU的设备访存空间逐渐... 在GPU高性能节点上构建高效的大规模图数据的算法和系统已经日益成为研究热点,以GPU协处理器为计算核心不仅能够提供大规模线程的并行环境,也能提供高吞吐的内存和缓存访问机制.随着图的规模增大,相对大小局限的GPU的设备访存空间逐渐不能满足缓存整个图数据的应用需求,也催生了大量以单节点上外存I/O优化(out-of-core graph)为主要研究方向的大规模图数据处理系统.为了应对这一瓶颈,现有的算法和系统研究采用对图切分的压缩数据形式(即shards)用以数据传输和迭代计算.然而,这类研究扩展到Multi-GPU平台上往往性能的局限性表现在对PCI-E带宽的高依赖性,同时也由于Multi-GPU上任务负载不均衡而缺乏一定的可扩展性.为了应对上述挑战,提出并设计了基于Multi-GPU平台的支持高效、可扩展的大规模图数据处理系统GFlow.GFlow提出了全新的适用于Multi-GPU下的图数据Grid切分策略和双层滑动窗口算法,在将图的属性数据(点的状态集合、点/边权重值)缓存于各GPU设备之后,顺序加载图的拓扑结构数据(点/边集合)值各GPU中.通过双层滑动窗口,GFlow动态地加载数据分块从SSD存储至GPU设备内存,并顺序化聚合并应用处理过程中各GPU所生成的Updates.通过在9个现实图数据集上的实验结果可以看出,GFlow在Multi-GPU平台下相比其他支持外存图(out-of-core graph)处理的相关系统性能表现更为优异,对比CPU下的GraphChi和X-Stream分别提升25.6X和20.3X,对比GPU下支持外存图数据处理的GraphReduce系统单GPU提升1.3~2.5X.同时GFlow可扩展性在Multi-GPU上也表现良好. 展开更多
关键词 大规模图数据 multi-GPU 图分块 双层滑动窗口 数据传输
在线阅读 下载PDF
知识图谱划分算法研究综述 被引量:25
20
作者 王鑫 陈蔚雪 +2 位作者 杨雅君 张小旺 冯志勇 《计算机学报》 EI CSCD 北大核心 2021年第1期235-260,共26页
知识图谱是人工智能的重要基石,因其包含丰富的图结构和属性信息而受到广泛关注.知识图谱可以精确语义描述现实世界中的各种实体及其联系,其中顶点表示实体,边表示实体间的联系.知识图谱划分是大规模知识图谱分布式处理的首要工作,对知... 知识图谱是人工智能的重要基石,因其包含丰富的图结构和属性信息而受到广泛关注.知识图谱可以精确语义描述现实世界中的各种实体及其联系,其中顶点表示实体,边表示实体间的联系.知识图谱划分是大规模知识图谱分布式处理的首要工作,对知识图谱分布式存储、查询、推理和挖掘起基础支撑作用.随着知识图谱数据规模及分布式处理需求的不断增长,如何对其进行划分已成为目前知识图谱研究的热点问题.从知识图谱和图划分的定义出发,系统性地介绍当前知识图谱数据划分的各类算法,包括基本、多级、流式、分布式和其他类型图划分算法.首先,介绍4种基本图划分算法:谱划分算法、几何划分算法、分支定界算法、KL及其衍生算法,这类算法通常用于小规模图数据或作为其他划分算法的一部分;然后,介绍多级图划分算法,这类算法对图粗糙化后进行划分再投射回原始图,根据粗糙化过程分为基于匹配的算法和基于聚合的算法;其次,描述3种流式图划分算法,这类算法将顶点或边加载为序列后进行划分,包括Hash算法、贪心算法、Fennel算法,以及这3种算法的衍生算法;再次,介绍以KaPPa、JA-BE-JA和轻量级重划分为代表的分布式图划分算法及它们的衍生算法;同时,在其他类型图划分算法中,介绍近年来新兴的2种图划分算法:标签传播算法和基于查询负载的算法.通过在合成与真实知识图谱数据集上的丰富实验,比较了5类知识图谱代表性划分算法在划分效果、查询处理与图数据挖掘方面的性能差异,分析实验结果并推广到推理层面,获得了基于实验的知识图谱划分算法性能评价结论.最后,在对已有方法分析和比较的基础上,总结目前知识图谱数据划分面临的主要挑战,提出相应的研究问题,并展望未来的研究方向. 展开更多
关键词 知识图谱 图划分 多级划分 流划分 分布式
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部