-
题名一种构造QC-Tree的单阶段算法
- 1
-
-
作者
向隆刚
龚健雅
-
机构
武汉大学测绘遥感信息工程国家重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2007年第10期1865-1868,共4页
-
基金
国家"九七三"重点基础研究发展计划项目(2006CB701300)资助.
-
文摘
QC-tree是一种组织数据立方的有效数据结构,不仅可以降低数据立方的存储开销,而且能够保持数据立方的语义关系.QC-tree的原始构造算法分为两个阶段,由于涉及到临时类的生成和处理,构造性能很低.为此,本文研究了QC-tree结构,导出了两个关于事实表划分和前缀路径的重要定理,在此基础上提出了构造QC-tree的单阶段算法,即OPA算法.实验和分析表明,OPA算法的构造效率远远优于原始构造算法.此外,OPA算法大大降低了对于工作内存的需求.
-
关键词
数据立方
QC-tree
划分
前缀路径
-
Keywords
data cube
QC-tree
partition
prefix-path
-
分类号
TP311.131
[自动化与计算机技术—计算机软件与理论]
-
-
题名热点词汇的最长时间区间查询算法
被引量:2
- 2
-
-
作者
路畅
何震瀛
荆一楠
王晓阳
-
机构
复旦大学计算机科学技术学院
上海市数据科学重点实验室(复旦大学)
上海智能电子与系统研究院
-
出处
《计算机应用与软件》
北大核心
2019年第8期249-254,305,共7页
-
基金
国家重点研发计划项目(2018YFB1004404)
-
文摘
热词查询是指在一个特定的时间范围内,从文本数据中搜索热点词汇。查询一组词汇成为热词的最长时间范围是话题检测与追踪的一个重要任务。现有的热词提取算法具有较高的时间复杂度,未考虑不同偏好的用户的查询需求,难以用于热词的在线提取以及最长时间范围的在线查询。为此提出一种在线查询算法,在类别和时间的二维区间上提取热词并查询用户指定词汇成为热词的最长时间范围。该算法基于Prefix Cube技术,对传统的TF^*PDF算法加以改进,在空间复杂度不变的情况下,降低TF^*PDF算法的时间复杂度。实验表明,与传统的TF^*PDF算法相比,该算法在路透社、纽约时报和BBC三个语料库上提取热词并查询最长时间区间的运行时间减少了81%,验证了该算法的高效性。
-
关键词
TF^*PDF
TOP-K
热点词汇
prefix
cube
在线查询
-
Keywords
TF^*PDF
Top-k
Hot terms
prefix cube
Online query
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名前缀立方的索引
被引量:1
- 3
-
-
作者
丁胡临
冯剑琳
聂晶
-
机构
华中科技大学计算机科学与技术系
-
出处
《计算机科学》
CSCD
北大核心
2005年第10期103-107,共5页
-
基金
国家自然科学基金(项目编号60303030)
-
文摘
前缀立方是最近提出的一种新的数据立方结构。它利用前缀共享和基本单元组有效地缩小了数据立方的尺寸,相应减少了数据立方的计算时间。为提高前缀立方的查询性能,本文提出了它的一种索引机制Prefix-CuboidTree。文中用真实数据集和模拟数据集进行大量实验,证明了该索引机制的查询性能。
-
关键词
prefix-CuboidTree
前缀立方
浓缩数据立方
基本单元组
数据立方
索引机制
前缀
查询性能
立方结构
计算时间
数据集
元组
共享
-
Keywords
prefix-CuboidTree , prefixcube , Condensed cube, Base single tuple
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
H313
[语言文字—英语]
-
-
题名数据仓库中一种有效的高维联机分析处理方法
- 4
-
-
作者
徐建平
胡孔法
-
机构
扬州大学信息工程学院
-
出处
《扬州大学学报(自然科学版)》
CAS
CSCD
2008年第1期46-50,共5页
-
基金
国家自然科学基金资助项目(60773103)
江苏省“青蓝工程”基金资助项目
-
文摘
在大量数据仓库系统中,对于一个d维的data cube,数据立方体(cube)可以生成2d个聚集cuboids,然而随着数据仓库维数的增长,计算这些预聚集数据已经成为一个瓶颈.在minimal cubing方法的基础上,提出一种具体层次语义特性的多维层次数据立方体——前缀索引立方体(prefix-index cubing)技术,将高维cube划分成若干个低维立方体cube,以实现高维cube的分布式存储和并行计算.理论分析与实验结果表明,相对于以往的minimal cubing等方法,前缀索引立方体方法的性能显著提高.
-
关键词
联机分析处理
高维数据立方体
前缀索引立方体
维层次编码
-
Keywords
online analytical processing (OLAP)
dimension hierarchical encoding high-dimensional cube
prefix-index cubing approach
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-