排序的子序列相似查询方法

Ranked subsequence similarity search

下载PDF

导出

摘要时间序列数据的高维性是影响数据查询代价的主要因素,降维技术是时间序列数据查询优化的有效手段。原有降维技术近似体积的无界性,造成索引阶段不能充分实现点过滤,影响了查询效率。首先,利用近似体积有界的非线性降维技术解决了点过滤问题。然后,引入提前终止技术,减少了原始序列距离计算阶段的冗余计算。在此基础上,提出排序的子序列相似查询算法。实验结果表明,排序子序列相似查询方法具有较高的效率。 High dimensionality of time series data cause high query cost. Dimensionality reduction on the data is an effective way ofqueryoptimization. The approximation volume ofproposed dimensionality reduction is unbounded, so the algorithm can not effectively filter the point in the index. First, a new non-linear dimensionality reduction is used to resolve the problem. Second, Early abandon technique is introduced to further improve efficiency and reduce redundant computation. Then on these basis, ranked subsequence similarity search algorithm is proposed. The experimental results show that ranked algorithm has higher efficiency.

作者朱鹤赵威余靖金顺福刘国华

机构地区燕山大学信息科学与工程学院

出处《燕山大学学报》 CAS 2009年第5期417-421,共5页 Journal of Yanshan University

基金国家自然科学基金资助项目(60773100) 国家"十一五"科技支撑计划资助项目(2006BAK05BO2) 河北省自然科学基金资助项目(F2009000475)

关键词排序非线性降维提前终止技术紧密下限 rank non-linear dimensionality reduction early abandon tight bounds

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献10

1Keogh E, Chakrabarti K, Mehrotra Set al.. Locally adaptive dimensionality reduction for indexing large time series databases [C] //Proc ofACM SIGMOD, Santa Barbara, California USA, 2001: 151-162.
2Faloutsos C, Runganathan M, Manolopoulos Y. Fast subsequence matching in time-series databases [C] //Proc ofACM SIGMOD, Minneapolis, Minnesota, USA, 1994: 419-429.
3Han W S, Lee J, Moon Y S, et al.Ranked subsequence matching in time-series databases [C] //Proc of the 33th VLDB Conference, Vienna, Austria, 2007: 423-434.
4Moon Y S, Whang K Y, Loh W K. Duality-based subsequence matching in time-series databases [C] //Proeofl7thlntemational Conference on Data Engineering, Heidelberg, Germany, 2001 : 263.
5Vu K, Hua K A, Cheng H, et al.. A non-linear dimensionality reduction technique for fast similarity search in large databases[C]// Proc ofACM SIGMOD, Chicago, Illinois, USA, 2006: 527-538.
6秦文.基于Voronoi图的时间序列线性模式查询算法[J].计算机工程与应用,2008,44(31):167-168. 被引量：1
7Li Wei, Keogh E, Van H H, et al.. Atomic Wedgie: efficient query filtering for streaming time series [C] //Proc of Intl Confon Data Mining, Houston, Texax, 2005: 490-497.
8Guttman A. R-trees: a dynamic index structure for spatial searching [C] //Proc ofACM SIGMOD, New York: ACM, 1984: 47-57.
9Hjaltason G R, Samet P. Distance browsing in spatial databases [J]. ACM Transactions on Database Systems, 1999,24 (2): 265-318.
10潘定,沈钧毅.时态数据挖掘的相似性发现技术[J].软件学报,2007,18(2):246-258. 被引量：41

二级参考文献10

1Jia-WeiHan,JianPei,Xi-FengYan.From Sequential Pattern Mining to Structured Pattern Mining： A Pattern-Growth Approach[J].Journal of Computer Science & Technology,2004,19(3):257-279. 被引量：18
2王国仁,葛健,徐恒宇,郑若石.基于二分频率变换的序列相似性查询处理技术[J].软件学报,2006,17(2):232-241. 被引量：8
3闫相斌,李一军,崔广斌.事件预测的时间序列数据挖掘方法[J].计算机工程,2006,32(5):29-31. 被引量：4
4Hetland M L.A survey of recent methods for efficient retrieval of similar time sequences[C]//Data Mining in Time Series Databases, London, 2004 : 23-42.
5Keogh E,Kasetty S.On the need for time series data mining benchmarks:a survey and empirical demonstration[C]//the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,Edmonton,Alberta,Canada,2002:102-111.
6Pratt K B,Fink E.Search for patterns in compressed time series[J]. International Journal of Image and Graphics, 2002,2( 1 ) : 89-106.
7Prerata F P,Shamos M I.Computational geometry-an introduction[M].New York:Springer-Verlag, 1985.
8Morchen F.Time series knowledge mining[D].Germany:Philipps- University Marburg, 2006.
9Zhou M,Wong M H,Chu K W.A geometrical solution to time series searching invariant to shifting and scaling[J].Knowledge and Information Systems, 2006,9(2) : 202-229.
10Moon Y S,Kim J.A single index approach for time-series subsequence matching that supports moving average transform of arbitrary order[C]//Advances in Knowledge Discovery and Data Mining, 10th Pacific-Asia Conference,PAKDD,Singapore,2006:739-749.

共引文献40

1孙梅玉,唐漾,方建安.一种基于MBR的高效的时间序列表示方法[J].计算机工程与应用,2008,44(16):135-138. 被引量：2
2曲明成,廖明宏,吴翔虎,刘志强.一种文档自动生成模型的构建及其应用[J].计算机集成制造系统,2008,14(7):1297-1305. 被引量：5
3宁慧,李红宇,吴培莲.Web日志中时态约束浏览模式挖掘算法研究[J].哈尔滨工业大学学报,2008,40(9):1474-1480. 被引量：3
4陈卓,杨炳儒,周法国,李琳娜.基于时态逻辑的多时间序列挖掘模型[J].辽宁工程技术大学学报（自然科学版）,2009,28(4):604-607. 被引量：2
5吴枫,仲妍,吴泉源,贾焰,杨树强.基于适应性分段估计的数据流相似性搜索[J].软件学报,2009,20(10):2867-2884. 被引量：4
6薛海东,朱群雄.基于结构化类比的时间序列预测算法[J].计算机工程,2010,36(1):211-214. 被引量：2
7吕玉增,彭启民,黎湘.基于参数化求和不变量与特征重整的形状匹配[J].中国图象图形学报,2010,15(1):122-128. 被引量：1
8段岩峰,于霄,于达仁.基于DTW技术的电站故障诊断[J].汽轮机技术,2010,52(1):57-60. 被引量：1
9曹茂俊,尚福华.改进的DTW算法在实时语音辨识系统中的应用[J].科学技术与工程,2010,10(7):1652-1655. 被引量：4
10肖红,尚福华.基于趋势转折点的时间序列模式表示[J].科学技术与工程,2010,10(13):3254-3257. 被引量：2

1何源,戴小鹏,张林峰.数据查询优化算法综述[J].计算机与现代化,2005(4):14-17. 被引量：14
2李昶,余立人.数据库应用系统性能与数据查询优化[J].现代计算机,2002,8(3):14-19. 被引量：4
3黄勤珍,秦萧萧.中间件在信息查询优化系统中的应用[J].电讯技术,2004,44(3):157-159.
4卜文军,李彩红.信息系统中的认证技术[J].才智,2011,0(31):38-38.
5赵静.Android系统架构及应用程序开发研究[J].自动化与仪器仪表,2017(1):86-87. 被引量：21
6郭再荣,喻占武,游韵.H.264帧间块模式选择与快速运动估计算法[J].计算机工程与应用,2006,42(6):30-32. 被引量：1
7胡祖辉.学生成绩管理系统数据查询优化方法研究[J].软件导刊,2016,15(9):149-151. 被引量：2
8边海容.分布式数据库中数据查询优化策略研究[J].科技广场,2008(12):76-77.
9李俊奎,王元珍,李海波,左琼.一种时间序列相似搜索中提前终止效率的估算方法[J].计算机科学,2009,36(1):114-117. 被引量：2
10赵焕新.英文论坛的独特功用[J].网络传播,2008(11):42-43.

燕山大学学报

2009年第5期

浏览历史

内容加载中请稍等...

排序的子序列相似查询方法

参考文献10

二级参考文献10

共引文献40

相关作者

相关机构

相关主题

浏览历史