通过查询模式聚类结构化的Deep Web资源

Organizing Structured Deep Web Sources by Query Schemas

下载PDF

导出

摘要近几年,网络被在线数据库迅速地深化。在深网中,大量的资料提供了丰富的数据模式,这些模式详细说明了它们的目标领域和查询性能,因此对大规模数据的整合是当前面临的挑战。在数据挖掘中,聚类分析是一个重要方法。本文论述通过查询接口采用凝聚层次聚类方法聚类结构化的Web资源,并采用先聚类后分类的方法稍加改进。实验显示对于聚类Web查询模式,凝聚的层次聚类能正确地组织资料。 In the recent years, the Web has been rapidly ＂deepened＂ with the databases online. On this deep Web, numerous sources are structured, providing schema-rich data-Their schemas define the object domain and its query capabilities. The structured deep Web thus presents challenges for large-scale information integration. Clustering is one of the important approaches in data mining, this paper studies organizing structured Web sources by query schemas with the hierarchical agglomerative clustering algorithm. And we use pre-clustering and post-classification techniques to improve it. Our experiments show the effectiveness- By clustering the query schemas, the hierarchical agglomerative clustering algorithm can accurately organize sources into object domains.

作者陈娟王贤黄青松

机构地区云南昆明理工大学信息工程与自动化学院

出处《现代计算机》 2006年第9期19-21,62,共4页 Modern Computer

关键词数据整合深网凝聚层次聚类 Data Integration Deep Web Hierarchical Agglomerative Clustering

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1B.He,T.Tao,and K.C.-C.Chang.Clustering Structured Web Sources:A Schema-based,Model-Differentiation Approach.Technical Report UIUCDCS-R-2003-2322,Dept.of Computer Science,UIUC,Feb.2003
2B.He and K.C.-C.Chang.Statistical Schema Matching Across Web Query Interfaces.In Proceedings of the 2003ACM SIGMOD Conference (SIGMOD 2003),2003
3Jiawei Han，Micheline Kamber．数据挖掘概念与技术．范明，盂小峰等译．北京：机械工业出版社，2005．8

共引文献1

1文习明.基于神经网络集成的数据分析[J].现代计算机,2006,12(5):23-26.

1袁斌,江涛,于洪志.基于语义空间的藏文微博情感分析方法[J].计算机应用研究,2016,33(3):682-685. 被引量：11
2彭敦陆,周傲英.基于方法聚类的Web服务检索技术[J].计算机应用,2007,27(10):2365-2368. 被引量：5
3徐丽佳,唐德玉.改进的FCM算法在医学中的应用[J].电脑知识与技术,2012,8(1X):668-672. 被引量：1
4陈涛,宋妍,谢阳群.改进的信息增益特征选择方法在文本聚类中的应用[J].现代图书情报技术,2004(12):7-9. 被引量：2
5陈娟,王贤,黄青松.基于模式—区别方法聚类结构化的Deep Web源[J].计算机技术与发展,2007,17(11):107-109.
6王新金,张华,曹祥红,崔光照.小波包分解和模糊聚类下的基因表达数据分析[J].计算机工程与应用,2009,45(19):128-130.
7王炳雪,陈元忠.基于模糊逻辑的多维时序软关联规则挖掘[J].计算机工程,2011,37(10):35-37. 被引量：1
8周津,陈超,俞能海.采用对象特征向量表示法的标签聚类算法[J].小型微型计算机系统,2012,33(3):525-530. 被引量：8
9赵洪杰,潘紫微,童靳于,刘燕.基于相空间重构与非线性流形的滚动轴承复合故障诊断[J].振动与冲击,2013,32(11):41-45. 被引量：5
10陈波,王延章.一种基于主动学习的相似记录匹配方法[J].计算机工程,2009,35(3):211-213. 被引量：1

现代计算机

2006年第9期

浏览历史

内容加载中请稍等...

通过查询模式聚类结构化的Deep Web资源

参考文献3

共引文献1

相关作者

相关机构

相关主题

浏览历史