摘要
数据库聚类的一个关键问题是数据库中存储数据的格式与聚类算法所要求的输入数据格式之间的差异,为了弥补这一差异,提出基于模块单元的数据表示方法,该方法能够有效提高数据库的聚类能力。
One critical problem of database clustering is the data model discrepancy between the representation format used to store the target data and the input data format that clustering algorithms expect. Proposes a data representation format that relies on modular units to solve the problem. This method can enhance the database clustering.
作者
许天兵
冯大力
XU Tian-bing,FENG Da-li (Department of Computer Information Engineering, Shandong University of Finance, Jinan 250014,China)
出处
《电脑知识与技术》
2007年第9期1334-1335,共2页
Computer Knowledge and Technology
基金
山东省教育厅科技计划基金项目(J02F06)
关键词
数据库聚类
模块单元
数据挖掘
相似性度量
Database clustering
Modular units
Data mining
Similarity measures