期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
搜索引擎的设计剖析 被引量:15
1
作者 张汛涞 《计算机工程与科学》 CSCD 2002年第4期18-20,共3页
本文介绍了搜索引擎的四个组成部分 :搜索器、索引器、检索器和用户接口 ,并分析其工作原理 ;给出搜索引擎中包含的关键技术算法 :分词技术、多路归并算法和大文件处理技术 ;最后结合当前最新的几种搜索引擎 ,探讨搜索引擎在多语言处理... 本文介绍了搜索引擎的四个组成部分 :搜索器、索引器、检索器和用户接口 ,并分析其工作原理 ;给出搜索引擎中包含的关键技术算法 :分词技术、多路归并算法和大文件处理技术 ;最后结合当前最新的几种搜索引擎 ,探讨搜索引擎在多语言处理、专业化和有效性等方面的技术改进目标。 展开更多
关键词 搜索引擎 设计 搜索器 索引器 检索器 分词技术 互联网 信息检索
在线阅读 下载PDF
DMK算法在中文文本聚类中的应用 被引量:2
2
作者 季圣洁 葛万成 《信息通信》 2018年第7期1-4,共4页
对中文文本聚类进行了研究,将所改进的DMK算法应用于实际的中文文本聚类中。将百度百科数据集中的不同类型词条内容经过文本处理(分词、去停用词、特征选取、降维)后分别使用原始K-means聚类算法和DMK(Density-based and Max-min-distan... 对中文文本聚类进行了研究,将所改进的DMK算法应用于实际的中文文本聚类中。将百度百科数据集中的不同类型词条内容经过文本处理(分词、去停用词、特征选取、降维)后分别使用原始K-means聚类算法和DMK(Density-based and Max-min-distance K-means)算法进行聚类,并选择F-measure值及RI值(Rand Index)等指标对聚类结果进行分析。结果表明,针对实验中使用的百度百科中文数据集,DMK算法的F-measure值较原始算法平均提高0.342%,RI值较原始算法平均提高9.34%,验证了所设计的DMK算法对实际中文文本聚类的实质性优化。 展开更多
关键词 K-MEANS DMK算法 文本聚类 分词 文本挖掘
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部