期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
相似度算法分析与比较研究 被引量:6
1
作者 陈天 刘文浩 《现代计算机》 2012年第12期18-20,共3页
针对RSS阅读器中冗余信息带来的不便,在采用中文分词和TF.IDF算法计算相似度进行预处理后,选取Levenshtein、余弦夹角法、Jaccard这三种相似度算法进行冗余信息鉴别。详细讨论这些方法的特征,并从实际应用的角度对这些方法的长处和不足... 针对RSS阅读器中冗余信息带来的不便,在采用中文分词和TF.IDF算法计算相似度进行预处理后,选取Levenshtein、余弦夹角法、Jaccard这三种相似度算法进行冗余信息鉴别。详细讨论这些方法的特征,并从实际应用的角度对这些方法的长处和不足做分析与比较,并选择Jaccard算法实现一个数据过滤机制。 展开更多
关键词 计算机应用技术 tp·idf 相似度计算:ICTCLAS
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部