K-means algorithm is one of the most widely used algorithms in the clustering analysis. To deal with the problem caused by the random selection of initial center points in the traditional al- gorithm, this paper propo...K-means algorithm is one of the most widely used algorithms in the clustering analysis. To deal with the problem caused by the random selection of initial center points in the traditional al- gorithm, this paper proposes an improved K-means algorithm based on the similarity matrix. The im- proved algorithm can effectively avoid the random selection of initial center points, therefore it can provide effective initial points for clustering process, and reduce the fluctuation of clustering results which are resulted from initial points selections, thus a better clustering quality can be obtained. The experimental results also show that the F-measure of the improved K-means algorithm has been greatly improved and the clustering results are more stable.展开更多
现有的基于评论与评分的方法通常使用相同的模型分别对用户和项目进行建模,但其局限在浅层特征层面,如果能够充分挖掘用户个性化偏好与项目深层特征,则会促进模型学习两种表示之间更深层次的关系从而提升预测结果.因此,本文提出一种融...现有的基于评论与评分的方法通常使用相同的模型分别对用户和项目进行建模,但其局限在浅层特征层面,如果能够充分挖掘用户个性化偏好与项目深层特征,则会促进模型学习两种表示之间更深层次的关系从而提升预测结果.因此,本文提出一种融合评论与评分的个性化推荐方法,用于深度挖掘用户偏好与项目特征.在对评论文本进行处理的过程中,首先通过ALBERT获得评论文本中单词的向量表示.其次,提出的个性化注意模块将用户的个性化偏好信息与评论文本向量结合,得到深层的基于评论的用户表示.在Amazon Digital Music、Grocery and Gourmet Food、Video Games数据集上进行实验,本文方法较基准方法在NDCG指标上分别提升了5%、11%、8%.代码已在https://github.com/ZehuaChenLab/paperCode/tree/main/DuWenNa/PRM-RR公开.展开更多
传统推荐算法仅依靠用户的历史评分数据来挖掘相似用户,这一方法会面临着严重的数据稀疏性和冷启动问题,造成推荐效果不理想.为解决数据稀疏性,提高推荐质量,通过深度挖掘评论文本和评分数据的语义信息,提出了基于多源特征融合的推荐算...传统推荐算法仅依靠用户的历史评分数据来挖掘相似用户,这一方法会面临着严重的数据稀疏性和冷启动问题,造成推荐效果不理想.为解决数据稀疏性,提高推荐质量,通过深度挖掘评论文本和评分数据的语义信息,提出了基于多源特征融合的推荐算法模型(recommendation algorithm model based on multi-source feature fusion,MSFF),该模型通过CNN和SA_BiLSTM混合模型对评论文本信息进行特征提取,并在特征提取时引入自注意力机制动态地调整评论信息的重要性,从而更好地捕捉评论信息中的深层关键信息.接着通过隐语义模型LFM分解评分矩阵得到用户和物品潜在特征.然后将两种模型所得的非同源特征进行有效融合得到高阶特征,进而预测评分,并根据最终的预测评分生成推荐列表.为了验证模型的有效性,在Yelp评论数据集和亚马逊评论数据集Amazon5-core中的3个子数据集上进行实验,结果表明,该模型不仅缓解推荐算法中评分数据稀疏性的影响,而且有效地提升了推荐结果的准确性.展开更多
随着电子商务的迅速发展和Web上信息的不断增长,推荐系统成为有效帮助用户做出决策的重要智能软件之一.基于评分数据的矩阵分解推荐模型被广泛研究和应用,但数据稀疏性问题影响了该模型的推荐质量.另一方面推荐系统中用户撰写的评论文...随着电子商务的迅速发展和Web上信息的不断增长,推荐系统成为有效帮助用户做出决策的重要智能软件之一.基于评分数据的矩阵分解推荐模型被广泛研究和应用,但数据稀疏性问题影响了该模型的推荐质量.另一方面推荐系统中用户撰写的评论文本可以反映用户的兴趣偏好,有研究工作提出了相应的文本分析及观点挖掘方法来缓解评分数据的稀疏性.评分矩阵分解模型与评论文本挖掘模型的融合有助于提高推荐质量,因此该文首先提出了一种融合评分数值和评论文本的推荐模型DTMF(Double Topics with Matrix Factorization),将用户评论集和商品评论集各自的潜在主题向量分别与传统矩阵分解的用户潜在因子向量和商品潜在因子向量建立正向映射关系,然后通过添加潜在主题为预测评分引导项进一步优化DTMF模型提出了DTMF+模型.在两组公开数据集上,以推荐结果的均方误差(MSE)为评估指标进行了实验验证.实验结果表明本文提出的DTMF和DTMF+两个模型整体上优于仅融入商品评论集的HFT(Hidden Factors as Topics)(item)模型,在子类数据上预测误差最大分别降低了3.68%和7.31%.该文最后探讨了有用性评论排序问题来增强推荐结果的可解释性.展开更多
提出一种矩阵加权关联模式支持度计算方法及其相关定理,给出矩阵加权项集剪枝策略,基于该剪枝策略提出一种基于项权值变化的矩阵加权关联规则挖掘算法MWAR-Miner(matrix-weighted association rules-miner)。该算法克服现有的项无加权...提出一种矩阵加权关联模式支持度计算方法及其相关定理,给出矩阵加权项集剪枝策略,基于该剪枝策略提出一种基于项权值变化的矩阵加权关联规则挖掘算法MWAR-Miner(matrix-weighted association rules-miner)。该算法克服现有的项无加权和项权值固定条件下挖掘关联规则的缺陷,采用新的剪枝技术和模式支持度计算方法挖掘有效的矩阵加权关联规则,避免无效的和无趣的模式产生。以中文数据集CWT200g和英文数据集NTCIR-5为实验数据,理论分析和实验结果表明,与现有矩阵加权模式挖掘算法和基于无加权的挖掘算法比较,该算法挖掘的候选项集数量和挖掘时间明显减少,挖掘效率得到极大提高。展开更多
文摘K-means algorithm is one of the most widely used algorithms in the clustering analysis. To deal with the problem caused by the random selection of initial center points in the traditional al- gorithm, this paper proposes an improved K-means algorithm based on the similarity matrix. The im- proved algorithm can effectively avoid the random selection of initial center points, therefore it can provide effective initial points for clustering process, and reduce the fluctuation of clustering results which are resulted from initial points selections, thus a better clustering quality can be obtained. The experimental results also show that the F-measure of the improved K-means algorithm has been greatly improved and the clustering results are more stable.
文摘现有的基于评论与评分的方法通常使用相同的模型分别对用户和项目进行建模,但其局限在浅层特征层面,如果能够充分挖掘用户个性化偏好与项目深层特征,则会促进模型学习两种表示之间更深层次的关系从而提升预测结果.因此,本文提出一种融合评论与评分的个性化推荐方法,用于深度挖掘用户偏好与项目特征.在对评论文本进行处理的过程中,首先通过ALBERT获得评论文本中单词的向量表示.其次,提出的个性化注意模块将用户的个性化偏好信息与评论文本向量结合,得到深层的基于评论的用户表示.在Amazon Digital Music、Grocery and Gourmet Food、Video Games数据集上进行实验,本文方法较基准方法在NDCG指标上分别提升了5%、11%、8%.代码已在https://github.com/ZehuaChenLab/paperCode/tree/main/DuWenNa/PRM-RR公开.
文摘传统推荐算法仅依靠用户的历史评分数据来挖掘相似用户,这一方法会面临着严重的数据稀疏性和冷启动问题,造成推荐效果不理想.为解决数据稀疏性,提高推荐质量,通过深度挖掘评论文本和评分数据的语义信息,提出了基于多源特征融合的推荐算法模型(recommendation algorithm model based on multi-source feature fusion,MSFF),该模型通过CNN和SA_BiLSTM混合模型对评论文本信息进行特征提取,并在特征提取时引入自注意力机制动态地调整评论信息的重要性,从而更好地捕捉评论信息中的深层关键信息.接着通过隐语义模型LFM分解评分矩阵得到用户和物品潜在特征.然后将两种模型所得的非同源特征进行有效融合得到高阶特征,进而预测评分,并根据最终的预测评分生成推荐列表.为了验证模型的有效性,在Yelp评论数据集和亚马逊评论数据集Amazon5-core中的3个子数据集上进行实验,结果表明,该模型不仅缓解推荐算法中评分数据稀疏性的影响,而且有效地提升了推荐结果的准确性.
文摘随着电子商务的迅速发展和Web上信息的不断增长,推荐系统成为有效帮助用户做出决策的重要智能软件之一.基于评分数据的矩阵分解推荐模型被广泛研究和应用,但数据稀疏性问题影响了该模型的推荐质量.另一方面推荐系统中用户撰写的评论文本可以反映用户的兴趣偏好,有研究工作提出了相应的文本分析及观点挖掘方法来缓解评分数据的稀疏性.评分矩阵分解模型与评论文本挖掘模型的融合有助于提高推荐质量,因此该文首先提出了一种融合评分数值和评论文本的推荐模型DTMF(Double Topics with Matrix Factorization),将用户评论集和商品评论集各自的潜在主题向量分别与传统矩阵分解的用户潜在因子向量和商品潜在因子向量建立正向映射关系,然后通过添加潜在主题为预测评分引导项进一步优化DTMF模型提出了DTMF+模型.在两组公开数据集上,以推荐结果的均方误差(MSE)为评估指标进行了实验验证.实验结果表明本文提出的DTMF和DTMF+两个模型整体上优于仅融入商品评论集的HFT(Hidden Factors as Topics)(item)模型,在子类数据上预测误差最大分别降低了3.68%和7.31%.该文最后探讨了有用性评论排序问题来增强推荐结果的可解释性.
文摘提出一种矩阵加权关联模式支持度计算方法及其相关定理,给出矩阵加权项集剪枝策略,基于该剪枝策略提出一种基于项权值变化的矩阵加权关联规则挖掘算法MWAR-Miner(matrix-weighted association rules-miner)。该算法克服现有的项无加权和项权值固定条件下挖掘关联规则的缺陷,采用新的剪枝技术和模式支持度计算方法挖掘有效的矩阵加权关联规则,避免无效的和无趣的模式产生。以中文数据集CWT200g和英文数据集NTCIR-5为实验数据,理论分析和实验结果表明,与现有矩阵加权模式挖掘算法和基于无加权的挖掘算法比较,该算法挖掘的候选项集数量和挖掘时间明显减少,挖掘效率得到极大提高。