期刊文献+
共找到2,491篇文章
< 1 2 125 >
每页显示 20 50 100
基于BERTopic模型的我国康复伦理研究主题挖掘与内容分析
1
作者 何照楠 张婷婷 +1 位作者 何照珂 孟丽君 《中国康复理论与实践》 北大核心 2026年第2期132-141,共10页
目的分析梳理我国康复伦理研究领域相关文献,探究主要的研究主题及发展趋势。方法以中国知网为数据来源,采用VOSviewer对作者合作网络进行可视化分析,采用BERTopic主题建模技术对106篇纳入文献进行主题识别、主题聚类和主题趋势分析。... 目的分析梳理我国康复伦理研究领域相关文献,探究主要的研究主题及发展趋势。方法以中国知网为数据来源,采用VOSviewer对作者合作网络进行可视化分析,采用BERTopic主题建模技术对106篇纳入文献进行主题识别、主题聚类和主题趋势分析。结果我国康复伦理研究相关文献发文量呈上升趋势,已形成8个合作较为密切的作者集群,BERTopic主题建模技术识别出14个主题,主题聚类形成3个主题集群,研究热点聚焦支持性社会关怀、全周期康复伦理和康复科技伦理3个方面。结论我国康复伦理研究整体处于初步发展阶段,尚未形成覆盖全国、紧密联动的学术共同体,智能康复伦理、医养结合康复伦理为新兴研究热点,研究范围呈现从特定功能障碍群体的伦理探讨,向系统性社会支持与权利保障体系构建的显著转向。 展开更多
关键词 康复 伦理 文献计量学 主题建模
暂未订购
GLMTopic:A Hybrid Chinese Topic Model Leveraging Large Language Models
2
作者 Weisi Chen Walayat Hussain Junjie Chen 《Computers, Materials & Continua》 2025年第10期1559-1583,共25页
Topic modeling is a fundamental technique of content analysis in natural language processing,widely applied in domains such as social sciences and finance.In the era of digital communication,social scientists increasi... Topic modeling is a fundamental technique of content analysis in natural language processing,widely applied in domains such as social sciences and finance.In the era of digital communication,social scientists increasingly rely on large-scale social media data to explore public discourse,collective behavior,and emerging social concerns.However,traditional models like Latent Dirichlet Allocation(LDA)and neural topic models like BERTopic struggle to capture deep semantic structures in short-text datasets,especially in complex non-English languages like Chinese.This paper presents Generative Language Model Topic(GLMTopic)a novel hybrid topic modeling framework leveraging the capabilities of large language models,designed to support social science research by uncovering coherent and interpretable themes from Chinese social media platforms.GLMTopic integrates Adaptive Community-enhanced Graph Embedding for advanced semantic representation,Uniform Manifold Approximation and Projection-based(UMAP-based)dimensionality reduction,Hierarchical Density-Based Spatial Clustering of Applications with Noise(HDBSCAN)clustering,and large language model-powered(LLM-powered)representation tuning to generate more contextually relevant and interpretable topics.By reducing dependence on extensive text preprocessing and human expert intervention in post-analysis topic label annotation,GLMTopic facilitates a fully automated and user-friendly topic extraction process.Experimental evaluations on a social media dataset sourced from Weibo demonstrate that GLMTopic outperforms Latent Dirichlet Allocation(LDA)and BERTopic in coherence score and usability with automated interpretation,providing a more scalable and semantically accurate solution for Chinese topic modeling.Future research will explore optimizing computational efficiency,integrating knowledge graphs and sentiment analysis for more complicated workflows,and extending the framework for real-time and multilingual topic modeling. 展开更多
关键词 topic modeling large language model deep learning natural language processing text mining
在线阅读 下载PDF
基于Topic-LLM框架的医学信息学跨学科主题演化研究
3
作者 苏中琪 董淼 崔雷 《医学信息学杂志》 2026年第1期55-61,69,共8页
目的/意义探索医学信息学跨学科主题演化路径识别方法,为该领域跨学科研究布局与科研管理提供参考。方法/过程首先利用BERTopic和大语言模型(large language model,LLM)在获取的医学信息学文献中识别全局主题和阶段主题;然后基于主题影... 目的/意义探索医学信息学跨学科主题演化路径识别方法,为该领域跨学科研究布局与科研管理提供参考。方法/过程首先利用BERTopic和大语言模型(large language model,LLM)在获取的医学信息学文献中识别全局主题和阶段主题;然后基于主题影响力与学科多样性二维分析框架,确定跨学科主题;最后分析跨学科主题的演化路径。结果/结论基于Topic-LLM的分析方法,发现医学信息学跨学科主题的学科多样性和主题影响力呈现稳步增长趋势。 展开更多
关键词 BERtopic 大语言模型 跨学科 主题识别 主题演化
暂未订购
基于BERTopic-RAG框架的医学信息学主题演化与知识发现研究
4
作者 张琳 任淑敏 《医学信息学杂志》 2026年第2期30-36,共7页
目的/意义构建双层分析框架,全面把握学科结构,识别新兴前沿领域,追踪主题演化。方法/过程检索2016—2025年PubMed、Scopus和Web of Science数据库医学信息学文献,采用BERTopic识别主题,并划分为新兴、稳定、衰退3种演化模式。基于Chrom... 目的/意义构建双层分析框架,全面把握学科结构,识别新兴前沿领域,追踪主题演化。方法/过程检索2016—2025年PubMed、Scopus和Web of Science数据库医学信息学文献,采用BERTopic识别主题,并划分为新兴、稳定、衰退3种演化模式。基于ChromaDB构建检索增强生成系统,通过文档-主题映射实现微观验证与知识关联挖掘。结果/结论医学信息学主题演化呈现研究重心转移、技术融合深化、学科交叉增强3个特征。BERTopic-RAG框架为知识发现提供了新方法。 展开更多
关键词 医学信息学 主题建模 BERtopic 检索增强生成 知识演化
暂未订购
基于BERTopic模型的企业ESG政策文本主题识别与趋势分析
5
作者 孟志华 耿嘉璘 《标准科学》 2026年第3期36-44,共9页
【目的】紧跟时事政策,探究发展趋势,更好地为企业提供参考价值,也为社会公众更整体地了解政策变化。【方法】采用BERTopic模型、数据搜集、文本分析等方法,对近几年各个单位出台的关于企业ESG相关政策进行总结分类和评价,审视主要方向... 【目的】紧跟时事政策,探究发展趋势,更好地为企业提供参考价值,也为社会公众更整体地了解政策变化。【方法】采用BERTopic模型、数据搜集、文本分析等方法,对近几年各个单位出台的关于企业ESG相关政策进行总结分类和评价,审视主要方向并提出不足和建议。【结果】上市公司环境战略、内部环境管理制度、企业信息披露评估框架、绿色债券信息披露、统一国内绿色债券项目认定标准、ESG信息披露的基本架构、定期披露公司信息的义务方面较好,但研究对象存在追责机制不健全、缺少ESG评级质量标准、ESG审计不足的问题。【结论】提出了需要完善追责机制、统一评级质量标准和提升ESG审计水平的建议,最终有效遏制“漂绿”乱象的发生,提升ESG信息质量与公信力,实现长期发展。 展开更多
关键词 ESG BERtopic模型 主题分析 趋势分析
在线阅读 下载PDF
基于Topic Model的我国档案学主题结构与演化研究 被引量:4
6
作者 董克 韩宇姝 《信息资源管理学报》 CSSCI 2017年第3期97-105,共9页
文本内容分析能够有效揭示学科研究的主题结构与知识的发展过程。本文运用主题模型与时间序列分析等方法,以档案学领域的两种CSSCI源刊近10年刊载的论文为分析对象进行文本内容挖掘。分析结果表明,上述方法的结合能够有效识别学科领域... 文本内容分析能够有效揭示学科研究的主题结构与知识的发展过程。本文运用主题模型与时间序列分析等方法,以档案学领域的两种CSSCI源刊近10年刊载的论文为分析对象进行文本内容挖掘。分析结果表明,上述方法的结合能够有效识别学科领域研究的主题,并揭示学科主题的发展过程;中国档案学领域近10年的研究主要集中在学科范式研究、电子文件管理、档案信息服务等12个研究主题;通过对不同主题的时间分布分析,揭示了这些主题的演化过程,进一步归纳总结了相关方法使用的主要注意事项并给出了对应建议。 展开更多
关键词 主题模型 学科结构 主题结构 主题演化档案学研究
在线阅读 下载PDF
基于BERTopic的科技人才政策文本主题识别与量化分析——以东北三省为例 被引量:9
7
作者 苗宏慧 全情爽 舒心 《现代情报》 北大核心 2025年第4期110-121,共12页
[目的/意义]新时代东北全面振兴取决于科技人才的有力支撑,科技人才政策是推动科技创新与人才发展的重要制度保障。通过对科技人才政策进行系统的量化分析,旨在准确把握区域科技人才政策的框架结构和动态特征,为深化政策供给侧改革提供... [目的/意义]新时代东北全面振兴取决于科技人才的有力支撑,科技人才政策是推动科技创新与人才发展的重要制度保障。通过对科技人才政策进行系统的量化分析,旨在准确把握区域科技人才政策的框架结构和动态特征,为深化政策供给侧改革提供决策参考。[方法/过程]本研究以黑龙江省、吉林省、辽宁省三省的科技人才政策文本为研究对象,运用BERTopic模型对其政策文本进行主题识别、关键词提取、相似度计算等,在此基础上开展各省政策主题的纵横向比较,并与粤苏浙鲁等发达省份的政策进行对比分析。[结果/结论]东北三省科技人才政策已形成了以人才引进、培养、使用、评价、激励、服务为主线的政策体系,但与发达省份相比,在政策供给、需求牵引、针对性等方面还存在不足。据此,本研究提出,东北三省应立足区域实际,提升人才政策的系统性、精准性、时效性,聚焦政策供给、需求牵引、区域特色等关键问题,在人才政策的集成优化、创新发展上持续发力,以新时代人才政策变革引领和保障全面振兴、高质量发展。 展开更多
关键词 科技人才政策 主题识别 BERtopic模型 对比分析 东北振兴 政策供给
在线阅读 下载PDF
基于BERTopic模型的我国医学人工智能领域的主题识别与内容分析 被引量:3
8
作者 袁永旭 王涟 +2 位作者 殷彩明 孙一凡 陈俊冶 《中国数字医学》 2025年第4期89-96,共8页
目的:从主题识别和发展演化两个角度对我国医学人工智能的研究现状进行梳理分析,为学者进行相关研究提供借鉴和参考。方法:首先从中国知网、万方数据和维普网三大数据库中获取2012年-2023年我国医学人工智能领域的相关文献,再利用BERTo... 目的:从主题识别和发展演化两个角度对我国医学人工智能的研究现状进行梳理分析,为学者进行相关研究提供借鉴和参考。方法:首先从中国知网、万方数据和维普网三大数据库中获取2012年-2023年我国医学人工智能领域的相关文献,再利用BERTopic模型挖掘医学人工智能领域的研究主题和发展演化趋势。结果:研究主题覆盖基础医学至临床实践的完整链条,体现学科复杂性与多维性;核心方向聚焦医学教育与基础研究、临床技术创新、医疗数据挖掘及公共卫生管理四大领域;热点呈分化趋势,医学影像与网络模型研究、医学人工智能教育研究热度显著,精准医学与医疗数据挖掘具备发展潜能。结论:本研究揭示了医学人工智能领域主题动态与前沿方向,为优化学科布局、引导资源投入及推动技术转化提供参考依据。 展开更多
关键词 医学人工智能 BERtopic模型 主题分析 主题挖掘
在线阅读 下载PDF
融合BERTopic和大语言模型的大数据安全与治理主题演化研究
9
作者 邓胜利 贾瑞琪 王少辉 《情报科学》 北大核心 2025年第9期12-18,30,共8页
【目的/意义】数智时代,大数据安全与治理的统筹研究成为当前的研究热点与重点问题。本文通过对大数据安全与治理领域中的研究主题进行挖掘,探究该领域的核心议题、发展趋势以及演化轨迹。【方法/过程】梳理考证该领域已有文献,利用中... 【目的/意义】数智时代,大数据安全与治理的统筹研究成为当前的研究热点与重点问题。本文通过对大数据安全与治理领域中的研究主题进行挖掘,探究该领域的核心议题、发展趋势以及演化轨迹。【方法/过程】梳理考证该领域已有文献,利用中国知网(CNKI)数据,对2012—2024年间大数据安全与治理相关核心期刊文献,采用改进BERTopic主题模型与GPT-4协同分析框架,挖掘文本隐含的研究主题及重要性,展示主题内容的动态演化过程与趋势。【结果/结论】研究发现大数据安全与治理领域呈现出理论与实践交互演进、多维安全深化拓展、安全与发展动态平衡三个主要演化特征,以此为基础提出完善大数据领域特色化发展的未来展望。【创新/局限】本研究引入大语言模型来深入挖掘出大数据安全与治理领域研究主题及其演化特征,未来将着眼于新兴技术治理与安全领域,以期实现大数据“善治”。 展开更多
关键词 大数据安全 数据治理 主题建模 主题演化 大语言模型
原文传递
基于BERTopic模型的美国国防部关键科技资助项目主题挖掘与演化分析
10
作者 杨阳 郑禧潓 +1 位作者 张雯 李刚 《图书与情报》 北大核心 2025年第5期34-46,共13页
美国作为全球科技和军事强国,其科技研发资助策略和方向对全球科技格局具有深远影响。文章基于BERTopic主题模型对2015年-2024年美国国防部关键科技资助项目进行主题挖掘和演化趋势分析,从主题分布及动态演化趋势角度对美国关键科技资... 美国作为全球科技和军事强国,其科技研发资助策略和方向对全球科技格局具有深远影响。文章基于BERTopic主题模型对2015年-2024年美国国防部关键科技资助项目进行主题挖掘和演化趋势分析,从主题分布及动态演化趋势角度对美国关键科技资助的战略布局及其构成因素进行了实证分析和系统梳理。美国国防部关键科技资助项目涵盖83个主题,大多数主题在时间维度上的频率变化相对平稳,仅少数主题呈现出显著波动或快速增长态势,体现了美国“集中资源突破核心领域,广泛布局孕育未来方向”的关键技术资助战略。总体来看,美国国防部在推进科技创新的过程中实现了基础研究与应用研究的协同并进,构建起以国家安全为导向的前沿技术生态体系。 展开更多
关键词 美国国防部 关键科技资助项目 主题挖掘 动态演化分析 BERtopic主题模型
在线阅读 下载PDF
基于BERTopic的生成式人工智能主题图谱与演化分析
11
作者 冯丹娃 王金舟 《情报科学》 北大核心 2025年第6期71-81,共11页
【目的/意义】自2022年底OpenAI发布ChatGPT以来,生成式人工智能在多个领域有了快速发展。厘清生成式人工智能在学术界的研究主题结构及其演化趋势,以揭示该领域研究热点的动态变化规律与未来发展方向。【方法/过程】运用BERTopic主题... 【目的/意义】自2022年底OpenAI发布ChatGPT以来,生成式人工智能在多个领域有了快速发展。厘清生成式人工智能在学术界的研究主题结构及其演化趋势,以揭示该领域研究热点的动态变化规律与未来发展方向。【方法/过程】运用BERTopic主题模型进行文本语义嵌入、UMAP降维与HDBSCAN密度聚类,并结合动态主题分析,精准识别研究主题并绘制主题演化路径。【结果/结论】识别出智能教育技术、风险与技术治理、智能内容服务等20个具体研究主题并绘制主题图谱,呈现出研究热点由技术探索逐步转向应用细化的演化趋势。其中,智能教育领域长期处于研究热点中心,风险治理主题稳步升温。动态分析发现,主题演化存在明显的聚合与分化路径,体现了跨学科融合与主题专业化的双重特征。【创新/局限】技术与方法的双重创新,提高了研究结果的可视性与解释力。然而,研究数据来源的单一性可能导致某些研究主题未被充分覆盖。 展开更多
关键词 生成式人工智能 BERtopic模型 动态主题分析 主题图谱 演化分析
原文传递
基于BERTOPIC模型的数据要素领域主题挖掘与内容分析
12
作者 杨智勇 王慧 《图书馆理论与实践》 2025年第6期78-89,126,共13页
文章以中国知网数据库中数据要素研究文献为例,利用BERTopic模型系统解构国内数据要素的核心研究主题与研究方向。研究发现该领域在数据产权、数据交易、数据治理等微观主题上表现出由表及里的深化研究态势;整体研究趋势变化受政策和社... 文章以中国知网数据库中数据要素研究文献为例,利用BERTopic模型系统解构国内数据要素的核心研究主题与研究方向。研究发现该领域在数据产权、数据交易、数据治理等微观主题上表现出由表及里的深化研究态势;整体研究趋势变化受政策和社会发展需求驱动特征明显,在“顶层设计—实施路径”的双向互动中形成了多层次分析框架;学科交叉属性显著,未来学者开展相关研究可采用跨学科式研究,整合多元方法论,推动数据要素领域研究向多维化、系统化方向深化发展。 展开更多
关键词 数据要素 研究主题 BERtopic 主题模型
在线阅读 下载PDF
Mining User Interest in Microblogs with a User-Topic Model 被引量:17
13
作者 HE Li JIA Yan +1 位作者 HAN Weihong DING Zhaoyun 《China Communications》 SCIE CSCD 2014年第8期131-144,共14页
Microblogs have become an important platform for people to publish,transform information and acquire knowledge.This paper focuses on the problem of discovering user interest in microblogs.In this paper,we propose a to... Microblogs have become an important platform for people to publish,transform information and acquire knowledge.This paper focuses on the problem of discovering user interest in microblogs.In this paper,we propose a topic mining model based on Latent Dirichlet Allocation(LDA) named user-topic model.For each user,the interests are divided into two parts by different ways to generate the microblogs:original interest and retweet interest.We represent a Gibbs sampling implementation for inference the parameters of our model,and discover not only user's original interest,but also retweet interest.Then we combine original interest and retweet interest to compute interest words for users.Experiments on a dataset of Sina microblogs demonstrate that our model is able to discover user interest effectively and outperforms existing topic models in this task.And we find that original interest and retweet interest are similar and the topics of interest contain user labels.The interest words discovered by our model reflect user labels,but range is much broader. 展开更多
关键词 MICROBLOGS topic mining userinterest LDA user-topic model
在线阅读 下载PDF
基于有监督Topic Model的图像分类 被引量:1
14
作者 付勋 宋俊德 《软件》 2013年第12期253-255,共3页
近年来,以LDA为代表的话题模型在图像和文本处理中均得到了广泛的应用。与传统的机器学习方法相比,LDA模型具有参数少,表达能力强等优点,同时作为一种生成模型,它可以有效模拟人类学习的方式,便利地加入先验知识。有监督的LDA模型则将... 近年来,以LDA为代表的话题模型在图像和文本处理中均得到了广泛的应用。与传统的机器学习方法相比,LDA模型具有参数少,表达能力强等优点,同时作为一种生成模型,它可以有效模拟人类学习的方式,便利地加入先验知识。有监督的LDA模型则将生成模型与判别模型结合在一起,是一种通用的分类方法。Dense-SIFT特征被作为底层特征,在词袋模型的框架下,以k-means算法构建词典,用有监督的LDA模型训练,并在通用的图像数据集上进行评测,根据评测结果证明其在图像分类任务中具有很好的性能。 展开更多
关键词 图像分类 话题模型 有监督模型词
在线阅读 下载PDF
BURST-LDA: A NEW TOPIC MODEL FOR DETECTING BURSTY TOPICS FROM STREAM TEXT 被引量:3
15
作者 Qi Xiang Huang Yu +4 位作者 Chen Ziyan Liu Xiaoyan Tian Jing Huang Tinglei Wang Hongqi 《Journal of Electronics(China)》 2014年第6期565-575,共11页
Topic models such as Latent Dirichlet Allocation(LDA) have been successfully applied to many text mining tasks for extracting topics embedded in corpora. However, existing topic models generally cannot discover bursty... Topic models such as Latent Dirichlet Allocation(LDA) have been successfully applied to many text mining tasks for extracting topics embedded in corpora. However, existing topic models generally cannot discover bursty topics that experience a sudden increase during a period of time. In this paper, we propose a new topic model named Burst-LDA, which simultaneously discovers topics and reveals their burstiness through explicitly modeling each topic's burst states with a first order Markov chain and using the chain to generate the topic proportion of documents in a Logistic Normal fashion. A Gibbs sampling algorithm is developed for the posterior inference of the proposed model. Experimental results on a news data set show our model can efficiently discover bursty topics, outperforming the state-of-the-art method. 展开更多
关键词 Text mining Burst detection topic model Graphical model Bayesian inference
在线阅读 下载PDF
Anomaly detection in traffic surveillance with sparse topic model 被引量:5
16
作者 XIA Li-min HU Xiang-jie WANG Jun 《Journal of Central South University》 SCIE EI CAS CSCD 2018年第9期2245-2257,共13页
Most research on anomaly detection has focused on event that is different from its spatial-temporal neighboring events.It is still a significant challenge to detect anomalies that involve multiple normal events intera... Most research on anomaly detection has focused on event that is different from its spatial-temporal neighboring events.It is still a significant challenge to detect anomalies that involve multiple normal events interacting in an unusual pattern.In this work,a novel unsupervised method based on sparse topic model was proposed to capture motion patterns and detect anomalies in traffic surveillance.scale-invariant feature transform(SIFT)flow was used to improve the dense trajectory in order to extract interest points and the corresponding descriptors with less interference.For the purpose of strengthening the relationship of interest points on the same trajectory,the fisher kernel method was applied to obtain the representation of trajectory which was quantized into visual word.Then the sparse topic model was proposed to explore the latent motion patterns and achieve a sparse representation for the video scene.Finally,two anomaly detection algorithms were compared based on video clip detection and visual word analysis respectively.Experiments were conducted on QMUL Junction dataset and AVSS dataset.The results demonstrated the superior efficiency of the proposed method. 展开更多
关键词 motion pattern sparse topic model SIFT flow dense trajectory fisher kernel
在线阅读 下载PDF
基于BERTopic模型的高校图书馆阅读推广主题研究及主题热度分析
17
作者 申胡日查 《情报探索》 2025年第5期18-26,共9页
[目的/意义]利用BERTopic模型对高校图书馆阅读推广研究成果进行主题提取,梳理高校阅读推广主题及研究方向、演变趋势,探索研究发展的方向。[方法/过程]首先,从CNKI数据库检索并下载“高校图书馆阅读推广”相关的所有期刊论文并删除与... [目的/意义]利用BERTopic模型对高校图书馆阅读推广研究成果进行主题提取,梳理高校阅读推广主题及研究方向、演变趋势,探索研究发展的方向。[方法/过程]首先,从CNKI数据库检索并下载“高校图书馆阅读推广”相关的所有期刊论文并删除与主题无关的内容形成研究数据集。然后,以论文的关键词构建自定义字典,利用Python对数据集进行停用词处理并分词。最后,利用BERTopic模型挖掘主题、研究趋势、并展现主题研究热度变化。[结果/结论]模型识别出新媒体阅读推广、阅读服务、阅读行为、微信阅读推广等高频率研究主题。根据主题内容归纳出基础理论研究、评估评价体系研究等研究方向并识别出“红色阅读推广”“短视频阅读推广”等热门研究主题。 展开更多
关键词 主题建模 BERtopic 主题识别 研究主题 研究方向
在线阅读 下载PDF
基于BERTopic模型的国内物流配送研究新动向
18
作者 王莉亚 吴昊 《中国商论》 2025年第19期83-86,共4页
为了系统梳理物流配送领域的研究现状与发展趋势,本文以CNKI数据库中收录的相关高质量研究文献为数据源,运用BERTopic模型和层次聚类法识别该领域的研究热点,并追踪研究前沿发展状况。研究发现,当前国内物流配送领域的研究热点主要集中... 为了系统梳理物流配送领域的研究现状与发展趋势,本文以CNKI数据库中收录的相关高质量研究文献为数据源,运用BERTopic模型和层次聚类法识别该领域的研究热点,并追踪研究前沿发展状况。研究发现,当前国内物流配送领域的研究热点主要集中在以下5个方面:物流配送中心选址和建设研究、物流配送路径优化研究、电子商务环境下的物流配送研究、农产品物流配送研究及物流配送在连锁企业中的应用研究。未来,物流配送领域研究的主动力将是技术驱动和系统化管理,尤其是人工智能、大数据、物联网等新兴技术将在物流配送领域发挥更大的作用;物流配送将更加注重个性化服务,提供更灵活的解决方案,以满足客户的多样化需求。同时,绿色可持续发展也将成为重要议题,通过优化资源利用和减少碳排放,推动物流配送行业的可持续发展。 展开更多
关键词 物流配送 BERtopic模型 研究热点 趋势预测 绿色可持续
在线阅读 下载PDF
A Framework for Personalized Adaptive User Interest Prediction Based on Topic Model and Forgetting Mechanism 被引量:1
19
作者 GUI Sisi LU Wei +1 位作者 ZHOU Pengcheng ZHENG Zhan 《Wuhan University Journal of Natural Sciences》 CAS CSCD 2018年第1期9-16,共8页
User interest is not static and changes dynamically. In the scenario of a search engine, this paper presents a personalized adaptive user interest prediction framework. It represents user interest as a topic distribut... User interest is not static and changes dynamically. In the scenario of a search engine, this paper presents a personalized adaptive user interest prediction framework. It represents user interest as a topic distribution, captures every change of user interest in the history, and uses the changes to predict future individual user interest dynamically. More specifically, it first uses a personalized user interest representation model to infer user interest from queries in the user's history data using a topic model; then it presents a personalized user interest prediction model to capture the dynamic changes of user interest and to predict future user interest by leveraging the query submission time in the history data. Compared with the Interest Degree Multi-Stage Quantization Model, experiment results on an AOL Search Query Log query log show that our framework is more stable and effective in user interest prediction. 展开更多
关键词 user interest user interest presentation user interestprediction topic model forgetting mechanism
原文传递
Enhancing Collaborative Filtering via Topic Model Integrated Uniform Euclidean Distance 被引量:1
20
作者 Tieliang Gao Bo Cheng +1 位作者 Junliang Chen Ming Chen 《China Communications》 SCIE CSCD 2017年第11期48-58,共11页
Recommendation system can greatly alleviate the "information overload" in the big data era. Existing recommendation methods, however, typically focus on predicting missing rating values via analyzing user-it... Recommendation system can greatly alleviate the "information overload" in the big data era. Existing recommendation methods, however, typically focus on predicting missing rating values via analyzing user-item dualistic relationship, which neglect an important fact that the latent interests of users can influence their rating behaviors. Moreover, traditional recommendation methods easily suffer from the high dimensional problem and cold-start problem. To address these challenges, in this paper, we propose a PBUED(PLSA-Based Uniform Euclidean Distance) scheme, which utilizes topic model and uniform Euclidean distance to recommend the suitable items for users. The solution first employs probabilistic latent semantic analysis(PLSA) to extract users' interests, users with different interests are divided into different subgroups. Then, the uniform Euclidean distance is adopted to compute the users' similarity in the same interest subset; finally, the missing rating values of data are predicted via aggregating similar neighbors' ratings. We evaluate PBUED on two datasets and experimental results show PBUED can lead to better predicting performance and ranking performance than other approaches. 展开更多
关键词 recommendation system topic model user interest uniform euclidean distance
在线阅读 下载PDF
上一页 1 2 125 下一页 到第
使用帮助 返回顶部