期刊文献+
共找到119篇文章
< 1 2 6 >
每页显示 20 50 100
基于LDA模型的福建省家庭农场研究热点主题识别与趋势分析
1
作者 段园园 陈卫娜 林树文 《福建农业科技》 2025年第3期76-82,共7页
通过全面系统地展示福建省家庭农场研究领域的整体脉络、热点演进及前沿趋势,旨在为关注该领域的学者开展后续研究、政府部门制定相关政策提供参考和启发。研究基于文献计量学视角,借助LDA主题模型对1982-2024年中国知网525篇福建省家... 通过全面系统地展示福建省家庭农场研究领域的整体脉络、热点演进及前沿趋势,旨在为关注该领域的学者开展后续研究、政府部门制定相关政策提供参考和启发。研究基于文献计量学视角,借助LDA主题模型对1982-2024年中国知网525篇福建省家庭农场研究领域的中文文献进行主题挖掘及趋势预测分析。结果表明:福建省家庭农场研究历经3个阶段:起步期(1982-2010年)聚焦农业社会保障与基础服务;增长期(2011-2014年)关注土地流转与政策支持;成熟期(2015-2024年)深化现代农业技术与合作社作用研究。福建农林类高校为该方向的科研主力,但跨学科合作不足。研究主题主要围绕四大核心领域:农业社会化服务与土地流转、新型农业经营主体与农业现代化、集约化经营与合作社作用、发展问题与对策建议。研究指出,土地流转、社会化服务体系、现代农业技术、经营模式、政策和制度支持仍将是家庭农场研究的热点。 展开更多
关键词 家庭农场 新型农业经营主体 lda模型 主题识别
在线阅读 下载PDF
基于LDA模型的国际人工智能监管文本的主题热点及策略分析
2
作者 毛太田 彭一荷 《科技情报研究》 2025年第3期70-81,共12页
[目的/意义]文章对国际人工智能监管政策深入挖掘研究,洞察各国监管焦点与趋势,以期为全球AI治理策略提供有益参考。[方法/过程]文章运用LDA主题聚类分析法,对27份国际政策文件开展深入研究,精准识别主题、剖析关键主题词,并进一步揭示... [目的/意义]文章对国际人工智能监管政策深入挖掘研究,洞察各国监管焦点与趋势,以期为全球AI治理策略提供有益参考。[方法/过程]文章运用LDA主题聚类分析法,对27份国际政策文件开展深入研究,精准识别主题、剖析关键主题词,并进一步揭示人工智能领域的监管热点。[结果/结论]研究揭示了6个核心监管主题:系统风险评估、伦理法律规范、社会影响治理、透明度与信任、创新与风险控制、全球监管策略,并根据结果提出4项政策建议。 展开更多
关键词 人工智能治理 人工智能监管 lda模型 主题挖掘 聚类分析 政策研究
在线阅读 下载PDF
LDA模型下的中央与地方公共数字文化服务政策文本量化分析 被引量:1
3
作者 蒲宝娣 《高科技与产业化》 2025年第2期26-28,共3页
本研究通过LDA主题模型,对2000年至2024年间中央与地方出台的公共数字文化服务政策文本进行了主题识别和成效分析。研究发现,政策主题可分为四大类:文化产业发展、文化数字化服务、民族文化保护及文化设施标准化建设。四个主题反映出,... 本研究通过LDA主题模型,对2000年至2024年间中央与地方出台的公共数字文化服务政策文本进行了主题识别和成效分析。研究发现,政策主题可分为四大类:文化产业发展、文化数字化服务、民族文化保护及文化设施标准化建设。四个主题反映出,该政策借助数字化转型,提升文化的可接近性、可用性与吸引力,意在丰富民众文化生活,增强民众文化自信,推动社会和谐进步。 展开更多
关键词 公共数字文化服务 政策文本 lda 主题模型
原文传递
基于LDA模型的卫生健康媒体数据时间序列主题分析
4
作者 吴旭生 查亚东 +4 位作者 张冬云 彭祖胜 林圣 刘宇锋 和晓峰 《医学信息学杂志》 2025年第2期62-67,75,共7页
目的/意义探索卫生健康领域媒体数据主题及其演化趋势。方法/过程以深圳广电媒资数据库中的160549条卫生健康领域媒体数据为研究对象,采用隐含狄利克雷分布模型结合时间序列进行主题聚类分析,并结合专家经验,进行对比分析。结果/结论得... 目的/意义探索卫生健康领域媒体数据主题及其演化趋势。方法/过程以深圳广电媒资数据库中的160549条卫生健康领域媒体数据为研究对象,采用隐含狄利克雷分布模型结合时间序列进行主题聚类分析,并结合专家经验,进行对比分析。结果/结论得到25个与卫生健康领域强相关的主题,根据主题强度演化趋势分为6组。主题建模的内容划分和强度变化有效反映了卫生健康领域热点事件的发生及其演进过程。利用隐含狄利克雷分布模型进行主题建模,结合时间序列分析主题分布、解读主题意义,有助于探索媒体数据在卫生健康领域的应用,为卫生健康公共事业赋能。 展开更多
关键词 卫生健康媒体数据 隐含狄利克雷分布模型 热点事件 主题演化
暂未订购
一种基于LDA的社区问答问句相似度计算方法 被引量:18
5
作者 熊大平 王健 林鸿飞 《中文信息学报》 CSCD 北大核心 2012年第5期40-45,共6页
传统的问答系统(QA)只是直接返回问题的答案,而且没有用户交互特性,而基于社区的问答系统(CQA),含有大量的"问答对"可以利用。该文提出了一种基于LDA的匹配框架来解决相似问句的匹配问题,分别从问句的统计信息、语义信息和主... 传统的问答系统(QA)只是直接返回问题的答案,而且没有用户交互特性,而基于社区的问答系统(CQA),含有大量的"问答对"可以利用。该文提出了一种基于LDA的匹配框架来解决相似问句的匹配问题,分别从问句的统计信息、语义信息和主题信息三个方面来计算问句相似度,综合得到整体相似度。实验是在Yahoo!Answers上抽取的真实标注数据集上进行,最终的实验结果表明,该文的方法达到了很好的性能。 展开更多
关键词 问句相似度 lda主题模型 社区问答 相似度计算
在线阅读 下载PDF
基于优化密度的耦合空间LDA文本聚类算法研究 被引量:8
6
作者 邢长征 赵全颖 +1 位作者 王伟 王星 《计算机应用研究》 CSCD 北大核心 2017年第7期1966-1970,共5页
针对传统的空间向量模型在进行文本表示时计算相似度仅采用词频统计来表示文本以及对高维文本数据聚类效果有所下降等问题,提出一种基于优化密度的耦合空间LDA文本聚类算法。该算法利用提出的耦合空间模型和LDA主题模型线性融合计算文... 针对传统的空间向量模型在进行文本表示时计算相似度仅采用词频统计来表示文本以及对高维文本数据聚类效果有所下降等问题,提出一种基于优化密度的耦合空间LDA文本聚类算法。该算法利用提出的耦合空间模型和LDA主题模型线性融合计算文本相似度,并对阈值敏感问题进行优化,确定不同密度区域对应的阈值半径。实验结果表明,与改进的DBSCAN文本聚类算法和R-DBSCAN文本聚类算法相比,该算法的文本聚类精度更高、聚类效果更优。 展开更多
关键词 文本聚类 耦合空间模型 lda主题模型 密度 阈值
在线阅读 下载PDF
基于LDA的游客感知维度识别:研究框架与实证研究——以国家矿山公园为例 被引量:17
7
作者 董爽 汪秋菊 《北京联合大学学报(人文社会科学版)》 CSSCI 2019年第2期42-49,共8页
国家矿山公园游客感知维度识别,能够从游客感知的角度发现游客的心理认知,为废弃矿区进行工业遗产旅游开发提供重要的参考价值。结合自然语言处理技术与隐含狄利克雷分布(LDA)主题模型方法,构建旅游目的地游客感知维度识别的研究框架。... 国家矿山公园游客感知维度识别,能够从游客感知的角度发现游客的心理认知,为废弃矿区进行工业遗产旅游开发提供重要的参考价值。结合自然语言处理技术与隐含狄利克雷分布(LDA)主题模型方法,构建旅游目的地游客感知维度识别的研究框架。利用旅游网站游客在线评论信息,识别国家矿山公园游客感知维度及各维度的构成因子。研究发现,游客对国家矿山公园的感知主要侧重于对功能客体(如旅游吸引物、服务、旅游目的地等)的认知,而对于工业遗产地所蕴含的意义与传递的文化等方面的解读是十分有限的。加大国家矿山公园产品创新成为废弃矿区旅游可持续发展的现实选择。 展开更多
关键词 国家矿山公园 lda主题模型 游客感知
在线阅读 下载PDF
基于LDA模型的西洋参专利热点内容及创新趋势分析方法研究 被引量:4
8
作者 张素娟 扆铁梅 +1 位作者 张云倩 董洁 《情报探索》 2019年第10期57-62,共6页
[目的/意义]为改善现有西洋参专利内容分析方法存在的辨识度低、分类粗泛性、界限划分模糊和热点领域不明确等问题,提高其主题分类时效性和科学性。[方法/过程]将LDA主题模型应用到西洋参专利内容聚类分析中,实现对专利主题的识别和划分... [目的/意义]为改善现有西洋参专利内容分析方法存在的辨识度低、分类粗泛性、界限划分模糊和热点领域不明确等问题,提高其主题分类时效性和科学性。[方法/过程]将LDA主题模型应用到西洋参专利内容聚类分析中,实现对专利主题的识别和划分。[结果/结论]西洋参专利相关的制剂方法、组方和组合物、保健食品、保健茶和保健酒等为当前研究热点领域,而在提取、加工和检测等技术方法的研究较少。与传统分析方法对比研究证明,LDA模型使西洋参专利主题得到明确划分,揭示了西洋参热点研究领域,实现了西洋参产业未来发展趋势的预测。 展开更多
关键词 聚类分析 lda主题模型 西洋参 专利分析
在线阅读 下载PDF
基于LDA的隐式标签协同过滤推荐算法 被引量:2
9
作者 文勇军 何环晶 唐立军 《计算机与现代化》 2022年第3期53-58,69,共7页
固定标签协同过滤推荐算法,未充分考虑标签因子的多样化,主要依靠人工标记,扩展性不强,主观因素多。本文从用户的喜好特征因素角度出发,在固定标签协同过滤推荐算法的基础上,提出一种隐式标签协同过滤推荐算法。该算法利用LDA主题模型... 固定标签协同过滤推荐算法,未充分考虑标签因子的多样化,主要依靠人工标记,扩展性不强,主观因素多。本文从用户的喜好特征因素角度出发,在固定标签协同过滤推荐算法的基础上,提出一种隐式标签协同过滤推荐算法。该算法利用LDA主题模型生成项目文本的隐式标签,得到项目-标签特征权重,根据算法性能优化的要求选择标签数量,将项目-标签矩阵与用户评分矩阵结合得到用户对标签的偏好矩阵,最后通过协同过滤算法产生推荐。实验结果表明,本文提出的基于LDA的隐式标签协同过滤推荐算法缓解了数据稀疏性问题,项目推荐的召回率、准确度和F1值有较大提升。 展开更多
关键词 固定标签 协同过滤 lda主题模型 隐式标签 算法改进
在线阅读 下载PDF
融合LDA主题权重修正模型的科研文献主题挖掘与量化分析——以国外学业指导研究为例 被引量:3
10
作者 李善兴 盛磊 吴昊 《情报科学》 CSSCI 北大核心 2020年第8期112-119,共8页
【目的/意义】改进传统的从科研文献挖掘对策启示的文本分析方法,构建了一种融合LDA主题权重修正模型的科研文献量化分析模型【方法/过程】选取WOS数据库前沿文献,基于文献可视化工具,通过文献共现方法,绘制学业指导发展动态及趋势特征... 【目的/意义】改进传统的从科研文献挖掘对策启示的文本分析方法,构建了一种融合LDA主题权重修正模型的科研文献量化分析模型【方法/过程】选取WOS数据库前沿文献,基于文献可视化工具,通过文献共现方法,绘制学业指导发展动态及趋势特征的知识图谱并加以阐释;利用R语言实现LDA建模,制取我国学业指导的"困境-对策"主题词矩阵,与国外研究前沿进展进行比对,反思现存学业指导工作不足及缺失【结果/结论】能够有效地从借助该模型,从科研文献中较为精准地获取更细颗粒度的对策词项,从而有助于推动学术文献向实务工作嵌入和转化的效果和效率。 展开更多
关键词 主题挖掘 lda建模量化分析 科研文献
原文传递
基于LDA主题模型的信息服务文献主题提取与演变研究 被引量:6
11
作者 钱旦敏 郑建明 《数字图书馆论坛》 CSSCI 2019年第10期16-22,共7页
运用LDA主题模型梳理近22年来国内信息服务研究主题演化情况,为该领域的可持续发展提供借鉴和指导。以中国知网(CNKI)为信息源,以信息服务为主题检索CSSCI期刊,排除不符合论文,共检索到8908篇论文,并按年文献量趋势划分为4个阶段。基于T... 运用LDA主题模型梳理近22年来国内信息服务研究主题演化情况,为该领域的可持续发展提供借鉴和指导。以中国知网(CNKI)为信息源,以信息服务为主题检索CSSCI期刊,排除不符合论文,共检索到8908篇论文,并按年文献量趋势划分为4个阶段。基于TF-IDF构建LDA主题模型,利用MindMapper绘制主题演变图,比较分析信息服务研究主题的持续、弱化、转移与新兴。模型结果显示,1998年以来我国信息服务领域持续研究主题包括图书馆服务、信息产业服务、资源服务及学科服务;图书馆服务模式和信息伦理研究逐渐弱化、转移;移动信息服务、智库大数据、专业领域信息以及图情计量成为近年来该领域研究热点。 展开更多
关键词 信息服务 lda主题建模 TF-IDF 主题演变
在线阅读 下载PDF
基于LDA主题模型的服务业企业创新测度研究——兼与传统创新测度方法的对比分析 被引量:2
12
作者 冯晓华 顾金科 《科学管理研究》 CSSCI 北大核心 2024年第3期76-88,共13页
服务创新是新时代服务业高质量发展的重要内涵。以R&D投入、专利申请为代表的传统创新测度方法在衡量服务业企业创新时存在明显缺陷。使用隐含狄利克雷分配(LDA)主题模型对2008-2022年间914家服务业上市公司的创新水平进行了测度,... 服务创新是新时代服务业高质量发展的重要内涵。以R&D投入、专利申请为代表的传统创新测度方法在衡量服务业企业创新时存在明显缺陷。使用隐含狄利克雷分配(LDA)主题模型对2008-2022年间914家服务业上市公司的创新水平进行了测度,并从企业整体、行业归属、区域分布、企业规模、企业所有制维度与传统创新测度方法对比分析。研究发现:相较于传统创新测度方法,LDA方法能够①同时反映服务业企业创新中的技术和非技术创新部分,更适用于测度非研发和非专利服务业企业;②更好捕捉教育,文化、体育和娱乐业等生活性服务业企业的创新特征和形式;③向上纠偏中西部地区服务业企业创新水平,向下纠偏东部地区服务业企业创新水平,还原东部和中西部地区服务业企业真实创新差距;④向上纠偏中小型服务业企业创新水平,向下纠偏大型服务业企业创新水平;⑤深入挖掘国有和非国有服务业企业在创新词频和主题上的差异,揭示非国有服务业企业创新水平较高的本质原因。基于此,从拓展服务创新内涵新认知、加快生活性服务业企业创新、营造良好创新生态、深化数字技术渗透以及发挥差异性优势五个方面提出政策建议,以期为加快服务业企业创新发展提供政策启示。 展开更多
关键词 lda主题模型 服务业企业 创新测度 分析师报告 文本分析
原文传递
我国战略科学家研究的热点透视与未来路向:基于LDA-SARIMA模型的研究 被引量:3
13
作者 黄涛 邹浙灿 《科技管理学报》 2024年第3期23-34,共12页
战略科学家是科技人才中的帅才,是支撑我国高水平科技自立自强的重要力量。探索战略科学家研究领域主题存在的取向和呈现的趋向,可为相关科技政策研究和制定工作提供借鉴。本文采用LDA主题建模和SARIMA预测分析方法对战略科学家这一重... 战略科学家是科技人才中的帅才,是支撑我国高水平科技自立自强的重要力量。探索战略科学家研究领域主题存在的取向和呈现的趋向,可为相关科技政策研究和制定工作提供借鉴。本文采用LDA主题建模和SARIMA预测分析方法对战略科学家这一重要研究领域进行主题挖掘与实证分析,抽取与战略科学家相关的6个核心主题,对该领域的研究现状与发展动态进行探讨。研究表明:战略科学家的研究具有显著的周期性特征;研究集中在建设国家战略人才力量层面,强调战略科学家对于承担国家战略任务,推动战略人才体系建设的作用;通过模型的定量预测功能得出培育和使用战略科学家、借助新媒体技术开展科学普及和教育工作是未来研究的趋向。建议在探讨如何完善战略科学家的培养体系时,紧跟时代发展的步伐,培养符合新时代需求的战略科学家。 展开更多
关键词 战略科学家 实证分析 主题挖掘 lda 主题模型
在线阅读 下载PDF
基于LDA与DTM模型的粤港澳大湾区文献主题演化研究 被引量:4
14
作者 马文聪 雷璇 李远辉 《科技管理研究》 CSSCI 北大核心 2023年第11期75-85,共11页
利用中国知网(CNKI)数据,基于CiteSpace可视化文献分布情况,采用隐含狄利克雷分布(LDA)主题模型提取关键词,挖掘出文本隐含的研究主题及重要性程度;结合动态主题模型(DTM),分析不同主题内容的演化过程。结果表明,粤港澳相关研究主题主... 利用中国知网(CNKI)数据,基于CiteSpace可视化文献分布情况,采用隐含狄利克雷分布(LDA)主题模型提取关键词,挖掘出文本隐含的研究主题及重要性程度;结合动态主题模型(DTM),分析不同主题内容的演化过程。结果表明,粤港澳相关研究主题主要集中于经济合作、协同治理、人才培养、环境保护、产业升级、旅游与文化六大方面。其中,经济合作和协同治理是目前研究关注的重点,人才培养和环境保护是今后主要研究趋势,且相关内容呈现不断细化特征。 展开更多
关键词 粤港澳大湾区 文献主题 主题演化 lda模型 DTM模型
在线阅读 下载PDF
基于LDA-BERT模型的智慧图书馆主题演化研究 被引量:2
15
作者 严素梅 海骏林峰 《数字图书馆论坛》 CSSCI 2023年第2期57-64,共8页
近年来,图书馆正不断朝“智慧化”方向迈进,智慧图书馆也逐渐走进研究者的视野。本文将LDA主题模型和BERT模型相结合,构建主题相似性测度模型,量化智慧图书馆领域主题之间的关联关系,并以此为基础绘制主题演化图谱,分析中外智慧图书馆... 近年来,图书馆正不断朝“智慧化”方向迈进,智慧图书馆也逐渐走进研究者的视野。本文将LDA主题模型和BERT模型相结合,构建主题相似性测度模型,量化智慧图书馆领域主题之间的关联关系,并以此为基础绘制主题演化图谱,分析中外智慧图书馆领域研究主题的演化趋势,探究中外研究的异同。基于主题演化图谱可以看出,智慧图书馆领域的研究主要聚焦于智慧图书馆理论研究、智慧图书馆服务、智慧图书馆技术与实践研究、智慧图书馆管理、图书馆资源获取与知识产权等5个领域。其中,中文研究侧重智慧图书馆服务;外文研究则侧重图书馆的资源获取与管理。 展开更多
关键词 智慧图书馆 lda-BERT模型 主题演化 关联分析
在线阅读 下载PDF
融合CNN和LDA的短文本分类研究 被引量:11
16
作者 张小川 余林峰 +1 位作者 桑瑞婷 张宜浩 《软件工程》 2018年第6期17-21,共5页
应用卷积神经网络分类文本是自然语言处理领域的研究热点,针对神经网络输入矩阵只提取词粒度层面的词向量矩阵,忽略了文本粒度层面整体语义特征的表达,导致文本特征表示不充分,影响分类准确度的问题。本文提出一种结合word2vec和LDA主... 应用卷积神经网络分类文本是自然语言处理领域的研究热点,针对神经网络输入矩阵只提取词粒度层面的词向量矩阵,忽略了文本粒度层面整体语义特征的表达,导致文本特征表示不充分,影响分类准确度的问题。本文提出一种结合word2vec和LDA主题模型的文本表示矩阵,结合词义特征和语义特征,输入卷积神经网络进行文本分类,以丰富池化层特征,达到精确分类的效果。对本文提出模型进行文本分类实验,结果表明,本文算法相比传统特征输入的卷积神经网络文本分类,在F度量值上取得一定程度的提升。 展开更多
关键词 卷积神经网络 主题模型 lda word2vec
在线阅读 下载PDF
基于LDA模型的音乐推荐算法 被引量:16
17
作者 李博 陈志刚 +1 位作者 黄瑞 郑祥云 《计算机工程》 CAS CSCD 北大核心 2016年第6期175-179,184,共6页
互联网的普及以及音乐资源的电子化使得人们可以更方便地获得音乐资源。但随着音乐库变得越来越大、资源越来越丰富,人们已经很难准确及时地找到自己喜欢的音乐。因此,对于音乐网站而言,需要一个合适的音乐推荐算法向用户推荐音乐。根... 互联网的普及以及音乐资源的电子化使得人们可以更方便地获得音乐资源。但随着音乐库变得越来越大、资源越来越丰富,人们已经很难准确及时地找到自己喜欢的音乐。因此,对于音乐网站而言,需要一个合适的音乐推荐算法向用户推荐音乐。根据已有的基于音频信息的音乐推荐以及协同过滤方法,分析用户的音乐试听数据以及下载数据,并结合Latent Dirichlet分配(LDA)主题挖掘模型,提出一种音乐推荐算法。实验结果表明,与基于用户的协同过滤算法以及基于项目的协同过滤算法相比,该算法可以更加高效地向用户推荐感兴趣的音乐。 展开更多
关键词 协同过滤 音乐推荐 主题挖掘 LATENT Dirichlet分配模型 吉布斯抽样 基于lda模型的音乐推荐
在线阅读 下载PDF
基于LDA和扎根理论的劳动教育型研学旅行课程质量评价
18
作者 邢慧斌 方旭宁 韩雨薇 《经济论坛》 2023年第9期64-77,共14页
课程质量评价体系是优质课程高效产出的前提与保证。研究选取48位劳动教育型研学旅行的利益相关者进行深度访谈,爬取网络文本作为研究数据,采用LDA主题模型和扎根理论方法,探讨劳动教育型研学旅行课程质量评价体系的主要内容与评价指标... 课程质量评价体系是优质课程高效产出的前提与保证。研究选取48位劳动教育型研学旅行的利益相关者进行深度访谈,爬取网络文本作为研究数据,采用LDA主题模型和扎根理论方法,探讨劳动教育型研学旅行课程质量评价体系的主要内容与评价指标之间的作用机制。结果表明:基于LDA主题模型发现劳动教育型研学旅行课程质量评价主要集中于劳动教育型研学旅行教学内容、教学资源和参与主体3个方面,且具有碎片化和表面化的特征;基于扎根理论发现影响课程质量评价的三个指标有劳动教育型研学旅行课程团队准备、课程方案设计及课程实施基地。最后研究梳理了三个指标之间的相互关系和内在机制。 展开更多
关键词 课程质量评价 劳动教育型研学旅行 lda主题模型 扎根理论
在线阅读 下载PDF
基于LDA-BERT相似性测度模型的文本主题演化研究 被引量:8
19
作者 海骏林峰 严素梅 +1 位作者 陈荣 李建霞 《图书馆工作与研究》 CSSCI 北大核心 2024年第1期72-79,共8页
文章针对LDA主题模型在提取文本主题时忽略文本语义关联的问题,提出基于LDA-BERT的相似性测度模型:首先,结合利用TF-IDF和TextRank方法提取文本特征词,利用LDA主题模型挖掘文本主题;其次,通过嵌入BERT模型,结合LDA主题模型构建的主题-... 文章针对LDA主题模型在提取文本主题时忽略文本语义关联的问题,提出基于LDA-BERT的相似性测度模型:首先,结合利用TF-IDF和TextRank方法提取文本特征词,利用LDA主题模型挖掘文本主题;其次,通过嵌入BERT模型,结合LDA主题模型构建的主题-主题词概率分布,从词粒度层面表示主题向量;最后,利用余弦相似度算法计算主题之间的相似度。在相似性测度模型基础上构建向量相似度指标分析文献研究主题之间的关联,并绘制主题演化知识图谱。通过智慧图书馆领域的实证研究发现,使用LDA-BERT模型计算出的主题相似度结果相较于LDA主题模型的计算结果更加准确,与实际情况更相符。 展开更多
关键词 相似性测度 lda-BERT模型 lda模型 BERT模型 主题演化
原文传递
基于LDA的微博用户粉丝亲密度评价模型 被引量:3
20
作者 王秋森 俞浩亮 +3 位作者 徐浩诚 冯旭鹏 刘利军 黄青松 《计算机应用与软件》 CSCD 2016年第10期67-71,共5页
用户关系是目前微博研究的热门方向,微博用户亲密度评价在对用户隐含亲密粉丝的发现、微博网络环境优化等方面具有重要意义。目前微博用户群体庞大且关系复杂,仅从用户自身出发,以用户特征和关系网络等为依据对用户关系亲密度评价的准... 用户关系是目前微博研究的热门方向,微博用户亲密度评价在对用户隐含亲密粉丝的发现、微博网络环境优化等方面具有重要意义。目前微博用户群体庞大且关系复杂,仅从用户自身出发,以用户特征和关系网络等为依据对用户关系亲密度评价的准确率太低。针对这一问题,提出基于LDA的微博用户粉丝亲密度评价模型。首先,对用户粉丝集中非活跃粉丝过滤剔除,获取其活跃粉丝。然后,利用LDA主题模型对用户某时间段所发微博集进行训练,获取用户阶段性微博的主题分布;同时通过主题分布推断其兴趣取向分布,并利用余弦相似方法计算用户与其粉丝之间的兴趣相似度。最后,结合用户的背景相似度和关系紧密度,为用户建立综合的亲密度评价标准。通过新浪API接口抓取微博近期相关数据,组成实验数据集。在数据集上基于评价的推荐实验结果表明,所提出的模型方法具有较高的准确率和有效性。 展开更多
关键词 亲密度 lda粉丝 主题模型 相似度
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部