期刊文献+
共找到2,391篇文章
< 1 2 120 >
每页显示 20 50 100
GLMTopic:A Hybrid Chinese Topic Model Leveraging Large Language Models
1
作者 Weisi Chen Walayat Hussain Junjie Chen 《Computers, Materials & Continua》 2025年第10期1559-1583,共25页
Topic modeling is a fundamental technique of content analysis in natural language processing,widely applied in domains such as social sciences and finance.In the era of digital communication,social scientists increasi... Topic modeling is a fundamental technique of content analysis in natural language processing,widely applied in domains such as social sciences and finance.In the era of digital communication,social scientists increasingly rely on large-scale social media data to explore public discourse,collective behavior,and emerging social concerns.However,traditional models like Latent Dirichlet Allocation(LDA)and neural topic models like BERTopic struggle to capture deep semantic structures in short-text datasets,especially in complex non-English languages like Chinese.This paper presents Generative Language Model Topic(GLMTopic)a novel hybrid topic modeling framework leveraging the capabilities of large language models,designed to support social science research by uncovering coherent and interpretable themes from Chinese social media platforms.GLMTopic integrates Adaptive Community-enhanced Graph Embedding for advanced semantic representation,Uniform Manifold Approximation and Projection-based(UMAP-based)dimensionality reduction,Hierarchical Density-Based Spatial Clustering of Applications with Noise(HDBSCAN)clustering,and large language model-powered(LLM-powered)representation tuning to generate more contextually relevant and interpretable topics.By reducing dependence on extensive text preprocessing and human expert intervention in post-analysis topic label annotation,GLMTopic facilitates a fully automated and user-friendly topic extraction process.Experimental evaluations on a social media dataset sourced from Weibo demonstrate that GLMTopic outperforms Latent Dirichlet Allocation(LDA)and BERTopic in coherence score and usability with automated interpretation,providing a more scalable and semantically accurate solution for Chinese topic modeling.Future research will explore optimizing computational efficiency,integrating knowledge graphs and sentiment analysis for more complicated workflows,and extending the framework for real-time and multilingual topic modeling. 展开更多
关键词 topic modeling large language model deep learning natural language processing text mining
在线阅读 下载PDF
基于BERTopic的科技人才政策文本主题识别与量化分析——以东北三省为例 被引量:4
2
作者 苗宏慧 全情爽 舒心 《现代情报》 北大核心 2025年第4期110-121,共12页
[目的/意义]新时代东北全面振兴取决于科技人才的有力支撑,科技人才政策是推动科技创新与人才发展的重要制度保障。通过对科技人才政策进行系统的量化分析,旨在准确把握区域科技人才政策的框架结构和动态特征,为深化政策供给侧改革提供... [目的/意义]新时代东北全面振兴取决于科技人才的有力支撑,科技人才政策是推动科技创新与人才发展的重要制度保障。通过对科技人才政策进行系统的量化分析,旨在准确把握区域科技人才政策的框架结构和动态特征,为深化政策供给侧改革提供决策参考。[方法/过程]本研究以黑龙江省、吉林省、辽宁省三省的科技人才政策文本为研究对象,运用BERTopic模型对其政策文本进行主题识别、关键词提取、相似度计算等,在此基础上开展各省政策主题的纵横向比较,并与粤苏浙鲁等发达省份的政策进行对比分析。[结果/结论]东北三省科技人才政策已形成了以人才引进、培养、使用、评价、激励、服务为主线的政策体系,但与发达省份相比,在政策供给、需求牵引、针对性等方面还存在不足。据此,本研究提出,东北三省应立足区域实际,提升人才政策的系统性、精准性、时效性,聚焦政策供给、需求牵引、区域特色等关键问题,在人才政策的集成优化、创新发展上持续发力,以新时代人才政策变革引领和保障全面振兴、高质量发展。 展开更多
关键词 科技人才政策 主题识别 BERtopic模型 对比分析 东北振兴 政策供给
在线阅读 下载PDF
基于BERTopic模型的我国医学人工智能领域的主题识别与内容分析 被引量:1
3
作者 袁永旭 王涟 +2 位作者 殷彩明 孙一凡 陈俊冶 《中国数字医学》 2025年第4期89-96,共8页
目的:从主题识别和发展演化两个角度对我国医学人工智能的研究现状进行梳理分析,为学者进行相关研究提供借鉴和参考。方法:首先从中国知网、万方数据和维普网三大数据库中获取2012年-2023年我国医学人工智能领域的相关文献,再利用BERTo... 目的:从主题识别和发展演化两个角度对我国医学人工智能的研究现状进行梳理分析,为学者进行相关研究提供借鉴和参考。方法:首先从中国知网、万方数据和维普网三大数据库中获取2012年-2023年我国医学人工智能领域的相关文献,再利用BERTopic模型挖掘医学人工智能领域的研究主题和发展演化趋势。结果:研究主题覆盖基础医学至临床实践的完整链条,体现学科复杂性与多维性;核心方向聚焦医学教育与基础研究、临床技术创新、医疗数据挖掘及公共卫生管理四大领域;热点呈分化趋势,医学影像与网络模型研究、医学人工智能教育研究热度显著,精准医学与医疗数据挖掘具备发展潜能。结论:本研究揭示了医学人工智能领域主题动态与前沿方向,为优化学科布局、引导资源投入及推动技术转化提供参考依据。 展开更多
关键词 医学人工智能 BERtopic模型 主题分析 主题挖掘
在线阅读 下载PDF
基于BERTopic模型的美国国防部关键科技资助项目主题挖掘与演化分析
4
作者 杨阳 郑禧潓 +1 位作者 张雯 李刚 《图书与情报》 北大核心 2025年第5期34-46,共13页
美国作为全球科技和军事强国,其科技研发资助策略和方向对全球科技格局具有深远影响。文章基于BERTopic主题模型对2015年-2024年美国国防部关键科技资助项目进行主题挖掘和演化趋势分析,从主题分布及动态演化趋势角度对美国关键科技资... 美国作为全球科技和军事强国,其科技研发资助策略和方向对全球科技格局具有深远影响。文章基于BERTopic主题模型对2015年-2024年美国国防部关键科技资助项目进行主题挖掘和演化趋势分析,从主题分布及动态演化趋势角度对美国关键科技资助的战略布局及其构成因素进行了实证分析和系统梳理。美国国防部关键科技资助项目涵盖83个主题,大多数主题在时间维度上的频率变化相对平稳,仅少数主题呈现出显著波动或快速增长态势,体现了美国“集中资源突破核心领域,广泛布局孕育未来方向”的关键技术资助战略。总体来看,美国国防部在推进科技创新的过程中实现了基础研究与应用研究的协同并进,构建起以国家安全为导向的前沿技术生态体系。 展开更多
关键词 美国国防部 关键科技资助项目 主题挖掘 动态演化分析 BERtopic主题模型
在线阅读 下载PDF
基于BERTopic的生成式人工智能主题图谱与演化分析
5
作者 冯丹娃 王金舟 《情报科学》 北大核心 2025年第6期71-81,共11页
【目的/意义】自2022年底OpenAI发布ChatGPT以来,生成式人工智能在多个领域有了快速发展。厘清生成式人工智能在学术界的研究主题结构及其演化趋势,以揭示该领域研究热点的动态变化规律与未来发展方向。【方法/过程】运用BERTopic主题... 【目的/意义】自2022年底OpenAI发布ChatGPT以来,生成式人工智能在多个领域有了快速发展。厘清生成式人工智能在学术界的研究主题结构及其演化趋势,以揭示该领域研究热点的动态变化规律与未来发展方向。【方法/过程】运用BERTopic主题模型进行文本语义嵌入、UMAP降维与HDBSCAN密度聚类,并结合动态主题分析,精准识别研究主题并绘制主题演化路径。【结果/结论】识别出智能教育技术、风险与技术治理、智能内容服务等20个具体研究主题并绘制主题图谱,呈现出研究热点由技术探索逐步转向应用细化的演化趋势。其中,智能教育领域长期处于研究热点中心,风险治理主题稳步升温。动态分析发现,主题演化存在明显的聚合与分化路径,体现了跨学科融合与主题专业化的双重特征。【创新/局限】技术与方法的双重创新,提高了研究结果的可视性与解释力。然而,研究数据来源的单一性可能导致某些研究主题未被充分覆盖。 展开更多
关键词 生成式人工智能 BERtopic模型 动态主题分析 主题图谱 演化分析
原文传递
基于BERTopic模型的高校图书馆阅读推广主题研究及主题热度分析
6
作者 申胡日查 《情报探索》 2025年第5期18-26,共9页
[目的/意义]利用BERTopic模型对高校图书馆阅读推广研究成果进行主题提取,梳理高校阅读推广主题及研究方向、演变趋势,探索研究发展的方向。[方法/过程]首先,从CNKI数据库检索并下载“高校图书馆阅读推广”相关的所有期刊论文并删除与... [目的/意义]利用BERTopic模型对高校图书馆阅读推广研究成果进行主题提取,梳理高校阅读推广主题及研究方向、演变趋势,探索研究发展的方向。[方法/过程]首先,从CNKI数据库检索并下载“高校图书馆阅读推广”相关的所有期刊论文并删除与主题无关的内容形成研究数据集。然后,以论文的关键词构建自定义字典,利用Python对数据集进行停用词处理并分词。最后,利用BERTopic模型挖掘主题、研究趋势、并展现主题研究热度变化。[结果/结论]模型识别出新媒体阅读推广、阅读服务、阅读行为、微信阅读推广等高频率研究主题。根据主题内容归纳出基础理论研究、评估评价体系研究等研究方向并识别出“红色阅读推广”“短视频阅读推广”等热门研究主题。 展开更多
关键词 主题建模 BERtopic 主题识别 研究主题 研究方向
在线阅读 下载PDF
基于BERTopic模型的国内物流配送研究新动向
7
作者 王莉亚 吴昊 《中国商论》 2025年第19期83-86,共4页
为了系统梳理物流配送领域的研究现状与发展趋势,本文以CNKI数据库中收录的相关高质量研究文献为数据源,运用BERTopic模型和层次聚类法识别该领域的研究热点,并追踪研究前沿发展状况。研究发现,当前国内物流配送领域的研究热点主要集中... 为了系统梳理物流配送领域的研究现状与发展趋势,本文以CNKI数据库中收录的相关高质量研究文献为数据源,运用BERTopic模型和层次聚类法识别该领域的研究热点,并追踪研究前沿发展状况。研究发现,当前国内物流配送领域的研究热点主要集中在以下5个方面:物流配送中心选址和建设研究、物流配送路径优化研究、电子商务环境下的物流配送研究、农产品物流配送研究及物流配送在连锁企业中的应用研究。未来,物流配送领域研究的主动力将是技术驱动和系统化管理,尤其是人工智能、大数据、物联网等新兴技术将在物流配送领域发挥更大的作用;物流配送将更加注重个性化服务,提供更灵活的解决方案,以满足客户的多样化需求。同时,绿色可持续发展也将成为重要议题,通过优化资源利用和减少碳排放,推动物流配送行业的可持续发展。 展开更多
关键词 物流配送 BERtopic模型 研究热点 趋势预测 绿色可持续
在线阅读 下载PDF
基于BERTopic模型的国内图书馆读者服务研究领域主题挖掘与演化分析
8
作者 龚花萍 郭紫梅 贺蔚敏 《图书馆研究》 2025年第4期104-114,共11页
本研究旨在挖掘国内图书馆读者服务研究领域的主题分布与演化趋势,以期揭示研究现状,为图书馆读者服务工作的优化提供实证依据。以中国知网数据库收录的1992—2023年期间关于图书馆读者服务研究主题的2288篇文献作为数据集,运用深度学习... 本研究旨在挖掘国内图书馆读者服务研究领域的主题分布与演化趋势,以期揭示研究现状,为图书馆读者服务工作的优化提供实证依据。以中国知网数据库收录的1992—2023年期间关于图书馆读者服务研究主题的2288篇文献作为数据集,运用深度学习BERTopic模型挖掘和合并主题,并借助DTM动态主题模型分析主题演化趋势。研究结果发现:国内图书馆读者服务领域的研究方向主要集中在5个方面,分别为以读者为主体的研究、特殊读者群体服务研究、参考咨询服务研究、读者服务工作变革研究和读者服务个性化研究;同时,在经历两次技术驱动增长后,该领域整体研究热度呈现下降趋势,图书馆读者服务研究领域正处于稳定发展阶段。在未来实践中,图书馆读者服务工作应该坚持贯彻“以人文本”服务思想、深化新兴技术应用并积极探索服务价值外延,实现图书馆读者服务工作的创新与优化。 展开更多
关键词 图书馆读者服务 BERtopic模型 主题挖掘 演化分析
在线阅读 下载PDF
融合Finetuned-BERTopic和大模型的技术主题识别方法研究 被引量:3
9
作者 张凯 杨敏纳 隗玲 《情报理论与实践》 北大核心 2025年第3期189-198,共10页
[目的/意义]文章提出一种结合科技文本预训练语言模型微调的BERTopic和大模型的技术主题识别方法,深入学习科技文本内容中蕴含的语义特征,从非结构化的科技文本中识别技术主题,并对其进行自动解读以归纳生成主题标签,减少人工干预,进一... [目的/意义]文章提出一种结合科技文本预训练语言模型微调的BERTopic和大模型的技术主题识别方法,深入学习科技文本内容中蕴含的语义特征,从非结构化的科技文本中识别技术主题,并对其进行自动解读以归纳生成主题标签,减少人工干预,进一步提升技术主题识别的确度与效度,为扩展和丰富技术主题识别研究方法体系提供理论与工具支持。[方法/过程]采用PAT SPECTER预训练语言模型对科技文本进行向量化表征,结合KeyBERT构建Finetuned-BERTopic模型,建模技术词汇间的语义关联关系,抽取特定领域的技术术语,以技术术语为表征单位对科技文本中蕴含的技术主题进行识别;使用GPT-4o大模型和提示工程对上述识别的技术主题内容进行自动评价并解读生成主题标签;在此基础上,以生成式人工智能领域为例,验证本文方法的有效性。[结果/结论]实验验证表明,对比LDA主题模型、Top2Vec、BERTopic等模型,文章提出的方法有效提高了技术主题识别的准确性,且可显著减少人工干预,实现更高效的技术主题发现。 展开更多
关键词 科技文本 技术主题识别 微调的BERtopic 大语言模型 生成式人工智能
原文传递
我国政府数据开放研究与国家战略所需的匹配度分析——基于BERTopic模型与扎根理论 被引量:1
10
作者 吴应强 李白杨 +1 位作者 费巍 黄平平 《情报科学》 北大核心 2025年第1期117-126,共10页
【目的/意义】识别我国政府数据开放相关研究主题与战略发展方向,探究我国政府数据开放研究与国家发展战略的匹配性。【方法/过程】采用BERTopic模型对2010-2023年期间CNKI数据库中政府数据开放相关文献进行主题挖掘,借助扎根理论对12... 【目的/意义】识别我国政府数据开放相关研究主题与战略发展方向,探究我国政府数据开放研究与国家发展战略的匹配性。【方法/过程】采用BERTopic模型对2010-2023年期间CNKI数据库中政府数据开放相关文献进行主题挖掘,借助扎根理论对12份政府数据开放内容相关国家级政策文件归纳梳理战略发展方向。【结果/结论】我国政府数据开放研究可分为14个主题,国家战略发展方向可分为6个子范畴和13个初始范畴,经对比分析发现,政府数据开放相关研究与我国国家发展战略具有较高的匹配程度,表明学界研究在对接国家政策需求与发展战略过程中具有较强主动性与一致性。【创新/局限】结合利用BERTopic模型与扎根理论思想,探究我国政府数据开放研究与国家发展战略的匹配性。但本文主题挖掘模型单一,未进行多种模型结果的对比;需进一步完善、补充自定义词表,加强主题特征的提取;未来可考虑使用词汇关联的形式呈现政策文件内容结构,有助于可视化展示国家战略发展方向。 展开更多
关键词 政府数据开放 政策文本 文本挖掘 主题挖掘 BERtopic模型 扎根理论
原文传递
基于BERTopic和LSTM模型的新兴主题预测研究 被引量:5
11
作者 张家惠 丁敬达 《情报科学》 北大核心 2025年第1期98-105,126,共9页
【目的/意义】相比新兴主题的回溯性探测,对新兴主题进行预测研究可以提高新兴主题识别的准确性和前瞻性,有助于丰富新兴主题探测分析的方法体系。【方法/过程】首先,利用BERTopic模型得到领域系列主题;其次,基于文档频率、引用频率、Ps... 【目的/意义】相比新兴主题的回溯性探测,对新兴主题进行预测研究可以提高新兴主题识别的准确性和前瞻性,有助于丰富新兴主题探测分析的方法体系。【方法/过程】首先,利用BERTopic模型得到领域系列主题;其次,基于文档频率、引用频率、Pscore和新兴分数构建模型预测特征集;然后基于主题前三年特征集数据采用LSTM模型预测后两年新兴分数,判断得到领域新兴主题。【结果/结论】构建基于BERTopic和LSTM模型的新兴主题预测方法,并以数据安全领域为例进行实证研究,通过和BP、SVM模型以及相关研究结果的比较表明该方法得到的新兴主题更加有效和合理。【创新/局限】融合新颖性、增长性和影响性特征,构建单一指标新兴分数来预测新兴主题,但没有考虑对未来可能出现主题的预测。 展开更多
关键词 BERtopic模型 神经网络 LSTM 预测 新兴主题 数据安全
原文传递
基于BERTopic的人工智能应用场景主题建模研究
12
作者 刘湘贝 严亚兰 查先进 《图书与情报》 北大核心 2025年第3期46-55,共10页
在国家大力推动人工智能场景应用的背景下,文章利用BERTopic考察人工智能应用场景的主题模型。首先,在澎湃新闻网搜集数据,经清洗后得到3524条新闻数据。在主题建模中,先利用Conan-embedding-v1预训练大模型实现文本嵌入,再利用UMAP、HD... 在国家大力推动人工智能场景应用的背景下,文章利用BERTopic考察人工智能应用场景的主题模型。首先,在澎湃新闻网搜集数据,经清洗后得到3524条新闻数据。在主题建模中,先利用Conan-embedding-v1预训练大模型实现文本嵌入,再利用UMAP、HDBSCAN和c-TF-IDF进行降维、聚类和主题表征,最后利用KeyBERT微调技术对主题词进行优化。在主题模型分析中,结合技术研发、文化数字化、区域经济协同、经济发展、金融创新、资本市场、医疗养老、政策协同、低空经济、城市发展、新闻传播11个主题进行了主题词分析。主题相似性分析表明不同主题之间存在强关联性:城市发展与经济发展、金融创新、政策协同三个主题的相似性较高,经济发展与金融创新、政策协同两个主题相似性较高;层次聚类及文档分布分析表明技术研发、文化数字化和政策协同与其他主题存在不同程度的交叉渗透现象。研究结果在一定程度上展现了催生人工智能颠覆性应用的场景现状、潜在需求和关联要素。 展开更多
关键词 BERtopic 人工智能 应用场景 主题建模 颠覆性应用
在线阅读 下载PDF
基于BERTopic主题建模的“Assessing Writing”研究趋势演化分析
13
作者 李锦焱 张丹 高慧敏 《河南科技大学学报(自然科学版)》 北大核心 2025年第4期97-104,M0008,共9页
通过深入挖掘期刊研究主题与预测学术发展趋势,研究人员能够更精准地把握学科方向,紧跟前沿动态。然而,期刊摘要作为短文本,其结构化特点、高维稀疏的向量表示、语义结构复杂性以及数据噪声等因素,对传统主题建模方法构成了严峻挑战。... 通过深入挖掘期刊研究主题与预测学术发展趋势,研究人员能够更精准地把握学科方向,紧跟前沿动态。然而,期刊摘要作为短文本,其结构化特点、高维稀疏的向量表示、语义结构复杂性以及数据噪声等因素,对传统主题建模方法构成了严峻挑战。针对这一问题,提出了一种基于BERTopic的主题演化分析模型。模型融合了预训练语言模型在语义表征方面的优势与层次化聚类算法的结构建模能力,同时重构词项加权策略,引入词频的次线性变换机制以优化传统词权计算方法,从而有效削弱高频词的干扰,突出对区分主题具有关键意义的词项,显著提升了模型的主题区分度和语义表征能力。以“Assessing Writing”期刊为研究对象,围绕不同时期写作评估领域的研究成果开展实证分析。通过系统梳理各阶段的研究主题与发展方向,挖掘其动态演化规律。实验结果表明,能够准确捕捉写作评估领域的研究热点变化,清晰揭示其发展脉络,在处理期刊摘要等短文本数据时展现出良好的实用性与有效性,为相关领域的学术研究和趋势预测提供了可靠的技术支撑。 展开更多
关键词 主题建模 BERtopic 语义结构 主题表征 次线性变换
在线阅读 下载PDF
Enhancing BERTopic with Pre-Clustered Knowledge: Reducing Feature Sparsity in Short Text Topic Modeling
14
作者 Qian Wang Biao Ma 《Journal of Data Analysis and Information Processing》 2024年第4期597-611,共15页
Modeling topics in short texts presents significant challenges due to feature sparsity, particularly when analyzing content generated by large-scale online users. This sparsity can substantially impair semantic captur... Modeling topics in short texts presents significant challenges due to feature sparsity, particularly when analyzing content generated by large-scale online users. This sparsity can substantially impair semantic capture accuracy. We propose a novel approach that incorporates pre-clustered knowledge into the BERTopic model while reducing the l2 norm for low-frequency words. Our method effectively mitigates feature sparsity during cluster mapping. Empirical evaluation on the StackOverflow dataset demonstrates that our approach outperforms baseline models, achieving superior Macro-F1 scores. These results validate the effectiveness of our proposed feature sparsity reduction technique for short-text topic modeling. 展开更多
关键词 topic model BERtopic Short Text Feature Sparsity CLUSTER
在线阅读 下载PDF
融合BERTopic和LSTM的LIS学科AI研究主题演变分析及趋势预测 被引量:1
15
作者 徐汉青 《情报科学》 北大核心 2025年第5期105-116,共12页
【目的/意义】本文旨在梳理人工智能(AI)在图书情报学(LIS)中的研究进展及未来趋势,为LIS学科的研究方向规划、资源配置及科研政策制定提供重要参考。【方法/过程】基于BERTopic模型识别研究主题,采用主题强度和主题词共现网络追踪主题... 【目的/意义】本文旨在梳理人工智能(AI)在图书情报学(LIS)中的研究进展及未来趋势,为LIS学科的研究方向规划、资源配置及科研政策制定提供重要参考。【方法/过程】基于BERTopic模型识别研究主题,采用主题强度和主题词共现网络追踪主题及知识结构演变,并利用长短期记忆网络(LSTM)预测主题发展趋势,全面展现LIS学科中AI研究的动态和未来趋势。【结果/结论】主题演化分析表明,临床数据分析与健康信息模型、信息检索、社交媒体情感分析和AI决策是LIS学科AI研究的持续核心主题。主题词共现网络演变揭示了,研究重心逐渐从传统的数据驱动向大语言模型的广泛应用转移,未来研究将更加聚焦于大语言模型的构建、解释及应用。LSTM模型预测显示,信息检索、引文分析、AI治理和人机交互与信任四个主题将在未来几年呈现显著的增长趋势。此外,AI与图书馆服务、AI算法公正与偏见以及数据隐私与安全等主题也展现出成为潜在热门主题的增长潜力。【创新/局限】本研究首次在LIS学科中结合BERTopic和LSTM模型,进行更具前瞻性和应用价值的主题演化分析与趋势预测。研究的局限在于模型预测依赖单一数据维度,未来研究需引入多维特征,以提高预测的准确性和科学性。 展开更多
关键词 图书情报学 人工智能 BERtopic模型 长短期记忆网络 主题预测
原文传递
基于BERTopic和A-Kano模型的冲锋衣用户需求研究
16
作者 李玉鹏 蒋玉 李祺 《丝绸》 北大核心 2025年第11期62-71,共10页
本文旨在探析冲锋衣用户在网购过程中的真实需求,为相关企业制定相关市场策略提供依据。本研究对京东商城中国内外16个冲锋衣品牌的40016条在线评论进行主题建模,以此识别用户对冲锋衣产品及相关服务的核心需求要素。并借助A-Kano模型... 本文旨在探析冲锋衣用户在网购过程中的真实需求,为相关企业制定相关市场策略提供依据。本研究对京东商城中国内外16个冲锋衣品牌的40016条在线评论进行主题建模,以此识别用户对冲锋衣产品及相关服务的核心需求要素。并借助A-Kano模型揭示各项需求要素对用户满意度的作用差异,进而实现冲锋衣用户需求的层级划分以及供给优先序确认。结果表明,防水性、布面疵点等7项需求是建立用户满意度的首要因素;防寒性、客服态度等12项需求是提升用户满意度的关键因素;防水拉链、无噪音面料等4项需求则是超出用户预期且显著提升用户满意度的重要因素。 展开更多
关键词 冲锋衣 用户需求 主题建模 在线评论 BERtopic A-Kano模型
在线阅读 下载PDF
Enhancing Exam Preparation through Topic Modelling and Key Topic Identification
17
作者 Rudraneel Dutta Shreya Mohanty 《Journal on Artificial Intelligence》 2024年第1期177-192,共16页
Traditionally,exam preparation involves manually analyzing past question papers to identify and prioritize key topics.This research proposes a data-driven solution to automate this process using techniques like Docume... Traditionally,exam preparation involves manually analyzing past question papers to identify and prioritize key topics.This research proposes a data-driven solution to automate this process using techniques like Document Layout Segmentation,Optical Character Recognition(OCR),and Latent Dirichlet Allocation(LDA)for topic modelling.This study aims to develop a system that utilizes machine learning and topic modelling to identify and rank key topics from historical exam papers,aiding students in efficient exam preparation.The research addresses the difficulty in exam preparation due to the manual and labour-intensive process of analyzing past exam papers to identify and prioritize key topics.This approach is designed to streamline and optimize exam preparation,making it easier for students to focus on the most relevant topics,thereby using their efforts more effectively.The process involves three stages:(i)Document Layout Segmentation and Data Preparation,using deep learning techniques to separate text from non-textual content in past exam papers,(ii)Text Extraction and Processing using OCR to convert images into machine-readable text,and(iii)Topic Modeling with LDA to identify key topics covered in the exams.The research demonstrates the effectiveness of the proposed method in identifying and prioritizing key topics from exam papers.The LDA model successfully extracts relevant themes,aiding students in focusing their study efforts.The research presents a promising approach for optimizing exam preparation.By leveraging machine learning and topic modelling,the system offers a data-driven and efficient solution for students to prioritize their study efforts.Future work includes expanding the dataset size to further enhance model accuracy.Additionally,integration with educational platforms holds potential for personalized recommendations and adaptive learning experiences. 展开更多
关键词 topic modelling document layout segmentation optical character recognition latent dirichlet allocation
在线阅读 下载PDF
基于BERTopic的残疾儿童康复救助政策主题识别及演化分析
18
作者 谢逸钧 邵瑛琦 +1 位作者 姜成华 吴恒璟 《医学信息学杂志》 2025年第10期51-57,75,共8页
目的/意义探析中国残疾儿童康复救助政策的主题结构及演化特征,为优化残疾儿童康复救助政策提供依据。方法/过程基于BERTopic模型,对1986—2024年中央层面发布的政策文本进行语义聚类与动态分析,从发布节奏、结构组织与功能演进3个维度... 目的/意义探析中国残疾儿童康复救助政策的主题结构及演化特征,为优化残疾儿童康复救助政策提供依据。方法/过程基于BERTopic模型,对1986—2024年中央层面发布的政策文本进行语义聚类与动态分析,从发布节奏、结构组织与功能演进3个维度识别政策体系演变路径。结果/结论中国残疾儿童康复救助政策呈现从功能补偿向制度支持的演进趋势,应进一步加强跨部门协同,推进差异化补贴,建立“政策-服务”联动评估机制。 展开更多
关键词 残疾儿童 康复救助 政策演化 主题建模 BERtopic
暂未订购
基于改进的BERTopic模型的政策文本主题挖掘
19
作者 王雨琪 刘晨 +1 位作者 刘建炜 蔡宏民 《计算机技术与发展》 2025年第5期90-96,共7页
自然语言处理技术在文本分析中的应用,显著提高了从海量数据中提取关键信息的效率。基于自然语言处理技术的主题分析方法也在文本分析领域中取得了一定成果。然而,由于政策文本数据具有场景复杂、文本长和头部效应等挑战,现有的主题挖... 自然语言处理技术在文本分析中的应用,显著提高了从海量数据中提取关键信息的效率。基于自然语言处理技术的主题分析方法也在文本分析领域中取得了一定成果。然而,由于政策文本数据具有场景复杂、文本长和头部效应等挑战,现有的主题挖掘方法生成的主题结果仍有较大的进步空间。针对政策文本主题建模的挑战,该文基于BERTopic方法,引入了动态文档嵌入优化器和流行度纠偏正则化项。分别克服了BERTopic只能在固定维度挖掘主题导致的普适性不足以及受到词级别的流行度偏差影响导致的主题结果同质化问题,实现了对最佳主题聚类向量维度的自动选择和对热门词汇的有效纠偏。通过对实验分析,改进后的BERTopic方法在主题一致性、主题多样性和综合质量指标上均显著优于原始BERTopic模型及先进的神经网络主题模型;在可视化结果上,生成的主题质量也显著优于原生模型。 展开更多
关键词 自然语言处理 主题模型 政策文本 BERtopic 流行度偏差
在线阅读 下载PDF
BERTopic在医疗领域文章主题挖掘中的应用与分析
20
作者 宋俊杰 尹裴 +1 位作者 邓诗语 袁逸馨 《软件工程》 2025年第4期62-66,72,共6页
文章采用BERTopic模型,对“好大夫在线”平台上的医学科普文章进行主题挖掘,旨在提升患者检索医疗信息的效率,并辅助医疗从业者精准把握医学话题的发展趋势,进而推动医疗事业的进步。针对医学文本信息量大、专业性强的特点,研究通过数... 文章采用BERTopic模型,对“好大夫在线”平台上的医学科普文章进行主题挖掘,旨在提升患者检索医疗信息的效率,并辅助医疗从业者精准把握医学话题的发展趋势,进而推动医疗事业的进步。针对医学文本信息量大、专业性强的特点,研究通过数据预处理、预训练嵌入模型ERNIE-Health,并细致调整模型参数,有效地解决了传统LDA(Latent Dirichlet Allocation)模型在医学文本处理任务中存在的局限性。实验结果显示,BERTopic模型成功识别出220个研究主题,且经OCTIS(Open Topic Modeling Toolkit for Interpretability and Similarity)框架评估,主题多样性得分为0.662,连贯性得分为0.991,显著提升了主题挖掘的准确性和可靠性。此项研究对医疗大数据中知识的深入挖掘具有重要意义。 展开更多
关键词 BERtopic 医学科普 主题挖掘 主题建模 自然语言处理
在线阅读 下载PDF
上一页 1 2 120 下一页 到第
使用帮助 返回顶部