期刊文献+
共找到13,485篇文章
< 1 2 250 >
每页显示 20 50 100
基于BERTopic主题模型的锂电池前沿监测及主题分析研究 被引量:1
1
作者 周洪 俞海龙 +1 位作者 王丽平 黄学杰 《储能科学与技术》 北大核心 2025年第1期406-416,共11页
随着锂电池领域论文数量的激增和研究主题的日益丰富,准确监测该领域的发展趋势和把握最新研究动向变得日益复杂。通过运用大数据和机器学习技术,采用BERTopic主题模型对Web of Science数据库中的18万余篇锂电池论文进行文本分析,绘制... 随着锂电池领域论文数量的激增和研究主题的日益丰富,准确监测该领域的发展趋势和把握最新研究动向变得日益复杂。通过运用大数据和机器学习技术,采用BERTopic主题模型对Web of Science数据库中的18万余篇锂电池论文进行文本分析,绘制了锂电池领域的主题图,识别了新兴研究主题和高被引主题。结果表明,锂电池研究活动正显著加速,锂硫电池、锂枝晶生长抑制、电池回收和金属回收等新兴主题快速发展,而材料研究如二硫化钼纳米材料、氧化铁电极材料则具有显著的高学术影响力。研究还探讨了《锂电池百篇论文点评系列》对当前锂电池研究主题的监测情况,该系列对多数科学技术主题有良好覆盖。本研究为锂电池领域的主题监测提供了新方法,为政策制定和技术研发提供了情报支持,并为“锂电池百篇论文点评”系列的后续研究提供了参考。 展开更多
关键词 锂电池 BERtopic 新兴主题 高被引主题 前沿监测
在线阅读 下载PDF
基于BERTopic的科技人才政策文本主题识别与量化分析——以东北三省为例 被引量:4
2
作者 苗宏慧 全情爽 舒心 《现代情报》 北大核心 2025年第4期110-121,共12页
[目的/意义]新时代东北全面振兴取决于科技人才的有力支撑,科技人才政策是推动科技创新与人才发展的重要制度保障。通过对科技人才政策进行系统的量化分析,旨在准确把握区域科技人才政策的框架结构和动态特征,为深化政策供给侧改革提供... [目的/意义]新时代东北全面振兴取决于科技人才的有力支撑,科技人才政策是推动科技创新与人才发展的重要制度保障。通过对科技人才政策进行系统的量化分析,旨在准确把握区域科技人才政策的框架结构和动态特征,为深化政策供给侧改革提供决策参考。[方法/过程]本研究以黑龙江省、吉林省、辽宁省三省的科技人才政策文本为研究对象,运用BERTopic模型对其政策文本进行主题识别、关键词提取、相似度计算等,在此基础上开展各省政策主题的纵横向比较,并与粤苏浙鲁等发达省份的政策进行对比分析。[结果/结论]东北三省科技人才政策已形成了以人才引进、培养、使用、评价、激励、服务为主线的政策体系,但与发达省份相比,在政策供给、需求牵引、针对性等方面还存在不足。据此,本研究提出,东北三省应立足区域实际,提升人才政策的系统性、精准性、时效性,聚焦政策供给、需求牵引、区域特色等关键问题,在人才政策的集成优化、创新发展上持续发力,以新时代人才政策变革引领和保障全面振兴、高质量发展。 展开更多
关键词 科技人才政策 主题识别 BERtopic模型 对比分析 东北振兴 政策供给
在线阅读 下载PDF
基于BERTopic模型的我国医学人工智能领域的主题识别与内容分析 被引量:1
3
作者 袁永旭 王涟 +2 位作者 殷彩明 孙一凡 陈俊冶 《中国数字医学》 2025年第4期89-96,共8页
目的:从主题识别和发展演化两个角度对我国医学人工智能的研究现状进行梳理分析,为学者进行相关研究提供借鉴和参考。方法:首先从中国知网、万方数据和维普网三大数据库中获取2012年-2023年我国医学人工智能领域的相关文献,再利用BERTo... 目的:从主题识别和发展演化两个角度对我国医学人工智能的研究现状进行梳理分析,为学者进行相关研究提供借鉴和参考。方法:首先从中国知网、万方数据和维普网三大数据库中获取2012年-2023年我国医学人工智能领域的相关文献,再利用BERTopic模型挖掘医学人工智能领域的研究主题和发展演化趋势。结果:研究主题覆盖基础医学至临床实践的完整链条,体现学科复杂性与多维性;核心方向聚焦医学教育与基础研究、临床技术创新、医疗数据挖掘及公共卫生管理四大领域;热点呈分化趋势,医学影像与网络模型研究、医学人工智能教育研究热度显著,精准医学与医疗数据挖掘具备发展潜能。结论:本研究揭示了医学人工智能领域主题动态与前沿方向,为优化学科布局、引导资源投入及推动技术转化提供参考依据。 展开更多
关键词 医学人工智能 BERtopic模型 主题分析 主题挖掘
在线阅读 下载PDF
基于BERTopic和长短期记忆网络(LSTM)模型的政策主题挖掘与预测研究——以工业互联网政策为例 被引量:1
4
作者 李艳 辛云丽 《科技管理研究》 2025年第9期31-41,共11页
通过对政策文本进行主题挖掘并预测其发展趋势,有助于明晰政策重点和趋势,为完善相关领域政策体系提供参考。首先从主题内容视角出发,引入新兴BERTopic模型挖掘潜在主题;其次增加时间维度,构建动态主题模型,从主题频率方面刻画主题演化... 通过对政策文本进行主题挖掘并预测其发展趋势,有助于明晰政策重点和趋势,为完善相关领域政策体系提供参考。首先从主题内容视角出发,引入新兴BERTopic模型挖掘潜在主题;其次增加时间维度,构建动态主题模型,从主题频率方面刻画主题演化趋势;再次,构建支持度指标,应用长短期记忆网络(LSTM)模型对政策热点进行定量预测,并与传统时间序列自回归移动平均模型(ARIMA)对比以验证模型拟合效果;最后以工业互联网领域2016—2023年发布的1304篇政策为例进行实证检验。检验结果表明,工业互联网相关政策可细分为15个核心主题,聚焦于创新应用、网络体系、平台建设、安全保障、资金奖励五大方面,随着时间的推移,工业互联网由初期的摸索借鉴转为规模化应用,政策主题也渐趋丰富。未来,数字赋能标杆平台、新型工业化信息化、标识解析体系的贯通应用或将成为热点方向,主题热度较高。 展开更多
关键词 BERtopic 政策文本 主题预测 长短期记忆网络 工业互联网
在线阅读 下载PDF
基于BERTopic模型的美国国防部关键科技资助项目主题挖掘与演化分析
5
作者 杨阳 郑禧潓 +1 位作者 张雯 李刚 《图书与情报》 北大核心 2025年第5期34-46,共13页
美国作为全球科技和军事强国,其科技研发资助策略和方向对全球科技格局具有深远影响。文章基于BERTopic主题模型对2015年-2024年美国国防部关键科技资助项目进行主题挖掘和演化趋势分析,从主题分布及动态演化趋势角度对美国关键科技资... 美国作为全球科技和军事强国,其科技研发资助策略和方向对全球科技格局具有深远影响。文章基于BERTopic主题模型对2015年-2024年美国国防部关键科技资助项目进行主题挖掘和演化趋势分析,从主题分布及动态演化趋势角度对美国关键科技资助的战略布局及其构成因素进行了实证分析和系统梳理。美国国防部关键科技资助项目涵盖83个主题,大多数主题在时间维度上的频率变化相对平稳,仅少数主题呈现出显著波动或快速增长态势,体现了美国“集中资源突破核心领域,广泛布局孕育未来方向”的关键技术资助战略。总体来看,美国国防部在推进科技创新的过程中实现了基础研究与应用研究的协同并进,构建起以国家安全为导向的前沿技术生态体系。 展开更多
关键词 美国国防部 关键科技资助项目 主题挖掘 动态演化分析 BERtopic主题模型
在线阅读 下载PDF
基于BERTopic模型的国内外数字学术服务的主题挖掘与演化分析
6
作者 郭顺利 张义文 初亚平 《图书馆学研究》 北大核心 2025年第9期2-13,23,共13页
当前数字学术服务正处于技术迭代与生态重构的关键阶段。系统性梳理国内外数字学术服务的研究热点主题与演化趋势,有利于为数字学术服务的转型和未来研究提供理论参考。利用BERTopic模型分别对国内外数字学术服务领域进行主题挖掘与演... 当前数字学术服务正处于技术迭代与生态重构的关键阶段。系统性梳理国内外数字学术服务的研究热点主题与演化趋势,有利于为数字学术服务的转型和未来研究提供理论参考。利用BERTopic模型分别对国内外数字学术服务领域进行主题挖掘与演化趋势分析,结果表明,国外研究更关注技术压力与伦理问题、数字学术交流模式、数字教育等方面,国内研究则侧重于数字人文实践与图书馆转型领域。未来,生成式人工智能驱动下的数字学术服务、社交媒体场景下的数字学术传播、数字学术空间建设等有望成为热门研究方向。 展开更多
关键词 BERtopic 数字学术服务 主题挖掘 研究热点 演化趋势
原文传递
基于BERTopic的生成式人工智能主题图谱与演化分析
7
作者 冯丹娃 王金舟 《情报科学》 北大核心 2025年第6期71-81,共11页
【目的/意义】自2022年底OpenAI发布ChatGPT以来,生成式人工智能在多个领域有了快速发展。厘清生成式人工智能在学术界的研究主题结构及其演化趋势,以揭示该领域研究热点的动态变化规律与未来发展方向。【方法/过程】运用BERTopic主题... 【目的/意义】自2022年底OpenAI发布ChatGPT以来,生成式人工智能在多个领域有了快速发展。厘清生成式人工智能在学术界的研究主题结构及其演化趋势,以揭示该领域研究热点的动态变化规律与未来发展方向。【方法/过程】运用BERTopic主题模型进行文本语义嵌入、UMAP降维与HDBSCAN密度聚类,并结合动态主题分析,精准识别研究主题并绘制主题演化路径。【结果/结论】识别出智能教育技术、风险与技术治理、智能内容服务等20个具体研究主题并绘制主题图谱,呈现出研究热点由技术探索逐步转向应用细化的演化趋势。其中,智能教育领域长期处于研究热点中心,风险治理主题稳步升温。动态分析发现,主题演化存在明显的聚合与分化路径,体现了跨学科融合与主题专业化的双重特征。【创新/局限】技术与方法的双重创新,提高了研究结果的可视性与解释力。然而,研究数据来源的单一性可能导致某些研究主题未被充分覆盖。 展开更多
关键词 生成式人工智能 BERtopic模型 动态主题分析 主题图谱 演化分析
原文传递
GenAI教育应用的未来:基于改进后的BERTopic工具的主题建模
8
作者 胡艺龄 陈煜 +1 位作者 何雨桐 顾小清 《现代教育技术》 2025年第7期44-53,共10页
生成式人工智能(Generative Artificial Intelligence,GenAI)技术及其应用的加速渗透,为全球人才竞争格局带来更多不稳定因素,其引发的变革正在重新定义知识、定义学习。囿于视角与方法的局限,目前针对GenAI赋能教育的综述研究尚未充分... 生成式人工智能(Generative Artificial Intelligence,GenAI)技术及其应用的加速渗透,为全球人才竞争格局带来更多不稳定因素,其引发的变革正在重新定义知识、定义学习。囿于视角与方法的局限,目前针对GenAI赋能教育的综述研究尚未充分挖掘文本之间的深层语义,也未建构系统性的应用框架。对此,文章探索性地从结构调整和算法选型两个方面对自动化主题建模工具BERTopic进行改进,设计了改进后的BERTopic主题聚类流程,并通过对比分析验证了改进后的BERTopic的主题聚类效果。应用改进后的BERTopic工具,文章从主题核心特征、演变趋势和层次关系三个方面剖析了GenAI教育应用的主题聚类结果,在此基础上建构了GenAI教育应用的主题模型。文章的研究对主题建模工具进行了探索性应用,拓展了GenAI教育应用的视角,可为推动GenAI赋能教育提供理论参考。 展开更多
关键词 生成式人工智能 BERtopic 人工智能教育应用 主题聚类
在线阅读 下载PDF
基于BERTopic模型的国内物流配送研究新动向
9
作者 王莉亚 吴昊 《中国商论》 2025年第19期83-86,共4页
为了系统梳理物流配送领域的研究现状与发展趋势,本文以CNKI数据库中收录的相关高质量研究文献为数据源,运用BERTopic模型和层次聚类法识别该领域的研究热点,并追踪研究前沿发展状况。研究发现,当前国内物流配送领域的研究热点主要集中... 为了系统梳理物流配送领域的研究现状与发展趋势,本文以CNKI数据库中收录的相关高质量研究文献为数据源,运用BERTopic模型和层次聚类法识别该领域的研究热点,并追踪研究前沿发展状况。研究发现,当前国内物流配送领域的研究热点主要集中在以下5个方面:物流配送中心选址和建设研究、物流配送路径优化研究、电子商务环境下的物流配送研究、农产品物流配送研究及物流配送在连锁企业中的应用研究。未来,物流配送领域研究的主动力将是技术驱动和系统化管理,尤其是人工智能、大数据、物联网等新兴技术将在物流配送领域发挥更大的作用;物流配送将更加注重个性化服务,提供更灵活的解决方案,以满足客户的多样化需求。同时,绿色可持续发展也将成为重要议题,通过优化资源利用和减少碳排放,推动物流配送行业的可持续发展。 展开更多
关键词 物流配送 BERtopic模型 研究热点 趋势预测 绿色可持续
在线阅读 下载PDF
基于BERTopic模型的高校图书馆阅读推广主题研究及主题热度分析
10
作者 申胡日查 《情报探索》 2025年第5期18-26,共9页
[目的/意义]利用BERTopic模型对高校图书馆阅读推广研究成果进行主题提取,梳理高校阅读推广主题及研究方向、演变趋势,探索研究发展的方向。[方法/过程]首先,从CNKI数据库检索并下载“高校图书馆阅读推广”相关的所有期刊论文并删除与... [目的/意义]利用BERTopic模型对高校图书馆阅读推广研究成果进行主题提取,梳理高校阅读推广主题及研究方向、演变趋势,探索研究发展的方向。[方法/过程]首先,从CNKI数据库检索并下载“高校图书馆阅读推广”相关的所有期刊论文并删除与主题无关的内容形成研究数据集。然后,以论文的关键词构建自定义字典,利用Python对数据集进行停用词处理并分词。最后,利用BERTopic模型挖掘主题、研究趋势、并展现主题研究热度变化。[结果/结论]模型识别出新媒体阅读推广、阅读服务、阅读行为、微信阅读推广等高频率研究主题。根据主题内容归纳出基础理论研究、评估评价体系研究等研究方向并识别出“红色阅读推广”“短视频阅读推广”等热门研究主题。 展开更多
关键词 主题建模 BERtopic 主题识别 研究主题 研究方向
在线阅读 下载PDF
基于BERTopic模型的国内图书馆读者服务研究领域主题挖掘与演化分析
11
作者 龚花萍 郭紫梅 贺蔚敏 《图书馆研究》 2025年第4期104-114,共11页
本研究旨在挖掘国内图书馆读者服务研究领域的主题分布与演化趋势,以期揭示研究现状,为图书馆读者服务工作的优化提供实证依据。以中国知网数据库收录的1992—2023年期间关于图书馆读者服务研究主题的2288篇文献作为数据集,运用深度学习... 本研究旨在挖掘国内图书馆读者服务研究领域的主题分布与演化趋势,以期揭示研究现状,为图书馆读者服务工作的优化提供实证依据。以中国知网数据库收录的1992—2023年期间关于图书馆读者服务研究主题的2288篇文献作为数据集,运用深度学习BERTopic模型挖掘和合并主题,并借助DTM动态主题模型分析主题演化趋势。研究结果发现:国内图书馆读者服务领域的研究方向主要集中在5个方面,分别为以读者为主体的研究、特殊读者群体服务研究、参考咨询服务研究、读者服务工作变革研究和读者服务个性化研究;同时,在经历两次技术驱动增长后,该领域整体研究热度呈现下降趋势,图书馆读者服务研究领域正处于稳定发展阶段。在未来实践中,图书馆读者服务工作应该坚持贯彻“以人文本”服务思想、深化新兴技术应用并积极探索服务价值外延,实现图书馆读者服务工作的创新与优化。 展开更多
关键词 图书馆读者服务 BERtopic模型 主题挖掘 演化分析
在线阅读 下载PDF
Research on the hysteresis effect of topic related evolution for emerging trends prediction
12
作者 Ziqiang Liu Haiyun Xu +1 位作者 Lixin Yue Zenghui Yue 《Journal of Data and Information Science》 2025年第3期52-77,共26页
Purpose:The study examines the synergy and hysteresis in the evolution of funding and its supported literature,depicts their temporal correlation mechanism,which aids in improving trend predictions.Design/methodology/... Purpose:The study examines the synergy and hysteresis in the evolution of funding and its supported literature,depicts their temporal correlation mechanism,which aids in improving trend predictions.Design/methodology/approach:The study uses the LDA model to identify topics in funding texts and supported papers.A cosine similarity algorithm was employed to estimate the nexus between topics and construct the topic evolution time series.Similarly,the hysteresis effect in topic evolution is analyzed based on topic popularity and content,leading to insights into their temporal correlation mechanism.Findings:The study finds that fund and sponsored paper topics exhibit strong collaboration with a noticeable lag in evolution.The fund topics significantly influence sponsored paper topics after a two-year lag.Moreover,the lag effect is inversely proportional to the topic’s similarity.Research limitations:We use the LDA model to determine the hysteresis effect in topic evolution despite its limitations in handling long-tail words and domain-specific vocabulary.Furthermore,the timing of the emergence of the focal topic in funds is undermined,affecting the findings.Practical implications:These findings enhance the accuracy and scientific validity of trend prediction.Estimating and identifying patterns can help technology managers anticipate future research hotspots,supporting informed decision-making and technology management.Originality/value:This study introduces a research framework to quantitatively and visually analyze the hysteresis effect,revealing the correlation and evolutionary patterns between fund research topics and their funded papers. 展开更多
关键词 Emerging trend prediction topic association topic evolution Hysteresis effect Lag period
在线阅读 下载PDF
融合BERTopic和Prompt的学者研究兴趣生成模型——以计算机科学领域为例 被引量:1
13
作者 李豪 张柏苑 +3 位作者 邵蝶语 杨婧 杨波 石燕青 《情报科学》 北大核心 2025年第1期127-136,160,共11页
【目的/意义】学者研究兴趣是学者画像的关键特征,本研究通过识别学者研究兴趣的变化过程,能够帮助补齐学术履历,对构建完整的学者画像以及面向前沿需求的精准人才发现具有重要意义。【方法/过程】构建计算机科学领域论文文本语料库,训... 【目的/意义】学者研究兴趣是学者画像的关键特征,本研究通过识别学者研究兴趣的变化过程,能够帮助补齐学术履历,对构建完整的学者画像以及面向前沿需求的精准人才发现具有重要意义。【方法/过程】构建计算机科学领域论文文本语料库,训练BERTopic主题模型,进行领域研究主题挖掘和学者研究兴趣特征识别。创建Prompt,利用LLM进行主题词提取,结合主题模型分析结果,进行学者研究兴趣描述。【结果/结论】对于学者研究兴趣描述任务,相较基准模型,融合模型的ROUGE得分平均相对提升8.2%,BERTScore得分相对提升4.5%。通过层次分析法发现,BERTopic与LLM融合模型的学者研究兴趣识别效果优于其他评测模型,模型人工评测满意度达到81.4%。【创新/局限】所构建模型能够更好地识别学者研究主题,生成的学者研究兴趣描述文本质量较高。使用的语料库内中文语料占比较大,模型对外文成果的识别能力欠佳。 展开更多
关键词 研究主题挖掘 研究兴趣描述 BERtopic PROMPT LLM
原文传递
基于BERTopic的新兴技术主题识别研究 被引量:5
14
作者 汪大锟 化柏林 《科技情报研究》 2025年第1期131-140,共10页
[目的/意义]识别并预见新兴技术,为企业和政府带来技术先发优势,及时把握技术发展趋势。[方法/过程]本研究采用BERTopic的主题建模方法获取领域主题分布,依据主题向量的余弦相似度合并论文和专利主题,实现新兴主题的识别。[结果/结论]运... [目的/意义]识别并预见新兴技术,为企业和政府带来技术先发优势,及时把握技术发展趋势。[方法/过程]本研究采用BERTopic的主题建模方法获取领域主题分布,依据主题向量的余弦相似度合并论文和专利主题,实现新兴主题的识别。[结果/结论]运用BERTopic主题建模方法结合指标评价,能够实现新兴主题与新兴术语的有效识别。以新能源汽车领域为例开展实证研究,使用划分验证期和资料验证法2种方式进行验证,在识别出的16项主题中有12项通过验证,证实了本研究方法的有效性。 展开更多
关键词 新兴技术 主题识别 BERtopic 新能源汽车
在线阅读 下载PDF
融合Finetuned-BERTopic和大模型的技术主题识别方法研究 被引量:3
15
作者 张凯 杨敏纳 隗玲 《情报理论与实践》 北大核心 2025年第3期189-198,共10页
[目的/意义]文章提出一种结合科技文本预训练语言模型微调的BERTopic和大模型的技术主题识别方法,深入学习科技文本内容中蕴含的语义特征,从非结构化的科技文本中识别技术主题,并对其进行自动解读以归纳生成主题标签,减少人工干预,进一... [目的/意义]文章提出一种结合科技文本预训练语言模型微调的BERTopic和大模型的技术主题识别方法,深入学习科技文本内容中蕴含的语义特征,从非结构化的科技文本中识别技术主题,并对其进行自动解读以归纳生成主题标签,减少人工干预,进一步提升技术主题识别的确度与效度,为扩展和丰富技术主题识别研究方法体系提供理论与工具支持。[方法/过程]采用PAT SPECTER预训练语言模型对科技文本进行向量化表征,结合KeyBERT构建Finetuned-BERTopic模型,建模技术词汇间的语义关联关系,抽取特定领域的技术术语,以技术术语为表征单位对科技文本中蕴含的技术主题进行识别;使用GPT-4o大模型和提示工程对上述识别的技术主题内容进行自动评价并解读生成主题标签;在此基础上,以生成式人工智能领域为例,验证本文方法的有效性。[结果/结论]实验验证表明,对比LDA主题模型、Top2Vec、BERTopic等模型,文章提出的方法有效提高了技术主题识别的准确性,且可显著减少人工干预,实现更高效的技术主题发现。 展开更多
关键词 科技文本 技术主题识别 微调的BERtopic 大语言模型 生成式人工智能
原文传递
基于BERTopic模型的国际开放科学主题挖掘研究 被引量:1
16
作者 卢加文 陈雅 《国家图书馆学刊》 北大核心 2025年第2期99-112,F0003,共15页
把握国际开放科学研究热点主题与特点,对于我国在该领域的研究发展具有重要意义。本研究数据来源于Web of Science核心合集,通过BERTopic主题模型得到学术出版开放获取、开放研究数据、开放科学工具、开放科学伦理道德、开放科学政策、... 把握国际开放科学研究热点主题与特点,对于我国在该领域的研究发展具有重要意义。本研究数据来源于Web of Science核心合集,通过BERTopic主题模型得到学术出版开放获取、开放研究数据、开放科学工具、开放科学伦理道德、开放科学政策、开放科学教育、同行评审和开放科学评估8个研究热点主题。基于建模结果和文本分析梳理发现,国际开放科学研究呈现出开放获取学科覆盖面广、重视基础设施建设和强调规范框架构建等特征。未来我国研究者需拓展学科覆盖面,增加开放获取研究维度;完善开放工具设施,重视开放意识培养;全面审视开放科学,加速构建规范体系。图7。表1。参考文献74。 展开更多
关键词 开放科学 主题挖掘 BERtopic 开放获取
在线阅读 下载PDF
基于BERTopic模型的国内政府数据开放研究主题挖掘及内容分析 被引量:1
17
作者 程越欣 杨峰 郭剑明 《图书馆学研究》 北大核心 2025年第5期26-37,65,共13页
目前,政府数据开放已成为加速数字经济发展、推进数字政府建设与促进数字社会转型的重要驱动力。近年来,中国业界和学界对政府数据开放研究议题投入了较高的关注度与研究热情。现阶段亟需对该领域的研究进行系统梳理,以回应数智时代对... 目前,政府数据开放已成为加速数字经济发展、推进数字政府建设与促进数字社会转型的重要驱动力。近年来,中国业界和学界对政府数据开放研究议题投入了较高的关注度与研究热情。现阶段亟需对该领域的研究进行系统梳理,以回应数智时代对政府数据开放研究的理论需求,为相关研究和实践工作提供科学参考。以中国知网数据库收录的2010—2024年间1495篇政府数据开放相关文献作为数据来源,基于主题建模方法BERTopic对政府数据开放领域文献进行主题挖掘和内容分析。政府数据开放研究在过去的十余年间发展迅猛,重点关注涵盖了现实路径、价值共创、法制建构、政策战略分析、信息安全和隐私保护、数据开放开发和流通使用、用户行为、平台评价及元数据管理等方向。展望未来路向,需从夯实顶层设计、导入价值理性、借鉴前沿动向及丰富研究视角4个维度入手,促进政府数据开放领域研究的进步与繁荣。 展开更多
关键词 政府数据 数据开放 BERtopic 主题挖掘 内容分析
原文传递
我国政府数据开放研究与国家战略所需的匹配度分析——基于BERTopic模型与扎根理论 被引量:1
18
作者 吴应强 李白杨 +1 位作者 费巍 黄平平 《情报科学》 北大核心 2025年第1期117-126,共10页
【目的/意义】识别我国政府数据开放相关研究主题与战略发展方向,探究我国政府数据开放研究与国家发展战略的匹配性。【方法/过程】采用BERTopic模型对2010-2023年期间CNKI数据库中政府数据开放相关文献进行主题挖掘,借助扎根理论对12... 【目的/意义】识别我国政府数据开放相关研究主题与战略发展方向,探究我国政府数据开放研究与国家发展战略的匹配性。【方法/过程】采用BERTopic模型对2010-2023年期间CNKI数据库中政府数据开放相关文献进行主题挖掘,借助扎根理论对12份政府数据开放内容相关国家级政策文件归纳梳理战略发展方向。【结果/结论】我国政府数据开放研究可分为14个主题,国家战略发展方向可分为6个子范畴和13个初始范畴,经对比分析发现,政府数据开放相关研究与我国国家发展战略具有较高的匹配程度,表明学界研究在对接国家政策需求与发展战略过程中具有较强主动性与一致性。【创新/局限】结合利用BERTopic模型与扎根理论思想,探究我国政府数据开放研究与国家发展战略的匹配性。但本文主题挖掘模型单一,未进行多种模型结果的对比;需进一步完善、补充自定义词表,加强主题特征的提取;未来可考虑使用词汇关联的形式呈现政策文件内容结构,有助于可视化展示国家战略发展方向。 展开更多
关键词 政府数据开放 政策文本 文本挖掘 主题挖掘 BERtopic模型 扎根理论
原文传递
基于BERTopic和LSTM模型的新兴主题预测研究 被引量:5
19
作者 张家惠 丁敬达 《情报科学》 北大核心 2025年第1期98-105,126,共9页
【目的/意义】相比新兴主题的回溯性探测,对新兴主题进行预测研究可以提高新兴主题识别的准确性和前瞻性,有助于丰富新兴主题探测分析的方法体系。【方法/过程】首先,利用BERTopic模型得到领域系列主题;其次,基于文档频率、引用频率、Ps... 【目的/意义】相比新兴主题的回溯性探测,对新兴主题进行预测研究可以提高新兴主题识别的准确性和前瞻性,有助于丰富新兴主题探测分析的方法体系。【方法/过程】首先,利用BERTopic模型得到领域系列主题;其次,基于文档频率、引用频率、Pscore和新兴分数构建模型预测特征集;然后基于主题前三年特征集数据采用LSTM模型预测后两年新兴分数,判断得到领域新兴主题。【结果/结论】构建基于BERTopic和LSTM模型的新兴主题预测方法,并以数据安全领域为例进行实证研究,通过和BP、SVM模型以及相关研究结果的比较表明该方法得到的新兴主题更加有效和合理。【创新/局限】融合新颖性、增长性和影响性特征,构建单一指标新兴分数来预测新兴主题,但没有考虑对未来可能出现主题的预测。 展开更多
关键词 BERtopic模型 神经网络 LSTM 预测 新兴主题 数据安全
原文传递
基于BERTopic的人工智能应用场景主题建模研究
20
作者 刘湘贝 严亚兰 查先进 《图书与情报》 北大核心 2025年第3期46-55,共10页
在国家大力推动人工智能场景应用的背景下,文章利用BERTopic考察人工智能应用场景的主题模型。首先,在澎湃新闻网搜集数据,经清洗后得到3524条新闻数据。在主题建模中,先利用Conan-embedding-v1预训练大模型实现文本嵌入,再利用UMAP、HD... 在国家大力推动人工智能场景应用的背景下,文章利用BERTopic考察人工智能应用场景的主题模型。首先,在澎湃新闻网搜集数据,经清洗后得到3524条新闻数据。在主题建模中,先利用Conan-embedding-v1预训练大模型实现文本嵌入,再利用UMAP、HDBSCAN和c-TF-IDF进行降维、聚类和主题表征,最后利用KeyBERT微调技术对主题词进行优化。在主题模型分析中,结合技术研发、文化数字化、区域经济协同、经济发展、金融创新、资本市场、医疗养老、政策协同、低空经济、城市发展、新闻传播11个主题进行了主题词分析。主题相似性分析表明不同主题之间存在强关联性:城市发展与经济发展、金融创新、政策协同三个主题的相似性较高,经济发展与金融创新、政策协同两个主题相似性较高;层次聚类及文档分布分析表明技术研发、文化数字化和政策协同与其他主题存在不同程度的交叉渗透现象。研究结果在一定程度上展现了催生人工智能颠覆性应用的场景现状、潜在需求和关联要素。 展开更多
关键词 BERtopic 人工智能 应用场景 主题建模 颠覆性应用
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部