期刊文献+
共找到13,025篇文章
< 1 2 250 >
每页显示 20 50 100
The Wording Techniques in Poetry Translation
1
作者 林佳 《海外英语》 2013年第12X期133-134,共2页
All times, there have been translators who endeavored to convey the original meaning of the poet by their own understandings and ways of expression. Therefore, different translators might have different translation fo... All times, there have been translators who endeavored to convey the original meaning of the poet by their own understandings and ways of expression. Therefore, different translators might have different translation for the same poem. Some pay more attention to the form while others to the meaning. 展开更多
关键词 POETRY TRANSLATION wording TECHNIQUES ORIGINAL mea
在线阅读 下载PDF
基于词典-TextCNN-Word2Vec组合模型的在线评价细粒度情感分析 被引量:7
2
作者 惠调艳 王智 +1 位作者 何振华 秦春秀 《情报理论与实践》 北大核心 2025年第2期168-177,共10页
[目的/意义]线上购物逐渐成为消费主流,在线情感评价成为消费者购买、厂商产品改进的重要决策依据。[方法/过程]深度挖掘商品显性和隐性属性特征,提出了融合词典-TextCNN-Word2Vec的在线评价细粒度情感分析模型。首先,利用Protég&#... [目的/意义]线上购物逐渐成为消费主流,在线情感评价成为消费者购买、厂商产品改进的重要决策依据。[方法/过程]深度挖掘商品显性和隐性属性特征,提出了融合词典-TextCNN-Word2Vec的在线评价细粒度情感分析模型。首先,利用Protégé软件和Pellet推理机推理等,构建了涵盖外观、硬件、软件、价格、质量、物流和服务7大主题维度的领域本体模型,并建立属性特征词典和情感词典;其次,针对三类在线评价,分别应用基于词典的显性属性情感分析模型、基于TextCNN的显性特征情感分类模型、基于Word2Vec的隐性特征情感分析模型,计算属性特征词的情感值;最后,通过词频加权法和熵权法,自下而上计算各层级主题属性的情感值,实现了多层次细粒度的情感挖掘。[结果/结论]综合基于词典、TextCNN和Word2Vec情感属性映射的三种模型的在线情感分析,显著提高了商品属性特征和情感分析的准确性,商品显性和隐性属性特征的总提取率高达93.77%,商品特征情感分析的加权平均准确率为86.78%。该组合模型为数字经济时代商品多属性特征的细粒度在线情感评价提供了创新研究方法。 展开更多
关键词 细粒度情感分析 情感词典 TextCNN Word2Vec
原文传递
战略性新兴产业政策与技术主题演化路径识别分析——以新能源汽车产业为例 被引量:4
3
作者 冉从敬 程凡 李旺 《情报科学》 北大核心 2025年第1期147-160,共14页
【目的/意义】构建战略性新兴产业政策-技术主题演化路径识别方法,为产业政策的制定与优化、技术的布局与发展提供重要参考。【方法/过程】以新能源汽车产业政策与专利文本为数据集,综合运用LDA模型和Word2Vec算法提取政策与技术主题,... 【目的/意义】构建战略性新兴产业政策-技术主题演化路径识别方法,为产业政策的制定与优化、技术的布局与发展提供重要参考。【方法/过程】以新能源汽车产业政策与专利文本为数据集,综合运用LDA模型和Word2Vec算法提取政策与技术主题,并通过相似度计算的方式识别产业政策与技术的演化脉络及互动关系。【结果/结论】政策关注点从早期的示范推广转向了重点技术研发和产业链全方位完善,技术研究逐渐向电池效能挖掘、充电基础设施智能化和动力系统性能提升等方向深化。政策与技术研究之间形成了协同推动关系,但需提高在智能化、氢能、混合动力方向的技术研究匹配度,与政策导向保持紧密协同,以提升产业整体韧性与安全水平。【创新/局限】本文对产业政策与技术发展互动演化关系进行了有效探索,可为产业政策完善与技术布局优化提供新视角,局限在于需要纳入更多数据源进行多维度分析,并进一步优化主题模型。 展开更多
关键词 产业政策与技术 LDA模型 Word2Vec 演化路径 互动演化
原文传递
一种基于图结构的相似图书内容推荐方法
4
作者 王莉军 王淑君 高影繁 《情报科学》 北大核心 2025年第5期199-205,共7页
【目的/意义】利用图书文本内容实现相似图书推荐,海量图书数据环境下提高图书相似度计算效率。【方法/过程】构建了一种基于图结构的相似图书内容推荐方法,在图书的文本内容进行短语抽取后计算短语网络中的TextRank值获得图书关键词,... 【目的/意义】利用图书文本内容实现相似图书推荐,海量图书数据环境下提高图书相似度计算效率。【方法/过程】构建了一种基于图结构的相似图书内容推荐方法,在图书的文本内容进行短语抽取后计算短语网络中的TextRank值获得图书关键词,进而建立图书向量并结合层次可导航小世界算法(Hierarchcal Navigable Small World,HNSW)得到目标图书和推荐图书之间的相似度。【结果/结论】利用基于内容的相似图书推荐方法得到的用户评价平均准确率达到0.807,客观平均准确率显著高于TF-IDF和TextRank的文本表示方法,可以实现较好的图书推荐效果,HNSW算法将计算效率缩小到对数级别,对大数据环境下的相似图书计算效率起到一定的优化作用。【创新/局限】本研究创新性地结合图结构和HNSW算法提高了图书推荐的准确性和计算效率,但受限于对腾讯词典的依赖,影响了向量表达的普适性和跨语言适应性。 展开更多
关键词 图书文本向量 图结构 HNSW Word2vec 图书推荐
原文传递
生成式人工智能在办公场景中的应用探究
5
作者 顾敏 秦燕妮 张爽 《高科技与产业化》 2025年第9期37-39,共3页
伴随人工智能技术的快速发展,生成式人工智能日益融入办公领域,显著改变传统的办公模式。本研究以Deepseek在微软Word平台中的应用为例,系统探讨了生成式人工智能技术在办公场景中的优势、现实困境及典型应用场景,通过深入分析生成式人... 伴随人工智能技术的快速发展,生成式人工智能日益融入办公领域,显著改变传统的办公模式。本研究以Deepseek在微软Word平台中的应用为例,系统探讨了生成式人工智能技术在办公场景中的优势、现实困境及典型应用场景,通过深入分析生成式人工智能在文本自动生成、信息精准提取、人机智能协作等具体应用场景的实践案例,进一步提出未来办公场景中人机协同发展的优化路径与策略建议,以期为生成式人工智能技术的办公场景落地提供理论支持与实践参考。 展开更多
关键词 生成式人工智能 办公场景 DeepSeek WORD 应用
原文传递
文本数据驱动下尾部风险影响因素动态识别与测度——基于我国金融机构的实证研究
6
作者 刘超 钱存 《管理工程学报》 北大核心 2025年第6期16-34,共19页
挖掘和提取文本数据中的潜在风险驱动信息,提升金融行业的风险识别效率是提高金融监管质效的重要途径。本文的研究将文本主题分析技术与多元统计方法相结合,提出文本数据驱动下的尾部风险影响因素动态识别与测度框架,以期从金融风险文... 挖掘和提取文本数据中的潜在风险驱动信息,提升金融行业的风险识别效率是提高金融监管质效的重要途径。本文的研究将文本主题分析技术与多元统计方法相结合,提出文本数据驱动下的尾部风险影响因素动态识别与测度框架,以期从金融风险文本中识别出金融机构的潜在风险因素并测度其影响程度,对结构化数据进行信息补充,为风险管理提供决策支持。本文以上市公司定期报告与机构分析师报告为文本数据源,采用LDA模型与Word2Vec模型的混合算法识别潜在风险因素,并针对风险因素的高维共线性特征,结合LASSO模型来验证和测度长期与短期影响因素的边际贡献。本文选取2001年至2022年我国上市金融机构的相关数据开展实证研究。研究结果表明,相较于仅包含结构化数据的分析框架,文本信息为尾部风险的影响因素识别补充了额外的信息价值,为尾部风险防范提供前瞻性的参考依据。静态分析表明,该框架能够识别出文本信息中金融机构经营过程中存在的长期风险因素,且不同风险因素的边际贡献存在异质性,即当尾部风险升高时风险文本主题因素的边际贡献更高,解释力度更强。动态模型分析表明,该框架能够识别出短期的潜在风险因素,且对尾部风险的敏感性更高。该框架为金融风险管理提供了“文本数据驱动”的新思路。 展开更多
关键词 文本驱动决策 尾部风险 LDA模型 Word2Vec模型 LASSO模型
在线阅读 下载PDF
基于LDA-Word2vec的冷链物流政策的央地协同量化分析
7
作者 甘卫华 凌耀琛 +1 位作者 吴素浓 熊奥诗 《兰州交通大学学报》 2025年第4期9-20,共12页
自2008年以来,为推动冷链物流健康快速发展,国家及各省市出台了一系列冷链物流政策,这些政策的效果直接影响各地冷链物流的投资热度和运营质量。基于政策工具理论,以中央和地方(下文简称“央地”)出台的冷链物流政策作为研究对象,引入LD... 自2008年以来,为推动冷链物流健康快速发展,国家及各省市出台了一系列冷链物流政策,这些政策的效果直接影响各地冷链物流的投资热度和运营质量。基于政策工具理论,以中央和地方(下文简称“央地”)出台的冷链物流政策作为研究对象,引入LDA主题模型和Word2vec词嵌入算法,进行政策文本的主题归纳分析、地域性差异分析、时序差异分析和央地协同性分析。研究结果表明:1) 2008-2023年研究期内,冷链物流政策主要聚焦“冷链物流行业的标准化”、“专项支持资金打造农产品冷链物流体系”、“多策并举落地冷链物流项目”、“构建绿色高效冷链供应链新模式”等四个主题;2)研究期内,冷链物流规范性政策文本具有时序阶段性特征,可分为萌芽期、增长期和稳健期,且各阶段主题强度不同,保证冷链物流的均衡发展;3)冷链物流规范性政策文本具有区域多样性,各地区对冷链侧重点存在差异,因地制宜制定冷链物流政策;4)华东城市群的冷链物流政策的央地协同性高于其他地区,且政策主题较为丰富,不仅响应中央政策要求,也适应各地区发展。 展开更多
关键词 冷链物流 政策协同 LDA主题模型 Word2vec词嵌入算法
在线阅读 下载PDF
基于LDA-Word2vec的人工智能技术主题演化与热点主题识别
8
作者 王向前 高润凤 李慧宗 《九江学院学报(自然科学版)》 2025年第2期19-31,共13页
为识别人工智能关键技术,深入研究人工智能技术发展态势,有助于国家和企业及时把握人工智能发展动向,本文以人工智能领域中2009—2023年的专利文献为基础,融合运用LDA模型和Word2vec词向量技术,从主题强度和内容双重维度系统考察技术主... 为识别人工智能关键技术,深入研究人工智能技术发展态势,有助于国家和企业及时把握人工智能发展动向,本文以人工智能领域中2009—2023年的专利文献为基础,融合运用LDA模型和Word2vec词向量技术,从主题强度和内容双重维度系统考察技术主题的动态演变过程,同时构建主题热度、新颖度、影响力指标识别人工智能阶段性的热点主题。研究结果表明:①结合LDA主题建模能力和Word2vec语义处理能力能够有效提升技术主题识别精度,直观呈现人工智能领域细粒度技术主题的演化规律与特征;②人工智能领域的技术主题主要分为核心算法与技术基础、感知与交互技术、自然语言与语义理解、数据处理与安全、智能应用与自动化5大类范畴,且主题之间的关联和互动日益紧密;③通过对设计的指标进行综合评估,可以较好识别2009—2014年、2015—2019年和2020—2023年3个不同阶段的热点技术主题。 展开更多
关键词 人工智能 LDA模型 主题识别 Word2vec 主题演化 热点技术主题
在线阅读 下载PDF
基于Word2Vec模型的泥石流多源灾害数据融合研究 被引量:1
9
作者 晋磊 徐鹏 +2 位作者 黎杰 蔡迎春 杨海波 《人民黄河》 北大核心 2025年第7期97-102,共6页
在大数据、物联网与人工智能技术快速发展的背景下,泥石流灾害数据正日益呈现出海量、多源、异构的特点。主要采用jieba、NLPIR和LTP等分词工具抽取模型库,对非结构化存储的泥石流灾害数据进行解析与抽取,并汇聚至数据库,实现数据融合... 在大数据、物联网与人工智能技术快速发展的背景下,泥石流灾害数据正日益呈现出海量、多源、异构的特点。主要采用jieba、NLPIR和LTP等分词工具抽取模型库,对非结构化存储的泥石流灾害数据进行解析与抽取,并汇聚至数据库,实现数据融合。通过Word2Vec模型将词语映射到高维空间中,实现文本中的词汇转换为实数向量;采用t-SNE算法和Kernel PCA算法将高维词向量转换为低维度的向量,使用K-means算法对其进行聚类可视化。研究结果表明:在数据抽取评估方面,一致性、完整性、准确性的评估均值在0.800以上,均方差小于0.050。对比PCA和t-SNE两种降维方法,通过轮廓系数(Silhouette Score,SS)评估聚类效果,PCA的SS指标值为0.359,t-SNE的SS指标值为0.336,结果显示PCA表现更优。Bert模型具有较强的上下文理解能力,更加适合泥石流灾害数据抽取,依托Word2Vec模型的CBOW架构获取词向量,结果显示PCA在评价指标上整体表现优于t-SNE。针对泥石流灾害数据多源和语义一致性问题,涵盖从数据抽取、降维到聚类的全过程,为实现泥石流灾害数据的语义融合与统一管理提供了有效支持。 展开更多
关键词 泥石流灾害 知识抽取 质量评估 知识融合 Word2Vec
在线阅读 下载PDF
引入语义引用信息的专利创新性测度研究 被引量:1
10
作者 吴海婷 唐晓波 董克 《现代情报》 北大核心 2025年第9期140-149,共10页
[目的/意义]专利的创新性测度是专利技术质量评价的关键。基于传统引用的专利创新性测度仅考虑物理引用的外部特征,无法充分反映发明创造过程中真实的知识吸收过程。引入语义引用信息的专利创新性测度有助于更为全面、准确地揭示专利的... [目的/意义]专利的创新性测度是专利技术质量评价的关键。基于传统引用的专利创新性测度仅考虑物理引用的外部特征,无法充分反映发明创造过程中真实的知识吸收过程。引入语义引用信息的专利创新性测度有助于更为全面、准确地揭示专利的知识和技术基础,为细粒度的专利创新评价提供支持。[方法/过程]本研究首先运用规则和句法分析抽取相关专利和论文中的知识元;其次,利用Sentence-BERT和Word2vec模型进行知识元的向量化,并计算向量的余弦相似度以确定专利语义引用;然后,从科学和技术知识吸收的数量、质量、广度维度,以及技术影响的数量和质量维度实现专利创新性测度;最后,选取量子计算领域进行了实证研究。[结果/结论]实验结果表明,本研究提出的方法能够提升专利创新性测度的准确性和有效性,为专利审核和评估提供支持。 展开更多
关键词 专利创新性 语义引用识别 知识元 Sentence-BERT Word2vec
在线阅读 下载PDF
美国智库生物安全研究:主题、演进与启示 被引量:1
11
作者 谢宇恒 李程 李春雷 《世界科技研究与发展》 2025年第3期372-388,共17页
研究美国智库21世纪以来生物安全研究主题与演进趋势,有助于推动我国生物安全智库与安全话语体系建设、完善我国生物安全保护与治理体系。本文基于LDA-Word2vec模型,以美国国防与国家安全领域六家主流智库研究产出为样本,以美国历届总... 研究美国智库21世纪以来生物安全研究主题与演进趋势,有助于推动我国生物安全智库与安全话语体系建设、完善我国生物安全保护与治理体系。本文基于LDA-Word2vec模型,以美国国防与国家安全领域六家主流智库研究产出为样本,以美国历届总统任期作为阶段划分依据,进行主题识别与演进分析发现,在形成主题框架基础之上,美国智库对于生物安全研究演进过程包括主题兴起与体系建构、战略发展与实践深化、技术创新与国际合作三大演进阶段以及公共卫生、生物监测与防御等领域在内的八条路径。基于此,建议我国加强国内生物安全智库建设,贡献中国智慧;推动生物安全风险防控前移,加强科技嵌入;积极参与国际生物安全治理,增强国际话语权;关注生物科技新兴发展领域,深化跨学科交流。 展开更多
关键词 生物安全 美国智库 LDA模型 Word2vec 主题演进 生物监测与防御
在线阅读 下载PDF
基于Word2vec-CNN与情感词典的情感分析模型构建及性能对比 被引量:1
12
作者 戴鹏 麻翊晨 +1 位作者 张静 裘坚杰 《信息系统工程》 2025年第4期129-132,共4页
情感分析是自然语言处理(NLP)领域的重要任务,广泛应用于舆情监测、产品评价分析等领域。传统的情感词典方法因高可解释性和低计算成本,在计算资源受限的环境下仍具有一定应用价值。然而,该方法难以处理新词、隐喻等复杂情感表达,泛化... 情感分析是自然语言处理(NLP)领域的重要任务,广泛应用于舆情监测、产品评价分析等领域。传统的情感词典方法因高可解释性和低计算成本,在计算资源受限的环境下仍具有一定应用价值。然而,该方法难以处理新词、隐喻等复杂情感表达,泛化能力有限。为提升情感分析的准确率和鲁棒性,构建了基于Word2vec-CNN的深度学习情感分析模型,并将其与情感词典方法在NLPCC 2014数据集上进行实验对比。 展开更多
关键词 情感分析 Word2vec 卷积神经网络(CNN) 情感词典
在线阅读 下载PDF
面向语义缺失的骨签释文分类算法
13
作者 窦相宜 王慧琴 +2 位作者 王可 刘瑞 王展 《计算机系统应用》 2025年第7期195-207,共13页
陕西省西安市汉长安城遗址出土的骨签为西汉历史的研究工作提供了丰富资料,受长期埋藏和人为开采影响,大量骨签存在断裂现象,造成语义信息缺失,影响骨签分类归置效率.为提高骨签分类归置效率,本文提出了一种面向语义缺失的EWRCA骨签释... 陕西省西安市汉长安城遗址出土的骨签为西汉历史的研究工作提供了丰富资料,受长期埋藏和人为开采影响,大量骨签存在断裂现象,造成语义信息缺失,影响骨签分类归置效率.为提高骨签分类归置效率,本文提出了一种面向语义缺失的EWRCA骨签释文分类模型.该模型利用ERNIE的8层编码器捕获文本的深层语义信息,学习断裂和不完整的骨签释文信息;通过融合ERNIE多层编码器的输出与Word2Vec生成的词向量,提高对骨签释文独有词汇的理解能力;将文本向量融合模块与TextRCNN-MHAtt模型结合,有效捕获文本的上下文依赖,增强文本的语义表示能力,提升分类准确性;引入融合注意力机制提高模型在处理骨签释文时的准确性.实验结果表明,该模型对汉长安城骨签释文的分类精度和准确率达到95.62%、95.2%,能够有效提高骨签释文的分类精度. 展开更多
关键词 骨签释文 释文分类 ERNIE Word2Vec TextRCNN-MHAtt
在线阅读 下载PDF
基于Word2vec的哈萨克文词向量化模型的实现
14
作者 吾塔嗯拜克·阿萨汗 亚森·艾则孜 阿依努尔·努尔太 《数字通信世界》 2025年第5期148-149,166,共3页
词向量嵌入技术是研究自然语言的重要一步,通过向量化,将自然语言数字化,使自然语言能够被计算机识别和进行相关处理计算。基于Word2vec实现哈萨克文向量化,对哈萨克语机器翻译、文本分类和识别等领域研究具有重要支撑意义。本文将开源... 词向量嵌入技术是研究自然语言的重要一步,通过向量化,将自然语言数字化,使自然语言能够被计算机识别和进行相关处理计算。基于Word2vec实现哈萨克文向量化,对哈萨克语机器翻译、文本分类和识别等领域研究具有重要支撑意义。本文将开源的科大讯飞哈萨克文语料数据集作为语料库,经过清洗、分词等步骤,用Word2vc实现向量化,将每一个哈萨克文词转换为一个独立的K位词向量,通过对词向量的计算,实现发现哈萨克文文本中包含的上下文语义规律、文本主题词提取、相似词计算等功能。 展开更多
关键词 哈萨克文 Word2vec 词向量 相似度分析
在线阅读 下载PDF
高校毕业论文格式设置软件的设计与实现 被引量:2
15
作者 董建文 《智能计算机与应用》 2025年第2期70-76,共7页
本研究利用Python语言开发了一款高校毕业论文格式自动设置软件,旨在提升论文格式设置的效率,减轻学生在遵循格式规范时的工作负担。经测试检验,软件运行稳定、格式设置准确率高。通过调整函数参数,软件可适应不同高校的毕业论文格式要... 本研究利用Python语言开发了一款高校毕业论文格式自动设置软件,旨在提升论文格式设置的效率,减轻学生在遵循格式规范时的工作负担。经测试检验,软件运行稳定、格式设置准确率高。通过调整函数参数,软件可适应不同高校的毕业论文格式要求,从而具备广泛的适用性和推广潜力。运用本软件与手工调整方法相比,显著缩短了论文格式设置的时间,使师生能将更多的时间和精力投入到论文内容的研究和表述上,从而有效提高高校毕业论文整体质量。因此,本软件具有一定的实践意义和应用价值。 展开更多
关键词 格式设置 WORD对象模型 PYTHON语言
在线阅读 下载PDF
基于卷积神经网络的中医医案诊断分类方法
16
作者 邱雪峰 查青林 +2 位作者 苗震 刘明 李欣依 《现代信息科技》 2025年第6期39-45,共7页
针对中医医案诊断分类研究中上下文语义捕捉不足,难以有效捕捉长距离依赖信息以及分类精确度低等问题,提出了一种结合文本卷积神经网络(TextCNN)和门控循环单元(GRU)的混合模型。首先,利用Word2Vec模型对词向量进行训练,构建局部词向量... 针对中医医案诊断分类研究中上下文语义捕捉不足,难以有效捕捉长距离依赖信息以及分类精确度低等问题,提出了一种结合文本卷积神经网络(TextCNN)和门控循环单元(GRU)的混合模型。首先,利用Word2Vec模型对词向量进行训练,构建局部词向量库。其次,采用文本卷积神经网络对中医医案文本进行特征提取,以捕捉局部重要信息。最后,利用门控循环单元对提取的特征进行上下文信息建模,从而显著增强模型对长依赖关系的处理能力。实验结果表明,该模型在中医医案诊断文本分类任务中表现出色,预测精度达到85.01%,F1值为81.86%。 展开更多
关键词 中医医案 TextCNN GRU Word2Vec模型 文本分类
在线阅读 下载PDF
GUIDE FOR AUTHORS
17
《Green Energy & Environment》 SCIE EI CAS 2025年第1期I0002-I0005,共4页
Introduction Types of paper Contributions falling into the following categories will be considered for publication:Reviews article(>10000 words),Short review(~5000 words),Feature article(>8000 words),Research pa... Introduction Types of paper Contributions falling into the following categories will be considered for publication:Reviews article(>10000 words),Short review(~5000 words),Feature article(>8000 words),Research paper,Short communication(~3000 words),Commentary(~1000 words),and Viewpiont(~3000 words).Please ensure that you select the appropriate article type from the list of options when making your submission.Authors contributing to special issues should ensure that they select the special issue article type from this list. 展开更多
关键词 SUBMISSION contributing WORDS
在线阅读 下载PDF
基于改进LDA模型的主题识别及演化研究——以软件开源领域为例
18
作者 高翔菲 董平军 《数据挖掘》 2025年第1期55-70,共16页
目的:针对基于LDA模型进行主题识别及演化分析方法在主题数量选择困难、时间窗口划分主观性强等方面的局限提出优化改进,从而推动主题识别及演化分析方法的进步。方法:结合TF-IDF算法和Word2Vec词向量技术计算主题向量,减少主题生成时... 目的:针对基于LDA模型进行主题识别及演化分析方法在主题数量选择困难、时间窗口划分主观性强等方面的局限提出优化改进,从而推动主题识别及演化分析方法的进步。方法:结合TF-IDF算法和Word2Vec词向量技术计算主题向量,减少主题生成时常用词汇的影响,同时实现主题向量的语义表达。在主题演化过程中提出基于主题语义距离变化的方法划分时间窗口,跟踪目标领域主题强度和主题内容的演化趋势。最后以软件开源领域研究文献为例进行实证研究。结果:研究结果显示,本文提出的优化方法能够有效识别领域的研究主题及热点主题,跟踪主题随时间演化的路径,并可视化呈现。结论:软件开源研究存在六个关键主题,其中“开源治理”和“市场竞争”是该研究领域的热点主题。从主题内容的演变来看,软件开源的研究正从个人自发参与的自治动机转向企业与政府等组织层面的参与。Purpose: To address the limitations of topic identification and evolution analysis methods based on LDA models, such as difficulty in selecting the number of topics and strong subjectivity in time window partitioning, and to propose optimization improvements, in order to promote the progress of topic identification and evolution analysis methods. Method: Combining TF-IDF algorithm and Word2Vec word vector technology to calculate topic vectors, reducing the influence of commonly used vocabulary in topic generation, while achieving semantic expression of topic vectors. Propose a method for dividing time windows based on changes in topic semantic distance during the process of topic evolution, and track the evolution trend of topic intensity and content in the target domain. Finally, empirical research will be conducted using literature in the field of open source software as an example. Result: The research results show that the optimization method proposed in this paper can effectively identify research topics and hot topics in the field, track the path of topic evolution over time, and visualize it. Conclusion: There are six key themes in software open source research, among which “open source governance” and “market competition” are hot topics in this research field. From the evolution of the theme content, research on open source software has shifted from the autonomous motivation of individual participation to the participation of organizations such as enterprises and governments. 展开更多
关键词 LDA模型 Word2Vec模型 主题识别及演化 时间窗口划分 软件开源
在线阅读 下载PDF
基于聚类的HTTP/HTTPS协议资产发现
19
作者 马琰 苏马婧 +2 位作者 姚旺君 权晓文 刘红 《电子技术应用》 2025年第11期98-106,共9页
网络探测扫描是发现网络资产的重要方法,在探测结果中HTTP/HTTPS协议占比较高,是重要的互联网资产识别来源。随着网络环境的日益复杂,应用HTTP/HTTPS协议的资产种类和数量也在急剧增加,这使得传统基于指纹规则的网络资产识别方法面临着... 网络探测扫描是发现网络资产的重要方法,在探测结果中HTTP/HTTPS协议占比较高,是重要的互联网资产识别来源。随着网络环境的日益复杂,应用HTTP/HTTPS协议的资产种类和数量也在急剧增加,这使得传统基于指纹规则的网络资产识别方法面临着识别效率低、适应性差等问题,无法满足HTTP/HTTPS协议识别的需要。因此,提出了一种新型HTTP/HTTPS协议资产发现方法,通过自动化规则生成器对HTTP/HTTPS协议响应数据进行处理,并基于词频统计和相似度信息对原始数据进行预过滤,利用文本编码模型实现对HTTP/HTTPS协议响应体信息的文本编码和特征融合,结合无监督聚类算法实现对HTTP/HTTPS协议资产的发现。实验结果表明,所提出的方法能够显著提高HTTP/HTTPS协议资产发现效率,提升资产标注速度,并可在无先验知识下发现未知资产。 展开更多
关键词 网络资产发现 HTTP/HTTPS协议 自动规则生成 无监督聚类 Word2Vec DBSCAN
在线阅读 下载PDF
博士阶段课程与研究选题之间的关联性分析:基于语义相似度的课程优化视角
20
作者 邢玥 朱桃林 黄文彬 《教学研究》 2025年第4期66-77,共12页
教学与科研的有机融合是高质量博士研究生培养的重要保障。然而,博士生普遍认为现行课程体系对科研能力提升的支持不足,相关研究结论亦存在分歧。基于此,以某综合性大学2022届博士毕业生为对象,采用自然语言处理技术,计算课程描述与学... 教学与科研的有机融合是高质量博士研究生培养的重要保障。然而,博士生普遍认为现行课程体系对科研能力提升的支持不足,相关研究结论亦存在分歧。基于此,以某综合性大学2022届博士毕业生为对象,采用自然语言处理技术,计算课程描述与学位论文主题的语义相似度,分析课程内容与博士生科研方向的契合度。结果显示,博士生所修课程与论文研究主题整体具有较高的语义关联性,选修课相似度最高,限选课最低,且存在学科差异。基于研究发现,提出了基于学科特征的课程优化建议,旨在增强课程体系对博士生科研能力培养的支持作用。 展开更多
关键词 博士生学术能力 课程设置 自然语言处理 Word2vec 相似度分析
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部