期刊文献+
共找到1,845篇文章
< 1 2 93 >
每页显示 20 50 100
基于词典-TextCNN-Word2Vec组合模型的在线评价细粒度情感分析 被引量:7
1
作者 惠调艳 王智 +1 位作者 何振华 秦春秀 《情报理论与实践》 北大核心 2025年第2期168-177,共10页
[目的/意义]线上购物逐渐成为消费主流,在线情感评价成为消费者购买、厂商产品改进的重要决策依据。[方法/过程]深度挖掘商品显性和隐性属性特征,提出了融合词典-TextCNN-Word2Vec的在线评价细粒度情感分析模型。首先,利用Protég&#... [目的/意义]线上购物逐渐成为消费主流,在线情感评价成为消费者购买、厂商产品改进的重要决策依据。[方法/过程]深度挖掘商品显性和隐性属性特征,提出了融合词典-TextCNN-Word2Vec的在线评价细粒度情感分析模型。首先,利用Protégé软件和Pellet推理机推理等,构建了涵盖外观、硬件、软件、价格、质量、物流和服务7大主题维度的领域本体模型,并建立属性特征词典和情感词典;其次,针对三类在线评价,分别应用基于词典的显性属性情感分析模型、基于TextCNN的显性特征情感分类模型、基于Word2Vec的隐性特征情感分析模型,计算属性特征词的情感值;最后,通过词频加权法和熵权法,自下而上计算各层级主题属性的情感值,实现了多层次细粒度的情感挖掘。[结果/结论]综合基于词典、TextCNN和Word2Vec情感属性映射的三种模型的在线情感分析,显著提高了商品属性特征和情感分析的准确性,商品显性和隐性属性特征的总提取率高达93.77%,商品特征情感分析的加权平均准确率为86.78%。该组合模型为数字经济时代商品多属性特征的细粒度在线情感评价提供了创新研究方法。 展开更多
关键词 细粒度情感分析 情感词典 TextCNN Word2vec
原文传递
基于LDA2Vec模型的国际区域合作标准化政策扩散研究 被引量:2
2
作者 方放 赵罗衣 《科研管理》 北大核心 2025年第5期142-151,共10页
标准是国际区域合作实现互联互通的坚实技术支撑和重要机制保障,标准化政策提供了标准化工作的规划部署与制度支持。本研究基于政策扩散理论,运用LDA2Vec模型对国家和省级层面的“一带一路”标准化政策文本进行深度挖掘,系统揭示我国国... 标准是国际区域合作实现互联互通的坚实技术支撑和重要机制保障,标准化政策提供了标准化工作的规划部署与制度支持。本研究基于政策扩散理论,运用LDA2Vec模型对国家和省级层面的“一带一路”标准化政策文本进行深度挖掘,系统揭示我国国际区域合作标准化政策扩散的内在逻辑和具有特色的政策模式和特征。研究发现:(1)针对层级政策导向维度,国家政策呈现综合性特点,而地区政策逐级传递、因地制宜,地域异质性明显。(2)针对时间演化维度,“一带一路”标准化政策发展可分为政策动员、拓展和调整三个阶段,并呈现出R型增长态势;同时政策主题演进包含传承、衍生和集成三种类型,而且具有交织融合的特点。(3)层级政策扩散受到纵向强制性扩散、央地互动和横向地方内部因素、学习与模仿机制影响,而路径依赖和社会学习机制是驱动政策随时间演化跨阶段扩散的内在逻辑。本研究丰富了政策扩散理论和国际区域合作标准化政策的相关研究,希冀为推动国际区域合作的高质量发展以及助力全球治理新方案供给提供政策决策体系制定和实施参考。 展开更多
关键词 LDA2vec 国际区域合作 标准化政策 政策导向 政策扩散
原文传递
我国智慧旅游政策的外部结构、工具特征与演进理路——基于LDA2Vec与政策工具的研究
3
作者 彭雷霆 黄延 《旅游学刊》 北大核心 2025年第8期147-161,共15页
随着数字技术与旅游业深度融合发展,智慧旅游已然成为旅游高质量发展的新动能。文章通过构建“外部结构-工具使用-演进理路”三维分析框架,运用政策工具法、LDA2Vec机器学习等方法,对2001—2023年间中央层面84份智慧旅游政策进行全面系... 随着数字技术与旅游业深度融合发展,智慧旅游已然成为旅游高质量发展的新动能。文章通过构建“外部结构-工具使用-演进理路”三维分析框架,运用政策工具法、LDA2Vec机器学习等方法,对2001—2023年间中央层面84份智慧旅游政策进行全面系统的历时纵向和剖面横向分析。研究发现:1)我国智慧旅游政策大致可划分为萌芽起步期、快速发展期与深化完善期,发文主体存在“主导-核心-参与”层级结构,合作网络由松散单一型转向紧密多主体型;2)政策工具从供给面、环境面转向需求面,需求型政策工具使用较为欠缺,且各工具内部的组合搭配不均;3)政策主题由信息化服务推进-数字化业态发展-智慧化生态建设依次演进,“人工智能+”与产业生态系统建设是未来政策制定的主要着力点。基于此,要进一步推进我国智慧旅游发展,可从增强部门统筹协调、优化政策工具结构、以系统思维支持产业生态建设、营造释放旅游数据要素潜能的制度环境等方面完善智慧旅游政策支持体系。 展开更多
关键词 智慧旅游政策 外部结构 政策工具 演进理路 LDA2vec
在线阅读 下载PDF
基于LDA-Word2vec的冷链物流政策的央地协同量化分析
4
作者 甘卫华 凌耀琛 +1 位作者 吴素浓 熊奥诗 《兰州交通大学学报》 2025年第4期9-20,共12页
自2008年以来,为推动冷链物流健康快速发展,国家及各省市出台了一系列冷链物流政策,这些政策的效果直接影响各地冷链物流的投资热度和运营质量。基于政策工具理论,以中央和地方(下文简称“央地”)出台的冷链物流政策作为研究对象,引入LD... 自2008年以来,为推动冷链物流健康快速发展,国家及各省市出台了一系列冷链物流政策,这些政策的效果直接影响各地冷链物流的投资热度和运营质量。基于政策工具理论,以中央和地方(下文简称“央地”)出台的冷链物流政策作为研究对象,引入LDA主题模型和Word2vec词嵌入算法,进行政策文本的主题归纳分析、地域性差异分析、时序差异分析和央地协同性分析。研究结果表明:1) 2008-2023年研究期内,冷链物流政策主要聚焦“冷链物流行业的标准化”、“专项支持资金打造农产品冷链物流体系”、“多策并举落地冷链物流项目”、“构建绿色高效冷链供应链新模式”等四个主题;2)研究期内,冷链物流规范性政策文本具有时序阶段性特征,可分为萌芽期、增长期和稳健期,且各阶段主题强度不同,保证冷链物流的均衡发展;3)冷链物流规范性政策文本具有区域多样性,各地区对冷链侧重点存在差异,因地制宜制定冷链物流政策;4)华东城市群的冷链物流政策的央地协同性高于其他地区,且政策主题较为丰富,不仅响应中央政策要求,也适应各地区发展。 展开更多
关键词 冷链物流 政策协同 LDA主题模型 Word2vec词嵌入算法
在线阅读 下载PDF
基于LDA-Word2vec的人工智能技术主题演化与热点主题识别
5
作者 王向前 高润凤 李慧宗 《九江学院学报(自然科学版)》 2025年第2期19-31,共13页
为识别人工智能关键技术,深入研究人工智能技术发展态势,有助于国家和企业及时把握人工智能发展动向,本文以人工智能领域中2009—2023年的专利文献为基础,融合运用LDA模型和Word2vec词向量技术,从主题强度和内容双重维度系统考察技术主... 为识别人工智能关键技术,深入研究人工智能技术发展态势,有助于国家和企业及时把握人工智能发展动向,本文以人工智能领域中2009—2023年的专利文献为基础,融合运用LDA模型和Word2vec词向量技术,从主题强度和内容双重维度系统考察技术主题的动态演变过程,同时构建主题热度、新颖度、影响力指标识别人工智能阶段性的热点主题。研究结果表明:①结合LDA主题建模能力和Word2vec语义处理能力能够有效提升技术主题识别精度,直观呈现人工智能领域细粒度技术主题的演化规律与特征;②人工智能领域的技术主题主要分为核心算法与技术基础、感知与交互技术、自然语言与语义理解、数据处理与安全、智能应用与自动化5大类范畴,且主题之间的关联和互动日益紧密;③通过对设计的指标进行综合评估,可以较好识别2009—2014年、2015—2019年和2020—2023年3个不同阶段的热点技术主题。 展开更多
关键词 人工智能 LDA模型 主题识别 Word2vec 主题演化 热点技术主题
在线阅读 下载PDF
基于多头注意力机制的Wav2Vec 2.0-LSTM语音情感识别
6
作者 张红兵 孙惠民 《电声技术》 2025年第8期27-29,79,共4页
传统语音情感识别方法依赖人工设计的特征,难以捕捉到语音中的复杂情感信息并进行准确分类。针对该问题提出一种基于多头注意力机制的Wav2Vec 2.0模型和长短期记忆(Long Short-Term Memory,LSTM)网络相结合的语音情感识别模型,并采用加... 传统语音情感识别方法依赖人工设计的特征,难以捕捉到语音中的复杂情感信息并进行准确分类。针对该问题提出一种基于多头注意力机制的Wav2Vec 2.0模型和长短期记忆(Long Short-Term Memory,LSTM)网络相结合的语音情感识别模型,并采用加权准确率和未加全准确率作为评价指标,在两个公开情感数据集IEMOCAP和RAVDESS上进行实验。实验结果表明,相较于其他基线模型,新模型在语音情感识别任务中具有较高的识别精度。 展开更多
关键词 语音情感识别 Wav2vec 2.0模型 长短期记忆(LSTM)网络 多头注意力机制
在线阅读 下载PDF
基于Word2Vec模型的泥石流多源灾害数据融合研究 被引量:1
7
作者 晋磊 徐鹏 +2 位作者 黎杰 蔡迎春 杨海波 《人民黄河》 北大核心 2025年第7期97-102,共6页
在大数据、物联网与人工智能技术快速发展的背景下,泥石流灾害数据正日益呈现出海量、多源、异构的特点。主要采用jieba、NLPIR和LTP等分词工具抽取模型库,对非结构化存储的泥石流灾害数据进行解析与抽取,并汇聚至数据库,实现数据融合... 在大数据、物联网与人工智能技术快速发展的背景下,泥石流灾害数据正日益呈现出海量、多源、异构的特点。主要采用jieba、NLPIR和LTP等分词工具抽取模型库,对非结构化存储的泥石流灾害数据进行解析与抽取,并汇聚至数据库,实现数据融合。通过Word2Vec模型将词语映射到高维空间中,实现文本中的词汇转换为实数向量;采用t-SNE算法和Kernel PCA算法将高维词向量转换为低维度的向量,使用K-means算法对其进行聚类可视化。研究结果表明:在数据抽取评估方面,一致性、完整性、准确性的评估均值在0.800以上,均方差小于0.050。对比PCA和t-SNE两种降维方法,通过轮廓系数(Silhouette Score,SS)评估聚类效果,PCA的SS指标值为0.359,t-SNE的SS指标值为0.336,结果显示PCA表现更优。Bert模型具有较强的上下文理解能力,更加适合泥石流灾害数据抽取,依托Word2Vec模型的CBOW架构获取词向量,结果显示PCA在评价指标上整体表现优于t-SNE。针对泥石流灾害数据多源和语义一致性问题,涵盖从数据抽取、降维到聚类的全过程,为实现泥石流灾害数据的语义融合与统一管理提供了有效支持。 展开更多
关键词 泥石流灾害 知识抽取 质量评估 知识融合 Word2vec
在线阅读 下载PDF
基于LDA2vec的数字图书馆信息资源共享研究
8
作者 王芳 《长江信息通信》 2025年第8期123-125,共3页
数字图书馆信息资源自身主题构成多元,导致直接匹配共享请求时,反馈准确性低。对此,开展基于LDA2vec的数字图书馆信息资源共享研究。利用word2vec词向量在特定窗口大小训练原始数字图书馆信息资源文档,输出文本字符串形式信息资源;利用... 数字图书馆信息资源自身主题构成多元,导致直接匹配共享请求时,反馈准确性低。对此,开展基于LDA2vec的数字图书馆信息资源共享研究。利用word2vec词向量在特定窗口大小训练原始数字图书馆信息资源文档,输出文本字符串形式信息资源;利用LDA输出包含主题document向量,求和计算得到转化后的信息资源。在数据共享请求的属性集中搜索与转化资源包含主题一致的属性,利用拉格朗日插值算法计算满足条件共享请求属性拟合阈值信息,输出多项式形式共享请求反馈结果。在结果中,设计方法在对测试样本信息资源向量化转化基础上,对共享请求反馈输出结果完整性高于88.0%,准确性在高于92.0%。 展开更多
关键词 LDA2vec 数字图书馆 信息资源共享 word2vec LDA 拉格朗日插值算法
在线阅读 下载PDF
基于Word2vec-CNN与情感词典的情感分析模型构建及性能对比 被引量:1
9
作者 戴鹏 麻翊晨 +1 位作者 张静 裘坚杰 《信息系统工程》 2025年第4期129-132,共4页
情感分析是自然语言处理(NLP)领域的重要任务,广泛应用于舆情监测、产品评价分析等领域。传统的情感词典方法因高可解释性和低计算成本,在计算资源受限的环境下仍具有一定应用价值。然而,该方法难以处理新词、隐喻等复杂情感表达,泛化... 情感分析是自然语言处理(NLP)领域的重要任务,广泛应用于舆情监测、产品评价分析等领域。传统的情感词典方法因高可解释性和低计算成本,在计算资源受限的环境下仍具有一定应用价值。然而,该方法难以处理新词、隐喻等复杂情感表达,泛化能力有限。为提升情感分析的准确率和鲁棒性,构建了基于Word2vec-CNN的深度学习情感分析模型,并将其与情感词典方法在NLPCC 2014数据集上进行实验对比。 展开更多
关键词 情感分析 Word2vec 卷积神经网络(CNN) 情感词典
在线阅读 下载PDF
基于Wav2Vec2.0特征融合与联合损失的深度伪造语音检测方法 被引量:1
10
作者 陈飞飞 郭海燕 +2 位作者 郭延民 葛子瑞 陆华庆 《信号处理》 北大核心 2025年第9期1547-1557,共11页
语音预训练模型Wav2Vec2.0能够通过多个隐藏层提取丰富的多层嵌入特征,在深度伪造语音检测任务中表现出良好的性能。将Wav2Vec2.0各层特征进行融合,是进一步挖掘语音数据深层次表示的有效途径,而改进Wav2Vec2.0各层特征的融合方式则有... 语音预训练模型Wav2Vec2.0能够通过多个隐藏层提取丰富的多层嵌入特征,在深度伪造语音检测任务中表现出良好的性能。将Wav2Vec2.0各层特征进行融合,是进一步挖掘语音数据深层次表示的有效途径,而改进Wav2Vec2.0各层特征的融合方式则有望进一步提升深度伪造语音检测性能。鉴于此,本文基于Wav2Vec2.0深度伪造语音检测架构,提出引入卷积注意力模块(Convolutional Block Attention Module,CBAM)对Wav2Vec2.0各层嵌入特征进行融合,通过结合通道注意力和空间注意力的加权融合方式来自适应地增强关键特征,有效提升模型的特征提取能力。在此基础上,考虑到伪造语音类型复杂多样,不同类型的伪造语音在鉴别难度上可能存在显著差异,为避免模型在处理难鉴别样本时存在的偏倚,同时使得类内特征分布紧凑、类间特征分布疏远。本文提出联合交叉熵损失、中心损失和焦点损失,构造模型的整体损失函数,充分利用各类损失的优势来增强模型在多种伪造语音场景下的判别能力和泛化性能。在ASVspoof 2019 LA、ASVspoof 2021 LA、ASVspoof 2021 DF和CFAD数据集上的实验结果表明,所提出的方法在常用评价指标等错误率(equal error rate,EER)和最小串联检测代价函数(minimum tandem detection cost function,min t-DCF)均表现出色。尤其是在ASVspoof 2021 LA数据集上,相较于AASIST、ECAPA-TDNN、ResNet,以及采用Wav2Vec2.0进行前端特征提取的多种对比方案,本文方法显著优于所有对比方法。 展开更多
关键词 深度伪造语音检测 Wav2vec2.0 特征融合 联合损失
在线阅读 下载PDF
Doc2Vec模型驱动的芯片竞争话语研究:主题意义与话语策略
11
作者 续雨媛 卫乃兴 《外语研究》 北大核心 2025年第5期27-35,共9页
基于分布式表示的Doc2Vec向量空间模型将抽象的语义关系表征为语义空间中的向量距离,可用于话语研究中的主题挖掘。本研究基于自建的中美媒体芯片竞争语料库,采用Doc2Vec模型进行主题挖掘,探讨中美媒体话语的主题意义与博弈策略。向量... 基于分布式表示的Doc2Vec向量空间模型将抽象的语义关系表征为语义空间中的向量距离,可用于话语研究中的主题挖掘。本研究基于自建的中美媒体芯片竞争语料库,采用Doc2Vec模型进行主题挖掘,探讨中美媒体话语的主题意义与博弈策略。向量数据表明,中美媒体围绕“芯片管制”“国际关系”“国家立法”“技术发展”等4个主题展开话语建构。在共享的“芯片管制”与“国际关系”主题下,双方话语策略迥异,呈现极强对抗态势:美方基于所谓“道义伦理学”合法化对华芯片管制,中方则从后果主义伦理原则发力,批判美方扰乱全球经济秩序,对之去合法化;美方借助危机叙事构建阵营对立,中方则以立足全人类共同价值的团结话语来消解。“国家立法”和“技术发展”分别为双方特有的主题,即美方通过零和博弈叙事,动员不同利益集团借助强制性法案遏制中国芯片发展;中方则聚焦技术自主创新,以事实性数据表征对芯片发展的信心。方法论上,本研究揭示,Doc2Vec模型、语料库方法与传统话语分析结合使用,对洞悉博弈双方的区别性话语建构及话语策略可产生协同效应,有助于拓展话语研究方法。 展开更多
关键词 Doc2vec模型 词嵌入 芯片竞争话语 对抗性话语 语料库话语研究
在线阅读 下载PDF
基于Word2vec的哈萨克文词向量化模型的实现
12
作者 吾塔嗯拜克·阿萨汗 亚森·艾则孜 阿依努尔·努尔太 《数字通信世界》 2025年第5期148-149,166,共3页
词向量嵌入技术是研究自然语言的重要一步,通过向量化,将自然语言数字化,使自然语言能够被计算机识别和进行相关处理计算。基于Word2vec实现哈萨克文向量化,对哈萨克语机器翻译、文本分类和识别等领域研究具有重要支撑意义。本文将开源... 词向量嵌入技术是研究自然语言的重要一步,通过向量化,将自然语言数字化,使自然语言能够被计算机识别和进行相关处理计算。基于Word2vec实现哈萨克文向量化,对哈萨克语机器翻译、文本分类和识别等领域研究具有重要支撑意义。本文将开源的科大讯飞哈萨克文语料数据集作为语料库,经过清洗、分词等步骤,用Word2vc实现向量化,将每一个哈萨克文词转换为一个独立的K位词向量,通过对词向量的计算,实现发现哈萨克文文本中包含的上下文语义规律、文本主题词提取、相似词计算等功能。 展开更多
关键词 哈萨克文 Word2vec 词向量 相似度分析
在线阅读 下载PDF
基于Time2Vec-BiGRU-SA深度学习模型的碳价格预测
13
作者 杨楠 毕贵红 +3 位作者 李玉洪 孔凡文 骆钊 王瑞 《电力科学与工程》 2025年第9期1-12,共12页
碳交易价格预测对政策制定与市场稳态的维护至关重要,但碳价时间序列的非线性、非平稳性等特征给其精准预测带来困难。为此,提出基于时序特征向量映射模块、双向门控循环单元和自注意力机制融合的深度学习模型。模型集成3个分支:直接处... 碳交易价格预测对政策制定与市场稳态的维护至关重要,但碳价时间序列的非线性、非平稳性等特征给其精准预测带来困难。为此,提出基于时序特征向量映射模块、双向门控循环单元和自注意力机制融合的深度学习模型。模型集成3个分支:直接处理原始碳价时间序列;构建碳价序列多尺度分量矩阵;基于灰色关联度分析与极端随机树方法筛选出与碳价相关的关键变量。各分支均利用时序特征向量映射模块编码时间信息。双向门控循环单元捕捉双向长时依赖。自注意力机制模型加权特征进行综合集成。实证研究显示,该模型单步及多步预测精度高,均优于基准模型,模型具有优越性与稳健性。 展开更多
关键词 深度学习 碳市场价格 多变量时间序列预测 多分支输入 Time2vec
在线阅读 下载PDF
基于Text2Vec_AE_KMeans的微博话题聚类分析方法
14
作者 万文桐 黄润才 《智能计算机与应用》 2025年第5期82-89,共8页
传统的话题聚类分析方法使用静态词向量对微博文本进行建模,对微博文本不规范表达、一词多义等特点应对不佳,从而影响聚类效果与话题表述。针对此,提出了一种基于Text2Vec_AE_KMeans的深度文本特征提取与聚类的微博话题聚类分析方法。首... 传统的话题聚类分析方法使用静态词向量对微博文本进行建模,对微博文本不规范表达、一词多义等特点应对不佳,从而影响聚类效果与话题表述。针对此,提出了一种基于Text2Vec_AE_KMeans的深度文本特征提取与聚类的微博话题聚类分析方法。首先,使用基于MacBert预训练模型与CoSENT文本语句建模方法设计的Text2Vec预训练模型,对微博话题文本进行文本语义表示,从而改进静态词向量在文本特征建模方面的不足;然后,通过带有非线性激活函数的AutoEncoder降维网络对高维非线性文本特征进行降维;最后,在话题聚类分析的过程中采用KMeans_C-TF-IDF算法进行面向微博文本的聚类分析,从聚类簇的角度把握话题分布信息。在真实微博话题数据集上,相较于传统静态词向量建模方法,本文提出的方法在聚类评价指标上表现优异,生成的话题信息可识别性较好。 展开更多
关键词 话题聚类分析 CoSENT Text2vec 自编码器
在线阅读 下载PDF
Cross-feature fusion speech emotion recognition based on attention mask residual network and Wav2vec 2.0
15
作者 Xiaoke Li Zufan Zhang 《Digital Communications and Networks》 2025年第5期1567-1577,共11页
Speech Emotion Recognition(SER)has received widespread attention as a crucial way for understanding human emotional states.However,the impact of irrelevant information on speech signals and data sparsity limit the dev... Speech Emotion Recognition(SER)has received widespread attention as a crucial way for understanding human emotional states.However,the impact of irrelevant information on speech signals and data sparsity limit the development of SER system.To address these issues,this paper proposes a framework that incorporates the Attentive Mask Residual Network(AM-ResNet)and the self-supervised learning model Wav2vec 2.0 to obtain AM-ResNet features and Wav2vec 2.0 features respectively,together with a cross-attention module to interact and fuse these two features.The AM-ResNet branch mainly consists of maximum amplitude difference detection,mask residual block,and an attention mechanism.Among them,the maximum amplitude difference detection and the mask residual block act on the pre-processing and the network,respectively,to reduce the impact of silent frames,and the attention mechanism assigns different weights to unvoiced and voiced speech to reduce redundant emotional information caused by unvoiced speech.In the Wav2vec 2.0 branch,this model is introduced as a feature extractor to obtain general speech features(Wav2vec 2.0 features)through pre-training with a large amount of unlabeled speech data,which can assist the SER task and cope with data sparsity problems.In the cross-attention module,AM-ResNet features and Wav2vec 2.0 features are interacted with and fused to obtain the cross-fused features,which are used to predict the final emotion.Furthermore,multi-label learning is also used to add ambiguous emotion utterances to deal with data limitations.Finally,experimental results illustrate the usefulness and superiority of our proposed framework over existing state-of-the-art approaches. 展开更多
关键词 Speech emotion recognition Residual network MASK ATTENTION Wav2vec 2.0 Cross-feature fusion
在线阅读 下载PDF
基于机器学习与TF-IDF、Word2Vec的文本情感分析
16
作者 张立伟 曹佳慧 +2 位作者 陆傲鹏 魏鸣辰 张庆莉 《电脑与信息技术》 2025年第4期23-26,共4页
在目前网络环境下,由于各社交平台发言难度低,网络空间中往往充斥着大量不和谐评论。为了净化网络环境,需要对网络热点话题进行快速、准确的舆情判断,采用词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)、Word2Ve... 在目前网络环境下,由于各社交平台发言难度低,网络空间中往往充斥着大量不和谐评论。为了净化网络环境,需要对网络热点话题进行快速、准确的舆情判断,采用词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)、Word2Vec算法与传统机器学习模型相结合,分别用TF-IDF和Word2Vec算法提取文本情感特征,构建机器学习模型,如随机梯度下降(Stochastic-Gradient-Descent,SGD)、支持向量机(Support-VectorMachine,SVM)等,计算精确率、召回率和F1值来评估模型性能。实验结果及评测显示,Word2Vec-SVM模型在文本情感分类中的F1值达0.958 2,能够取得较好的文本情感分类效果。 展开更多
关键词 TF-IDF Word2vec 机器学习 SVM 文本情感分析
在线阅读 下载PDF
TF-IDF和Word2Vec组合算法的招标工程量清单标准化方法研究
17
作者 潘定才 钱琪琪 万正东 《建筑经济》 2025年第S1期137-141,共5页
为进一步发挥标准化招标工程清单的作用,提高招标工程量清单的准确性,及时发现招标工程量清单中漏项、项目特征不规范、逻辑不合理等问题,本文引入TF-IDF和Word2Vec组合方法,进而提出一种兼顾文本特征和语义特征的文本特征提取算法,先... 为进一步发挥标准化招标工程清单的作用,提高招标工程量清单的准确性,及时发现招标工程量清单中漏项、项目特征不规范、逻辑不合理等问题,本文引入TF-IDF和Word2Vec组合方法,进而提出一种兼顾文本特征和语义特征的文本特征提取算法,先将文本进行向量化表示,然后根据文本的特征,使用余弦相似度的方法,对招标工程量清单的相似度进行计算,根据相似度水平,进而实现招标工程量清单和标准化招标工程量清单差异的智能识别和智能比对检查,以提升招标工程量清单编制质量和编制效率。结果表明,使用TF-IDF和Word2Vec组合方法和使用单一模型相比,对招标工程量清单识别的准确性更高,效果更好,具有较好的应用前景。 展开更多
关键词 标准化清单 TF-IDF Word2vec 相似度 文本识别
在线阅读 下载PDF
我国慢性病医防融合领域文献主题演化——基于Word2vec与LDA模型的可视化分析
18
作者 李艳 唐岚 黄豪 《临床医学进展》 2025年第3期980-989,共10页
为了深入研究我国慢性病医防融合领域的发展趋势和演化过程,本文收集了2006~2024年的373篇相关文献,经过数据清洗和预处理后,引入Word2vec的LDA模型进行文献的主题挖掘,确定每个时期的最佳主题数量,并生成主题演化桑基图。计算不同时间... 为了深入研究我国慢性病医防融合领域的发展趋势和演化过程,本文收集了2006~2024年的373篇相关文献,经过数据清洗和预处理后,引入Word2vec的LDA模型进行文献的主题挖掘,确定每个时期的最佳主题数量,并生成主题演化桑基图。计算不同时间段内各主题强度,并通过交互式条形图描述热点主题。结果显示,在第一阶段2006~2020年,大部分研究主要集中在如何整合医疗服务,以及如何将慢性病防控与医防结合;在第二阶段2021~2022年,除了延续既有的主题,部分研究焦点转移到如何更好地管理和融合综合医疗服务,以及如何将公共卫生服务与医疗体系更有效地结合;在第三阶段2023~2024年,研究重点在于如何实现健康服务与医防的深度融合,以及如何在医疗服务中具体落实医防融合的理念,研究更加注重实际操作和具体应用。通过主题演化分析揭示了不同时期内主题之间的关联和演化过程,综合医疗服务、慢性病防控与医防结合等主题在不同阶段都有较强的延续性,而研究重点随着时间的推移逐渐从综合医疗服务向医防融合和健康服务管理方向转移。研究发现,一些主题在不同时期内保持较高的强度,从本研究主题强度图可以看出,在慢性病医防融合领域,社区基层医疗机构在医防融合中具有重要作用,此外2021年及以后的阶段中公共卫生体系建设及医防融合成为研究的共识热点。该研究有助于更全面地理解慢性病医防融合领域的研究动态,为未来的研究方向和政策制定提供有益的参考,同时也为文本分析方法的应用提供了实践示范。未来的研究可以进一步挖掘基层医疗与医防协同机制以及健康服务管理与慢性病防控方面的潜力,更好地帮助社区基层医疗机构服务提供者应对来自人口老龄化社会慢性病高发以及多样化健康需求的挑战,同时也要关注对应的新兴技术如人工智能和大数据分析和对应的数据隐私和伦理挑战,以及政策实施中的风险。In this paper, in order to deeply study the development trend and evolution process in the field of chronic disease medical preventive integration in China, 373 relevant literatures from 2006~2024 were collected, and after data cleaning and pre-processing, the LDA model of Word2vec was introduced in the theme mining of the literature to determine the optimal number of themes in each period and generate the theme evolution Sankey diagram. The intensity of each topic in different time periods is calculated and hot topics are described by interactive bar charts. The results show that in the first period of 2006~2020, most of the studies focused on how to integrate healthcare services and how to combine chronic disease prevention and control with medical prevention;in the second period of 2021~2022, in addition to the continuation of the existing themes, some of the studies shifted their focus to how to better manage and integrate integrated healthcare services and how to combine public health services with the healthcare system more effectively;in the third stage, 2023~2024, the research focused on how to realize the deep integration of health services and medical preventive, and how to implement the concept of medical prevention integration in health care services, and the research focused more on practical operation and specific application. The analysis of theme evolution reveals the connection and evolution process between themes in different periods. The themes of comprehensive medical service, chronic disease prevention and control and medical prevention integration have strong continuity in different stages, while the focus of research gradually shifts from comprehensive medical service to medical prevention integration and health service management over time. It is found that some themes maintain a high intensity in different periods, and the intensity map of the themes in this study shows that in the field of chronic disease medical prevention integration, community-based primary healthcare organizations have an important role in medical prevention integration, and in addition, public health system construction and medical prevention integration have become consensus hotspots in research in the stage of 2021 and beyond. This study contributes to a more comprehensive understanding of the research dynamics in the field of chronic disease medical prevention integration, provides useful references for future research directions and policy formulation, and also provides a practical demonstration of the application of text analysis methods. Future research can further explore the potential of primary care and medical prevention synergistic mechanisms as well as health service management and chronic disease prevention and control to better help community-based primary care providers to cope with the challenges from the high prevalence of chronic diseases and diversified health needs of an aging population, as well as to pay attention to the corresponding emerging technologies such as artificial intelligence and big data analytics and the corresponding data privacy and ethical challenges, and the risks in policy implementation. 展开更多
关键词 文本挖掘 主题识别 LDA Word2vec 慢性病 医防融合
暂未订购
基于Node2vec与GCN融合的图嵌入优化方法研究
19
作者 王玺 鞠敏 《理论数学》 2025年第4期53-61,共9页
本文结合了Node2vec和GCN这两种方法,先利用Node2vec方法得到初步的图嵌入,之后将其作为输入利用GCN进一步更新图嵌入矩阵。本文选择在维基数据集上进行节点分类任务,比较了结合前后方法的表现,验证了其有效性。In this paper, we integ... 本文结合了Node2vec和GCN这两种方法,先利用Node2vec方法得到初步的图嵌入,之后将其作为输入利用GCN进一步更新图嵌入矩阵。本文选择在维基数据集上进行节点分类任务,比较了结合前后方法的表现,验证了其有效性。In this paper, we integrate the Node2vec and GCN methods. Initially, the Node2vec method is employed to obtain preliminary graph embeddings, which are then used as input to further update the graph embedding matrix through GCN. The study selects the Wikipedia dataset for node classification tasks, comparing the performance of the methods before and after integration to validate their effectiveness. 展开更多
关键词 图嵌入 Node2vec GCN
在线阅读 下载PDF
基于Node2Vec-LGBM模型的CBA球员位置预测
20
作者 何家丽 杨军 《现代信息科技》 2025年第8期65-70,共6页
随着体育数据的积累和人工智能技术的快速发展,利用大数据和机器学习方法优化球员位置预测变得尤为重要。然而,传统方法往往忽略了球员之间复杂的结构关系,而这些关系对位置预测至关重要。因此,文章提出一种基于Node2Vec和轻量级梯度提... 随着体育数据的积累和人工智能技术的快速发展,利用大数据和机器学习方法优化球员位置预测变得尤为重要。然而,传统方法往往忽略了球员之间复杂的结构关系,而这些关系对位置预测至关重要。因此,文章提出一种基于Node2Vec和轻量级梯度提升机(LGBM)的球员位置预测模型。通过数据挖掘和分析,爬取了CBA球员3个赛季的球员基础数据,并利用LGBM模型进行球员位置预测,结合超参数调优以及Node2Vec图嵌入算法,进一步提高模型本身的准确率。实验结果表明,该模型不仅能有效优化球队的阵容和战术安排,还能为球队提升竞争力和整体表现提供有力支持。 展开更多
关键词 机器学习 轻量级梯度提升机 Node2vec 预测模型
在线阅读 下载PDF
上一页 1 2 93 下一页 到第
使用帮助 返回顶部