期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
基于LDA-Word2vec的冷链物流政策的央地协同量化分析
1
作者 甘卫华 凌耀琛 +1 位作者 吴素浓 熊奥诗 《兰州交通大学学报》 2025年第4期9-20,共12页
自2008年以来,为推动冷链物流健康快速发展,国家及各省市出台了一系列冷链物流政策,这些政策的效果直接影响各地冷链物流的投资热度和运营质量。基于政策工具理论,以中央和地方(下文简称“央地”)出台的冷链物流政策作为研究对象,引入LD... 自2008年以来,为推动冷链物流健康快速发展,国家及各省市出台了一系列冷链物流政策,这些政策的效果直接影响各地冷链物流的投资热度和运营质量。基于政策工具理论,以中央和地方(下文简称“央地”)出台的冷链物流政策作为研究对象,引入LDA主题模型和Word2vec词嵌入算法,进行政策文本的主题归纳分析、地域性差异分析、时序差异分析和央地协同性分析。研究结果表明:1) 2008-2023年研究期内,冷链物流政策主要聚焦“冷链物流行业的标准化”、“专项支持资金打造农产品冷链物流体系”、“多策并举落地冷链物流项目”、“构建绿色高效冷链供应链新模式”等四个主题;2)研究期内,冷链物流规范性政策文本具有时序阶段性特征,可分为萌芽期、增长期和稳健期,且各阶段主题强度不同,保证冷链物流的均衡发展;3)冷链物流规范性政策文本具有区域多样性,各地区对冷链侧重点存在差异,因地制宜制定冷链物流政策;4)华东城市群的冷链物流政策的央地协同性高于其他地区,且政策主题较为丰富,不仅响应中央政策要求,也适应各地区发展。 展开更多
关键词 冷链物流 政策协同 LDA主题模型 word2vec词嵌入算法
在线阅读 下载PDF
一种基于Word2Vec的训练效果优化策略研究 被引量:20
2
作者 王飞 谭新 《计算机应用与软件》 北大核心 2018年第1期97-102,174,共7页
Word2Vec是谷歌在2013年开源的一款语言处理工具包,它能够在基于神经网络训练语言模型的同时将词表示成实数值向量,并根据向量空间余弦距离来寻找语义相似度高的词,训练效率较高。在应用Word2 Vec训练词向量的过程中,对其中可能影响Word... Word2Vec是谷歌在2013年开源的一款语言处理工具包,它能够在基于神经网络训练语言模型的同时将词表示成实数值向量,并根据向量空间余弦距离来寻找语义相似度高的词,训练效率较高。在应用Word2 Vec训练词向量的过程中,对其中可能影响Word2 Vec词向量训练的中文分词和算法选择环节进行试验,配合深入解析部分核心源代码,发现能使训练效果最优的策略,使得Word2Vec的性能获得一定的提升,为下一步的应用提供了更好的词向量。 展开更多
关键词 word2vec 词向量 语义相似度 算法
在线阅读 下载PDF
基于GA-LGBM算法的文本泄露智能预警
3
作者 叶磊 李卫国 +3 位作者 蔡翔 魏绪亮 孙露露 杜成斌 《电子设计工程》 2026年第4期178-181,187,共5页
为有效识别和预警文本数据中的隐私泄露风险,设计基于GA-LGBM算法的文本泄露智能预警方法。对文本数据实施清洗、分词、去除停用词等预处理操作。使用Word2Vec模型实施文本向量化,将文本数据转换为数值特征。提出遗传算法(Genetic Algor... 为有效识别和预警文本数据中的隐私泄露风险,设计基于GA-LGBM算法的文本泄露智能预警方法。对文本数据实施清洗、分词、去除停用词等预处理操作。使用Word2Vec模型实施文本向量化,将文本数据转换为数值特征。提出遗传算法(Genetic Algorithm,GA)优化的轻量梯度提升机(Light Gradient Boosting Machine,LGBM)模型(GA-LGBM算法),将GA的全局搜索优势与Light GBM的预测能力相结合,优化文本泄露智能预警效果。测试结果表明,设计方法在数据量较大的情况下错误预警与无法预警的情况较少,正确预警的占比高;当测试集中的数据从较为平衡的状态转变为极度不平衡时,设计方法的AUC值较高,具有较好的预警效果。 展开更多
关键词 分词 停用词 word2vec模型 GA-LGBM算法 智能预警
在线阅读 下载PDF
基于Word2Vec和LDA主题模型的Web服务聚类方法 被引量:13
4
作者 肖巧翔 曹步清 +2 位作者 张祥平 刘建勋 李晏新闻 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第12期2979-2985,共7页
为高效地发现满足用户需求的Web服务,针对Web服务的描述文本较短、缺乏足够有效信息的问题,提出一种基于Word2Vec和LDA主题模型的Web服务聚类方法。该方法首先将Wikipedia语料库作为扩充源,使用word2vec对Web服务描述文档内容进行扩充,... 为高效地发现满足用户需求的Web服务,针对Web服务的描述文本较短、缺乏足够有效信息的问题,提出一种基于Word2Vec和LDA主题模型的Web服务聚类方法。该方法首先将Wikipedia语料库作为扩充源,使用word2vec对Web服务描述文档内容进行扩充,再将扩充后的描述文档利用主题模型进行特征建模,将短文本主题建模转化为长文本主题建模,更准确地实现服务内容主题表达,最后根据文档的主题分布矩阵寻找相似的服务并完成聚类,使用从ProgrammableWeb收集的真实数据进行实验。研究结果表明:本文方法与TFIDF-K,LDA,WT-LDA和LDA-K方法相比,F分别提高419.74%,20.11%,15.60%和27.80%,利用扩充后的Web服务的描述文档进行聚类的方法能够有效提高Web服务聚类的效果。 展开更多
关键词 WEB服务 word2vec LDA主题模型 K-MEANS算法 Web服务聚类
在线阅读 下载PDF
一种基于Word2vec的敏感内容识别技术 被引量:8
5
作者 金贵涛 石元兵 +2 位作者 魏忠 王雍 刘峻豪 《通信技术》 2019年第11期2750-2756,共7页
随着数据量的爆炸式增长,企业面临数据安全防护的难题,尤其是文本数据的安全防护。传统的精确匹配识别文本中敏感词的方法,因存在相似词而导致遗漏,造成数据泄露。于是,提出了一种基于Word2vec结合人工设定的不同等级敏感词识别技术,从... 随着数据量的爆炸式增长,企业面临数据安全防护的难题,尤其是文本数据的安全防护。传统的精确匹配识别文本中敏感词的方法,因存在相似词而导致遗漏,造成数据泄露。于是,提出了一种基于Word2vec结合人工设定的不同等级敏感词识别技术,从语义层面识别文本中的敏感词,并根据提出的敏感度模型计算文本敏感度,判断文本敏感等级。实验结果表明,与传统方法相比,提出的技术方法能够更准确、全面地识别文本敏感内容,并确定文本敏感等级。 展开更多
关键词 敏感词 TextRank算法 word2vec 文本敏感等级
在线阅读 下载PDF
基于会话记录的Word2Vec音乐推荐算法研究 被引量:4
6
作者 周航帆 周莲英 《通信技术》 2019年第4期850-857,共8页
在很多推荐场景下,用户在短时间内做出的一系列会话行为,更能反映一个人当时的心理状态与需求,为此这里提出基于会话记录的Word2Vec音乐推荐算法。Word2Vec是目前最常用的文本词向量神经网络模型,这里利用Word2Vec模型学习用户音乐会话... 在很多推荐场景下,用户在短时间内做出的一系列会话行为,更能反映一个人当时的心理状态与需求,为此这里提出基于会话记录的Word2Vec音乐推荐算法。Word2Vec是目前最常用的文本词向量神经网络模型,这里利用Word2Vec模型学习用户音乐会话记录中相似场景的共同特点,在无明确需求场景下向用户进行个性化音乐推荐。主要工作包括会话记录推荐问题的形式化定义、基于会话记录情境下的音乐词向量模型搭建和训练、音乐词向量学习模型通过理论推导进一步验证音乐词向量提取合理性,在Last.fm真实数据集下进行实验,实验的主要设计为合理选择窗口值以及维度,获取低维、稠密歌曲词向量,利用t-分布邻域嵌入算法实现降维可视化,可以直观发现相似‘语义’歌曲在二维空间紧密相连,最后,提出的方案相较于其他通用推荐算法,推荐效用性取得显著效果。 展开更多
关键词 推荐算法 词向量 会话记录
在线阅读 下载PDF
基于Word2Vec和TextRank的时政类新闻关键词抽取方法研究 被引量:13
7
作者 刘奇飞 沈炜域 《情报探索》 2018年第6期22-27,共6页
[目的/意义]旨在为时政类新闻关键词抽取提供参考。[方法/过程]基于融合Word2Vec和TextRank算法,在研究时政类新闻文本特征基础上,利用政治重点词库修订文本词语的初始权重,结合上下文关系确定词语之间的连接关系,并基于Word2Vec模型构... [目的/意义]旨在为时政类新闻关键词抽取提供参考。[方法/过程]基于融合Word2Vec和TextRank算法,在研究时政类新闻文本特征基础上,利用政治重点词库修订文本词语的初始权重,结合上下文关系确定词语之间的连接关系,并基于Word2Vec模型构建概率转移矩阵,提出改进的Word2Vec和TextRank算法。[结果/结论 ]运用改进的Word2Vec和TextRank算法对时政类新闻关键词进行抽取,其准确率、召回率和F值均优于传统TextRank算法及普通的融合Word2Vec和TextRank算法,抽取效果更好。 展开更多
关键词 时政新闻 关键词抽取 TextRank算法 word2vec模型 词图
在线阅读 下载PDF
基于Word2Vec及TextRank算法的长文档摘要自动生成研究 被引量:1
8
作者 朱玉婷 刘乐 +2 位作者 辛晓乐 陈珑慧 康亮河 《现代信息科技》 2023年第4期36-38,42,共4页
近年来,如何从大量信息中提取关键信息已成为一个急需解决的问题。针对中文专利长文档,提出一种结合Word2Vec和TextRank的专利生成算法。首先利用Python Jieba技术对中文专利文档进行分词,利用停用词典去除无意义的词;其次利用Word2Vec... 近年来,如何从大量信息中提取关键信息已成为一个急需解决的问题。针对中文专利长文档,提出一种结合Word2Vec和TextRank的专利生成算法。首先利用Python Jieba技术对中文专利文档进行分词,利用停用词典去除无意义的词;其次利用Word2Vec算法进行特征提取,并利用WordCloud对提取的关键词进行可视化展示;最后利用TextRank算法计算语句间的相似度,生成摘要候选句,根据候选句的权重生成该专利文档的摘要信息。实验表明,采用Word2Vec和TextRank生成的专利摘要质量高,概括性也强。 展开更多
关键词 Jieba分词 关键词提取 word2vec算法 TextRank算法
在线阅读 下载PDF
分类数据的Word2Vec与Jaccard相似度聚类方法的比较分析
9
作者 孙晶 《软件》 2024年第9期49-51,共3页
在实际问题中,使用K-means算法进行聚类的数据点往往有很多特征值,这些特征值大多以文本形式存在,因此如何将大量特征值形成的稀疏数据集进行有效编码,再进行数据点聚类是一个重要的研究方向。本文提出了一种优化思路:将贝叶斯优化应用... 在实际问题中,使用K-means算法进行聚类的数据点往往有很多特征值,这些特征值大多以文本形式存在,因此如何将大量特征值形成的稀疏数据集进行有效编码,再进行数据点聚类是一个重要的研究方向。本文提出了一种优化思路:将贝叶斯优化应用于Word2Vec和K-means聚类算法的参数调优过程,通过多次迭代寻找最优参数解。通过计算分析,并与基于独热编码的Jaccard相似度计算方法实现的聚类算法结果进行比较,证明本文提出的优化改进思路聚类效果更好,准确率更高。 展开更多
关键词 K-MEANS算法 贝叶斯优化 word2vec模型 独热编码 Jaccard相似度
在线阅读 下载PDF
基于LDA2vec的数字图书馆信息资源共享研究
10
作者 王芳 《长江信息通信》 2025年第8期123-125,共3页
数字图书馆信息资源自身主题构成多元,导致直接匹配共享请求时,反馈准确性低。对此,开展基于LDA2vec的数字图书馆信息资源共享研究。利用word2vec词向量在特定窗口大小训练原始数字图书馆信息资源文档,输出文本字符串形式信息资源;利用... 数字图书馆信息资源自身主题构成多元,导致直接匹配共享请求时,反馈准确性低。对此,开展基于LDA2vec的数字图书馆信息资源共享研究。利用word2vec词向量在特定窗口大小训练原始数字图书馆信息资源文档,输出文本字符串形式信息资源;利用LDA输出包含主题document向量,求和计算得到转化后的信息资源。在数据共享请求的属性集中搜索与转化资源包含主题一致的属性,利用拉格朗日插值算法计算满足条件共享请求属性拟合阈值信息,输出多项式形式共享请求反馈结果。在结果中,设计方法在对测试样本信息资源向量化转化基础上,对共享请求反馈输出结果完整性高于88.0%,准确性在高于92.0%。 展开更多
关键词 LDA2vec 数字图书馆 信息资源共享 word2vec LDA 拉格朗日插值算法
在线阅读 下载PDF
融合词向量的多特征句子相似度计算方法研究 被引量:14
11
作者 李峰 侯加英 +1 位作者 曾荣仁 凌晨 《计算机科学与探索》 CSCD 北大核心 2017年第4期608-618,共11页
在归纳常见的句子相似度计算方法后,基于《人民日报》3.4万余份文本训练了用于语义相似度计算的词向量模型,并设计了一种融合词向量的多特征句子相似度计算方法。该方法在词方面,考虑了句子中重叠的词数和词的连续性,并运用词向量模型... 在归纳常见的句子相似度计算方法后,基于《人民日报》3.4万余份文本训练了用于语义相似度计算的词向量模型,并设计了一种融合词向量的多特征句子相似度计算方法。该方法在词方面,考虑了句子中重叠的词数和词的连续性,并运用词向量模型测量了非重叠词间的相似性;在结构方面,考虑了句子中重叠词的语序和两个句子的长度一致性。实验部分设计实现了4种句子相似度计算方法,并开发了相应的实验系统。结果表明:提出的算法能够取得相对较好的实验结果,对句子中词的语义特征和句子结构特征进行组合处理和优化,能够提升句子相似度计算的准确性。 展开更多
关键词 词向量 句子相似度 word2vec 算法设计
在线阅读 下载PDF
基于文本挖掘的铁路信号设备故障自动分类方法 被引量:14
12
作者 林海香 陆人杰 +1 位作者 卢冉 许丽 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第2期281-289,共9页
铁路信号设备在运营维护过程中积累了大量以文本方式记录的维护数据,为了实现高效准确分类,提出将Word2vec、SMOTE算法与卷积神经网络(Convolutional Neural Networks,CNN)相结合的铁路信号设备故障文本自动分类方法.首先,对故障文本使... 铁路信号设备在运营维护过程中积累了大量以文本方式记录的维护数据,为了实现高效准确分类,提出将Word2vec、SMOTE算法与卷积神经网络(Convolutional Neural Networks,CNN)相结合的铁路信号设备故障文本自动分类方法.首先,对故障文本使用自然语言方法完成预处理,并采用Word2vec训练词向量;其次,通过SMOTE算法自动生成小类别文本向量数据,嵌入至CNN的输入层;再次,利用CNN的卷积层和池化层提取故障文本的局部上下文高层特征;最后,通过softmax分类器对故障文本自动分类.依据某铁路局所记录的信号设备故障文本数据进行实验分析并与其他方法对比,实验结果表明新方法可使各评价指标得到明显提升,其中分类准确率和召回率分别达到95.26%和94.32%,可以作为铁路信号设备故障自动分类的有效方法. 展开更多
关键词 铁路信号设备 word2vec SMOTE算法 卷积神经网络 故障文本数据 自动分类
在线阅读 下载PDF
基于AWCRF模型的微博情感倾向分类方法 被引量:2
13
作者 陈炳丰 郝志峰 +2 位作者 蔡瑞初 温雯 梁礼欣 《计算机工程》 CAS CSCD 北大核心 2017年第7期187-192,共6页
为有效解决中文微博情感数据分布不平衡的分类问题,提出一种融合Affinity Propogation(AP)算法、Word2vec技术和条件随机场(CRF)模型的分类方法。通过AP算法对微博数据进行聚类,将多数类样本按照相似性的度量划分为若干簇类,使类间距离... 为有效解决中文微博情感数据分布不平衡的分类问题,提出一种融合Affinity Propogation(AP)算法、Word2vec技术和条件随机场(CRF)模型的分类方法。通过AP算法对微博数据进行聚类,将多数类样本按照相似性的度量划分为若干簇类,使类间距离极大化、类内距离极小化。利用欠采样技术构建情感倾向分布平衡的训练集,采用Word2vec计算并求出语义相似度最高的文本来扩展微博句子以增加情感信息,使用CRF模型计算已经平衡并扩展后的训练集标签序列,在数据集情感倾向分布不平衡时也能准确地分类微博情感倾向。实验结果表明,与ACRF方法、CRF方法及SCRF方法相比,该方法在召回率和G均值评价标准上具有更好的效果。 展开更多
关键词 情感分析 情感分类 AFFINITY Propogation算法 欠采样技术 word2vec技术 条件随机场
在线阅读 下载PDF
基于多特征融合的TextRank新闻自动摘要模型 被引量:1
14
作者 徐飞 彭佳佳 +1 位作者 刘军 杨博 《计算机系统应用》 2023年第2期242-249,共8页
随着互联网的发展,如何快速地从海量新闻中获取核心信息,减少浏览负担,是信息部门目前急需解决的问题.现有的TextRank及其改进算法在新闻摘要抽取任务中,考虑文本特征不全面.在摘要句选择时,只考虑到摘要的冗余度,忽略了摘要的多样性及... 随着互联网的发展,如何快速地从海量新闻中获取核心信息,减少浏览负担,是信息部门目前急需解决的问题.现有的TextRank及其改进算法在新闻摘要抽取任务中,考虑文本特征不全面.在摘要句选择时,只考虑到摘要的冗余度,忽略了摘要的多样性及可读性.针对上述问题,本文提出了融合多特征的文本自动摘要方法MF-Text Rank(multi-feature TextRank).根据新闻的结构、句子和单词总结了更全面的文本特征信息用于改进TextRank算法的权重转移矩阵,使句子权重计算更准确.采用MMR算法更新句子权重,通过集束搜索得到候选摘要集,在MMR得分的基础上选择内聚性最高的候选摘要集作为最终的摘要输出.实验结果表明,MF-TextRank算法在摘要抽取任务中摘要Rouge得分优于现有改进的TexRank算法,有效提高了摘要抽取的准确性. 展开更多
关键词 TextRank MMR word2vec 新闻摘要 多特征融合 自动摘要
在线阅读 下载PDF
问询函语调降低了年报乐观性披露吗?
15
作者 刘慧芬 陈贤湘 +1 位作者 林子琛 董慧 《湖南财政经济学院学报》 2021年第5期86-98,共13页
随着我国资本市场发展,问询已经成为两大证券交易所主要的监管手段,与问询力度为主流的研究相比,问询函语调研究成果相对较少,究其原因在于缺乏适用于问询研究的情感词典。基于此提出利用Word2vec模型和调整后的SO-WV算法,以2014至2019... 随着我国资本市场发展,问询已经成为两大证券交易所主要的监管手段,与问询力度为主流的研究相比,问询函语调研究成果相对较少,究其原因在于缺乏适用于问询研究的情感词典。基于此提出利用Word2vec模型和调整后的SO-WV算法,以2014至2019年上市公司问询函作为语料库,构建相关情感词典,并对问询函文本语调进行经济后果研究,结果发现问询函负面语调对上市公司下一年度报表乐观语气具有显著抑制效应,一定程度上说明,审核问询机制降低了管理层回函的语调管理空间,从而优化了信息披露环境。 展开更多
关键词 问询函 情感分析 情感词典 word2vec SO-WV算法
在线阅读 下载PDF
多特征因子融合的引文推荐算法 被引量:2
16
作者 陈志涛 李书琴 +1 位作者 刘斌 何进荣 《计算机工程与设计》 北大核心 2018年第7期1895-1903,共9页
针对传统引文推荐算法只考虑单一特征导致推荐结果过于专门化和推荐质量较低等问题,提出一种多特征因子融合的引文推荐算法。将整体影响力因子、局部活跃度因子、查询相关度因子及作者相关度因子通过多特征因子融合模型进行有效融合,其... 针对传统引文推荐算法只考虑单一特征导致推荐结果过于专门化和推荐质量较低等问题,提出一种多特征因子融合的引文推荐算法。将整体影响力因子、局部活跃度因子、查询相关度因子及作者相关度因子通过多特征因子融合模型进行有效融合,其中,查询相关度因子通过引入ID2vec改进重启随机游走算法实现。基于ANN数据集的实验结果表明,多特征融合的引文推荐算法相比GloPageRank、TopicSim、BM25模型在召回率上都有相应的提升,改进的重启随机游走算法相比原有算法在召回率上提升了8.13%,在NDCG上提升了29.7%。由实验结果分析可得,所提算法可有效提升引文推荐质量。 展开更多
关键词 引文推荐 词向量 PAGERANK算法 重启随机游走 表示学习
在线阅读 下载PDF
融合LSTM和LDA差异的新闻文本关键词抽取方法 被引量:3
17
作者 宁珊 严馨 +2 位作者 周枫 王红斌 张金鹏 《计算机工程与科学》 CSCD 北大核心 2020年第1期153-160,共8页
针对语义信息对TextRank的影响,同时考虑新闻标题信息高度浓缩以及关键词的覆盖性与差异性的特点,提出一种新的融合LSTM和LDA差异的关键词抽取方法。首先对新闻文本进行预处理,得到候选关键词;其次通过LDA主题模型得到候选关键词的主题... 针对语义信息对TextRank的影响,同时考虑新闻标题信息高度浓缩以及关键词的覆盖性与差异性的特点,提出一种新的融合LSTM和LDA差异的关键词抽取方法。首先对新闻文本进行预处理,得到候选关键词;其次通过LDA主题模型得到候选关键词的主题差异影响度;然后结合LSTM模型和word2vec模型计算候选关键词与标题的语义相关性影响度;最后将候选关键词节点按照主题差异影响度和语义相关性影响度进行非均匀转移,得到最终的候选关键词排序,抽取关键词。该方法融合了关键词的语义重要性、覆盖性以及差异性的不同属性。在搜狗全网新闻语料上的实验结果表明,该方法的抽取结果相比于传统方法在准确率和召回率上都有明显提升。 展开更多
关键词 抽取 新闻标题 TextRank算法 word2vec模型 LDA模型
在线阅读 下载PDF
基于异质网络表示学习的姓名消歧 被引量:2
18
作者 唐正正 洪学海 +1 位作者 汪洋 李玉轩 《模式识别与人工智能》 CSCD 北大核心 2021年第6期485-496,共12页
在系统中搜索某一姓名时,会返回该同名作者的所有文档(如论文、网页),严重影响用户体验,姓名消歧可提高检索精度.因此,文中提出基于异质网络表示学习的姓名消歧方法.首先为每个歧义姓名构造一个论文异质网络.然后使用异质网络表示学习... 在系统中搜索某一姓名时,会返回该同名作者的所有文档(如论文、网页),严重影响用户体验,姓名消歧可提高检索精度.因此,文中提出基于异质网络表示学习的姓名消歧方法.首先为每个歧义姓名构造一个论文异质网络.然后使用异质网络表示学习并结合词向量化语义表征学习方法,获取网络中每个论文节点的表征向量.最后使用具有噪声的基于密度的聚类方法与规则匹配结合的聚类方法将论文划分给不同的作者实体.文中方法在OAG-WholsWho比赛数据集上的性能较优,结果验证方法的有效性. 展开更多
关键词 姓名消歧 异质网络 词向量化(word2vec) 分类算法
在线阅读 下载PDF
基于改进TextRank的铁路文献关键词抽取算法 被引量:18
19
作者 赵占芳 刘鹏鹏 李雪山 《北京交通大学学报》 CAS CSCD 北大核心 2021年第2期80-86,共7页
实现铁路行业海量的铁路科技信息资源有效地组织管理并提供智能化、专业化的检索和服务,已经成为科研人员迫切期望解决的问题.关键词自动抽取技术是实现信息的智能检索和标引分类的核心技术,本文提出了一种改进TextRank的关键词抽取算... 实现铁路行业海量的铁路科技信息资源有效地组织管理并提供智能化、专业化的检索和服务,已经成为科研人员迫切期望解决的问题.关键词自动抽取技术是实现信息的智能检索和标引分类的核心技术,本文提出了一种改进TextRank的关键词抽取算法应用于铁路文献关键词的抽取,该算法融合多个特征因素改进词汇节点的初始权重设置,并利用Word2Vec训练的词向量表征改进词节点间的转移概率.实验结果表明:本文所提出的关键词抽取算法相对于经典的TextRank和TF-IDF算法在准确率,召回率以及F值上都有较大的提升.与TextRank相比,F值提升了13.9%. 展开更多
关键词 抽取 word2vec模型 TextRank算法
在线阅读 下载PDF
基于变异反馈的临床路径优化 被引量:2
20
作者 陈年 金涛 王建民 《计算机集成制造系统》 EI CSCD 北大核心 2021年第9期2556-2564,共9页
为解决人工制定临床路径变异率高的问题,提出一种基于遗传算法挖掘可推荐医嘱的方法。在该方法中,每条染色体代表一组可以加入临床路径的医嘱。针对挖掘算法效率较低的问题,调研了遗传算法的常用优化方法,将这些方法应用到临床路径优化... 为解决人工制定临床路径变异率高的问题,提出一种基于遗传算法挖掘可推荐医嘱的方法。在该方法中,每条染色体代表一组可以加入临床路径的医嘱。针对挖掘算法效率较低的问题,调研了遗传算法的常用优化方法,将这些方法应用到临床路径优化问题上;为了进一步改进遗传算法,提出一种基于Word2vec的变异算子改进方法。实验结果表明,遗传挖掘算法在临床路径优化问题上具备可行性,轮盘赌、尺度变换、最优保存、均匀交叉、自适应变异、引入Word2vec的改进方法组合最有效,采用非数值编码,改进后的遗传算法性能提高了50%~55%;采用二进制编码,性能提高了约77%。 展开更多
关键词 临床路径 优化 遗传算法 word2vec 变异反馈
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部