期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
结合Word2vec和BiLSTM的民航非计划事件分析方法 被引量:1
1
作者 王捷 周迪 +1 位作者 左洪福 黄维 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2024年第7期917-924,共8页
安全是民航业的核心主题。针对目前民航非计划事件分析严重依赖专家经验及分析效率低下的问题,文章提出一种结合Word2vec和双向长短期记忆(bidirectional long short-term memory,BiLSTM)神经网络模型的民航非计划事件分析方法。首先采... 安全是民航业的核心主题。针对目前民航非计划事件分析严重依赖专家经验及分析效率低下的问题,文章提出一种结合Word2vec和双向长短期记忆(bidirectional long short-term memory,BiLSTM)神经网络模型的民航非计划事件分析方法。首先采用Word2vec模型针对事件文本语料进行词向量训练,缩小空间向量维度;然后通过BiLSTM模型自动提取特征,获取事件文本的完整序列信息和上下文特征向量;最后采用softmax函数对民航非计划事件进行分类。实验结果表明,所提出的方法分类效果更好,能达到更优的准确率和F 1值,对不平衡数据样本同样具有较稳定的分类性能,证明了该方法在民航非计划事件分析上的适用性和有效性。 展开更多
关键词 民航安全 文本分析 非计划事件 word2vec 双向长短期记忆(BiLSTM)神经网络
在线阅读 下载PDF
基于Word2vec和改进型TF-IDF的卷积神经网络文本分类模型 被引量:43
2
作者 王根生 黄学坚 《小型微型计算机系统》 CSCD 北大核心 2019年第5期1120-1126,共7页
针对传统机器学习文本分类算法语义特征表达弱、文本表示维度高、词序丢失、矩阵稀疏等问题,提出基于Word2vec、改进型TF-IDF和卷积神经网络三者相结合的文本分类模型(CTMWT):首先通过Word2vec模型训练得出样本中所有的词向量;然后提出... 针对传统机器学习文本分类算法语义特征表达弱、文本表示维度高、词序丢失、矩阵稀疏等问题,提出基于Word2vec、改进型TF-IDF和卷积神经网络三者相结合的文本分类模型(CTMWT):首先通过Word2vec模型训练得出样本中所有的词向量;然后提出基于类频方差改进型TF-IDF算法,分析每个词向量在文本中的权重,构建基于词向量和权重的文本向量表示;最后借助卷积神经网络从局部到全局相关性特征的学习能力,对该大量文本向量进行深度学习.试验结果表明三者结合的文本分类模型不仅能实现文本的准确分类,并且相比传统的机器学习文本分类算法具有更好的分类效果. 展开更多
关键词 word2vec 改进型TF-IDF算法 卷积神经网络 文本分类 CTMWT
在线阅读 下载PDF
基于Word2vec与BP神经网络的病历症状自动分类研究 被引量:1
3
作者 叶辉 卓奕荣 +1 位作者 肖志毅 吴瑞源 《医学信息学杂志》 CAS 2018年第11期59-62,共4页
分别运用Word2vec和BP神经网络算法以及两者混合对300份长病历数据进行症状信息的分类抽取,旨在解决医学病历症状信息自动分类问题,结果表明采用两种方法混合处理能够得到更好的效果。
关键词 BP神经网络 word2vec 文本分类 病历症状信息
暂未订购
基于词向量-卷积神经网络的新闻文本分类研究
4
作者 张迪 《西安交通工程学院学术研究》 2025年第2期84-90,共7页
针对传统新闻文本分类方法依赖人工特征工程,难以有效捕捉新闻文本的深层语义信息,并且存在特征稀疏性的问题。为解决目前分类存在的局限,提出一种基于词向量与卷积神经网络(CNN,convolutional neural network)的分类模型。关键在于研究... 针对传统新闻文本分类方法依赖人工特征工程,难以有效捕捉新闻文本的深层语义信息,并且存在特征稀疏性的问题。为解决目前分类存在的局限,提出一种基于词向量与卷积神经网络(CNN,convolutional neural network)的分类模型。关键在于研究CNN中不同激活函数对新闻文本分类性能的影响,通过对比分析ReLU、Mish、Swish等激活函数在新闻文本特征提取中的表现,结合预训练词向量(Word2vec)构建多层级CNN网络架构,以优化新闻文本的特征表示。通过Word2vec将新闻文本中的词汇转化为稠密低维的向量表示,高效保留词语的语义与句法的紧密关系,CNN利用卷积层在词向量序列上滑动,自动提取局部上下文特征,捕获文本的关键分类信息。在搜狗全网中文新闻语料上进行测试表明:W_CNNMish模型分类精确率、召回率、F1值最高,同时验证了CNN在自动提取文本分类特征方面表现优异。 展开更多
关键词 word2vec 卷积神经网络 激活函数 新闻文本分类
在线阅读 下载PDF
基于Word2Vec与深度神经网络的协同推荐模型 被引量:1
5
作者 金楠 王瑞琴 陆悦聪 《湖州师范学院学报》 2022年第8期45-54,共10页
针对目前推荐系统广泛存在的数据稀疏性、预测评分不准确和神经网络模型复杂度较高等问题,提出深度神经网络模型ProfileDNN.模型借鉴自然语言处理中的Word2Vec表征学习方法预训练物品的嵌入向量,并利用物品的嵌入向量构建物品和用户画像... 针对目前推荐系统广泛存在的数据稀疏性、预测评分不准确和神经网络模型复杂度较高等问题,提出深度神经网络模型ProfileDNN.模型借鉴自然语言处理中的Word2Vec表征学习方法预训练物品的嵌入向量,并利用物品的嵌入向量构建物品和用户画像,最后基于深度神经网络模型学习用户对物品的预测评分.基于3个公共数据集的对比实验表明,相比同类模型,ProfileDNN模型的复杂度更低,且推荐准确率最高提升达1.1%. 展开更多
关键词 推荐系统 嵌入向量 word2vec 表征学习 深度神经网络
在线阅读 下载PDF
基于Word2Vec的疫情虚假信息检测方法 被引量:4
6
作者 齐浩翔 马莉媛 朱翌民 《智能计算机与应用》 2021年第10期134-138,共5页
在面临突发大型公共事件时虚假信息的广泛传播将具有极大的破坏性。虚假信息的传播将严重干扰疫情的救治工作,针对以往传统分类模型存在特征稀疏,准确率不高等问题。提出了一种基于Word2Vec的疫情虚假信息检测方法。该方法使用Word2Vec... 在面临突发大型公共事件时虚假信息的广泛传播将具有极大的破坏性。虚假信息的传播将严重干扰疫情的救治工作,针对以往传统分类模型存在特征稀疏,准确率不高等问题。提出了一种基于Word2Vec的疫情虚假信息检测方法。该方法使用Word2Vec模型训练词向量,解决了传统向量空间模型的特征稀疏问题,再引入TFIDF对词向量进行加权,最终将处理过后的数据输入到SVM模型。通过在国内新闻平台爬取的数据集上的实验验证,该方法较之传统方法,对虚假信息的检测在准确率上有4%以上的提升。 展开更多
关键词 疫情 word2vec 神经网络 SVM 文本分类
在线阅读 下载PDF
基于Word2Vec的神经网络协同推荐模型 被引量:2
7
作者 张华伟 《网络空间安全》 2019年第6期25-28,共4页
在信息推荐系统中,传统的方法是通过对内容、行为去预测用户的兴趣点来实现信息推送。国内外研究实验结果表明,这种模型推荐性能较为显著,说明用户行为和内容是相关的。根据相关性的对称原理,文章提出了基于用户行为的Word2Vec协同推荐... 在信息推荐系统中,传统的方法是通过对内容、行为去预测用户的兴趣点来实现信息推送。国内外研究实验结果表明,这种模型推荐性能较为显著,说明用户行为和内容是相关的。根据相关性的对称原理,文章提出了基于用户行为的Word2Vec协同推荐算法,通过神经网络模型来隐式地抽取商品和用户的相互关系并进行向量化表示,能够更好地计算商品和用户间的相似性,以达到提升模型的推荐效果和泛化能力。 展开更多
关键词 word2vec 词向量 协同推荐 卷积神经网络
在线阅读 下载PDF
word2vec基础上的配电网恶意控制指令检测
8
作者 李静 戴越 《单片机与嵌入式系统应用》 2019年第10期22-24,36,共4页
提出了一种根据上下文数据关系建立的word2vec算法。针对大量访问数据来建立白名单模型,通过对配电网上下文测量信息和控制信息的挖掘和数据驱动实现恶意控制指令的快速检测,获得白名单模型中的不符合项作为异常。利用孤立森林算法建立... 提出了一种根据上下文数据关系建立的word2vec算法。针对大量访问数据来建立白名单模型,通过对配电网上下文测量信息和控制信息的挖掘和数据驱动实现恶意控制指令的快速检测,获得白名单模型中的不符合项作为异常。利用孤立森林算法建立上下文关系的孤立树,从而实现对各测试样本的分类和训练,采用CBOW神经网络模型将中心词汇后验概率作为输出层,获得不同样本集下的监测精确度和准确率。最后在建立的配电网仿真平台上对word2vec进行了数据挖掘和计算,验证了算法具有高准确率和低误警率。 展开更多
关键词 word2vec 配电网 恶意控制指令 CBOW神经网络模型
在线阅读 下载PDF
基于Word2Vec与LSTM病历文本分类研究
9
作者 王捷 陈超 +2 位作者 周海权 舒德胜 黄豪 《现代计算机》 2023年第17期41-44,共4页
医疗系统的不断完善,产生了大量的医疗电子病历文本数据,其中含有数量可观的有借鉴性的医疗文本信息,而在对电子病历文本挖掘和利用方面,一直存在有效信息分类难度大、利用率低等问题。为了解决以上问题,设计一种基于Word2Vec与长短期... 医疗系统的不断完善,产生了大量的医疗电子病历文本数据,其中含有数量可观的有借鉴性的医疗文本信息,而在对电子病历文本挖掘和利用方面,一直存在有效信息分类难度大、利用率低等问题。为了解决以上问题,设计一种基于Word2Vec与长短期记忆神经网络(LSTM)的文本分类模型,使用Word2Vec模型计算文本向量作为LSTM的输入,构建两组对照模型,分别是基于支持向量机(SVM)的文本分类算法以及基于卷积神经网络(CNN)的文本分类算法,实验结果显示该方法在分类效果上优于其它对照模型,具有一定的实用价值。 展开更多
关键词 文本分类 word2vec 长短期记忆神经网络
在线阅读 下载PDF
数据资产信息披露对制造企业债务融资成本的影响研究——基于年报“管理层讨论与分析”文本 被引量:21
10
作者 王文彦 张红梅 张目 《金融理论与实践》 北大核心 2024年第2期38-50,共13页
以2010-2022年中国A股上市2702家制造企业为样本,运用Word2Vec神经网络模型构建文本词典获取数据资产信息披露指标,探究数据资产信息披露与制造企业债务融资成本的关系。研究发现,数据资产信息披露程度越高,制造企业债务融资成本越低;... 以2010-2022年中国A股上市2702家制造企业为样本,运用Word2Vec神经网络模型构建文本词典获取数据资产信息披露指标,探究数据资产信息披露与制造企业债务融资成本的关系。研究发现,数据资产信息披露程度越高,制造企业债务融资成本越低;进一步研究发现,数据资产信息披露能通过提高分析师盈余预测准确率和降低债务违约风险两条路径降低制造企业债务融资成本,并且数据资产信息披露在非国有制造企业和治理水平较高的制造企业中促进作用更加显著。因此,应持续完善上市公司数据资产信息披露准则,缓解企业与债权人之间的信息不对称,进而优化企业的金融资源配置能力。 展开更多
关键词 制造企业 数据资产 信息披露 债务融资成本 word2vec神经网络
在线阅读 下载PDF
基于字词向量的BiLSTM-CRF水利工程巡检文本实体识别模型 被引量:5
11
作者 刘雪梅 程彭圣男 +3 位作者 李海瑞 曹闯 高英 崔培 《华北水利水电大学学报(自然科学版)》 北大核心 2024年第3期9-17,共9页
命名实体识别是构建水利知识图谱的核心技术。水利工程巡检文本是水利工程最为常见的数据类型,以文本形式记录,没有固定格式与结构,但其包含水利工程安全潜在风险信息,具有价值密度高的特点。针对水利工程巡检文本命名实体识别问题,提... 命名实体识别是构建水利知识图谱的核心技术。水利工程巡检文本是水利工程最为常见的数据类型,以文本形式记录,没有固定格式与结构,但其包含水利工程安全潜在风险信息,具有价值密度高的特点。针对水利工程巡检文本命名实体识别问题,提出字词向量融合的BiLSTM-CRF模型,首先将巡检文本分别在字维度和词维度进行向量化处理,合并字词向量获取字词向量特征;然后利用BiLSTM神经网络获取序列化后的上下文特征;最后通过CRF进行解码并提取相应实体。以南水北调中线工程巡检文本为例,实验结果表明:字词向量结合之后的方法能有效提高识别性能,对实体边界的识别效果更优,模型准确率、召回率和F1值分别可以达到93.79%、93.06%、93.42%;时间效率较BERT-BiLSTM-CRF模型的时间效率提高82.86%。基于字词向量的BiLSTM-CRF模型可为水利工程知识图谱的快速构建提供技术支撑。 展开更多
关键词 巡检文本 实体识别 双向长短期记忆神经网络 word2vec 条件向量场
在线阅读 下载PDF
基于历史会话数据的客户服务分配方法
12
作者 石海威 《移动信息》 2024年第9期182-184,共3页
随着时代的发展,企业对客户服务的要求越来越高,对客户问题的处理时效性要求也越来越严,对现有客服人员的分配方法提出了挑战.为解决传统手动或基于简单规则分配客户的方法会影响客服人员的效率和准确度的问题,文中利用深度学习和自然... 随着时代的发展,企业对客户服务的要求越来越高,对客户问题的处理时效性要求也越来越严,对现有客服人员的分配方法提出了挑战.为解决传统手动或基于简单规则分配客户的方法会影响客服人员的效率和准确度的问题,文中利用深度学习和自然语言处理(NLP)技术,深入分析了企业微信等工具中大量的历史会话数据,并结合分析结果与机器学习算法,将客户问题精确、高效地分配给最合适的客服人员. 展开更多
关键词 深度学习(LSTM) 机器学习(XgBoost) word2vec模型 神经网络
在线阅读 下载PDF
融合知识库和深度学习的电网监控告警事件智能识别 被引量:36
13
作者 孙国强 沈培锋 +4 位作者 赵扬 朱红勤 丁小柳 卫志农 臧海祥 《电力自动化设备》 EI CSCD 北大核心 2020年第4期40-47,共8页
电网监控告警信息是监控人员进行监控事件识别的重要数据基础。针对当前人为处理海量监控告警信息效率低的现状和电网智能技术深化应用的需求,提出一种融合知识库和深度学习的电网监控告警事件自主识别方法。基于自然语言处理技术中的Wo... 电网监控告警信息是监控人员进行监控事件识别的重要数据基础。针对当前人为处理海量监控告警信息效率低的现状和电网智能技术深化应用的需求,提出一种融合知识库和深度学习的电网监控告警事件自主识别方法。基于自然语言处理技术中的Word2vec模型对监控告警信息进行向量化建模,基于卷积神经网络建立监控告警事件识别模型,通过算例对比验证所建模型的有效性和实用性。提出融合知识库与所建模型的应用方法,实现电网监控告警事件的智能感知和可靠识别。 展开更多
关键词 电网监控 告警信息 word2vec 卷积神经网络 事件识别 知识库 深度学习
在线阅读 下载PDF
改进卷积神经网络的文本主题识别算法研究 被引量:8
14
作者 邱宁佳 杨长庚 +1 位作者 王鹏 任涛 《计算机工程与应用》 CSCD 北大核心 2022年第2期161-168,共8页
针对于传统方法中存在的文本特征表示能力差、模型主题识别准确率低等问题,提出一种融合SENet与卷积神经网络的文本主题识别方法。将每个词对应的Word2vec词向量与LDA主题向量进行融合,并依据词语对主题的贡献度完成文档加权向量化处理... 针对于传统方法中存在的文本特征表示能力差、模型主题识别准确率低等问题,提出一种融合SENet与卷积神经网络的文本主题识别方法。将每个词对应的Word2vec词向量与LDA主题向量进行融合,并依据词语对主题的贡献度完成文档加权向量化处理;构建SECNN主题识别模型,使用SENet对卷积层输出的特征图进行权值的重标定,依靠其提升重要特征并抑制无用特征的性能,高效地进行主题识别;使用FDA评估样本的类别表征能力,提出FDA-SGD算法对模型参数进行调优,完成文本主题识别任务。使用新闻文本数据集验证改进算法的有效性,通过与传统模型对比表明,改进算法可以有效提高模型的收敛速度,具有较好的主题识别能力。 展开更多
关键词 主题识别 SENet 卷积神经网络 word2vec 隐含狄利克雷分布(LDA)
在线阅读 下载PDF
煤矿安全隐患信息自动分类方法 被引量:11
15
作者 谢斌红 马非 +1 位作者 潘理虎 张英俊 《工矿自动化》 北大核心 2018年第10期10-14,共5页
人工分类方式难以满足海量煤矿安全隐患信息的分类要求,而基于概率统计的文本自动分类方法分类准确率较低。针对上述问题,提出了一种基于Word2vec和卷积神经网络的煤矿安全隐患信息自动分类方法。首先对隐患信息进行分词、去停用词等预... 人工分类方式难以满足海量煤矿安全隐患信息的分类要求,而基于概率统计的文本自动分类方法分类准确率较低。针对上述问题,提出了一种基于Word2vec和卷积神经网络的煤矿安全隐患信息自动分类方法。首先对隐患信息进行分词、去停用词等预处理,然后应用Word2vec来表征词之间的语义相似性关系,最后利用卷积神经网络提取隐患信息的局部上下文高层特征,并使用Softmax分类器实现隐患信息的自动分类。实验结果表明,该方法实现了端到端的自动分类,可有效提升分类的准确性和全面性。 展开更多
关键词 煤矿安全 隐患信息自动分类 文本分类 卷积神经网络 word2vec
在线阅读 下载PDF
基于MCNN的铁路信号设备故障短文本分类方法研究 被引量:16
16
作者 周庆华 李晓丽 《铁道科学与工程学报》 CAS CSCD 北大核心 2019年第11期2859-2865,共7页
铁路运营维护中产生了大量非结构化的文本数据,针对这些文本信息,提出一种基于Word2Vec+MCNN的文本挖掘分类方法。首先采用Word2Vec训练故障词向量;其次丰富词向量矩阵信息,使网络模型从多方位的特征表示中学习输入句子的故障信息;最后... 铁路运营维护中产生了大量非结构化的文本数据,针对这些文本信息,提出一种基于Word2Vec+MCNN的文本挖掘分类方法。首先采用Word2Vec训练故障词向量;其次丰富词向量矩阵信息,使网络模型从多方位的特征表示中学习输入句子的故障信息;最后使用多池化卷积神经网络模型作为故障分类的方法,得到更多全面的隐藏信息。通过与传统分类器以及其他类型的多池化卷积神经网络模型实验对比,得出本文的模型可以更好地达到分类效果,具有较高的分类准确率。 展开更多
关键词 故障分类 信号设备 word2vec 卷积神经网路
在线阅读 下载PDF
一种基于字向量和LSTM的句子相似度计算方法 被引量:4
17
作者 何颖刚 王宇 《长江大学学报(自然科学版)》 CAS 2019年第1期88-94,I0006,共8页
句子相似度度量在自然语言处理领域中有着广泛的应用。针对现有的句子相似度计算方法不能充分捕捉句子的语义结构特征信息的问题,提出一种基于字向量和LSTM (long-short term memory,长短期记忆)网络的句子相度计算方法。首先,通过Word2... 句子相似度度量在自然语言处理领域中有着广泛的应用。针对现有的句子相似度计算方法不能充分捕捉句子的语义结构特征信息的问题,提出一种基于字向量和LSTM (long-short term memory,长短期记忆)网络的句子相度计算方法。首先,通过Word2Vec模型对中文维基百科语料进行训练,得到中文字向量词典;然后根据字向量词典将句子映射为句向量,并输入LSTM网络,获得句子的特征向量;最后,通过相似度算法计算2个句子特征向量之间的相似度。通过在2个数据集上的试验结果表明,该方法能够提高句子相似度计算的准确性,效果好于传统的语句相似度计算方法和基于词向量的相似度计算方法。 展开更多
关键词 句子相似度 字向量 word2vec LSTM神经网络
在线阅读 下载PDF
基于文本挖掘的铁路信号设备故障自动分类方法 被引量:13
18
作者 林海香 陆人杰 +1 位作者 卢冉 许丽 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第2期281-289,共9页
铁路信号设备在运营维护过程中积累了大量以文本方式记录的维护数据,为了实现高效准确分类,提出将Word2vec、SMOTE算法与卷积神经网络(Convolutional Neural Networks,CNN)相结合的铁路信号设备故障文本自动分类方法.首先,对故障文本使... 铁路信号设备在运营维护过程中积累了大量以文本方式记录的维护数据,为了实现高效准确分类,提出将Word2vec、SMOTE算法与卷积神经网络(Convolutional Neural Networks,CNN)相结合的铁路信号设备故障文本自动分类方法.首先,对故障文本使用自然语言方法完成预处理,并采用Word2vec训练词向量;其次,通过SMOTE算法自动生成小类别文本向量数据,嵌入至CNN的输入层;再次,利用CNN的卷积层和池化层提取故障文本的局部上下文高层特征;最后,通过softmax分类器对故障文本自动分类.依据某铁路局所记录的信号设备故障文本数据进行实验分析并与其他方法对比,实验结果表明新方法可使各评价指标得到明显提升,其中分类准确率和召回率分别达到95.26%和94.32%,可以作为铁路信号设备故障自动分类的有效方法. 展开更多
关键词 铁路信号设备 word2vec SMOTE算法 卷积神经网络 故障文本数据 自动分类
在线阅读 下载PDF
基于神经网络的关系词非充盈态复句层次的自动识别 被引量:1
19
作者 杨进才 杨璐璐 +1 位作者 汪燕燕 沈显君 《计算机科学》 CSCD 北大核心 2019年第S11期103-107,共5页
复句层次关系划分是复句句法结构分析以及语义甄别的基础,但关系词非充盈态复句由于关系标记的省略给层次划分带来了困难。文中利用依存关系句法树和word2vec词向量模型的方法来提取复句中分句的句法特征和语义特征,并利用神经网络进行... 复句层次关系划分是复句句法结构分析以及语义甄别的基础,但关系词非充盈态复句由于关系标记的省略给层次划分带来了困难。文中利用依存关系句法树和word2vec词向量模型的方法来提取复句中分句的句法特征和语义特征,并利用神经网络进行训练,获得三句式关系词的非充盈态复句层次划分模型,对测试集中的复句进行层次划分测试,其准确率为74%。 展开更多
关键词 关系词非充盈态 复句层次划分 依存句法 word2vec 神经网络
在线阅读 下载PDF
学习者视角下的国际中文慕课建设:一种比较的路径 被引量:12
20
作者 周汶霏 宁继鸣 《国际汉语教学研究》 2020年第3期82-89,共8页
本研究从学习者视角出发,采集了中国大学MOOC平台815门国家精品课程的学习者评价文本,基于Word2Vec神经网络模型进行文本挖掘,并结合质性解读的方法,挖掘和分析学习者对慕课的共性认识。经比较分析,本研究对当前国际中文慕课建设提出建... 本研究从学习者视角出发,采集了中国大学MOOC平台815门国家精品课程的学习者评价文本,基于Word2Vec神经网络模型进行文本挖掘,并结合质性解读的方法,挖掘和分析学习者对慕课的共性认识。经比较分析,本研究对当前国际中文慕课建设提出建议:在课程设置方面应着力实现用户界面、学习内容与教学模式的"三个友好";国际中文教师需致力于成为在线上与线下教学场域之间灵活切换的多面手;通过系统设置与环节把控确保课程互动的充分实现;建设更多类似于"中文联盟"的中国语言与文化数字化国际传播平台,打造优质国际中文慕课群,形成集群效应。 展开更多
关键词 学习者评价 国际中文慕课 国家精品课程 word2vec神经网络模型 共词分析
原文传递
上一页 1 2 3 下一页 到第
使用帮助 返回顶部