期刊文献+
共找到175篇文章
< 1 2 9 >
每页显示 20 50 100
利用word2vec对中文词进行聚类的研究 被引量:30
1
作者 郑文超 徐鹏 《软件》 2013年第12期160-162,共3页
文本聚类在数据挖掘和机器学习中发挥着重要的作用,该技术经过多年的发展,已产生了一系列的理论成果。本文在前人研究成果的基础上,探索了一种新的中文聚类方法。本文先提出了一种中文分词算法,用来将中文文本分割成独立的词语。再对处... 文本聚类在数据挖掘和机器学习中发挥着重要的作用,该技术经过多年的发展,已产生了一系列的理论成果。本文在前人研究成果的基础上,探索了一种新的中文聚类方法。本文先提出了一种中文分词算法,用来将中文文本分割成独立的词语。再对处理后的语料使用Word2Vec工具集,应用深度神经网络算法,转化为对应的词向量。最后,将词向量之间的余弦距离定义为词之间的相似度,通过使用K-means聚类算法将获取的词向量进行聚类,最终可以返回语料库中同输入词语语意最接近的词。本文从网络上抓取了2012年的网络新闻数据,应用上述方法进行了实验,取得了不错的实验效果。 展开更多
关键词 数据挖掘 聚类 分词 词向量 神经网络
在线阅读 下载PDF
基于Word2Vec词向量维度媒体与公众潜在语义的网络议程设置研究 被引量:1
2
作者 孙强 《长江师范学院学报》 2021年第5期56-63,共8页
当前社会网络分析在网络议程设置研究中的应用,都是基于属性关键词的共现次数来判断交互议程的效果,这种简单的做法忽视了属性关键词在上下文当中的潜在语义。在本文中,试着从潜在语义网络层面来探讨传统媒体议程网络、社交媒体议程网... 当前社会网络分析在网络议程设置研究中的应用,都是基于属性关键词的共现次数来判断交互议程的效果,这种简单的做法忽视了属性关键词在上下文当中的潜在语义。在本文中,试着从潜在语义网络层面来探讨传统媒体议程网络、社交媒体议程网络、公共议程网络之间交互议程效果的问题,并试着比较显在语义网络和潜在语义网络之间的差异性。本文以陈春秀事件为例,并采集了相关文本数据,然后应用Python中的Word2Vec库来构建词向量,以及应用Ucinet进行社会网络分析。在上下文潜在语义网络层面的研究发现:传统媒体议程网络和公共议程网络之间的相关系数为(r=0.480,p<0.01);社交媒体议程网络和公共议程网络之间的相关系数为(r=0.520,p<0.01);传统媒体议程网络和社交媒体议程网络之间的相关系数为(r=0.556,p<0.01)。也就是说,传统媒体议程网络、社交媒体议程网络、公共议程网络之间存在较强的交互议程效果。但是,社交媒体议程网络在公共议程网络的构建中占据了议程主导性的作用,而传统媒体议程网络在公共议程网络中的主体性作用正在下降。传统媒体议程网络仍然发挥关键性作用的地方,是其对社交媒体议程网络的议程主导性角色。 展开更多
关键词 词向量 网络议程设置 潜在语义网络 显在语义网络 社会网络分析
在线阅读 下载PDF
基于Word2Vec的神经网络协同推荐模型 被引量:2
3
作者 张华伟 《网络空间安全》 2019年第6期25-28,共4页
在信息推荐系统中,传统的方法是通过对内容、行为去预测用户的兴趣点来实现信息推送。国内外研究实验结果表明,这种模型推荐性能较为显著,说明用户行为和内容是相关的。根据相关性的对称原理,文章提出了基于用户行为的Word2Vec协同推荐... 在信息推荐系统中,传统的方法是通过对内容、行为去预测用户的兴趣点来实现信息推送。国内外研究实验结果表明,这种模型推荐性能较为显著,说明用户行为和内容是相关的。根据相关性的对称原理,文章提出了基于用户行为的Word2Vec协同推荐算法,通过神经网络模型来隐式地抽取商品和用户的相互关系并进行向量化表示,能够更好地计算商品和用户间的相似性,以达到提升模型的推荐效果和泛化能力。 展开更多
关键词 word2Vec 词向量 协同推荐 卷积神经网络
在线阅读 下载PDF
Word2vec-CNN-Bilstm短文本情感分类 被引量:1
4
作者 王立荣 《福建电脑》 2020年第1期11-16,共6页
使用传统的神经网络的短文本分类算法对其进行情感分类易出现定位误差等问题。为了解决对短文本情感分类时存在的定位误差,本文通过将词向量模型(Word2vec)、双向长短时记忆网络模型(BiLSTM)以及卷积神经网络(CNN)按照一定的框架进行组... 使用传统的神经网络的短文本分类算法对其进行情感分类易出现定位误差等问题。为了解决对短文本情感分类时存在的定位误差,本文通过将词向量模型(Word2vec)、双向长短时记忆网络模型(BiLSTM)以及卷积神经网络(CNN)按照一定的框架进行组合,提出了Word2vec-CNN-BiLSTM的短文本情感分类模型。Word2vec-CNN-BiLSTM模型采用对预处理后的文本进行向量化表示来提取文章特征向量,并在神经网络层进行双向语义捕捉实现文本的情感分类。实验结果显示Word2vec-CNN-BiLSTM的短文本情感分类模型有效解决了对短文本分类出现的情感分类定位误差问题。 展开更多
关键词 神经网络 情感分类 词向量 短文本
在线阅读 下载PDF
基于词向量网络的科研主题演化分析:语义漂移过程的揭示
5
作者 王宏宇 石锴文 +3 位作者 王晓光 金壮 郑阳 黄菡 《情报学报》 北大核心 2025年第10期1287-1299,共13页
作为表征学科领域知识结构的经典知识网络,共词网络方法受特征关键词共现关系稀疏、关键词同义不同形及语料利用不充分等因素影响,在面对大规模学科领域数据时,难以精准描绘关键词间的语义关联关系。从理论与方法论层面对共词网络进行扩... 作为表征学科领域知识结构的经典知识网络,共词网络方法受特征关键词共现关系稀疏、关键词同义不同形及语料利用不充分等因素影响,在面对大规模学科领域数据时,难以精准描绘关键词间的语义关联关系。从理论与方法论层面对共词网络进行扩展,以全面揭示学科领域研究主题在宏观、微观等层面上的语义演化过程具有现实意义。本文将学科领域特征关键词视为网络顶点,通过全局词嵌入模型(global vectors for word representation,GloVe)获取特征关键词的向量表示,并将对应词向量间的归一化余弦相似度设定为网络连边权重,构建全连接、无向的词向量网络。进一步地,本文详细分析了学科领域词向量网络的作用与特征,提出基于词向量网络的科研主题语义漂移分析框架,并就其表征的语义关联关系与共词网络中的共现关系进行比较分析。研究发现,本文提出的学科领域词向量网络作为一类特殊的知识网络,是特征关键词的共词网络在语义超空间上的映射,具有明显的社区结构和时序演化分析价值。与共词网络方法相比,学科领域词向量网络在表征学科领域的关键概念上具有一致性,并在反映学科领域知识结构时更具稳定性和全面性,能够精细化揭示科研主题在微观层面上产生的语义漂移等更细粒度的演化过程。 展开更多
关键词 知识网络 共词网络 词向量网络 词嵌入 语义演化
在线阅读 下载PDF
基于TB-IDACNN的新闻推荐模型
6
作者 辛春花 鲁晓波 何婷 《计算机工程与设计》 北大核心 2025年第5期1387-1394,共8页
针对现有新闻推荐方法存在未考虑新闻的动态特性、难以深度挖掘新闻的语义信息等问题,提出一种融合TinyBERT和改进型动态注意卷积神经网络的个性化新闻推荐模型(TB-IDACNN)。充分利用TinyBERT词向量模型、卷积神经网络和内积注意力网络... 针对现有新闻推荐方法存在未考虑新闻的动态特性、难以深度挖掘新闻的语义信息等问题,提出一种融合TinyBERT和改进型动态注意卷积神经网络的个性化新闻推荐模型(TB-IDACNN)。充分利用TinyBERT词向量模型、卷积神经网络和内积注意力网络等深度学习模型的优势,综合考虑新闻的动态特性和静态特性,实现个性化新闻推荐。在MIND和Adressa数据集上的结果表明,相比其它几种先进的新闻推荐模型,所提模型可以获得更好的推荐性能,能够有效满足用户在新闻推荐任务中的需求。 展开更多
关键词 动态神经网络 新闻推荐 词嵌入模型 内积注意力机制 卷积神经网络 词向量化 平均加权池化
在线阅读 下载PDF
基于GloVe词向量与卷积神经网络的文本类主观题自动评分算法
7
作者 祁长生 张中锋 《移动信息》 2025年第12期141-143,共3页
在线考试是教育信息化发展的重要组成部分,当前其客观题自动评分已较为成熟,但主观题自动评分仍面临着诸多挑战。文中提出了一种基于GloVe词向量与卷积神经网络的文本类主观题自动评分算法。首先,利用GloVe模型对文本类作答主观题答案... 在线考试是教育信息化发展的重要组成部分,当前其客观题自动评分已较为成熟,但主观题自动评分仍面临着诸多挑战。文中提出了一种基于GloVe词向量与卷积神经网络的文本类主观题自动评分算法。首先,利用GloVe模型对文本类作答主观题答案进行词向量表示,然后使用CNN进行特征提取和语义建模,最后通过注意力机制进行加权融合得到最终评分。在真实考试数据集上的实验表明,该方法在准确性、鲁棒性等方面优于传统评分算法,为在线考试主观题自动评分提供了新的思路。 展开更多
关键词 GloVe词向量 卷积神经网络 注意力机制 在线考试
在线阅读 下载PDF
基于自然语言处理的企业科技成果管理平台研究
8
作者 韩光明 车坚女 +2 位作者 郭龙 韩玉林 王继鹏 《天然气与石油》 2025年第1期43-50,共8页
企业科技成果包含数据较为复杂,并涵盖较多敏感数据,现有文本分类结果不能满足实际的保密管理需求,可能存在数据泄露或非法访问的风险。为此,设计基于自然语言处理(Natural Language Processing,NLP)的企业科技成果管理平台,以解决关键... 企业科技成果包含数据较为复杂,并涵盖较多敏感数据,现有文本分类结果不能满足实际的保密管理需求,可能存在数据泄露或非法访问的风险。为此,设计基于自然语言处理(Natural Language Processing,NLP)的企业科技成果管理平台,以解决关键字检索不能对保密文本进行准确分类的经典问题。使用卷积神经网络(Convolutional Neural Networks,CNN)自动提取文本特征,并用支持向量机(Support Vector Machine,SVM)作为最终的分类器,构建CNN-SVM模型;采用多种不同维度的卷积核进行卷积运算,利用全连接层接收并处理来自注意力层的输出数据,采用SVM分类器对科技成果文本进行分类;通过附件管理模块实现对象存储服务(Swift Object Storage Service,Swift)部署;通过高级加密标准(Advanced Encryption Standard,AES)算法实施科技成果文本数据在传输和存储过程中的加密处理,实现企业科技成果管理平台设计。为了验证设计平台的有效性,将系统A、系统B进行对比实验,表明不同频率的数据窃取攻击下,被窃取科技成果数据不超过1 MB,检索一致性超过90%,对文档进行分类后语义涉密检查的召回率最高可达97%,说明设计平台的文档自动分类效果较好,能够对保护企业知识产权起一定作用。研究设计的企业科技成果管理平台,通过结合NLP技术和先进的加密手段,有效提升了科技成果文本的保密管理水平,能够在很大程度上防止数据泄露和非法访问,同时保证了文档分类的准确性和效率。 展开更多
关键词 NLP SVM CNN 词语向量化处理 SWIFT 企业科技成果管理 AES算法
在线阅读 下载PDF
基于BERT-BiLSTM-CRF的工业控制协议逆向工程
9
作者 连莲 李素敏 +1 位作者 宗学军 何戡 《沈阳工业大学学报》 北大核心 2025年第5期609-616,共8页
【目的】工业控制协议解析是工业互联网安全中的关键环节,但传统方法存在普适性差和准确率低的问题,导致协议解析效率低下,难以满足实际工业场景中对高精度和高适应性解析的需求。【方法】提出一种基于深度学习模型的工业控制协议逆向... 【目的】工业控制协议解析是工业互联网安全中的关键环节,但传统方法存在普适性差和准确率低的问题,导致协议解析效率低下,难以满足实际工业场景中对高精度和高适应性解析的需求。【方法】提出一种基于深度学习模型的工业控制协议逆向解析方法,通过结合BERT预训练模型、双向长短期记忆网络(BiLSTM)和条件随机场(CRF),提升协议解析的普适性和准确率,为工业控制系统的安全分析和漏洞挖掘提供技术支持。首先,利用BERT预训练模型对工业控制协议数据进行动态词向量编码,将协议数据转化为高维向量,以捕捉协议数据的语义信息。BERT预训练模型通过其强大的上下文理解能力,能够有效处理复杂且多样的协议数据。其次,采用双向长短期记忆网络对协议数据之间的关系以及协议数据与标签数据之间的关联性进行建模。双向长短期记忆网络能够捕获协议数据中的长距离依赖关系,从而更好地理解协议的结构和语义。最后,引入条件随机场作为约束条件,对工业控制协议的格式和语义进行最优预测。条件随机场通过引入标签之间的转移概率,进一步提高了预测的准确性和一致性。通过BERT预训练模型、双向长短期记忆网络和条件随机场的结合,实现了对工业控制协议的格式提取和语义分析。此外,本文方法还针对大规模协议数据进行了优化,确保其在处理复杂工业场景时的高效性和稳定性。【结果】针对三种典型工业控制协议展开实验,结果表明本文方法在格式提取和语义分析上的精度均超过96%,较传统方法有所提升,在不同协议上均表现出高适应性和准确性,能够有效识别字段边界与语义信息。【结论】本文方法显著提升了工业控制协议解析的普适性和准确率,为工业控制系统的安全分析提供了可靠的技术支持。未来将进一步优化模型,拓展应用场景,提升方法的实用性。 展开更多
关键词 工业控制协议 协议逆向工程 BERT预训练模型 双向长短期记忆网络 条件随机场 词向量 格式提取 语义分析
在线阅读 下载PDF
基于多特征融合与双向RNN的细粒度意见分析 被引量:19
10
作者 郝志峰 黄浩 +1 位作者 蔡瑞初 温雯 《计算机工程》 CAS CSCD 北大核心 2018年第7期199-204,211,共7页
文本细粒度意见分析主要有属性抽取和基于属性的情感分类2个任务,现有方法完成上述任务采用条件随机场(CRF)训练属性抽取模型,并运用循环神经网络(RNN)训练基于属性的情感分类模型。但同时完成2个任务则无法找到属性和情感倾向的对应关... 文本细粒度意见分析主要有属性抽取和基于属性的情感分类2个任务,现有方法完成上述任务采用条件随机场(CRF)训练属性抽取模型,并运用循环神经网络(RNN)训练基于属性的情感分类模型。但同时完成2个任务则无法找到属性和情感倾向的对应关系。针对该问题,提出利用双向RNN构建基于序列标注的细粒度意见分析模型。通过融合文本的词向量、词性和依存关系等语言学特征,学习文本的修饰和语义信息,并设计一个时间序列标注模型,同时抽取属性实体判断文本的情感极性。在真实数据集上的实验结果表明,与CRF、TD-LSTM、AELSTM等模型相比,该模型情感分类效果提升明显。 展开更多
关键词 特征融合 词向量 循环神经网络 属性抽取 细粒度意见分析
在线阅读 下载PDF
基于词向量特征的循环神经网络语言模型 被引量:43
11
作者 张剑 屈丹 李真 《模式识别与人工智能》 EI CSCD 北大核心 2015年第4期299-305,共7页
循环神经网络语言模型能解决传统N-gram模型中存在的数据稀疏和维数灾难问题,但仍缺乏对长距离信息的描述能力.为此文中提出一种基于词向量特征的循环神经网络语言模型改进方法.该方法在输入层中增加特征层,改进模型结构.在模型训练时,... 循环神经网络语言模型能解决传统N-gram模型中存在的数据稀疏和维数灾难问题,但仍缺乏对长距离信息的描述能力.为此文中提出一种基于词向量特征的循环神经网络语言模型改进方法.该方法在输入层中增加特征层,改进模型结构.在模型训练时,通过特征层加入上下文词向量,增强网络对长距离信息约束的学习能力.实验表明,文中方法能有效提高语言模型的性能. 展开更多
关键词 语音识别 语言模型 循环神经网络 词向量
在线阅读 下载PDF
不平衡训练数据下的基于深度学习的文本分类 被引量:23
12
作者 陈志 郭武 《小型微型计算机系统》 CSCD 北大核心 2020年第1期1-5,共5页
近几年来,随着词向量和各种神经网络模型在自然语言处理上的成功应用,基于神经网络的文本分类方法开始成为研究主流.但是当不同类别的训练数据不均衡时,训练得到的神经网络模型会由多数类所主导,分类结果往往倾向多数类,极大彩响了分类... 近几年来,随着词向量和各种神经网络模型在自然语言处理上的成功应用,基于神经网络的文本分类方法开始成为研究主流.但是当不同类别的训练数据不均衡时,训练得到的神经网络模型会由多数类所主导,分类结果往往倾向多数类,极大彩响了分类效果.针对这种情况,本文在卷积神经网络训练过程中,损失函数引入类别标签权重,强化少数类对模型参数的影响.在复旦大学文本分类数据集上进行测试,实验表明本文提出的方法相比于基线系统宏平均F1值提高了4.49%,较好地解决数据不平衡分类问题. 展开更多
关键词 不平衡数据集 词向量 卷积神经网络 文本分类
在线阅读 下载PDF
一种基于用户播放行为序列的个性化视频推荐策略 被引量:36
13
作者 王娜 何晓明 +2 位作者 刘志强 王文君 李霞 《计算机学报》 EI CSCD 北大核心 2020年第1期123-135,共13页
本文针对在线视频服务网站的个性化推荐问题,提出了一种基于用户播放行为序列的个性化推荐策略.该策略通过深度神经网络词向量模型分析用户播放视频行为数据,将视频映射成等维度的特征向量,提取视频的语义特征.聚类用户播放历史视频的... 本文针对在线视频服务网站的个性化推荐问题,提出了一种基于用户播放行为序列的个性化推荐策略.该策略通过深度神经网络词向量模型分析用户播放视频行为数据,将视频映射成等维度的特征向量,提取视频的语义特征.聚类用户播放历史视频的特征向量,建模用户兴趣分布矩阵.结合用户兴趣偏好和用户观看历史序列生成推荐列表.在大规模的视频服务系统中进行了离线实验,相比随机算法、基于物品的协同过滤和基于用户的协同过滤传统推荐策略,本方法在用户观看视频的Top-N推荐精确率方面平均分别获得22.3%、30.7%和934%的相对提升,在召回率指标上分别获得52.8%、41%和1065%的相对提升.进一步地与矩阵分解算法SVD++、基于双向LSTM模型和注意力机制的Bi-LSTM+Attention算法和基于用户行为序列的深度兴趣网络DIN比较,Top-N推荐精确率和召回率也得到了明显提升.该推荐策略不仅获得了较高的精确率和召回率,还尝试解决传统推荐面临大规模工业数据集时的数据要求严苛、数据稀疏和数据噪声等问题. 展开更多
关键词 词向量 协同过滤 深度神经网络 个性化推荐
在线阅读 下载PDF
粒度计算在人工神经网络中的应用 被引量:8
14
作者 李道国 苗夺谦 杜伟林 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第7期960-964,共5页
介绍了粒度计算的基本思想和理论基础,详细论证了基于词计算理论的一种粒向量空间,研究了基于这种粒向量空间的人工神经网络模型.该模型可以在一定程度上提高人工神经网络的时效性、知识表达的可理解性,并能增强人工神经网络的功能.
关键词 粒度计算 词计算理论 粒向量空间 人工神经网络
在线阅读 下载PDF
基于CNN和BiLSTM网络特征融合的文本情感分析 被引量:126
15
作者 李洋 董红斌 《计算机应用》 CSCD 北大核心 2018年第11期3075-3080,共6页
卷积神经网络(CNN)和循环神经网络(RNN)在自然语言处理上得到广泛应用,但由于自然语言在结构上存在着前后依赖关系,仅依靠卷积神经网络实现文本分类将忽略词的上下文含义,且传统的循环神经网络存在梯度消失或梯度爆炸问题,限制了文本分... 卷积神经网络(CNN)和循环神经网络(RNN)在自然语言处理上得到广泛应用,但由于自然语言在结构上存在着前后依赖关系,仅依靠卷积神经网络实现文本分类将忽略词的上下文含义,且传统的循环神经网络存在梯度消失或梯度爆炸问题,限制了文本分类的准确率。为此,提出一种卷积神经网络和双向长短时记忆(Bi LSTM)特征融合的模型,利用卷积神经网络提取文本向量的局部特征,利用Bi LSTM提取与文本上下文相关的全局特征,将两种互补模型提取的特征进行融合,解决了单卷积神经网络模型忽略词在上下文语义和语法信息的问题,也有效避免了传统循环神经网络梯度消失或梯度弥散问题。在两种数据集上进行对比实验,实验结果表明,所提特征融合模型有效提升了文本分类的准确率。 展开更多
关键词 词向量 卷积神经网络 双向长短时记忆 特征融合 文本情感分析
在线阅读 下载PDF
基于集成神经网络的短文本分类模型 被引量:12
16
作者 高云龙 左万利 +1 位作者 王英 王鑫 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2018年第4期933-938,共6页
针对短文本具有稀疏性强和文本长度较小等特性,为更好地处理短文本分类问题,提出一个基于集成神经网络的短文本分类模型.首先,使用扩展词向量作为模型的输入,从而使数值词向量可有效描述短文本中形态、句法及语义特征;其次,利用递归神... 针对短文本具有稀疏性强和文本长度较小等特性,为更好地处理短文本分类问题,提出一个基于集成神经网络的短文本分类模型.首先,使用扩展词向量作为模型的输入,从而使数值词向量可有效描述短文本中形态、句法及语义特征;其次,利用递归神经网络(RNN)对短文本语义进行建模,捕获短文本内部结构的依赖关系;最后,在训练模型过程中,利用正则化项选取经验风险和模型复杂度同时最小的模型.通过对语料库进行短文本分类实验,验证了所提出模型有较好的分类效果,且该分类模型可处理变长的短文本输入,具有良好的鲁棒性. 展开更多
关键词 短文本 集成神经网络 扩展词向量 分类
在线阅读 下载PDF
基于卷积神经网络和用户信息的微博话题追踪模型 被引量:6
17
作者 付鹏 林政 +3 位作者 袁凤程 林海伦 王伟平 孟丹 《模式识别与人工智能》 EI CSCD 北大核心 2017年第1期73-80,共8页
为了解决微博文本特征抽取及特征稀疏问题,提出基于卷积神经网络的微博话题追踪模型(CNN-TTM).基于微博用户信息,又提出融合微博用户信息及卷积神经网络的微博话题追踪模型(CNN-User TTM),利用微博用户信息提高话题追踪准确率.实验表明... 为了解决微博文本特征抽取及特征稀疏问题,提出基于卷积神经网络的微博话题追踪模型(CNN-TTM).基于微博用户信息,又提出融合微博用户信息及卷积神经网络的微博话题追踪模型(CNN-User TTM),利用微博用户信息提高话题追踪准确率.实验表明,在新浪微博数据集上,CNN-TTM和CNN-User TTM分别获得较高的微博话题追踪准确率. 展开更多
关键词 话题追踪 卷积神经网络 词向量 微博分类 用户画像
在线阅读 下载PDF
中文交互式网络搜索引擎及其自学习能力 被引量:14
18
作者 杜阿宁 方滨兴 +1 位作者 胡铭曾 云晓春 《计算机工程与应用》 CSCD 北大核心 2003年第10期148-150,212,共4页
论文介绍了一种具有自学习能力的中文交互式网络搜索引擎INSE(aninteractivenetsearchengineforChi-nesetext),向量空间模型、基于自动机思想的中文分词技术和神经网络BP算法的应用是INSE的主要特点,重点讨论了INSE的自学习能力。基于... 论文介绍了一种具有自学习能力的中文交互式网络搜索引擎INSE(aninteractivenetsearchengineforChi-nesetext),向量空间模型、基于自动机思想的中文分词技术和神经网络BP算法的应用是INSE的主要特点,重点讨论了INSE的自学习能力。基于自动机思想分词是INSE提出的新概念,应用于中文分词可以满足最大匹配且速度较快。INSE自学习能力的实现依靠神经网络的BP算法。该算法应用于交互式网络搜索引擎可以提供更加精确的查询结果。 展开更多
关键词 中文交互式网络搜索引擎 自学习能力 Internet WWW 计算机网络 向量空间模型 自动机 分词 神经网络 BP算法 信息库 信息检索 信息资源
在线阅读 下载PDF
基于卷积神经网络的语句级新闻分类算法 被引量:11
19
作者 曾凡锋 李玉珂 肖珂 《计算机工程与设计》 北大核心 2020年第4期978-982,共5页
针对传统的中文文本分类在海量的互联网信息中难以胜任的现状,提出一种语句级的卷积神经网络中文新闻分类方案。通过信息提取算法从长短不一的新闻数据中提取固定大小的新闻摘要,压缩输入量的同时统一输入格式。信息提取时,通过对TF-ID... 针对传统的中文文本分类在海量的互联网信息中难以胜任的现状,提出一种语句级的卷积神经网络中文新闻分类方案。通过信息提取算法从长短不一的新闻数据中提取固定大小的新闻摘要,压缩输入量的同时统一输入格式。信息提取时,通过对TF-IDF算法进行改进提升新闻摘要的质量,结合word2vec技术和卷积神经网络完成文本分类任务。与传统方法相比,词向量模型的引入弥补了传统词袋模型的缺陷,且语句的语义远比词的更加全面,使用语句进行分类更加可靠。通过实验对比验证了该方案具有较好的性能。 展开更多
关键词 文本分类 深度学习 卷积神经网络 词向量 TF-IDF算法 信息抽取
在线阅读 下载PDF
基于深度语义学习的智能录波器自配置方法 被引量:9
20
作者 陈旭 张弛 +3 位作者 刘千宽 彭业 周达明 甄家林 《电力系统保护与控制》 EI CSCD 北大核心 2021年第2期179-187,共9页
智能录波器的基础配置工作是将全站配置描述文件(Substation Configuration Description,SCD)中智能二次设备(Intelligent Electronic Device,IED)各运行数据输出端口的地址信息分类映射至录波器不同信息组中。目前主流配置方法是针对... 智能录波器的基础配置工作是将全站配置描述文件(Substation Configuration Description,SCD)中智能二次设备(Intelligent Electronic Device,IED)各运行数据输出端口的地址信息分类映射至录波器不同信息组中。目前主流配置方法是针对端口的文本描述进行人工配置。在大规模高电压等级变电站内端口文本描述繁杂,人工操作耗时长,工作量大。针对该现状,提出了基于字符级TextCNN深度语义学习的智能录波器自配置方法。首先利用word2vec模型针对高维稀疏的文本样本矩阵进行降维与稠密化处理,实现字符词向量的分布式表达。之后建立TextCNN模型,基于其多层次抽象化提取样本特征的结构特点进行文本语义挖掘与分类。依据文本分类结果实现端口地址信息的分类映射。案例分析表明,基于TextCNN模型的录波器自配置方法具有分类时间短与分类精度高的优点,提高了录波器自动化配置的准确性。 展开更多
关键词 智能录波器 信息自配置 文本挖掘 词向量分布式表达 文本卷积神经网络
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部