期刊文献+
共找到2,211篇文章
< 1 2 111 >
每页显示 20 50 100
Research on Feature Extraction Method of Social Network Text 被引量:2
1
作者 Zheng Zhang Shu Zhou 《Journal of New Media》 2021年第2期73-80,共8页
The development of various applications based on social network text is in full swing.Studying text features and classifications is of great value to extract important information.This paper mainly introduces the comm... The development of various applications based on social network text is in full swing.Studying text features and classifications is of great value to extract important information.This paper mainly introduces the common feature selection algorithms and feature representation methods,and introduces the basic principles,advantages and disadvantages of SVM and KNN,and the evaluation indexes of classification algorithms.In the aspect of mutual information feature selection function,it describes its processing flow,shortcomings and optimization improvements.In view of its weakness in not balancing the positive and negative correlation characteristics,a balance weight attribute factor and feature difference factor are introduced to make up for its deficiency.The experimental stage mainly describes the specific process:the word segmentation processing,to disuse words,using various feature selection algorithms,including optimized mutual information,and weighted with TF-IDF.Under the two classification algorithms of SVM and KNN,we compare the merits and demerits of all the feature selection algorithms according to the evaluation index.Experiments show that the optimized mutual information feature selection has good performance and is better than KNN under the SVM classification algorithm.This experiment proves its validity. 展开更多
关键词 Social network text mutual information positive and negative correlation characteristics SVM KNN
在线阅读 下载PDF
The Role of Rare Terms in Enhancing the Performance of Polynomial Networks Based Text Categorization
2
作者 Mayy M. Al-Tahrawi 《Journal of Intelligent Learning Systems and Applications》 2013年第2期84-89,共6页
In this paper, the role of rare or infrequent terms in enhancing the accuracy of English Text Categorization using Polynomial Networks (PNs) is investigated. To study the impact of rare terms in enhancing the accuracy... In this paper, the role of rare or infrequent terms in enhancing the accuracy of English Text Categorization using Polynomial Networks (PNs) is investigated. To study the impact of rare terms in enhancing the accuracy of PNs-based text categorization, different term reduction criteria as well as different term weighting schemes were experimented on the Reuters Corpus using PNs. Each term weighting scheme on each reduced term set was tested once keeping the rare terms and another time removing them. All the experiments conducted in this research show that keeping rare terms substantially improves the performance of Polynomial Networks in Text Categorization, regardless of the term reduction method, the number of terms used in classification, or the term weighting scheme adopted. 展开更多
关键词 POLYNOMIAL networkS text CATEGORIZATION Document Classification Infrequent TERMS RARE TERMS
暂未订购
Hybrid Reliability Parameter Selection Method Based on Text Mining, Frequent Pattern Growth Algorithm and Fuzzy Bayesian Network 被引量:1
3
作者 SHUAI Yon SONG Tailian +1 位作者 WANG Jianping ZHAN Wenbin 《Journal of Shanghai Jiaotong university(Science)》 EI 2018年第3期423-428,共6页
Reliability parameter selection is very important in the period of equipment project design and demonstration. In this paper, the problem in selecting the reliability parameters and their number is proposed. In order ... Reliability parameter selection is very important in the period of equipment project design and demonstration. In this paper, the problem in selecting the reliability parameters and their number is proposed. In order to solve this problem, the thought of text mining is used to extract the feature and curtail feature sets from text data firstly, and frequent pattern tree (FPT) of the text data is constructed to reason frequent item-set between the key factors by frequent patter growth (FPC) algorithm. Then on the basis of fuzzy Bayesian network (FBN) and sample distribution, this paper fuzzifies the key attributes, which forms associated relationship in frequent item-sets and their main parameters, eliminates the subjective influence factors and obtains condition mutual information and maximum weight directed tree among all the attribute variables. Furthermore, the hybrid model is established by reason fuzzy prior probability and contingent probability and concluding parameter learning method. Finally, the example indicates the model is believable and effective. 展开更多
关键词 reliability parameter text mining frequent pattern growth(FPG) fuzzy Bayesian network(FBN)
原文传递
基于PKUSEG-Text-GCN的肿瘤疾病预测模型
4
作者 高志玲 赵新宇 《计算机工程与科学》 北大核心 2025年第7期1303-1311,共9页
当前疾病预测模型仅关注病历文本的局部信息以及上下文信息,缺乏对全局信息的考虑,由此导致预测结果准确率不高。利用图神经网络关注全局信息的特点,提出将图卷积神经网络(GCN)用于中文电子病历的肿瘤疾病预测。首先,利用医学领域分词... 当前疾病预测模型仅关注病历文本的局部信息以及上下文信息,缺乏对全局信息的考虑,由此导致预测结果准确率不高。利用图神经网络关注全局信息的特点,提出将图卷积神经网络(GCN)用于中文电子病历的肿瘤疾病预测。首先,利用医学领域分词工具包PKUSEG对中文电子病历进行分词;其次,通过病历与词的共现关系和病历文本中词与词之间的关系,建立文本图;最后,基于该医学文本图利用图卷积神经网络(Text-GCN)对文本图的特征进行学习,将学习到的模型用于肿瘤疾病预测。实验结果显示,所提模型相比多个模型中的最优模型准确率提升了6%。同时,当数据较少的时候准确率并不会明显下降,表明该模型在电子病历较少的情况下仍具有很好的鲁棒性。 展开更多
关键词 文本图卷积神经网络 中文分词 肿瘤致病分析 肿瘤疾病预测
在线阅读 下载PDF
基于文本引导的轻量异构编码多模态图像融合
5
作者 王传云 周明奇 +3 位作者 孙冬冬 王田 高骞 李照奎 《工程科学学报》 北大核心 2026年第2期346-359,共14页
针对资源受限的无人机平台对红外与可见光图像的融合效率与感知性能需求,本文提出一种基于文本引导的轻量异构编码多模态图像融合网络.该网络设计了一种面向红外与可见光图像信息表达功能互补的轻量化双分支异构编码,红外图像编码分支... 针对资源受限的无人机平台对红外与可见光图像的融合效率与感知性能需求,本文提出一种基于文本引导的轻量异构编码多模态图像融合网络.该网络设计了一种面向红外与可见光图像信息表达功能互补的轻量化双分支异构编码,红外图像编码分支强调热目标与边缘响应,可见光图像编码分支侧重于纹理与细节信息建模,从而有效避免同构编码器带来的特征冗余与性能瓶颈.同时,引入轻量级跨模态特征融合模块,增强多模信息之间的互补性与融合表达能力.进一步,通过预训练视觉语言模型结合语义文本特征对融合过程进行引导与调控,提升融合图像的语义一致性与环境适应性.在三个公开多模态图像数据集TNO、LLVIP与M3FD上,本文方法与九种代表性图像融合算法进行了系统对比实验与综合评估,结果显示本文网络在互信息、结构相似性等多个主流评价指标上均表现优越,融合图像在细节清晰度、边缘结构一致性与目标可辨性方面优于现有方法.同时,消融实验表明所提出模型的推理时间相较基线方法减少约50%,且在不显著牺牲性能的前提下实现了更高的效率.除定量评估外,本文还开展了基于文本指令的定性实验,结果显示模型可根据不同语义指令灵活调整红外与可见光特征融合策略,适应低光、过曝、低对比、噪声等多种任务场景.在保证语义一致性的同时,有效增强了热源感知、结构清晰度与抗干扰能力,展现出传统无引导方法难以实现的语义可控性与内容适应性. 展开更多
关键词 多模态图像融合 双分支异构编码 文本引导 轻量化网络 注意力机制
在线阅读 下载PDF
基于Text-CNN模型的工程质量信息化研究
6
作者 母晓维 《建筑机械化》 2025年第9期28-32,共5页
针对建设工程质量问题分类的复杂性与数据不平衡问题,提出Text-CNN模型进行智能分类,通过数据预处理与基于语言学规则的数据增强方法解决类别不平衡问题,实现数据集的适度平衡。构建并训练Text-CNN模型,有效实现建设工程质量问题的识别... 针对建设工程质量问题分类的复杂性与数据不平衡问题,提出Text-CNN模型进行智能分类,通过数据预处理与基于语言学规则的数据增强方法解决类别不平衡问题,实现数据集的适度平衡。构建并训练Text-CNN模型,有效实现建设工程质量问题的识别与分类,与SVM和LSTM模型对比,Text-CNN在准确率与召回率及精确率方面具有明显优势,证明了其在建设工程监理信息化中的高效性与实用性。 展开更多
关键词 工程质量 施工监理 卷积神经网络 text-CNN 信息化
原文传递
融合Transformer与DF-GAN的文本生成图像方法
7
作者 马静 车进 孙末贤 《计算机工程》 北大核心 2026年第2期413-422,共10页
文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像语义不一致。针对该问题,提出一种DXC-GAN文本生成图像方法。引入Transformer系列中的XLNet(Xtra Long Network)预训练模型替换原始文本编码器,捕获大量文本的... 文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像语义不一致。针对该问题,提出一种DXC-GAN文本生成图像方法。引入Transformer系列中的XLNet(Xtra Long Network)预训练模型替换原始文本编码器,捕获大量文本的先验知识,实现对上下文信息的深度挖掘。添加CBAM(Convolutional Block Attention Module)注意力模块,使生成器更加关注图像中的重要信息,从而解决生成图像细节不完整和空间结构错误问题。在判别器中引入对比损失,与模型中匹配感知梯度惩罚和单向输出结合,使得相同语义图像之间更加接近,不同语义图像之间更加疏远,从而增强文本与生成图像之间的语义一致性。实验结果表明:与DF-GAN相对比,DXC-GAN在CUB数据集上的IS(Inception Score)与FID(Fréchet Inception Distance)分别提升了4.42%和17.96%;在Oxford-102数据集上,IS为3.97,FID为37.82;相较于DF-GAN,DXC-GAN在鸟类图像生成方面有效避免了多头少脚等畸形问题,同时在花卉图像生成上也显著减少了花瓣残缺等图像质量问题;此外,DXC-GAN还增强了文本与图像的对齐性,显著提升了图像的完整度和生成效果。 展开更多
关键词 生成对抗网络 文本生成图像 XLNet CBAM 对比损失
在线阅读 下载PDF
基于语义特征和TextRank算法的科研成果论文中文文本关键词提取方法
8
作者 张世超 王建宾 孟浩 《华南地震》 2025年第3期188-194,共7页
为准确提取科研成果论文中文文本关键词,并准确排列,研究基于语义特征和TextRank算法的科研成果论文中文文本关键词提取方法。基于语义特征的科研成果论文中文文本候选关键词筛选方法,在Word2Vec工具中,将中文文本转换为词向量,作为论... 为准确提取科研成果论文中文文本关键词,并准确排列,研究基于语义特征和TextRank算法的科研成果论文中文文本关键词提取方法。基于语义特征的科研成果论文中文文本候选关键词筛选方法,在Word2Vec工具中,将中文文本转换为词向量,作为论文中文文本语义特征;将语义特征输入卷积神经网络中,以分类的方式,提取属于候选关键词类型的语义特征,将其所属文本词语作为候选关键词;通过基于TextRank算法的科研成果论文中文文本关键词提取方法,在候选关键词中,以候选关键词的平均信息熵、词性、位置三种特征,为关键词提取指标,构建提取关键词的图模型,运算候选关键词综合权重,以从大到小的方式排列候选关键词,将排名靠前的候选关键词,作为最终提取的关键词,完成科研成果论文中文文本关键词提取。经测试,此方法可提高科研成果论文中文文本关键词提取精度、提高关键词排名准确性。 展开更多
关键词 语义特征 textRank算法 科研成果论文 中文文本 关键词提取 卷积神经网络
在线阅读 下载PDF
湖南省红色旅游经典景区故事讲述研究——基于网络文本分析
9
作者 朱东国 曾建华 《湖北科技学院学报》 2026年第1期32-39,46,共9页
基于2019—2023年7月的马蜂窝、大众点评两大旅游网站游客点评网络文本,采用情感分析方法和内容分析方法,以湖南省14个全国红色旅游经典景区为案例地,分析游客对景区故事讲述情感特征。研究表明,游客的情感整体上以积极情感为主,情感强... 基于2019—2023年7月的马蜂窝、大众点评两大旅游网站游客点评网络文本,采用情感分析方法和内容分析方法,以湖南省14个全国红色旅游经典景区为案例地,分析游客对景区故事讲述情感特征。研究表明,游客的情感整体上以积极情感为主,情感强度以高度强度为主;游客在表达积极感受时,使用的词语多为耐心、很好、很不错和好听等,积极情感的产生与导游或讲解员故事知识储备、讲述故事技巧、态度和免费讲解服务密切相关;游客在表达消极情感主要表现为感到被欺骗或恶心痛恨等,与导游或讲解员服务质量、讲解设备和讲解人员配置有关。为进一步增强游客的积极情感,红色旅游经典景区应着重从讲解服务质量、讲解设备管理和讲解宣传资源采取改进措施。 展开更多
关键词 红色旅游经典景区 故事讲述 网络文本 湖南省
在线阅读 下载PDF
基于多码深度特征融合生成对抗网络的文本生成图像方法
10
作者 顾广华 孙文星 伊柏宇 《电子与信息学报》 北大核心 2026年第1期287-296,共10页
文本生成图像是一项极具挑战的跨模态任务,其核心在于生成与文本描述高度一致、细节丰富的高质量图像。当前基于生成对抗网络的方法多依赖单一噪声输入,导致生成图像细粒度不足;同时,单词级特征利用不充分,也制约了文本与图像之间的语... 文本生成图像是一项极具挑战的跨模态任务,其核心在于生成与文本描述高度一致、细节丰富的高质量图像。当前基于生成对抗网络的方法多依赖单一噪声输入,导致生成图像细粒度不足;同时,单词级特征利用不充分,也制约了文本与图像之间的语义对齐精度。为此,该文提出一种多码深度特征融合生成对抗网络(mDFAGAN)。该方法通过设计多噪声输入生成器与多码先验融合模块,提升生成图像的细节表现力;在生成器中引入多头注意力机制,从多角度对齐单词与图像子区域,增强语义一致性;此外,提出多码先验融合损失以稳定训练过程。在CUB和COCO数据集上的实验结果表明,所提方法在IS与FID评价指标上均优于当前主流生成对抗网络方法,能够生成更逼真、细节更丰富、语义一致性更强的图像。 展开更多
关键词 文本生成图像 生成对抗网络 跨模态 多码先验融合
在线阅读 下载PDF
基于文本挖掘的网络文化安全评价指标体系研究
11
作者 肖军 陈林培 《情报探索》 2026年第2期25-32,共8页
[目的/意义]旨在提升网络文化安全治理水平,研究并建立网络文化安全评价指标体系。[方法/过程]通过文献分析法、文本挖掘法、层次分析法、熵值法等研究方法相结合,对网络文化安全相关政策文本进行语义挖掘、指标赋权、模型建构。[结果/... [目的/意义]旨在提升网络文化安全治理水平,研究并建立网络文化安全评价指标体系。[方法/过程]通过文献分析法、文本挖掘法、层次分析法、熵值法等研究方法相结合,对网络文化安全相关政策文本进行语义挖掘、指标赋权、模型建构。[结果/结论]构建了网络文化价值层、生产层、内容层、传播层、监管层五个层次的网络文化安全评价指标体系。此外,提出维护网络文化安全可从提高网络文化内容评价要求、价值观念引导、传播环境塑造、法治体系构建等层面出发。 展开更多
关键词 网络文化安全 指标体系 文本挖掘 文化主权
在线阅读 下载PDF
融合FastText模型和注意力机制的网络新闻文本分类模型 被引量:11
12
作者 王婉 张向先 +1 位作者 卢恒 张莉曼 《现代情报》 CSSCI 2022年第3期40-47,共8页
[目的/意义]构建融合Fast Text模型和注意力机制的网络新闻文本分类模型,为网络新闻平台运营提供了智能化的知识组织思路。[方法/过程]基于Word2vec模型与Fast Text模型相结合的词向量模型Ngram2vec进行网络新闻文本的语义表达,并运用... [目的/意义]构建融合Fast Text模型和注意力机制的网络新闻文本分类模型,为网络新闻平台运营提供了智能化的知识组织思路。[方法/过程]基于Word2vec模型与Fast Text模型相结合的词向量模型Ngram2vec进行网络新闻文本的语义表达,并运用融合注意力机制的Bi LSTM;tte模型实现新闻文本分类。[结果/结论]实验结果显示,融合了Fast Text模型与注意力机制的网络新闻文本分类模型使F1值从90.62%提升到92.03%,说明本文提出的文本分类模型能够提升网络新闻文本分类的精确率,对网络新闻平台提升知识组织效率、优化服务水平具有重要参考价值。 展开更多
关键词 网络新闻 文本分类 注意力机制 双向长短期记忆神经网络模型
在线阅读 下载PDF
基于语义情感的森林康养满意度分析——以西樵山森林公园为例
13
作者 郑淳佳 钱万惠 +2 位作者 杨清 赖灿 赵庆 《中南林业科技大学学报》 北大核心 2026年第2期204-214,共11页
【目的】森林康养满意度是指导森林公园服务管理优化的重要指标。研究网络文本反映的游客康养体验满意度能为森林公园的管理与服务优化提供依据。【方法】选取广东西樵山国家森林公园作为研究对象,从携程和大众点评旅游网站采集游客上... 【目的】森林康养满意度是指导森林公园服务管理优化的重要指标。研究网络文本反映的游客康养体验满意度能为森林公园的管理与服务优化提供依据。【方法】选取广东西樵山国家森林公园作为研究对象,从携程和大众点评旅游网站采集游客上传的用户评论,运用网络文本分析法和情感倾向分析法筛选出康养形象高频感知特征,量化游客情绪倾向,运用IPA分析法分析游客感知的康养要素和游客满意评价。【结果】用户评论中对西樵山的感知正向表达较多,对风景优美、空气清新、观音像等方面感知较为突出,并且对公园服务与设施较为关注。游客对西樵山公园的积极情绪占比为72.83%,游客对各类康养要素满意度均为“很满意”及以上,但服务感知要素在“不满意”区间有较大的占比。自然风光和历史人文要素是西樵山公园的优势康养要素,可重点宣传,发扬优势;而服务设施与场地交通要素需要重点改进,休闲游憩要素可在资源充足情况下提升。【结论】今后公园可通过融合观音文化等特色资源,设计多样化康养活动,并优化导览系统、交通布局及停车设施,全面提升服务质量,为游客提供高质量的森林康养体验。 展开更多
关键词 西樵山 网络文本分析 IPA分析法 森林康养 满意度
在线阅读 下载PDF
融合知识增强与SimCLS框架的生成式文本摘要模型
14
作者 刘佳旭 吴石 张艳菊 《计算机系统应用》 2026年第3期44-58,共15页
旨在通过理解输入的原始文本生成简洁、易读的摘要.然而,现有模型输出的摘要中仍存在语义冗余、事实性错误以及暴露偏差的问题.解决这些问题对于提升模型性能和摘要质量具有重要的研究意义.因此,提出一种融合知识增强与SimCLS框架的生... 旨在通过理解输入的原始文本生成简洁、易读的摘要.然而,现有模型输出的摘要中仍存在语义冗余、事实性错误以及暴露偏差的问题.解决这些问题对于提升模型性能和摘要质量具有重要的研究意义.因此,提出一种融合知识增强与SimCLS框架的生成式文本摘要模型.首先,设计了知识增强编码器获取源文本的结构化知识信息以维护全局上下文的结构信息,并结合文本编码器充分编码全文语义信息.其次,在解码器部分利用Copy机制,更加准确地再现原始文本中的信息.最后,使用SimCLS两阶段的对比学习训练框架,对模型生成的摘要进行评分以驱动模型生成高质量摘要.实验结果表明,相较于表现较为优异的SeqCo模型,所提模型在CNN/Daily Mail数据集上的ROUGE-1/2/L及BERTScore分别提升了1.84、0.65、2.04和0.21个百分点,在XSum数据集上分别提升了1.78、2.16、2.36和0.13个百分点,验证了模型的有效性. 展开更多
关键词 知识增强 生成式文本摘要 对比学习 语义知识 图注意力网络
在线阅读 下载PDF
卡若拉冰川景区游客满意度调查分析及其提升策略
15
作者 刘金花 马百惠 +4 位作者 胡海平 李文 叶长盛 朵耀华 姜勇彪 《地球环境学报》 2026年第1期177-187,共11页
2022年北京冬奥会成功举办以来,中国冰雪旅游产业迎来了重大机遇。西藏冰川旅游资源丰富,具有天然优势。以卡若拉冰川景区为例,基于调查问卷、访谈数据和网络文本数据,对卡若拉冰川景区的游客人口学特征、总体满意度及其影响因素进行分... 2022年北京冬奥会成功举办以来,中国冰雪旅游产业迎来了重大机遇。西藏冰川旅游资源丰富,具有天然优势。以卡若拉冰川景区为例,基于调查问卷、访谈数据和网络文本数据,对卡若拉冰川景区的游客人口学特征、总体满意度及其影响因素进行分析。调查问卷数据采用二元Logistic模型分析卡若拉冰川景区游客总体满意度评价的影响因素。利用数据挖掘技术抓取携程、马蜂窝、大众点评这3个网站共801条游客评论,采用ROST CM6软件对游客评论数据进行统计分析。结果表明:游客学历、可支配收入与景区总体满意度呈负相关;交通通达性、景区服务水平、基础设施和新媒体显著影响游客对景区的满意度评价,且呈正相关。游客评论中冰川旅游资源及目的地类高频词占比73.82%。游客情感分析中,游客积极、中性和消极情绪占比分别为71.89%、5.64%和22.47%。基于研究结果,建议政府及景区要细分旅游市场,区域协同发展,完善基础设施,提高服务水平,利用好新媒体等,进一步提升卡若拉冰川景区的整体旅游形象。 展开更多
关键词 卡若拉冰川 游客满意度 冰川旅游 网络文本分析
在线阅读 下载PDF
基于双重注意力生成对抗网络的文本到图像生成
16
作者 张振兴 杨任农 +3 位作者 李永林 左家亮 胡利平 陈双艳 《系统工程与电子技术》 北大核心 2026年第1期34-43,共10页
针对多阶段文本到图像生成方法存在的3个显著问题,即学习多个神经网络会延长收敛时间、忽视早期生成器生成图像的质量、需要训练多个对抗器,提出基于双重注意力生成对抗网络(double-attention generative adversarial network,DoubleGAN... 针对多阶段文本到图像生成方法存在的3个显著问题,即学习多个神经网络会延长收敛时间、忽视早期生成器生成图像的质量、需要训练多个对抗器,提出基于双重注意力生成对抗网络(double-attention generative adversarial network,DoubleGAN)的文本到图像生成模型。DoubleGAN纳入通道与像素注意机制,使用语句向量引领生成器聚焦于与文字内容紧密关联的通道及像素点。同时,提出条件自适应的实例级-层标准化方法,该方法能够依据语言信息调控形状与纹理的变动幅度,从而显著增强视觉-语义的对应关系并促进训练过程的稳定性。同时,采用一种视觉损失来增强图像分辨率,确保生成图像具有生动的形状和感知上均匀的颜色分布。实验结果表明,DoubleGAN实现了优秀的性能,在CUB bird-200-2011(Caltech-UCSD Birds-200-2011)数据集上将初始分数(inception score,IS)从4.75显著提高到4.97,具有实际应用价值。 展开更多
关键词 文本到图像生成 生成对抗网络 注意力机制 单阶段架构
在线阅读 下载PDF
融合多级语义的中文医疗短文本分类模型
17
作者 杨杰 刘纳 +2 位作者 郑国风 李晨 道路 《郑州大学学报(理学版)》 北大核心 2026年第1期51-57,共7页
针对医疗短文本分类中关键语义信息提取不足与模型鲁棒性下降的问题,提出了融合多级语义信息的文本分类模型。首先,利用预训练模型捕获文本的初步语义特征。其次,通过胶囊网络提取关键语义信息,确保模型能够有效学习到短文本中的核心语... 针对医疗短文本分类中关键语义信息提取不足与模型鲁棒性下降的问题,提出了融合多级语义信息的文本分类模型。首先,利用预训练模型捕获文本的初步语义特征。其次,通过胶囊网络提取关键语义信息,确保模型能够有效学习到短文本中的核心语义;采用注意力池化技术聚焦文本中的文档级信息,增强对医学专业术语和概念的识别与理解。最后,引入对抗训练策略,提升模型在面对模糊表达或扰动输入时的稳定性和准确性。在CHIP-CTC、KUAKE_QIC和VSQ三个医疗文本分类数据集上验证了模型的有效性,结果表明,相较于现有模型,所提模型在三个数据集上的F 1值均有所提升,显著增强了中文医疗短文本的分类性能。 展开更多
关键词 中文医疗数据 短文本分类 语义融合 胶囊网络 注意力池化
在线阅读 下载PDF
中文科技政策文本分类:增强的TextCNN视角 被引量:8
18
作者 李牧南 王良 赖华鹏 《科技管理研究》 CSSCI 北大核心 2023年第2期160-166,共7页
近年尽管针对中文本文分类的研究成果不少,但基于深度学习对中文政策等长文本进行自动分类的研究还不多见。为此,借鉴和拓展传统的数据增强方法,提出集成新时代人民日报分词语料库(NEPD)、简单数据增强(EDA)算法、word2vec和文本卷积神... 近年尽管针对中文本文分类的研究成果不少,但基于深度学习对中文政策等长文本进行自动分类的研究还不多见。为此,借鉴和拓展传统的数据增强方法,提出集成新时代人民日报分词语料库(NEPD)、简单数据增强(EDA)算法、word2vec和文本卷积神经网络(TextCNN)的NEWT新型计算框架;实证部分,基于中国地方政府发布的科技政策文本进行算法校验。实验结果显示,在取词长度分别为500、750和1000词的情况下,应用NEWT算法对中文科技政策文本进行分类的效果优于RCNN、Bi-LSTM和CapsNet等传统深度学习模型,F1值的平均提升比例超过13%;同时,NEWT在较短取词长度下能够实现全文输入的近似效果,可以部分改善传统深度学习模型在中文长文本自动分类任务中的计算效率。 展开更多
关键词 NEWT 深度学习 数据增强 卷积神经网络 政策文本分类 中文长文本
在线阅读 下载PDF
Text-CRNN+attention架构下的多类别文本信息分类 被引量:13
19
作者 卢健 马成贤 +1 位作者 杨腾飞 周嫣然 《计算机应用研究》 CSCD 北大核心 2020年第6期1693-1696,1701,共5页
迄今为止,传统机器学习方法依赖人工提取特征,复杂度高;深度学习网络本身特征表达能力强,但模型可解释性弱导致关键特征信息丢失。为此,以网络层次结合的方式设计了CRNN并引入attention机制,提出一种Text-CRNN+attention模型用于文本分... 迄今为止,传统机器学习方法依赖人工提取特征,复杂度高;深度学习网络本身特征表达能力强,但模型可解释性弱导致关键特征信息丢失。为此,以网络层次结合的方式设计了CRNN并引入attention机制,提出一种Text-CRNN+attention模型用于文本分类。首先利用CNN处理局部特征的位置不变性,提取高效局部特征信息;然后在RNN进行序列特征建模时引入attention机制对每一时刻输出序列信息进行自动加权,减少关键特征的丢失,最后完成时间和空间上的特征提取。实验结果表明,提出模型较其他模型准确率提升了2%~3%;在提取文本特征时,该模型既保证了数据的局部相关性又起到强化序列特征的有效组合能力。 展开更多
关键词 文本分类 卷积神经网络 循环神经网络 convolutional recurrent neural network 注意力机制
在线阅读 下载PDF
面向公安侦查的社交平台用户画像构建方法研究
20
作者 韩沈飞 何芳州 《情报探索》 2026年第1期33-41,共9页
[目的/意义]旨在探索一种基于社交平台数据的用户画像构建方法,通过分析用户行为特征为公安侦查提供数据支持。[方法/过程]以微信平台为数据来源,采用图卷积神经网络GCN模型对用户朋友圈行为数据进行挖掘,提取用户社交特征;同时,利用DSR... [目的/意义]旨在探索一种基于社交平台数据的用户画像构建方法,通过分析用户行为特征为公安侦查提供数据支持。[方法/过程]以微信平台为数据来源,采用图卷积神经网络GCN模型对用户朋友圈行为数据进行挖掘,提取用户社交特征;同时,利用DSR-BGRU(Dynamic Semantic Representation-Bidirectional Gated Recurrent Unit)模型对用户聊天记录进行文本分类,提取用户兴趣标签,并结合警务数据库中的犯罪标签,构建完整的用户标签体系。[结果/结论]该方法能够有效挖掘用户的社交特征,为犯罪个体的画像构建提供了可靠的技术支持。 展开更多
关键词 用户画像 图卷积神经网络 文本分类 标签提取
在线阅读 下载PDF
上一页 1 2 111 下一页 到第
使用帮助 返回顶部