期刊文献+
共找到2,227篇文章
< 1 2 112 >
每页显示 20 50 100
Research on Feature Extraction Method of Social Network Text 被引量:2
1
作者 Zheng Zhang Shu Zhou 《Journal of New Media》 2021年第2期73-80,共8页
The development of various applications based on social network text is in full swing.Studying text features and classifications is of great value to extract important information.This paper mainly introduces the comm... The development of various applications based on social network text is in full swing.Studying text features and classifications is of great value to extract important information.This paper mainly introduces the common feature selection algorithms and feature representation methods,and introduces the basic principles,advantages and disadvantages of SVM and KNN,and the evaluation indexes of classification algorithms.In the aspect of mutual information feature selection function,it describes its processing flow,shortcomings and optimization improvements.In view of its weakness in not balancing the positive and negative correlation characteristics,a balance weight attribute factor and feature difference factor are introduced to make up for its deficiency.The experimental stage mainly describes the specific process:the word segmentation processing,to disuse words,using various feature selection algorithms,including optimized mutual information,and weighted with TF-IDF.Under the two classification algorithms of SVM and KNN,we compare the merits and demerits of all the feature selection algorithms according to the evaluation index.Experiments show that the optimized mutual information feature selection has good performance and is better than KNN under the SVM classification algorithm.This experiment proves its validity. 展开更多
关键词 Social network text mutual information positive and negative correlation characteristics SVM KNN
在线阅读 下载PDF
The Role of Rare Terms in Enhancing the Performance of Polynomial Networks Based Text Categorization
2
作者 Mayy M. Al-Tahrawi 《Journal of Intelligent Learning Systems and Applications》 2013年第2期84-89,共6页
In this paper, the role of rare or infrequent terms in enhancing the accuracy of English Text Categorization using Polynomial Networks (PNs) is investigated. To study the impact of rare terms in enhancing the accuracy... In this paper, the role of rare or infrequent terms in enhancing the accuracy of English Text Categorization using Polynomial Networks (PNs) is investigated. To study the impact of rare terms in enhancing the accuracy of PNs-based text categorization, different term reduction criteria as well as different term weighting schemes were experimented on the Reuters Corpus using PNs. Each term weighting scheme on each reduced term set was tested once keeping the rare terms and another time removing them. All the experiments conducted in this research show that keeping rare terms substantially improves the performance of Polynomial Networks in Text Categorization, regardless of the term reduction method, the number of terms used in classification, or the term weighting scheme adopted. 展开更多
关键词 POLYNOMIAL networkS text CATEGORIZATION Document Classification Infrequent TERMS RARE TERMS
暂未订购
Hybrid Reliability Parameter Selection Method Based on Text Mining, Frequent Pattern Growth Algorithm and Fuzzy Bayesian Network 被引量:1
3
作者 SHUAI Yon SONG Tailian +1 位作者 WANG Jianping ZHAN Wenbin 《Journal of Shanghai Jiaotong university(Science)》 EI 2018年第3期423-428,共6页
Reliability parameter selection is very important in the period of equipment project design and demonstration. In this paper, the problem in selecting the reliability parameters and their number is proposed. In order ... Reliability parameter selection is very important in the period of equipment project design and demonstration. In this paper, the problem in selecting the reliability parameters and their number is proposed. In order to solve this problem, the thought of text mining is used to extract the feature and curtail feature sets from text data firstly, and frequent pattern tree (FPT) of the text data is constructed to reason frequent item-set between the key factors by frequent patter growth (FPC) algorithm. Then on the basis of fuzzy Bayesian network (FBN) and sample distribution, this paper fuzzifies the key attributes, which forms associated relationship in frequent item-sets and their main parameters, eliminates the subjective influence factors and obtains condition mutual information and maximum weight directed tree among all the attribute variables. Furthermore, the hybrid model is established by reason fuzzy prior probability and contingent probability and concluding parameter learning method. Finally, the example indicates the model is believable and effective. 展开更多
关键词 reliability parameter text mining frequent pattern growth(FPG) fuzzy Bayesian network(FBN)
原文传递
基于PKUSEG-Text-GCN的肿瘤疾病预测模型
4
作者 高志玲 赵新宇 《计算机工程与科学》 北大核心 2025年第7期1303-1311,共9页
当前疾病预测模型仅关注病历文本的局部信息以及上下文信息,缺乏对全局信息的考虑,由此导致预测结果准确率不高。利用图神经网络关注全局信息的特点,提出将图卷积神经网络(GCN)用于中文电子病历的肿瘤疾病预测。首先,利用医学领域分词... 当前疾病预测模型仅关注病历文本的局部信息以及上下文信息,缺乏对全局信息的考虑,由此导致预测结果准确率不高。利用图神经网络关注全局信息的特点,提出将图卷积神经网络(GCN)用于中文电子病历的肿瘤疾病预测。首先,利用医学领域分词工具包PKUSEG对中文电子病历进行分词;其次,通过病历与词的共现关系和病历文本中词与词之间的关系,建立文本图;最后,基于该医学文本图利用图卷积神经网络(Text-GCN)对文本图的特征进行学习,将学习到的模型用于肿瘤疾病预测。实验结果显示,所提模型相比多个模型中的最优模型准确率提升了6%。同时,当数据较少的时候准确率并不会明显下降,表明该模型在电子病历较少的情况下仍具有很好的鲁棒性。 展开更多
关键词 文本图卷积神经网络 中文分词 肿瘤致病分析 肿瘤疾病预测
在线阅读 下载PDF
基于“网络药理学-文本挖掘-分子对接”的补阳还五汤抗动脉粥样硬化“药代效应标志物”研究
5
作者 姜丽 郑雨婷 +6 位作者 丁雅芬 王玮玮 曾年娣 晏炜婷 罗康 熊旺平 徐国良 《中国中药杂志》 北大核心 2026年第3期854-865,共12页
该研究旨在通过整合网络药理学、文本挖掘及分子对接技术,筛选补阳还五汤抗动脉粥样硬化(atherosclerosis,AS)的核心效应成分,并探究其在正常和慢性炎症表征的AS大鼠体内的药代动力学特征。基于网络药理学方法筛选出31个核心成分及6个... 该研究旨在通过整合网络药理学、文本挖掘及分子对接技术,筛选补阳还五汤抗动脉粥样硬化(atherosclerosis,AS)的核心效应成分,并探究其在正常和慢性炎症表征的AS大鼠体内的药代动力学特征。基于网络药理学方法筛选出31个核心成分及6个核心靶点(ESR1、PARP1、ALOX5、CNR2、NOS2、PTGS2),构建补阳还五汤抗AS的“中药-活性成分-靶点”网络。通过文本挖掘补充文献高频报道成分后,最终确定8个关键效应成分:羟基红花黄色素A、苦杏仁苷、芍药内酯苷、芍药苷、阿魏酸、黄芪甲苷、正丁烯基苯酞、Z-藁本内酯。这些成分与获得的核心靶点进行分子对接,结果显示,除羟基红花黄色素A与CNR2外,其余成分与靶点结合能均小于-5 kJ·mol^(-1),表明成分与靶点具有较强生物亲和力。在药代动力学研究中,以30 g·kg^(-1)剂量灌胃给予正常及脂多糖(LPS)诱导的慢性炎症模型大鼠后,通过超高效液相色谱-三重四极杆质谱联用技术(UPLC-QQQ-MS)检测多时间点血浆样本。结果显示,与正常组相比,模型组大鼠血浆中多数成分的C_(max)、AUC_(0-t)显著降低,t_(1/2)、CL、MRT_(0-t)显著升高(P<0.05),且6种成分的t_(max)呈延长趋势;正丁烯基苯酞与Z-藁本内酯因血药浓度低于定量限未检出。该研究通过“网络药理学-文本挖掘-分子对接”多维技术体系,系统阐明补阳还五汤抗AS的药效物质基础及作用机制,为中药复方药代效应标志物研究提供了思路与方法。 展开更多
关键词 补阳还五汤 网络药理学 文本挖掘 分子对接 药代动力学
原文传递
基于文本引导的轻量异构编码多模态图像融合
6
作者 王传云 周明奇 +3 位作者 孙冬冬 王田 高骞 李照奎 《工程科学学报》 北大核心 2026年第2期346-359,共14页
针对资源受限的无人机平台对红外与可见光图像的融合效率与感知性能需求,本文提出一种基于文本引导的轻量异构编码多模态图像融合网络.该网络设计了一种面向红外与可见光图像信息表达功能互补的轻量化双分支异构编码,红外图像编码分支... 针对资源受限的无人机平台对红外与可见光图像的融合效率与感知性能需求,本文提出一种基于文本引导的轻量异构编码多模态图像融合网络.该网络设计了一种面向红外与可见光图像信息表达功能互补的轻量化双分支异构编码,红外图像编码分支强调热目标与边缘响应,可见光图像编码分支侧重于纹理与细节信息建模,从而有效避免同构编码器带来的特征冗余与性能瓶颈.同时,引入轻量级跨模态特征融合模块,增强多模信息之间的互补性与融合表达能力.进一步,通过预训练视觉语言模型结合语义文本特征对融合过程进行引导与调控,提升融合图像的语义一致性与环境适应性.在三个公开多模态图像数据集TNO、LLVIP与M3FD上,本文方法与九种代表性图像融合算法进行了系统对比实验与综合评估,结果显示本文网络在互信息、结构相似性等多个主流评价指标上均表现优越,融合图像在细节清晰度、边缘结构一致性与目标可辨性方面优于现有方法.同时,消融实验表明所提出模型的推理时间相较基线方法减少约50%,且在不显著牺牲性能的前提下实现了更高的效率.除定量评估外,本文还开展了基于文本指令的定性实验,结果显示模型可根据不同语义指令灵活调整红外与可见光特征融合策略,适应低光、过曝、低对比、噪声等多种任务场景.在保证语义一致性的同时,有效增强了热源感知、结构清晰度与抗干扰能力,展现出传统无引导方法难以实现的语义可控性与内容适应性. 展开更多
关键词 多模态图像融合 双分支异构编码 文本引导 轻量化网络 注意力机制
在线阅读 下载PDF
基于Text-CNN模型的工程质量信息化研究
7
作者 母晓维 《建筑机械化》 2025年第9期28-32,共5页
针对建设工程质量问题分类的复杂性与数据不平衡问题,提出Text-CNN模型进行智能分类,通过数据预处理与基于语言学规则的数据增强方法解决类别不平衡问题,实现数据集的适度平衡。构建并训练Text-CNN模型,有效实现建设工程质量问题的识别... 针对建设工程质量问题分类的复杂性与数据不平衡问题,提出Text-CNN模型进行智能分类,通过数据预处理与基于语言学规则的数据增强方法解决类别不平衡问题,实现数据集的适度平衡。构建并训练Text-CNN模型,有效实现建设工程质量问题的识别与分类,与SVM和LSTM模型对比,Text-CNN在准确率与召回率及精确率方面具有明显优势,证明了其在建设工程监理信息化中的高效性与实用性。 展开更多
关键词 工程质量 施工监理 卷积神经网络 text-CNN 信息化
原文传递
融合Transformer与DF-GAN的文本生成图像方法
8
作者 马静 车进 孙末贤 《计算机工程》 北大核心 2026年第2期413-422,共10页
文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像语义不一致。针对该问题,提出一种DXC-GAN文本生成图像方法。引入Transformer系列中的XLNet(Xtra Long Network)预训练模型替换原始文本编码器,捕获大量文本的... 文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像语义不一致。针对该问题,提出一种DXC-GAN文本生成图像方法。引入Transformer系列中的XLNet(Xtra Long Network)预训练模型替换原始文本编码器,捕获大量文本的先验知识,实现对上下文信息的深度挖掘。添加CBAM(Convolutional Block Attention Module)注意力模块,使生成器更加关注图像中的重要信息,从而解决生成图像细节不完整和空间结构错误问题。在判别器中引入对比损失,与模型中匹配感知梯度惩罚和单向输出结合,使得相同语义图像之间更加接近,不同语义图像之间更加疏远,从而增强文本与生成图像之间的语义一致性。实验结果表明:与DF-GAN相对比,DXC-GAN在CUB数据集上的IS(Inception Score)与FID(Fréchet Inception Distance)分别提升了4.42%和17.96%;在Oxford-102数据集上,IS为3.97,FID为37.82;相较于DF-GAN,DXC-GAN在鸟类图像生成方面有效避免了多头少脚等畸形问题,同时在花卉图像生成上也显著减少了花瓣残缺等图像质量问题;此外,DXC-GAN还增强了文本与图像的对齐性,显著提升了图像的完整度和生成效果。 展开更多
关键词 生成对抗网络 文本生成图像 XLNet CBAM 对比损失
在线阅读 下载PDF
天津市内六区自然与文化遗产整体保护空间网络构建
9
作者 张春彦 张新翊 何严松 《风景园林》 北大核心 2026年第4期39-49,共11页
【目的】构建天津市内六区自然与文化遗产整体保护空间网络(简称遗产保护网络),破解现有自然与文化保护分离的困境,为区域遗产的协同治理提供科学决策支撑。【方法】以天津市内六区为例,基于自然-文化关联机制,结合文本、图像、地理空... 【目的】构建天津市内六区自然与文化遗产整体保护空间网络(简称遗产保护网络),破解现有自然与文化保护分离的困境,为区域遗产的协同治理提供科学决策支撑。【方法】以天津市内六区为例,基于自然-文化关联机制,结合文本、图像、地理空间多源数据,综合运用GIS空间分析、主成分分析(principal component analysis,PCA)与高斯混合模型(Gaussian mixture model,GMM)组合的PACGMM聚类、核密度估计与最小生成树模型,识别市内六区自然与文化遗产空间要素,量化空间要素的自然与文化特征及关联性,并以此为依据构建遗产保护网络。【结果】天津市内六区遗产保护网络中共识别重要遗产点458个,依据地形地貌、水文条件、气候特征、植被土壤4类自然地理指标划分5类自然基底。同时,总结渡运航运、商贸集市、农业生产、宗教民俗和军防城防5个文化主题与河流、湖泊、湿地、台地4种自然要素。最终,聚类7种文化特征与4类自然特征,划分典型文化景观单元9个,构建空间关联路径311条。【结论】从理论和方法2个维度,在中国传统古迹观与文化景观理论视角下构建遗产保护网络,推动自然与文化遗产价值复合的整体保护与协同治理。 展开更多
关键词 文化遗产保护 古迹观 自然和文化关联 文本挖掘 空间网络
在线阅读 下载PDF
基于语义特征和TextRank算法的科研成果论文中文文本关键词提取方法
10
作者 张世超 王建宾 孟浩 《华南地震》 2025年第3期188-194,共7页
为准确提取科研成果论文中文文本关键词,并准确排列,研究基于语义特征和TextRank算法的科研成果论文中文文本关键词提取方法。基于语义特征的科研成果论文中文文本候选关键词筛选方法,在Word2Vec工具中,将中文文本转换为词向量,作为论... 为准确提取科研成果论文中文文本关键词,并准确排列,研究基于语义特征和TextRank算法的科研成果论文中文文本关键词提取方法。基于语义特征的科研成果论文中文文本候选关键词筛选方法,在Word2Vec工具中,将中文文本转换为词向量,作为论文中文文本语义特征;将语义特征输入卷积神经网络中,以分类的方式,提取属于候选关键词类型的语义特征,将其所属文本词语作为候选关键词;通过基于TextRank算法的科研成果论文中文文本关键词提取方法,在候选关键词中,以候选关键词的平均信息熵、词性、位置三种特征,为关键词提取指标,构建提取关键词的图模型,运算候选关键词综合权重,以从大到小的方式排列候选关键词,将排名靠前的候选关键词,作为最终提取的关键词,完成科研成果论文中文文本关键词提取。经测试,此方法可提高科研成果论文中文文本关键词提取精度、提高关键词排名准确性。 展开更多
关键词 语义特征 textRank算法 科研成果论文 中文文本 关键词提取 卷积神经网络
在线阅读 下载PDF
湖南省红色旅游经典景区故事讲述研究——基于网络文本分析
11
作者 朱东国 曾建华 《湖北科技学院学报》 2026年第1期32-39,46,共9页
基于2019—2023年7月的马蜂窝、大众点评两大旅游网站游客点评网络文本,采用情感分析方法和内容分析方法,以湖南省14个全国红色旅游经典景区为案例地,分析游客对景区故事讲述情感特征。研究表明,游客的情感整体上以积极情感为主,情感强... 基于2019—2023年7月的马蜂窝、大众点评两大旅游网站游客点评网络文本,采用情感分析方法和内容分析方法,以湖南省14个全国红色旅游经典景区为案例地,分析游客对景区故事讲述情感特征。研究表明,游客的情感整体上以积极情感为主,情感强度以高度强度为主;游客在表达积极感受时,使用的词语多为耐心、很好、很不错和好听等,积极情感的产生与导游或讲解员故事知识储备、讲述故事技巧、态度和免费讲解服务密切相关;游客在表达消极情感主要表现为感到被欺骗或恶心痛恨等,与导游或讲解员服务质量、讲解设备和讲解人员配置有关。为进一步增强游客的积极情感,红色旅游经典景区应着重从讲解服务质量、讲解设备管理和讲解宣传资源采取改进措施。 展开更多
关键词 红色旅游经典景区 故事讲述 网络文本 湖南省
在线阅读 下载PDF
基于多码深度特征融合生成对抗网络的文本生成图像方法
12
作者 顾广华 孙文星 伊柏宇 《电子与信息学报》 北大核心 2026年第1期287-296,共10页
文本生成图像是一项极具挑战的跨模态任务,其核心在于生成与文本描述高度一致、细节丰富的高质量图像。当前基于生成对抗网络的方法多依赖单一噪声输入,导致生成图像细粒度不足;同时,单词级特征利用不充分,也制约了文本与图像之间的语... 文本生成图像是一项极具挑战的跨模态任务,其核心在于生成与文本描述高度一致、细节丰富的高质量图像。当前基于生成对抗网络的方法多依赖单一噪声输入,导致生成图像细粒度不足;同时,单词级特征利用不充分,也制约了文本与图像之间的语义对齐精度。为此,该文提出一种多码深度特征融合生成对抗网络(mDFAGAN)。该方法通过设计多噪声输入生成器与多码先验融合模块,提升生成图像的细节表现力;在生成器中引入多头注意力机制,从多角度对齐单词与图像子区域,增强语义一致性;此外,提出多码先验融合损失以稳定训练过程。在CUB和COCO数据集上的实验结果表明,所提方法在IS与FID评价指标上均优于当前主流生成对抗网络方法,能够生成更逼真、细节更丰富、语义一致性更强的图像。 展开更多
关键词 文本生成图像 生成对抗网络 跨模态 多码先验融合
在线阅读 下载PDF
基于文本挖掘的网络文化安全评价指标体系研究
13
作者 肖军 陈林培 《情报探索》 2026年第2期25-32,共8页
[目的/意义]旨在提升网络文化安全治理水平,研究并建立网络文化安全评价指标体系。[方法/过程]通过文献分析法、文本挖掘法、层次分析法、熵值法等研究方法相结合,对网络文化安全相关政策文本进行语义挖掘、指标赋权、模型建构。[结果/... [目的/意义]旨在提升网络文化安全治理水平,研究并建立网络文化安全评价指标体系。[方法/过程]通过文献分析法、文本挖掘法、层次分析法、熵值法等研究方法相结合,对网络文化安全相关政策文本进行语义挖掘、指标赋权、模型建构。[结果/结论]构建了网络文化价值层、生产层、内容层、传播层、监管层五个层次的网络文化安全评价指标体系。此外,提出维护网络文化安全可从提高网络文化内容评价要求、价值观念引导、传播环境塑造、法治体系构建等层面出发。 展开更多
关键词 网络文化安全 指标体系 文本挖掘 文化主权
在线阅读 下载PDF
融合FastText模型和注意力机制的网络新闻文本分类模型 被引量:11
14
作者 王婉 张向先 +1 位作者 卢恒 张莉曼 《现代情报》 CSSCI 2022年第3期40-47,共8页
[目的/意义]构建融合Fast Text模型和注意力机制的网络新闻文本分类模型,为网络新闻平台运营提供了智能化的知识组织思路。[方法/过程]基于Word2vec模型与Fast Text模型相结合的词向量模型Ngram2vec进行网络新闻文本的语义表达,并运用... [目的/意义]构建融合Fast Text模型和注意力机制的网络新闻文本分类模型,为网络新闻平台运营提供了智能化的知识组织思路。[方法/过程]基于Word2vec模型与Fast Text模型相结合的词向量模型Ngram2vec进行网络新闻文本的语义表达,并运用融合注意力机制的Bi LSTM;tte模型实现新闻文本分类。[结果/结论]实验结果显示,融合了Fast Text模型与注意力机制的网络新闻文本分类模型使F1值从90.62%提升到92.03%,说明本文提出的文本分类模型能够提升网络新闻文本分类的精确率,对网络新闻平台提升知识组织效率、优化服务水平具有重要参考价值。 展开更多
关键词 网络新闻 文本分类 注意力机制 双向长短期记忆神经网络模型
在线阅读 下载PDF
基于语义情感的森林康养满意度分析——以西樵山森林公园为例
15
作者 郑淳佳 钱万惠 +2 位作者 杨清 赖灿 赵庆 《中南林业科技大学学报》 北大核心 2026年第2期204-214,共11页
【目的】森林康养满意度是指导森林公园服务管理优化的重要指标。研究网络文本反映的游客康养体验满意度能为森林公园的管理与服务优化提供依据。【方法】选取广东西樵山国家森林公园作为研究对象,从携程和大众点评旅游网站采集游客上... 【目的】森林康养满意度是指导森林公园服务管理优化的重要指标。研究网络文本反映的游客康养体验满意度能为森林公园的管理与服务优化提供依据。【方法】选取广东西樵山国家森林公园作为研究对象,从携程和大众点评旅游网站采集游客上传的用户评论,运用网络文本分析法和情感倾向分析法筛选出康养形象高频感知特征,量化游客情绪倾向,运用IPA分析法分析游客感知的康养要素和游客满意评价。【结果】用户评论中对西樵山的感知正向表达较多,对风景优美、空气清新、观音像等方面感知较为突出,并且对公园服务与设施较为关注。游客对西樵山公园的积极情绪占比为72.83%,游客对各类康养要素满意度均为“很满意”及以上,但服务感知要素在“不满意”区间有较大的占比。自然风光和历史人文要素是西樵山公园的优势康养要素,可重点宣传,发扬优势;而服务设施与场地交通要素需要重点改进,休闲游憩要素可在资源充足情况下提升。【结论】今后公园可通过融合观音文化等特色资源,设计多样化康养活动,并优化导览系统、交通布局及停车设施,全面提升服务质量,为游客提供高质量的森林康养体验。 展开更多
关键词 西樵山 网络文本分析 IPA分析法 森林康养 满意度
在线阅读 下载PDF
融合知识增强与SimCLS框架的生成式文本摘要模型
16
作者 刘佳旭 吴石 张艳菊 《计算机系统应用》 2026年第3期44-58,共15页
旨在通过理解输入的原始文本生成简洁、易读的摘要.然而,现有模型输出的摘要中仍存在语义冗余、事实性错误以及暴露偏差的问题.解决这些问题对于提升模型性能和摘要质量具有重要的研究意义.因此,提出一种融合知识增强与SimCLS框架的生... 旨在通过理解输入的原始文本生成简洁、易读的摘要.然而,现有模型输出的摘要中仍存在语义冗余、事实性错误以及暴露偏差的问题.解决这些问题对于提升模型性能和摘要质量具有重要的研究意义.因此,提出一种融合知识增强与SimCLS框架的生成式文本摘要模型.首先,设计了知识增强编码器获取源文本的结构化知识信息以维护全局上下文的结构信息,并结合文本编码器充分编码全文语义信息.其次,在解码器部分利用Copy机制,更加准确地再现原始文本中的信息.最后,使用SimCLS两阶段的对比学习训练框架,对模型生成的摘要进行评分以驱动模型生成高质量摘要.实验结果表明,相较于表现较为优异的SeqCo模型,所提模型在CNN/Daily Mail数据集上的ROUGE-1/2/L及BERTScore分别提升了1.84、0.65、2.04和0.21个百分点,在XSum数据集上分别提升了1.78、2.16、2.36和0.13个百分点,验证了模型的有效性. 展开更多
关键词 知识增强 生成式文本摘要 对比学习 语义知识 图注意力网络
在线阅读 下载PDF
基于多特征融合和混合神经网络的医疗健康问题分类 被引量:1
17
作者 刘畅 梁冰雪 +1 位作者 田荣坤 秦玉华 《计算机工程》 北大核心 2026年第2期342-355,共14页
在医疗健康领域中,现有的问题分类方法存在文本特征表示能力弱的问题,并且对于多类别问题,忽视了不同关键词特征的权重,从而影响了分类的准确性。为了解决这些问题,提出一种基于多特征融合与混合神经网络的医疗健康问题分类方法(MPC-MFF... 在医疗健康领域中,现有的问题分类方法存在文本特征表示能力弱的问题,并且对于多类别问题,忽视了不同关键词特征的权重,从而影响了分类的准确性。为了解决这些问题,提出一种基于多特征融合与混合神经网络的医疗健康问题分类方法(MPC-MFF-HNN),旨在提高医疗健康问题分类的准确性。首先,该方法结合RoBERTa-wwm-ex模型和Word2Vec模型对文本信息进行字符级和单词级的向量表示,以获得丰富的多特征信息,从而弥补单一特征表示方法的不足,使得模型在处理复杂的医疗健康文本时能够更全面地理解和表征文本语义;其次,通过多头注意力机制结合改进的文本卷积神经网络(TextCNN)和双向门控循环单元(BiGRU),设计了一种混合神经网络模型MHA-APTC-BiGRU,其采用多层次特征提取方法,能够有效提取包含关键词权重的深层次文本特征;最后,分类器将语义增强的特征向量作为输入,用于问题类别的分类。在真实公开数据集上的实验结果表明,与其他基线算法相比,该方法在精确率、召回率和F1值指标上均显著提升,在医疗健康问题分类方面表现出更优越的性能。 展开更多
关键词 多特征融合 混合神经网络 多标签文本分类 注意力机制 医疗健康
在线阅读 下载PDF
基于文本挖掘的电网事故风险因素及致因识别
18
作者 冯永康 尹鑫伟 +1 位作者 吴祥 代宝乾 《中国安全生产科学技术》 北大核心 2026年第3期110-117,共8页
为了提升新型电力系统背景下电网安全风险识别的准确性与系统性,解决传统分析方法在处理高维、非线性事故数据时的不足。采用词语频率-逆文档频率(term frequency-inverse document frequency,TF-IDF)算法与隐含狄利克雷分布(latent dir... 为了提升新型电力系统背景下电网安全风险识别的准确性与系统性,解决传统分析方法在处理高维、非线性事故数据时的不足。采用词语频率-逆文档频率(term frequency-inverse document frequency,TF-IDF)算法与隐含狄利克雷分布(latent dirichlet allocation,LDA)主题模型进行文本挖掘,提取关键风险因素与致因主题,并运用复杂网络分析法构建风险关联网络。研究结果表明:识别出27个关键风险因素和10个核心致因主题;复杂网络分析进一步表明,管理缺失与高风险作业许可管理分别是2个网络中的核心,这证明管理体系缺陷是导致系统性风险的根本原因。研究结果可为电网企业提供1套数据驱动的风险识别与管控方法,所构建的综合分析框架亦可推广至其他工业领域,为系统性安全治理提供决策支持。 展开更多
关键词 文本挖掘 复杂网络 电网安全 风险识别 事故致因
在线阅读 下载PDF
卡若拉冰川景区游客满意度调查分析及其提升策略
19
作者 刘金花 马百惠 +4 位作者 胡海平 李文 叶长盛 朵耀华 姜勇彪 《地球环境学报》 2026年第1期177-187,共11页
2022年北京冬奥会成功举办以来,中国冰雪旅游产业迎来了重大机遇。西藏冰川旅游资源丰富,具有天然优势。以卡若拉冰川景区为例,基于调查问卷、访谈数据和网络文本数据,对卡若拉冰川景区的游客人口学特征、总体满意度及其影响因素进行分... 2022年北京冬奥会成功举办以来,中国冰雪旅游产业迎来了重大机遇。西藏冰川旅游资源丰富,具有天然优势。以卡若拉冰川景区为例,基于调查问卷、访谈数据和网络文本数据,对卡若拉冰川景区的游客人口学特征、总体满意度及其影响因素进行分析。调查问卷数据采用二元Logistic模型分析卡若拉冰川景区游客总体满意度评价的影响因素。利用数据挖掘技术抓取携程、马蜂窝、大众点评这3个网站共801条游客评论,采用ROST CM6软件对游客评论数据进行统计分析。结果表明:游客学历、可支配收入与景区总体满意度呈负相关;交通通达性、景区服务水平、基础设施和新媒体显著影响游客对景区的满意度评价,且呈正相关。游客评论中冰川旅游资源及目的地类高频词占比73.82%。游客情感分析中,游客积极、中性和消极情绪占比分别为71.89%、5.64%和22.47%。基于研究结果,建议政府及景区要细分旅游市场,区域协同发展,完善基础设施,提高服务水平,利用好新媒体等,进一步提升卡若拉冰川景区的整体旅游形象。 展开更多
关键词 卡若拉冰川 游客满意度 冰川旅游 网络文本分析
在线阅读 下载PDF
基于改进卷积神经网络的微博文本情感分类模型
20
作者 章美芳 俞龙 孙道宗 《济南大学学报(自然科学版)》 北大核心 2026年第2期297-304,共8页
为了提高微博文本情感分类模型的性能,将卷积神经网络用于文本训练,并采用樽海鞘群算法优化求解卷积神经网络权重;对微博文本进行样本初始化并采用Word2Vec模型进行样本向量化,并建立卷积神经网络微博文本情感分类模型;将权重和偏置参... 为了提高微博文本情感分类模型的性能,将卷积神经网络用于文本训练,并采用樽海鞘群算法优化求解卷积神经网络权重;对微博文本进行样本初始化并采用Word2Vec模型进行样本向量化,并建立卷积神经网络微博文本情感分类模型;将权重和偏置参数作为多个樽海鞘个体进行训练,并采用樽海鞘群算法的领队和追随者的的位置更新不断优化;对比所有樽海鞘个体和食物位置的适应度值,取适应度值最大的个体即获得卷积神经网络最优权重和偏置;采用经樽海鞘群算法优化的卷积神经网络对微博文本进行情感分类仿真验证。结果表明,通过合理设置樽海鞘群算法的控制参数,能够得到更优的卷积神经网络参数;与常用微博文本情感分类模型相比,樽海鞘群算法优化的卷积神经网络具有更高的分类准确率。 展开更多
关键词 微博文本 情感分类 卷积神经网络 樽海鞘群算法
在线阅读 下载PDF
上一页 1 2 112 下一页 到第
使用帮助 返回顶部