期刊文献+
共找到852篇文章
< 1 2 43 >
每页显示 20 50 100
mBERT与多源领域自适应协同的工控协议逆向方法
1
作者 宗学军 易容光 +4 位作者 刘昱萱 何戡 史洪岩 孙逸菲 宁博伟 《沈阳工业大学学报》 北大核心 2026年第1期63-73,共11页
【目的】工业控制系统(industrial control system,ICS)中设备间通信过程高度依赖工控协议来实现,协议安全性对保障ICS稳定运行起到关键作用。漏洞挖掘与入侵检测等作为ICS安全防御体系的核心技术组件,其有效性依赖于对工控协议结构及... 【目的】工业控制系统(industrial control system,ICS)中设备间通信过程高度依赖工控协议来实现,协议安全性对保障ICS稳定运行起到关键作用。漏洞挖掘与入侵检测等作为ICS安全防御体系的核心技术组件,其有效性依赖于对工控协议结构及语义功能的精确解析。协议逆向分析作为解析协议结构与语义功能的关键技术,其核心环节语义推断精度直接决定协议理解的准确性。然而,受限于工控协议文档缺失、格式异构性强等现实条件,现有语义推断方法普遍依赖专家经验,存在自动化水平不足、跨协议泛化性能有限等固有瓶颈,难以适应实际工业环境中多源异构协议的高精度解析需求。【方法】为解决上述问题,本文提出mBERT协同多源领域自适应与结构化掩码策略的语义推断方法。通过mBERT模型实现跨协议通用语义表示;利用结合注意力权重与位置编码设计的结构化掩码策略,增强模型对协议结构和语义内在联系的表示能力,提高语义推断方法的自动化程度和效率;利用结合对抗训练的多源领域自适应逐步微调策略,提升模型对多个源协议的语义通用表示能力,增强其在多种工控协议上的适用性,实现关键字语义的有效推断。【结果】在辽宁省石油化工行业信息安全重点实验室的典型能源企业攻防演练靶场中开展实验验证,采集了S7comm、Modbus/TCP和EtherNet/IP三种工控协议数据,并利用协议复杂度评分机制组建训练数据集。结果表明,多源领域自适应逐步微调策略能够显著提升模型性能,将其与结构化掩码策略结合,进一步提高了语义推断精度,且本文方法在精确度、召回率与F_(1)分数指标上均显著优于现有基线方法。【结论】本文提出了mBERT协同多源领域自适应与结构化掩码策略的语义推断方法,在语义推断中采用高维球面映射与多任务损失函数,增强了不同语义类别的区分度与模型对协议语义的深层辨识能力。本文方法不仅显著降低了对人工先验知识的依赖,也提升了语义推断效率与跨协议适用性,为工控协议逆向分析及工业系统安全防护提供了具备理论支撑的新路径。 展开更多
关键词 工控协议 结构化掩码 语义推断 注意力权重 多源领域自适应 mBERT模型 词向量 对抗训练
在线阅读 下载PDF
融合词向量的智能客服交互式问句相似性识别
2
作者 臧依璨 谢秦 +1 位作者 张婕 高伟 《电子设计工程》 2026年第1期120-123,128,共5页
智能客服系统主机会根据用户问句与已有问题之间的相似性,从知识库中寻找最优答案并将其反馈给用户,因此其识别准确性直接影响用户满意度。为此,针对融合词向量的智能客服交互式问句相似性识别算法开展研究。先结合智能客服系统构建词向... 智能客服系统主机会根据用户问句与已有问题之间的相似性,从知识库中寻找最优答案并将其反馈给用户,因此其识别准确性直接影响用户满意度。为此,针对融合词向量的智能客服交互式问句相似性识别算法开展研究。先结合智能客服系统构建词向量,并在此基础上表示用户问句,然后计算交互式问句与已有问题的相似度,进而根据相似阈值设定标准,实现对语句相似性的识别。实验结果表明,当阈值区间为[0.5, 0.7]时,该文方法下F1值取值稳定,最大值达0.99;用户对反馈信息的满意度超95%,精度较高,能有效提升用户对智能客服反馈的满足程度。 展开更多
关键词 词向量 智能客服 交互式问句 相似性识别 相似阈值
在线阅读 下载PDF
基于自然语言处理的职务犯罪法律文书处理与分析研究
3
作者 姜志超 杨炳文 +1 位作者 高谷刚 李林怡 《通信与信息技术》 2026年第1期7-12,30,共7页
近年来,职务犯罪案件频发,现有研究多局限于法律文本和犯罪构成分析,缺乏跨学科视角,难以揭示其特征和发展趋势。目前,专门针对职务犯罪文书处理与分析的类似系统较少,法律领域通用的数据分析系统难以处理此类文书的专业性和特殊性。因... 近年来,职务犯罪案件频发,现有研究多局限于法律文本和犯罪构成分析,缺乏跨学科视角,难以揭示其特征和发展趋势。目前,专门针对职务犯罪文书处理与分析的类似系统较少,法律领域通用的数据分析系统难以处理此类文书的专业性和特殊性。因此,借助大数据、人工智能和自然语言处理技术,分析职务犯罪案例文本,揭示犯罪规律并实现高效预防具有重要意义。本研究提出基于智能数据处理与分析的职务犯罪研究模型与算法,并构建了系统原型。通过定制化爬虫技术高效采集多平台职务犯罪文书数据。在数据预处理阶段,采用jieba分词结合深度学习序列标注技术进行清洗、分词及关键信息提取。基于Word2Vec模型将文本信息转化为数字化表达,并结合K-Means聚类算法与Llama3大语言模型挖掘关键特征,显著提升类案检索精准性。最终通过箱线图、散点图等可视化手段展示犯罪规律。实验结果表明,相较于传统方法,该模型在精确度和召回率方面分别提升了21%和9%,充分验证了Llama3在语义理解和特征提取方面的强大能力。 展开更多
关键词 职务犯罪 法律文书 大数据 自然语言处理 词向量模型 聚类算法
在线阅读 下载PDF
融合多阶段特征的中文命名实体识别模型
4
作者 杨先凤 范玥 +1 位作者 李自强 汤依磊 《计算机工程与设计》 北大核心 2025年第1期37-43,共7页
针对中文命名实体识别中未充分利用完整的文本表示和语句特征的问题,提出一种融合多阶段特征的中文命名实体识别模型(LM-CNER)。采用全局注意力机制文本融合字符级嵌入与其预训练词向量,同时获取字符级特征和单词级特征。采用翻转长短... 针对中文命名实体识别中未充分利用完整的文本表示和语句特征的问题,提出一种融合多阶段特征的中文命名实体识别模型(LM-CNER)。采用全局注意力机制文本融合字符级嵌入与其预训练词向量,同时获取字符级特征和单词级特征。采用翻转长短时记忆网络(Re-LSTM)进行上下文特征提取,采用多头自注意力机制进行句法分析,并将二者进行拼接。使用条件随机场作为解码器,得到命名实体识别结果。在微博和简历两个数据集上的实验结果表明,该模型能够获取更加准确的文本表示和语句特征,提升模型的实体识别效果。 展开更多
关键词 命名实体识别 翻转长短时记忆网络 注意力机制 编码器 预训练词向量 多阶段特征 条件随机场
在线阅读 下载PDF
基于文本挖掘的我国长期护理保险政策供给特征研究
5
作者 刘芷含 李鹤斌 +1 位作者 卢志诚 王雪晗 《护理研究》 北大核心 2025年第19期3242-3255,共14页
目的:探索我国长期护理保险政策的核心要点,为后续提高长期护理保险政策文件的制定及落实提供参考。方法:采用词频-逆文档频率(TF-IDF)词向量模型,对中国长期护理保险试点政策数据库中的1600余份我国长期护理保险政策文件进行文本挖掘... 目的:探索我国长期护理保险政策的核心要点,为后续提高长期护理保险政策文件的制定及落实提供参考。方法:采用词频-逆文档频率(TF-IDF)词向量模型,对中国长期护理保险试点政策数据库中的1600余份我国长期护理保险政策文件进行文本挖掘研究。结果:利用多维尺度分析将政策文本内容梳理出宏观政策环境、服务模式与内容、筹资与给付标准3条政策脉络。结论:建议政府创新制度供给,鼓励数据驱动供给,加强危机学习意识。 展开更多
关键词 长期护理保险 词频-逆文档频率词向量模型 多维尺度分析 文本挖掘 政策供给
在线阅读 下载PDF
DeepSeek懂哲学吗?——以黑格尔哲学为例
6
作者 徐英瑾 《山西师大学报(社会科学版)》 2025年第3期76-85,共10页
DeepSeek等大模型的出现,显然在工具意义上大大提高了人文社科工作者的研究效率。但由此就认定大模型能“懂”诸如哲学这样的高深学问,则未免过于言过其实。哲学思维本质上是一种高级的格局感训练,因此,“懂”哲学在相当程度上就等于具... DeepSeek等大模型的出现,显然在工具意义上大大提高了人文社科工作者的研究效率。但由此就认定大模型能“懂”诸如哲学这样的高深学问,则未免过于言过其实。哲学思维本质上是一种高级的格局感训练,因此,“懂”哲学在相当程度上就等于具备了在宏观上调整我们借以描述世界的根本概念构架之拓扑学结构的能力。然而,大模型所依赖的“预测词元”的工作方式在本质上就是去层次化的,而这种工作方式也会在根本上剥夺机器对于概念图谱的洞察力。与之相较,黑格尔哲学对于概念层次自身的复杂结构性特征的高度重视,的确对大模型的现有工作方式提出了严峻挑战。 展开更多
关键词 大语言模型 人工智能 DeepSeek 词向量 《逻辑学》 三段论
在线阅读 下载PDF
基于超球坐标的复数词向量位置编码研究
7
作者 安俊秀 杨林旺 柳源 《微电子学与计算机》 2025年第6期138-145,共8页
现有的位置编码方法采用绝对位置编码和相对位置编码,但两种编码方式的缺点都源自元素信息和其位置信息的分离。为解决这一问题,提出了基于超球坐标的复数词向量中的位置编码方法(HCCPE)。借鉴复数编码的思想,采用超球坐标将元素信息和... 现有的位置编码方法采用绝对位置编码和相对位置编码,但两种编码方式的缺点都源自元素信息和其位置信息的分离。为解决这一问题,提出了基于超球坐标的复数词向量中的位置编码方法(HCCPE)。借鉴复数编码的思想,采用超球坐标将元素信息和位置信息统一编码。首先采用绝对位置编码生成角度坐标,其次采用中心点方法求得超球半径,最后将超球坐标系中表示的向量重新转移回原始坐标系。考虑到融合位置信息后,词向量会受到位置特征的影响而失去部分原始语义信息。因此,通过设置不同的权重系数,来确保融合结果既包含位置信息,又保留原始语义信息。实验结果表明:在机器翻译和文本分类任务上,基于WMT2016数据集的实验中,所提方法的BLEU值提升了1.16%;基于CR、MPQA、SUBJ、MR、SST和TREC数据集的实验中,所提方法相比已有基线模型取得了较好的效果。 展开更多
关键词 位置编码 复数词向量 超球坐标
在线阅读 下载PDF
基于Bagging_BiLSTM的网络文本情感分析
8
作者 刘杰 葛浩伟 《计算机仿真》 2025年第9期274-278,共5页
网络文本处理中,颗粒度过大或过小都会造成情感分析关键词断裂,无法精准定位文本内部固有的结构断裂点,从而难以全面捕捉关键词,导致情感识别准确性、特征贡献率减弱。为此,提出基于Bagging_BiLSTM的网络文本情感分析方法。基于word2ve... 网络文本处理中,颗粒度过大或过小都会造成情感分析关键词断裂,无法精准定位文本内部固有的结构断裂点,从而难以全面捕捉关键词,导致情感识别准确性、特征贡献率减弱。为此,提出基于Bagging_BiLSTM的网络文本情感分析方法。基于word2vec方法将网络文本中的词语转换为词向量,并根据词向量计算文本中各语句的重要度,选取重要度较高的语句作为颗粒度基准,构建文本摘要,更准确地反映文本的情感和结构特点;基于最大距离法的K-means算法对各文本摘要展开聚类,将相似的文本摘要归为一类,避免文本结构断裂造成的情感分析关键词断裂;在各聚类中任选一个文本,将该文本摘要的词向量输入到Bagging_BiLSTM模型中,识别各聚类文本的具体情感类型特征信息,完成情感分析。实验结果表明,上述方法的文本聚类效果较好,情感识别准确性、特征贡献率较高。 展开更多
关键词 情感分析 网络文本分类 词向量
在线阅读 下载PDF
不同基本单元信息融合的藏文短文本摘要生成 被引量:1
9
作者 夏吾吉 黄鹤鸣 +2 位作者 樊永红 更藏措毛 范玉涛 《计算机工程》 北大核心 2025年第6期174-183,共10页
藏文文本摘要能使用户快速有效地理解藏文文本内容。然而,公开的、多领域的大规模藏文摘要数据集的稀缺,使得藏文文本摘要生成的发展面临挑战;此外,藏文文本摘要生成研究借用中文和英文等以词作为基本单元的文本摘要生成技术构建模型,... 藏文文本摘要能使用户快速有效地理解藏文文本内容。然而,公开的、多领域的大规模藏文摘要数据集的稀缺,使得藏文文本摘要生成的发展面临挑战;此外,藏文文本摘要生成研究借用中文和英文等以词作为基本单元的文本摘要生成技术构建模型,但由于藏文受分词技术的限制,直接以词作为文本摘要生成的基本单元,对性能的影响较大。针对上述问题,构建包含10523条文本-摘要对的多领域藏文短文本摘要数据集TB-SUM,在研究藏文文本构成单元的基础上,提出适用于藏文文本摘要生成的不同基本单元融合方法,并构建融合不同基本单元的藏文文本摘要生成模型Fusion_GloVe_GRU_Atten,利用全局词向量表示(GloVe)模块实现藏文文本向量化后通过双向门控循环单元(Bi-GRU)模块对输入向量进行编码,利用注意力机制获取输入向量的完整语义信息,使解码器更加关注与当前单词相关的编码器输出,同时将GRU作为解码器生成藏文摘要。在数据集TB-SUM和Ti-SUM上的实验结果表明,以音节和词的融合作为模型训练的基本单元,以音节作为测试的基本单元时,Fusion_GloVe_GRU_Atten模型生成短文本摘要效果更好,能得到更高的ROUGE(Recall-Oriented Understudy for Gisting Evaluation)分数。 展开更多
关键词 基本单元 信息融合 词向量 数据集构建 藏文短文本摘要生成
在线阅读 下载PDF
基于词向量模型的短文本分类方法研究综述 被引量:1
10
作者 李晨 刘纳 +2 位作者 郑国风 杨杰 道路 《南京师范大学学报(工程技术版)》 2025年第2期54-68,共15页
生成、信息抽取等领域具有重要的研究意义.相比长文本数据,如何高效地对短文本进行分类是研究的重点.词向量模型可以避免从头开始训练模型,加快了算法研究和实践过程的速度,尤其在短文本分类领域表现突出.本文根据近年来短文本分类中采... 生成、信息抽取等领域具有重要的研究意义.相比长文本数据,如何高效地对短文本进行分类是研究的重点.词向量模型可以避免从头开始训练模型,加快了算法研究和实践过程的速度,尤其在短文本分类领域表现突出.本文根据近年来短文本分类中采用的词向量模型,从传统词向量模型和预训练词向量模型来分析主流词向量模型在短文本分类领域的研究现状,简要梳理了词向量模型的发展进程,介绍了词向量模型在短文本分类领域的具体应用,分析了其优缺点,给出了后词向量时代的短文本分类的发展展望,最后探讨了当前词向量模型在短文本分类中存在的局限性及未来的发展方向. 展开更多
关键词 文本挖掘 词向量 短文本分类 预训练模型
在线阅读 下载PDF
基于BERT-CNN模型的病案数据智能检索与分类研究 被引量:2
11
作者 高洁 王琳 《电子设计工程》 2025年第9期27-30,37,共5页
针对病案数据量大、结构复杂以及检索与分类困难等问题,提出了一种基于深度学习模型的智能检索与分类方法。通过使用BERT模型对病案文本数据进行词向量转换,将这些向量输入CNN模型,实现局部特征提取,并采用全连接层对病案数据进行分类... 针对病案数据量大、结构复杂以及检索与分类困难等问题,提出了一种基于深度学习模型的智能检索与分类方法。通过使用BERT模型对病案文本数据进行词向量转换,将这些向量输入CNN模型,实现局部特征提取,并采用全连接层对病案数据进行分类。实验结果表明,该方法在分类任务中展现出较高的精度。BERT与CNN的结合不仅增强了病案数据的语义表征能力,还提升了分类效果,加权精度为87.22%,加权召回率为85.30%。说明该方法为医疗信息处理提供了有效支持。 展开更多
关键词 病案数据 深度学习 词向量 特征提取 分类
在线阅读 下载PDF
基于词向量网络的科研主题演化分析:语义漂移过程的揭示
12
作者 王宏宇 石锴文 +3 位作者 王晓光 金壮 郑阳 黄菡 《情报学报》 北大核心 2025年第10期1287-1299,共13页
作为表征学科领域知识结构的经典知识网络,共词网络方法受特征关键词共现关系稀疏、关键词同义不同形及语料利用不充分等因素影响,在面对大规模学科领域数据时,难以精准描绘关键词间的语义关联关系。从理论与方法论层面对共词网络进行扩... 作为表征学科领域知识结构的经典知识网络,共词网络方法受特征关键词共现关系稀疏、关键词同义不同形及语料利用不充分等因素影响,在面对大规模学科领域数据时,难以精准描绘关键词间的语义关联关系。从理论与方法论层面对共词网络进行扩展,以全面揭示学科领域研究主题在宏观、微观等层面上的语义演化过程具有现实意义。本文将学科领域特征关键词视为网络顶点,通过全局词嵌入模型(global vectors for word representation,GloVe)获取特征关键词的向量表示,并将对应词向量间的归一化余弦相似度设定为网络连边权重,构建全连接、无向的词向量网络。进一步地,本文详细分析了学科领域词向量网络的作用与特征,提出基于词向量网络的科研主题语义漂移分析框架,并就其表征的语义关联关系与共词网络中的共现关系进行比较分析。研究发现,本文提出的学科领域词向量网络作为一类特殊的知识网络,是特征关键词的共词网络在语义超空间上的映射,具有明显的社区结构和时序演化分析价值。与共词网络方法相比,学科领域词向量网络在表征学科领域的关键概念上具有一致性,并在反映学科领域知识结构时更具稳定性和全面性,能够精细化揭示科研主题在微观层面上产生的语义漂移等更细粒度的演化过程。 展开更多
关键词 知识网络 共词网络 词向量网络 词嵌入 语义演化
在线阅读 下载PDF
基于语义增强的装备事件抽取方法
13
作者 方睿 崔良中 方圆婧 《计算机科学》 北大核心 2025年第S1期286-294,共9页
信息时代下,装备领域的数据量急剧增长,使得论证人员难以高效地从中获取关键信息,进而支持相应的数据分析和论证工作。针对装备领域事件抽取事件论元边界模糊的问题,提出了一种基于语义增强的装备事件抽取方法。该方法利用装备领域的专... 信息时代下,装备领域的数据量急剧增长,使得论证人员难以高效地从中获取关键信息,进而支持相应的数据分析和论证工作。针对装备领域事件抽取事件论元边界模糊的问题,提出了一种基于语义增强的装备事件抽取方法。该方法利用装备领域的专业术语和词汇信息,构建领域词向量,并设计能够兼容和整合不同粒度语义信息的模型结构,将装备领域词向量与预训练模型ERNIE生成的字符向量进行融合,将专业术语知识和通用语言理解能力相结合,实现更全面的语义信息捕捉,增强模型对装备领域文本语义的理解,从而提升模型对事件论元边界的识别能力。实验结果表明,该方法在装备领域数据集上取得了优于基线方法的F1值,相比CK-BERT模型F1值提升了3.83%;在公开数据集ACE2005上进行的实验验证了其能有效提升装备领域事件要素抽取的性能。 展开更多
关键词 装备领域 事件抽取 语义增强 领域词向量 预训练模型
在线阅读 下载PDF
获取适配专利知识的功能模型相似度计算方法 被引量:1
14
作者 曹国忠 李凯 《机械设计》 北大核心 2025年第4期175-181,共7页
为优化产品创新知识推送的适配性问题,在构建模型进行知识匹配与推送研究基础上,提出一种获取适配专利知识的功能模型相似度计算方法。该方法将TRIZ中的功能模型与知识推送过程相结合,根据功能模型选取待改进设计中相似度计算的要素,引... 为优化产品创新知识推送的适配性问题,在构建模型进行知识匹配与推送研究基础上,提出一种获取适配专利知识的功能模型相似度计算方法。该方法将TRIZ中的功能模型与知识推送过程相结合,根据功能模型选取待改进设计中相似度计算的要素,引入图论算法;基于功能模型计算所选要素的权重;融合专利检索与专利自然语言处理技术提取专利设计中的相似度计算要素,采用词向量模型实现相似度计算。对存在刹车导管切割长度不良问题的切管机进行实例研究,构建其功能模型,并采用计算方法匹配相似专利方案功能模型,验证该计算方法的可行性与准确性。基于该方法准确计算匹配相似专利方案功能模型,从结构层面直接对设计问题的解决进行启发,可提升产品创新知识推送的适配性,进而提高创新设计效率。 展开更多
关键词 功能模型相似度计算 适配性专利知识 图论算法 自然语言处理 词向量模型
原文传递
基于TB-IDACNN的新闻推荐模型
15
作者 辛春花 鲁晓波 何婷 《计算机工程与设计》 北大核心 2025年第5期1387-1394,共8页
针对现有新闻推荐方法存在未考虑新闻的动态特性、难以深度挖掘新闻的语义信息等问题,提出一种融合TinyBERT和改进型动态注意卷积神经网络的个性化新闻推荐模型(TB-IDACNN)。充分利用TinyBERT词向量模型、卷积神经网络和内积注意力网络... 针对现有新闻推荐方法存在未考虑新闻的动态特性、难以深度挖掘新闻的语义信息等问题,提出一种融合TinyBERT和改进型动态注意卷积神经网络的个性化新闻推荐模型(TB-IDACNN)。充分利用TinyBERT词向量模型、卷积神经网络和内积注意力网络等深度学习模型的优势,综合考虑新闻的动态特性和静态特性,实现个性化新闻推荐。在MIND和Adressa数据集上的结果表明,相比其它几种先进的新闻推荐模型,所提模型可以获得更好的推荐性能,能够有效满足用户在新闻推荐任务中的需求。 展开更多
关键词 动态神经网络 新闻推荐 词嵌入模型 内积注意力机制 卷积神经网络 词向量化 平均加权池化
在线阅读 下载PDF
基于Word2vec的哈萨克文词向量化模型的实现
16
作者 吾塔嗯拜克·阿萨汗 亚森·艾则孜 阿依努尔·努尔太 《数字通信世界》 2025年第5期148-149,166,共3页
词向量嵌入技术是研究自然语言的重要一步,通过向量化,将自然语言数字化,使自然语言能够被计算机识别和进行相关处理计算。基于Word2vec实现哈萨克文向量化,对哈萨克语机器翻译、文本分类和识别等领域研究具有重要支撑意义。本文将开源... 词向量嵌入技术是研究自然语言的重要一步,通过向量化,将自然语言数字化,使自然语言能够被计算机识别和进行相关处理计算。基于Word2vec实现哈萨克文向量化,对哈萨克语机器翻译、文本分类和识别等领域研究具有重要支撑意义。本文将开源的科大讯飞哈萨克文语料数据集作为语料库,经过清洗、分词等步骤,用Word2vc实现向量化,将每一个哈萨克文词转换为一个独立的K位词向量,通过对词向量的计算,实现发现哈萨克文文本中包含的上下文语义规律、文本主题词提取、相似词计算等功能。 展开更多
关键词 哈萨克文 Word2vec 词向量 相似度分析
在线阅读 下载PDF
一种基于BERT的领域情感词典构建方法 被引量:1
17
作者 谢云高 《科技创新与应用》 2025年第12期48-51,共4页
针对基于种子词扩展的领域情感词典构建方法存在词语上下文语义信息提取能力较低从而导致构建的领域情感词典领域性较差的问题,该文提出一种基于BERT的领域情感词典构建方法(BERT-SentiL)。该方法将领域情感词典的构建视为对词或短语的... 针对基于种子词扩展的领域情感词典构建方法存在词语上下文语义信息提取能力较低从而导致构建的领域情感词典领域性较差的问题,该文提出一种基于BERT的领域情感词典构建方法(BERT-SentiL)。该方法将领域情感词典的构建视为对词或短语的情感分类任务,运用BERT模型提取候选情感词的语义特征表示,然后将获取的语义特征表示输入Softamx并得到每个候选词所对应类别(正、负)的置信度(概率),最后依据置信度对候选词进行情感分类,构建领域情感词典。实验结果表明,采用BERT-SentiL方法构造的领域情感词典拥有较好的领域表达性和情绪识别有效性。 展开更多
关键词 情感词典构建 BERT 词向量 情感分析 语义特征
在线阅读 下载PDF
基于混合词嵌入的多通道MOOC评论情感分析模型 被引量:1
18
作者 王奴建 贾灿 +1 位作者 申红旭 艾孜尔古丽·玉素甫 《新疆师范大学学报(自然科学版)》 2025年第4期37-46,共10页
多通道词嵌入模型在情感分析方面显示出卓越的性能,但往往未能充分利用文本中的图结构,多将各种词嵌入技术进行组合应用。为了解决这一问题,本研究首先计算并归一化文本词汇的TFIDF权重,然后利用权重构建加权图,通过Node2vec训练获取节... 多通道词嵌入模型在情感分析方面显示出卓越的性能,但往往未能充分利用文本中的图结构,多将各种词嵌入技术进行组合应用。为了解决这一问题,本研究首先计算并归一化文本词汇的TFIDF权重,然后利用权重构建加权图,通过Node2vec训练获取节点嵌入向量。同时,将Word2vec和Bert词向量合并,并结合权值,实现多通道特征学习。最后通过R-Drop结构提升泛化能力。实验结果表明,模型在准确率和F1分数上分别比传统卷积模型提升了3.35%和3.80%,与其他多通道模型相比,也显示出优越性。 展开更多
关键词 多通道 词嵌入 MOOC R-Drop 节点词向量
在线阅读 下载PDF
小学教育现代化:教师视角的核心关切与现实困境分析——基于自然语言处理(NLP)技术
19
作者 杨黎 宋乃庆 谢路 《教育与教学研究》 2025年第6期83-95,共13页
小学教育现代化是实现基础教育高质量发展的关键环节。当前关于小学教育现代化的研究多聚焦宏观理论与政策设计,对教师在实践中的实际感受和意见关注不足。本研究基于全国中东西部25省市的6942位小学教师的意见数据,运用自然语言处理(N... 小学教育现代化是实现基础教育高质量发展的关键环节。当前关于小学教育现代化的研究多聚焦宏观理论与政策设计,对教师在实践中的实际感受和意见关注不足。本研究基于全国中东西部25省市的6942位小学教师的意见数据,运用自然语言处理(NLP)技术和词向量分析模型,对教师意见数据进行定量分析,系统挖掘小学教师在学校教育现代化进程中的核心关注点与现实困境,为政策制定者提供基层教育工作者的直接反馈,并在此基础上提出了小学教育现代化改进与完善的对策建议,为小学教育现代化的理论研究和实践探索提供科学依据和实践参考。 展开更多
关键词 小学教育 现代化发展 教师视角 自然语言处理(NLP)技术 词向量模型
在线阅读 下载PDF
数据驱动的汉语动名兼类探索
20
作者 杨牧 刘海涛 《语言文字应用》 北大核心 2025年第3期89-102,共14页
“名动包含说”引发了汉语词类格局的大讨论。动名如何布局仍莫衷一是,但其语义关系逐渐得到重视。动名语义,异中有同,难以用传统理论、方法准确把握。本文结合用法论和数据驱动范式,构建了动/名词及其兼类词的向量,经专家知识、词典标... “名动包含说”引发了汉语词类格局的大讨论。动名如何布局仍莫衷一是,但其语义关系逐渐得到重视。动名语义,异中有同,难以用传统理论、方法准确把握。本文结合用法论和数据驱动范式,构建了动/名词及其兼类词的向量,经专家知识、词典标注、参照词向量等检验后,分析了动名关系的宏观模式。结果显示,动词和名词涌现出偏向于动词的连续统模式。以上探索表明,数据驱动不仅有助于动名研究,还能为数智时代的语言学研究转型提供参考。 展开更多
关键词 动名兼类 用法论 词向量 数据驱动 连续统
原文传递
上一页 1 2 43 下一页 到第
使用帮助 返回顶部