-
题名融合词性特征的中文命名实体识别模型
- 1
-
-
作者
朱浩华
张琨
刘尧迪
江浩俊
Tong Rong
-
机构
南京理工大学计算机科学与工程学院
-
出处
《计算机与数字工程》
2025年第6期1669-1674,1703,共7页
-
文摘
命名实体识别是自然语言处理领域的一项基础性任务。其中,在中文命名实体识别过程中,存在实体边界识别困难的问题。为了解决这一问题,提出了CTE模型。该模型在Transformer的基础上,首先使用词袋模型生成对应的词性特征;其次,针对自注意力机制无法捕获不同样本之间潜在相关性的问题,采用叠加外部注意力的方法,提高模型对全局特征的捕捉能力,从而增强实体识别效果。为了验证模型的有效性,论文在Weibo、Resume、Ontonotes5.0和MSRA四个基准数据集上进行实验验证,其F1值分别达到65.95%、96.11%、77.25%、94.80%。
-
关键词
命名实体识别
词性特征
注意力机制
cbow算法
-
Keywords
namedentity recognition
lexical features
attention mechanism
cbow algorithm
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于元路径加权融合的异构网络相似性度量
被引量:2
- 2
-
-
作者
赵宇红
薛维佳
-
机构
内蒙古科技大学信息工程学院
-
出处
《计算机工程与设计》
北大核心
2021年第2期309-315,共7页
-
基金
国家自然科学基金项目(61562065)
内蒙古自然科学基金项目(2016MS0608)。
-
文摘
针对PathSim算法只能度量异构网络同类节点和预设元路径的问题,提出可度量任意类型节点的加权融合元路径的相似性度量算法Multi-WPathSim。基于随机游走与CBOW模型进行元路径的表示学习,获得路径集合及权重,在元路径融合算法的基础上进行相似性度量,解决PathSim算法需要预设元路径的不足,通过双向游走克服PathSim算法只能度量同类节点相似性的局限性。在真实数据集中进行Top-K查询、相似性度量和聚类实验对比,Multi-WPathSim算法在对称和非对称元路径上,相似度准确率和聚类精度都有明显提升。
-
关键词
异构信息网络
元路径
相似性度量
cbow模型
PathSim算法
-
Keywords
heterogeneous information network
meta-path
similarity measure
cbow model
PathSim algorithm
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名改进词向量和kNN的中文文本分类算法
被引量:12
- 3
-
-
作者
丁正生
马春洁
-
机构
西安科技大学
-
出处
《现代电子技术》
2022年第1期100-103,共4页
-
基金
国家自然科学基金项目(71473194)。
-
文摘
为提高中文文本分类的效率和准确率,针对汉字象形字的特点和数据量剧增的大数据背景,建立基于深度学习的中文文本分类算法。首先根据汉字子字符(字形、偏旁、笔画等)象形字即形状自带含义的特点,建立基于子字符和上下文特征的双通道CBOW模型实现中文文本向量化;其次基于大数据的背景,针对传统的kNN算法分类速度慢的缺点,提出一种基于LSC聚类和多目标数据筛选的快速kNN分类算法;最后运用快速kNN算法对文本数据转化的特征词向量数据进行分类。实验结果表明,改进后的中文文本分类算法增加了算法的使用范围,能够更精确地处理中文文本数据,更快地处理大数据问题,在分类速率和效果上都有一定程度的提升。
-
关键词
中文文本分类
文本向量化
快速kNN算法
词向量
双通道cbow模型
特征向量
数据分类
-
Keywords
Chinese text classification
text vectorization
fast kNN algorithm
word embedding
two-channel cbow model
feature vector
data classification
-
分类号
TN911.1-34
[电子电信—通信与信息系统]
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名中文领域情感词典自适应学习方法
被引量:17
- 4
-
-
作者
叶霞
曹军博
许飞翔
郭鸿燕
尹列东
-
机构
火箭军工程大学作战保障学院
中国航天科工集团第二研究院
-
出处
《计算机工程与设计》
北大核心
2020年第8期2231-2237,共7页
-
基金
国家自然科学基金项目(61702525)。
-
文摘
针对领域情感词典的局限性,提出一种中文领域情感词典自适应学习方法。从中文基础情感词典中选取少量种子词,采用基于CBOW模型和基于句法规则两种抽取方法,对领域语料库进行候选情感词的抽取,通过改进的SO_PMI算法对得到的候选情感词进行情感极性判定,形成领域正负情感词典。实验结果表明,该方法能够自适应生成领域情感词典,情感词识别准确率较高,该模型在中文情感分析应用中取得了较好的效果。
-
关键词
情感分析
领域情感词典
情感极性
cbow连续词袋模型
PMI算法
-
Keywords
sentiment analysis
domain sentiment dictionary
sentiment polarity
cbow model
PMI algorithm
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于社交网络分析的学生异常轨迹检测方法研究
- 5
-
-
作者
梁庆伟
马健
林泽东
-
机构
山东科技大学
-
出处
《信息与电脑》
2021年第10期30-33,共4页
-
文摘
随着智能终端的普及,校园网已成为一个庞大的信息承载体,包含了高校学生的各种行为轨迹,也能够准确反映出学生的日程行为规律。在这样的背景下,笔者以校园大数据为核心,首先构建每个学生的轨迹序列,利用CBOW(Continuous Bag-of-Word Model)模型得到学生轨迹向量,使用Louvain算法搭建社交网络,在此基础上构建基于社交网络分析的学生异常轨迹监测预警方法。实验结果表明,本文提出的方法能有效检测出异常的学生轨迹。
-
关键词
社交网络
cbow模型
Louvain算法
轨迹检测
-
Keywords
social network
cbow model
Louvain algorithm
trajectory detection
-
分类号
U495
[交通运输工程—交通运输规划与管理]
TP311.13
[自动化与计算机技术—计算机软件与理论]
-