期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于潜在语义分析的中文文本层次分类技术
被引量:
15
1
作者
王怡
盖杰
+1 位作者
武港山
王继成
《计算机应用研究》
CSCD
北大核心
2004年第8期151-154,165,共5页
从网络文本自动分类的需求出发 ,针对基于VSM模型的分类处理中词条无关假设和词条维度过高等问题 ,对基于类中心向量的分类方法进行了改进。利用LSA分析中的SVD分解获得Web文档的语义特征向量 ,并在此基础上进行分类处理 ,在不损害分类...
从网络文本自动分类的需求出发 ,针对基于VSM模型的分类处理中词条无关假设和词条维度过高等问题 ,对基于类中心向量的分类方法进行了改进。利用LSA分析中的SVD分解获得Web文档的语义特征向量 ,并在此基础上进行分类处理 ,在不损害分类精度的同时提高了分类及其后处理速度 ,并设计实现了一个原型系统。
展开更多
关键词
潜在语义分析
类重心分类
向量空间模型
文本分类
特征向量
在线阅读
下载PDF
职称材料
基于中心法的多层次文本分类方法的研究
2
作者
何尧
陈治平
杨亚蕾
《信息技术》
2007年第12期116-118,共3页
中心法运算速度快,效率高,而多层次分类器能有效地应对较多类别的分类任务,为此,提出了基于中心法的多层次分类法,通过分析大量类别之间的关系,把类别组织成树状结构,并在特征选择时,根据层次结构特色采取去根处理,在分类时采用中心法...
中心法运算速度快,效率高,而多层次分类器能有效地应对较多类别的分类任务,为此,提出了基于中心法的多层次分类法,通过分析大量类别之间的关系,把类别组织成树状结构,并在特征选择时,根据层次结构特色采取去根处理,在分类时采用中心法来进行分类。经过实验,与一般的层次分类算法、平面分类算法进行比较,该分类法具有较好的性能。
展开更多
关键词
中心法
多层次分类
文本分类
在线阅读
下载PDF
职称材料
利用未标识文档提高中心分类法性能的研究
3
作者
何尧
张顺淼
《电脑知识与技术(过刊)》
2007年第16期1125-1126,1169,共3页
中心分类法性能高效,但需要大量的训练文档(已标识文档)来训练分类器以保证分类的正确性.而训练文档因需花费大量人力物力来分类而数量有限,同时,网络上存在着很多未标识文档.为此,对中心分类法进行改进,提出了ONUC和0FFUC算法,以弥补...
中心分类法性能高效,但需要大量的训练文档(已标识文档)来训练分类器以保证分类的正确性.而训练文档因需花费大量人力物力来分类而数量有限,同时,网络上存在着很多未标识文档.为此,对中心分类法进行改进,提出了ONUC和0FFUC算法,以弥补当训练文档不足时,中心分类法性能急剧下降的缺陷.考虑到中心分类法易受孤立点的影响,采取了去边处理.实验证明,与普通的中心分类法、其它半监督经典算法比较,在训练文档很少的情况下,该算法能获得较好的性能.
展开更多
关键词
中心分类法
文本分类
未标识文档
已标识文档
在线阅读
下载PDF
职称材料
挖掘重要项集的关联文本分类
被引量:
2
4
作者
蔡金凤
白清源
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2011年第5期544-550,共7页
针对在关联规则分类算法的构造分类器阶段中只考虑特征词是否存在,忽略了文本特征权重的问题,基于关联规则的文本分类方法(ARC-BC)的基础上提出一种可以提高关联文本分类准确率的ISARC(ItemSet Significance-based ARC)算法.该算法利用...
针对在关联规则分类算法的构造分类器阶段中只考虑特征词是否存在,忽略了文本特征权重的问题,基于关联规则的文本分类方法(ARC-BC)的基础上提出一种可以提高关联文本分类准确率的ISARC(ItemSet Significance-based ARC)算法.该算法利用特征项权重定义了k-项集重要度,通过挖掘重要项集来产生关联规则,并考虑提升度对待分类文本的影响.实验结果表明,挖掘重要项集的ISARC算法可以提高关联文本分类的准确率.
展开更多
关键词
文本分类
基于关联规则的分类算法
权重
重要项集
在线阅读
下载PDF
职称材料
题名
基于潜在语义分析的中文文本层次分类技术
被引量:
15
1
作者
王怡
盖杰
武港山
王继成
机构
南京大学软件新技术国家重点实验室南京大学计算机系
出处
《计算机应用研究》
CSCD
北大核心
2004年第8期151-154,165,共5页
基金
国家自然科学基金资助项目 (6 0 0 730 30 )
国家"86 3"计划基金资助项目 (2 0 0 2AA1170 10 10 )
文摘
从网络文本自动分类的需求出发 ,针对基于VSM模型的分类处理中词条无关假设和词条维度过高等问题 ,对基于类中心向量的分类方法进行了改进。利用LSA分析中的SVD分解获得Web文档的语义特征向量 ,并在此基础上进行分类处理 ,在不损害分类精度的同时提高了分类及其后处理速度 ,并设计实现了一个原型系统。
关键词
潜在语义分析
类重心分类
向量空间模型
文本分类
特征向量
Keywords
Latent Semantic Analysis(LSA)
text categorization based on category centroid
Vector Space Model
text
categorization
Eigenvector
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于中心法的多层次文本分类方法的研究
2
作者
何尧
陈治平
杨亚蕾
机构
福建工程学院计算机系
出处
《信息技术》
2007年第12期116-118,共3页
文摘
中心法运算速度快,效率高,而多层次分类器能有效地应对较多类别的分类任务,为此,提出了基于中心法的多层次分类法,通过分析大量类别之间的关系,把类别组织成树状结构,并在特征选择时,根据层次结构特色采取去根处理,在分类时采用中心法来进行分类。经过实验,与一般的层次分类算法、平面分类算法进行比较,该分类法具有较好的性能。
关键词
中心法
多层次分类
文本分类
Keywords
centroid
-
based
methods
hierarchical classificati
on
text
categorization
分类号
TP274 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
利用未标识文档提高中心分类法性能的研究
3
作者
何尧
张顺淼
机构
福建工程学院
出处
《电脑知识与技术(过刊)》
2007年第16期1125-1126,1169,共3页
文摘
中心分类法性能高效,但需要大量的训练文档(已标识文档)来训练分类器以保证分类的正确性.而训练文档因需花费大量人力物力来分类而数量有限,同时,网络上存在着很多未标识文档.为此,对中心分类法进行改进,提出了ONUC和0FFUC算法,以弥补当训练文档不足时,中心分类法性能急剧下降的缺陷.考虑到中心分类法易受孤立点的影响,采取了去边处理.实验证明,与普通的中心分类法、其它半监督经典算法比较,在训练文档很少的情况下,该算法能获得较好的性能.
关键词
中心分类法
文本分类
未标识文档
已标识文档
Keywords
centroid
-
based
Classificati
on
Algorithms
text
categorization
Unlabled Document
Labeled Document
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
挖掘重要项集的关联文本分类
被引量:
2
4
作者
蔡金凤
白清源
机构
福州大学数学与计算机科学学院
出处
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2011年第5期544-550,共7页
基金
国家自然科学基金(61070062)
文摘
针对在关联规则分类算法的构造分类器阶段中只考虑特征词是否存在,忽略了文本特征权重的问题,基于关联规则的文本分类方法(ARC-BC)的基础上提出一种可以提高关联文本分类准确率的ISARC(ItemSet Significance-based ARC)算法.该算法利用特征项权重定义了k-项集重要度,通过挖掘重要项集来产生关联规则,并考虑提升度对待分类文本的影响.实验结果表明,挖掘重要项集的ISARC算法可以提高关联文本分类的准确率.
关键词
文本分类
基于关联规则的分类算法
权重
重要项集
Keywords
text
classificati
on
associati
on
rule-
based
categorizer by
category
weight
itemset significance
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于潜在语义分析的中文文本层次分类技术
王怡
盖杰
武港山
王继成
《计算机应用研究》
CSCD
北大核心
2004
15
在线阅读
下载PDF
职称材料
2
基于中心法的多层次文本分类方法的研究
何尧
陈治平
杨亚蕾
《信息技术》
2007
0
在线阅读
下载PDF
职称材料
3
利用未标识文档提高中心分类法性能的研究
何尧
张顺淼
《电脑知识与技术(过刊)》
2007
0
在线阅读
下载PDF
职称材料
4
挖掘重要项集的关联文本分类
蔡金凤
白清源
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2011
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部