期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向自动文摘的文本结构划分
被引量:
2
1
作者
朱荷香
曲维光
+2 位作者
卢俊之
李素建
邵艳秋
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2008年第2期204-211,共8页
文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,...
文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,该方法能够较有效地反映文章的内容结构,对有子标题组织和无子标题组织的文章均适用;由于考虑了总起段,使得文本结构划分更加合理,为自动文摘系统的后续工作打下坚实的基础.
展开更多
关键词
文本结构
自动文摘
向量空间模型
段落相似度
意义段划分
在线阅读
下载PDF
职称材料
基于改进向量空间模型的邮件分类
被引量:
3
2
作者
廖玲
文敦伟
《计算机与数字工程》
2007年第4期190-193,共4页
基于内容的邮件分类一般采用向量空间模型来表示邮件,该模型只是基于独立词在邮件内容中出现的频率来建立的,而并未考虑邮件的结构特征和词所在的上下文环境,这使得特征向量不能准确地表示邮件的内容,从而导致分类不够准确。文中提出了...
基于内容的邮件分类一般采用向量空间模型来表示邮件,该模型只是基于独立词在邮件内容中出现的频率来建立的,而并未考虑邮件的结构特征和词所在的上下文环境,这使得特征向量不能准确地表示邮件的内容,从而导致分类不够准确。文中提出了改进的向量空间模型,针对邮件特有的结构,以段落为分块单位,通过分析段落间的关系和段落中的内容来更改特征词的权重。以此模型设计了一个邮件分类系统,并对该系统进行了测试和结果分析。
展开更多
关键词
向量空间模型
邮件分类
段落结构
在线阅读
下载PDF
职称材料
基于内容粘合性的邮件分类
被引量:
1
3
作者
廖玲
文敦伟
《计算机仿真》
CSCD
2008年第2期121-123,共3页
电子邮件分类一般采用向量空间模型来表示邮件,但是该模型只是基于独立词在邮件内容中出现的频率来建立的,而并未考虑邮件的结构特征,从而使得特征向量不能准确地表示邮件的内容。针对目前向量空间模型出现的这种缺陷,文中将粘合性衡量...
电子邮件分类一般采用向量空间模型来表示邮件,但是该模型只是基于独立词在邮件内容中出现的频率来建立的,而并未考虑邮件的结构特征,从而使得特征向量不能准确地表示邮件的内容。针对目前向量空间模型出现的这种缺陷,文中将粘合性衡量方法提取n-gram的思想运用于文本表示当中,对词的权重进行赋值,并以此模型设计了一个邮件分类系统,由于粘合性方法考虑到了邮件的结构特征,实例证明,这种方法能够提高系统的分类精确度。
展开更多
关键词
粘合性衡量
邮件分类
向量空间模型
在线阅读
下载PDF
职称材料
一种优化的AP-CAPSA中文文本结构分析算法
4
作者
刘亚亮
卢选民
+1 位作者
冯莎
王兴亮
《计算机应用研究》
CSCD
北大核心
2012年第1期137-139,共3页
从段落向量空间模型、特征词权重等多个侧面分析比较了已有的文本结构分析算法,提出了优化的AP-CAPSA算法;给出了算法性能的评价准则,并在不同的语料集合上进行了测试。实验表明该方法能够更有效地反映文本的结构,为中文自动摘要系统奠...
从段落向量空间模型、特征词权重等多个侧面分析比较了已有的文本结构分析算法,提出了优化的AP-CAPSA算法;给出了算法性能的评价准则,并在不同的语料集合上进行了测试。实验表明该方法能够更有效地反映文本的结构,为中文自动摘要系统奠定了重要的理论基础。
展开更多
关键词
文本结构
中文自动摘要
段落向量空间模型
特征词权重
评价准则
在线阅读
下载PDF
职称材料
Web文本层次分类方法研究
5
作者
王序臻
《温州职业技术学院学报》
2008年第3期44-47,共4页
Web文本分类是在给定分类体系下,根据Web文本内容判定文本所属类别的一种分类方法。当文本类别数量庞大或者类别复杂时,可采用基于向量空间模型的Web文本层次分类方法,但该分类方法仍存在若干不足。本文就此归纳多种改进方法,用作讨论,...
Web文本分类是在给定分类体系下,根据Web文本内容判定文本所属类别的一种分类方法。当文本类别数量庞大或者类别复杂时,可采用基于向量空间模型的Web文本层次分类方法,但该分类方法仍存在若干不足。本文就此归纳多种改进方法,用作讨论,为文本在Web中的分类及构建模型提供参考。
展开更多
关键词
WEB文本分类
向量空间模型
层次分类方法
层次结构
在线阅读
下载PDF
职称材料
基于文档结构的特征权重计算方法研究
6
作者
罗衎
马佳佳
《软件导刊》
2019年第5期65-68,共4页
针对不同类别文档可能被表示为相同向量的问题,在研究常用文档特征权重计算方法的基础上,分析文档中特征项之间的相对位置关系,引入文档结构矩阵DS。将DS与3种常用权重算法相结合,构造3种新模型,并利用6种模型在实际语料上进行分类实验...
针对不同类别文档可能被表示为相同向量的问题,在研究常用文档特征权重计算方法的基础上,分析文档中特征项之间的相对位置关系,引入文档结构矩阵DS。将DS与3种常用权重算法相结合,构造3种新模型,并利用6种模型在实际语料上进行分类实验。结果表明,基于DS的权重算法与原始权重算法相比,能够提高文本分类效果。
展开更多
关键词
文本分类
向量空间模型
文档结构
特征权重
特征选择
在线阅读
下载PDF
职称材料
题名
面向自动文摘的文本结构划分
被引量:
2
1
作者
朱荷香
曲维光
卢俊之
李素建
邵艳秋
机构
南京师范大学计算机科学系
南京师范大学文学院
北京大学计算语言研究所
出处
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2008年第2期204-211,共8页
基金
国家自然科学基金(60773173,60603093)
国家社会科学基金(07BYY050)
+2 种基金
国家973项目(2004CB318102)
江苏省社会科学基金(06JSBYY001)
国家博士后基金(20060400027)
文摘
文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,该方法能够较有效地反映文章的内容结构,对有子标题组织和无子标题组织的文章均适用;由于考虑了总起段,使得文本结构划分更加合理,为自动文摘系统的后续工作打下坚实的基础.
关键词
文本结构
自动文摘
向量空间模型
段落相似度
意义段划分
Keywords
text
structure
, automatic summarization,
vector space model
, paragraphic similarity, topic partition
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于改进向量空间模型的邮件分类
被引量:
3
2
作者
廖玲
文敦伟
机构
中南大学信息科学与工程学院
出处
《计算机与数字工程》
2007年第4期190-193,共4页
文摘
基于内容的邮件分类一般采用向量空间模型来表示邮件,该模型只是基于独立词在邮件内容中出现的频率来建立的,而并未考虑邮件的结构特征和词所在的上下文环境,这使得特征向量不能准确地表示邮件的内容,从而导致分类不够准确。文中提出了改进的向量空间模型,针对邮件特有的结构,以段落为分块单位,通过分析段落间的关系和段落中的内容来更改特征词的权重。以此模型设计了一个邮件分类系统,并对该系统进行了测试和结果分析。
关键词
向量空间模型
邮件分类
段落结构
Keywords
vector space model
,
email classification
,
structure of paragraphs
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于内容粘合性的邮件分类
被引量:
1
3
作者
廖玲
文敦伟
机构
中南大学信息科学与工程学院
阿萨巴斯卡大学计算机与信息系统学院
出处
《计算机仿真》
CSCD
2008年第2期121-123,共3页
文摘
电子邮件分类一般采用向量空间模型来表示邮件,但是该模型只是基于独立词在邮件内容中出现的频率来建立的,而并未考虑邮件的结构特征,从而使得特征向量不能准确地表示邮件的内容。针对目前向量空间模型出现的这种缺陷,文中将粘合性衡量方法提取n-gram的思想运用于文本表示当中,对词的权重进行赋值,并以此模型设计了一个邮件分类系统,由于粘合性方法考虑到了邮件的结构特征,实例证明,这种方法能够提高系统的分类精确度。
关键词
粘合性衡量
邮件分类
向量空间模型
Keywords
Glue measure
email classification
vector space model
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种优化的AP-CAPSA中文文本结构分析算法
4
作者
刘亚亮
卢选民
冯莎
王兴亮
机构
西北工业大学电子信息学院
出处
《计算机应用研究》
CSCD
北大核心
2012年第1期137-139,共3页
基金
2011年西北工业大学研究生创新性实验项目
文摘
从段落向量空间模型、特征词权重等多个侧面分析比较了已有的文本结构分析算法,提出了优化的AP-CAPSA算法;给出了算法性能的评价准则,并在不同的语料集合上进行了测试。实验表明该方法能够更有效地反映文本的结构,为中文自动摘要系统奠定了重要的理论基础。
关键词
文本结构
中文自动摘要
段落向量空间模型
特征词权重
评价准则
Keywords
text
structure
Chinese automatic summarization
paragraphic
vector space model
term weighing
evaluation criteria
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
Web文本层次分类方法研究
5
作者
王序臻
机构
温州职业技术学院计算机系
出处
《温州职业技术学院学报》
2008年第3期44-47,共4页
文摘
Web文本分类是在给定分类体系下,根据Web文本内容判定文本所属类别的一种分类方法。当文本类别数量庞大或者类别复杂时,可采用基于向量空间模型的Web文本层次分类方法,但该分类方法仍存在若干不足。本文就此归纳多种改进方法,用作讨论,为文本在Web中的分类及构建模型提供参考。
关键词
WEB文本分类
向量空间模型
层次分类方法
层次结构
Keywords
Web text
classification
vector space model
Hierarchical
classification
method
Hierarchical
structure
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于文档结构的特征权重计算方法研究
6
作者
罗衎
马佳佳
机构
渤海证券股份有限公司
北京工业大学计算机学院
出处
《软件导刊》
2019年第5期65-68,共4页
文摘
针对不同类别文档可能被表示为相同向量的问题,在研究常用文档特征权重计算方法的基础上,分析文档中特征项之间的相对位置关系,引入文档结构矩阵DS。将DS与3种常用权重算法相结合,构造3种新模型,并利用6种模型在实际语料上进行分类实验。结果表明,基于DS的权重算法与原始权重算法相比,能够提高文本分类效果。
关键词
文本分类
向量空间模型
文档结构
特征权重
特征选择
Keywords
document
classification
vector space model
document
structure
feature weight
feature selection
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向自动文摘的文本结构划分
朱荷香
曲维光
卢俊之
李素建
邵艳秋
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2008
2
在线阅读
下载PDF
职称材料
2
基于改进向量空间模型的邮件分类
廖玲
文敦伟
《计算机与数字工程》
2007
3
在线阅读
下载PDF
职称材料
3
基于内容粘合性的邮件分类
廖玲
文敦伟
《计算机仿真》
CSCD
2008
1
在线阅读
下载PDF
职称材料
4
一种优化的AP-CAPSA中文文本结构分析算法
刘亚亮
卢选民
冯莎
王兴亮
《计算机应用研究》
CSCD
北大核心
2012
0
在线阅读
下载PDF
职称材料
5
Web文本层次分类方法研究
王序臻
《温州职业技术学院学报》
2008
0
在线阅读
下载PDF
职称材料
6
基于文档结构的特征权重计算方法研究
罗衎
马佳佳
《软件导刊》
2019
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部