期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
面向自动文摘的文本结构划分 被引量:2
1
作者 朱荷香 曲维光 +2 位作者 卢俊之 李素建 邵艳秋 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第2期204-211,共8页
文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,... 文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,该方法能够较有效地反映文章的内容结构,对有子标题组织和无子标题组织的文章均适用;由于考虑了总起段,使得文本结构划分更加合理,为自动文摘系统的后续工作打下坚实的基础. 展开更多
关键词 文本结构 自动文摘 向量空间模型 段落相似度 意义段划分
在线阅读 下载PDF
基于改进向量空间模型的邮件分类 被引量:3
2
作者 廖玲 文敦伟 《计算机与数字工程》 2007年第4期190-193,共4页
基于内容的邮件分类一般采用向量空间模型来表示邮件,该模型只是基于独立词在邮件内容中出现的频率来建立的,而并未考虑邮件的结构特征和词所在的上下文环境,这使得特征向量不能准确地表示邮件的内容,从而导致分类不够准确。文中提出了... 基于内容的邮件分类一般采用向量空间模型来表示邮件,该模型只是基于独立词在邮件内容中出现的频率来建立的,而并未考虑邮件的结构特征和词所在的上下文环境,这使得特征向量不能准确地表示邮件的内容,从而导致分类不够准确。文中提出了改进的向量空间模型,针对邮件特有的结构,以段落为分块单位,通过分析段落间的关系和段落中的内容来更改特征词的权重。以此模型设计了一个邮件分类系统,并对该系统进行了测试和结果分析。 展开更多
关键词 向量空间模型 邮件分类 段落结构
在线阅读 下载PDF
基于内容粘合性的邮件分类 被引量:1
3
作者 廖玲 文敦伟 《计算机仿真》 CSCD 2008年第2期121-123,共3页
电子邮件分类一般采用向量空间模型来表示邮件,但是该模型只是基于独立词在邮件内容中出现的频率来建立的,而并未考虑邮件的结构特征,从而使得特征向量不能准确地表示邮件的内容。针对目前向量空间模型出现的这种缺陷,文中将粘合性衡量... 电子邮件分类一般采用向量空间模型来表示邮件,但是该模型只是基于独立词在邮件内容中出现的频率来建立的,而并未考虑邮件的结构特征,从而使得特征向量不能准确地表示邮件的内容。针对目前向量空间模型出现的这种缺陷,文中将粘合性衡量方法提取n-gram的思想运用于文本表示当中,对词的权重进行赋值,并以此模型设计了一个邮件分类系统,由于粘合性方法考虑到了邮件的结构特征,实例证明,这种方法能够提高系统的分类精确度。 展开更多
关键词 粘合性衡量 邮件分类 向量空间模型
在线阅读 下载PDF
一种优化的AP-CAPSA中文文本结构分析算法
4
作者 刘亚亮 卢选民 +1 位作者 冯莎 王兴亮 《计算机应用研究》 CSCD 北大核心 2012年第1期137-139,共3页
从段落向量空间模型、特征词权重等多个侧面分析比较了已有的文本结构分析算法,提出了优化的AP-CAPSA算法;给出了算法性能的评价准则,并在不同的语料集合上进行了测试。实验表明该方法能够更有效地反映文本的结构,为中文自动摘要系统奠... 从段落向量空间模型、特征词权重等多个侧面分析比较了已有的文本结构分析算法,提出了优化的AP-CAPSA算法;给出了算法性能的评价准则,并在不同的语料集合上进行了测试。实验表明该方法能够更有效地反映文本的结构,为中文自动摘要系统奠定了重要的理论基础。 展开更多
关键词 文本结构 中文自动摘要 段落向量空间模型 特征词权重 评价准则
在线阅读 下载PDF
Web文本层次分类方法研究
5
作者 王序臻 《温州职业技术学院学报》 2008年第3期44-47,共4页
Web文本分类是在给定分类体系下,根据Web文本内容判定文本所属类别的一种分类方法。当文本类别数量庞大或者类别复杂时,可采用基于向量空间模型的Web文本层次分类方法,但该分类方法仍存在若干不足。本文就此归纳多种改进方法,用作讨论,... Web文本分类是在给定分类体系下,根据Web文本内容判定文本所属类别的一种分类方法。当文本类别数量庞大或者类别复杂时,可采用基于向量空间模型的Web文本层次分类方法,但该分类方法仍存在若干不足。本文就此归纳多种改进方法,用作讨论,为文本在Web中的分类及构建模型提供参考。 展开更多
关键词 WEB文本分类 向量空间模型 层次分类方法 层次结构
在线阅读 下载PDF
基于文档结构的特征权重计算方法研究
6
作者 罗衎 马佳佳 《软件导刊》 2019年第5期65-68,共4页
针对不同类别文档可能被表示为相同向量的问题,在研究常用文档特征权重计算方法的基础上,分析文档中特征项之间的相对位置关系,引入文档结构矩阵DS。将DS与3种常用权重算法相结合,构造3种新模型,并利用6种模型在实际语料上进行分类实验... 针对不同类别文档可能被表示为相同向量的问题,在研究常用文档特征权重计算方法的基础上,分析文档中特征项之间的相对位置关系,引入文档结构矩阵DS。将DS与3种常用权重算法相结合,构造3种新模型,并利用6种模型在实际语料上进行分类实验。结果表明,基于DS的权重算法与原始权重算法相比,能够提高文本分类效果。 展开更多
关键词 文本分类 向量空间模型 文档结构 特征权重 特征选择
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部