期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
矩阵的奇异值分解在文本分类研究中的应用 被引量:14
1
作者 刘贵龙 王慧玲 宋柔 《计算机工程》 CAS CSCD 北大核心 2002年第12期17-18,100,共3页
用向量空间的方法对文本进行分类是指通过对训练语料的学习,对每个类建立反映该类特征的向量,然后对每一个新的文本,提取其反映该文本特征的向量以确定其类别的过程。文章利用矩阵的奇异值分解理论,把被测文本的向量与所建立的标准... 用向量空间的方法对文本进行分类是指通过对训练语料的学习,对每个类建立反映该类特征的向量,然后对每一个新的文本,提取其反映该文本特征的向量以确定其类别的过程。文章利用矩阵的奇异值分解理论,把被测文本的向量与所建立的标准向量(降维后)逐一比较,自动确定该文本的分类,经过开放式试验,获得了较好的效果。 展开更多
关键词 矩阵 奇异值分解 文本分类 矩阵理论 INTERNET 智能信息检索
在线阅读 下载PDF
基于隐含语义的kNN文本分类研究 被引量:8
2
作者 李永平 程莉 叶卫国 《计算机工程与应用》 CSCD 北大核心 2004年第6期71-73,共3页
介绍了传统的kNN的文本分类方法,分析其实质,指出其不足,提出了一种基于隐含语义的改进方案,并结合实际给出实验结果。
关键词 KNN 奇异值分解 文本分类
在线阅读 下载PDF
隐含语义索引及其在中文文本处理中的应用研究 被引量:41
3
作者 周水庚 关佶红 胡运发 《小型微型计算机系统》 CSCD 北大核心 2001年第2期239-243,共5页
信息检索本质上是语义检索 ,而传统信息检索系统都是基于独立词索引 ,因此检索效果并不理想 .隐含语义索引是一种新型的信息检索模型 ,它通过奇异值分解 ,将词向量和文档向量投影到一个低维空间 ,消减了词和文档之间的语义模糊度 ,使得... 信息检索本质上是语义检索 ,而传统信息检索系统都是基于独立词索引 ,因此检索效果并不理想 .隐含语义索引是一种新型的信息检索模型 ,它通过奇异值分解 ,将词向量和文档向量投影到一个低维空间 ,消减了词和文档之间的语义模糊度 ,使得文档之间的语义关系更为明晰 .实验和理论结果证实了隐含语义索引能够取得更好的检索效果 .本文论述了隐含语义索引的理论基础 ,研究了隐含语义索引在中文文本处理中的应用 ,包括中文文本检索、中文文本分类和中文文本聚类等 . 展开更多
关键词 信息检索 隐含语义索引 中文文本处理 中文信息处理
在线阅读 下载PDF
文本检索的潜在语义索引法初探 被引量:11
4
作者 杨梁彬 《大学图书馆学报》 CSSCI 北大核心 2003年第6期68-72,84,共6页
传统的文本检索方式是基于提问集合和文本集合的单纯语词匹配检索,然而这并不能解决检索实践过程中存在的同义和多义问题。文章阐述了文本检索的潜在语义索引法的原理并通过实验来验证潜在语义索引可以用来解决同义和多义问题,完善检索... 传统的文本检索方式是基于提问集合和文本集合的单纯语词匹配检索,然而这并不能解决检索实践过程中存在的同义和多义问题。文章阐述了文本检索的潜在语义索引法的原理并通过实验来验证潜在语义索引可以用来解决同义和多义问题,完善检索系统的性能。 展开更多
关键词 文本检索 潜在语义索引法 LSI 奇异值分解 SVD 加权方法
在线阅读 下载PDF
潜在语义分析在中文文本分类中的应用 被引量:2
5
作者 李莉 张太红 李霞 《新疆农业大学学报》 CAS 2006年第2期99-102,共4页
潜在语义分析(LSA)是一种知识提取和表示的理论和方法。它通过对大量文本集进行统计分析,消除同义词和多义词影响,提高了文本分类处理的精度。本文将主要介绍LSA方法的基本思想和实现方法并讨论LSA在中文文本分类中的应用。
关键词 潜在语义分析 奇异值分解 中文文本分类 知识提取
在线阅读 下载PDF
一种基于潜语义分析的中文网页自动摘要方法 被引量:1
6
作者 叶昭晖 杨高峰 杨岳湘 《广西大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第2期341-345,共5页
自动文摘的目的是借由计算机技术自动从原始文献中提取文摘,针对这一问题,提出了一种新的基于潜在语义分析(Latent Semantic Analysis,LSA)的中文自动摘要方法,该方法利用奇异值分解(Singular Value Decomposition,SVD)来获得文章的语... 自动文摘的目的是借由计算机技术自动从原始文献中提取文摘,针对这一问题,提出了一种新的基于潜在语义分析(Latent Semantic Analysis,LSA)的中文自动摘要方法,该方法利用奇异值分解(Singular Value Decomposition,SVD)来获得文章的语义结构,以句子和全文的相似度为依据抽取一组句子作为文章的摘要,提升了自动摘要的效率和精度,并重点介绍了该方法的基本思想、特点以及实现方法。实验结果表明,该方法在实践中取得了预期的效果。 展开更多
关键词 潜在语义分析 奇异值分解 自动摘要
在线阅读 下载PDF
TCBLSA:一种中文文本聚类新方法 被引量:15
7
作者 王国勇 徐建锁 《计算机工程》 CAS CSCD 北大核心 2004年第5期21-22,37,共3页
根据隐含语义分析(LSA)理论,提出了一种文本聚类的新方法。该方法应用LSA理论来构建文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包含的“噪声”因素,从而更加突出了词和文本之间的语义关系。通过奇异... 根据隐含语义分析(LSA)理论,提出了一种文本聚类的新方法。该方法应用LSA理论来构建文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包含的“噪声”因素,从而更加突出了词和文本之间的语义关系。通过奇异值分解(SVD),有效地降低了向量空间的维数,从而提高了文本聚类的精度和速度。 展开更多
关键词 文本聚类 隐含语义分析 奇异值分解 向量空间模型
在线阅读 下载PDF
一种结合上下文语义的短文本聚类算法 被引量:11
8
作者 张群 王红军 王伦文 《计算机科学》 CSCD 北大核心 2016年第S2期443-446,450,共5页
短文本因具有特征信息不足且高维稀疏等特点,使得传统文本聚类算法应用于短文本聚类任务时性能有限。针对上述情况,提出一种结合上下文语义的短文本聚类算法。首先借鉴社会网络分析领域的中心性和权威性思想设计了一种结合上下文语义的... 短文本因具有特征信息不足且高维稀疏等特点,使得传统文本聚类算法应用于短文本聚类任务时性能有限。针对上述情况,提出一种结合上下文语义的短文本聚类算法。首先借鉴社会网络分析领域的中心性和权威性思想设计了一种结合上下文语义的特征词权重计算方法,在此基础上构建词条-文本矩阵;然后对该矩阵进行奇异值分解,进一步将原始特征词空间映射到低维的潜在语义空间;最后通过改进的K-means聚类算法在低维潜在语义空间完成短文本聚类。实验结果表明,与传统的基于词频及逆向文档频权重的文本聚类算法相比,该算法能有效改善短文本特征不足及高维稀疏性,提高了短文的本聚类效果。 展开更多
关键词 短文本聚类 上下文语义 奇异值分解 K均值算法
在线阅读 下载PDF
基于奇异值分解的英文文本检索算法 被引量:3
9
作者 高仕龙 《计算机工程》 CAS CSCD 北大核心 2011年第1期78-80,共3页
提出一种英文文本检索算法,从文本中提取关键词项,根据转移概率计算出关键词项的状态矩阵,并通过奇异值分解,提取第一奇异值向量作为复特征向量,利用向量间的余弦相似度作为文本检索的相似度度量。实验结果表明,该算法在检索准确率和运... 提出一种英文文本检索算法,从文本中提取关键词项,根据转移概率计算出关键词项的状态矩阵,并通过奇异值分解,提取第一奇异值向量作为复特征向量,利用向量间的余弦相似度作为文本检索的相似度度量。实验结果表明,该算法在检索准确率和运算效率上都优于传统的LSA算法。 展开更多
关键词 文本检索 转移概率 奇异值分解 状态矩阵
在线阅读 下载PDF
潜在语义索引在文本分类中的应用 被引量:3
10
作者 伍建军 康耀红 《电脑与信息技术》 2006年第5期32-34,38,共4页
传统的文本分类都是根据文本的外在特征进行的,最常见的就是基于向量空间模型的方法,使用空间向量表示文本,通过相似度比较来确定分类。为了克服向量空间模型中的词条独立性假设,文章提出了一种基于潜在语义索引的文本分类模型,通过对... 传统的文本分类都是根据文本的外在特征进行的,最常见的就是基于向量空间模型的方法,使用空间向量表示文本,通过相似度比较来确定分类。为了克服向量空间模型中的词条独立性假设,文章提出了一种基于潜在语义索引的文本分类模型,通过对大量的文本集进行统计分析,揭示了词语的上下文使用含义,通过奇异值分解有效地降低了向量空间的维数,消除了同义词、多义词的影响,从而提高了文本分类的精度。 展开更多
关键词 潜在语义索引 文本分类 奇异值分解
在线阅读 下载PDF
基于LSI和自组织神经网络的高效文本聚类方法 被引量:7
11
作者 徐建锁 王正欧 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2004年第11期1026-1030,共5页
根据隐含语义索引(LSI)理论和动态自组织映射神经网络理论,提出了一种文本聚类的新方法.应用动态自组织映射神经网络来实现文本聚类,不必预先给定聚类个数,可以在任意合适的位置生成一个新的类,具有聚类灵活和精度高等特点,对于高维的... 根据隐含语义索引(LSI)理论和动态自组织映射神经网络理论,提出了一种文本聚类的新方法.应用动态自组织映射神经网络来实现文本聚类,不必预先给定聚类个数,可以在任意合适的位置生成一个新的类,具有聚类灵活和精度高等特点,对于高维的文本特征向量来说,聚类速度很低;该方法应用LSI理论来建立文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包含的"噪声"因素,从而更加突出了词和文本之间的语义关系.通过奇异值分解(SVD),有效地降低了向量空间的维数,克服了自组织神经网络的聚类缺陷,提高了文本聚类的精度和速度. 展开更多
关键词 文本聚类 隐含语义索引 奇异值分解 自组织神经网络 向量空间模型
在线阅读 下载PDF
LSI和kNN相结合的文本分类模型研究 被引量:3
12
作者 王天江 叶卫国 +1 位作者 卢正鼎 李永平 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第4期59-60,86,共3页
针对传统文本分类系统的不足 ,提出了一种基于隐含语义索引的kNN的文本分类模型 .该方法既充分利用了向量空间模型在表示方法上的巨大优势 ,又弥补了其忽略语义的不足 ,具备一定的理论和现实意义 .
关键词 文本分类 k最邻参照法 隐含语义索引 奇异值分解
在线阅读 下载PDF
结合改进主动学习的SVD-CNN弹幕文本分类算法 被引量:11
13
作者 邱宁佳 丛琳 +2 位作者 周思丞 王鹏 李岩芳 《计算机应用》 CSCD 北大核心 2019年第3期644-650,共7页
为解决传统卷积神经网络(CNN)模型使用池化层进行文本特征降维会损失较多文本语义信息的问题,提出一种基于奇异值分解(SVD)算法的卷积神经网络模型(SVD-CNN)。首先,采用改进的基于密度中心点采样的主动学习算法(DBC-AL)选择对分类模型... 为解决传统卷积神经网络(CNN)模型使用池化层进行文本特征降维会损失较多文本语义信息的问题,提出一种基于奇异值分解(SVD)算法的卷积神经网络模型(SVD-CNN)。首先,采用改进的基于密度中心点采样的主动学习算法(DBC-AL)选择对分类模型贡献率较高的样本进行标注,以低标注代价获得高质量模型训练集;然后,结合SVD算法建立SVD-CNN弹幕文本分类模型,使用奇异值分解的方法代替传统CNN模型池化层进行特征提取和降维,并在此基础上完成弹幕文本分类任务;最后,使用改进的梯度下降算法(PSGD)对模型参数进行优化。为了验证改进算法的有效性,使用多种弹幕数据样本集,对提出的模型与常用的文本分类模型进行对比实验。实验结果表明,改进的算法能够更好地保留文本语义特征,保证训练过程的稳定性并提高了模型的收敛速度,在不同的弹幕文本上较传统算法具有更好的分类性能。 展开更多
关键词 卷积神经网络 奇异值分解 主动学习 梯度下降 文本分类
在线阅读 下载PDF
一种新的英文文本检索算法 被引量:1
14
作者 高仕龙 《计算机工程与应用》 CSCD 北大核心 2010年第5期21-23,58,共4页
提出一种新的英文文本检索算法,该算法将英文文本映射为26阶频率矩阵,然后通过奇异值分解,对文本表示空间进行降维处理,并融合第一奇异值分量和第二奇异值分量的特征,得到既反映字母统计频率,又反映文本字符间顺序结构的复特征向量,最... 提出一种新的英文文本检索算法,该算法将英文文本映射为26阶频率矩阵,然后通过奇异值分解,对文本表示空间进行降维处理,并融合第一奇异值分量和第二奇异值分量的特征,得到既反映字母统计频率,又反映文本字符间顺序结构的复特征向量,最后利用向量间余弦相似度作为文本检索的相似度度量。数据对比表明,算法取得了较好的实验效果,且在检索准确率和运算效率上优于经典的LSA算法。 展开更多
关键词 文本检索 特征融合 频率矩阵 奇异值分解
在线阅读 下载PDF
改进的潜在语义分析中文摘录方法 被引量:8
15
作者 肖升 何炎祥 《计算机应用研究》 CSCD 北大核心 2012年第12期4507-4511,共5页
中文摘录是一种实现中文自动文摘的便捷方法,它根据摘录规则选取若干个原文句子直接组成摘要。通过优化输入矩阵和关键句子选取算法,提出了一种改进的潜在语义分析中文摘录方法。该方法首先基于向量空间模型构建多值输入矩阵;然后对输... 中文摘录是一种实现中文自动文摘的便捷方法,它根据摘录规则选取若干个原文句子直接组成摘要。通过优化输入矩阵和关键句子选取算法,提出了一种改进的潜在语义分析中文摘录方法。该方法首先基于向量空间模型构建多值输入矩阵;然后对输入矩阵进行潜在语义分析,并由此得出句子与潜在概念(主题信息的抽象表达)的语义相关度;最后借助改进的优选算法完成关键句子选取。实验结果显示,该方法准确率、召回率和F度量值的平均值分别为75.9%、71.8%和73.8%,与已有同类方法相比,改进后的方法实现了全程无监督且在整体效率上有较大提升,更具应用潜质。 展开更多
关键词 自动文摘 自动摘录 潜在语义分析 奇异值分解 潜在概念
在线阅读 下载PDF
PACS中诊断文本的SVD聚类研究
16
作者 陈戏墨 谢铉洋 +2 位作者 李志铭 李曦 李扬彬 《医学信息(西安上半月)》 2005年第12期1612-1614,共3页
本文研究了PACS中诊断文本的聚类问题。对诊断文本通过词频矩阵建立向量空间模型,在保持文本向量余弦相似度不变的前提下,采用奇异值分解对空间降维,以减少空间的占用和计算时间,最后利用层次聚类算法得到各种常见病变的诊断文本聚类结... 本文研究了PACS中诊断文本的聚类问题。对诊断文本通过词频矩阵建立向量空间模型,在保持文本向量余弦相似度不变的前提下,采用奇异值分解对空间降维,以减少空间的占用和计算时间,最后利用层次聚类算法得到各种常见病变的诊断文本聚类结果。最后从实践角度讨论诊断文本聚类需要考虑的因素。 展开更多
关键词 诊断文本 聚类 奇异值分解 PACS
暂未订购
一种大容量文本集的智能检索方法
17
作者 金小峰 《计算机工程与应用》 CSCD 北大核心 2011年第7期143-145,158,共4页
分析了潜在语义模型,研究了潜在语义空间中文本的表示方法,提出了一种大容量文本集的检索策略。检索过程由粗粒度非相关剔除和相关文本的精确检索两个步骤组成。使用潜在语义空间模型对文本集进行初步的筛选,剔除非相关文本;使用大规模... 分析了潜在语义模型,研究了潜在语义空间中文本的表示方法,提出了一种大容量文本集的检索策略。检索过程由粗粒度非相关剔除和相关文本的精确检索两个步骤组成。使用潜在语义空间模型对文本集进行初步的筛选,剔除非相关文本;使用大规模文本检索方法对相关文本在段落一级进行精确检索,其中为了提高检索的执行效率,在检索算法中引入了遗传算法;输出这些候选的段落序号。实验结果证明了这种方法的有效性和高效性。 展开更多
关键词 向量空间模型 潜在语义索引 奇异值分解 文本信息检索
在线阅读 下载PDF
应用潜在语义分析,探析认知科学 被引量:3
18
作者 杨守捷 刘曼华 《天津大学学报(社会科学版)》 2001年第3期238-244,共7页
潜在语义分析是美国 2 0世纪 90年代发展起来的一种信息提取技术。文章对其原理和结构进行了分析 ,并对其在认知科学的应用 ,主要集中在文本理解和人类如何获取知识、归纳知识和表述知识方面进行了探讨 。
关键词 潜在语义分析 奇异值分解 认知科学 文本理解 语义空间 询问 知识 归纳 应用 LSA模式
在线阅读 下载PDF
基于语义空间的支持向量机的文本过滤 被引量:3
19
作者 沈丽虹 周昌乐 《计算机应用》 CSCD 北大核心 2005年第3期664-665,共2页
传统的基于支持向量机的文本过滤,用向量空间模型来表示文本和用户模板,向量空间模型假设特征项之间是线性无关的,该假设引入了许多因具体用词变化不定而带来的词汇噪音信息,影响了基于支持向量机的文本过滤的过滤性能。提出基于语义空... 传统的基于支持向量机的文本过滤,用向量空间模型来表示文本和用户模板,向量空间模型假设特征项之间是线性无关的,该假设引入了许多因具体用词变化不定而带来的词汇噪音信息,影响了基于支持向量机的文本过滤的过滤性能。提出基于语义空间的支持向量机的文本过滤,用语义来表示文本和用户模板。该方法主要通过奇异值分解提取文本的潜在语义空间,在语义空间上训练支持向量机得到用户模板和过滤阈值,文本流上的文本映射到语义空间上,在语义空间上计算用户模板和新文本的相似度。实验表明:该方法的过滤性能可以达到 98. 67%。 展开更多
关键词 文本过滤 奇异值分解 支持向量机 语义空间
在线阅读 下载PDF
基于改进的潜在语义分析的文本聚类 被引量:5
20
作者 宋涛 施水才 +1 位作者 房祥 吕学强 《北京信息科技大学学报(自然科学版)》 2012年第3期21-25,共5页
文本聚类中不同文本表示方法获得的聚类效果不尽相同。引入潜在语义分析模型对文本进行表示,重新给出了针对潜在语义分析的特征权重计算方法,并提出了截断奇异值分解中K值的选取方法,达到了"词-文本"空间的降维去噪目的。鉴于... 文本聚类中不同文本表示方法获得的聚类效果不尽相同。引入潜在语义分析模型对文本进行表示,重新给出了针对潜在语义分析的特征权重计算方法,并提出了截断奇异值分解中K值的选取方法,达到了"词-文本"空间的降维去噪目的。鉴于K-means算法中初始聚类中心选取具有一定的随机性,应用相似性初始聚类中心选取方法确定了K-means的初始聚类中心,避免了随机选取聚类中心对聚类效果的影响。基于改进的潜在语义分析方法极大的降低了文本空间的维度,经实验证明改进后的方法在聚类问题中聚类效果显著。 展开更多
关键词 潜在语义分析 权重计算 奇异值分解 K-MEANS 文本聚类
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部