期刊文献+
共找到106篇文章
< 1 2 6 >
每页显示 20 50 100
基于二语习得的汉/韩语路径概念表征及编码差异
1
作者 黄玉花 于兆敏 《汉语学习》 北大核心 2025年第5期64-73,共10页
汉语和韩语路径概念表征及编码上的差异对韩语母语者的汉语路径表达产生较大影响。汉/韩语在内移轨迹、外移主体及背景、指向等路径概念表征上的差异常引发汉语习得者对路径动词的易混淆偏误。与汉语显性路径附加语相比韩语的显性/隐性... 汉语和韩语路径概念表征及编码上的差异对韩语母语者的汉语路径表达产生较大影响。汉/韩语在内移轨迹、外移主体及背景、指向等路径概念表征上的差异常引发汉语习得者对路径动词的易混淆偏误。与汉语显性路径附加语相比韩语的显性/隐性编码,与汉语矢量路径编码的前位式/后位式相比韩语的前位式语序编码,这种跨语言差异常使汉语习得者出现光杆动词的泛化使用、路径动词缺失及动趋式与处所名词的组配偏误。 展开更多
关键词 路径概念表征 附加语编码 矢量路径编码 跨语言差异
原文传递
基于时间加权和AdaBoost集成的动态多因子选股模型 被引量:1
2
作者 杨园园 鲁统宇 +1 位作者 任婷婷 许文甫 《系统工程》 北大核心 2025年第1期124-135,共12页
本文重点研究了如何有效地构建动态的量化选股模型。考虑到股票数据中存在的概念漂移现象,构建一种基于时间加权和AdaBoost支持向量机集成的动态选股模型——ADASVM-TW^(*)。该模型通过将时间权重嵌入ADASVM中,根据样本的新旧以及是否... 本文重点研究了如何有效地构建动态的量化选股模型。考虑到股票数据中存在的概念漂移现象,构建一种基于时间加权和AdaBoost支持向量机集成的动态选股模型——ADASVM-TW^(*)。该模型通过将时间权重嵌入ADASVM中,根据样本的新旧以及是否错分更新样本权重。考虑到因子的时变性,采用随机森林算法进行动态因子选择。以2011年至2020年上证50各成分股为研究对象进行实证研究。研究发现,ADASVM-TW^(*)模型的平均准确率和平均精度分别达到了53.24%和56.10%,基于预测结果构建的投资组合实现了29.86%的年化收益率,远高于其他投资组合和基准,并且该模型同时通过了显著性检验和稳健性检验。 展开更多
关键词 动态选股 概念漂移 ADABOOST 支持向量机 集成算法
原文传递
基于布尔矩阵的补背景概念获取
3
作者 石慧 钱婷 侯亚红 《纯粹数学与应用数学》 2025年第1期106-113,共8页
形式概念分析是知识表示和知识发现的一个重要方法,已被广泛应用到很多领域.本文将布尔逻辑运算引入形式概念分析之中,定义了向量间的反蕴含运算,构造出布尔形式背景中的补运算,分析其性质,并依据该运算定义布尔补背景概念.其次,给出布... 形式概念分析是知识表示和知识发现的一个重要方法,已被广泛应用到很多领域.本文将布尔逻辑运算引入形式概念分析之中,定义了向量间的反蕴含运算,构造出布尔形式背景中的补运算,分析其性质,并依据该运算定义布尔补背景概念.其次,给出布尔补背景概念获取的等价定理,即利用布尔矩阵中向量的交运算得到表示共同不具有语义的布尔补背景概念.最后,依据对象(属性)集与布尔列(行)向量间的等价关系得到全部补背景概念,进而构造出补背景概念格. 展开更多
关键词 布尔向量 布尔矩阵 形式背景 补背景概念格
在线阅读 下载PDF
Hybrid Chinese Information Retrieval Model Based on the Combination of Keyword and Concept 被引量:2
4
作者 樊孝忠 李宏乔 李良富 《Journal of Beijing Institute of Technology》 EI CAS 2003年第S1期120-123,共4页
A hybrid model that is based on the Combination of keywords and concept was put forward. The hybrid model is built on vector space model and probabilistic reasoning network. It not only can exert the advantages of key... A hybrid model that is based on the Combination of keywords and concept was put forward. The hybrid model is built on vector space model and probabilistic reasoning network. It not only can exert the advantages of keywords retrieval and concept retrieval but also can compensate for their shortcomings. Their parameters can be adjusted according to different usage in order to accept the best information retrieval result, and it has been proved by our experiments. 展开更多
关键词 hybrid information retrieval model concept retrieval vector space model probabilistic reasoning network
在线阅读 下载PDF
Optimized Modeling Method for Unbalanced Data in High-Level Visual Semantic Concept Classification
5
作者 谭励 曹元大 +1 位作者 杨明华 贺巧艳 《Journal of Beijing Institute of Technology》 EI CAS 2009年第2期186-191,共6页
To solve the unbalanced data problems of learning models for semantic concepts, an optimized modeling method based on the posterior probability support vector machine (PPSVM) is presented. A neighborbased posterior ... To solve the unbalanced data problems of learning models for semantic concepts, an optimized modeling method based on the posterior probability support vector machine (PPSVM) is presented. A neighborbased posterior probability estimator for visual concepts is provided. The proposed method has been applied in a high-level visual semantic concept classification system and the experiment results show that it results in enhanced performance over the baseline SVM models, as well as in improved robustness with respect to high-level visual semantic concept classification. 展开更多
关键词 visual concept modeling posterior probability support vector machine unbalanced data
在线阅读 下载PDF
基于聚类分析策略的用户偏好挖掘 被引量:8
6
作者 刘远超 王晓龙 +1 位作者 刘秉权 钟彬彬 《计算机应用研究》 CSCD 北大核心 2005年第12期21-23,共3页
利用训练文档集准确高效地挖掘隐藏的用户文本偏好和概念向量是文本信息过滤和多文档自动文摘等自然语言处理应用的关键技术之一。针对训练文本集中往往存在多个主题类别的问题,提出一种基于聚类分析策略的文本偏好挖掘方法。其基本思... 利用训练文档集准确高效地挖掘隐藏的用户文本偏好和概念向量是文本信息过滤和多文档自动文摘等自然语言处理应用的关键技术之一。针对训练文本集中往往存在多个主题类别的问题,提出一种基于聚类分析策略的文本偏好挖掘方法。其基本思路是对训练文档集进行聚类处理,然后对同主题文档进行共性分析,并经过特征权值调整和特征约简,获得表示用户不同主题偏好的概念向量。实验结果表明该方法具有对用户的文本偏好刻画更加精确,对相关阈值变化不敏感等优点,可以与Rocchio等算法结合来进行用户兴趣建模。 展开更多
关键词 偏好挖掘:文档聚类 概念向量 Rocchio算法
在线阅读 下载PDF
概念向量文本聚类算法 被引量:11
7
作者 白秋产 金春霞 周海岩 《计算机工程与应用》 CSCD 北大核心 2011年第35期155-157,209,共4页
为了解决基于传统关键词的文本聚类算法没有考虑特征关键词之间的相关性,而导致文本向量概念表达不够准确,提出基于概念向量的文本聚类算法TCBCV(Text Clustering Based on Concept Vector),采用HowNet的概念属性,并利用语义场密度和义... 为了解决基于传统关键词的文本聚类算法没有考虑特征关键词之间的相关性,而导致文本向量概念表达不够准确,提出基于概念向量的文本聚类算法TCBCV(Text Clustering Based on Concept Vector),采用HowNet的概念属性,并利用语义场密度和义原在概念树的权值选取合适的义原作为关键词的概念,实现关键词到概念的映射,不仅增加了文本之间的语义关系,而且降低了向量维度,将其应用于文本聚类,能够提高文本聚类效果。实验结果表明,该算法在文本聚类的准确率和召回率上都得到了较大的提高。 展开更多
关键词 知网 概念语义场 义原抽取 概念向量 文本聚类
在线阅读 下载PDF
基于WordNet概念向量空间模型的文本分类 被引量:16
8
作者 张剑 李春平 《计算机工程与应用》 CSCD 北大核心 2006年第4期174-178,共5页
文章提出了一种文本特征提取方法,以WordNet语言本体库为基础,以同义词集合概念代替词条,同时考虑同义词集合间的上下位关系,建立文本的概念向量空间模型作为文本特征向量,使得在训练过程中能够提取出代表类别的高层次信息。实验结果表... 文章提出了一种文本特征提取方法,以WordNet语言本体库为基础,以同义词集合概念代替词条,同时考虑同义词集合间的上下位关系,建立文本的概念向量空间模型作为文本特征向量,使得在训练过程中能够提取出代表类别的高层次信息。实验结果表明,当训练文本集合很小时,方法能够较大地提高文本的分类准确率。 展开更多
关键词 文本自动分类 WORDNET 概念向量 向量空间模型
在线阅读 下载PDF
基于概念统计和语义层次分析的英文自动文摘研究 被引量:9
9
作者 季姮 罗振声 +1 位作者 万敏 高小云 《中文信息学报》 CSCD 北大核心 2003年第2期14-20,共7页
传统的自动文摘方法基于词语统计抽取文摘句 ,未进行文本的语义分析 ,导致文摘精度不高。为了克服传统方法的缺点 ,本文提出了一种基于主题概念的自动文摘方法 ,以概念统计和层次分析为基础设计并实现了一个英文自动文摘系统。系统利用W... 传统的自动文摘方法基于词语统计抽取文摘句 ,未进行文本的语义分析 ,导致文摘精度不高。为了克服传统方法的缺点 ,本文提出了一种基于主题概念的自动文摘方法 ,以概念统计和层次分析为基础设计并实现了一个英文自动文摘系统。系统利用WordNet以概念统计代替传统的词频统计 ,基于主题概念构建向量空间模型 ,计算句子重要度。并且根据主题概念在概念层次树上的分布进行文本结构分析划分意义块 ,以意义块为单元抽取文摘 ,初步解决了多主题文章的文摘结构不平衡问题。本文主要介绍了概念层次树的构造 ,主题概念的抽取步骤 ,基于主题概念的句子重要度的计算和意义块的划分算法。测试表明 ,通过概念统计和语义层次分析的方法 ,我们设计了更理想的向量空间模型 ,系统生成的文摘精度较高 。 展开更多
关键词 计算机应用 中文信息处理 概念统计 主题概念 向量空间模型 句子重要度 意义块划分
在线阅读 下载PDF
一种基于本体的文本聚类方法 被引量:12
10
作者 朱会峰 左万利 +2 位作者 赫枫龄 彭涛 纪文彦 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2010年第2期277-283,共7页
基于本体的文本聚类方法,在文本表示上引入WordNet,并定义了关键概念集,使用WordNet中的概念节点及概念间的语义关系减少文本特征向量维数,提高聚类效果.聚类过程中,算法使用文本的关键概念集和概念特征向量计算文本相似度,利用文本的... 基于本体的文本聚类方法,在文本表示上引入WordNet,并定义了关键概念集,使用WordNet中的概念节点及概念间的语义关系减少文本特征向量维数,提高聚类效果.聚类过程中,算法使用文本的关键概念集和概念特征向量计算文本相似度,利用文本的关键概念集标注聚簇为聚类结果中的各个簇提供解释.实验结果表明,该方法有效地减少了文本特征向量的维数,提高了文本聚类效果以及聚类结果的可解释性. 展开更多
关键词 本体 WORDNET 关键概念集 概念特征向量
在线阅读 下载PDF
基于概念统计的英文自动文摘研究 被引量:9
11
作者 万敏 罗振声 +1 位作者 季姮 高小云 《计算机工程与应用》 CSCD 北大核心 2002年第24期7-9,16,共4页
文章提出了一种基于概念统计和语义层次分析的自动文摘方法,并以此实现了一个英文自动文摘系统。系统利用WordNet对英文文章进行词语分析,用概念统计的方法选取文章的主题概念,以此构建向量空间模型;并根据主题概念在概念层次树上的分... 文章提出了一种基于概念统计和语义层次分析的自动文摘方法,并以此实现了一个英文自动文摘系统。系统利用WordNet对英文文章进行词语分析,用概念统计的方法选取文章的主题概念,以此构建向量空间模型;并根据主题概念在概念层次树上的分布划分意义块,以意义块为单位抽取文摘,初步解决多主题文章的文摘结构不平衡问题。该文主要介绍概念层次树的构造,主题概念的抽取步骤,句子重要度的计算和意义块的划分算法。测试表明该文提到的方法比传统的基于词频统计的方法有更高的召回率与精确率。 展开更多
关键词 概念统计 英文自动文摘 主题概念 向量空间模型 句子重要度 计算机
在线阅读 下载PDF
基于SUMO和WordNet本体集成的文本分类模型研究 被引量:8
12
作者 胡泽文 王效岳 白如江 《现代图书情报技术》 CSSCI 北大核心 2011年第1期31-38,共8页
针对传统文本分类方法和目前语义分类方法中存在的问题,提出基于SUMO和W ordNet本体集成的文本分类模型,该模型利用W ordNet同义词集与SUMO本体概念之间的映射关系,将文档-词向量空间中的词条映射成本体中相应的概念,形成文档-概念向量... 针对传统文本分类方法和目前语义分类方法中存在的问题,提出基于SUMO和W ordNet本体集成的文本分类模型,该模型利用W ordNet同义词集与SUMO本体概念之间的映射关系,将文档-词向量空间中的词条映射成本体中相应的概念,形成文档-概念向量空间进行文本自动分类。实验表明,该方法能够极大降低向量空间维度,提高文本分类性能。 展开更多
关键词 SUMO本体 WORDNET 本体集成 文本分类模型 词向量空间 概念向量空间
原文传递
基于概念扩充的文本过滤模型 被引量:9
13
作者 尤文建 李绍滋 李堂秋 《计算机工程与应用》 CSCD 北大核心 2003年第25期74-77,共4页
该文在介绍文本过滤的背景及向量空间模型的同时,提出了基于语义词典对用户模板进行扩充的文本过滤模型,该模型首先对文本进行分析,把文本表示成向量空间中的向量形式,在形成用户初始模板之后,对用户模板进行同义词扩充,形成扩充后的用... 该文在介绍文本过滤的背景及向量空间模型的同时,提出了基于语义词典对用户模板进行扩充的文本过滤模型,该模型首先对文本进行分析,把文本表示成向量空间中的向量形式,在形成用户初始模板之后,对用户模板进行同义词扩充,形成扩充后的用户模板,以此模板来进行文本过滤。在用户反馈的基础上,自适应地修改该模板,以适应用户变化的需求及改善系统过滤性能。实验表明,这样的确可以提高系统覆盖面,提高系统效率。 展开更多
关键词 概念扩充 向量空间 用户模板 文本表示 WORDNET
在线阅读 下载PDF
基于中文维基百科的词语语义相关度计算 被引量:9
14
作者 万富强 吴云芳 《中文信息学报》 CSCD 北大核心 2013年第6期31-37,109,共8页
语义相关度计算在信息检索、词义消歧、自动文摘、拼写校正等自然语言处理中均扮演着重要的角色。该文采用基于维基百科的显性语义分析方法计算汉语词语之间的语义相关度。基于中文维基百科,将词表示为带权重的概念向量,进而将词之间相... 语义相关度计算在信息检索、词义消歧、自动文摘、拼写校正等自然语言处理中均扮演着重要的角色。该文采用基于维基百科的显性语义分析方法计算汉语词语之间的语义相关度。基于中文维基百科,将词表示为带权重的概念向量,进而将词之间相关度的计算转化为相应的概念向量的比较。进一步,引入页面的先验概率,利用维基百科页面之间的链接信息对概念向量各分量的值进行修正。实验结果表明,使用该方法计算汉语语义相关度,与人工标注标准的斯皮尔曼等级相关系数可以达到0.52,显著改善了相关度计算的结果。 展开更多
关键词 语义相关度 显性语义分析 中文维基百科 先验概率 概念向量
在线阅读 下载PDF
个性化搜索引擎研究 被引量:14
15
作者 左雄辉 糜麒 《计算机工程与应用》 CSCD 北大核心 2005年第17期190-192,共3页
Internet上存在大量的信息资源,如何从中获取有价值的信息一直以来是一个问题。论文在传统搜索引擎的基础上,采用Web挖掘技术,引用概念格知识,提出了个性化搜索引擎。文中分析了个性化搜索引擎的系统构成,详细介绍了每个模块的功能,最... Internet上存在大量的信息资源,如何从中获取有价值的信息一直以来是一个问题。论文在传统搜索引擎的基础上,采用Web挖掘技术,引用概念格知识,提出了个性化搜索引擎。文中分析了个性化搜索引擎的系统构成,详细介绍了每个模块的功能,最后展望了它的发展前景。 展开更多
关键词 WEB挖掘 概念格 向量空间模型 个性化
在线阅读 下载PDF
基于两层向量空间模型和模糊FCA本体学习方法 被引量:13
16
作者 邢军 韩敏 《计算机研究与发展》 EI CSCD 北大核心 2009年第3期443-451,共9页
本体是WWW进化为语义Web版本的瓶颈,手工构造本体费时费力,本体学习技术使得在文本中自动构造本体成为可能,但存在通用性差和准确性低等问题.提出以面向对象思想的分析方法为基础,把传统的单层文本向量空间模型(VSM)改进为2层向量空间模... 本体是WWW进化为语义Web版本的瓶颈,手工构造本体费时费力,本体学习技术使得在文本中自动构造本体成为可能,但存在通用性差和准确性低等问题.提出以面向对象思想的分析方法为基础,把传统的单层文本向量空间模型(VSM)改进为2层向量空间模型(double vector space model,D-VSM),该模型不仅具有属性特性,而且还具有很强的关系特性.在此模型的基础上,引入模糊形式概念分析(fuzzy formal concept analysis,FFCA)本体学习技术.该技术充分考虑D-VSM模型中的数据分布特点,较好地解决本体学习通用性、本体关系获取等问题.基于上述方法实现一个本体学习工具,为本体的(半)自动构造提供有力的支持. 展开更多
关键词 本体学习 模糊形式概念分析 向量空间模型 本体关系 本体概念
在线阅读 下载PDF
基于子主题区域划分的多文档自动文摘方法 被引量:1
17
作者 王萌 徐超 +1 位作者 李春贵 何婷婷 《计算机工程》 CAS CSCD 北大核心 2011年第12期158-160,163,共4页
为解决词频矩阵的词频维数过大和矩阵过于稀疏的问题,提出一种子主题区域划分的多文档自动文摘方法。使用知网进行概念获取,建立概念向量空间模型,代替传统的词频向量空间模型。在概念向量空间模型的基础上,利用一种改进的层次分割法对... 为解决词频矩阵的词频维数过大和矩阵过于稀疏的问题,提出一种子主题区域划分的多文档自动文摘方法。使用知网进行概念获取,建立概念向量空间模型,代替传统的词频向量空间模型。在概念向量空间模型的基础上,利用一种改进的层次分割法对文档集合进行子主题划分,从各个子主题中抽取出满足一定数量的句子作为文摘。实验结果验证了该方法的有效性。 展开更多
关键词 子主题区域 自动文摘 知网 概念向量空间模型
在线阅读 下载PDF
利用概念-权向量组匹配算法的Ontology搜索精化 被引量:1
18
作者 高明霞 刘椿年 陈福荣 《计算机工程》 CAS CSCD 北大核心 2006年第8期195-197,共3页
提出了概念-权向量组匹配算法。该算法对输入信息和待评估Ontology进行语义分析,生成对应的概念-权向量组,利用概念-权向量组的匹配结果生成作为过滤和排序依据的结果向量。并利用该算法开发了Ontology搜索引擎——WI OntoSearch。
关键词 Ontology搜索 概念权向量 概念 权向量组
在线阅读 下载PDF
概念推理网及其在文本分类中的应用 被引量:57
19
作者 李晓黎 刘继敏 史忠植 《计算机研究与发展》 EI CSCD 北大核心 2000年第9期1032-1038,共7页
在分析了当前文本分类中常用方法的基础上 ,提出了一种新的分类模型 .该模型是对人的分类过程的一种模拟 .在已有的英语语义词典及大量训练集的基础上 ,应用机器学习、数据挖掘等技术进行知识获取并最终形成若干个概念推理网 .对待分类... 在分析了当前文本分类中常用方法的基础上 ,提出了一种新的分类模型 .该模型是对人的分类过程的一种模拟 .在已有的英语语义词典及大量训练集的基础上 ,应用机器学习、数据挖掘等技术进行知识获取并最终形成若干个概念推理网 .对待分类的文档可以激活相应的网络 ,同时传播推理以决定其类别的归属 ,试验表明 :该方法具有较高的分类正确率与召回率 . 展开更多
关键词 文本分类 向量空间模型 概念推理网 机器学习
在线阅读 下载PDF
基于共享矢量链的多任务概念漂移分类方法 被引量:3
20
作者 史荧中 邓赵红 +1 位作者 钱鹏江 王士同 《控制与决策》 EI CSCD 北大核心 2018年第7期1215-1222,共8页
增强型时间自适应支持向量机在针对单一概念漂移问题时展现出了良好效果,但是无法协同求解多个概念漂移问题.然而,在很多应用场景中,有时会包含数个具有内在相关性的非静态数据集,它们各自的分类模型应充分考虑这种关联.为了反映出各概... 增强型时间自适应支持向量机在针对单一概念漂移问题时展现出了良好效果,但是无法协同求解多个概念漂移问题.然而,在很多应用场景中,有时会包含数个具有内在相关性的非静态数据集,它们各自的分类模型应充分考虑这种关联.为了反映出各概念漂移分类模型之间的相关部分,提出共享矢量链的概念,并开发面向多任务概念漂移问题的共享矢量链支持向量机(SVC-SVM).在模拟数据集及气体传感器阵列漂移数据集上的实验结果显示,协同求解多个具有相关性的概念漂移问题能够有效提升各自的泛化能力. 展开更多
关键词 多任务 概念漂移 支持向量机 共享矢量链
原文传递
上一页 1 2 6 下一页 到第
使用帮助 返回顶部