期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于String Kernel和KPCA的负实例语法特征提取算法
1
作者 吕威 林文昶 +1 位作者 姚正安 李磊 《计算机工程与应用》 CSCD 北大核心 2009年第20期136-139,共4页
提出通过String Kernel方法把负实例语法数据库中的负实例转化成核矩阵,再用Kernel Principal Component Analysis(KPCA)对转换的核矩阵进行特征提取,进而可将原始负实例数据库按照这些特征分成多个容量较小的特征表。通过构造负实例特... 提出通过String Kernel方法把负实例语法数据库中的负实例转化成核矩阵,再用Kernel Principal Component Analysis(KPCA)对转换的核矩阵进行特征提取,进而可将原始负实例数据库按照这些特征分成多个容量较小的特征表。通过构造负实例特征索引表设计了一个分类器,待检查的句子通过此分类器被分配到某个负实例特征表里进行匹配搜索,而此特征表的特征属性数和记录数要远远小于原始负实例数据库中的相应数目,从而大大提高了检查的速度,同时不影响语法检查的精度。通过比较测试,可看出提出的方法在保证语法检查精确度的同时有更快的速度。 展开更多
关键词 string kernel 核主成分分析 负实例 特征提取
在线阅读 下载PDF
Identification of MicroRNA Precursors with Support Vector Machine and String Kernel 被引量:1
2
作者 Jian-Hua Xu Fei Li Qiu-Feng Sun 《Genomics, Proteomics & Bioinformatics》 SCIE CAS CSCD 2008年第2期121-128,共8页
MicroRNAs (miRNAs) are one family of short (21-23 nt) regulatory non-coding RNAs processed from long (70-110 nt) miRNA precursors (pre-miRNAs). Identifying true and false precursors plays an important role in ... MicroRNAs (miRNAs) are one family of short (21-23 nt) regulatory non-coding RNAs processed from long (70-110 nt) miRNA precursors (pre-miRNAs). Identifying true and false precursors plays an important role in computational identification of miRNAs. Some numerical features have been extracted from precursor sequences and their secondary structures to suit some classification methods; however, they may lose some usefully discriminative information hidden in sequences and structures. In this study, pre-miRNA sequences and their secondary structures are directly used to construct an exponential kernel based on weighted Levenshtein distance between two sequences. This string kernel is then combined with support vector machine (SVM) for detecting true and false pre-miRNAs. Based on 331 training samples of true and false human pre-miRNAs, 2 key parameters in SVM are selected by 5-fold cross validation and grid search, and 5 realizations with different 5-fold partitions are executed. Among 16 independent test sets from 3 human, 8 animal, 2 plant, 1 virus, and 2 artificially false human pre-miRNAs, our method statistically outperforms the previous SVM-based technique on 11 sets, including 3 human, 7 animal, and 1 false human pre-miRNAs. In particular, premiRNAs with multiple loops that were usually excluded in the previous work are correctly identified in this study with an accuracy of 92.66%. 展开更多
关键词 string kernel support vector machine MICRORNA PRECURSOR weighted Levenshteindistance
在线阅读 下载PDF
On Using Physico-Chemical Properties of Amino Acids in String Kernels for Protein Classification via Support Vector Machines
3
作者 LI Limin AOKI-KINOSHITA Kiyoko F +1 位作者 CHING Wai-Ki JIANG Hao 《Journal of Systems Science & Complexity》 SCIE EI CSCD 2015年第2期504-516,共13页
String kernels are popular tools for analyzing protein sequence data and they have been successfully applied to many computational biology problems. The traditional string kernels assume that different substrings are ... String kernels are popular tools for analyzing protein sequence data and they have been successfully applied to many computational biology problems. The traditional string kernels assume that different substrings are independent. However, substrings can be highly correlated due to their substructure relationship or common physico-chemical properties. This paper proposes two kinds of weighted spectrum kernels: The correlation spectrum kernel and the AA spectrum kernel. We evMuate their performances by predicting glycan-binding proteins of 12 glycans. The results show that the correlation spectrum kernel and the AA spectrum kernel perform significantly better than the spectrum kernel for nearly all the 12 glycans. By comparing the predictive power of AA spectrum kernels constructed by different physico-chemical properties, the authors can also identify the physico- chemical properties which contributes the most to the glycan-protein binding. The results indicate that physico-chemical properties of amino acids in proteins play an important role in the mechanism of glycamprotein binding. 展开更多
关键词 AAindex AA spectrum kernel correlation spectrum kernel physico-chemical properties string kernel weighted spectrum kernel.
原文传递
String核负实例语法特征提取算法
4
作者 吕威 林文昶 李磊 《计算机工程》 CAS CSCD 北大核心 2009年第23期12-14,共3页
通过String核方法把语法数据库中的负实例转化成核矩阵,采用Kmeans聚类算法对核矩阵进行聚类,将原始负实例数据库分成多个容量较小的特征数据表,使大规模O(n3)核矩阵转换为n/s×O(s3)(s<<n)矩阵,以减少运算量。分析语法检查... 通过String核方法把语法数据库中的负实例转化成核矩阵,采用Kmeans聚类算法对核矩阵进行聚类,将原始负实例数据库分成多个容量较小的特征数据表,使大规模O(n3)核矩阵转换为n/s×O(s3)(s<<n)矩阵,以减少运算量。分析语法检查精度随Kmeans聚类参数的变化规律。实验结果表明,该算法在不降低语法检查精度的前提下提高了语法检查速度。 展开更多
关键词 Kmeans方法 聚类 string 负实例 特征提取
在线阅读 下载PDF
基于IAOA-KELM的储气库注采管柱内腐蚀速率预测 被引量:4
5
作者 骆正山 于瑶如 +1 位作者 骆济豪 王小完 《安全与环境学报》 CAS CSCD 北大核心 2024年第3期971-977,共7页
针对储气库注采管柱的内腐蚀速率预测问题,建立了基于阿基米德优化算法(Archimedes Optimization Algorithm,AOA)与核极限学习机(Kernel Extreme Learning Machine,KELM)相结合的模型提高腐蚀速率预测精度。通过引入佳点集、改进密度降... 针对储气库注采管柱的内腐蚀速率预测问题,建立了基于阿基米德优化算法(Archimedes Optimization Algorithm,AOA)与核极限学习机(Kernel Extreme Learning Machine,KELM)相结合的模型提高腐蚀速率预测精度。通过引入佳点集、改进密度降低因子、采用黄金正弦算法缩小搜索空间,提高局部开发能力,利用改进阿基米德优化算法(Improved Archimedes Optimization Algorithm,IAOA)优化KELM正则化系数(C)和核函数参数(γ),进而建立IAOA-KELM储气库注采管柱内腐蚀速率预测模型;使用MATLAB软件运用该模型对某注采管柱内腐蚀数据集进行学习与预测,将IAOA-KELM模型与KELM、粒子群优化算法(Particle Swarm Optimization,PSO)-KELM、AOA-KELM结果进行预测误差对比。结果表明,IAOA-KELM模型的预测值与实际值较为拟合,其E RMSE为0.65%,E MAE为0.39%,R 2为99.83%,均优于其他模型。研究表明,IAOA-KELM模型能够更为准确地预测储气库注采管柱内腐蚀速率,为储气库注采管柱的运维及储气库的健康管理提供参考。 展开更多
关键词 安全工程 地下储气库 注采管柱 核极限学习机 改进阿基米德优化算法 腐蚀速率
原文传递
基于后缀树词序列核挖掘Web文档 被引量:2
6
作者 傅鹏 张德运 +1 位作者 陈海诠 董皓 《微电子学与计算机》 CSCD 北大核心 2005年第12期4-7,共4页
通过将文档表示为一棵后缀树,文章提出一种基于后缀树索引计算文档相似度的词序列核。首先根据文档的词序列构造出后缀树,然后根据后缀树词序列核计算文档间的相似度,最后利用支持向量机对文档进行分类。理论分析表明后缀树词序列核的... 通过将文档表示为一棵后缀树,文章提出一种基于后缀树索引计算文档相似度的词序列核。首先根据文档的词序列构造出后缀树,然后根据后缀树词序列核计算文档间的相似度,最后利用支持向量机对文档进行分类。理论分析表明后缀树词序列核的计算只与比较文档的长度成线性关系,大大减少了序列核的计算时间。在reuters-21578文档集上将后缀树词序列核与词序列核、多项式核进行比较,实验结果表明在改善速度的同时,后缀树词序列核可达到与词序列核相当的性能,优于多项式核,更适于Web文档挖掘等应用。 展开更多
关键词 核学习方法 词序列核 字符串核 后缀树 WEB挖掘
在线阅读 下载PDF
基于串核的音乐分类研究 被引量:1
7
作者 杨圣云 赖国明 袁德辉 《计算机工程与应用》 CSCD 北大核心 2008年第16期243-245,共3页
给出了一种新的映射音乐到Rn空间的方法和基于串核的音乐风格分类法。首先利用统计方法分析大量音乐的旋律轮廓线得到合适的编码模式,用它把旋律轮廓线编码为有限字母表(8个字母)的字符串。利用连续子串嵌入法把音乐串显式映射到高维Rn... 给出了一种新的映射音乐到Rn空间的方法和基于串核的音乐风格分类法。首先利用统计方法分析大量音乐的旋律轮廓线得到合适的编码模式,用它把旋律轮廓线编码为有限字母表(8个字母)的字符串。利用连续子串嵌入法把音乐串显式映射到高维Rn空间,并用核表示这一映射。通过用基于核的SVM分类算法和ROC评价方法,比较了3个不同串核在5组音乐数据集上的分类性能。 展开更多
关键词 音乐风格 旋律轮廓线 串核 核方法 ROC 核向量机
在线阅读 下载PDF
一种面向间隙核函数的快速算法 被引量:1
8
作者 尹传环 田盛丰 牟少敏 《电子学报》 EI CAS CSCD 北大核心 2007年第5期875-881,共7页
间隙核是一种应用非常广泛的字符串核,在文本分类和蛋白质分类中都取得了很好的效果.本文提出了一种应用在入侵检测领域的间隙核,称为长度加权核.并且提出了一种基于后缀核的动态规划算法,能够有效计算变长度加权核.另外,本文提出了一... 间隙核是一种应用非常广泛的字符串核,在文本分类和蛋白质分类中都取得了很好的效果.本文提出了一种应用在入侵检测领域的间隙核,称为长度加权核.并且提出了一种基于后缀核的动态规划算法,能够有效计算变长度加权核.另外,本文提出了一种位并行算法,能够加速定长度加权核的计算.实验表明在满足位并行的条件下这种快速算法比现有的几种计算间隙核的算法更为快速,而且应用在入侵检测中能够取得较好的效果. 展开更多
关键词 核方法 字符串核 间隙核 位并行
在线阅读 下载PDF
模糊匹配在树到串翻译模型中的应用 被引量:1
9
作者 熊皓 刘洋 刘群 《中文信息学报》 CSCD 北大核心 2011年第2期66-71,共6页
在传统的基于树的翻译模型中,一般都是将一条规则视为字符串,然后使用字符串匹配技术从规则表中搜索可用的规则。然而,由于基于树的翻译模型依赖于句法分析的结果,而有些语言的句法分析准确率并不是很高,所以由句法分析错误造成的规则... 在传统的基于树的翻译模型中,一般都是将一条规则视为字符串,然后使用字符串匹配技术从规则表中搜索可用的规则。然而,由于基于树的翻译模型依赖于句法分析的结果,而有些语言的句法分析准确率并不是很高,所以由句法分析错误造成的规则无法匹配的现象很常见,特别是在树到树的翻译模型中,能够精确匹配的规则数量非常稀少,进而对机器翻译的性能造成很大影响。因此该文提出了一种基于树核的模糊匹配技术,在NIST 2005汉英翻译测试集上的结果表明,基于树核的模糊匹配模型相对于传统的翻译模型显著的提高了1.3个BLEU值,并且在森林模型中使用模糊匹配技术仍然能够提高0.7个BLEU值。 展开更多
关键词 树核 树到串翻译模型 统计机器翻译 模糊匹配
在线阅读 下载PDF
基于串核的音乐风格聚类
10
作者 杨圣云 袁德辉 赖国明 《计算机工程与设计》 CSCD 北大核心 2008年第3期687-689,共3页
给出了一种新的映射音乐到Rn空间的方法和基于串核的音乐风格聚类法。利用统计方法分析大量音乐的旋律轮廓线得到合适的编码模式,用它把旋律轮廓线编码为有限字母表(8个字母)的字符串。利用连续子串嵌入法把音乐串显式映射到高维Rn空间... 给出了一种新的映射音乐到Rn空间的方法和基于串核的音乐风格聚类法。利用统计方法分析大量音乐的旋律轮廓线得到合适的编码模式,用它把旋律轮廓线编码为有限字母表(8个字母)的字符串。利用连续子串嵌入法把音乐串显式映射到高维Rn空间,并用核表示这一映射。通过用基于核的山方法选择聚类的适合初始点,最后使用基于核的K-means方法聚类音乐数据集,比较了3个不同串核在5个音乐数据集上的聚类性能。 展开更多
关键词 音乐风格 旋律轮廓线 串核 核方法 山方法 核聚类
在线阅读 下载PDF
基于小波KPCA-SSA-ELM的盐穴储气库注采管柱内腐蚀速率预测 被引量:5
11
作者 骆正山 欧阳长风 +1 位作者 王小完 张新生 《安全与环境学报》 CAS CSCD 北大核心 2023年第7期2238-2245,共8页
为提升盐穴储气库注采管柱的内腐蚀速率预测精度,建立了基于小波核主成分分析方法(Kernel Principal Components Analysis, KPCA)和樽海鞘群算法(Salp Swarm Algorithm, SSA)优化的极限学习机(Extreme Learning Machine, ELM)腐蚀速率... 为提升盐穴储气库注采管柱的内腐蚀速率预测精度,建立了基于小波核主成分分析方法(Kernel Principal Components Analysis, KPCA)和樽海鞘群算法(Salp Swarm Algorithm, SSA)优化的极限学习机(Extreme Learning Machine, ELM)腐蚀速率预测模型。首先通过小波KPCA提取影响注采管柱内腐蚀的主要特征,应用ELM建立盐穴储气库注采管柱内腐蚀速率预测模型,并采用SSA对模型参数进行迭代寻优,避免原参数选取的强随机性对模型泛化能力和预测性能的影响。结果表明,经小波KPCA特征提取后得到包含98.73%原信息的3项主成分,SSA-ELM模型的预测结果与实际值基本吻合,其均方根误差(E_(RMS))为0.009 3,平均绝对百分比误差(E_(MAP))为0.336 0%,决定系数(R~2)高达0.991 2,较其他3种对比模型性能更优。研究表明,所建模型具有强泛化性能和高预测精度,能够有效预测盐穴储气库注采管柱的内腐蚀速率,为盐穴储气库注采系统的完整性评价和风险预警提供参考。 展开更多
关键词 安全工程 盐穴储气库 注采管柱 内腐蚀速率 核主成分分析法(KPCA) 樽海鞘群算法(SSA) 极限学习机(ELM)
原文传递
基于改进K-modes聚类的KNN分类算法 被引量:25
12
作者 王志华 刘绍廷 罗齐 《计算机工程与设计》 北大核心 2019年第8期2228-2234,共7页
为解决K-modes算法初始化k簇时误差率较高和KNN(K最近邻算法)算法面对大样本数据量时分类不准确的现状,分析传统的K-modes算法从k簇的初始化到簇中心不再变化的全过程和KNN(K最近邻算法)算法在面对大样本数据时执行效率低下的问题,提出... 为解决K-modes算法初始化k簇时误差率较高和KNN(K最近邻算法)算法面对大样本数据量时分类不准确的现状,分析传统的K-modes算法从k簇的初始化到簇中心不再变化的全过程和KNN(K最近邻算法)算法在面对大样本数据时执行效率低下的问题,提出改进的K-modes-KNN算法。使用字符串核函数初始化k簇,字符串核函数迭代计算样本到簇中心的距离来动态改变簇中心,利用改进的K-modes算法将数据集进行分簇处理后,在每个子簇中建立KNN(K最近邻算法)分类模型。通过真实数据验证了所提算法在一定程度上优于同种分类算法。 展开更多
关键词 K-modes算法 KNN算法 分类 簇中心 K-modes-KNN算法 字符串核函数
在线阅读 下载PDF
一种基于中文关键字符串核函数的分类算法
13
作者 沈黎 肖勇 刘莺 《吉首大学学报(自然科学版)》 CAS 2019年第1期18-20,共3页
提出了一种基于中文关键字符串核函数的分类算法,并在农业文本上进行了分类性能测试.实验结果表明,与传统的中文分类算法相比,基于中文关键字符串核函数的分类算法准确率更高.
关键词 中文关键字符串核函数 农业文本 文本分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部