期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
Sequence-Based Deep Learning Ensemble for Targeted Phage–Host Interaction Prediction
1
作者 Zihang Zhao Qian Chen +3 位作者 Min Li Wenchen Song Minfeng Xiao Min Fang 《国际计算机前沿大会会议论文集》 2025年第1期364-388,共25页
The rapid rise of antibiotic-resistant bacteria has created an urgent need for alternative treatments,such as bacteriophage therapy,which relies on phages to selectively eliminate specific bacterial pathogens.However,... The rapid rise of antibiotic-resistant bacteria has created an urgent need for alternative treatments,such as bacteriophage therapy,which relies on phages to selectively eliminate specific bacterial pathogens.However,the success of phage therapy hinges on accurately matching phages to their bacterial hosts,and predicting these phage–host interactions(PHIs)remains a significant challenge.The existing computational approaches for PHI prediction have major limitations.For example,the PredPHI model achieves less than 70%accuracy,and most methods predict only broad host categories(e.g.,genus levels)rather than pinpointing the exact bacterial strain.To address these gaps,we present a novel data-driven framework that predicts PHIs at the individual host strain level using only protein amino acid sequence data as input.Our approach extracts informative features from protein sequences—including amino acid composition(AAC),key chemical element abundance(AC),and molecular weight(MW)—and employs a one-dimensional convolutional neural network(1D CNN)tailored for sequential protein data.To further increase the prediction accuracy and mitigate class imbalance,we train multiple CNN models on different subsets of the data and integrate their outputs via a weighted ensemble strategy.This ensemble 1D CNN model achieves an AUC of 0.968,an AUPR of 0.976,an accuracy of 88%,and a sensitivity of 0.911,with a Matthews correlation coefficient(MCC)approximately 40%greater than that of PredPHI.Overall,this data-driven bioinformatics approach provides a powerful tool for rapid phage–host matching and custom phage design,potentially accelerating the development of targeted phage therapy. 展开更多
关键词 Phage-Host Interactions Protein Sequence 1D CNN ensemblelearning·data-drivenbioinformatics
原文传递
基于信息熵的自适应网络流概念漂移分类方法 被引量:14
2
作者 潘吴斌 程光 +1 位作者 郭晓军 黄顺翔 《计算机学报》 EI CSCD 北大核心 2017年第7期1556-1571,共16页
由于网络流量特征随时间和网络环境的变化而发生改变,导致基于机器学习的流量分类方法精度明显降低.同时,根据经验定期更新分类器是耗时的,且难以保证新分类器泛化性能.因而,文中提出一种基于信息熵的自适应网络流概念漂移分类方法,首... 由于网络流量特征随时间和网络环境的变化而发生改变,导致基于机器学习的流量分类方法精度明显降低.同时,根据经验定期更新分类器是耗时的,且难以保证新分类器泛化性能.因而,文中提出一种基于信息熵的自适应网络流概念漂移分类方法,首先根据特征属性的信息熵变化检测概念漂移,再采用增量集成学习策略在概念漂移点引入当前流量建立的分类器,并剔除性能下降的分类器,达到更新分类器的目的,最后加权集成分类结果.实验结果表明该方法可以有效地检测概念漂移并更新分类器,表现出较好的分类性能和泛化能力. 展开更多
关键词 概念漂移 机器学习 信息熵检测 增量集成学习 流量分类
在线阅读 下载PDF
基于多过滤器集成学习的在线垃圾邮件过滤 被引量:4
3
作者 刘伍颖 王挺 《中文信息学报》 CSCD 北大核心 2008年第1期67-73,共7页
垃圾邮件过滤就是在线对邮件做出Spam(垃圾)或Ham(非垃圾)的判断,这是一种根据客户反馈不断自学习的过程。本文抽取邮件的语言特征和行为特征构建多个简单过滤器,然后采用集成学习方法组合这些简单过滤器,获得了比简单过滤器更高的性能... 垃圾邮件过滤就是在线对邮件做出Spam(垃圾)或Ham(非垃圾)的判断,这是一种根据客户反馈不断自学习的过程。本文抽取邮件的语言特征和行为特征构建多个简单过滤器,然后采用集成学习方法组合这些简单过滤器,获得了比简单过滤器更高的性能。实验表明单一特征学习的计算复杂性低、速度较快,而集成学习的效果更好。本文提出的将SVM集成学习用于邮件过滤的方法,在各种集成学习方法中效果最好。 展开更多
关键词 计算机应用 中文信息处理 垃圾邮件过滤 机器学习 集成学习 支持向量机
在线阅读 下载PDF
基于GBRT模型的交通事故预测 被引量:7
4
作者 杨文忠 张志豪 +3 位作者 柴亚闯 温杰彬 杨蒙蒙 富雅玲 《新疆大学学报(自然科学版)》 CAS 2020年第1期36-43,共8页
道路交通安全水平的重要标志就是道路交通事故发生量.为解决当前交通事故量预测精度不高、时间拐点数据预测效果差的问题,以及在交通管理系统中提供更加准确的预测数据帮助交通管理部门做出科学的决策,本文针对我国年周期交通事故建立... 道路交通安全水平的重要标志就是道路交通事故发生量.为解决当前交通事故量预测精度不高、时间拐点数据预测效果差的问题,以及在交通管理系统中提供更加准确的预测数据帮助交通管理部门做出科学的决策,本文针对我国年周期交通事故建立了基于GBRT(Gradient Boosted Regression Tree)的交通事故模型.通过训练交通事故相关数据对未来交通事故死亡人数进行预测,并与多种回归模型、神经网络模型进行对比实验,结果显示GBRT模型具有拟合效果佳、训练时间短、高鲁棒性的优势,能够更准确、高效的对交通事故安全水平进行预测. 展开更多
关键词 交通事故 集成学习 GBRT 预测 回归
在线阅读 下载PDF
变量选择集成方法 被引量:2
5
作者 张春霞 李俊丽 《工程数学学报》 CSCD 北大核心 2019年第1期1-17,共17页
随着海量高维数据在众多研究和应用领域的不断涌现,如何利用数据的稀疏性特征,从中挖掘到有价值的信息显得至关重要.变量选择作为可解释性建模、提高统计推断和预测精度的有效工具,在高维数据的分析中发挥着愈来愈重要的作用.由于集成... 随着海量高维数据在众多研究和应用领域的不断涌现,如何利用数据的稀疏性特征,从中挖掘到有价值的信息显得至关重要.变量选择作为可解释性建模、提高统计推断和预测精度的有效工具,在高维数据的分析中发挥着愈来愈重要的作用.由于集成学习能显著提高选择精度、缓解变量选择过程的不稳定性、降低噪声变量被误选的机率,变量选择集成方法近年来得到了广泛研究.为了给相关方向的研究者提供一个系统的参考资料,论文对现有的变量选择集成方法进行了详细阐述,按照构建集成所用的不同策略将其分为两大类,分析了各类方法的特征,并采用数值试验研究了各类方法在变量选择、预测等方面的性能.最后,论文对变量选择集成方法在未来值得研究的方向进行了探讨. 展开更多
关键词 高维数据分析 变量选择 线性回归模型 集成学习 稳定性
在线阅读 下载PDF
基于机器学习的工业控制网络异常检测方法 被引量:7
6
作者 邵俊杰 董伟 冯志 《信息技术与网络安全》 2019年第6期17-20,25,共5页
针对工业控制网络中常用的Modbus协议,提出了一种工业控制网络的异常检测方法。使用n-gram(n=0.5,1,1.5,2,2.5)算法从Modbus正常报文帧的有效载荷中进行特征提取,确定出5组特征向量,并结合单类支持向量机(OCSVM)算法训练出5个初级学习器... 针对工业控制网络中常用的Modbus协议,提出了一种工业控制网络的异常检测方法。使用n-gram(n=0.5,1,1.5,2,2.5)算法从Modbus正常报文帧的有效载荷中进行特征提取,确定出5组特征向量,并结合单类支持向量机(OCSVM)算法训练出5个初级学习器,对5个同质的初级学习器采用“学习法”进行集成,最终得出次级学习器,利用上述两层模型,即可完成异常识别。在气体管道网络原始数据集中进行试验,最终误报率为8%,漏报率为6%。 展开更多
关键词 N-GRAM 单类支持向量机 集成学习 工业控制网络 异常检测
在线阅读 下载PDF
基于Boosting的集成k-NN软件缺陷预测方法 被引量:7
7
作者 何亮 宋擒豹 沈钧毅 《模式识别与人工智能》 EI CSCD 北大核心 2012年第5期792-802,共11页
软件缺陷预测是改善软件开发质量,提高测试效率的重要途径.文中提出一种基于软件度量元的集成k-NN软件缺陷预测方法.首先,该方法在不同的Bootstrap抽样数据集上迭代训练生成一个基本k-NN预测器集合.然后,这些基本预测器分别对软件模块... 软件缺陷预测是改善软件开发质量,提高测试效率的重要途径.文中提出一种基于软件度量元的集成k-NN软件缺陷预测方法.首先,该方法在不同的Bootstrap抽样数据集上迭代训练生成一个基本k-NN预测器集合.然后,这些基本预测器分别对软件模块进行独立预测,各基本预测值将被融合生成最终的预测结果.为判别新的软件模块是否为缺陷模块,设计分类阈值的自适应学习方法.集成预测结果大于该阈值的模块将被识别为缺陷模块,反之则为正常模块.NASAMDP及PROMISEAR标准软件缺陷数据集上的实验结果表明集成k-NN缺陷预测的性能较之广泛采用的对比缺陷预测方法有较明显的提高,同时也证明软件度量元在缺陷预测中的有效性. 展开更多
关键词 软件缺陷预测 k-近邻(k-NN) 软件度量元 集成学习
原文传递
一种融入可信度的集成SVM垃圾书签检测方法
8
作者 张付志 周全强 《模式识别与人工智能》 EI CSCD 北大核心 2011年第4期591-596,共6页
针对现有垃圾书签检测方法在用户概貌信息较少情况下检测性能下降的问题,提出一种融入可信度的集成SVM垃圾书签检测方法.首先基于Bootstrap技术对训练样本进行可重复采样,得到个体SVM的训练子集,然后将SVM的标准输出直接拟合Sigmoid函... 针对现有垃圾书签检测方法在用户概貌信息较少情况下检测性能下降的问题,提出一种融入可信度的集成SVM垃圾书签检测方法.首先基于Bootstrap技术对训练样本进行可重复采样,得到个体SVM的训练子集,然后将SVM的标准输出直接拟合Sigmoid函数得到SVM的后验概率输出,作为类别输出的可信度,并提出一种性能优于投票策略的融入可信度的融合方法对个体SVM的输出结果进行融合.实验结果表明,该方法在用户概貌信息较少的情况下具有较好的检测性能. 展开更多
关键词 垃圾书签 垃圾检测 支持向量机 可信度 集成学习
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部