多因子量化选股是量化金融研究的核心方向,随着深度学习与机器学习算法的快速发展,传统因子选取方法如打分法、主成分分析法(principal component analysis,PCA)等存在主观性强或过拟合问题。因此,如何利用非线性特征提取及分类模型提...多因子量化选股是量化金融研究的核心方向,随着深度学习与机器学习算法的快速发展,传统因子选取方法如打分法、主成分分析法(principal component analysis,PCA)等存在主观性强或过拟合问题。因此,如何利用非线性特征提取及分类模型提升选股效果成为量化选股领域的研究热点。提出一种基于自编码器与支持向量机(support vector machine,SVM)相结合的多因子量化选股策略,利用自编码器对多因子数据进行非线性降维,提取潜在特征,将降维后特征输入SVM进行收益分类预测,并采用网格搜索与交叉验证优化SVM模型超参数。实证分析表明,相比传统PCA-SVM模型,该策略在分类准确率、AUC(area under the curve)值、夏普比率及最大回撤等核心指标上均取得显著提升,证实“深度学习特征提取+传统机器学习分类”在量化选股领域的有效性。展开更多
故障根因分析旨在找到导致特定问题、故障或事件发生的原因,是多个领域中追踪溯源的重要支撑技术,但现有方法在效率、准确性和稳定性等方面仍不能满足故障根因分析任务的实际需求。对此,将贝叶斯网作为相关属性之间依赖关系表示和推理...故障根因分析旨在找到导致特定问题、故障或事件发生的原因,是多个领域中追踪溯源的重要支撑技术,但现有方法在效率、准确性和稳定性等方面仍不能满足故障根因分析任务的实际需求。对此,将贝叶斯网作为相关属性之间依赖关系表示和推理的知识框架,提出基于贝叶斯网的故障根因分析方法。首先,针对高维数据和稀疏样本带来的挑战,提出基于向量量化自编码器的高维属性约简算法,并给出α-BIC评分准则,高效地学习根因贝叶斯网(Root Cause Bayesian Network,RCBN)。随后,基于贝叶斯网嵌入技术实现RCBN的高效推理,高效计算各原因条件下故障产生的可能性,进而使用因果模型中的Blame机制度量各原因对给定故障的贡献度,从而实现故障根因分析。在3个公共数据集和3个合成数据集上的实验结果表明,所提方法的平均检测准确性和效率明显优于对比方法,在CHILD数据集上精度提升了7%,运行时间快了60%。展开更多
文摘多因子量化选股是量化金融研究的核心方向,随着深度学习与机器学习算法的快速发展,传统因子选取方法如打分法、主成分分析法(principal component analysis,PCA)等存在主观性强或过拟合问题。因此,如何利用非线性特征提取及分类模型提升选股效果成为量化选股领域的研究热点。提出一种基于自编码器与支持向量机(support vector machine,SVM)相结合的多因子量化选股策略,利用自编码器对多因子数据进行非线性降维,提取潜在特征,将降维后特征输入SVM进行收益分类预测,并采用网格搜索与交叉验证优化SVM模型超参数。实证分析表明,相比传统PCA-SVM模型,该策略在分类准确率、AUC(area under the curve)值、夏普比率及最大回撤等核心指标上均取得显著提升,证实“深度学习特征提取+传统机器学习分类”在量化选股领域的有效性。
文摘故障根因分析旨在找到导致特定问题、故障或事件发生的原因,是多个领域中追踪溯源的重要支撑技术,但现有方法在效率、准确性和稳定性等方面仍不能满足故障根因分析任务的实际需求。对此,将贝叶斯网作为相关属性之间依赖关系表示和推理的知识框架,提出基于贝叶斯网的故障根因分析方法。首先,针对高维数据和稀疏样本带来的挑战,提出基于向量量化自编码器的高维属性约简算法,并给出α-BIC评分准则,高效地学习根因贝叶斯网(Root Cause Bayesian Network,RCBN)。随后,基于贝叶斯网嵌入技术实现RCBN的高效推理,高效计算各原因条件下故障产生的可能性,进而使用因果模型中的Blame机制度量各原因对给定故障的贡献度,从而实现故障根因分析。在3个公共数据集和3个合成数据集上的实验结果表明,所提方法的平均检测准确性和效率明显优于对比方法,在CHILD数据集上精度提升了7%,运行时间快了60%。