面向高维复杂的电力量测数据,现有攻击定位检测方法存在定位精度差的问题。为此该文提出一种基于最大信息系数-双层置信极端梯度提升树的电网虚假数据注入攻击定位检测方法。所提方法引入最大信息系数对量测数据进行特征选择,能够非线...面向高维复杂的电力量测数据,现有攻击定位检测方法存在定位精度差的问题。为此该文提出一种基于最大信息系数-双层置信极端梯度提升树的电网虚假数据注入攻击定位检测方法。所提方法引入最大信息系数对量测数据进行特征选择,能够非线性地衡量数据特征之间的关联性,且公平地根据一个特征变量中包含另一个特征变量的信息量来去除冗余特征,有效解决虚假数据注入攻击定位检测方法普遍面临的量测数据高维冗余问题;同时提出一种具有正反馈信息传递作用的双层置信极端梯度提升树来对各节点状态进行分类,通过结合电网拓扑关系学习标签相关性,从而有选择性地利用前序标签有效预测信息,来减少后续分类器学习到的前序标签预测信息中包含的错误,最终实现对受攻击位置的精确定位。在IEEE-14、IEEE-57节点系统上进行大量仿真,算例结果验证了所提方法的有效性,且相较于其他方法具有更高的准确率、精度、召回率、F1值和AUC(area under curve)值。展开更多
外来入侵植物命名实体识别是进一步挖掘入侵植物信息的关键步骤。为解决外来入侵植物领域命名实体识别存在训练数据稀缺、字符级向量表征单一、专业实体识别精度不足等问题,构建了一种基于多特征融合的外来入侵植物细粒度命名实体识别模...外来入侵植物命名实体识别是进一步挖掘入侵植物信息的关键步骤。为解决外来入侵植物领域命名实体识别存在训练数据稀缺、字符级向量表征单一、专业实体识别精度不足等问题,构建了一种基于多特征融合的外来入侵植物细粒度命名实体识别模型(invasive alien plant fine-grained named entity recognition model based on multi-feature fusion,IAPMFF)。首先,采用RoBERTa(Robustly optimized BERT approach,RoBERTa)预训练模型为基础架构,通过构建领域专用词典并通过词汇特征向量融合,增强模型对低频词及专业术语的表征能力;其次,设计双通道特征提取层,利用双向长短时记忆网络(Bi-directional long-short term memory,BiLSTM)提取长序列语义特征,结合卷积残差结构(convolution residual structure,CRS)捕获更多细粒度特征;然后,设计分层特征融合机制,通过多头自注意力机制加权融合两种特征向量,构建多维度语义表征;最后,采用条件随机场(conditional random field,CRF)进行序列解码优化。基于专家知识,构建包含24类细粒度实体标签的外来入侵植物命名实体识别数据集。试验表明,IAP-MFF模型在外来入侵植物命名实体识别数据集上取得91.51%精确率、92.51%召回率和92.01%的F1值,较基线模型分别提升4.40、3.39、3.91个百分点,显著改善了小样本细粒度实体的识别效果。在Weibo、Resume公共数据集上F1值分别达到72.75%和97.15%,表明了模型的泛化性和优越性能。IAP-MFF模型通过融合包含领域知识在内的多种特征,有效提升实体识别精度与泛化能力,为外来入侵植物知识图谱构建奠定技术基础。展开更多
含分布式电源(distributed generation,DG)的双极直流配电系统是未来配电网发展的重要形态之一,但由于DG接入方式、数量、容量、位置以及系统正负极负荷不平衡对系统静暂态电压稳定性影响不同,目前相关研究尚缺乏对此问题的分析。该文...含分布式电源(distributed generation,DG)的双极直流配电系统是未来配电网发展的重要形态之一,但由于DG接入方式、数量、容量、位置以及系统正负极负荷不平衡对系统静暂态电压稳定性影响不同,目前相关研究尚缺乏对此问题的分析。该文首先将DG等效为受控电流源,推导分析了DG接入方式、容量及负荷不平衡度对系统静态下电压不平衡度的影响;其次,基于单极故障下光伏型DG与交流电网暂态放电情况,推导分析了DG接入方式、位置、容量与系统暂态电压稳定性的关系;再者,基于多目标蜣螂优化算法提出以系统静暂态电压稳定性与DG接入成本为目标的DG接入方案规划方法,采用熵权逼近理想解排序法(technique for order preference by similarity to ideal solution,TOPSIS)法筛选出DG接入的最佳折中方案。最后在Matlab/Simulink仿真平台搭建改进IEEE14、IEEE33双极直流配电系统验证该文所提优化方法的普适性和有效性。展开更多
文摘面向高维复杂的电力量测数据,现有攻击定位检测方法存在定位精度差的问题。为此该文提出一种基于最大信息系数-双层置信极端梯度提升树的电网虚假数据注入攻击定位检测方法。所提方法引入最大信息系数对量测数据进行特征选择,能够非线性地衡量数据特征之间的关联性,且公平地根据一个特征变量中包含另一个特征变量的信息量来去除冗余特征,有效解决虚假数据注入攻击定位检测方法普遍面临的量测数据高维冗余问题;同时提出一种具有正反馈信息传递作用的双层置信极端梯度提升树来对各节点状态进行分类,通过结合电网拓扑关系学习标签相关性,从而有选择性地利用前序标签有效预测信息,来减少后续分类器学习到的前序标签预测信息中包含的错误,最终实现对受攻击位置的精确定位。在IEEE-14、IEEE-57节点系统上进行大量仿真,算例结果验证了所提方法的有效性,且相较于其他方法具有更高的准确率、精度、召回率、F1值和AUC(area under curve)值。
文摘针对农药登记文本中信息密集、逻辑结构复杂、实体间跨度大以及实体长度异质性等特点,同时为克服传统联合抽取方法中面临的三元组重叠、曝光偏差和冗余计算问题,本研究提出一种多特征融合的单阶段实体关系联合抽取模型(Multi-feature fusion single-stage entity and relation joint extraction model,MF-SERel)。首先,在编码层,通过融合语义与句法特征,丰富字符向量表示,提升模型对复杂语料的表征能力;其次,在多维标注框架层,提出HT-BES多维标注策略,以解决重叠三元组问题。通过并行评分函数与细粒度分类组件,将实体关系联合抽取转化为了基于关系维度的多标签标注任务,该过程不包含相互依赖步骤,从而实现单阶段并行标注,避免了曝光偏差并降低了计算冗余;最后,在解码层依据细粒度分类预测标签,解码出实体关系三元组。将本研究提出的模型与GraphRel、CasRel和TPLinker等基线模型进行对比,在农药数据集(Pesticide registration dataset,PRD)和公开数据集(Dataset of unstructured information extraction,DuIE)上进行检测。结果表明MF-SERel模型在农药数据集PRD和公开数据集DuIE上具有良好的表现。在农药数据集PRD上,本研究提出的模型MF-SERel在推理速度上提升了20%,F1值提升了2.3%,说明MF-SERel模型在农药登记文本中具有良好的知识挖掘能力;在公开数据集DuIE上,MF-SERel模型在推理速度上提升了54%,F1值提升了1.7%,同样取得了较好结果,证明MF-SERel模型具有较好的泛化能力。综上,本研究提出的MF-SERel模型可为农药领域知识的结构化抽取提供新方法。
文摘外来入侵植物命名实体识别是进一步挖掘入侵植物信息的关键步骤。为解决外来入侵植物领域命名实体识别存在训练数据稀缺、字符级向量表征单一、专业实体识别精度不足等问题,构建了一种基于多特征融合的外来入侵植物细粒度命名实体识别模型(invasive alien plant fine-grained named entity recognition model based on multi-feature fusion,IAPMFF)。首先,采用RoBERTa(Robustly optimized BERT approach,RoBERTa)预训练模型为基础架构,通过构建领域专用词典并通过词汇特征向量融合,增强模型对低频词及专业术语的表征能力;其次,设计双通道特征提取层,利用双向长短时记忆网络(Bi-directional long-short term memory,BiLSTM)提取长序列语义特征,结合卷积残差结构(convolution residual structure,CRS)捕获更多细粒度特征;然后,设计分层特征融合机制,通过多头自注意力机制加权融合两种特征向量,构建多维度语义表征;最后,采用条件随机场(conditional random field,CRF)进行序列解码优化。基于专家知识,构建包含24类细粒度实体标签的外来入侵植物命名实体识别数据集。试验表明,IAP-MFF模型在外来入侵植物命名实体识别数据集上取得91.51%精确率、92.51%召回率和92.01%的F1值,较基线模型分别提升4.40、3.39、3.91个百分点,显著改善了小样本细粒度实体的识别效果。在Weibo、Resume公共数据集上F1值分别达到72.75%和97.15%,表明了模型的泛化性和优越性能。IAP-MFF模型通过融合包含领域知识在内的多种特征,有效提升实体识别精度与泛化能力,为外来入侵植物知识图谱构建奠定技术基础。
文摘含分布式电源(distributed generation,DG)的双极直流配电系统是未来配电网发展的重要形态之一,但由于DG接入方式、数量、容量、位置以及系统正负极负荷不平衡对系统静暂态电压稳定性影响不同,目前相关研究尚缺乏对此问题的分析。该文首先将DG等效为受控电流源,推导分析了DG接入方式、容量及负荷不平衡度对系统静态下电压不平衡度的影响;其次,基于单极故障下光伏型DG与交流电网暂态放电情况,推导分析了DG接入方式、位置、容量与系统暂态电压稳定性的关系;再者,基于多目标蜣螂优化算法提出以系统静暂态电压稳定性与DG接入成本为目标的DG接入方案规划方法,采用熵权逼近理想解排序法(technique for order preference by similarity to ideal solution,TOPSIS)法筛选出DG接入的最佳折中方案。最后在Matlab/Simulink仿真平台搭建改进IEEE14、IEEE33双极直流配电系统验证该文所提优化方法的普适性和有效性。