台区电力工单记录反映了台区运行工况和用户需求,是制定台区用电安全管理制度和满足台区用户用电需求的重要依据。针对台区电力工单高复杂性和强专业性给台区工单分类带来的难题,提出一种融合标签平滑(LS)与预训练语言模型的台区电力工...台区电力工单记录反映了台区运行工况和用户需求,是制定台区用电安全管理制度和满足台区用户用电需求的重要依据。针对台区电力工单高复杂性和强专业性给台区工单分类带来的难题,提出一种融合标签平滑(LS)与预训练语言模型的台区电力工单分类模型(MiniRBT-LSTM-GAT)。首先,利用预训练模型计算电力工单文本中的字符级特征向量表示;其次,采用双向长短期记忆网络(BiLSTM)捕捉电力文本序列中的依赖关系;再次,通过图注意力网络(GAT)聚焦对文本分类贡献大的特征信息;最后,利用LS改进损失函数以提高模型的分类精度。所提模型与当前主流的文本分类算法在农网台区电力工单数据集(RSPWO)、浙江省95598电力工单数据集(ZJPWO)和THUCNews(TsingHua University Chinese News)数据集上的实验结果表明,与电力审计文本多粒度预训练语言模型(EPAT-BERT)相比,所提模型在RSPWO、ZJPWO上的查准率和F1值分别提升了2.76、2.02个百分点和1.77、1.40个百分点;与胶囊神经网络模型BRsyn-caps(capsule network based on BERT and dependency syntax)相比,所提模型在THUCNews数据集上的查准率和准确率分别提升了0.76和0.71个百分点。可见,所提模型有效提升了台区电力工单分类的性能,并在THUCNews数据集上表现良好,验证了模型的通用性。展开更多
针对电网积累的海量工单数据未被深度挖掘、人工分析效率低等问题,本文提出一种基于命名实体识别模型的配网客户诉求知识图谱构建方法。该方法通过融合基于Transformer的双向编码器表征(bidirectional encoder representation from tran...针对电网积累的海量工单数据未被深度挖掘、人工分析效率低等问题,本文提出一种基于命名实体识别模型的配网客户诉求知识图谱构建方法。该方法通过融合基于Transformer的双向编码器表征(bidirectional encoder representation from transformers,BERT)预训练语言模型、双向长短期记忆(bidirectional long short-term memory,BiLSTM)语义提取层和条件随机场(conditional random field,CRF)解码层构建实体识别模型,显著提升了配网工单文本中“客户”“故障设备”“反馈类型”等关键实体的识别准确率(F1值达84.21%);利用Neo4j图数据库对抽取的实体关系进行知识融合与存储,实现了客户诉求、设备信息、处理状态等多维度数据的可视化关联分析。经某供电公司8 764份工单数据验证,该方法能有效推动配网供电服务指挥系统转型升级,提升诉求处理效率和业务管控能力,为供电服务质量优化提供数字化决策支持。展开更多
电力客服工单数据以文本形式记录电力用户的需求信息,合理的工单分类方法有利于准确定位用户需求,提升电力系统的运行效率.针对工单数据特征稀疏、依赖性强等问题,本文对基于字符级嵌入的长短时记忆网络(Bidirectional Long Short-Term ...电力客服工单数据以文本形式记录电力用户的需求信息,合理的工单分类方法有利于准确定位用户需求,提升电力系统的运行效率.针对工单数据特征稀疏、依赖性强等问题,本文对基于字符级嵌入的长短时记忆网络(Bidirectional Long Short-Term Memory network,BiLSTM)和卷积神经网络(Convolution Neural Network,CNN)组合的结构模型进行优化.该模型首先对Word2Vec模型训练的词向量进行降噪处理,得到文本的特征表示;其次,利用BiLSTM网络递归地学习文本的时序信息,提取句子特征信息;再输入到双通道池化的CNN网络中,进行局部的特征提取.通过在真实客服工单数据集上的测试实验,验证了该模型在客服工单分类任务上的具有较好的精确性和鲁棒性.展开更多
文摘台区电力工单记录反映了台区运行工况和用户需求,是制定台区用电安全管理制度和满足台区用户用电需求的重要依据。针对台区电力工单高复杂性和强专业性给台区工单分类带来的难题,提出一种融合标签平滑(LS)与预训练语言模型的台区电力工单分类模型(MiniRBT-LSTM-GAT)。首先,利用预训练模型计算电力工单文本中的字符级特征向量表示;其次,采用双向长短期记忆网络(BiLSTM)捕捉电力文本序列中的依赖关系;再次,通过图注意力网络(GAT)聚焦对文本分类贡献大的特征信息;最后,利用LS改进损失函数以提高模型的分类精度。所提模型与当前主流的文本分类算法在农网台区电力工单数据集(RSPWO)、浙江省95598电力工单数据集(ZJPWO)和THUCNews(TsingHua University Chinese News)数据集上的实验结果表明,与电力审计文本多粒度预训练语言模型(EPAT-BERT)相比,所提模型在RSPWO、ZJPWO上的查准率和F1值分别提升了2.76、2.02个百分点和1.77、1.40个百分点;与胶囊神经网络模型BRsyn-caps(capsule network based on BERT and dependency syntax)相比,所提模型在THUCNews数据集上的查准率和准确率分别提升了0.76和0.71个百分点。可见,所提模型有效提升了台区电力工单分类的性能,并在THUCNews数据集上表现良好,验证了模型的通用性。
文摘针对电网积累的海量工单数据未被深度挖掘、人工分析效率低等问题,本文提出一种基于命名实体识别模型的配网客户诉求知识图谱构建方法。该方法通过融合基于Transformer的双向编码器表征(bidirectional encoder representation from transformers,BERT)预训练语言模型、双向长短期记忆(bidirectional long short-term memory,BiLSTM)语义提取层和条件随机场(conditional random field,CRF)解码层构建实体识别模型,显著提升了配网工单文本中“客户”“故障设备”“反馈类型”等关键实体的识别准确率(F1值达84.21%);利用Neo4j图数据库对抽取的实体关系进行知识融合与存储,实现了客户诉求、设备信息、处理状态等多维度数据的可视化关联分析。经某供电公司8 764份工单数据验证,该方法能有效推动配网供电服务指挥系统转型升级,提升诉求处理效率和业务管控能力,为供电服务质量优化提供数字化决策支持。