期刊文献+
共找到598篇文章
< 1 2 30 >
每页显示 20 50 100
Quality Assessment of Training Data with Uncertain Labels for Classification of Subjective Domains
1
作者 Ying Dai 《Journal of Computer and Communications》 2017年第7期152-168,共17页
In order to improve the performance of classifiers in subjective domains, this paper defines a metric to measure the quality of the subjectively labelled training data (QoSTD) by means of K-means clustering. Then, the... In order to improve the performance of classifiers in subjective domains, this paper defines a metric to measure the quality of the subjectively labelled training data (QoSTD) by means of K-means clustering. Then, the QoSTD is used as a weight of the predicted class scores to adjust the likelihoods of instances. Moreover, two measurements are defined to assess the performance of the classifiers trained by the subjective labelled data. The binary classifiers of Traditional Chinese Medicine (TCM) Zhengs are trained and retrained by the real-world data set, utilizing the support vector machine (SVM) and the discrimination analysis (DA) models, so as to verify the effectiveness of the proposed method. The experimental results show that the consistency of likelihoods of instances with the corresponding observations is increased notable for the classes, especially in the cases with the relatively low QoSTD training data set. The experimental results also indicate the solution how to eliminate the miss-labelled instances from the training data set to re-train the classifiers in the subjective domains. 展开更多
关键词 Quality Assessment SUBJECTIVE Domain Multimodal Sensor data label Noise LIKELIHOOD ADJUSTING TCM ZHENG
暂未订购
Coupled Attribute Similarity Learning on Categorical Data for Multi-Label Classification
2
作者 Zhenwu Wang Longbing Cao 《Journal of Beijing Institute of Technology》 EI CAS 2017年第3期404-410,共7页
In this paper a novel coupled attribute similarity learning method is proposed with the basis on the multi-label categorical data(CASonMLCD).The CASonMLCD method not only computes the correlations between different ... In this paper a novel coupled attribute similarity learning method is proposed with the basis on the multi-label categorical data(CASonMLCD).The CASonMLCD method not only computes the correlations between different attributes and multi-label sets using information gain,which can be regarded as the important degree of each attribute in the attribute learning method,but also further analyzes the intra-coupled and inter-coupled interactions between an attribute value pair for different attributes and multiple labels.The paper compared the CASonMLCD method with the OF distance and Jaccard similarity,which is based on the MLKNN algorithm according to 5common evaluation criteria.The experiment results demonstrated that the CASonMLCD method can mine the similarity relationship more accurately and comprehensively,it can obtain better performance than compared methods. 展开更多
关键词 COUPLED SIMILARITY MULTI-label categorical data CORRELATIONS
在线阅读 下载PDF
基于响应数据图像化和深度残差收缩网络的结构损伤诊断
3
作者 李书进 张杰玲 赵源 《建筑科学与工程学报》 北大核心 2026年第1期28-40,共13页
利用卷积神经网络(CNN)处理二维图像的优势以及深度残差收缩网络(DRSN)在抗噪性、稳定性和鲁棒性上的良好表现,提出一种将动力响应信号图像化处理后利用DRSN对结构损伤进行诊断的方法。以复杂损伤工况下的平面和空间框架结构的节点损伤... 利用卷积神经网络(CNN)处理二维图像的优势以及深度残差收缩网络(DRSN)在抗噪性、稳定性和鲁棒性上的良好表现,提出一种将动力响应信号图像化处理后利用DRSN对结构损伤进行诊断的方法。以复杂损伤工况下的平面和空间框架结构的节点损伤诊断问题为研究对象,从模型的样本输入和特征学习两方面出发,通过格拉姆角场(GAF)变换和数据增强处理将各监测点的一维结构动力响应信号构造为图像增强样本集,同时构建了适用于框架结构节点损伤位置和损伤程度诊断的DRSN多标签分类模型,并从训练收敛速度、诊断准确率、训练样本类别及网络结构几方面对其诊断性能进行了研究。通过对所提方法在强噪声干扰下的抗噪性能及处理新样本时的泛化性能进行研究,验证其有效性和实用性。结果表明:采用图像增强样本集训练的DRSN模型在诊断准确率、迭代收敛速度和稳定性方面的表现优于普通卷积神经网络模型,且在不同的诊断对象上表现出了良好的鲁棒性和适应性;DRSN的自适应调整阈值降噪机制具有出色的抗噪性能和泛化性能,使其在强噪声、小样本情况下的表现更具优势。 展开更多
关键词 损伤诊断 深度残差收缩网络 卷积神经网络 格拉姆角场 多标签分类 数据增强
在线阅读 下载PDF
基于Labeled-LDA模型的科学数据与科技文献关联识别研究——以生物医学领域为例 被引量:7
4
作者 潘有能 吕晶晶 丁楠 《情报科学》 CSSCI 北大核心 2023年第9期138-145,154,共9页
【目的/意义】在万物互联的开放科学时代,建立科学数据与科技文献之间的关联成为推动科学数据开放获取、共享和重用的重要举措。【方法/过程】本研究基于Labeled-LDA模型,辅以基于规则的识别方法,构建科学数据与科技文献关联识别模型,... 【目的/意义】在万物互联的开放科学时代,建立科学数据与科技文献之间的关联成为推动科学数据开放获取、共享和重用的重要举措。【方法/过程】本研究基于Labeled-LDA模型,辅以基于规则的识别方法,构建科学数据与科技文献关联识别模型,并以生物医学领域为例分别针对规范化引用、非规范化引用以及无引用三种关联情况进行模型训练与测试。【结果/结论】研究发现本模型在识别规范化引用测试集时识别率和F值分别为0.9和0.5左右,有比较稳定的识别效果,在识别非规范化引用和无引用的测试集时识别率分别为0.465和0.5,也展现出较强的可移植性与应用潜力。通过对非规范化引用和无引用识别结果进行人工判断,发现科学研究中确实存在数据引用不规范的现象,需要学界共同推动数据引用规范化。【创新/局限】与其他研究相比,本文构建的模型为基于语义的关联识别提供了方法层面的参考和基础,可以应用于大规模语料研究,从而促进更深层次语义关联的知识发现。 展开更多
关键词 科学数据 科技文献 labeled-LDA 关联识别 数据引用
原文传递
网络数据标识标签技术的发展困境及治理路径研究
5
作者 吴梦婷 唐纪元 +1 位作者 李金奉 李红飞 《信息安全研究》 北大核心 2026年第2期118-123,共6页
网络数据标识标签技术是保障数据要素可信流通与安全可控的关键性技术,具有广阔的应用前景与发展潜力.梳理了国内外数据标识标签技术的治理现状,归纳了制约此项技术发展的3大困境,并提出了针对性的治理路径.以制度创新、技术优化与协同... 网络数据标识标签技术是保障数据要素可信流通与安全可控的关键性技术,具有广阔的应用前景与发展潜力.梳理了国内外数据标识标签技术的治理现状,归纳了制约此项技术发展的3大困境,并提出了针对性的治理路径.以制度创新、技术优化与协同监管应对技术瓶颈,为我国构建安全高效的网络数据治理体系提供理论参考. 展开更多
关键词 数据标签 数据标识 网络数据治理 数据可信流通 数据要素
在线阅读 下载PDF
多普勒雷达DATA文件安全模型的设计 被引量:1
6
作者 万绪江 班显秀 +2 位作者 袁健 罗晶 万朔 《电脑编程技巧与维护》 2010年第20期131-133,共3页
从计算机DATA文件安全的内涵出发,针对目前DATA文件面临的安全威胁,分析了影响DATA文件的安全因素,提出了DATA文件安全体系层次结构。重点论述DATA文件层次的安全控制所采取的技术手段和应急措施,在此基础上设计了一种新型DATA文件安全... 从计算机DATA文件安全的内涵出发,针对目前DATA文件面临的安全威胁,分析了影响DATA文件的安全因素,提出了DATA文件安全体系层次结构。重点论述DATA文件层次的安全控制所采取的技术手段和应急措施,在此基础上设计了一种新型DATA文件安全防护模型,使之能够控制DATA文件多层安全,保证DATA文件的安全运行。 展开更多
关键词 data文件 访问控制 标签转发 引擎处理 数据恢复 data文件防护模型
在线阅读 下载PDF
FedGMH:基于全局多头部的标签干扰消除方法研究
7
作者 孙圳峰 倪郑威 《电信科学》 北大核心 2026年第1期159-173,共15页
个性化联邦学习因其在应对数据异质性和隐私保护方面的优势而备受关注。现有算法专注于平衡全局信息和个性化信息之间的矛盾,忽视了全局信息中的不同标签信息带来的干扰,尤其在维护单一全局头部的算法中,容易出现标签间特征冲突导致的... 个性化联邦学习因其在应对数据异质性和隐私保护方面的优势而备受关注。现有算法专注于平衡全局信息和个性化信息之间的矛盾,忽视了全局信息中的不同标签信息带来的干扰,尤其在维护单一全局头部的算法中,容易出现标签间特征冲突导致的收敛困难。为此,提出一种新的算法——全局多头部联邦学习(federated learning with global multi-head,FedGMH)算法,该算法在服务器创建多个全局头部,每个头部专门处理一种标签信息,而客户端下载与本地标签相关的全局头部,从而避免无关标签信息的干扰。此外,FedGMH引入参数级聚合机制:评估头部参数重要性,并将关键参数更新为全局多头部的加权参数,以加快收敛速度并且提高准确率。在3个视觉数据集上的大量实验表明,FedGMH优于现有的先进算法。 展开更多
关键词 个性化联邦学习 数据异质性 标签信息 全局多头部 头部参数
在线阅读 下载PDF
A Top-down Method of Extraction Entity Relationship Triples and Obtaining Annotated Data
8
作者 Zhiqiang Hu Zheng Ma +6 位作者 Jun Shi Zhipeng Li Xun Shao Yangzhao Yang Yong Liao Zhenyuan Gao Jie Zhang 《Journal of Quantum Computing》 2022年第1期13-22,共10页
The extraction of entity relationship triples is very important to build a knowledge graph(KG),meanwhile,various entity relationship extraction algorithms are mostly based on data-driven,especially for the current pop... The extraction of entity relationship triples is very important to build a knowledge graph(KG),meanwhile,various entity relationship extraction algorithms are mostly based on data-driven,especially for the current popular deep learning algorithms.Therefore,obtaining a large number of accurate triples is the key to build a good KG as well as train a good entity relationship extraction algorithm.Because of business requirements,this KG’s application field is determined and the experts’opinions also must be satisfied.Considering these factors we adopt the top-down method which refers to determining the data schema firstly,then filling the specific data according to the schema.The design of data schema is the top-level design of KG,and determining the data schema according to the characteristics of KG is equivalent to determining the scope of data’s collection and the mode of data’s organization.This method is generally suitable for the construction of domain KG.This article proposes a fast and efficient method to extract the topdown type KG’s triples in social media with the help of structured data in the information box on the right side of the related encyclopedia webpage.At the same time,based on the obtained triples,a data labeling method is proposed to obtain sufficiently high-quality training data,using in various Natural Language Processing(NLP)information extraction algorithms’training. 展开更多
关键词 Entity relationship triples knowledge graph TOP-DOWN social media data labeling
在线阅读 下载PDF
融合数据增强和多通道解码的中文多标签文本分类方法
9
作者 黄荣达 彭若馨 杨英勃 《网络新媒体技术》 2026年第1期57-65,共9页
中文多标签文本分类是自然语言处理领域的重要任务之一,广泛应用于情感分析、舆情监测、文本标注等多个领域。然而,中文文本的复杂性以及多标签数据集的特殊性(如数据量少、标签不平衡、复合标签等)给分类任务带来诸多挑战。本文提出一... 中文多标签文本分类是自然语言处理领域的重要任务之一,广泛应用于情感分析、舆情监测、文本标注等多个领域。然而,中文文本的复杂性以及多标签数据集的特殊性(如数据量少、标签不平衡、复合标签等)给分类任务带来诸多挑战。本文提出一种基于数据增强和多通道解码的中文多标签文本分类模型,通过大模型增强平衡不同类型的标签数据,同时利用多通道解码改善单通道解码不能充分区分不同维度语义差别的问题。实验结果表明,所提出的方法在多个数据集上平均F1值从69提升至79,为中文多标签文本分类任务提供新的解决方案。 展开更多
关键词 中文数据集 多标签文本分类 数据增强 多通道解码
在线阅读 下载PDF
基于伪标签的二阶段时序半监督学习框架
10
作者 彭鸿鑫 骆淑云 罗志一 《电子科技》 2026年第2期9-18,共10页
针对部分场景下时序分类问题中标签数据稀缺问题,文中提出了一种基于伪标签的二阶段时序半监督学习框架。在第1阶段,利用对比学习进行训练,构建基分类模型,并对无标签数据进行类别标记。在第2阶段,借助合适的伪标签技术对模型进行再训练... 针对部分场景下时序分类问题中标签数据稀缺问题,文中提出了一种基于伪标签的二阶段时序半监督学习框架。在第1阶段,利用对比学习进行训练,构建基分类模型,并对无标签数据进行类别标记。在第2阶段,借助合适的伪标签技术对模型进行再训练,以充分利用标签数据和无标签数据之间的紧密关联来提升模型性能。在多个公开时序分类数据集进行实验来验证所提框架的有效性,并对不同第2阶段伪标签训练方法的适用条件进行深入探讨。实验结果表明,在标签数据比例仅为1%和5%的情况下,所提学习框架在两个基模型和多个数据集上的准确率平均提升了约5.1%和3.5%,充分证明了所提方法能够有效解决半监督时序分类问题。 展开更多
关键词 半监督分类 时序数据 学习框架 伪标签技术 二阶段训练 对比学习 预训练 模型微调
在线阅读 下载PDF
基于Labeled-LDA模型的居民群体分类与出行特征分析 被引量:2
11
作者 王长硕 蒲英霞 《计算机应用与软件》 北大核心 2022年第11期17-24,共8页
如何使用海量社交媒体数据分析城市居民日常行为特征成为国内外学者广泛关注的问题。城市居民在不同时空间扮演的社会角色的不同将导致其出行行为特征随之变化,为此构建居民出行活动模式模型表征居民出行行为,引入自然语言处理领域内的... 如何使用海量社交媒体数据分析城市居民日常行为特征成为国内外学者广泛关注的问题。城市居民在不同时空间扮演的社会角色的不同将导致其出行行为特征随之变化,为此构建居民出行活动模式模型表征居民出行行为,引入自然语言处理领域内的标签狄利克雷分布模型Labeled-LDA完成群体分类,分析居民群体的出行行为特征,并讨论个体出行行为的不确定性。使用波士顿海量Twitter签到数据的实验表明,该方法能够有效区分典型的城市居民群体,并为居民在不同时空间表现出的不同出行行为特征提供概率解释。 展开更多
关键词 居民出行行为 标签狄利克雷分布(labeled-LDA) 社交媒体大数据 移动模式
在线阅读 下载PDF
Cost-Aware Multi-Domain Virtual Data Center Embedding 被引量:1
12
作者 Xiao Ma Zhongbao Zhang Sen Su 《China Communications》 SCIE CSCD 2018年第12期190-207,共18页
Virtual data center is a new form of cloud computing concept applied to data center. As one of the most important challenges, virtual data center embedding problem has attracted much attention from researchers. In dat... Virtual data center is a new form of cloud computing concept applied to data center. As one of the most important challenges, virtual data center embedding problem has attracted much attention from researchers. In data centers, energy issue is very important for the reality that data center energy consumption has increased by dozens of times in the last decade. In this paper, we are concerned about the cost-aware multi-domain virtual data center embedding problem. In order to solve this problem, this paper first addresses the energy consumption model. The model includes the energy consumption model of the virtual machine node and the virtual switch node, to quantify the energy consumption in the virtual data center embedding process. Based on the energy consumption model above, this paper presents a heuristic algorithm for cost-aware multi-domain virtual data center embedding. The algorithm consists of two steps: inter-domain embedding and intra-domain embedding. Inter-domain virtual data center embedding refers to dividing virtual data center requests into several slices to select the appropriate single data center. Intra-domain virtual data center refers to embedding virtual data center requests in each data center. We first propose an inter-domain virtual data center embedding algorithm based on label propagation to select the appropriate single data center. We then propose a cost-aware virtual data center embedding algorithm to perform the intra-domain data center embedding. Extensive simulation results show that our proposed algorithm in this paper can effectively reduce the energy consumption while ensuring the success ratio of embedding. 展开更多
关键词 virtual data CENTER EMBEDDING MULTI-DOMAIN cost-aware label PROPAGATION
在线阅读 下载PDF
无线局域网多模态数据标签自适应标注方法
13
作者 陈琳 魏娟 《吉林大学学报(理学版)》 北大核心 2025年第3期878-884,共7页
针对无线局域网的动态性导致数据标签有效性随时间变化,需定期更新和重新标注数据,增加了数据标签标注难度的问题,提出一种无线局域网多模态数据标签自适应标注方法.首先,通过动态滑动邻近排序算法清洗重复的无线局域网多模态数据,利用... 针对无线局域网的动态性导致数据标签有效性随时间变化,需定期更新和重新标注数据,增加了数据标签标注难度的问题,提出一种无线局域网多模态数据标签自适应标注方法.首先,通过动态滑动邻近排序算法清洗重复的无线局域网多模态数据,利用循环神经网络融合多模态数据,获取更全面的数据信息.其次,将融合后的无线局域网数据划分为确定集和模糊集,采用支持向量机标注确定集数据标签,利用K-近邻(KNN)分类器标注模糊集数据标签,从而实现无线局域网多模态数据标签自适应标注.实验结果表明,该方法的重复数据删除率始终高于12%,一致指数为0.9928,平均绝对百分比误差为0.4539,ROC曲线更靠近坐标轴左上角,AUC值为0.9824,内存占用率始终低于10%,无线局域网多模态数据标签标注效果较好. 展开更多
关键词 无线局域网 多模态数据 标签标注 支持向量机 KNN分类器
在线阅读 下载PDF
基于多模态的缺陷绝缘子图像的多标签分类 被引量:5
14
作者 周景 王满意 田兆星 《高电压技术》 北大核心 2025年第2期642-651,共10页
对巡检图像中绝缘子缺陷准确分类是输电线路自动巡检领域中的关键技术之一。针对传统深度学习的分类方法对文本信息利用不够充分以及绝缘子图像分类标签较为单一的问题,该文首次提出了一种基于多模态的缺陷绝缘子图像的多标签分类方法... 对巡检图像中绝缘子缺陷准确分类是输电线路自动巡检领域中的关键技术之一。针对传统深度学习的分类方法对文本信息利用不够充分以及绝缘子图像分类标签较为单一的问题,该文首次提出了一种基于多模态的缺陷绝缘子图像的多标签分类方法。首先,采用一种多模态联合数据增强方法,实现了绝缘子图像和标签文本间跨模态的数据增强。然后,使用Vision Transformer网络提取图像的特征信息和BERT网络提取标签文本的特征信息,充分利用图像和标签文本的特征信息,从不同模态获取全面的信息,提高了网络的分类能力。最后,通过对比学习的方式将图像和文本的特征信息关联,增强网络分类的可靠性的同时,又为分类结果提供了良好的可解释性。实验结果表明,该方法的分类总体准确率达到93.87%,在同一数据集中对比其他模型,分类性能具有明显优势,为多模态技术在电网领域的应用提供了较好的基础。 展开更多
关键词 绝缘子图像 多标签分类 多模态 对比学习 数据增强
原文传递
面向绿色转型的数字化标识可选数据载体与访问技术比较浅析
15
作者 夏玉娟 刘荣宽 何源 《标准科学》 2025年第12期123-129,共7页
【目的】随着全球绿色转型的加速,产品标识数字化成为促进绿色消费和产业低碳转型的重要支撑。【方法】本文立足全球标识数字化发展趋势,梳理各国绿色可持续标识实践案例,对比分析二维码、RFID、NFC、星闪等典型数据载体与访问技术的核... 【目的】随着全球绿色转型的加速,产品标识数字化成为促进绿色消费和产业低碳转型的重要支撑。【方法】本文立足全球标识数字化发展趋势,梳理各国绿色可持续标识实践案例,对比分析二维码、RFID、NFC、星闪等典型数据载体与访问技术的核心特性及应用差异。【结果】研究发现,全球标识已形成“物理标识+数字化载体”融合发展格局,我国在能效标识二维码应用、大湾区碳足迹标识数字化平台建设等方面积累了实践基础。不同技术适配场景存在显著差异,二维码凭借低成本、高普及率优势主导通用产品场景,RFID/NFC依托动态更新与高安全性适配工业监管、供应链追溯及高价值产品防伪溯源等场景,星闪技术以大容量存储、低时延特性满足智能制造装备等工业物联网全生命周期数据管理需求。【结论】研究认为,应通过构建分层分类技术适配体系、推进数据载体标准化建设、强化数据载体动态交互能力、平衡技术创新与应用便捷性,助力绿色可持续类标识数字化高效升级。 展开更多
关键词 数字化标识 绿色标识 数据载体与访问技术
在线阅读 下载PDF
基于标记属性图的Wikidata人物关系可视化数据分析
16
作者 刘鹏鹏 赵占芳 王楠 《新一代信息技术》 2021年第12期13-18,共6页
通过人物关系分析挖掘实体之间的联系,在数据挖掘领域具有重要的研究意义。本文提出了一种基于标记属性图模型的可视化实体关系分析框架,以人物关系分析为研究案例,对诺贝尔化学奖得主的人物关系进行了可视化的实证分析。标记属性图模... 通过人物关系分析挖掘实体之间的联系,在数据挖掘领域具有重要的研究意义。本文提出了一种基于标记属性图模型的可视化实体关系分析框架,以人物关系分析为研究案例,对诺贝尔化学奖得主的人物关系进行了可视化的实证分析。标记属性图模型能够有效的刻画实体之间的关系,便于挖掘实体之间的内在联系。本研究探索了属性图模型在人物关系分析中的应用,为知识发现和关联关系的研究提供了不同的视角。 展开更多
关键词 标记属性图 可视化分析 数据挖掘 Wikidata知识库 Neo4j图数据库
在线阅读 下载PDF
基于CGAN台风气象下负荷场景生成 被引量:4
17
作者 罗萍萍 盛奥 +3 位作者 林济铿 王忠岳 李启本 周平 《中国电力》 北大核心 2025年第2期176-185,共10页
台风天气下负荷水平的剧烈波动威胁电网平衡,相应地台风气象条件下的负荷场景生成受到电力公司的重视。因此,提出一种面向台风天气基于条件生成对抗网络(conditional generative adversarial network,CGAN)模型的负荷场景生成算法。首先... 台风天气下负荷水平的剧烈波动威胁电网平衡,相应地台风气象条件下的负荷场景生成受到电力公司的重视。因此,提出一种面向台风天气基于条件生成对抗网络(conditional generative adversarial network,CGAN)模型的负荷场景生成算法。首先,针对台风样本登陆位置分散、持续周期不同及等级不同的特点,提出一种台风下负荷样本的拆分及标签给定方法。然后,针对台风气象下负荷样本数量稀少,提出一种基于条件概率的样本扩充策略以扩充样本集。最后,为了进一步提升样本集的有效性,基于迁徙训练思想,先用正常气象下的负荷样本对CGAN进行训练,然后再采用台风样本集训练CGAN,在模型训练完成后,输入随机噪声与台风标签即可生成对应的负荷场景。算例证实了所提模型及算法的有效性和先进性。 展开更多
关键词 台风气象 负荷场景生成 数据扩充 标签 人工智能
在线阅读 下载PDF
地面沉降立体监测数据融合方法 被引量:1
18
作者 杨魁 邱亚辉 +3 位作者 徐骏千 梁军 李文彬 孙国昱 《测绘通报》 北大核心 2025年第2期122-126,142,共6页
针对目前单一监测方法造成的地面沉降情况掌握不精确的问题,本文采用平台、参数协同完善了“空中-地表-地下”的地面沉降立体监测体系,构建了空中与地表测量的融合模型后,利用最小二乘法获取高精度沉降数据;采用可视化、时空统计等方法... 针对目前单一监测方法造成的地面沉降情况掌握不精确的问题,本文采用平台、参数协同完善了“空中-地表-地下”的地面沉降立体监测体系,构建了空中与地表测量的融合模型后,利用最小二乘法获取高精度沉降数据;采用可视化、时空统计等方法开展了空中/地表与地下数据融合,实现地面沉降精准诱因的获取。以天津市某区域为例,本文构建了由InSAR、水准、分层标等组成的地面沉降立体监测体系;利用InSAR、GNSS、水准监测数据进行融合获取高精度的地面沉降成果,中误差提高比率达20%,验证了空中与地表融合方法的有效性。此外通过结合地下水位、一孔多标分层标观测数据,从定性与定量角度进行集成分析,得到地下水开采是该区域地面沉降较严重主要原因的结论。试验结果验证了本文方法能提高地面沉降监测的可靠性,实现地面沉降诱因精准判断,其结果可为地面沉降综合防治提供支撑。 展开更多
关键词 地面沉降 立体监测 数据融合 分层标监测 沉降诱因
原文传递
DRO框架下不平衡分类损失函数重加权优化 被引量:1
19
作者 李佳静 林耿 《计算机应用研究》 北大核心 2025年第8期2428-2436,共9页
在不平衡数据的多分类任务中,由于类别分布存在数量差异,分类器的决策边界往往偏向多数类别,从而导致模型难以实现准确分类。现有研究主要关注于数据平衡策略和损失函数的结构调整,忽视了样本标签可能存在标注错误或噪声,标签信息的不... 在不平衡数据的多分类任务中,由于类别分布存在数量差异,分类器的决策边界往往偏向多数类别,从而导致模型难以实现准确分类。现有研究主要关注于数据平衡策略和损失函数的结构调整,忽视了样本标签可能存在标注错误或噪声,标签信息的不确定性会进一步增加分类的难度。为解决这一问题,提出了一种名为加权标签分布稳健(weighted label distributionally robust Kullback-Leibler,WLDR-KL)的损失函数。该损失利用先验信息和标签权重显式地调整模型对少数类别的关注度,通过优化最不利的集合下的预测分布来应对数据标签不确定性下的不平衡分类任务。此外,利用Monte Carlo模拟提出了一种不平衡数据集的仿真方法,以更全面地评估各损失函数在不同类别和不同数量差异水平下的表现。在多组模拟数据集、UCI和Kaggle数据集上的实验结果表明,所提出的方法在处理不平衡数据时表现良好,并且在top-k准确率、F_(1)值、精度、召回率上均实现了一定程度的提升,为解决不平衡分类问题提供了一种有效的方法。 展开更多
关键词 不平衡分类 数据标签不确定性 加权标签分布稳健损失
在线阅读 下载PDF
大数据背景下电力数据交互平台的实时监控与异常检测模型 被引量:4
20
作者 张思雨 吴佐平 +2 位作者 谢敏 余锦河 张鹏 《自动化技术与应用》 2025年第5期182-187,共6页
在大数据时代,电力系统面临着越来越复杂的运行环境,为了有效应对电力数据交互平台中的实时监控与异常检测挑战,首先提取大数据平台存储管理中的数据特征,建立数据标签化规则,标签各类设备以便进行属性关联。其次,利用电力数据交互平台... 在大数据时代,电力系统面临着越来越复杂的运行环境,为了有效应对电力数据交互平台中的实时监控与异常检测挑战,首先提取大数据平台存储管理中的数据特征,建立数据标签化规则,标签各类设备以便进行属性关联。其次,利用电力数据交互平台模型筛选数据,同时调用函数执行信息接收处理规划程序,完成异常检测。仿真发现在检测时长大于15 s以上时,大数据算法检测数量高于6条,所设计监测系统的平均误差对应的是7.04 kbps和9次,特征相关系数基本都在0.5以上。说明大数据背景下开展电力监测,能够提高电力系统的稳定性、安全性和运行效率。 展开更多
关键词 电力系统 数据交互平台 实时监控 异常检测 数据交互 标签化规则
在线阅读 下载PDF
上一页 1 2 30 下一页 到第
使用帮助 返回顶部