期刊文献+
共找到467篇文章
< 1 2 24 >
每页显示 20 50 100
If real-time route and high-speed data is important, GoTa is vital.
1
《ZTE Communications》 2008年第2期65-65,共1页
GoTa TM from ZTE is the world’s first CDMA-based system. Now, ZTE proudly introduces its third-generation digital trunking system featuring
关键词 GoTa is vital If real-time route and high-speed data is important real time high data
在线阅读 下载PDF
If real-time route and high-speed data is important,GoTa is vital.
2
《ZTE Communications》 2008年第1期3-3,共1页
GoTaTM from ZTE is the world’s first CDMA-based system. Now, ZTE proudly introduces its third-generation digital trunking system featuring a centralized dispatch,
关键词 GoTa is vital If real-time route and high-speed data is important real time high data
在线阅读 下载PDF
If real-time route and high-speed data is important, GoTa is vital.
3
《ZTE Communications》 2008年第4期67-67,共1页
Go Tafrom ZTE is the world’s first CDMA-based system. Now, ZTE proudly introduces its third-generation digital trunking system featuring a centralized dispatch,
关键词 GOTA If real-time route and high-speed data is important GoTa is vital real time high data
在线阅读 下载PDF
药物临床试验数据跨境流动问题研究
4
作者 陈锋 由玉伟 《中国食品药品监管》 2025年第10期24-29,共6页
近年来,我国医药产业发展迅速,国际化进程加快,药物临床试验数据跨境流动需求大增。然而,数据跨境流动存在风险,需要遵循《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律法规及配套... 近年来,我国医药产业发展迅速,国际化进程加快,药物临床试验数据跨境流动需求大增。然而,数据跨境流动存在风险,需要遵循《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律法规及配套文件对数据出境的相关要求。药物临床试验数据具有涉及敏感个人信息、需取得个人同意、具有良好行业数据保护基础等特点。当前,医药企业在数据出境时面临重要数据识别难、取得个人单独同意难、出境操作流程繁琐等挑战。为应对相关挑战,建议医药企业牵头确保重要数据识别准确,推动研究者共同落实个人信息保护要求,并主动配合政府部门共同推动数据高效跨境流动,以促进医药产业高质量发展。 展开更多
关键词 临床试验数据 数据跨境流动 重要数据 个人信息保护 合规路径
暂未订购
数字服务进口贸易与东道国经济增长——基于跨境数据要素流入视角 被引量:4
5
作者 陈治 郝爽 《统计研究》 北大核心 2025年第3期103-116,共14页
数字服务进口贸易是跨境数据要素流入的载体和数字经济外循环的表现形式,对东道国畅通经济外循环、赋能内循环具有重要意义。本文基于48个样本国家2005—2021年的面板数据,从跨境数据要素流入视角研究数字服务进口贸易对东道国经济增长... 数字服务进口贸易是跨境数据要素流入的载体和数字经济外循环的表现形式,对东道国畅通经济外循环、赋能内循环具有重要意义。本文基于48个样本国家2005—2021年的面板数据,从跨境数据要素流入视角研究数字服务进口贸易对东道国经济增长的影响和作用机制。结果表明:数字服务进口贸易对东道国经济增长具有短期正效应和长期负效应;数字服务进口贸易对东道国经济增长的短期正效应通过促进数据要素、人力资本要素、数字技术领域技术要素升级和要素禀赋结构优化实现;数字服务贸易壁垒会削弱数字服务进口贸易对东道国经济增长的短期正效应,数字经济发展会强化数字服务进口贸易对东道国经济增长的短期正效应、弱化长期负效应;数字服务进口贸易对东道国福利具有短期正效应。本文建议扩大数字服务进口、重视跨境数据要素融合、优化数字服务进口贸易发展环境从而更持续地激发跨境数据要素价值。 展开更多
关键词 数字服务进口贸易 经济增长 跨境数据要素 要素禀赋
在线阅读 下载PDF
面向大规模机构分散存储数据的基于属性的实体对齐算法
6
作者 曹泽毅 昌燕 +5 位作者 赖仁鑫 张仕斌 秦智 闫丽丽 张雪健 狄元灏 《计算机应用》 北大核心 2025年第10期3195-3202,共8页
大规模机构分散存储的数据实体存在数据冗余、信息缺失和不一致等问题,需要通过实体对齐进行集成融合。现有的实体对齐方法大多依赖实体的结构信息,通过子图匹配进行对齐,但分散存储数据的结构信息匮乏,导致对齐效果不佳。为解决上述问... 大规模机构分散存储的数据实体存在数据冗余、信息缺失和不一致等问题,需要通过实体对齐进行集成融合。现有的实体对齐方法大多依赖实体的结构信息,通过子图匹配进行对齐,但分散存储数据的结构信息匮乏,导致对齐效果不佳。为解决上述问题,并支撑重要数据的识别,提出一种单层图神经网络的基于属性的实体对齐模型。首先,使用单层图神经网络避免次级邻居节点的信息干扰;其次,设计基于信息熵的属性赋权方法,从而在初始阶段快速区分属性的重要程度;最后,构建基于注意力机制的编码器,以结合局部和全局视角表征不同属性在对齐中的重要程度,更全面地表征实体信息。实验结果表明,在2个分散存储数据集上,相较于次优模型,所提模型的前1位命中率(Hits@1)分别提升了5.24和2.03个百分点。可见,所提模型的对齐效果优于其他实体对齐方法。 展开更多
关键词 重要数据识别 数据融合 信息熵 实体对齐 注意力机制
在线阅读 下载PDF
基于KNN-ERT算法的铁路继电器不良数据处理方法
7
作者 刘树鑫 柴宇凡 +2 位作者 李哲 贺恩平 姚旺 《铁道科学与工程学报》 北大核心 2025年第10期4737-4748,共12页
针对在处理铁路继电器退化特征参数中的不良数据时传统方法存在效率低下、需要预先标记异常值、鲁棒性差、准确度较低等问题,提出一种基于KNN-ERT算法的不良数据处理方法。以铁路列车常用的西门子3RH2122-2KF40型号直流继电器为实验对象... 针对在处理铁路继电器退化特征参数中的不良数据时传统方法存在效率低下、需要预先标记异常值、鲁棒性差、准确度较低等问题,提出一种基于KNN-ERT算法的不良数据处理方法。以铁路列车常用的西门子3RH2122-2KF40型号直流继电器为实验对象,首先,利用铁路直流继电器寿命实验平台采集线圈与触头的电信号,并以计算得到的8种退化特征参数作为原始数据;然后,利用孤立森林算法去除所得退化特征参数中的不良数据,该算法可以有效地处理高维特征空间;最后,使用KNN-ERT算法进行数据插值,该方法充分利用KNN的局部特征捕捉能力和ERT的集成学习优势,从而提高数据填补的准确性与鲁棒性。将含有缺失值的数据集分别输入7种不同的插值模型进行插值对比,使用RMSE、MSE、SNR和量化图评价指标进行插值结果评估。实验结果表明:本文提出的算法插值结果在多个不同的评价指标下均优于传统的线性插值、随机森林、KNN和ERT等算法,鲁棒性强,准确度高,在有效处理数据集的局部相似性的同时避免了数据过拟合的风险,实验结果证明了该算法的优越性。研究结果为后续实验中对继电器的健康状态分析打下了更为坚实的基础。 展开更多
关键词 铁路继电器 不良数据 极端随机树 特征重要度 数据填补
在线阅读 下载PDF
从进出口数据分析我国模具产业近10年发展情况 被引量:1
8
作者 张莉 《模具工业》 2025年第6期1-7,共7页
通过检索、分析海关总署公布的2015-2024年模具进出口数据发现,我国模具十年内基本保持贸易顺差,出口年均增长6.14%,进口年均下降9.6%,出口首要目的地为美国,进口相对依赖于日本、韩国、德国、中国台湾地区。细分品类中,出口额最高的是... 通过检索、分析海关总署公布的2015-2024年模具进出口数据发现,我国模具十年内基本保持贸易顺差,出口年均增长6.14%,进口年均下降9.6%,出口首要目的地为美国,进口相对依赖于日本、韩国、德国、中国台湾地区。细分品类中,出口额最高的是“其他塑料或橡胶用注模或压模”,发货注册地中,广东、江苏、浙江出口总额占比最高,相关数据可为产业决策提供参考。 展开更多
关键词 模具 进出口 海关 数据
在线阅读 下载PDF
面向遥感数据的基于本地差分隐私的联邦学习隐私保护方案 被引量:2
9
作者 陈海田 陈学斌 +1 位作者 马锐奎 张帅华 《计算机应用》 北大核心 2025年第2期506-517,共12页
遥感数据具有高度的时空相关性以及复杂的地物特征,使得这些数据的隐私保护面临挑战。联邦学习作为一种旨在保护参与方数据隐私的分布式学习方法,为应对遥感数据隐私保护面对的挑战提供了有效的解决方案;然而,在联邦学习模型的训练阶段... 遥感数据具有高度的时空相关性以及复杂的地物特征,使得这些数据的隐私保护面临挑战。联邦学习作为一种旨在保护参与方数据隐私的分布式学习方法,为应对遥感数据隐私保护面对的挑战提供了有效的解决方案;然而,在联邦学习模型的训练阶段,恶意攻击者可能通过反演推断参与者的隐私信息,进而导致敏感信息的泄露。针对遥感数据在联邦学习训练中存在的隐私泄露问题,提出一种基于本地差分隐私的联邦学习隐私保护方案。首先,对模型进行预训练,计算模型的层重要性,并根据层重要性合理分配隐私预算;然后,通过对模型更新进行裁剪变换,并对裁剪值进行自适应随机扰动,实现本地差分隐私保护;最后,在聚合扰动更新时,采用模型校正以进一步提高模型性能。理论分析和仿真结果表明,所提方案不仅能为各参与方提供合适的差分隐私保护,并有效防止通过反演推断出隐私敏感信息,而且在3个遥感数据集上相较于基于分段机制的扰动方案提升了3.28~3.93个百分点的准确率。可见,所提方案在保证隐私的同时有效保障了模型性能。 展开更多
关键词 联邦学习 差分隐私 层重要性 遥感数据 模型校正
在线阅读 下载PDF
基于数据预处理和改进麻雀算法的岩爆预测
10
作者 张鼎 周宗红 《高压物理学报》 北大核心 2025年第7期111-124,共14页
为解决机器学习岩爆预测中存在离群样本、样本不均衡、麻雀搜索算法易陷入局部最优等问题,从数据预处理和算法改进2个角度建立岩爆预测模型。首先,基于岩性条件和应力条件,选取围岩最大切向应力、抗压强度、抗拉强度和弹性能量指数作为... 为解决机器学习岩爆预测中存在离群样本、样本不均衡、麻雀搜索算法易陷入局部最优等问题,从数据预处理和算法改进2个角度建立岩爆预测模型。首先,基于岩性条件和应力条件,选取围岩最大切向应力、抗压强度、抗拉强度和弹性能量指数作为特征指标,采用3种机器学习算法,结合5折交叉验证方法构建预测模型。在数据预处理阶段,收集了174组国内外岩爆案例建立数据库,针对离群样本,引入局部离群因子(LOF)算法,根据岩爆等级逐级检测并剔除离群样本;针对样本不均衡问题,引入自适应过采样方法(ADASYN)增加少数类样本数目。采用3种混合策略改进麻雀搜索算法,利用改进的麻雀搜索算法(ISSA)对极限梯度提升树(XGBoost)、随机森林(RF)、多层感知机(MLP)3种机器学习算法参数寻优,分析准确率、精确率等多个评价指标,对模型进行有效性验证。结果表明,新构建的最优模型ISSAXGBoost的准确率达到了94.12%,具有较高的预测准确率。此外,对4种特征指标进行特征重要性分析,确定了围岩最大切向应力是最重要特征。 展开更多
关键词 岩爆预测 数据预处理 算法改进 特征重要性 机器学习
在线阅读 下载PDF
基于机器学习与配合比的混凝土电通量预测
11
作者 李逸飞 石新波 +3 位作者 林宝臣 王威 肖会刚 刘家林 《硅酸盐通报》 北大核心 2025年第10期3634-3643,共10页
针对混凝土传输性评价问题,基于已知配合比建立了混凝土电通量的机器学习预测模型,并揭示关键影响因素及影响规律。通过集成极端梯度提升(XGBoost)、支持向量回归(SVR)等6种机器学习算法,基于48组试验数据构建预测模型,采用沙普利加性解... 针对混凝土传输性评价问题,基于已知配合比建立了混凝土电通量的机器学习预测模型,并揭示关键影响因素及影响规律。通过集成极端梯度提升(XGBoost)、支持向量回归(SVR)等6种机器学习算法,基于48组试验数据构建预测模型,采用沙普利加性解释(SHAP)函数解析特征贡献度。结果表明:XGBoost模型预测精度最高(R^(2)=0.983 6),砂用量与含气量为混凝土电通量核心影响因素;数据分析显示,水胶比约为0.4时,电通量达到最低值,砂率在30.5%~35.3%,可使电通量维持在较低水平。研究为混凝土耐久性预测提供了理论依据与量化方法。 展开更多
关键词 混凝土 电通量 氯离子 机器学习 权重分析 大数据
在线阅读 下载PDF
基于重要性采样的异质超网络表示学习
12
作者 夏青青 朱宇 +2 位作者 王晓英 黄建强 曹腾飞 《计算机工程》 北大核心 2025年第11期133-143,共11页
异质超网络能够建模现实世界中的各种高阶元组关系,表征超网络的异质高阶信息,同时异质超网络具有不同程度的不可分解性,而现有研究方法没有充分考虑高阶元组关系(超边)的不可分解性。针对上述问题,提出一种基于重要性采样的异质超网络... 异质超网络能够建模现实世界中的各种高阶元组关系,表征超网络的异质高阶信息,同时异质超网络具有不同程度的不可分解性,而现有研究方法没有充分考虑高阶元组关系(超边)的不可分解性。针对上述问题,提出一种基于重要性采样的异质超网络表示学习方法HRIS,将紧密高阶元组关系融入超网络表示学习中。首先,该方法提出判断节点的概念,融合不可分解因子与元组相似度改进随机游走对重要节点的采样来捕获超网络中紧密的高阶元组关系。其次,为了使序列更具全局性与多样性,引入数据增强中的随机交换方法来解决过拟合问题,同时提出基于节点度的随机删除方法提升鲁棒性。最后,构建一个负采样增强的skip-gram模型NSE-skip-gram来获得高质量的节点表示向量。在4个真实数据集上的实验结果表明:对于链接预测任务,HRIS显著优于基线方法;对于超网络重建任务,在所有重建比例下,HRIS在全球定位系统(GPS)和drug数据集上较最优基线方法平均提升3.75和9.79百分点。 展开更多
关键词 表示学习 高阶元组关系 重要性采样 数据增强 负采样增强 链接预测 超网络重建
在线阅读 下载PDF
基于GEE云平台的小江流域泥石流迹地空间分布制图
13
作者 宗慧琳 袁希平 +3 位作者 甘淑 杨明龙 吕杰 张晓伦 《光谱学与光谱分析》 北大核心 2025年第4期1045-1060,共16页
快速、准确、详尽调研泥石流孕灾区域的分布信息能够帮助了解、深刻认识泥石流分布范围、分布规律及成因,并进一步根据具体情况找到科学的监测、预测、预防和治理的技术手段,从而减少泥石流灾害带来的问题与损失。为寻求高效、高精度的... 快速、准确、详尽调研泥石流孕灾区域的分布信息能够帮助了解、深刻认识泥石流分布范围、分布规律及成因,并进一步根据具体情况找到科学的监测、预测、预防和治理的技术手段,从而减少泥石流灾害带来的问题与损失。为寻求高效、高精度的泥石流空间分布提取方法,以云南省小江流域作为研究区,利用谷歌地球引擎(Google Earth Engine,GEE)平台和随机森林算法,有效地提取了泥石流迹地的空间分布。首先利用2022年Sentinel-2影像及地形数据构建4类特征变量(光谱特征、指数特征、地形特征、纹理特征)作为特征集合,接着将随机森林特征变量重要性评分和J-M距离结合进行特征优选研究与分析,探讨了各个特征变量对泥石流迹地提取的重要性;最后设置不同特征组合形成6种不同的提取方案,对比分析6种试验方案提取泥石流迹地的精度,确定最优方案以提高识别精度。研究表明:(1)无论是否进行特征优选,加入地形特征变量的泥石流迹地提取精度均优于仅使用光学影像数据的精度,可见地形数据有利于泥石流迹地信息提取;(2)不同类型的特征变量对分类精度的影响不同,特征重要性评分由高到低的特征类型为地形特征、指数特征、纹理特征、光谱特征;(3)基于Sentinel-2光学影像和地形数据的多源数据构建多维特征变量并进行特征优选的试验方案6,提取到的2022年云南省小江流域泥石流迹地空间分布图最优,总体精度为94.95%,Kappa系数为0.94,泥石流迹地的制图精度为91.01%,用户精度为95.29%,该方案不仅提高了分类精度还有效降低了数据冗余。利用Google Earth Engine平台,光学遥感影像和地形数据相结合的多源数据以及随机森林算法,能够快速、准确、高效地制作较大范围地物覆盖复杂地区的泥石流迹地空间分布图,具有较大的应用潜力。 展开更多
关键词 泥石流区提取 特征优选 J-M距离 Google Earth Engine Sentinel-2数据 随机森林 特征变量重要性
在线阅读 下载PDF
基于Visual LISP的卫星雷达干涉测量数据导入插件的设计及应用
14
作者 王招冰 《现代信息科技》 2025年第2期145-148,153,共5页
目前合成孔径雷达干涉测量(Interferometric Synthetic Aperture Radar,InSAR)技术已经广泛在工程监测、地质灾害监测等领域得到应用。文章基于Visual LISP语言,开发了可以将海量InSAR监测点数据批量导入至AutoCAD软件的插件。该插件将I... 目前合成孔径雷达干涉测量(Interferometric Synthetic Aperture Radar,InSAR)技术已经广泛在工程监测、地质灾害监测等领域得到应用。文章基于Visual LISP语言,开发了可以将海量InSAR监测点数据批量导入至AutoCAD软件的插件。该插件将InSAR成果数据文件进行关键信息提取,并实现了对成果数据中的坐标系统与工程设计常用的独立坐标系统的转换,将数值直接以数值文字的方式写入对应AutoCAD文件中,使监测数据与目标位置精确匹配。经实际工程数据导入应用测试,该插件实现56万条数据的导入仅需约90 s,极大降低了使用人员将监测数据导入工程图纸的工作量,提升了InSAR监测数据在工程应用上的效率。 展开更多
关键词 Visual LISP 二次开发 数据导入 程序设计
在线阅读 下载PDF
基于AI的多模态融合感知综合决策系统设计实现 被引量:3
15
作者 冯晓辉 艾润 +1 位作者 刘林青 眭臻 《现代电子技术》 北大核心 2025年第1期173-178,共6页
针对传统军事要地安防系统智能化程度较低,各自独立互不关联,缺少顶层数据综合治理等问题,选取外围周界、重要卡口、无人巡更和区域高点四种典型安防业务场景开展建模,通过数据标准化接入、智能研判分析、安防态势显示三个处理环节,构... 针对传统军事要地安防系统智能化程度较低,各自独立互不关联,缺少顶层数据综合治理等问题,选取外围周界、重要卡口、无人巡更和区域高点四种典型安防业务场景开展建模,通过数据标准化接入、智能研判分析、安防态势显示三个处理环节,构建基于AI的多模态融合感知综合决策系统,实现前端感知多维化、中台研判智能化、后端处置多样化,有效支撑了重要军事目标安全防卫,系统后续也具有良好的可扩展性与可维护性。 展开更多
关键词 要地防卫 多模态数据融合 场景建模 规则定制 感知处置决策 智能化安防系统
在线阅读 下载PDF
多云储存下异构数据库数据快速迁移方法研究
16
作者 敖知琪 康旖 +1 位作者 任昊文 王金贺 《微型电脑应用》 2025年第9期285-289,共5页
异构数据库中的数据较为分散,较多的相似数据和冗余数据影响到了数据迁移进度,导致数据迁移难度增加,为此提出多云储存下异构数据库数据快速迁移方法。对多云储存下异构数据库中的数据实施分类,利用数据的散列值判断数据间之间的相似度... 异构数据库中的数据较为分散,较多的相似数据和冗余数据影响到了数据迁移进度,导致数据迁移难度增加,为此提出多云储存下异构数据库数据快速迁移方法。对多云储存下异构数据库中的数据实施分类,利用数据的散列值判断数据间之间的相似度,获取相似数据并剔除冗余数据。通过数据重要性评估模型实现对数据的重要性评估,根据数据重要性决定数据迁移的先后顺序;利用哈密顿随机效应构建数据迁移模型,结合数据的重要性对数据进行分批迁移,实现数据快速迁移的目标。实验结果表明,所提方法不仅能够合理删除冗余数据,而且单位时间内数据吞吐量大、对设备内存要求较低,能够很好地实现各类设备数据的快速迁移,对于数据迁移领域的研究能够奠定坚实的理论基础。 展开更多
关键词 异构数据库 多云储存 数据迁移 冗余数据 重要性评估
在线阅读 下载PDF
基于数据增强和多解释方法融合的入侵检测方法
17
作者 熊炫睿 郭星佑 +2 位作者 宁兆龙 张玉树 周力 《通信学报》 北大核心 2025年第10期191-206,共16页
为了解决入侵检测系统中现有解释方法给出不一致结果、模型决策缺乏可信度的问题,提出并设计了多解释方法融合技术。该技术通过一致性、聚焦性和稳定性指标,融合沙普利加性解释(SHAP)、局部可解释模型(LIME)和置换特征重要性(PFI)的优势... 为了解决入侵检测系统中现有解释方法给出不一致结果、模型决策缺乏可信度的问题,提出并设计了多解释方法融合技术。该技术通过一致性、聚焦性和稳定性指标,融合沙普利加性解释(SHAP)、局部可解释模型(LIME)和置换特征重要性(PFI)的优势,建立客观权重计算机制,生成更可靠的特征重要性解释结果。针对数据不平衡导致解释稳定性差及少数类检测性能低的问题,采用数据平衡技术提供稳定数据基础。实验结果表明,所提方法显著增强了模型解释的可靠性和一致性,并进一步提升了入侵检测性能。 展开更多
关键词 入侵检测 可解释性 多解释方法融合 特征重要性 数据平衡
在线阅读 下载PDF
《博物志》辑补二卷科技史料整理与价值研究
18
作者 许晓东 《怀化学院学报》 2025年第5期123-128,共6页
《博物志》辑补二卷中所载的科技史料仍有其当代价值。首先,梳理周心如其人与辑补过程,重点分析其通过唐宋文献补遗《博物志》残缺的贡献。其次,阐释了周心如以“类书”方法对文本的辑补原则与策略,以及其为正名《博物志》所进行的学术... 《博物志》辑补二卷中所载的科技史料仍有其当代价值。首先,梳理周心如其人与辑补过程,重点分析其通过唐宋文献补遗《博物志》残缺的贡献。其次,阐释了周心如以“类书”方法对文本的辑补原则与策略,以及其为正名《博物志》所进行的学术辨析。周心如的辑补既补正了文本错漏,也延续了张华“格物致知”的科学实践精神,为当代跨学科研究提供了重要历史资料和思想启示。 展开更多
关键词 《博物志》 辑补 科技史料 价值
在线阅读 下载PDF
对作为独立数据类型的“重要数据”的发生史与本体论考察
19
作者 张建文 《上海政法学院学报(法治论丛)》 2025年第1期53-64,共12页
“重要数据”从仅具有日常意义的表述,到作为在立法上具有独立地位的数据类型,经历了《网安法》和《数安法》,再到《条例》才逐渐形成较为完整的法制框架,包括目录管理制与确认告知或公开发布制,以及重要数据处理者的识别申报义务、重... “重要数据”从仅具有日常意义的表述,到作为在立法上具有独立地位的数据类型,经历了《网安法》和《数安法》,再到《条例》才逐渐形成较为完整的法制框架,包括目录管理制与确认告知或公开发布制,以及重要数据处理者的识别申报义务、重要数据安全保护义务、实施特定处理行为时的特别义务、年度风险评估义务、处理重要数据的大型网络平台服务提供者的特殊义务。“重要数据”作为数据法律制度,取得了与国家秘密与工作秘密、隐私与个人信息、商业秘密和保密商务信息、政府信息、档案信息与文献信息,以及拟议中的商业数据等数据类型相并列的地位,但仍存在自身内部与核心数据和一般数据的区别,以及在外部与其他数据类型的精确区分问题。 展开更多
关键词 数据制度 重要数据 个人信息 直接报告权 数据法制
在线阅读 下载PDF
基于SMOTE-CatBoost-SHAP的面向严重非均衡数据集欺诈检测研究——以进出口申报企业欺诈检测场景为例
20
作者 薛永磊 郭晓桢 +4 位作者 成应强 童顺立 李晟 陈剑峰 王璐茜 《价值工程》 2025年第20期141-145,共5页
在风险欺诈检测领域,存在风险的样本通常只占极少数类,而严重非均衡数据集的分类问题会导致模型过拟合或欠拟合影响模型效果。本研究旨在利用数据均衡技术与机器学习相结合,从而削弱上述现象,提升模型性能。此外,在针对模型检测结果进... 在风险欺诈检测领域,存在风险的样本通常只占极少数类,而严重非均衡数据集的分类问题会导致模型过拟合或欠拟合影响模型效果。本研究旨在利用数据均衡技术与机器学习相结合,从而削弱上述现象,提升模型性能。此外,在针对模型检测结果进行风险评估与处置时,业务专家更加关注黑盒模型的可解释性,本研究在上述模型架构基础上引入SHAP识别欺诈行为的重要影响因素,提升模型的可解释性与场景易用性。研究以进出口贸易欺诈检测为应用场景,利用真实海关报关单数据集验证本文提出的SMOTECatBoost-SHAP的风险欺诈检测模型的分类准确率和可解释性。 展开更多
关键词 机器学习 欺诈检测 非均衡数据 可解释性 进出口
在线阅读 下载PDF
上一页 1 2 24 下一页 到第
使用帮助 返回顶部