期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
Dropout training for SVMs with data augmentation 被引量:1
1
作者 Ning CHEN Jun ZHU +1 位作者 Jianfei CHEN Ting CHEN 《Frontiers of Computer Science》 SCIE EI CSCD 2018年第4期694-713,共20页
Dropout and other feature noising schemes have shown promise in controlling over-fitting by artificially corrupting the training data. Though extensive studies have been performed for generalized linear models, little... Dropout and other feature noising schemes have shown promise in controlling over-fitting by artificially corrupting the training data. Though extensive studies have been performed for generalized linear models, little has been done for support vector machines (SVMs), one of the most successful approaches for supervised learning. This paper presents dropout training for both linear SVMs and the nonlinear extension with latent representation learning. For linear SVMs, to deal with the intractable expectation of the non-smooth hinge loss under corrupting distributions, we develop an iteratively re-weighted least square (IRLS) algorithm by exploring data augmentation techniques. Our algorithm iteratively minimizes the expectation of a re- weighted least square problem, where the re-weights are analytically updated. For nonlinear latent SVMs, we con- sider learning one layer of latent representations in SVMs and extend the data augmentation technique in conjunction with first-order Taylor-expansion to deal with the intractable expected hinge loss and the nonlinearity of latent representa- tions. Finally, we apply the similar data augmentation ideas to develop a new IRLS algorithm for the expected logistic loss under corrupting distributions, and we further develop a non-linear extension of logistic regression by incorporating one layer of latent representations. Our algorithms offer insights on the connection and difference between the hinge loss and logistic loss in dropout training. Empirical results on several real datasets demonstrate the effectiveness of dropout training on significantly boosting the classification accuracy of both linear and nonlinear SVMs. 展开更多
关键词 DROPOUT SVMS logistic regression data aug- mentation iteratively reweighted least square
原文传递
“动态+泛知情同意”在医疗机构实施初探 被引量:22
2
作者 陈晓云 田雨 +3 位作者 平立 董亮 沈亮 陆丽丽 《中国医学伦理学》 2018年第4期487-491,共5页
随着大数据的广泛深入应用,目前医疗机构或科研机构使用医疗数据或利用患者剩余样本进行分析研究的需求很大,但根据近两年我国的法律法规和国际伦理发展,对此类研究须满足研究前的知情同意程序。但由于这些研究的特殊性,进行传统的面对... 随着大数据的广泛深入应用,目前医疗机构或科研机构使用医疗数据或利用患者剩余样本进行分析研究的需求很大,但根据近两年我国的法律法规和国际伦理发展,对此类研究须满足研究前的知情同意程序。但由于这些研究的特殊性,进行传统的面对面知情告知并同意的困难很大甚至无法进行。泛知情同意是欧美近十年逐步推行的一种特殊知情同意方式。结合我国的情况,从泛知情同意利弊方面进行分析,提出与动态知情同意相结合进行推行的"动态+泛知情同意"方式;并从医院管理层面、我国法规层面、流程操作方面进行探索性分析,为我国实施严谨合理高效的泛知情同意模式打下基础。 展开更多
关键词 泛知情同意 动态知情同意 健康大数据研究 临床样本 医疗机构实施
暂未订购
教育数据融通共享:困境、框架与实施路径 被引量:5
3
作者 钱海燕 杨成 +1 位作者 蔡韩燕 刘霞 《中国医学教育技术》 2023年第2期146-154,共9页
在大数据时代,教育数据的融通共享是实现数据驱动教育变革及创新的前提。当前中国教育数据融通共享面临着数据分散、结构多元、权责不清、关键技术尚未成熟以及数据安全等现实困境,亟待构建校内外教育数据融通的框架。文章从价值理念、... 在大数据时代,教育数据的融通共享是实现数据驱动教育变革及创新的前提。当前中国教育数据融通共享面临着数据分散、结构多元、权责不清、关键技术尚未成熟以及数据安全等现实困境,亟待构建校内外教育数据融通的框架。文章从价值理念、教育服务以及教育数据“三个维度”构建了教育数据融通共享的理论框架;在此基础上,构建“四个层次”数据融通的技术框架;最后,从制度、主体、条件、技术、应用等“五个层面”提出教育数据融通共享的实施路径。以期对校内外教育数据融通共享提供参考框架,确保各级各类教育数据在应用上统一、高效、便捷,实现数据驱动的教育高质量发展。 展开更多
关键词 教育大数据 数据融通 数据共享 保障框架 实施策略
在线阅读 下载PDF
稀疏样本条件下的舰船舷号检测与识别 被引量:1
4
作者 洪汉玉 陈冰川 +1 位作者 马雷 张必银 《中国图象图形学报》 CSCD 北大核心 2023年第4期984-1003,共20页
目的舰船舷号检测识别是海面态势感知的关键技术,精准的舷号检测识别对海洋权益保护具有重要意义。但目前没有公开数据提供支持。为此,本文先构建了一个真实场景下的稀疏舰船舷号数据集(sparse ship hull number dataset in real scene,... 目的舰船舷号检测识别是海面态势感知的关键技术,精准的舷号检测识别对海洋权益保护具有重要意义。但目前没有公开数据提供支持。为此,本文先构建了一个真实场景下的稀疏舰船舷号数据集(sparse ship hull number dataset in real scene,SSHN-RS),包含3004幅舰船图像,共计11328个舷号字符,覆盖了多国、各类、水平、倾斜、背景简单、背景复杂、光线不佳和被遮挡的舰船舷号样本,是一个具有挑战性的数据集。基于SSHN-RS,开展舰船舷号检测识别研究,其主要难点在于:1)样本稀疏,模型容易过拟合;2)舷号字符分布密集,网络难以充分提取各字符特征;3)部分字符存在嵌套区域和相似区域,网络会识别出大量冗余结果。针对上述难点,提出了一种基于多视角渐进式上下文解耦的舰船舷号检测识别算法。方法首先,引入一个固定中心和最大化面积的随机透视变换技术,在不增加样本数量的前提下扩充舷号姿态,实现了数据增广,提升了模型的泛化能力;其次,提出了一个渐进式上下文解耦技术,先通过依次擦除舷号各字符生成一系列新样本,再利用特征提取网络提取和融合各样本的多尺度特征,不仅减少字符上下文信息对特征学习的干扰,而且再次增广了数据;最后,在测试阶段,提出了一个掩码间扰动抑制技术,先根据预测结果采用与渐进式上下文解耦技术类似的方法生成新样本并重新进行预测,再引入一个1维非极大值抑制技术去除预测结果中错误的冗余字符,输出最佳检测识别结果,进一步优化网络性能。结果在SSHN-RS上采用主流实例分割算法进行定性和定量评估。在定量评估上,本文算法舷号的检测精确率、召回率、F值和识别率分别可达0.9854,0.9576,0.9713,0.9018,均优于其他算法。相比指标排名第2的算法,分别提高了4.51%,3.45%,3.97%,8.83%;在定性评估上,本文算法更适合舰船舷号检测识别任务,检测识别性能更高。此外,本文算法可以泛化到其他实例分割算法中,以经典算法Mask RCNN(mask region based convolutional neural network)为例,加入本文算法各模块后,各指标分别提升了9.82%,6.04%,7.80%,6.73%。结论本文算法可以解决舷号检测识别任务中因样本稀疏、舷号分布密集、部分字符存在嵌套和相似性带来的问题,在主观和客观上均取得了最先进的性能,并且具有通用性。SSHN-RS可通过https://github.com/Bingchuan897/SSHN-RS获取。 展开更多
关键词 稀疏样本 公开数据集 舰船舷号检测与识别 实例分割 数据增广 渐进式上下文解耦
原文传递
基于九轴IMU的船舶运动模式识别方法 被引量:1
5
作者 陈芊芊 胡凤玲 文元桥 《交通信息与安全》 CSCD 北大核心 2024年第6期74-83,共10页
运动模式识别是实现船舶智能航行的重要研究方向。针对现有方法中数据更新速度慢、受环境约束大的问题,研究了1种基于九轴惯性测量单元(inertial measurement unit,IMU)的船舶运动模式识别方法。分析了当前船舶运动感知技术的不足,提出... 运动模式识别是实现船舶智能航行的重要研究方向。针对现有方法中数据更新速度慢、受环境约束大的问题,研究了1种基于九轴惯性测量单元(inertial measurement unit,IMU)的船舶运动模式识别方法。分析了当前船舶运动感知技术的不足,提出利用加速度计、陀螺仪和磁力计构成的九轴IMU来识别船舶运动参数。为处理包含多种运动模式的长时间连续信号,提出了1种基于隐马尔可夫模型的数据分割算法,并采用期望最大化算法估算模型参数,实现按运动模式分割信号,提取单一稳态模式信号。分析分割后的运动模式信号,提取能够表征船舶运动模式的时域特征。为提高识别精度,设计了1种基于二叉树结构的支持向量机(support vector machine,SVM)算法,利用最大割问题构建二叉树结构,在决策节点使用SVM分类器,并通过粒子群优化算法优化模型参数。实验基于实船采集的运动数据进行验证,结果表明:所提识别算法只需训练5个SVM子分类器,能够对6种船舶运动模式进行有效识别,平均识别精度达到96.498%。相比传统的一对一和一对多SVM多分类方法,提出的方法平均识别精度分别提高了13.835%和21.305%,且所需训练的子分类器数量更少,验证了方法的优越性与高效性。 展开更多
关键词 智能交通 船舶运动模式 模式识别 支持向量机 数据分割
在线阅读 下载PDF
数据驱动下上市公司财务信息公开的机制创新与实现路径 被引量:1
6
作者 张煜晓 《特区经济》 2024年第6期133-136,共4页
在当今时代,大数据和人工智能的发展为行业革新提供了数据支撑,已成为关键推动力。上市公司公开财务信息不仅彰显透明度,更是市场监督的基石。本研究探讨了上市公司如何通过制度创新高效公开财务信息,进而绘制出了一条明确的实施轨迹。... 在当今时代,大数据和人工智能的发展为行业革新提供了数据支撑,已成为关键推动力。上市公司公开财务信息不仅彰显透明度,更是市场监督的基石。本研究探讨了上市公司如何通过制度创新高效公开财务信息,进而绘制出了一条明确的实施轨迹。本研究通过深入分析现行制度并借鉴国内外的成功案例,构建了一套创新的方案。该方案意在优化财务信息披露的效率与品质,从而增强投资者的信任感,推动市场的良性运行。 展开更多
关键词 数据驱动 上市公司 财务信息公开 机制创新 实现路径
原文传递
基于预过滤与数据增强的色情图像识别模型 被引量:1
7
作者 陈俊任 刘瑞航 《现代计算机》 2020年第10期69-75,共7页
网络色情问题已经成为互联网应用不得不面对的问题。现有的色情图像识别技术仍然有较高的误报率。此外,色情图像数据集少使得基于深度学习的色情图像识别的训练容易产生过拟合。为了解决上述挑战,提出一种改进的基于预过滤与数据增强的... 网络色情问题已经成为互联网应用不得不面对的问题。现有的色情图像识别技术仍然有较高的误报率。此外,色情图像数据集少使得基于深度学习的色情图像识别的训练容易产生过拟合。为了解决上述挑战,提出一种改进的基于预过滤与数据增强的色情图像识别模型PIRPDA。该模型能预过滤掉人脸特写图像以及婴儿图像这些容易被识别为色情的图像。并且通过不改变色情图像性质的方法来设计数据增强方案,提高色情图像识别的准确率。实验表明,所提出的PIRPDA模型在NPDI色情数据集上取得93.268%的准确率,优于当前主流的色情图像识别方法。 展开更多
关键词 色情图像识别 深度学习 数据增强 PIRPDA
在线阅读 下载PDF
如何评价教育数据应用绩效?——基于3E理论的分析 被引量:2
8
作者 杨现民 赵路瑶 +1 位作者 李新 魏顺平 《中国远程教育》 CSSCI 北大核心 2024年第5期51-61,共11页
教育数据是推动教育数字化转型的动力引擎,是推动教育高质量发展的重要抓手。在此背景下,我国各地区正大力推展教育数据应用项目,充分发挥教育数据在教育治理、教育教学以及教育评价等方面的重要潜能。然而,目前关于教育数据应用的实践... 教育数据是推动教育数字化转型的动力引擎,是推动教育高质量发展的重要抓手。在此背景下,我国各地区正大力推展教育数据应用项目,充分发挥教育数据在教育治理、教育教学以及教育评价等方面的重要潜能。然而,目前关于教育数据应用的实践效果缺乏系统评估,导致教育从业者难以准确了解教育数据应用的实际效果、资源配置等实践情况。因此急需一套科学有效的评价体系。基于此,本研究立足教育数据应用绩效的内涵和评价意义,以3E[经济性(Economy)、效率性(Efficiency)和有效性(Effectiveness)]理论为基础设计了教育数据应用绩效评价框架,随后采用德尔菲法构建了教育数据应用绩效评价指标体系,包括教育数据应用投入和教育数据应用产出2个一级指标,经费投入和人员投入等5个二级指标,以及涉及具体应用情况与评估现状的13个三级指标。最后基于该评价指标体系,从落实评价工作开展、规范评价方法程序、以横向与纵向比较为抓手,以及建立评价结果反馈和激励机制四个方面提出教育数据应用绩效评价的实施建议,以期促进教育数据应用绩效评价的落地,实现教育数据应用的科学化、高效化。 展开更多
关键词 教育数据应用 绩效评价 3E理论 评价指标体系 实施建议
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部