期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于特征检测的折扇图像数据集构建与分析
1
作者 高亚鑫 王存睿 肖瑛 《大连民族大学学报》 2026年第1期40-45,共6页
针对折扇复杂的纹理和图案,构建了包含7 200张成对的折扇图像数据集,主要用于折扇折痕修复任务。首先使用3ds Max三维建模软件构建了一套合适的折扇数据模型,通过融合特征检测算法检测折扇模型的特征信息与收集到的图像数据集进行特征融... 针对折扇复杂的纹理和图案,构建了包含7 200张成对的折扇图像数据集,主要用于折扇折痕修复任务。首先使用3ds Max三维建模软件构建了一套合适的折扇数据模型,通过融合特征检测算法检测折扇模型的特征信息与收集到的图像数据集进行特征融合,从而生成高质量的带折痕的折扇图像数据集。然后使用ctsdg和pix2pix HD网络模型检测折扇图像数据集的有效性,并使用SSIM和PSNR作为指标进行评估,所得的数值均良好,证明该数据集可以用于图像修复任务。 展开更多
关键词 特征检测 自定义数据集 折痕消除
在线阅读 下载PDF
Explainable Diabetic Retinopathy Detection Using a Distributed CNN and LightGBM Framework
2
作者 Pooja Bidwai Shilpa Gite +1 位作者 Biswajeet Pradhan Abdullah Almari 《Computers, Materials & Continua》 2025年第8期2645-2676,共32页
Diabetic Retinopathy(DR)is a critical disorder that affects the retina due to the constant rise in diabetics and remains the major cause of blindness across the world.Early detection and timely treatment are essential... Diabetic Retinopathy(DR)is a critical disorder that affects the retina due to the constant rise in diabetics and remains the major cause of blindness across the world.Early detection and timely treatment are essential to mitigate the effects of DR,such as retinal damage and vision impairment.Several conventional approaches have been proposed to detect DR early and accurately,but they are limited by data imbalance,interpretability,overfitting,convergence time,and other issues.To address these drawbacks and improve DR detection accurately,a distributed Explainable Convolutional Neural network-enabled Light Gradient Boosting Machine(DE-ExLNN)is proposed in this research.The model combines an explainable Convolutional Neural Network(CNN)and Light Gradient Boosting Machine(LightGBM),achieving highly accurate outcomes in DR detection.LightGBM serves as the detection model,and the inclusion of an explainable CNN addresses issues that conventional CNN classifiers could not resolve.A custom dataset was created for this research,containing both fundus and OCTA images collected from a realtime environment,providing more accurate results compared to standard conventional DR datasets.The custom dataset demonstrates notable accuracy,sensitivity,specificity,and Matthews Correlation Coefficient(MCC)scores,underscoring the effectiveness of this approach.Evaluations against other standard datasets achieved an accuracy of 93.94%,sensitivity of 93.90%,specificity of 93.99%,and MCC of 93.88%for fundus images.For OCTA images,the results obtained an accuracy of 95.30%,sensitivity of 95.50%,specificity of 95.09%,andMCC of 95%.Results prove that the combination of explainable CNN and LightGBMoutperforms othermethods.The inclusion of distributed learning enhances the model’s efficiency by reducing time consumption and complexity while facilitating feature extraction. 展开更多
关键词 Diabetic retinopathy explainable convolutional neural network light gradient boosting machine fundus image custom dataset
在线阅读 下载PDF
基于双维信息与剪枝的中文猕猴桃文本命名实体识别方法 被引量:1
3
作者 齐梓均 牛当当 +3 位作者 吴华瑞 张礼麟 王仑峰 张宏鸣 《智慧农业(中英文)》 2025年第1期44-56,共13页
[目的/意义]中文猕猴桃文本在段落上下文主题与字符间的左右关系中,展现出垂直与水平双维度特性。若能充分利用中文猕猴桃文本的双维特性,将有助于进一步提升命名实体识别的识别效果。基于此,提出了一种基于双维信息与剪枝的命名实体识... [目的/意义]中文猕猴桃文本在段落上下文主题与字符间的左右关系中,展现出垂直与水平双维度特性。若能充分利用中文猕猴桃文本的双维特性,将有助于进一步提升命名实体识别的识别效果。基于此,提出了一种基于双维信息与剪枝的命名实体识别方法,命名为KIWI-Coord-Prune(kiwifruit-CoordKIWINER-PruneBiLSTM)。[方法]通过设计CoordKIWINER与PruneBi-LSTM两个模块,对中文猕猴桃文本中的双维信息进行精准处理。其中CoordKIWINER模块能够显著提升模型捕捉复杂和嵌套实体的能力,从而生成涵盖更多文本信息的加强字符矢量;PruneBi-LSTM模块在上一模块的基础上,加强了模型对重要特征的学习与识别能力,从而进一步提升了实体识别效果。[结果和讨论]在自建数据集KIWIPRO和四个公开数据集人民日报(People's Daily)、ClueNER、Boson,以及ResumeNER上进行试验,并与LSTM、Bi-LSTM、LR-CNN、Softlexicon-LSTM,以及KIWINER五个先进模型进行对比,本研究提出的方法在5个数据集上分别取得了较好的F1值,分别为89.55%、91.02%、83.50%、83.49%和95.81%。[结论]与现有方法相比,本研究提出的方法不仅能够有效提升中文猕猴桃领域文本的命名实体识别效果,且具有一定的泛化性,同时也能够为相关知识图谱和问答系统的构建等下游任务提供技术支持。 展开更多
关键词 中文命名实体识别 猕猴桃文本 自建数据集 多维度注意力机制 剪枝 深度学习 文本特征增强
在线阅读 下载PDF
汉字计算机字库笔画标注数据集 被引量:1
4
作者 廖丹青 王存睿 战国栋 《大连民族大学学报》 2025年第1期53-58,共6页
在使用深度学习辅助计算机字库生成汉字的过程中,常面临笔画黏连、笔画错误和风格细节不足等问题。为了提高生成模型的质量,结合字体设计行业的实际需求,构建了包含71种笔画、1 960个汉字字符的笔画标注数据集。该数据集涵盖了不同结构... 在使用深度学习辅助计算机字库生成汉字的过程中,常面临笔画黏连、笔画错误和风格细节不足等问题。为了提高生成模型的质量,结合字体设计行业的实际需求,构建了包含71种笔画、1 960个汉字字符的笔画标注数据集。该数据集涵盖了不同结构和复杂度的汉字,71种笔画是在GB13000.1标准的32类笔画基础上结合行业实际扩展出来的类别。使用Labelme工具对数据集进行人工标注,并将标注的汉字图像生成的JSON数据转换为VOC格式,最终得到8位笔画图像数据集。通过使用FCN、U-Net和Seg Net对数据集进行测试,并将原始图像与预测结果进行对比,结果显示预测效果良好,且评价指标MPA、MIoU及FWIoU所得数值均良好,证明了该数据集的有效性。 展开更多
关键词 自定义数据集 字体风格迁移 笔画分割 深度学习
在线阅读 下载PDF
EG-YOLO:基于YOLOv8改进的月面陨坑检测算法
5
作者 朱高城 刘世杰 《智能计算机与应用》 2025年第8期184-189,共6页
精确检测识别月面陨坑目标,对于深化月球科学研究、巡视器导航定位以及避障具有重要意义。为了提高月面影像陨坑检测的准确性,本文提出了一种基于YOLOv8改进的陨坑检测算法EG-YOLO,另外通过收集和处理大量的月面影像数据,构建了一个广... 精确检测识别月面陨坑目标,对于深化月球科学研究、巡视器导航定位以及避障具有重要意义。为了提高月面影像陨坑检测的准确性,本文提出了一种基于YOLOv8改进的陨坑检测算法EG-YOLO,另外通过收集和处理大量的月面影像数据,构建了一个广泛多样的月面陨坑数据集,并结合多种数据增强手段对数据进行了扩展,有效提升了模型在不同场景下的泛化能力和鲁棒性。改进算法主要内容包括:引入EMA注意力机制模块,在不增加原始网络参数的同时提高模型的特征检测识别能力;采用GIoU作为模型的损失函数,减少预测边界框和真实边界框之间的差异,提高模型的识别准确率。利用自建数据集进行了对比实验,实验结果表明本文所提算法相较于原模型,精度提升了3.3%,平均精度均值mAP@50提升了2%,mAP@0.95提升了1.5%。整体结果表明,本文方法能在确保计算效率的同时,实现高精度月面陨坑检测。 展开更多
关键词 月面陨坑检测 YOLOv8 EMA注意力机制 GIoU 自建数据集
在线阅读 下载PDF
基于Python的YOLO数据集管理软件设计与实证研究
6
作者 林静敏 魏松林 《乐山师范学院学报》 2025年第4期23-32,共10页
随着YOLO目标检测技术的广泛应用,多源数据集的标签定制与高效融合成为提升模型训练效率的关键挑战。现有工具存在标注分散、格式转换繁琐、缺乏统一管理平台等问题,导致数据准备效率低且易出错。为此,文章通过集成多源数据集格式转换... 随着YOLO目标检测技术的广泛应用,多源数据集的标签定制与高效融合成为提升模型训练效率的关键挑战。现有工具存在标注分散、格式转换繁琐、缺乏统一管理平台等问题,导致数据准备效率低且易出错。为此,文章通过集成多源数据集格式转换、标签动态映射、子集划分及合并等核心功能,支持用户通过配置文件灵活定制标签,拟设计一款基于Python的YOLO数据集管理软件,以解决标签命名冲突与类别冗余等问题。实证结果表明,该软件在融合4个异构数据集(15.8万张图像)时,内存占用仅99.8 MB,平均每生成一个标注文件约耗时12.74 ms,验证了其在复杂场景与大规模数据下的高效性;该软件支持跨平台运行,为YOLO算法开发者提供了一套轻量化、可扩展的工具,成功实现了多源数据集标签定制与融合,对推动目标检测技术的工程化应用具有实践价值。 展开更多
关键词 目标检测 YOLO数据集管理 数据集融合 标签定制
在线阅读 下载PDF
基于信息熵的改进型支持向量机客户流失预测模型应用研究 被引量:5
7
作者 方磊 马溪骏 《情报学报》 CSSCI 北大核心 2011年第6期643-648,共6页
客户流失数据是一类的非平衡数据集,如何有效地对其进行分类学习,其关键是要提高少数类(流失客户)的识别率,少数类是相对多数类而言的一类特殊的子样本,其错分的代价非常高,因此,有效地减少少数类的错分率是一个亟待解决的问题。本文... 客户流失数据是一类的非平衡数据集,如何有效地对其进行分类学习,其关键是要提高少数类(流失客户)的识别率,少数类是相对多数类而言的一类特殊的子样本,其错分的代价非常高,因此,有效地减少少数类的错分率是一个亟待解决的问题。本文在Veropoulous提出的采用不同惩罚因子数的支持向量机算法基础上,利用样本自身信息熵值来确定不同的惩罚因子,使模型更加倾向于提高少数类的识别精度,并在电信客户流失数据这一非平衡数据集中进行了验证,结果表明该方法较其他方法对流失客户(少数类)的识别率有很大的提高,具有很强的实际应用意义。 展开更多
关键词 支持向量机 不平衡数据 信息熵 分类预测 客户流失
在线阅读 下载PDF
Audiovisual speech recognition based on a deep convolutional neural network 被引量:2
8
作者 Shashidhar Rudregowda Sudarshan Patilkulkarni +2 位作者 Vinayakumar Ravi Gururaj H.L. Moez Krichen 《Data Science and Management》 2024年第1期25-34,共10页
Audiovisual speech recognition is an emerging research topic.Lipreading is the recognition of what someone is saying using visual information,primarily lip movements.In this study,we created a custom dataset for India... Audiovisual speech recognition is an emerging research topic.Lipreading is the recognition of what someone is saying using visual information,primarily lip movements.In this study,we created a custom dataset for Indian English linguistics and categorized it into three main categories:(1)audio recognition,(2)visual feature extraction,and(3)combined audio and visual recognition.Audio features were extracted using the mel-frequency cepstral coefficient,and classification was performed using a one-dimension convolutional neural network.Visual feature extraction uses Dlib and then classifies visual speech using a long short-term memory type of recurrent neural networks.Finally,integration was performed using a deep convolutional network.The audio speech of Indian English was successfully recognized with accuracies of 93.67%and 91.53%,respectively,using testing data from 200 epochs.The training accuracy for visual speech recognition using the Indian English dataset was 77.48%and the test accuracy was 76.19%using 60 epochs.After integration,the accuracies of audiovisual speech recognition using the Indian English dataset for training and testing were 94.67%and 91.75%,respectively. 展开更多
关键词 Audiovisual speech recognition custom dataset 1D Convolution neural network(CNN) Deep CNN(DCNN) Long short-term memory(LSTM) LIPREADING Dlib Mel-frequency cepstral coefficient(MFCC)
在线阅读 下载PDF
基于混合数据聚类算法的异质顾客群体识别 被引量:3
9
作者 谢卫星 王晓琳 +2 位作者 王旭阳 张静娜 李玉鹏 《计算机工程与应用》 CSCD 北大核心 2021年第13期130-137,共8页
顾客作为产品满意度测度过程中评价决策的主体,对其进行分类研究,识别不同顾客群体异质评价特征具有重要意义。顾客评价特征存在多元性和冲突性,根本原因是顾客作为决策者的异质性,而顾客的异质性来源于顾客本身属性,包含分类型属性和... 顾客作为产品满意度测度过程中评价决策的主体,对其进行分类研究,识别不同顾客群体异质评价特征具有重要意义。顾客评价特征存在多元性和冲突性,根本原因是顾客作为决策者的异质性,而顾客的异质性来源于顾客本身属性,包含分类型属性和数值型属性。提出了一种基于惩罚竞争机制的混合属性顾客分类方法,根据数值型和分类型属性值的分布规律,给出了混合数据初始聚类中心的确定方法;建立了统一相似性度量模型,并引入惩罚竞争机制,实现了聚类过程中的基本迭代和自动优化聚类数。以某产品异质顾客分类问题为例验证了所提方法的可行性,继而通过"Heart Disease"标准数据集将所提算法与K-means和K-prototypes两种经典聚类算法进行对比,验证了该方法的有效性。 展开更多
关键词 决策群体分类 顾客分类 混合数据聚类 惩罚竞争机制
在线阅读 下载PDF
一种基于深度相机的人体扫描设备及应用
10
作者 丁军涛 《现代信息科技》 2021年第19期117-120,124,共5页
文章对当前市场上几种常见人体扫描设备的原理进行分析,对基于深度相机的人体扫描设备的数据采集、精度保障、彩色贴图和尺寸提取几个方面进行了深度研究,介绍了此类设备在服装高端定制、国民体型测量和服装号型更新方面的应用,并创新... 文章对当前市场上几种常见人体扫描设备的原理进行分析,对基于深度相机的人体扫描设备的数据采集、精度保障、彩色贴图和尺寸提取几个方面进行了深度研究,介绍了此类设备在服装高端定制、国民体型测量和服装号型更新方面的应用,并创新性地提出在健康产品定制、3D影视、动漫游戏和3D照相馆方面的探索性应用。 展开更多
关键词 人体扫描 人体数据 服装定制 虚拟试衣 新零售
在线阅读 下载PDF
基于大数据的客户热词分析系统的架构设计
11
作者 王献军 张岚 +2 位作者 许国伟 武柯 杨秀梅 《微型电脑应用》 2024年第6期151-155,共5页
针对现有技术中电力用户数据信息客户热词分析能力低下问题,提出了一种新型的数据分析方法。通过智能电网云端数据库获取客户热词,提炼电力数据信息客户热词数据库所有语义数据信息,并基于ADSP-BF533处理器实现电力数据信息客户热词信... 针对现有技术中电力用户数据信息客户热词分析能力低下问题,提出了一种新型的数据分析方法。通过智能电网云端数据库获取客户热词,提炼电力数据信息客户热词数据库所有语义数据信息,并基于ADSP-BF533处理器实现电力数据信息客户热词信息采集和输入。通过创建频率矩阵,将电力热词数据信息转换为数学表达式能够提高电力数据信息的分析能力。通过试验,所提方法运行效果好,分析误差低,为电力系统客户热词分析提供新思路。 展开更多
关键词 电力用户 客户热词分析 语义数据 挖掘与分析 数据集
在线阅读 下载PDF
基于用户生成内容的潜在客户识别方法 被引量:9
12
作者 蒋翠清 宋凯伦 +1 位作者 丁勇 刘尧 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第3期1-8,共8页
【目的】从产品论坛中识别潜在客户,对产品论坛中的用户生成内容特征进行分析,识别有购买意愿的产品潜在客户。【方法】将不均衡数据集转换为n个均衡数据集,结合Stacking分类算法识别潜在客户,分别使用基分类器算法和本文提出的针对不... 【目的】从产品论坛中识别潜在客户,对产品论坛中的用户生成内容特征进行分析,识别有购买意愿的产品潜在客户。【方法】将不均衡数据集转换为n个均衡数据集,结合Stacking分类算法识别潜在客户,分别使用基分类器算法和本文提出的针对不均衡数据集的Stacking分类算法对样本数据进行测试,并通过对比F值验证本文算法的有效性。【结果】本文提出的算法的F值较贝叶斯网络、逻辑回归、C4.5决策树、SMO和朴素贝叶斯5种基分类器算法分别提高17.4%、26.5%、24.1%、29.3%、40.9%,较Stacking、Bagging和Boosting三种集成学习算法分别提高10.1%、5.9%、13.1%。【局限】研究语料来源于汽车行业,具有一定的领域局限性。【结论】该方法能有效识别潜在客户。 展开更多
关键词 用户生成内容 潜在客户识别 Stacking分类算法 不均衡数据集
原文传递
Indian traffic sign detection and recognition using deep learning 被引量:1
13
作者 Rajesh Kannan Megalingam Kondareddy Thanigundala +2 位作者 Sreevatsava Reddy Musani Hemanth Nidamanuru Lokesh Gadde 《International Journal of Transportation Science and Technology》 2023年第3期683-699,共17页
Traffic signs play a crucial role in managing traffic on the road,disciplining the drivers,thereby preventing injury,property damage,and fatalities.Traffic sign management with automatic detection and recognition is v... Traffic signs play a crucial role in managing traffic on the road,disciplining the drivers,thereby preventing injury,property damage,and fatalities.Traffic sign management with automatic detection and recognition is very much part of any Intelligent Transportation System(ITS).In this era of self-driving vehicles,calls for automatic detection and recognition of traffic signs cannot be overstated.This paper presents a deep-learning-based autonomous scheme for cognizance of traffic signs in India.The automatic traffic sign detection and recognition was conceived on a Convolutional Neural Network(CNN)-Refined Mask R-CNN(RM R-CNN)-based end-to-end learning.The proffered concept was appraised via an innovative dataset comprised of 6480 images that constituted 7056 instances of Indian traffic signs grouped into 87 categories.We present several refinements to the Mask R-CNN model both in architecture and data augmentation.We have considered highly challenging Indian traffic sign categories which are not yet reported in previous works.The dataset for training and testing of the proposed model is obtained by capturing images in real-time on Indian roads.The evaluation results indicate lower than 3%error.Furthermore,RM R-CNN’s performance was compared with the conventional deep neural network architectures such as Fast R-CNN and Mask R-CNN.Our proposed model achieved precision of 97.08%which is higher than precision obtained by Mask R-CNN and Faster RCNN models. 展开更多
关键词 Refined Mask R-CNN Fast R-CNN Data augmentation PRE-PROCESSING custom dataset Indian Traffic Sign
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部