期刊文献+
共找到1,241篇文章
< 1 2 63 >
每页显示 20 50 100
A Convolutional and Transformer Based Deep Neural Network for Automatic Modulation Classification 被引量:5
1
作者 Shanchuan Ying Sai Huang +3 位作者 Shuo Chang Zheng Yang Zhiyong Feng Ningyan Guo 《China Communications》 SCIE CSCD 2023年第5期135-147,共13页
Automatic modulation classification(AMC)aims at identifying the modulation of the received signals,which is a significant approach to identifying the target in military and civil applications.In this paper,a novel dat... Automatic modulation classification(AMC)aims at identifying the modulation of the received signals,which is a significant approach to identifying the target in military and civil applications.In this paper,a novel data-driven framework named convolutional and transformer-based deep neural network(CTDNN)is proposed to improve the classification performance.CTDNN can be divided into four modules,i.e.,convolutional neural network(CNN)backbone,transition module,transformer module,and final classifier.In the CNN backbone,a wide and deep convolution structure is designed,which consists of 1×15 convolution kernels and intensive cross-layer connections instead of traditional 1×3 kernels and sequential connections.In the transition module,a 1×1 convolution layer is utilized to compress the channels of the previous multi-scale CNN features.In the transformer module,three self-attention layers are designed for extracting global features and generating the classification vector.In the classifier,the final decision is made based on the maximum a posterior probability.Extensive simulations are conducted,and the result shows that our proposed CTDNN can achieve superior classification performance than traditional deep models. 展开更多
关键词 automatic modulation classification deep neural network convolutional neural network transformer
在线阅读 下载PDF
一种基于Transformer架构的多层级自动睡眠分期模型 被引量:1
2
作者 金峥 贾克斌 《电子学报》 北大核心 2025年第2期545-557,共13页
睡眠是人体保持健康的重要生理过程,基于多导睡眠图(PolySomnoGraphy,PSG)的睡眠分期是诊疗睡眠疾病和评估睡眠质量的重要依据.人工睡眠分期法在处理大规模PSG数据时存在耗时久、效率低的问题,采用深度学习模型有效表征PSG的自动睡眠分... 睡眠是人体保持健康的重要生理过程,基于多导睡眠图(PolySomnoGraphy,PSG)的睡眠分期是诊疗睡眠疾病和评估睡眠质量的重要依据.人工睡眠分期法在处理大规模PSG数据时存在耗时久、效率低的问题,采用深度学习模型有效表征PSG的自动睡眠分期法显现出广阔的研究前景.针对现有模型未充分考虑PSG片段内波形信息、通道间相关性信息、片段间睡眠转换信息的问题,本文提出一种基于Transformer架构的多层级睡眠分期网络模型(Hierarchical transFormer sleep staging model,HierFormer),采用Transformer编码器有效提取片段内波形特征、通道相关性特征、片段间转换特征,并结合注意力机制综合提升模型对于PSG片段内、通道间、片段间三种视角信号特性的可解释性.基于睡眠集-欧洲数据格式(sleep-European Data Format,sleep-EDF)扩展睡眠数据集开展的实验结果表明:本文模型利用更少的参数量取得优于多种现有基线模型的分期性能,分类准确率、宏平均精确率、宏平均召回率、宏平均F1分数、科恩卡帕系数分别可达到0.807、0.784、0.735、0.750和0.721.通过在三种视角下不同特征编码方式的性能对比和注意力分数的可视化,本文进一步证明了所提模型良好的编码能力和可解释性.本研究旨在为睡眠分期领域的深度学习应用提供新途径和新技术,从而辅助医生提升睡眠疾病诊疗效率. 展开更多
关键词 多导睡眠图(PSG) 自动睡眠分期 深度神经网络 transformer架构 注意力机制 模型可解释性
在线阅读 下载PDF
基于改进Transformer的电信重投报告自动生成方法研究
3
作者 梁伟明 肖军 +2 位作者 马晓亮 辛盛 徐荣彬 《电信科学》 北大核心 2025年第6期197-207,共11页
在电信行业中,客户对未解决或处理不满意的投诉进行重复投诉的现象较为常见。手动生成重投报告不仅耗时且主观性较强,难以满足企业对高效性和一致性的要求。针对这一问题,提出了一种基于改进Transformer模型的自动化报告生成方法。该方... 在电信行业中,客户对未解决或处理不满意的投诉进行重复投诉的现象较为常见。手动生成重投报告不仅耗时且主观性较强,难以满足企业对高效性和一致性的要求。针对这一问题,提出了一种基于改进Transformer模型的自动化报告生成方法。该方法通过引入情绪嵌入,有效捕捉客户在对话中的情绪变化,改善了生成报告对客户态度和诉求的理解能力。同时,结合定制化位置编码,提升了模型对投诉时序信息的感知能力,从而增强了生成内容的时间逻辑性和细节完整性。实验结果表明,改进后的模型在BLEU(bilingual evaluation understudy)和ROUGE(recall-oriented understudy for gisting evaluation)指标上分别达到0.352和0.482,显著优于原始Transformer和其他对比模型。此外,与人工对比,工作效率提高了89%。生成的报告内容不仅更加准确贴合实际需求,还在语义细节与时序一致性上表现优异。 展开更多
关键词 电信客服 transformer 重投报告 自动报告生成
在线阅读 下载PDF
Vision Transformer深度学习模型在前列腺癌识别中的价值
4
作者 李梦娟 金龙 +2 位作者 尹胜男 计一丁 丁宁 《中国医学计算机成像杂志》 北大核心 2025年第3期396-401,共6页
目的:旨在探讨Vision Transformer(ViT)深度学习模型在前列腺癌(PCa)识别中的应用价值.方法:回顾性分析了480例接受磁共振成像(MRI)检查的患者影像资料.采用TotalSegmentator模型自动分割前列腺区域,通过ViT深度学习方法分别构建基于T2... 目的:旨在探讨Vision Transformer(ViT)深度学习模型在前列腺癌(PCa)识别中的应用价值.方法:回顾性分析了480例接受磁共振成像(MRI)检查的患者影像资料.采用TotalSegmentator模型自动分割前列腺区域,通过ViT深度学习方法分别构建基于T2加权像(T2WI)、基于表观弥散系数(ADC)图和基于两者结合的三个ViT模型.结果:在PCa的识别能力上,结合模型在训练组和测试组上的受试者工作特征(ROC)曲线下面积(AUC)分别为0.961和0.980,优于仅基于单一成像序列构建的ViT模型.在基于单一序列构建的ViT模型中,基于ADC图的模型相较于基于T2WI的模型表现更佳.此外,决策曲线分析显示结合模型提供了更大的临床效益.结论:ViT深度学习模型在前列腺癌识别中具有较高的诊断准确性和潜在价值. 展开更多
关键词 Vision transformer 深度学习 前列腺癌 自动分割 磁共振成像
暂未订购
Transformer-based identification for ADS-B transmitters in open–time sets 被引量:1
5
作者 Yunfei ZHENG Xuejun ZHANG +1 位作者 Yuanhao TAN Xueyuan LI 《Chinese Journal of Aeronautics》 2025年第8期470-484,共15页
Radio Frequency Fingerprint Identification(RFFI)technology provides a means of identifying spurious signals.This technology has been widely used in solving Automatic Dependent Surveillance–Broadcast(ADS-B)signal spoo... Radio Frequency Fingerprint Identification(RFFI)technology provides a means of identifying spurious signals.This technology has been widely used in solving Automatic Dependent Surveillance–Broadcast(ADS-B)signal spoofing problems.However,the effects of circuit changes over time often lead to a decline in identification accuracy within open-time set.This paper proposes an ADS-B transmitter identification method to solve the degradation of identification accuracy.First,a real-time data processing system is established to receive and store ADS-B signals to meet the conditions for open-time set.The system possesses the following functionalities:data collection,data parsing,feature extraction,and identity recognition.Subsequently,a two-dimensional TimeFrequency Feature Diagram(TFFD)is proposed as a signal pre-processing method.The TFFD is constructed from the received ADS-B signal and the reconstructed signal for input to the recognition model.Finally,incorporating a frequency offset layer into the Swin Transformer architecture,a novel recognition network framework is proposed.This integration can enhance the network recognition accuracy and robustness by tailoring to the specific characteristics of ADSB signals.Experimental results indicate that the proposed recognition architecture achieves recognition accuracy of 95.86%in closed-time set and 84.33%in open-time set,surpassing other algorithms. 展开更多
关键词 automatic Dependent Surveillance-Broadcast Radio frequency fingerprinting IDENTIFICATION Open-time set Time-frequency feature diagram Swin transformer
原文传递
CNN-ViTAMR:一种基于Transformer的自动信号调制识别算法及其轻量化实现
6
作者 刘畅 徐炜遐 《计算机工程与科学》 北大核心 2025年第8期1408-1416,共9页
随着物联网、5G通信、无线自组网以及无人集群系统等技术的迅猛发展和普及应用,信号自动调制识别在无线通信、雷达信号处理和电子战等领域有着广泛的应用,并且开始向边缘智能端侧设备渗透。因此,轻量化的智能调制识别算法及其实现成为... 随着物联网、5G通信、无线自组网以及无人集群系统等技术的迅猛发展和普及应用,信号自动调制识别在无线通信、雷达信号处理和电子战等领域有着广泛的应用,并且开始向边缘智能端侧设备渗透。因此,轻量化的智能调制识别算法及其实现成为当前通信领域亟待解决的关键问题之一。传统的基于CNN和RNN的信号调制识别算法模型无法准确地把握信号的全局信息,因而在AMR任务中存在一定的局限性。近年来,Transformer借助其内部多头自注意力机制的全局信息特征提取能力,突破了DNN模型泛化能力的约束,在时间序列信息处理中取得了重大突破。因此,提出一种基于Transformer结构的AMR算法模型,该模型在Transformer中嵌入基于CNN的Token化模块,从而使模型在兼具Transformer的全局信息提取能力的同时,又保留了Token内部的局部时序特征,从而保证了算法的识别正确率。同时,所提模型的参数量较少,适合部署在边缘侧设备终端。基于Zynq Ultrascale+MPSoC平台的评估结果表明,相较运行于较高基准频率CPU平台的软件算法版本,FPGA硬件加速平台以较低的时钟频率实现了高达2.47倍的硬件加速。 展开更多
关键词 信号自动调制识别 transformer 多头自注意力机制 硬件加速 边缘计算
在线阅读 下载PDF
A New Algorithm for Automatic Double Bright Fringe of Multiple-Beam Fizeau Fringe Skeletonization Using Fourier Transform Method of Fringe Pattern Analysis
7
作者 Mohamed A. EL-Morsy 《Journal of Signal and Information Processing》 2012年第3期412-419,共8页
The interferogram of multiple-beam Fizeau fringe technique plays an important role to investigate the optical properties of fiber because this interferogram provides us with useful information which can used to determ... The interferogram of multiple-beam Fizeau fringe technique plays an important role to investigate the optical properties of fiber because this interferogram provides us with useful information which can used to determine the dispersion curve of the fiber sample. A common problem in any interferogram analysis is the accuracy in locating fringe centers (fringe skeleton). There are a lot of computer-aided algorithms, which depend on the interferogram types, used to fringe skeleton extraction of various digital interferogram. In this paper, as far as I know, a novel algorithm for fringe skeleton extraction of double bright fringe of multiple-beam Fizeau fringe is presented. The proposed algorithm based on using the different order of Fourier transform and the derivative-sign binary image. Also the proposed algorithm has been successfully tested by using a computer simulation fringe and an experimental pattern. The results are compared with the original interferogram and shown a good agreement. 展开更多
关键词 automatic FRINGE Analysis Multiple-Beam Fizeau FRINGE FOURIER transform
暂未订购
An Arabic Transformation Based Approach to Automatic Paraphrasing of Syntactic Sentences
8
作者 Ali Boulaalam Azeddine Rhazi 《Sino-US English Teaching》 2021年第6期137-146,共10页
The aim of this paper is to exploit the existing Lexicon-Grammar(LG)tables,as well as to assess their relative importance vis-à-vis the concept of transformation and automatic paraphrasing.These operations includ... The aim of this paper is to exploit the existing Lexicon-Grammar(LG)tables,as well as to assess their relative importance vis-à-vis the concept of transformation and automatic paraphrasing.These operations include multiple processes at the lexical,morpho-syntactic,and semantic levels.Our proposal is to model highly productive phenomena of the Arabic language,such as pronominalization and passivization,dedicated to the both Arabic verb classes and Multiword Expressions(MWEs),in order to formalize the relation between structures and their semantic properties and thus to represent the symmetry and pairs between sentences that share a predicate that links the noun and a support verb.Furthermore,the automatic process of paraphrasing involves both the distributional and transformative features of each class of verbs or other structures such as Arabic MWEs.This research in progress outlines how to build Lexicon-Grammar tables for Arabic syntactic sentences by using automatic paraphrasing in a large transformational grammar on the one hand,and to implement it into both NooJ electronic dictionaries and local grammars on the other hand. 展开更多
关键词 Lexicon-Grammar transformATION automatic paraphrasing ARABIC NOMINALIZATION passivization NooJ
在线阅读 下载PDF
基于Swin Transformer和LSTM的CycleGAN建筑平面图外墙自动识别方法
9
作者 陈静 沈吉云 +3 位作者 陆一鸣 夏艺奕 徐奕欣 陆卫忠 《苏州科技大学学报(自然科学版)》 2025年第4期53-61,共9页
建筑平面图外墙的自动识别在建筑设计和施工的过程中具有重要意义,它不仅能提高设计效率,还能辅助设计审核,降低图纸错误风险。同时,自动识别外墙等构件为三维模型的快速生成提供有效数据,推动建筑信息建模(Building Information Modeli... 建筑平面图外墙的自动识别在建筑设计和施工的过程中具有重要意义,它不仅能提高设计效率,还能辅助设计审核,降低图纸错误风险。同时,自动识别外墙等构件为三维模型的快速生成提供有效数据,推动建筑信息建模(Building Information Modeling,BIM)技术的发展。目前自动识别建筑平面图外墙的方法主要是基于规则的方法,且其效果仍有一定的提升空间。针对上述问题,本文提出了一种基于Swin Transformer和LSTM的CycleGAN算法实现建筑平面图外墙的自动识别,以辅助建筑平面图的设计、建筑平面图设计的质量稽查、三维模型的快速生成等。该算法基于循环一致性生成对抗网络(CycleGAN)框架,嵌入Swin Transformer Block模块和长短期记忆(Long Short-Term Memory,LSTM)模块,增强模型特征提取能力和网络学习能力。实验结果表明,改进的CycleGAN算法实现了非成对训练样本条件下建筑平面图外墙的识别,在结构相似性指数和峰值信噪比的两个指标上分别提高了22.4%和4.223,且生成的建筑外墙图具有清晰度高、细节特征完整的特点。 展开更多
关键词 循环一致性生成对抗网络 Swin transformer 长短期记忆 图像生成 建筑平面图外墙 自动识别方法
在线阅读 下载PDF
基于改进Swin Transformer的膝骨关节炎X光影像自动诊断 被引量:3
10
作者 许超 王云健 +2 位作者 刘洋 卢雪梅 丁勇 《电子测量技术》 北大核心 2024年第19期155-163,共9页
膝骨关节炎是老年人群体的常见疾病,具有较高的致残性。依托深度学习算法开展膝骨关节炎的自动诊断,具有重要的应用价值。为此,提出了一种基于改进Swin Transformer模型的膝骨关节炎X光影像自动诊断算法。通过两层全连接层加ReLU激活函... 膝骨关节炎是老年人群体的常见疾病,具有较高的致残性。依托深度学习算法开展膝骨关节炎的自动诊断,具有重要的应用价值。为此,提出了一种基于改进Swin Transformer模型的膝骨关节炎X光影像自动诊断算法。通过两层全连接层加ReLU激活函数的结构替换颈部网络的全局平均池化层,对迁移学习进行保护;在头部网络中添加全连接层与Tanh激活函数,组合出更多非线性特征;在数据预处理和模型训练过程中,分别依托Albumentations库和添加Mixup模块以此实现数据增强处理。实验结果表明,所提算法能够有效提升膝骨关节炎X光影像的分类精度,在Kaggle网站的公开数据集上诊断精度达到76.0%;同时,经过在其他膝骨关节炎X光影像数据集与不同领域的医学影像数据集上进行泛化实验,结果表明其具有较好的泛化能力,进一步证明所提算法的有效性。 展开更多
关键词 膝骨关节炎 Swin transformer 全局平均池化 数据增强
原文传递
基于多层级视频Transformer的视觉自动定位方法
11
作者 邹琦萍 李博涛 +2 位作者 陈赛安 郭茜 张桃红 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第6期34-43,共10页
工业自动化产线中,设备的异常检测直接决定加工质量,由机械臂和搭载于机械臂前端的工业相机构成的视觉系统可以有效监测此类异常。本文使用六轴机械臂搭载工业相机对工件表面进行成像,获取由模糊到清晰再到模糊的视频序列,以此选出最清... 工业自动化产线中,设备的异常检测直接决定加工质量,由机械臂和搭载于机械臂前端的工业相机构成的视觉系统可以有效监测此类异常。本文使用六轴机械臂搭载工业相机对工件表面进行成像,获取由模糊到清晰再到模糊的视频序列,以此选出最清晰的视频帧作为自动加工中有聚焦要求的距离指导,以进行聚焦异常修正,从而实现自动定位。提出一种基于多层级视频Transformer的视频分类模型多级视频Transformer(MLVT)用于高语义级别的视频表征学习,并用于选出视频序列中成像最清晰的帧。首先,提出一种具有多种感受野的token划分方法多级标记(MLT),能够将原始视频数据按2D图像补丁、3D图像补丁、帧和片段这4个层级划分成token序列,并在加入位置编码之后送入多级编码器(MLE)方法进行注意力的计算。为了缓解多层级的tokens带来的计算代价和收敛速度慢的问题,MLE引入一种逐层的可变形注意力机制逐层可变形注意力机制(LWLA),以一种可学习的方式代替全局注意力进行特征相似性的计算。最终,该方法3个版本的模型在本文的视频数据集上分别取得了87.2%、88.6%、88.9%的分类准确率,在与同参数量级的主流视频Transformer实验对比中均表现了最优的性能,有效地完成了从视频序列中选择出最清晰帧的任务,能够为下游视觉任务的性能提供强有力保障。 展开更多
关键词 视频transformer 视频分类 视觉自动定位 可变形注意力
在线阅读 下载PDF
基于Transformer编码器的合成语声检测系统 被引量:2
12
作者 万伊 杨飞然 杨军 《应用声学》 CSCD 北大核心 2023年第1期26-33,共8页
自动说话人认证系统是一种常用的目标说话人身份认证方案,但它在合成语声的攻击下表现出脆弱性,合成语声检测系统试图解决这一问题。该文提出了一种基于Transformer编码器的合成语声检测方法,利用自注意力机制学习输入特征内部的长期依... 自动说话人认证系统是一种常用的目标说话人身份认证方案,但它在合成语声的攻击下表现出脆弱性,合成语声检测系统试图解决这一问题。该文提出了一种基于Transformer编码器的合成语声检测方法,利用自注意力机制学习输入特征内部的长期依赖关系。合成语声检测问题并不关注句子的抽象语义特征,用参数量较小的模型也能得到较好的检测性能。该文分别测试了4种常用合成语声检测特征在Transformer编码器上的表现,在国际标准的ASVspoof2019挑战赛的逻辑攻击数据集上,基于线性频率倒谱系数特征和Transformer编码器的系统等错误率与串联检测代价函数分别为3.13%和0.0708,且模型参数量仅为0.082 M,在较小参数量下得到了较好的检测性能。 展开更多
关键词 自动说话人认证 合成语声检测 transformer编码器
在线阅读 下载PDF
基于DFCNN-CTC和Transformer的中文语音识别 被引量:1
13
作者 杨璐 郭文明 韩芳 《火力与指挥控制》 CSCD 北大核心 2022年第3期16-21,共6页
语音识别一般只是将语音转化成文字,识别的结果是没有标点的一连串汉字,这不利于读者阅读,也会影响后续任务的处理。因此,引入语音端点检测解决上述问题。同时针对传统的语言模型N-gram存在忽略字词之间语义的相似性、训练时的参数过大... 语音识别一般只是将语音转化成文字,识别的结果是没有标点的一连串汉字,这不利于读者阅读,也会影响后续任务的处理。因此,引入语音端点检测解决上述问题。同时针对传统的语言模型N-gram存在忽略字词之间语义的相似性、训练时的参数过大等问题,提出一种以全序列卷积神经网络DFCNN作为声学模型,Transformer作为语言模型的语音识别系统。在Thchs30、ST-CMDS数据集上的实验表明,相较于DFCNN结合3-gram模型,该系统在最优模型上达到了12.8%的字符错误率,相对下降了6.9%。 展开更多
关键词 语音识别 语音端点检测 DFCNN transformer
在线阅读 下载PDF
基于CNN-Transformer的自动泊车车位感知算法 被引量:2
14
作者 王玉龙 翁茂楠 +1 位作者 黄辉 覃小艺 《汽车技术》 CSCD 北大核心 2024年第8期1-6,共6页
为提高自动泊车成功率及准确性,首先基于卷积神经网络(CNN)模型对输入图像进行特征提取,然后利用Transfomer模型的“编码-解码”机制对CNN提取到的图像特征平铺后进行计算推理,通过前馈神经网络得到目标预测结果,最后基于180°广角... 为提高自动泊车成功率及准确性,首先基于卷积神经网络(CNN)模型对输入图像进行特征提取,然后利用Transfomer模型的“编码-解码”机制对CNN提取到的图像特征平铺后进行计算推理,通过前馈神经网络得到目标预测结果,最后基于180°广角鱼眼图像进行推理识别,车位角中心点和空车位入口中心点均采用二维坐标表示,降低了输出信息的冗余,优化了模型结构。测试结果表明,该算法能够较好地适应不同车位线划线方式和不同的自然环境,目标感知的召回率达到98%,车位角中心点定位平均误差小于3 cm,满足泊车系统对车位感知的鲁棒性、实时性和准确性要求。 展开更多
关键词 自动泊车 车位检测 视觉增强 卷积神经网络 transformer
在线阅读 下载PDF
Automatic extraction of foreground objects from Mars images 被引量:1
15
作者 WANG Shuliang LIU Chang +4 位作者 WU Shangru NIE Qianqian WANG Yongtao ZENG Shi ZHU Haifeng 《Geo-Spatial Information Science》 SCIE EI 2012年第1期17-25,共9页
A novel method is proposed to automatically extract foreground objects from Martian surface images.The characteristics of Mars images are distinct,e.g.uneven illumination,low contrast between foreground and background... A novel method is proposed to automatically extract foreground objects from Martian surface images.The characteristics of Mars images are distinct,e.g.uneven illumination,low contrast between foreground and background,much noise in the background,and foreground objects with irregular shapes.In the context of these characteristics,an image is divided into foreground objects and background information.Homomorphism filtering is first applied to rectify brightness.Then,wavelet transformation enhances contrast and denoises the image.Third,edge detection and active contour are combined to extract contours regardless of the shape of the image.Experimental results show that the method can extract foreground objects from Mars images automatically and accurately,and has many potential applications. 展开更多
关键词 automatic object extraction Mars images homomorphic filtering wavelet transformation active contour edge detection
原文传递
AUTOMATIC SEARCHING OF CONTROL POINT IN NOAA AVHRR IMAGE
16
作者 Shu Ning Shi Huaxiang 《Geo-Spatial Information Science》 1999年第1期26-29,67,共5页
This paper discusses the approaches for automatical searching of control points in the NOAA AVHRR image on the basis of data rearrangement in the form of latitude and longitude grid. The vegetation index transformatio... This paper discusses the approaches for automatical searching of control points in the NOAA AVHRR image on the basis of data rearrangement in the form of latitude and longitude grid. The vegetation index transformation and multi-level matching strategies have been proven effective and successful as the experiments show while the control point database is established. 展开更多
关键词 control point database automatical SEARCHING grid IMAGE VEGETATION index transformation MULTI-LEVEL matching NOAA AVHRR IMAGE
在线阅读 下载PDF
基于3D UNet结合Transformer的肝脏及肝肿瘤自动分割 被引量:3
17
作者 戴振晖 简婉薇 +5 位作者 朱琳 张白霖 靳怀志 杨耕 谭翔 王学涛 《中国医疗设备》 2023年第1期42-47,共6页
目的肝脏和肝肿瘤分割是肝癌放疗计划设计的重要步骤,本文提出新型自动分割模型,以实现肝脏和肝肿瘤的精确分割。方法在3D UNet深度神经网络中加入了残差模块和Swim Transformer模块,提出一个新型的卷积和Transformer结合的Res-Swim-UNe... 目的肝脏和肝肿瘤分割是肝癌放疗计划设计的重要步骤,本文提出新型自动分割模型,以实现肝脏和肝肿瘤的精确分割。方法在3D UNet深度神经网络中加入了残差模块和Swim Transformer模块,提出一个新型的卷积和Transformer结合的Res-Swim-UNet模型。在LiTS公共数据集上对比了所提出方法与先前方法的性能,并在本地数据集上验证了Res-Swim-UNet模型的泛化能力。结果Res-Swim-UNet模型在LiTS公共数据集上肝脏分割结果的Dice相似性系数(Dice Similarity Coefficient,DSC)、体积重叠误差(Volumetric Overlap Error,VOE)分别是0.957、0.522,相对于UNet模型DSC提高了1.6%,VOE降低了1.3%;肝肿瘤分割结果的DSC、VOE分别是0.672、0.617,相对于UNet模型DSC提高了13.5%,VOE降低了5.9%。在本地数据集上肝脏分割结果的DSC、VOE分别是0.895、0.552,肝肿瘤分割结果的DSC、VOE分别是0.589、0.706。结论本文提出的Res-Swim-UNet模型可以有效提高CT图像中肝脏和肝肿瘤的分割效果,且该模型在迁移到本地数据时仍具有较高的分割精度。该模型可以用于提高医生勾画靶区的效率。 展开更多
关键词 肝脏 肝肿瘤 自动分割 3D UNet深度神经网络 Swim transformer模块
暂未订购
Automatic Road Extraction in Rural Areas Based on Digital Imaging and Laser Scanner Data
18
作者 Claudionor Ribeiro da Silva Jorge Ant6nio Silva Centeno Maria Joao Henriques 《Journal of Civil Engineering and Architecture》 2011年第4期285-296,共12页
Digitizing road maps manually is an expensive and time-consuming task. Several methods that intend to develop fully or semi-automated systems have been proposed. In this work we introduce a method, based on the Radon ... Digitizing road maps manually is an expensive and time-consuming task. Several methods that intend to develop fully or semi-automated systems have been proposed. In this work we introduce a method, based on the Radon transform and optimal algorithms, which extracts automatically roads on images of rural areas, images that were acquired by digital cameras and airborne laser scanners. The proposed method detects linear segments iteratively and starting from this it generates the centerlines of the roads. The method is based on an objective function which depends on three parameters related to the correlation between the cross-sections, spectral similarity and directions of the segments. Different tests were performed using aerial photos, Ikonos images and laser scanner data of an area located in the state of Parana (Brazil) and their results are presented and discussed. The quality of the detection of the roads centerlines was computed using several indexes - completeness, correctness and RMS. The values obtained reveal the good performance of the proposed methodology. 展开更多
关键词 Radon transform automatic extraction ROADS laser scanning digital image
在线阅读 下载PDF
Design and Simulation of an Audio Signal Alerting and Automatic Control System
19
作者 Winfred Adjardjah John Awuah Addor +1 位作者 Wisdom Opare Isaac Mensah Ayipeh 《Communications and Network》 2023年第4期98-119,共22页
A large part of our daily lives is spent with audio information. Massive obstacles are frequently presented by the colossal amounts of acoustic information and the incredibly quick processing times. This results in th... A large part of our daily lives is spent with audio information. Massive obstacles are frequently presented by the colossal amounts of acoustic information and the incredibly quick processing times. This results in the need for applications and methodologies that are capable of automatically analyzing these contents. These technologies can be applied in automatic contentanalysis and emergency response systems. Breaks in manual communication usually occur in emergencies leading to accidents and equipment damage. The audio signal does a good job by sending a signal underground, which warrants action from an emergency management team at the surface. This paper, therefore, seeks to design and simulate an audio signal alerting and automatic control system using Unity Pro XL to substitute manual communication of emergencies and manual control of equipment. Sound data were trained using the neural network technique of machine learning. The metrics used are Fast Fourier transform magnitude, zero crossing rate, root mean square, and percentage error. Sounds were detected with an error of approximately 17%;thus, the system can detect sounds with an accuracy of 83%. With more data training, the system can detect sounds with minimal or no error. The paper, therefore, has critical policy implications about communication, safety, and health for underground mine. 展开更多
关键词 Emergency Response Emergency Management Team Audio Signal Alerting automatic Control System Uni Pro XL Manual Communication Fast Fourier transform Magnitude Zero Crossing Rate Root Means Square
在线阅读 下载PDF
一种基于Transformer模型的特征增强算法及其应用研究
20
作者 李俊华 段志奎 于昕梅 《佛山科学技术学院学报(自然科学版)》 CAS 2024年第3期27-34,共8页
Transformer模型在自动语音识别(ASR)任务中展现出优秀的性能,但在特征提取方面存在两个问题:一是模型集中于全局特征交互信息提取,忽略了其他有用的特征信息,如局部特征交互信息;二是模型对低层特征交互信息的利用不够充分。为了解决... Transformer模型在自动语音识别(ASR)任务中展现出优秀的性能,但在特征提取方面存在两个问题:一是模型集中于全局特征交互信息提取,忽略了其他有用的特征信息,如局部特征交互信息;二是模型对低层特征交互信息的利用不够充分。为了解决这两个问题,提出了卷积线性映射(CMLP)模块以强化局部特征交互,并设计低层特征融合(LF)模块来融合高低层特征。通过整合这些模块,构建了CLformer模型。在两个中文普通话数据集(Aishell-1和HKUST)上进行实验,结果表明,CLformer显著提升了模型性能,在Aishell-1上较基线提高0.3%,在HKUST上提高0.5%。 展开更多
关键词 transformer模型 自动语音识别 特征增强 局部特征 特征融合
在线阅读 下载PDF
上一页 1 2 63 下一页 到第
使用帮助 返回顶部