期刊文献+
共找到4,939篇文章
< 1 2 247 >
每页显示 20 50 100
GPT-NAS:Neural Architecture Search Meets Generative Pre-Trained Transformer Model
1
作者 Caiyang Yu Xianggen Liu +5 位作者 Yifan Wang Yun Liu Wentao Feng Xiong Deng Chenwei Tang Jiancheng Lv 《Big Data Mining and Analytics》 2025年第1期45-64,共20页
The pursuit of optimal neural network architectures is foundational to the progression of Neural Architecture Search (NAS). However, the existing NAS methods suffer from the following problem using traditional search ... The pursuit of optimal neural network architectures is foundational to the progression of Neural Architecture Search (NAS). However, the existing NAS methods suffer from the following problem using traditional search strategies, i.e., when facing a large and complex search space, it is difficult to mine more effective architectures within a reasonable time, resulting in inferior search results. This research introduces the Generative Pre-trained Transformer NAS (GPT-NAS), an innovative approach designed to overcome the limitations which are inherent in traditional NAS strategies. This approach improves search efficiency and obtains better architectures by integrating GPT model into the search process. Specifically, we design a reconstruction strategy that utilizes the trained GPT to reorganize the architectures obtained from the search. In addition, to equip the GPT model with the design capabilities of neural architecture, we propose the use of the GPT model for training on a neural architecture dataset. For each architecture, the structural information of its previous layers is utilized to predict the next layer of structure, iteratively traversing the entire architecture. In this way, the GPT model can efficiently learn the key features required for neural architectures. Extensive experimental validation shows that our GPT-NAS approach beats both manually constructed neural architectures and automatically generated architectures by NAS. In addition, we validate the superiority of introducing the GPT model in several ways, and find that the accuracy of the neural architecture on the image dataset obtained from the search after introducing the GPT model is improved by up to about 9%. 展开更多
关键词 Neural Architecture Search(NAS) generative pre-trained transformer(GPT)model evolutionary algorithm image classification
原文传递
AB-Gen:Antibody Library Design with Generative Pre-trained Transformer and Deep Reinforcement Learning 被引量:1
2
作者 Xiaopeng Xu Tiantian Xu +5 位作者 Juexiao Zhou Xingyu Liao Ruochi Zhang Yu Wang Lu Zhang Xin Gao 《Genomics, Proteomics & Bioinformatics》 SCIE CAS CSCD 2023年第5期1043-1053,共11页
Antibody leads must fulfill multiple desirable properties to be clinical candidates.Primarily due to the low throughput in the experimental procedure,the need for such multiproperty optimization causes the bottleneck ... Antibody leads must fulfill multiple desirable properties to be clinical candidates.Primarily due to the low throughput in the experimental procedure,the need for such multiproperty optimization causes the bottleneck in preclinical antibody discovery and development,because addressing one issue usually causes another.We developed a reinforcement learning(RL)method,named AB-Gen,for antibody library design using a generative pre-trained transformer(GPT)as the policy network of the RL agent.We showed that this model can learn the antibody space of heavy chain complementarity determining region 3(CDRH3)and generate sequences with similar property distributions.Besides,when using human epidermal growth factor receptor-2(HER2)as the target,the agent model of AB-Gen was able to generate novel CDRH3 sequences that fulfill multi-property constraints.Totally,509 generated sequences were able to pass all property filters,and three highly conserved residues were identified.The importance of these residues was further demonstrated by molecular dynamics simulations,consolidating that the agent model was capable of grasping important information in this complex optimization task.Overall,the ABGen method is able to design novel antibody sequences with an improved success rate than the traditional propose-then-filter approach.It has the potential to be used in practical antibody design,thus empowering the antibody discovery and development process.The source code of AB-Gen is freely available at Zenodo(https://doi.org/10.5281/zenodo.7657016)and BioCode(https://ngdc.cncb.ac.cn/biocode/tools/BT007341). 展开更多
关键词 Protein design transformer Reinforcement learning generative modeling Multi-objective optimization
原文传递
Evaluating chat generative pretrained transformer in answering questions on endoscopic mucosal resection and endoscopic submucosal dissection 被引量:1
3
作者 Shi-Song Wang Hui Gao +3 位作者 Peng-Yao Lin Tian-Chen Qian Ying Du Lei Xu 《World Journal of Gastrointestinal Oncology》 2025年第10期290-303,共14页
BACKGROUND With the rising use of endoscopic submucosal dissection(ESD)and endoscopic mucosal resection(EMR),patients are increasingly questioning various aspects of these endoscopic procedures.At the same time,conver... BACKGROUND With the rising use of endoscopic submucosal dissection(ESD)and endoscopic mucosal resection(EMR),patients are increasingly questioning various aspects of these endoscopic procedures.At the same time,conversational artificial intelligence(AI)tools like chat generative pretrained transformer(ChatGPT)are rapidly emerging as sources of medical information.AIM To evaluate ChatGPT’s reliability and usefulness regarding ESD and EMR for patients and healthcare professionals.METHODS In this study,30 specific questions related to ESD and EMR were identified.Then,these questions were repeatedly entered into ChatGPT,with two independent answers generated for each question.A Likert scale was used to rate the accuracy,completeness,and comprehensibility of the responses.Meanwhile,a binary category(high/Low)was used to evaluate each aspect of the two responses generated by ChatGPT and the response retrieved from Google.RESULTS By analyzing the average scores of the three raters,our findings indicated that the responses generated by ChatGPT received high ratings for accuracy(mean score of 5.14 out of 6),completeness(mean score of 2.34 out of 3),and comprehensibility(mean score of 2.96 out of 3).Kendall’s coefficients of concordance indicated good agreement among raters(all P<0.05).For the responses generated by Google,more than half were classified by experts as having low accuracy and low completeness.CONCLUSION ChatGPT provided accurate and reliable answers in response to questions about ESD and EMR.Future studies should address ChatGPT’s current limitations by incorporating more detailed and up-to-date medical information.This could establish AI chatbots as significant resource for both patients and health care professionals. 展开更多
关键词 Endoscopic submucosal dissection Endoscopic mucosal dissection Artificial intelligence Chat generative pretrained transformer Patient education Google
暂未订购
知识蒸馏Transformer的人物交互检测
4
作者 陈东吉 赖惠成 +3 位作者 高古学 马骏 李俊凯 权虎拓 《计算机工程》 北大核心 2026年第1期206-216,共11页
得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务... 得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务:预测人框,预测物框与物体类别,预测人物之间的交互动作,构建基础多分支Transformer结构,包含一个人体实例分支、一个物体实例分支和一个交互分支,并利用人、物分支的解码器为交互分支解码器提供人、物的区域线索。为了给Transformer结构提供关键的语义、空间信息,预先生成物体类别和交互动词语义特征,以及人物框的空间特征为不同的Transformer分支提供语义、空间线索,进一步提升解码器对于不同HOI任务的特征提取能力。并在此基础上构建另一个多分支Transformer结构作为教师网络,教师网络的解码器以预生成特征为解码器查询,输出更精确的HOI特征。在训练过程中让基础多分支网络模仿教师网络的输出,构建额外的类相似度损失度量两个网络输出预测之间的类内、类间向量相似度,从而达到提升基础网络解码器性能的目的。实验结果表明,在人-物交互基准数据集HICO-DET所有类别、稀有类别和非稀有类别上的均值平均精度(mAP)分别为32.13%、28.57%和33.19%,对比基线取得了最多4.65百分点的提升。 展开更多
关键词 transformer网络 人-物交互 预生成特征 教师网络 类相似度损失
在线阅读 下载PDF
A 4-MA linear transformer driver for X-ray generation
5
作者 Hao Wei Mengtong Qiu +21 位作者 Xiaofeng Jiang Zhiguo Wang Hongyu Jiang Weibo Yao Dingguo Lai Hanyu Wu Cheng Lou Jiachen Wang Yaorong Yang Fengju Sun Mo Li Liangping Wang Qifu Xu Pengchao Li Sen Yang Yi Shen Zhen Wu Jinhua Wang Wei Liu Hailiang Yang Wei Wu Aici Qiu 《Matter and Radiation at Extremes》 2025年第6期42-50,共9页
We have designed,assembled,and tested a 4-MA,60-ns fast linear transformer driver(LTD),which is the first operating generator featuring multiple LTD modules connected in parallel.The LTD-based accelerator comprises si... We have designed,assembled,and tested a 4-MA,60-ns fast linear transformer driver(LTD),which is the first operating generator featuring multiple LTD modules connected in parallel.The LTD-based accelerator comprises six modules in parallel,each of which has ten-stage cavities stacked in series.The six LTD modules are connected to a water tank of diameter 6 m via a 3-m-long impedance-matched deionized waterinsulated coaxial transmission line.In the water tank,the electrical pulses are transmitted down by six horizontal tri-plate transmission lines.A 2.1-m-diameter two-level vacuum insulator stack is utilized to separate the deionized water region from the vacuum region.In the vacuum,the currents are further transported downstream by a two-level magnetically insulated transmission-line and then converged through four post-hole convolutes.Plasma radiation loads or bremsstrahlung electron beam diodes serve as loads that are expected to generate intense soft X rays or warm X rays.The machine is 3.2 m in height and 22 m in outer diameter,including support systems such as a high-voltage charge supply,magnetic core reset system,trigger system,and support platform for inner stalk installation and maintenance.A total of 1440 individual±100-kV multi-gap spark switches and 2880 individual 100-kV capacitors are employed in the accelerator.A total of 12 fiberoptic laser-controlled trigger generators combining photoconductive and traditional gas spark switch technologies are used to realize the synchronous discharge of the more than 1000 gas switches.At an LTD charge voltage of±85 kV,the accelerator stores an initial energy of about 300 kJ and is expected to deliver a current of 3–5 MA into various loads.To date,the LTD facility has shot into a thick-walled aluminum liner load and a reflex triode load.With a thick-walled aluminum liner of inductance 1.81 nH,a current with peak up to 4.1 MA and rise time(10%–90%)of about 60 ns has been achieved.The current transport efficiency from the insulator stack to the liner load approaches 100%during peak times.The LTD accelerator has been used to drive reflex triode loads generating warm X rays with high energy fluence and large radiation area.It has been demonstrated that this LTD is a promising and high-efficiency prime pulsed power source suitable for use in constructing the next generation of large-scale accelerators with currents of tens of megaamperes. 展开更多
关键词 X ray generation Linear transformer Driver Multi Megampere Accelerator water tank water tankthe Pulsed Power Source linear transformer driver ltd which operating generator
在线阅读 下载PDF
A Generative Image Steganography Based on Disentangled Attribute Feature Transformation and Invertible Mapping Rule
6
作者 Xiang Zhang Shenyan Han +1 位作者 Wenbin Huang Daoyong Fu 《Computers, Materials & Continua》 2025年第4期1149-1171,共23页
Generative image steganography is a technique that directly generates stego images from secret infor-mation.Unlike traditional methods,it theoretically resists steganalysis because there is no cover image.Currently,th... Generative image steganography is a technique that directly generates stego images from secret infor-mation.Unlike traditional methods,it theoretically resists steganalysis because there is no cover image.Currently,the existing generative image steganography methods generally have good steganography performance,but there is still potential room for enhancing both the quality of stego images and the accuracy of secret information extraction.Therefore,this paper proposes a generative image steganography algorithm based on attribute feature transformation and invertible mapping rule.Firstly,the reference image is disentangled by a content and an attribute encoder to obtain content features and attribute features,respectively.Then,a mean mapping rule is introduced to map the binary secret information into a noise vector,conforming to the distribution of attribute features.This noise vector is input into the generator to produce the attribute transformed stego image with the content feature of the reference image.Additionally,we design an adversarial loss,a reconstruction loss,and an image diversity loss to train the proposed model.Experimental results demonstrate that the stego images generated by the proposed method are of high quality,with an average extraction accuracy of 99.4%for the hidden information.Furthermore,since the stego image has a uniform distribution similar to the attribute-transformed image without secret information,it effectively resists both subjective and objective steganalysis. 展开更多
关键词 Image information hiding generative information hiding disentangled attribute feature transformation invertible mapping rule steganalysis resistance
在线阅读 下载PDF
基于GAN和Transformer模型组合的格陵兰地区PWV短时预报方法
7
作者 张胜凯 胡希成 +4 位作者 龚力 雷锦韬 李文浩 马超 肖峰 《大地测量与地球动力学》 北大核心 2025年第9期881-887,893,共8页
基于2010—2018年GPS反演的PWV时间序列数据以及同时期ERA5再分析资料计算的格陵兰地区PWV数据,采用深度学习中的生成对抗网络模型(GAN)和Transformer神经网络模型组合,实现由GPS-PWV数据对格陵兰地区PWV数据的短时预报。采用2019年的E... 基于2010—2018年GPS反演的PWV时间序列数据以及同时期ERA5再分析资料计算的格陵兰地区PWV数据,采用深度学习中的生成对抗网络模型(GAN)和Transformer神经网络模型组合,实现由GPS-PWV数据对格陵兰地区PWV数据的短时预报。采用2019年的ERA5数据对预测结果进行评估,结果表明,模型在大部分地区表现较好,RMSE优于4.5 mm,相关系数大于0.7。在春、秋、冬季,相关系数均高于0.5;受天气剧烈变化影响,夏季少部分时间相关系数略低。该方法能够预测格陵兰地区PWV的空间分布和随时间的变化情况。 展开更多
关键词 生成对抗网络 transformer GPS 格陵兰 PWV 短时预报
在线阅读 下载PDF
基于音乐情感的ERoPE-Transformer音乐生成方法 被引量:1
8
作者 张玉梅 陈章杰 +2 位作者 吕小姣 延成岭 卢恒 《榆林学院学报》 2025年第2期78-86,共9页
针对音乐生成缺乏情感表达和交互性的问题,提出一种基于音乐情感的ERoPE-Transformer音乐生成方法。基于情感的旋转位置编码Transformer模型(Emotion Rotary Position Embedding Transformer,ERoPE-Transformer)以CP Transformer模型为... 针对音乐生成缺乏情感表达和交互性的问题,提出一种基于音乐情感的ERoPE-Transformer音乐生成方法。基于情感的旋转位置编码Transformer模型(Emotion Rotary Position Embedding Transformer,ERoPE-Transformer)以CP Transformer模型为基础模型,在CP编码的基础上加入情感标签,将音乐序列转换成离散的符号序列,并且引入旋转位置编码,提高模型的外推性,更好地捕获长序列建模中的音乐信息和情感特征。最后通过客观和主观实验对音乐质量和情感效果进行验证,与其他常用的音乐生成模型进行比较,包括Transformer-XL模型、CP Transformer模型和CEG-Transformer模型。客观实验从音高、节奏和音乐结构三个方面评价音乐质量,同时采用DUPSO-DSKSVM民歌快速分类算法对音乐情感进行分类,以验证生成音乐的情感效果。主观实验通过人耳听力测试从不同方面对音乐质量进行打分评价,同时使用人耳听力测试对音乐的情感效果进行评价。实验结果表明,本文提出的ERoPE-Transformer模型在音乐质量和情感表达上都有很好的效果,优于其他三种方法。 展开更多
关键词 情感音乐生成 transformer网络 旋转位置编码
在线阅读 下载PDF
不均衡样本下轴承故障的LSGAN‑Swin Transformer诊断方法
9
作者 刘杰 谭玉涛 +1 位作者 谷艳玲 杨娜 《振动工程学报》 北大核心 2025年第8期1775-1787,共13页
针对轴承在复杂环境下工作时故障数据难以大量获取,正常数据与故障数据比例严重失衡造成的深度模型训练不充分、诊断精度低等问题,提出一种基于LSGAN-Swin Transformer的轴承故障诊断方法,利用最小二乘生成对抗网络(LSGAN)扩充不均衡或... 针对轴承在复杂环境下工作时故障数据难以大量获取,正常数据与故障数据比例严重失衡造成的深度模型训练不充分、诊断精度低等问题,提出一种基于LSGAN-Swin Transformer的轴承故障诊断方法,利用最小二乘生成对抗网络(LSGAN)扩充不均衡或缺少的轴承数据集,引入窗口自注意力网络进行轴承故障状态识别,使用两种数据集验证所提方法的有效性,并分别与SGAN、WGAN进行对比,证明LSGAN生成的数据训练模型具有更高的准确率。在小样本条件下训练LSGAN,将所提Swin Transformer(Swin-T)模型与CNN、AlexNe和SqueezeNet进行对比,诊断准确率分别提升了34.85%、13.45%和12.95%。通过t-SNE可视化分析对模型分类效果进行评估,结果表明,LSGAN-Swin-T模型在训练样本数量较少时仍能较好地满足故障诊断中的需求,为不均衡数据下的轴承故障诊断研究提供思路。 展开更多
关键词 故障诊断 滚动轴承 不均衡样本 最小二乘生成对抗网络 Swin transformer
在线阅读 下载PDF
基于改进Vision Transformer的水稻叶片病害图像识别
10
作者 朱周华 周怡纳 +1 位作者 侯智杰 田成源 《电子测量技术》 北大核心 2025年第10期153-160,共8页
水稻叶片病害智能识别在现代农业生产中具有重要意义。针对传统Vision Transformer网络缺乏归纳偏置,难以有效捕捉图像局部细节特征的问题,提出了一种改进的Vision Transformer模型。该模型通过引入内在归纳偏置,增强了对多尺度上下文... 水稻叶片病害智能识别在现代农业生产中具有重要意义。针对传统Vision Transformer网络缺乏归纳偏置,难以有效捕捉图像局部细节特征的问题,提出了一种改进的Vision Transformer模型。该模型通过引入内在归纳偏置,增强了对多尺度上下文以及局部与全局依赖关系的建模能力,同时降低了对大规模数据集的需求。此外,Vision Transformer中的多层感知器模块被Kolmogorov-Arnold网络结构取代,从而提升了模型对复杂特征的提取能力和可解释性。实验结果表明,所提模型在水稻叶片病害识别任务中取得了优异的性能,识别准确率达到了98.62%,较原始ViT模型提升了6.2%,显著提高了对水稻叶片病害的识别性能。 展开更多
关键词 水稻叶片病害 图像识别 Vision transformer网络 归纳偏置 局部特征
原文传递
ViTAU:基于Vision transformer和面部动作单元的面瘫识别与分析 被引量:1
11
作者 高嘉 蔡文浩 +1 位作者 赵俊莉 段福庆 《工程科学学报》 EI 北大核心 2025年第2期351-363,共13页
面部神经麻痹(Facial nerve paralysis,FNP),通常称为贝尔氏麻痹或面瘫,对患者的日常生活和心理健康产生显著影响,面瘫的及时识别和诊断对于患者的早期治疗和康复至关重要.随着深度学习和计算机视觉技术的快速发展,面瘫的自动识别变得可... 面部神经麻痹(Facial nerve paralysis,FNP),通常称为贝尔氏麻痹或面瘫,对患者的日常生活和心理健康产生显著影响,面瘫的及时识别和诊断对于患者的早期治疗和康复至关重要.随着深度学习和计算机视觉技术的快速发展,面瘫的自动识别变得可行,为诊断提供了一种更准确和客观的方式.目前的研究主要集中关注面部的整体变化,而忽略了面部细节的重要性.面部不同部位对识别结果的影响力并不相同,这些研究尚未对面部各个区域进行细致区分和分析.本项研究引入结合Vision transformer(ViT)模型和动作单元(Action unit,AU)区域检测网络的创新性方法用于面瘫的自动识别及区域分析.ViT模型通过自注意力机制精准识别是否面瘫,同时,基于AU的策略从StyleGAN2模型提取的特征图中,利用金字塔卷积神经网络分析受影响区域.这一综合方法在YouTube Facial Palsy(YFP)和经过扩展的Cohn Kanade(CK+)数据集上的实验中分别达到99.4%的面瘫识别准确率和81.36%的面瘫区域识别准确率.通过与最新方法的对比,实验结果展示了所提的自动面瘫识别方法的有效性. 展开更多
关键词 transformer 面部动作单元 多分辨率特征图 生成器 热力图回归
在线阅读 下载PDF
The Main Theories of Transformational-Generative Grammar and Its Guide Upon Language Teaching
12
作者 李桂真 《科技信息》 2011年第2期186-186,188,共2页
This essay is showing an opinion that despite the many disadvantages of T.G grammar,its main theories about human language learning can give valuable guide to language teaching,which will be illustrated in the followi... This essay is showing an opinion that despite the many disadvantages of T.G grammar,its main theories about human language learning can give valuable guide to language teaching,which will be illustrated in the following from three main aspects. 展开更多
关键词 英语 语言学 学习方法 语法
在线阅读 下载PDF
基于GAN-Transformer的车载网络入侵检测算法 被引量:1
13
作者 王浩轩 苏圣超 崔文霞 《计算机工程与设计》 北大核心 2025年第6期1710-1716,共7页
针对当前车载网络入侵检测算法可用的训练数据集稀少且类别不均衡、难以提取时序性及泛化性较差的问题,提出一种基于Transformer模型的车载网络入侵检测算法。将报文输入到模型中进行对抗训练得到捕获正常报文时序特征的生成器和判别器... 针对当前车载网络入侵检测算法可用的训练数据集稀少且类别不均衡、难以提取时序性及泛化性较差的问题,提出一种基于Transformer模型的车载网络入侵检测算法。将报文输入到模型中进行对抗训练得到捕获正常报文时序特征的生成器和判别器;通过判别器将输入的报文进行精确分类。为提升算法的泛化能力,使用生成器以随机掩码预测的方法进行入侵检测。经过测试并采用消融实验验证后,针对各类入侵检测的实验结果表明,所提算法相较最新车载网络入侵检测算法实现更优异的检测性能。 展开更多
关键词 控制器局域网络 小样本学习 车载网络 入侵检测系统 自注意力模型 生成对抗网络 多头注意力
在线阅读 下载PDF
Diffusion-based generative drug-like molecular editing with chemical natural language 被引量:1
14
作者 Jianmin Wang Peng Zhou +6 位作者 Zixu Wang Wei Long Yangyang Chen Kyoung Tai No Dongsheng Ouyang Jiashun Mao Xiangxiang Zeng 《Journal of Pharmaceutical Analysis》 2025年第6期1215-1225,共11页
Recently,diffusion models have emerged as a promising paradigm for molecular design and optimization.However,most diffusion-based molecular generative models focus on modeling 2D graphs or 3D geom-etries,with limited ... Recently,diffusion models have emerged as a promising paradigm for molecular design and optimization.However,most diffusion-based molecular generative models focus on modeling 2D graphs or 3D geom-etries,with limited research on molecular sequence diffusion models.The International Union of Pure and Applied Chemistry(IUPAC)names are more akin to chemical natural language than the simplified molecular input line entry system(SMILES)for organic compounds.In this work,we apply an IUPAC-guided conditional diffusion model to facilitate molecular editing from chemical natural language to chemical language(SMILES)and explore whether the pre-trained generative performance of diffusion models can be transferred to chemical natural language.We propose DiffIUPAC,a controllable molecular editing diffusion model that converts IUPAC names to SMILES strings.Evaluation results demonstrate that our model out-performs existing methods and successfully captures the semantic rules of both chemical languages.Chemical space and scaffold analysis show that the model can generate similar compounds with diverse scaffolds within the specified constraints.Additionally,to illustrate the model’s applicability in drug design,we conducted case studies in functional group editing,analogue design and linker design. 展开更多
关键词 Diffusion model IUPAC Molecular generative model Chemical natural language transformer
在线阅读 下载PDF
基于VMD-T2V-Transformer的太阳辐射预测
15
作者 胡雅彬 史加荣 +1 位作者 陈应瑞 雍龙泉 《太阳能学报》 北大核心 2025年第7期778-784,共7页
太阳辐射的不确定性导致太阳能发电具有明显的随机性和不稳定性。针对此问题,该文结合变分模态分解(VMD)、Time2Vec(T2V)和Transformer,提出一种用于太阳辐射预测的VMD-T2V-Transformer模型。首先利用VMD将太阳辐射序列分解为若干子序列... 太阳辐射的不确定性导致太阳能发电具有明显的随机性和不稳定性。针对此问题,该文结合变分模态分解(VMD)、Time2Vec(T2V)和Transformer,提出一种用于太阳辐射预测的VMD-T2V-Transformer模型。首先利用VMD将太阳辐射序列分解为若干子序列;接着采用T2V对分解后的每个子序列进行时间特征嵌入;然后对嵌入时间特征后的子序列建立Transformer预测模型;最后将各模型的预测结果进行叠加,得到最终预测值。实验结果表明:该文所提模型优于其他主流模型,RMSE和MAE至少降低13.81%和16.44%。 展开更多
关键词 太阳辐射 太阳能发电 变分模态分解 Time2Vec transformer
原文传递
基于改进Transformer的电信重投报告自动生成方法研究
16
作者 梁伟明 肖军 +2 位作者 马晓亮 辛盛 徐荣彬 《电信科学》 北大核心 2025年第6期197-207,共11页
在电信行业中,客户对未解决或处理不满意的投诉进行重复投诉的现象较为常见。手动生成重投报告不仅耗时且主观性较强,难以满足企业对高效性和一致性的要求。针对这一问题,提出了一种基于改进Transformer模型的自动化报告生成方法。该方... 在电信行业中,客户对未解决或处理不满意的投诉进行重复投诉的现象较为常见。手动生成重投报告不仅耗时且主观性较强,难以满足企业对高效性和一致性的要求。针对这一问题,提出了一种基于改进Transformer模型的自动化报告生成方法。该方法通过引入情绪嵌入,有效捕捉客户在对话中的情绪变化,改善了生成报告对客户态度和诉求的理解能力。同时,结合定制化位置编码,提升了模型对投诉时序信息的感知能力,从而增强了生成内容的时间逻辑性和细节完整性。实验结果表明,改进后的模型在BLEU(bilingual evaluation understudy)和ROUGE(recall-oriented understudy for gisting evaluation)指标上分别达到0.352和0.482,显著优于原始Transformer和其他对比模型。此外,与人工对比,工作效率提高了89%。生成的报告内容不仅更加准确贴合实际需求,还在语义细节与时序一致性上表现优异。 展开更多
关键词 电信客服 transformer 重投报告 自动报告生成
在线阅读 下载PDF
融合双向感知Transformer与频率分析策略的图像修复
17
作者 赵芷蔚 樊瑶 +1 位作者 郑黎志 余思运 《计算机应用研究》 北大核心 2025年第3期927-936,共10页
现有图像修复技术通常很难为缺失区域生成视觉上连贯的内容,其原因是高频内容质量下降导致频谱结构的偏差,以及有限的感受野无法有效建模输入特征之间的非局部关系。为解决上述问题,提出一种融合双向感知Transformer与频率分析策略的图... 现有图像修复技术通常很难为缺失区域生成视觉上连贯的内容,其原因是高频内容质量下降导致频谱结构的偏差,以及有限的感受野无法有效建模输入特征之间的非局部关系。为解决上述问题,提出一种融合双向感知Transformer与频率分析策略的图像修复网络(bidirect-aware Transformer and frequency analysis,BAT-Freq)。具体内容包括,设计了双向感知Transformer,用自注意力和n-gram的组合从更大的窗口捕获上下文信息,以全局视角聚合高级图像上下文;同时,提出了频率分析指导网络,利用频率分量来提高图像修复质量,并设计了混合域特征自适应对齐模块,有效地对齐并融合破损区域的混合域特征,提高了模型的细节重建能力。该网络实现空间域与频率域相结合的图像修复。在CelebA-HQ、Place2、Paris StreetView三个数据集上进行了大量的实验,结果表明,PSNR和SSIM分别平均提高了2.804 dB和8.13%,MAE和LPIPS分别平均降低了0.0158和0.0962。实验证明,该方法能够同时考虑语义结构的完善和纹理细节的增强,生成具有逼真感的修复结果。 展开更多
关键词 图像修复 生成对抗网络 小波变换 transformer
在线阅读 下载PDF
基于SSIMGAN和时间序列Transformer的内部威胁检测模型
18
作者 冯克俊 黄晓芳 +1 位作者 宋鲁华 殷明勇 《信息安全研究》 北大核心 2025年第12期1108-1116,共9页
内部威胁检测是信息安全的重要环节,旨在保护企业网络和数据安全,避免因内部人员不当行为导致的破坏.基于CERT4.2数据集提出了一种新的内部威胁检测模型,首先构建了相应的多变量时间序列数据,提出了引入结构相似度指数的辅助分类器生成... 内部威胁检测是信息安全的重要环节,旨在保护企业网络和数据安全,避免因内部人员不当行为导致的破坏.基于CERT4.2数据集提出了一种新的内部威胁检测模型,首先构建了相应的多变量时间序列数据,提出了引入结构相似度指数的辅助分类器生成对抗网络(SSIM结合ACGAN,简称SSIMGAN)对威胁数据按照不同场景进行增强,针对CERT4.2数据集中样本不平衡问题,生成更贴近原始数据分布的样本.然后,采用Focal Loss作为损失函数的时间序列Transformer(time series Transformer,TST)模型进行分类任务,使得模型更能注意到那些难分类的数据和少数样本的数据.最后,以精确率、召回率和F 1值作为模型性能的评价指标进行测试.实验结果表明,相较于其他模型,该方法在CERT4.2数据集上将召回率提升至96.22%,F 1值达到94.22%,验证了其在应对数据不均衡和降低漏报风险方面的有效性. 展开更多
关键词 内部威胁检测 生成对抗网络 transformer 结构相似度指数 数据增强
在线阅读 下载PDF
基于频域注意力Diffusion Transformer的SAR舰船图像生成技术
19
作者 黄文宇 熊刚 +1 位作者 舒汀 郁文贤 《现代雷达》 北大核心 2025年第11期52-57,共6页
目前,基于生成对抗网络的合成孔径雷达(SAR)图像生成方法受限于训练过程中的固有不稳定性,而基于扩散模型的方法仍主要依赖于传统的U-Net骨干网络。文中提出了一种新颖的扩散模型架构——SpectDiT,旨在实现高质量的SAR图像生成。该模型... 目前,基于生成对抗网络的合成孔径雷达(SAR)图像生成方法受限于训练过程中的固有不稳定性,而基于扩散模型的方法仍主要依赖于传统的U-Net骨干网络。文中提出了一种新颖的扩散模型架构——SpectDiT,旨在实现高质量的SAR图像生成。该模型将频谱层与Transformer注意力层相结合,在扩散过程中引入频域特征建模,从而进一步提升SAR图像的质量与真实性。与传统的去噪扩散概率模型及基于全注意力Transformer的扩散Transformer相比,SpectDiT在SAR图像生成任务中表现更为优越,尤其在峰值信噪比、结构相似度和感知图像块相似度等指标上取得了新的最优性能。值得注意的是,SpectDiT具备灵活的架构设计,可通过调整频谱层与注意力层的比例来适应不同的生成任务。作为一种新的扩散模型骨干网络,SpectDiT为SAR图像合成开辟了新的方向,具备拓展至其他领域图像生成任务的潜力。 展开更多
关键词 去噪扩散概率模型 扩散transformer 合成孔径雷达图像生成 频域学习
原文传递
基于Transformer与强化学习的叶片与机匣处理一体化优化设计
20
作者 范忠岗 吴跃腾 +3 位作者 巴顿 王阳阳 张敏 杜娟 《工程热物理学报》 北大核心 2025年第12期3995-4004,共10页
针对一台低速轴流压气机搭建了基于Transformer和强化学习的叶片与机匣处理一体化优化设计平台,综合考虑稳定裕度和效率,智能体在与环境交互过程中不断改进策略,最终在峰值效率不降的情况下获得稳定裕度拓宽13.1%的设计。针对最优方案,... 针对一台低速轴流压气机搭建了基于Transformer和强化学习的叶片与机匣处理一体化优化设计平台,综合考虑稳定裕度和效率,智能体在与环境交互过程中不断改进策略,最终在峰值效率不降的情况下获得稳定裕度拓宽13.1%的设计。针对最优方案,开展了气动性能的分析,研究发现叶片与机匣处理一体化设计后,叶顶区域流场堵塞明显降低,推迟了主流与泄漏流交界面的溢出。同时二次泄漏流诱发的熵产损失明显降低,抵消了机匣处理的施加对效率的负面影响。 展开更多
关键词 机匣处理 强化学习 transformer 叶顶泄漏流 熵产分析
原文传递
上一页 1 2 247 下一页 到第
使用帮助 返回顶部