-
题名基于CNN和自注意力神经网络的代码补全方法
- 1
-
-
作者
陈伟
何成万
余秋惠
贺正源
罗蝶
-
机构
武汉工程大学计算机科学与工程学院
武汉工程大学智能机器人湖北省重点实验室
-
出处
《计算机工程与设计》
北大核心
2025年第10期2919-2926,共8页
-
基金
国家自然科学基金项目(61272115)
武汉工程大学第十五届研究生教育创新基金项目(CX2023294)。
-
文摘
由于基于抽象语法树的代码补全模型在提取代码序列细粒度的局部特征方面能力较差,并且难以应用于实际开发场景,提出一种基于卷积神经网络(convolutional neural network,CNN)和自注意力神经网络Transformer的代码补全方法。采用基于代码轻量级语法信息的预处理方法,并提出将CNN与Transformer网络以参数有效的方式结合,对代码序列的全局和局部依赖关系进行全面性建模。模型采用多任务学习机制(multi-task learning,MTL)共享代码token值和类型信息,提取代码序列中的语法和语义特征完成代码token级补全任务。实验结果表明,所提出的代码补全方法在ETH 150K Python数据集上准确率达到74.85%,显著优于基线方法。
-
关键词
代码补全
多任务学习
Transformer
卷积神经网络
抽象语法树
轻量级语法
深度学习
-
Keywords
code completion
multi-task learning
Transformer
convolutional neutral network
abstract syntax tree
lightweight syntax
deep learning
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-