期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于T5模型的智能合约漏洞修复研究
1
作者 焦健 陈瑞翔 +2 位作者 贺强 渠开洋 张子怡 《计算机科学》 北大核心 2025年第4期362-368,共7页
针对以太坊智能合约漏洞修复问题,目前的研究主要集中在人工定义模板的方法上。此方法需要开发者具备丰富的专业知识,面对复杂漏洞时修复效果较差。在Solidity智能合约源代码层面,围绕智能合约的漏洞修复技术开展研究。引入机器学习的... 针对以太坊智能合约漏洞修复问题,目前的研究主要集中在人工定义模板的方法上。此方法需要开发者具备丰富的专业知识,面对复杂漏洞时修复效果较差。在Solidity智能合约源代码层面,围绕智能合约的漏洞修复技术开展研究。引入机器学习的漏洞修复方式,设计并实现一个T5模型智能合约漏洞修复系统,解决人工依赖的问题。利用数据爬虫技术和数据增强技术,构建相应T5模型训练数据集。利用机器学习技术,训练智能合约漏洞修复T5模型。通过网络爬虫构建了一个测试数据集,对所提系统进行多角度的性能评估。在合约修复准确率、gas消耗和引入代码量等方面,与TIPS,SGUARD和Elysium等合约漏洞修复工具进行对比。实验结果表明,所提系统修复效果良好,整体性能优于其他漏洞修复工具。 展开更多
关键词 智能合约 区块链 t5模型 机器学习 漏洞修复
在线阅读 下载PDF
结合预训练模型和数据增强的跨领域属性级情感分析研究 被引量:1
2
作者 陈舸 王中卿 《计算机科学》 北大核心 2025年第8期300-307,共8页
属性级情感分析(ABSA)是一项细粒度情感分析任务,旨在识别文本中的具体属性并探测其情感倾向。针对ABSA模型因无法适应不同领域的语言风格而导致性能不佳以及目标领域缺乏标注数据的问题,提出了一种结合预训练模型的跨领域属性级情感分... 属性级情感分析(ABSA)是一项细粒度情感分析任务,旨在识别文本中的具体属性并探测其情感倾向。针对ABSA模型因无法适应不同领域的语言风格而导致性能不佳以及目标领域缺乏标注数据的问题,提出了一种结合预训练模型的跨领域属性级情感分析方法。该方法利用预训练模型对目标领域文本进行标签生成,再利用大语言模型重新生成更具目标领域风格的自然语句,最后将生成的样本和源领域样本组合训练,以对目标领域进行预测。在SemEval语料库的restaurant和laptop数据集以及一个公开的网络服务评论数据集上进行实验,结果表明,与现有跨领域情感分析方法相比,所提方法在F1值上至少提升了5.33%,充分证明了该方法的有效性。 展开更多
关键词 跨领域情感分析 预训练模型 t5 GPT
在线阅读 下载PDF
结合评价对象信息的评论摘要研究
3
作者 孔银玲 王中卿 王红玲 《计算机科学》 北大核心 2025年第7期233-240,共8页
评论是消费者对商品评价和反馈的一种文本形式。评论摘要是指对评论进行提取和压缩,形成能够概括评论信息的短文本。目前,评论摘要任务大多只关注评论的文本序列,忽略了评论中的方面、意见短语和情感极性等相关评价对象信息。因此,提出... 评论是消费者对商品评价和反馈的一种文本形式。评论摘要是指对评论进行提取和压缩,形成能够概括评论信息的短文本。目前,评论摘要任务大多只关注评论的文本序列,忽略了评论中的方面、意见短语和情感极性等相关评价对象信息。因此,提出了一种基于T5模型(Text-to-Text Transfer Transformer),结合评价对象信息的评论摘要方法。该方法首先利用T5模型对评论摘要任务进行建模,通过注意力机制学习评论文本中的上下文信息,生成包含核心语义的摘要文本;然后提取摘要文本中的评价对象信息,并将其作为评论摘要任务的辅助信息;最后利用少样本数据对模型参数进行特异性调整,进一步改善摘要的效果,从而生成高质量的评论摘要。实验结果表明,在酒店评论数据集SPACE和产品评论数据集OPOSUM+上,该方法相较于基准模型在ROUGE评价指标上均有显著提升。 展开更多
关键词 评论摘要 t5模型 评价对象信息 少样本数据 注意力机制
在线阅读 下载PDF
基于双重预训练的商品属性分类方法
4
作者 赵哲宇 王中卿 王红玲 《计算机科学》 北大核心 2025年第S1期204-211,共8页
商品属性分类任务是指对一段商品的描述文字进行属性分析并进而对多个属性进行分类的过程,其有助于人们从多个角度了解商品,为市场营销、产品管理等提供帮助。当前大语言模型的使用也愈加广泛,但在商品属性分类问题上,通用大模型由于缺... 商品属性分类任务是指对一段商品的描述文字进行属性分析并进而对多个属性进行分类的过程,其有助于人们从多个角度了解商品,为市场营销、产品管理等提供帮助。当前大语言模型的使用也愈加广泛,但在商品属性分类问题上,通用大模型由于缺乏领域知识和属性关联等信息,性能不够理想。为此,提出了一个基于双重预训练的商品属性分类方法,旨在通过使用特定的预训练方式提高大语言模型在商品属性分类任务中的性能。在T5模型的基础上,引入了领域内文本预训练和基于属性间关联性的预训练两种方法。在Clothing Fit Data数据集上的实验结果显示,使用了双重预训练的T5模型较未经过预训练的模型以及其他基准模型,在各个属性上的分类效果都取得了一定提升。实验结果证明了所提方法的有效性。 展开更多
关键词 双重预训练 多属性分类 大语言模型 t5 商品属性分类
在线阅读 下载PDF
基于T5的多项选择题自动生成模型研究 被引量:2
5
作者 徐坚 孙瑜 张利明 《曲靖师范学院学报》 2021年第6期36-42,共7页
多选题自动生成属自然语言处理领域难题,其子任务有问题生成、答案生成、干扰项生成等尖端任务,虽前人对三者均有研究,但鲜有文献将其整合.提出多选题自动生成模型,对模型的问题生成、答案生成和干扰项生成等开展理论分析,并基于T5开展... 多选题自动生成属自然语言处理领域难题,其子任务有问题生成、答案生成、干扰项生成等尖端任务,虽前人对三者均有研究,但鲜有文献将其整合.提出多选题自动生成模型,对模型的问题生成、答案生成和干扰项生成等开展理论分析,并基于T5开展自动问题生成和答案生成的实验.实验表明,本模型能根据用户输入文本生成多项选择题,问题质量比纯T5模型的BLEU指标高约1个点,其它指标也略有提升.鉴于干扰项生成属前沿难题,文章仅作理论分析. 展开更多
关键词 多项选择题 问题生成 t5模型
在线阅读 下载PDF
基于改进T5 PEGASUS模型的新闻文本摘要生成 被引量:9
6
作者 张琪 范永胜 《电子科技》 2023年第12期72-78,共7页
生成任务旨在解决用户在阅读新闻时无法快速把握内容重点而造成的时间损耗和阅读疲劳等问题。目前面向中文的文本摘要模型效果较佳的是T5 PEGASUS模型,但针对该模型的研究较少。文中针对T5 PEGASUS模型的中文分词方面进行改进,使用更适... 生成任务旨在解决用户在阅读新闻时无法快速把握内容重点而造成的时间损耗和阅读疲劳等问题。目前面向中文的文本摘要模型效果较佳的是T5 PEGASUS模型,但针对该模型的研究较少。文中针对T5 PEGASUS模型的中文分词方面进行改进,使用更适用于新闻领域的Pkuseg分词方法进行处理,并在NLPCC2017、LCSTS、SogouCS这3种新闻长度不同的公开数据集上验证其有效性。研究发现Pkuseg分词方法更适合T5 PEGASUS模型,模型生成摘要的ROUGE(Recall-Oriented Understudy for Gisting Evaluation)值与新闻文本长度成正相关,训练集损失值和损失值下降速度与新闻文本长度成负相关,在面对少量训练集时能得到较高的ROUGE分数,因此该模型具有较强的小样本学习能力。 展开更多
关键词 文本摘要生成 生成式模型 t5 PEGASUS 新闻文本 中文分词 Pkuseg 小样本学习 ROUGE
在线阅读 下载PDF
A Robust Conformer-Based Speech Recognition Model for Mandarin Air Traffic Control
7
作者 Peiyuan Jiang Weijun Pan +2 位作者 Jian Zhang Teng Wang Junxiang Huang 《Computers, Materials & Continua》 SCIE EI 2023年第10期911-940,共30页
This study aims to address the deviation in downstream tasks caused by inaccurate recognition results when applying Automatic Speech Recognition(ASR)technology in the Air Traffic Control(ATC)field.This paper presents ... This study aims to address the deviation in downstream tasks caused by inaccurate recognition results when applying Automatic Speech Recognition(ASR)technology in the Air Traffic Control(ATC)field.This paper presents a novel cascaded model architecture,namely Conformer-CTC/Attention-T5(CCAT),to build a highly accurate and robust ATC speech recognition model.To tackle the challenges posed by noise and fast speech rate in ATC,the Conformer model is employed to extract robust and discriminative speech representations from raw waveforms.On the decoding side,the Attention mechanism is integrated to facilitate precise alignment between input features and output characters.The Text-To-Text Transfer Transformer(T5)language model is also introduced to handle particular pronunciations and code-mixing issues,providing more accurate and concise textual output for downstream tasks.To enhance the model’s robustness,transfer learning and data augmentation techniques are utilized in the training strategy.The model’s performance is optimized by performing hyperparameter tunings,such as adjusting the number of attention heads,encoder layers,and the weights of the loss function.The experimental results demonstrate the significant contributions of data augmentation,hyperparameter tuning,and error correction models to the overall model performance.On the Our ATC Corpus dataset,the proposed model achieves a Character Error Rate(CER)of 3.44%,representing a 3.64%improvement compared to the baseline model.Moreover,the effectiveness of the proposed model is validated on two publicly available datasets.On the AISHELL-1 dataset,the CCAT model achieves a CER of 3.42%,showcasing a 1.23%improvement over the baseline model.Similarly,on the LibriSpeech dataset,the CCAT model achieves a Word Error Rate(WER)of 5.27%,demonstrating a performance improvement of 7.67%compared to the baseline model.Additionally,this paper proposes an evaluation criterion for assessing the robustness of ATC speech recognition systems.In robustness evaluation experiments based on this criterion,the proposed model demonstrates a performance improvement of 22%compared to the baseline model. 展开更多
关键词 Air traffic control automatic speech recognition CONFORMER robustness evaluation t5 error correction model
在线阅读 下载PDF
面向中文长文本摘要混合模型方法研究
8
作者 王炜琦 姜丹 +2 位作者 曹少中 张寒 肖克晶 《北京印刷学院学报》 2024年第6期14-21,共8页
在自然语言处理领域,中文长文本摘要生成一直是自动摘要领域的难题,中文因其丰富的语法结构、多义词汇以及词序对句子含义的影响,自动摘要的难度较大。针对中文长文本摘要这一难题,提出了一种混合式摘要模型,首先对文本进行向量化,然后... 在自然语言处理领域,中文长文本摘要生成一直是自动摘要领域的难题,中文因其丰富的语法结构、多义词汇以及词序对句子含义的影响,自动摘要的难度较大。针对中文长文本摘要这一难题,提出了一种混合式摘要模型,首先对文本进行向量化,然后利用抽取式摘要模型进行信息提取,最后利用生成式摘要模型进行文章摘要的生成,其中采用更适配中文语境的词表和分词器,提升摘要句准确率。实验结果表明,抽取—生成式混合模型在针对中文长文本摘要时表现出色,生成的摘要文本更加流畅、连贯,具有更好的可读性和理解性。 展开更多
关键词 中文长文本摘要 混合模型 BERT DGCNN t5-PEGASUS
在线阅读 下载PDF
基于T5语言大模型的中国特色话语自动识别及特征研究 被引量:4
9
作者 邓云华 许群爱 罗坚 《中国外语》 CSSCI 北大核心 2024年第1期58-67,共10页
基于T5语言大模型,本研究探索了中国特色话语的自动识别及其特征。通过在大规模语料上进行预训练和微调,本研究构建了适用于中国特色话语自动识别的T5语言大模型,提取了语义、文化和情感等多维特征,以区分中国特色话语和其他类型的文本... 基于T5语言大模型,本研究探索了中国特色话语的自动识别及其特征。通过在大规模语料上进行预训练和微调,本研究构建了适用于中国特色话语自动识别的T5语言大模型,提取了语义、文化和情感等多维特征,以区分中国特色话语和其他类型的文本。实验结果表明T5语言大模型在中国特色话语自动识别任务上表现出较高的准确率,特征分析揭示了中国特色话语的独特表达方式和语言特征,话语理论分析阐释了中国特色话语的构建特征。本研究方法可用于中国特色话语非结构化文本挖掘,有助于构建中国特色话语数据库、知识图谱、知识问答系统等,对于跨文化语言研究和自然语言处理具有重要的理论和实际意义。 展开更多
关键词 中国特色话语 t5语言大模型 预训练 自动识别 特征分析
原文传递
基于关键短语抽取与答案过滤的问答对生成 被引量:1
10
作者 郭峥嵘 郭躬德 王晖 《计算机系统应用》 2023年第6期293-300,共8页
高质量的问答对有助于从文章中获取知识,提高问答系统性能,促进机器阅读理解,在人类活动和人工智能领域中都起着较为重要的作用.当前主要问答对生成方法依靠提供文章中的候选答案,根据答案生成特定的问题.然而一些候选答案可能会生成无... 高质量的问答对有助于从文章中获取知识,提高问答系统性能,促进机器阅读理解,在人类活动和人工智能领域中都起着较为重要的作用.当前主要问答对生成方法依靠提供文章中的候选答案,根据答案生成特定的问题.然而一些候选答案可能会生成无法从文章中回答的问题,或是生成问题的答案不再是候选答案,造成问答对相关性差,影响问答对的质量.针对此问题,本文提出了一个基于关键短语抽取与过滤生成问答对的方法.该方法能够在输入文本中自动抽取适合生成问题的关键短语作为候选答案,再根据候选答案在问题生成器和答案生成器中生成问答对,并通过对比候选答案与生成答案的相似度过滤相关性低的问答对,最终输出保证质量的问答对.本方法在SQUAD1.1和NewsQA数据集上进行了实验验证,并人工检验了生成的问答对的质量,结果表明该方法可以有效提高生成的问答对的质量. 展开更多
关键词 问答对 候选答案 关键短语抽取 t5模型 相似度过滤
在线阅读 下载PDF
NUMERICAL STUDY ON EFFECTS OF THE QINGHAIXIZANG PLATEAU ON FORMATION OF THE URAL BLOCKING HIGH 被引量:1
11
作者 郑庆林 古瑜 +1 位作者 宋青丽 蒋平 《Acta meteorologica Sinica》 SCIE 1993年第1期61-69,共9页
By employing the improved T42L5 spectral model and utilizing the ECMWF data covering the period from 1 July to 7 July 1982,a numerical research on the formation of the Ural blocking system has been made.The results sh... By employing the improved T42L5 spectral model and utilizing the ECMWF data covering the period from 1 July to 7 July 1982,a numerical research on the formation of the Ural blocking system has been made.The results show that the model forecasts for the upstream U ral area turn out to be worse if the dynamic effect of the Qinghai-Xizang Plateau is not considered.The correlation coefficient between the model forecasts and observed 500 hPa geopotential height anomaly decreases by 9% for the 5-day mean,and their averaged root mean square (RMS) error increases 15 m.Due to the dynamic effect of the Plateau,the trough being on the northwest of the Plateau is barricaded and turns to be a transversal trough.Consequently southwest flow occurs along the northwest of the Plateau in front of the trough,while northeast flow prevails over the west of the trough,causing the formation of the blocking high over the Ural area.When the dynamic effect of the Plateau is not taken into consideration,the trough develops and moves southeastward and the Ural blocking high changes into a migratory high.All these result in the failure of the simulation.The dynamic effect of the Plateau helps to increase the negative vorticities over the Plateau and its north periphery as well as the Ural area,and also helps to increase the positive vorticities over the Black Sea and the Caspian Sea area.On the other hand,the thermodynamic effect mainly influences the Plateau and its downstream area and plays an less important role in the formation of the blocking high over the upstream Ural area. 展开更多
关键词 Qinghai-Xizang Plateau T42L5 spectrum model numerical simulation Ural blocking high dynamic effect
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部