期刊文献+
共找到116,705篇文章
< 1 2 250 >
每页显示 20 50 100
面向跨域自然语言生成SQL语句的超图神经网络
1
作者 郝志峰 黎阳霖 +1 位作者 许柏炎 蔡瑞初 《计算机工程》 北大核心 2025年第5期114-123,共10页
近年来,图神经网络(GNN)广泛-应用于跨域自然语言生成结构化查询语言(SQL)语句(Text-to-SQL)的编码器。基于GNN的编码过程通过捕获数据库架构和自然语言问题之间的关联信息,大幅提高生成模型在跨域SQL语句生成下的泛化性。现有的GNN方... 近年来,图神经网络(GNN)广泛-应用于跨域自然语言生成结构化查询语言(SQL)语句(Text-to-SQL)的编码器。基于GNN的编码过程通过捕获数据库架构和自然语言问题之间的关联信息,大幅提高生成模型在跨域SQL语句生成下的泛化性。现有的GNN方法在异构图结构编码学习过程中存在缺陷,以节点为中心进行数据库架构和自然语言问题的链接预测,在复杂语义场景下容易出现错配。针对这一问题,提出一种面向跨域Text-to-SQL的异构图学习框架。框架针对异构图以边为中心学习的过程提出关系边子图构建和边超图注意力网络,有效学习异构图中关系边与节点的差异化结构特征,实现复杂语义场景下SQL语句正确生成。为验证所提框架的有效性,在多个跨域Text-to-SQL数据集上进行充分实验对比。结果表明,相较于基线,该框架在F1值和完全匹配准确率(EMA)指标上均取得显著提升,且在复杂跨域场景下具有更强的泛化性。 展开更多
关键词 自然语言处理 自然语言生成sql语句解析 深度学习 图构建 图神经网络
在线阅读 下载PDF
RNSQL:融合逆规范化的Text2SQL生成
2
作者 帖军 范子琪 +2 位作者 孙翀 郑禄 朱柏尔 《计算机应用与软件》 北大核心 2025年第9期31-37,86,共8页
Text2SQL是自然语言处理科研领域中的一项重要任务,在研究智能问答系统中发挥关键性的作用,其核心任务是将自然语言描述的问题自动转换为SQL查询语句。当前研究重点为提高SQL子句任务的匹配准确率,但忽略了SQL的句法生成的正确性,涉及... Text2SQL是自然语言处理科研领域中的一项重要任务,在研究智能问答系统中发挥关键性的作用,其核心任务是将自然语言描述的问题自动转换为SQL查询语句。当前研究重点为提高SQL子句任务的匹配准确率,但忽略了SQL的句法生成的正确性,涉及多表连接的SQL生成仍存在大量错误。因此,提出一种基于神经网络的Text2SQL方法,该方法通过逆规范化技术,对数据库模式进行重构,关注SQL句法生成的正确性,称为逆规范化网络(Reverse Normalization SQL,RNSQL)。经理论分析和在公共数据集Spider上实验验证,RNSQL能有效提升Text2SQL任务的质量。 展开更多
关键词 逆规范化 语义解析 Text2sql 槽填充
在线阅读 下载PDF
基于SQL数据库和KD-Tree算法的船体型线匹配方法 被引量:1
3
作者 余恺 马宁 +1 位作者 史琪琪 孙利 《舰船科学技术》 北大核心 2025年第11期8-14,共7页
为提高船舶初步设计效率,提出一种基于SQL数据库和KD-Tree算法的船舶型线快速匹配方法。针对船舶数据繁多复杂的问题,利用SQL语言保存、分类和提取船舶设计过程中的型线数据和特征线数据,提高了数据的存储和利用效率。针对船体复杂曲面... 为提高船舶初步设计效率,提出一种基于SQL数据库和KD-Tree算法的船舶型线快速匹配方法。针对船舶数据繁多复杂的问题,利用SQL语言保存、分类和提取船舶设计过程中的型线数据和特征线数据,提高了数据的存储和利用效率。针对船体复杂曲面的匹配问题,采取基于特征线描述船体特征,并求解特征线B样条控制点的方法保存船体的曲面特征数据。针对高维度变量的匹配问题,在不同大小的测试集中采用KD-Tree结构保存数据并采用最邻近搜索算法,能将船体型线的搜索匹配速度提高34.31%~84.16%。该方法对提高船舶初步设计效率提供有益的借鉴和帮助。 展开更多
关键词 船体设计 sql数据库 KD-Tree算法 船舶特征线
在线阅读 下载PDF
基于弱监督学习的Text-to-SQL自动生成方法
4
作者 向宁 《无线电通信技术》 北大核心 2025年第3期520-529,共10页
结构化查询语言(Structured Query Language,SQL)生成模型对于非专业人员检索情报至关重要。通常训练SQL生成模型需要使用标注的SQL以及对应的自然语言问题,现有SQL生成模型难以推广到不同的训练数据。根据问题分解半结构化表示(Decompo... 结构化查询语言(Structured Query Language,SQL)生成模型对于非专业人员检索情报至关重要。通常训练SQL生成模型需要使用标注的SQL以及对应的自然语言问题,现有SQL生成模型难以推广到不同的训练数据。根据问题分解半结构化表示(Decomposition Semi-structed Representation,DSR),提出一种基于弱监督学习的Text-to-SQL自动生成方法(Text-to-SQL Automatic Generation Method Based on Weakly Supervised Learning,TS-WSL),给定问题、DSR和执行答案,能够自动合成用于训练Text-to-SQL模型的SQL查询。使用DSR解析器对问题进行解析,通过短语链接、连接路径推理以及SQL映射过程生成候选SQL;使用候选SQL搜索选择最佳的SQL查询;使用生成的SQL数据对T5模型进行训练。在5个基准数据集上进行实验,结果表明所提方法比基于注释SQL数据集上训练的模型更具泛化性,在无域内DSR场景下,仍然可以达到完全监督模型约90%的性能。 展开更多
关键词 结构化查询语言生成模型 分解半结构化表示 弱监督学习 大模型
在线阅读 下载PDF
基于反向数据流传播的SQL语句随机化
5
作者 马佳鑫 张铮 +3 位作者 刘鹏 刘浩 周宛秋 刘慧 《计算机应用研究》 北大核心 2025年第10期3106-3113,共8页
应用程序使用随机化SQL语句可在随机化SQL环境中访问数据库并防御SQL注入攻击。分析了应用程序SQL语句随机化存在的挑战,提出了一种基于反向数据流传播的SQL语句随机化方法。反向数据流传播算法从数据库操作函数出发,反向追踪SQL语句的... 应用程序使用随机化SQL语句可在随机化SQL环境中访问数据库并防御SQL注入攻击。分析了应用程序SQL语句随机化存在的挑战,提出了一种基于反向数据流传播的SQL语句随机化方法。反向数据流传播算法从数据库操作函数出发,反向追踪SQL语句的数据传播,可快速、准确地识别应用程序源码中的SQL语句。实验表明基于PHP 8.0内核实现的算法识别SQL语句准确率达91.7%。基于反向数据流传播的SQL语句随机化方法较传统方法实施更便捷、通用性更强,该方法处理后的应用程序可适用于随机化SQL环境防御SQL注入攻击。 展开更多
关键词 sql注入攻击 sql随机化 静态分析 数据流传播
在线阅读 下载PDF
多维上下文关系感知的SQL自动生成方法
6
作者 刘晨旭 王邦平 +3 位作者 宋海权 韩楠 杨春芳 乔少杰 《重庆理工大学学报(自然科学)》 北大核心 2025年第9期124-132,共9页
结构化查询语言(structured query language,SQL)生成技术能将自然语言(natural language,NL)自动转换为SQL,成为当前研究热点。现有SQL自动生成方法仍存在诸多不足:无法在复杂情况下准确生成SQL;无法充分建模NL及数据库元素间的关系;... 结构化查询语言(structured query language,SQL)生成技术能将自然语言(natural language,NL)自动转换为SQL,成为当前研究热点。现有SQL自动生成方法仍存在诸多不足:无法在复杂情况下准确生成SQL;无法充分建模NL及数据库元素间的关系;在上下文相关环境下的多轮对话处理能力不足。针对上述问题,提出多维上下维关系感知的SQL自动生成方法MCRA(multi-dimensional context-relation awareness),集成了多维关系图构建模块、多维关系感知编码器、辅助任务模块等关键组件,能够更加全面地建模各元素间的关系,在一定程度上克服多轮对话生成的SQL准确率较低的问题。在标准数据集上进行实验,结果表明:MCRA算法SQL生成准确率优于主流模型。 展开更多
关键词 sql生成器 语义解析 人机交互 NL-to-sql
在线阅读 下载PDF
面向研究生招生咨询的中文Text-to-SQL模型
7
作者 王庆丰 李旭 +1 位作者 姚春龙 程腾腾 《计算机工程》 北大核心 2025年第3期362-368,共7页
研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言... 研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言问题转化为SQL语句后到结构化数据库中查询答案并返回。搜集了研究生招生场景中的高频咨询问题,根据3所高校真实招生数据,构建问题与SQL语句模板,通过填充模板的方式构建数据集,共有训练集1501条、测试集386条。将RESDSQL的RoBERTa模型替换为具有更强多语言生成能力的XLM-RoBERTa模型、T5模型替换为mT5模型,并在目标领域数据集上进行微调,在招生领域问题上取得了较高的准确率,在mT5-large模型上执行正确率为0.95,精确匹配率为1。与基于ChatGPT3.5模型、使用零样本提示的C3SQL方法对比,该模型性能与成本均更优。 展开更多
关键词 中文文本转结构化查询语言 自然语言查询 中文sql语句生成 预训练模型 Text-to-sql数据集
在线阅读 下载PDF
多域人机交互场景下中文SQL生成算法
8
作者 李洲 王星捷 +3 位作者 韩楠 潘乐盈 杨春芳 乔少杰 《重庆理工大学学报(自然科学)》 北大核心 2025年第6期100-107,共8页
随着自然语言处理、人工智能和多域数据库应用的发展,对智能数据库查询系统的需求迅速增长,尤其是在中文语境中,实现准确的查询生成已成为金融、医疗保健和客户服务等行业的必需要素。现有的SQL生成方法难以解决中文语义解析、多域适应... 随着自然语言处理、人工智能和多域数据库应用的发展,对智能数据库查询系统的需求迅速增长,尤其是在中文语境中,实现准确的查询生成已成为金融、医疗保健和客户服务等行业的必需要素。现有的SQL生成方法难以解决中文语义解析、多域适应性及人机交互中语义一致性的问题,限制复杂查询的跨域处理。针对上述挑战,提出一种面向中文的多域人机交互式SQL生成算法MH-CSQL(multi-domain human-computer interaction for Chinese SQL generation algorithm),结合历史信息和课程学习技术以增强自然语言理解,支持多域数据库处理各种查询任务。实验结果表明,MH-CSQL在准确性和适应性方面均优于传统方法。此外,将人机交互模型的结果可视图进行展示,验证了MH-CSQL在智能问答等领域的应用前景。 展开更多
关键词 中文语义解析 多领域数据库 人机交互 sql自动生成
在线阅读 下载PDF
基于大模型NL2SQL的交通系统运行智能问数助手技术研究
9
作者 沈宇 黄卫东 叶文武 《信息通信技术》 2025年第3期29-36,76,共9页
在智慧城市发展进程中,交通系统的精细化管理和智能化服务面临海量异构数据处理的挑战。传统交通信息查询系统存在数据源异构性强、自然语言交互能力不足、长尾查询场景覆盖有限等问题。文章基于ChatGLM3大语言模型,创新性地构建了融合N... 在智慧城市发展进程中,交通系统的精细化管理和智能化服务面临海量异构数据处理的挑战。传统交通信息查询系统存在数据源异构性强、自然语言交互能力不足、长尾查询场景覆盖有限等问题。文章基于ChatGLM3大语言模型,创新性地构建了融合NL2SQL(Natural Language to Structured Query Language)技术的智能问数系统,通过动态Schema对齐、LoRA微调优化及多维度提示工程技术,实现了交通领域复杂自然语言查询到精准SQL指令的智能转换。实验结果表明,经过微调的模型在交通信息查询任务中准确率达到78.9%,较基线模型提升15.8个百分点。本研究为交通管理智能化转型提供了创新技术路径,并对大模型在垂直领域的深度适配进行了系统性探索。 展开更多
关键词 自然语言处理 交通数据分析 大语言模型 NL2sql
在线阅读 下载PDF
基于容器技术的Union SQL注入课程实验题设计
10
作者 向训文 吕波 +2 位作者 张振 马思梦 徐涛 《现代信息科技》 2025年第16期163-167,共5页
文章提出了一种基于容器技术的Union SQL注入课程实验题设计方案,旨在解决传统教学模式中环境搭建复杂、教学效果欠佳、作业考核困难等问题。通过精心设计一系列针对性强的实验题目,学生能够在实践中逐步掌握Union SQL注入的关键步骤,... 文章提出了一种基于容器技术的Union SQL注入课程实验题设计方案,旨在解决传统教学模式中环境搭建复杂、教学效果欠佳、作业考核困难等问题。通过精心设计一系列针对性强的实验题目,学生能够在实践中逐步掌握Union SQL注入的关键步骤,如登录框绕过、字段数判断、数据库名注入等。利用容器技术,可为学生快速搭建独立的练习环境,各环境互不干扰,且同一题目不同学生的答案各异,题目内容也融入了随机性元素,使得每位同学完成同一题目所需的步骤不尽相同,在一定程度上有效遏制了作弊行为。 展开更多
关键词 容器 CTF sql注入 实验题
在线阅读 下载PDF
二语写作研究的现状、反思与展望——基于Journal of Second Language Writing近十年载文分析
11
作者 孙云帆 孙玲 《西部学刊》 2025年第5期164-168,共5页
二语写作是二语习得研究领域的重要组成部分。运用CiteSpace软件对近十年发表在Journal of Second Language Writing的231篇实证研究论文进行可视化分析,研究发现:二语写作研究整体呈波动性上升趋势,研究规模较为稳定,研究关注度逐渐提... 二语写作是二语习得研究领域的重要组成部分。运用CiteSpace软件对近十年发表在Journal of Second Language Writing的231篇实证研究论文进行可视化分析,研究发现:二语写作研究整体呈波动性上升趋势,研究规模较为稳定,研究关注度逐渐提升;二语写作研究领域暂未形成明显的核心作者和机构的合作网络;研究主题主要聚焦二语写作教学方法的多元化、二语写作反馈的多焦点、二语写作评估与测试的科学化,以及学习者个体差异的多维影响等方面。基于此,提出未来该领域发展需加强学者、机构之间的相互合作;关注个体学习者写作过程的认知特征与情感因素,尤其重视青少年二语学习过程的研究;扩大二语写作纵向研究规模,推动研究的深入发展。 展开更多
关键词 二语写作研究 Journal of Second language Writing 可视化分析 现状 反思与展望
在线阅读 下载PDF
Large language models for robotics:Opportunities,challenges,and perspectives 被引量:3
12
作者 Jiaqi Wang Enze Shi +7 位作者 Huawen Hu Chong Ma Yiheng Liu Xuhui Wang Yincheng Yao Xuan Liu Bao Ge Shu Zhang 《Journal of Automation and Intelligence》 2025年第1期52-64,共13页
Large language models(LLMs)have undergone significant expansion and have been increasingly integrated across various domains.Notably,in the realm of robot task planning,LLMs harness their advanced reasoning and langua... Large language models(LLMs)have undergone significant expansion and have been increasingly integrated across various domains.Notably,in the realm of robot task planning,LLMs harness their advanced reasoning and language comprehension capabilities to formulate precise and efficient action plans based on natural language instructions.However,for embodied tasks,where robots interact with complex environments,textonly LLMs often face challenges due to a lack of compatibility with robotic visual perception.This study provides a comprehensive overview of the emerging integration of LLMs and multimodal LLMs into various robotic tasks.Additionally,we propose a framework that utilizes multimodal GPT-4V to enhance embodied task planning through the combination of natural language instructions and robot visual perceptions.Our results,based on diverse datasets,indicate that GPT-4V effectively enhances robot performance in embodied tasks.This extensive survey and evaluation of LLMs and multimodal LLMs across a variety of robotic tasks enriches the understanding of LLM-centric embodied intelligence and provides forward-looking insights towards bridging the gap in Human-Robot-Environment interaction. 展开更多
关键词 Large language models ROBOTICS Generative AI Embodied intelligence
在线阅读 下载PDF
融合语义与结构特征的SQL注入攻击检测方法
13
作者 丁福豪 郭晓军 韩一鑫 《西藏科技》 2025年第7期70-80,共11页
SQL注入攻击已成为Web应用中的严重安全威胁,现有检测方法多依赖自然语言处理,侧重语义特征。然而,SQL语句中蕴含的丰富结构信息常被忽视,导致传统方法难以有效捕捉。为此,文章提出了一种融合语义与结构特征的SQL注入攻击检测方法,旨在... SQL注入攻击已成为Web应用中的严重安全威胁,现有检测方法多依赖自然语言处理,侧重语义特征。然而,SQL语句中蕴含的丰富结构信息常被忽视,导致传统方法难以有效捕捉。为此,文章提出了一种融合语义与结构特征的SQL注入攻击检测方法,旨在提升检测准确性和鲁棒性。具体而言,文章采用结合自注意力机制的双向长短期记忆网络(SA-BiLSTM)进行语义特征提取,以深入挖掘SQL查询的逻辑和意图;同时,在SQL抽象语法树的每棵子树上应用卷积操作,以完成结构特征的提取。该研究通过在多个公开数据集上进行实验,验证了所提方法的有效性,并在准确率、F1分数及召回率等多个评价指标上表现出色。实验结果表明,所提出方法在检测准确率和AUC均超过99%,F1分数达到95%. 展开更多
关键词 sql注入攻击 特征融合 自注意力机制 双向长短期记忆网络 抽象语法树
在线阅读 下载PDF
一种基于RAG的离线中文Text-to-SQL技术
14
作者 周学文 江荣 +1 位作者 许超俊 秦基尧 《网络安全与数据治理》 2025年第S1期55-59,共5页
在现代数据驱动的决策过程中,数据的重要性不言而喻。有效的数据管理和分析不仅能提升业务效率,还能为策略制定提供科学依据。在众多数据处理领域,自然语言处理与结构化查询语言之间的转换显得尤为重要。针对离线环境下,大语言模型无法... 在现代数据驱动的决策过程中,数据的重要性不言而喻。有效的数据管理和分析不仅能提升业务效率,还能为策略制定提供科学依据。在众多数据处理领域,自然语言处理与结构化查询语言之间的转换显得尤为重要。针对离线环境下,大语言模型无法自动完成模型的更新迭代,这在一定程度上限制了提供精确和详细信息的能力的问题,提出一种基于RAG的离线中文Text-to-SQL技术。首先,根据用户输入自然语言查询请求,通过RAG技术对请求解析,生成结构化信息;其次,根据解析后的信息检索相关的数据库表和字段;最后,通过大语言模型生成精确的SQL查询语句。这一技术的应用,不仅能帮助非专业用户更容易地访问和分析数据,还能够有效提高模型语义理解能力和生成SQL精度,同时防止数据泄露。因此,研究和开发高效的自然语言到SQL的离线处理方法,将对数据分析的普及和应用产生深远的影响。 展开更多
关键词 Text-to-sql 离线环境 RAG 自然语言处理 大语言模型
在线阅读 下载PDF
SQL注入漏洞与安全防范技术探讨 被引量:2
15
作者 粟圣森 《轻工科技》 2025年第2期100-103,共4页
SQL注入漏洞是一种广泛存在于Web应用程序中的安全漏洞,其产生的主要原因是应用程序在处理用户输入时未进行有效的验证和过滤,从而使得攻击者可以在Web应用攻击中通过构造恶意代码填充到SQL语句中,并作为数据库的查询条件从而绕过身份... SQL注入漏洞是一种广泛存在于Web应用程序中的安全漏洞,其产生的主要原因是应用程序在处理用户输入时未进行有效的验证和过滤,从而使得攻击者可以在Web应用攻击中通过构造恶意代码填充到SQL语句中,并作为数据库的查询条件从而绕过身份验证、读取敏感数据或执行其他非法操作达到攻击的目的。本文探讨SQL注入漏洞这类安全威胁的常见注入类型、漏洞成因和安全风险,并提出相应的安全防范措施。 展开更多
关键词 sql注入 漏洞 WEB应用 数据库
原文传递
基于结构化案例推理的SQL生成模型
16
作者 罗明全 王静 魏英 《无线电通信技术》 北大核心 2025年第3期478-485,共8页
自动化的自然语言与数据库接口对于应用开发至关重要。语义解析驱动的推理时间结构化查询语言(Structured Query Language,SQL)自适应方法能够兼容来自新域的样本,且无需重复调优。现有方法通常简单地将编码器输入的新域输入-输出案例... 自动化的自然语言与数据库接口对于应用开发至关重要。语义解析驱动的推理时间结构化查询语言(Structured Query Language,SQL)自适应方法能够兼容来自新域的样本,且无需重复调优。现有方法通常简单地将编码器输入的新域输入-输出案例连接到模型中,进而使解码器产生偏差,不能充分利用案例中逻辑形式的结构。基于上述情况,提出一种基于结构化案例推理(Structured Case Reasoning Model,SCRM)的SQL生成模型,充分利用案例的逻辑形式和候选输出之间的子树级相似性,以此生成更好的解码器决策;提出一个可训练的组合子树相似函数,与全树嵌入相比,该函数对于大型搜索边界的评分更为准确。SCRM结合新的结构化案例记忆及可训练的查询子树相似度模块,可以提升推理过程中正确输出的得分。在5种不同的数据集上进行实验,相对于其他模型,所提出的SCRM凭借结构化案例的优势,在不同性能指标上均取得了最佳结果。 展开更多
关键词 Text-to-sql 子树级相似性 结构化案例 解码器 相似函数
在线阅读 下载PDF
Evaluating research quality with Large Language Models:An analysis of ChatGPT’s effectiveness with different settings and inputs 被引量:1
17
作者 Mike Thelwall 《Journal of Data and Information Science》 2025年第1期7-25,共19页
Purpose:Evaluating the quality of academic journal articles is a time consuming but critical task for national research evaluation exercises,appointments and promotion.It is therefore important to investigate whether ... Purpose:Evaluating the quality of academic journal articles is a time consuming but critical task for national research evaluation exercises,appointments and promotion.It is therefore important to investigate whether Large Language Models(LLMs)can play a role in this process.Design/methodology/approach:This article assesses which ChatGPT inputs(full text without tables,figures,and references;title and abstract;title only)produce better quality score estimates,and the extent to which scores are affected by ChatGPT models and system prompts.Findings:The optimal input is the article title and abstract,with average ChatGPT scores based on these(30 iterations on a dataset of 51 papers)correlating at 0.67 with human scores,the highest ever reported.ChatGPT 4o is slightly better than 3.5-turbo(0.66),and 4o-mini(0.66).Research limitations:The data is a convenience sample of the work of a single author,it only includes one field,and the scores are self-evaluations.Practical implications:The results suggest that article full texts might confuse LLM research quality evaluations,even though complex system instructions for the task are more effective than simple ones.Thus,whilst abstracts contain insufficient information for a thorough assessment of rigour,they may contain strong pointers about originality and significance.Finally,linear regression can be used to convert the model scores into the human scale scores,which is 31%more accurate than guessing.Originality/value:This is the first systematic comparison of the impact of different prompts,parameters and inputs for ChatGPT research quality evaluations. 展开更多
关键词 ChatGPT Large language Models LLMs SCIENTOMETRICS Research Assessment
在线阅读 下载PDF
On large language models safety,security,and privacy:A survey 被引量:1
18
作者 Ran Zhang Hong-Wei Li +2 位作者 Xin-Yuan Qian Wen-Bo Jiang Han-Xiao Chen 《Journal of Electronic Science and Technology》 2025年第1期1-21,共21页
The integration of artificial intelligence(AI)technology,particularly large language models(LLMs),has become essential across various sectors due to their advanced language comprehension and generation capabilities.De... The integration of artificial intelligence(AI)technology,particularly large language models(LLMs),has become essential across various sectors due to their advanced language comprehension and generation capabilities.Despite their transformative impact in fields such as machine translation and intelligent dialogue systems,LLMs face significant challenges.These challenges include safety,security,and privacy concerns that undermine their trustworthiness and effectiveness,such as hallucinations,backdoor attacks,and privacy leakage.Previous works often conflated safety issues with security concerns.In contrast,our study provides clearer and more reasonable definitions for safety,security,and privacy within the context of LLMs.Building on these definitions,we provide a comprehensive overview of the vulnerabilities and defense mechanisms related to safety,security,and privacy in LLMs.Additionally,we explore the unique research challenges posed by LLMs and suggest potential avenues for future research,aiming to enhance the robustness and reliability of LLMs in the face of emerging threats. 展开更多
关键词 Large language models Privacy issues Safety issues Security issues
在线阅读 下载PDF
Diffusion-based generative drug-like molecular editing with chemical natural language 被引量:1
19
作者 Jianmin Wang Peng Zhou +6 位作者 Zixu Wang Wei Long Yangyang Chen Kyoung Tai No Dongsheng Ouyang Jiashun Mao Xiangxiang Zeng 《Journal of Pharmaceutical Analysis》 2025年第6期1215-1225,共11页
Recently,diffusion models have emerged as a promising paradigm for molecular design and optimization.However,most diffusion-based molecular generative models focus on modeling 2D graphs or 3D geom-etries,with limited ... Recently,diffusion models have emerged as a promising paradigm for molecular design and optimization.However,most diffusion-based molecular generative models focus on modeling 2D graphs or 3D geom-etries,with limited research on molecular sequence diffusion models.The International Union of Pure and Applied Chemistry(IUPAC)names are more akin to chemical natural language than the simplified molecular input line entry system(SMILES)for organic compounds.In this work,we apply an IUPAC-guided conditional diffusion model to facilitate molecular editing from chemical natural language to chemical language(SMILES)and explore whether the pre-trained generative performance of diffusion models can be transferred to chemical natural language.We propose DiffIUPAC,a controllable molecular editing diffusion model that converts IUPAC names to SMILES strings.Evaluation results demonstrate that our model out-performs existing methods and successfully captures the semantic rules of both chemical languages.Chemical space and scaffold analysis show that the model can generate similar compounds with diverse scaffolds within the specified constraints.Additionally,to illustrate the model’s applicability in drug design,we conducted case studies in functional group editing,analogue design and linker design. 展开更多
关键词 Diffusion model IUPAC Molecular generative model Chemical natural language Transformer
在线阅读 下载PDF
When Software Security Meets Large Language Models:A Survey 被引量:1
20
作者 Xiaogang Zhu Wei Zhou +3 位作者 Qing-Long Han Wanlun Ma Sheng Wen Yang Xiang 《IEEE/CAA Journal of Automatica Sinica》 2025年第2期317-334,共18页
Software security poses substantial risks to our society because software has become part of our life. Numerous techniques have been proposed to resolve or mitigate the impact of software security issues. Among them, ... Software security poses substantial risks to our society because software has become part of our life. Numerous techniques have been proposed to resolve or mitigate the impact of software security issues. Among them, software testing and analysis are two of the critical methods, which significantly benefit from the advancements in deep learning technologies. Due to the successful use of deep learning in software security, recently,researchers have explored the potential of using large language models(LLMs) in this area. In this paper, we systematically review the results focusing on LLMs in software security. We analyze the topics of fuzzing, unit test, program repair, bug reproduction, data-driven bug detection, and bug triage. We deconstruct these techniques into several stages and analyze how LLMs can be used in the stages. We also discuss the future directions of using LLMs in software security, including the future directions for the existing use of LLMs and extensions from conventional deep learning research. 展开更多
关键词 Large language models(LLMs) software analysis software security software testing
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部