期刊文献+
共找到44,916篇文章
< 1 2 250 >
每页显示 20 50 100
RNSQL:融合逆规范化的Text2SQL生成
1
作者 帖军 范子琪 +2 位作者 孙翀 郑禄 朱柏尔 《计算机应用与软件》 北大核心 2025年第9期31-37,86,共8页
Text2SQL是自然语言处理科研领域中的一项重要任务,在研究智能问答系统中发挥关键性的作用,其核心任务是将自然语言描述的问题自动转换为SQL查询语句。当前研究重点为提高SQL子句任务的匹配准确率,但忽略了SQL的句法生成的正确性,涉及... Text2SQL是自然语言处理科研领域中的一项重要任务,在研究智能问答系统中发挥关键性的作用,其核心任务是将自然语言描述的问题自动转换为SQL查询语句。当前研究重点为提高SQL子句任务的匹配准确率,但忽略了SQL的句法生成的正确性,涉及多表连接的SQL生成仍存在大量错误。因此,提出一种基于神经网络的Text2SQL方法,该方法通过逆规范化技术,对数据库模式进行重构,关注SQL句法生成的正确性,称为逆规范化网络(Reverse Normalization SQL,RNSQL)。经理论分析和在公共数据集Spider上实验验证,RNSQL能有效提升Text2SQL任务的质量。 展开更多
关键词 逆规范化 语义解析 text2sql 槽填充
在线阅读 下载PDF
基于弱监督学习的Text-to-SQL自动生成方法
2
作者 向宁 《无线电通信技术》 北大核心 2025年第3期520-529,共10页
结构化查询语言(Structured Query Language,SQL)生成模型对于非专业人员检索情报至关重要。通常训练SQL生成模型需要使用标注的SQL以及对应的自然语言问题,现有SQL生成模型难以推广到不同的训练数据。根据问题分解半结构化表示(Decompo... 结构化查询语言(Structured Query Language,SQL)生成模型对于非专业人员检索情报至关重要。通常训练SQL生成模型需要使用标注的SQL以及对应的自然语言问题,现有SQL生成模型难以推广到不同的训练数据。根据问题分解半结构化表示(Decomposition Semi-structed Representation,DSR),提出一种基于弱监督学习的Text-to-SQL自动生成方法(Text-to-SQL Automatic Generation Method Based on Weakly Supervised Learning,TS-WSL),给定问题、DSR和执行答案,能够自动合成用于训练Text-to-SQL模型的SQL查询。使用DSR解析器对问题进行解析,通过短语链接、连接路径推理以及SQL映射过程生成候选SQL;使用候选SQL搜索选择最佳的SQL查询;使用生成的SQL数据对T5模型进行训练。在5个基准数据集上进行实验,结果表明所提方法比基于注释SQL数据集上训练的模型更具泛化性,在无域内DSR场景下,仍然可以达到完全监督模型约90%的性能。 展开更多
关键词 结构化查询语言生成模型 分解半结构化表示 弱监督学习 大模型
在线阅读 下载PDF
面向研究生招生咨询的中文Text-to-SQL模型
3
作者 王庆丰 李旭 +1 位作者 姚春龙 程腾腾 《计算机工程》 北大核心 2025年第3期362-368,共7页
研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言... 研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言问题转化为SQL语句后到结构化数据库中查询答案并返回。搜集了研究生招生场景中的高频咨询问题,根据3所高校真实招生数据,构建问题与SQL语句模板,通过填充模板的方式构建数据集,共有训练集1501条、测试集386条。将RESDSQL的RoBERTa模型替换为具有更强多语言生成能力的XLM-RoBERTa模型、T5模型替换为mT5模型,并在目标领域数据集上进行微调,在招生领域问题上取得了较高的准确率,在mT5-large模型上执行正确率为0.95,精确匹配率为1。与基于ChatGPT3.5模型、使用零样本提示的C3SQL方法对比,该模型性能与成本均更优。 展开更多
关键词 中文文本转结构化查询语言 自然语言查询 中文sql语句生成 预训练模型 text-to-sql数据集
在线阅读 下载PDF
一种基于RAG的离线中文Text-to-SQL技术
4
作者 周学文 江荣 +1 位作者 许超俊 秦基尧 《网络安全与数据治理》 2025年第S1期55-59,共5页
在现代数据驱动的决策过程中,数据的重要性不言而喻。有效的数据管理和分析不仅能提升业务效率,还能为策略制定提供科学依据。在众多数据处理领域,自然语言处理与结构化查询语言之间的转换显得尤为重要。针对离线环境下,大语言模型无法... 在现代数据驱动的决策过程中,数据的重要性不言而喻。有效的数据管理和分析不仅能提升业务效率,还能为策略制定提供科学依据。在众多数据处理领域,自然语言处理与结构化查询语言之间的转换显得尤为重要。针对离线环境下,大语言模型无法自动完成模型的更新迭代,这在一定程度上限制了提供精确和详细信息的能力的问题,提出一种基于RAG的离线中文Text-to-SQL技术。首先,根据用户输入自然语言查询请求,通过RAG技术对请求解析,生成结构化信息;其次,根据解析后的信息检索相关的数据库表和字段;最后,通过大语言模型生成精确的SQL查询语句。这一技术的应用,不仅能帮助非专业用户更容易地访问和分析数据,还能够有效提高模型语义理解能力和生成SQL精度,同时防止数据泄露。因此,研究和开发高效的自然语言到SQL的离线处理方法,将对数据分析的普及和应用产生深远的影响。 展开更多
关键词 text-to-sql 离线环境 RAG 自然语言处理 大语言模型
在线阅读 下载PDF
基于双向增强和多阶监督的Text2SQL训练语料生成
5
作者 黄浩 《计算机科学与应用》 2025年第7期1-8,共8页
针对Text2SQL任务中训练语料人工标注成本高、场景覆盖有限的问题,本文提出一种基于双向增强与多阶监督的语料生成框架。该方法通过问题到SQL的正向增强与SQL到问题的逆向增强构建双向数据流,结合大语言模型的上下文理解与代码生成能力... 针对Text2SQL任务中训练语料人工标注成本高、场景覆盖有限的问题,本文提出一种基于双向增强与多阶监督的语料生成框架。该方法通过问题到SQL的正向增强与SQL到问题的逆向增强构建双向数据流,结合大语言模型的上下文理解与代码生成能力,创新性地引入四阶段监督审查机制(提问多样性扩充、提问质量审查、SQL自动生成、生成质量审查),极大地提高了低资源条件下训练语料生成的效率与质量。实验表明,该方法生成的语料所训练出来的模型执行准确率相较于传统人工标注语料微调模型提升了16.3%,相较于少样本提示学习方法提升了35.7%。其次,在语料的泛化迁移性方面,本文方法生成的语料对模型尺寸大小和提问难易程度的适应性都高于人工少量标注方式。 展开更多
关键词 双向增强 多阶监督 text2sql 训练语料生成 低语言学习
在线阅读 下载PDF
基于知识库的Text-to-SQL准确性提升研究
6
作者 杨梅 王航 拜睿杰 《电脑知识与技术》 2025年第32期85-88,共4页
针对自然语言文本到结构化查询语言转换(Text-to-SQL)在人工智能与大模型飞速发展的背景下取得显著进展,但在领域术语和复杂查询中SQL生成准确性仍有不足的问题,本研究提出一种基于知识库与嵌入模型微调的Text-toSQL改进方法。该方法聚... 针对自然语言文本到结构化查询语言转换(Text-to-SQL)在人工智能与大模型飞速发展的背景下取得显著进展,但在领域术语和复杂查询中SQL生成准确性仍有不足的问题,本研究提出一种基于知识库与嵌入模型微调的Text-toSQL改进方法。该方法聚焦于提升特定领域的泛化能力与知识检索效能,通过构建专有领域知识库,为大模型提供丰富且精准的领域知识支撑,同时对嵌入模型实施针对性微调,以优化知识检索过程中的特征表示与匹配效果。实验表明,该方法能够有效提升SQL生成的准确性,并减少领域术语查询和复杂语句生成时的错误率。 展开更多
关键词 text-to-sql 知识库 嵌入模型 sql生成 自然语言处理
在线阅读 下载PDF
浅谈如何使用SQL中的image和text数据 被引量:1
7
作者 陈晓男 《电脑知识与技术》 2006年第5期123-124,共2页
SQL中的image和text类型的数据带给用户很多便利。但具体使用时常常会遇到许多问题,那幺该如何解决呢,我们可以用两个命令提示待下的命令bcp和textcopy来解决。
关键词 sql 数据 IMAGE text命令 bcp textcopy
在线阅读 下载PDF
SQL Server中text/image类型数据的使用
8
作者 兰丽辉 《电脑知识与技术(过刊)》 2007年第14期313-,315,共2页
使用MS SQL Server进行数据库软件开发时,对于text和image类型的数据在进行存取操作时,有别与其他数据类型.结合应用实例介绍了通过Transact-SQL语句、API函数、sp_tableoption存储过程、bcp命令、textcopy命令等几种常用的方法使用text... 使用MS SQL Server进行数据库软件开发时,对于text和image类型的数据在进行存取操作时,有别与其他数据类型.结合应用实例介绍了通过Transact-SQL语句、API函数、sp_tableoption存储过程、bcp命令、textcopy命令等几种常用的方法使用text/image类型数据. 展开更多
关键词 MS sql SERVER text/image TRANSACT-sql API函数
在线阅读 下载PDF
面向跨域自然语言生成SQL语句的超图神经网络
9
作者 郝志峰 黎阳霖 +1 位作者 许柏炎 蔡瑞初 《计算机工程》 北大核心 2025年第5期114-123,共10页
近年来,图神经网络(GNN)广泛-应用于跨域自然语言生成结构化查询语言(SQL)语句(Text-to-SQL)的编码器。基于GNN的编码过程通过捕获数据库架构和自然语言问题之间的关联信息,大幅提高生成模型在跨域SQL语句生成下的泛化性。现有的GNN方... 近年来,图神经网络(GNN)广泛-应用于跨域自然语言生成结构化查询语言(SQL)语句(Text-to-SQL)的编码器。基于GNN的编码过程通过捕获数据库架构和自然语言问题之间的关联信息,大幅提高生成模型在跨域SQL语句生成下的泛化性。现有的GNN方法在异构图结构编码学习过程中存在缺陷,以节点为中心进行数据库架构和自然语言问题的链接预测,在复杂语义场景下容易出现错配。针对这一问题,提出一种面向跨域Text-to-SQL的异构图学习框架。框架针对异构图以边为中心学习的过程提出关系边子图构建和边超图注意力网络,有效学习异构图中关系边与节点的差异化结构特征,实现复杂语义场景下SQL语句正确生成。为验证所提框架的有效性,在多个跨域Text-to-SQL数据集上进行充分实验对比。结果表明,相较于基线,该框架在F1值和完全匹配准确率(EMA)指标上均取得显著提升,且在复杂跨域场景下具有更强的泛化性。 展开更多
关键词 自然语言处理 自然语言生成sql语句解析 深度学习 图构建 图神经网络
在线阅读 下载PDF
一种利用词典扩展数据库模式信息的Text2SQL方法 被引量:1
10
作者 于晓昕 何东 +2 位作者 叶子铭 陈黎 于中华 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期78-88,共11页
现有Text2SQL方法严重依赖表名和列名在自然语言查询中的显式提及,在同物异名的实际应用场景中准确率急剧下降.此外,这些方法仅仅依赖数据库模式捕捉数据库建模的领域知识,而数据库模式作为结构化的元数据,其表达领域知识的能力是非常... 现有Text2SQL方法严重依赖表名和列名在自然语言查询中的显式提及,在同物异名的实际应用场景中准确率急剧下降.此外,这些方法仅仅依赖数据库模式捕捉数据库建模的领域知识,而数据库模式作为结构化的元数据,其表达领域知识的能力是非常有限的,即使有经验的程序员也很难仅从数据库模式完全领会该数据库建模的领域知识,因此程序员必须依赖详细的数据库设计文档才能构造SQL语句以正确地表达特定的查询.为此,本文提出一种利用词典扩展数据库模式信息的Text2SQL方法,该方法从数据库表名和列名解析出其中的单词或短语,查询词典获取这些单词或短语的语义解释,将这些解释看成是相应表名或列名的扩展内容,与表名、列名及其他数据库模式信息(主键、外键等)相结合,作为模型的输入,从而使模型能够更全面地学习数据库建模的应用领域知识.在Spider-syn和Spider数据集上进行的实验说明了所提出方法的有效性,即使自然语言查询中使用的表名和列名与数据库模式中对应的表名和列名完全不同,本文方法也能够得到较好的SQL翻译结果,明显优于最新提出的抗同义词替换攻击的方法. 展开更多
关键词 数据库模式 语义扩展 解释信息 text2sql
在线阅读 下载PDF
面向工业生产的中文Text-to-SQL模型 被引量:3
11
作者 吕剑清 王先兵 +2 位作者 陈刚 张华 王明刚 《计算机应用》 CSCD 北大核心 2022年第10期2996-3002,共7页
英文自然语言查询转SQL语句(Text-to-SQL)任务的模型迁移到中文工业Text-to-SQL任务时,由于工业数据集的可解释差且比较分散,会出现数据库的表名列名等信息与问句中关键信息的表示形式不一致以及问句中的列名隐含在语义中等问题导致模... 英文自然语言查询转SQL语句(Text-to-SQL)任务的模型迁移到中文工业Text-to-SQL任务时,由于工业数据集的可解释差且比较分散,会出现数据库的表名列名等信息与问句中关键信息的表示形式不一致以及问句中的列名隐含在语义中等问题导致模型精确匹配率变低。针对迁移过程中出现的问题,提出了对应的解决方法并构建修改后的模型。首先,在数据使用过程中融入工厂元数据信息以解决表示形式不一致以及列名隐含在语义中的问题;然后,根据中文语言表达方式的特性,使用基于相对位置的自注意力模型直接通过问句以及数据库模式信息识别出where子句的value值;最后,根据工业问句查询内容的特性,使用微调后的基于变换器的双向编码器表示技术(BERT)对问句进行分类以提高模型对SQL语句结构预测的准确率。构建了一个基于铝冶炼行业的工业数据集,并在该数据集上进行实验验证。结果表明所提模型在工业测试集上的精确匹配率为74.2%,对比英文数据集Spider上各阶段主流模型的效果后可以看出,所提模型能有效处理中文工业Text-to-SQL任务。 展开更多
关键词 中文text-to-sql任务 工业数据集 元数据 自注意力模型 基于变换器的双向编码器表示技术
在线阅读 下载PDF
MySQL数据库复杂多表联合查询的优化策略及性能分析
12
作者 刘雪梅 《软件》 2025年第10期138-140,共3页
随着数据量的持续增长,MySQL数据库在处理复杂多表联合查询时面临显著的性能挑战。针对查询响应时间长、资源消耗高等瓶颈,本文围绕索引设计、执行计划优化及SQL语句重构等方面展开系统优化策略设计。通过执行计划关键字段分析,建立优... 随着数据量的持续增长,MySQL数据库在处理复杂多表联合查询时面临显著的性能挑战。针对查询响应时间长、资源消耗高等瓶颈,本文围绕索引设计、执行计划优化及SQL语句重构等方面展开系统优化策略设计。通过执行计划关键字段分析,建立优化模型,提升查询效率。实验结果显示,优化方案显著缩短了查询时间,降低了系统负载,具备良好的应用价值和推广前景。 展开更多
关键词 MYsql 多表联合查询 执行计划 索引优化 sql重构
在线阅读 下载PDF
基于语义增强模式链接的Text-to-SQL模型 被引量:1
13
作者 吴相岚 肖洋 +1 位作者 刘梦莹 刘明铭 《计算机应用》 CSCD 北大核心 2024年第9期2689-2695,共7页
为优化基于异构图编码器的Text-to-SQL生成效果,提出SELSQL模型。首先,模型采用端到端的学习框架,使用双曲空间下的庞加莱距离度量替代欧氏距离度量,以此优化使用探针技术从预训练语言模型中构建的语义增强的模式链接图;其次,利用K头加... 为优化基于异构图编码器的Text-to-SQL生成效果,提出SELSQL模型。首先,模型采用端到端的学习框架,使用双曲空间下的庞加莱距离度量替代欧氏距离度量,以此优化使用探针技术从预训练语言模型中构建的语义增强的模式链接图;其次,利用K头加权的余弦相似度以及图正则化方法学习相似度度量图使得初始模式链接图在训练中迭代优化;最后,使用改良的关系图注意力网络(RGAT)图编码器以及多头注意力机制对两个模块的联合语义模式链接图进行编码,并且使用基于语法的神经语义解码器和预定义的结构化语言进行结构化查询语言(SQL)语句解码。在Spider数据集上的实验结果表明,使用ELECTRA-large预训练模型时,SELSQL模型比最佳基线模型的准确率提升了2.5个百分点,对于复杂SQL语句生成的提升效果很大。 展开更多
关键词 模式链接 图结构学习 预训练语言模型 text-to-sql 异构图
在线阅读 下载PDF
图神经网络在Text-to-SQL解析中的技术研究 被引量:3
14
作者 曹合心 赵亮 李雪峰 《计算机科学》 CSCD 北大核心 2022年第4期110-115,共6页
语义解析领域中的Text-to-SQL任务对实现基于数据库的自动问答具有重要意义。现有深度学习模型,如Seq2Seq的序列生成模型在单表SQL查询中已取得显著效果,但无法解决多表SQL查询的问题。图神经网络能够有效提取数据库表和问句之间的关联... 语义解析领域中的Text-to-SQL任务对实现基于数据库的自动问答具有重要意义。现有深度学习模型,如Seq2Seq的序列生成模型在单表SQL查询中已取得显著效果,但无法解决多表SQL查询的问题。图神经网络能够有效提取数据库表和问句之间的关联信息,丰富解析过程中的语义信息,从而提升多表SQL查询的准确率。文中提出一种自适应的图构建方式和图编码方式,在现有Text-to-SQL模型中引入问句信息,通过对问句和数据库的拼接词向量进行卷积操作生成图网络初始化权重,对同种类型下的不同数据库可实现统一训练。采用IRNet框架和关系扩充的方式进行整体模型设计,在当前开放的Text-to-SQL数据集Spider上进行验证。结果表明,该技术能够有效提升多表SQL语句生成的匹配准确率,同时算法对图神经网络在Text-to-SQL领域的研究具有重要的参考价值。 展开更多
关键词 text-to-sql解析 深度学习 图构建 图神经网络 多表sql语句生成
在线阅读 下载PDF
J-TEXT托卡马克相干成像光谱诊断系统设计
15
作者 聂林 吴骏彬 +5 位作者 龙婷 雷驰 严伟 李杨波 张霄翼 J-TEXT实验团队 《核聚变与等离子体物理》 北大核心 2025年第3期273-279,共7页
相干成像光谱诊断是一种采用高速相机拍摄方式对等离子体边界的杂质离子流速进行二维成像的被动光谱诊断,对研究托卡马克边界和偏滤器等离子体环向旋转、杂质离子分布有着重要的作用。J-TEXT装置成功研制并部署了一套主要基于CⅢ线(464.... 相干成像光谱诊断是一种采用高速相机拍摄方式对等离子体边界的杂质离子流速进行二维成像的被动光谱诊断,对研究托卡马克边界和偏滤器等离子体环向旋转、杂质离子分布有着重要的作用。J-TEXT装置成功研制并部署了一套主要基于CⅢ线(464.88 nm)的相干成像光谱诊断系统。该系统的光学视场设计为12°,主要针对J-TEXT强场侧边缘等离子体区域进行观测。在性能指标方面,系统具备2 ms的时间分辨率,同时实现了11 mm(垂直方向)空间分辨率。目前该诊断系统已完成实验测试,并成功获取了等离子体边界的关键数据,为开展边界物理研究提供了新的实验手段。 展开更多
关键词 相干成像光谱诊断 环向速度 J-text托卡马克
在线阅读 下载PDF
基于SQL数据库和KD-Tree算法的船体型线匹配方法 被引量:1
16
作者 余恺 马宁 +1 位作者 史琪琪 孙利 《舰船科学技术》 北大核心 2025年第11期8-14,共7页
为提高船舶初步设计效率,提出一种基于SQL数据库和KD-Tree算法的船舶型线快速匹配方法。针对船舶数据繁多复杂的问题,利用SQL语言保存、分类和提取船舶设计过程中的型线数据和特征线数据,提高了数据的存储和利用效率。针对船体复杂曲面... 为提高船舶初步设计效率,提出一种基于SQL数据库和KD-Tree算法的船舶型线快速匹配方法。针对船舶数据繁多复杂的问题,利用SQL语言保存、分类和提取船舶设计过程中的型线数据和特征线数据,提高了数据的存储和利用效率。针对船体复杂曲面的匹配问题,采取基于特征线描述船体特征,并求解特征线B样条控制点的方法保存船体的曲面特征数据。针对高维度变量的匹配问题,在不同大小的测试集中采用KD-Tree结构保存数据并采用最邻近搜索算法,能将船体型线的搜索匹配速度提高34.31%~84.16%。该方法对提高船舶初步设计效率提供有益的借鉴和帮助。 展开更多
关键词 船体设计 sql数据库 KD-Tree算法 船舶特征线
在线阅读 下载PDF
基于Kali Linux平台与Sqlmap工具的SQL注入实验研究
17
作者 洪允德 《电脑编程技巧与维护》 2025年第12期99-101,共3页
SQL注入漏洞是Web应用中危害较大的漏洞之一。探讨了利用Kali Linux作为渗透平台,对目标Web服务器(靶机)的phpcms网站进行SQL注入实验的过程。通过实验可以理解SQL注入基本过程,掌握SQLmap注入工具的使用方法及典型命令,感受SQL注入的... SQL注入漏洞是Web应用中危害较大的漏洞之一。探讨了利用Kali Linux作为渗透平台,对目标Web服务器(靶机)的phpcms网站进行SQL注入实验的过程。通过实验可以理解SQL注入基本过程,掌握SQLmap注入工具的使用方法及典型命令,感受SQL注入的危害。 展开更多
关键词 Kali Linux平台 sqlmap注入工具 sql注入攻击
在线阅读 下载PDF
中文短文本情感分类:融入位置感知强化的Transformer-TextCNN模型研究
18
作者 李浩君 王耀东 汪旭辉 《计算机工程与应用》 北大核心 2025年第11期216-226,共11页
针对当前中文短文本情感分类模型文本位置信息与关键特征获取不足的问题,提出了一种融入位置感知强化的Transformer-TextCNN情感分类模型。利用BERT可学习绝对位置编码与正弦位置编码强化模型的位置感知能力,融合Transformer的全局上下... 针对当前中文短文本情感分类模型文本位置信息与关键特征获取不足的问题,提出了一种融入位置感知强化的Transformer-TextCNN情感分类模型。利用BERT可学习绝对位置编码与正弦位置编码强化模型的位置感知能力,融合Transformer的全局上下文理解能力与TextCNN的局部特征捕捉能力,分别提取中文短文本全局特征与局部特征,构建位置感知强化与特征协同的情感特征输出服务,实现中文短文本情感准确分类。实验结果表明,该模型在视频弹幕数据集上的准确率达到90.23%,在SMP2020数据集上的准确率达到87.38%。相较于最优的基线模型,准确率在视频弹幕数据集和SMP2020数据集上分别提高了1.98和0.44个百分点,在中文短文本情感分类任务中取得更好的分类效果。 展开更多
关键词 文本情感分类 BERT TRANSFORMER textCNN 位置编码
在线阅读 下载PDF
Text-to-SQL文本信息处理技术研究综述 被引量:4
19
作者 彭钰寒 乔少杰 +5 位作者 薛骐 李江敏 谢添丞 徐康镭 冉黎琼 曾少北 《无线电工程》 2024年第5期1053-1062,共10页
信号与信息处理的需求日益增加,离不开数据处理技术,数据处理需要数据库的支持,然而没有经过训练的使用者会因为不熟悉数据库操作产生诸多问题。文本转结构化查询语言(Text to Structured Query Language,Text-to-SQL)的出现,使用户无... 信号与信息处理的需求日益增加,离不开数据处理技术,数据处理需要数据库的支持,然而没有经过训练的使用者会因为不熟悉数据库操作产生诸多问题。文本转结构化查询语言(Text to Structured Query Language,Text-to-SQL)的出现,使用户无需掌握结构化查询语言(Structured Query Language,SQL)也能够熟练操作数据库。介绍Text-to-SQL的研究背景及面临的挑战;介绍Text-to-SQL关键技术、基准数据集、模型演变及最新研究进展,关键技术包括Transformer等主流技术,用于模型训练的基准数据集包括WikiSQL和Spider;介绍Text-to-SQL不同阶段模型的特点,详细阐述Text-to-SQL最新研究成果的工作原理,包括模型构建、解析器设计及数据集生成;总结Text-to-SQL未来的发展方向及研究重点。 展开更多
关键词 文本转结构化查询语言 解析器 文本信息处理 数据库 深度学习
在线阅读 下载PDF
基于Transformer和Text-CNN的日志异常检测
20
作者 尹春勇 张小虎 《计算机工程与科学》 北大核心 2025年第3期448-458,共11页
日志数据作为软件系统中最为重要的数据资源之一,记录着系统运行期间的详细信息,自动化的日志异常检测对于维护系统安全至关重要。随着大型语言模型在自然语言处理领域的广泛应用,基于Transformer的日志异常检测方法被广泛地提出。传统... 日志数据作为软件系统中最为重要的数据资源之一,记录着系统运行期间的详细信息,自动化的日志异常检测对于维护系统安全至关重要。随着大型语言模型在自然语言处理领域的广泛应用,基于Transformer的日志异常检测方法被广泛地提出。传统的基于Transformer的方法,难以捕捉日志序列的局部特征,针对上述问题,提出了基于Transformer和Text-CNN的日志异常检测方法LogTC。首先,通过规则匹配将日志转换成结构化的日志数据,并保留日志语句中的有效信息;其次,根据日志特性采用固定窗口或会话窗口将日志语句划分为日志序列;再次,使用自然语言处理技术Sentence-BERT生成日志语句的语义化表示;最后,将日志序列的语义化向量输入到LogTC日志异常检测模型中进行检测。实验结果表明,LogTC能够有效地检测日志数据中的异常,且在2个数据集上都取得了较好的结果。 展开更多
关键词 日志异常检测 深度学习 词嵌入 TRANSFORMER text-CNN
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部