期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
面向研究生招生咨询的中文Text-to-SQL模型
1
作者 王庆丰 李旭 +1 位作者 姚春龙 程腾腾 《计算机工程》 北大核心 2025年第3期362-368,共7页
研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言... 研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言问题转化为SQL语句后到结构化数据库中查询答案并返回。搜集了研究生招生场景中的高频咨询问题,根据3所高校真实招生数据,构建问题与SQL语句模板,通过填充模板的方式构建数据集,共有训练集1501条、测试集386条。将RESDSQL的RoBERTa模型替换为具有更强多语言生成能力的XLM-RoBERTa模型、T5模型替换为mT5模型,并在目标领域数据集上进行微调,在招生领域问题上取得了较高的准确率,在mT5-large模型上执行正确率为0.95,精确匹配率为1。与基于ChatGPT3.5模型、使用零样本提示的C3SQL方法对比,该模型性能与成本均更优。 展开更多
关键词 中文文本转结构化查询语言 自然语言查询 中文SQL语句生成 预训练模型 text-to-sql数据集
在线阅读 下载PDF
一种基于RAG的离线中文Text-to-SQL技术
2
作者 周学文 江荣 +1 位作者 许超俊 秦基尧 《网络安全与数据治理》 2025年第S1期55-59,共5页
在现代数据驱动的决策过程中,数据的重要性不言而喻。有效的数据管理和分析不仅能提升业务效率,还能为策略制定提供科学依据。在众多数据处理领域,自然语言处理与结构化查询语言之间的转换显得尤为重要。针对离线环境下,大语言模型无法... 在现代数据驱动的决策过程中,数据的重要性不言而喻。有效的数据管理和分析不仅能提升业务效率,还能为策略制定提供科学依据。在众多数据处理领域,自然语言处理与结构化查询语言之间的转换显得尤为重要。针对离线环境下,大语言模型无法自动完成模型的更新迭代,这在一定程度上限制了提供精确和详细信息的能力的问题,提出一种基于RAG的离线中文Text-to-SQL技术。首先,根据用户输入自然语言查询请求,通过RAG技术对请求解析,生成结构化信息;其次,根据解析后的信息检索相关的数据库表和字段;最后,通过大语言模型生成精确的SQL查询语句。这一技术的应用,不仅能帮助非专业用户更容易地访问和分析数据,还能够有效提高模型语义理解能力和生成SQL精度,同时防止数据泄露。因此,研究和开发高效的自然语言到SQL的离线处理方法,将对数据分析的普及和应用产生深远的影响。 展开更多
关键词 text-to-sql 离线环境 RAG 自然语言处理 大语言模型
在线阅读 下载PDF
大语言模型时代Text-to-SQL更准确的评估指标
3
作者 蒋鹏 《电脑知识与技术》 2025年第1期76-78,88,共4页
大型语言模型(LLM)已成为推进Text-to-SQL任务的强大工具。研究发现,基于LLM的模型在不同评估指标下,其性能表现与经过微调的模型存在显著差异。因此,文章分析了测试套件执行准确度(EXE)和精确集匹配准确度(ESM)在评估基于LLM的Text-to-... 大型语言模型(LLM)已成为推进Text-to-SQL任务的强大工具。研究发现,基于LLM的模型在不同评估指标下,其性能表现与经过微调的模型存在显著差异。因此,文章分析了测试套件执行准确度(EXE)和精确集匹配准确度(ESM)在评估基于LLM的Text-to-SQL模型时的不足,并提出了改进指标EESM(Enhanced Exact Set Matching)。实验结果表明,EXE和ESM分别存在高达13.2%和10.8%的假阳性和假阴性率,而EESM的假阳性率和假阴性率分别仅为0.2%和1.8%,表明EESM能够提供更准确的评估。 展开更多
关键词 EESM 增强的精确集匹配准确度 测试套件执行准确度 精确集匹配准确度 text-to-sql
在线阅读 下载PDF
基于语义增强模式链接的Text-to-SQL模型 被引量:1
4
作者 吴相岚 肖洋 +1 位作者 刘梦莹 刘明铭 《计算机应用》 CSCD 北大核心 2024年第9期2689-2695,共7页
为优化基于异构图编码器的Text-to-SQL生成效果,提出SELSQL模型。首先,模型采用端到端的学习框架,使用双曲空间下的庞加莱距离度量替代欧氏距离度量,以此优化使用探针技术从预训练语言模型中构建的语义增强的模式链接图;其次,利用K头加... 为优化基于异构图编码器的Text-to-SQL生成效果,提出SELSQL模型。首先,模型采用端到端的学习框架,使用双曲空间下的庞加莱距离度量替代欧氏距离度量,以此优化使用探针技术从预训练语言模型中构建的语义增强的模式链接图;其次,利用K头加权的余弦相似度以及图正则化方法学习相似度度量图使得初始模式链接图在训练中迭代优化;最后,使用改良的关系图注意力网络(RGAT)图编码器以及多头注意力机制对两个模块的联合语义模式链接图进行编码,并且使用基于语法的神经语义解码器和预定义的结构化语言进行结构化查询语言(SQL)语句解码。在Spider数据集上的实验结果表明,使用ELECTRA-large预训练模型时,SELSQL模型比最佳基线模型的准确率提升了2.5个百分点,对于复杂SQL语句生成的提升效果很大。 展开更多
关键词 模式链接 图结构学习 预训练语言模型 text-to-sql 异构图
在线阅读 下载PDF
面向工业生产的中文Text-to-SQL模型 被引量:3
5
作者 吕剑清 王先兵 +2 位作者 陈刚 张华 王明刚 《计算机应用》 CSCD 北大核心 2022年第10期2996-3002,共7页
英文自然语言查询转SQL语句(Text-to-SQL)任务的模型迁移到中文工业Text-to-SQL任务时,由于工业数据集的可解释差且比较分散,会出现数据库的表名列名等信息与问句中关键信息的表示形式不一致以及问句中的列名隐含在语义中等问题导致模... 英文自然语言查询转SQL语句(Text-to-SQL)任务的模型迁移到中文工业Text-to-SQL任务时,由于工业数据集的可解释差且比较分散,会出现数据库的表名列名等信息与问句中关键信息的表示形式不一致以及问句中的列名隐含在语义中等问题导致模型精确匹配率变低。针对迁移过程中出现的问题,提出了对应的解决方法并构建修改后的模型。首先,在数据使用过程中融入工厂元数据信息以解决表示形式不一致以及列名隐含在语义中的问题;然后,根据中文语言表达方式的特性,使用基于相对位置的自注意力模型直接通过问句以及数据库模式信息识别出where子句的value值;最后,根据工业问句查询内容的特性,使用微调后的基于变换器的双向编码器表示技术(BERT)对问句进行分类以提高模型对SQL语句结构预测的准确率。构建了一个基于铝冶炼行业的工业数据集,并在该数据集上进行实验验证。结果表明所提模型在工业测试集上的精确匹配率为74.2%,对比英文数据集Spider上各阶段主流模型的效果后可以看出,所提模型能有效处理中文工业Text-to-SQL任务。 展开更多
关键词 中文text-to-sql任务 工业数据集 元数据 自注意力模型 基于变换器的双向编码器表示技术
在线阅读 下载PDF
图神经网络在Text-to-SQL解析中的技术研究 被引量:3
6
作者 曹合心 赵亮 李雪峰 《计算机科学》 CSCD 北大核心 2022年第4期110-115,共6页
语义解析领域中的Text-to-SQL任务对实现基于数据库的自动问答具有重要意义。现有深度学习模型,如Seq2Seq的序列生成模型在单表SQL查询中已取得显著效果,但无法解决多表SQL查询的问题。图神经网络能够有效提取数据库表和问句之间的关联... 语义解析领域中的Text-to-SQL任务对实现基于数据库的自动问答具有重要意义。现有深度学习模型,如Seq2Seq的序列生成模型在单表SQL查询中已取得显著效果,但无法解决多表SQL查询的问题。图神经网络能够有效提取数据库表和问句之间的关联信息,丰富解析过程中的语义信息,从而提升多表SQL查询的准确率。文中提出一种自适应的图构建方式和图编码方式,在现有Text-to-SQL模型中引入问句信息,通过对问句和数据库的拼接词向量进行卷积操作生成图网络初始化权重,对同种类型下的不同数据库可实现统一训练。采用IRNet框架和关系扩充的方式进行整体模型设计,在当前开放的Text-to-SQL数据集Spider上进行验证。结果表明,该技术能够有效提升多表SQL语句生成的匹配准确率,同时算法对图神经网络在Text-to-SQL领域的研究具有重要的参考价值。 展开更多
关键词 text-to-sql解析 深度学习 图构建 图神经网络 多表SQL语句生成
在线阅读 下载PDF
TSCL-SQL: Two-Stage Curriculum Learning Framework for Text-to-SQL
7
作者 尹枫 程路易 +3 位作者 王秋月 王志军 杜明 徐波 《Journal of Donghua University(English Edition)》 CAS 2023年第4期421-427,共7页
Text-to-SQL is the task of translating a natural language query into a structured query language. Existing text-to-SQL approaches focus on improving the model’s architecture while ignoring the relationship between qu... Text-to-SQL is the task of translating a natural language query into a structured query language. Existing text-to-SQL approaches focus on improving the model’s architecture while ignoring the relationship between queries and table schemas and the differences in difficulty between examples in the dataset. To tackle these challenges, a two-stage curriculum learning framework for text-to-SQL(TSCL-SQL) is proposed in this paper. To exploit the relationship between the queries and the table schemas, a schema identification pre-training task is proposed to make the model choose the correct table schema from a set of candidates for a specific query. To leverage the differences in difficulty between examples, curriculum learning is applied to the text-to-SQL task, accompanied by an automatic curriculum learning solution, including a difficulty scorer and a training scheduler. Experiments show that the framework proposed in this paper is effective. 展开更多
关键词 text-to-sql curriculum learning semantic parsing
在线阅读 下载PDF
基于结构化案例推理的SQL生成模型
8
作者 罗明全 王静 魏英 《无线电通信技术》 北大核心 2025年第3期478-485,共8页
自动化的自然语言与数据库接口对于应用开发至关重要。语义解析驱动的推理时间结构化查询语言(Structured Query Language,SQL)自适应方法能够兼容来自新域的样本,且无需重复调优。现有方法通常简单地将编码器输入的新域输入-输出案例... 自动化的自然语言与数据库接口对于应用开发至关重要。语义解析驱动的推理时间结构化查询语言(Structured Query Language,SQL)自适应方法能够兼容来自新域的样本,且无需重复调优。现有方法通常简单地将编码器输入的新域输入-输出案例连接到模型中,进而使解码器产生偏差,不能充分利用案例中逻辑形式的结构。基于上述情况,提出一种基于结构化案例推理(Structured Case Reasoning Model,SCRM)的SQL生成模型,充分利用案例的逻辑形式和候选输出之间的子树级相似性,以此生成更好的解码器决策;提出一个可训练的组合子树相似函数,与全树嵌入相比,该函数对于大型搜索边界的评分更为准确。SCRM结合新的结构化案例记忆及可训练的查询子树相似度模块,可以提升推理过程中正确输出的得分。在5种不同的数据集上进行实验,相对于其他模型,所提出的SCRM凭借结构化案例的优势,在不同性能指标上均取得了最佳结果。 展开更多
关键词 text-to-sql 子树级相似性 结构化案例 解码器 相似函数
在线阅读 下载PDF
基于大模型的数据分析技术在烟草行业的应用
9
作者 刘晶 杜云鹏 +1 位作者 杨海 罗文 《新潮电子》 2025年第12期13-15,共3页
随着大数据时代的到来,数据分析在企业决策中的作用日益凸显。为了帮助烟草企业进行更加科学的决策,推动烟草企业的发展,本文研究了大规模自然语言模型(LLMs)在烟草行业数据分析中的应用,特别是Text-to-SQL(Text2SQL)技术。该技术通过... 随着大数据时代的到来,数据分析在企业决策中的作用日益凸显。为了帮助烟草企业进行更加科学的决策,推动烟草企业的发展,本文研究了大规模自然语言模型(LLMs)在烟草行业数据分析中的应用,特别是Text-to-SQL(Text2SQL)技术。该技术通过自然语言查询直接生成SQL语句,简化了数据分析流程,提高了效率。本文首先概述了大规模自然语言模型的基本原理和Text2SQL技术的工作机制,然后介绍了对星火大模型的微调过程,包括数据集构建、微调策略和效果评估。微调后的模型在烟草企业数据分析任务中表现出色,显著提升了数据分析的实时性和准确性。此外,本文还探讨了Text2SQL技术在烟草企业实际应用中的潜在价值和效果,为烟草行业的数字化转型提供了新的思路和实践案例。 展开更多
关键词 大规模自然语言模型 text-to-sql 数据分析 烟草企业 企业决策
在线阅读 下载PDF
基于关系感知注意力的信息检索SQL生成器
10
作者 王孝红 杨帅强 《无线电通信技术》 北大核心 2025年第3期511-519,共9页
结构化查询语言(Structured Query Language,SQL)生成器对于非专业人员检索信息至关重要,模型学习模式链接和模式编码等关系结构是自然语言转换为SQL,即Text-to-SQL任务的关键步骤。不同的关系结构通常利用不同结构的模型进行学习,难以... 结构化查询语言(Structured Query Language,SQL)生成器对于非专业人员检索信息至关重要,模型学习模式链接和模式编码等关系结构是自然语言转换为SQL,即Text-to-SQL任务的关键步骤。不同的关系结构通常利用不同结构的模型进行学习,难以兼容现有固定结构的大型预训练模型。现有方法往往忽视问题依赖结构关系和问题共引用关系对模型的影响,很难同时利用不同的关系结构。为了解决上述问题,提出基于关系感知注意力(Relation-Aware Attention,RAA)的信息检索SQL生成器,使用RAA机制学习模式链接和模式编码等关系结构,引入问题依赖结构关系和问题共引用关系使模型更具泛化性,利用关系副本方法处理关系与输入标记之间的粒度。RAA能够在利用预训练权重的情况下向模型引入新的关系权重。在3个包含单回合和多回合场景的Text-to-SQL数据集上进行了大量实验,结果表明RAA在不同数据集上均表现出最佳性能。 展开更多
关键词 结构化查询语言生成器 信息检索 text-to-sql 预训练模型 关系感知注意力
在线阅读 下载PDF
Comparing Large Language Models for Generating Complex Queries
11
作者 Limin Ma Ken Pu +1 位作者 Ying Zhu Wesley Taylor 《Journal of Computer and Communications》 2025年第2期236-249,共14页
This study presents a comparative analysis of a complex SQL benchmark, TPC-DS, with two existing text-to-SQL benchmarks, BIRD and Spider. Our findings reveal that TPC-DS queries exhibit a significantly higher level of... This study presents a comparative analysis of a complex SQL benchmark, TPC-DS, with two existing text-to-SQL benchmarks, BIRD and Spider. Our findings reveal that TPC-DS queries exhibit a significantly higher level of structural complexity compared to the other two benchmarks. This underscores the need for more intricate benchmarks to simulate realistic scenarios effectively. To facilitate this comparison, we devised several measures of structural complexity and applied them across all three benchmarks. The results of this study can guide future research in the development of more sophisticated text-to-SQL benchmarks. We utilized 11 distinct Language Models (LLMs) to generate SQL queries based on the query descriptions provided by the TPC-DS benchmark. The prompt engineering process incorporated both the query description as outlined in the TPC-DS specification and the database schema of TPC-DS. Our findings indicate that the current state-of-the-art generative AI models fall short in generating accurate decision-making queries. We conducted a comparison of the generated queries with the TPC-DS gold standard queries using a series of fuzzy structure matching techniques based on query features. The results demonstrated that the accuracy of the generated queries is insufficient for practical real-world application. 展开更多
关键词 text-to-sql Evaluation LLM Generative AI
在线阅读 下载PDF
大语言模型赋能数据库运维:应用、挑战与展望
12
作者 李灏江 《电脑知识与技术》 2025年第31期61-66,共6页
为应对传统数据库运维面临的效率瓶颈、高昂成本与系统复杂性等挑战,文章系统综述了大语言模型(LLMs)在该领域的应用,深入分析了其应用潜力、面临的挑战及未来发展趋势,旨在为LLMs在数据库运维领域的理论研究与工程实践提供参考框架与... 为应对传统数据库运维面临的效率瓶颈、高昂成本与系统复杂性等挑战,文章系统综述了大语言模型(LLMs)在该领域的应用,深入分析了其应用潜力、面临的挑战及未来发展趋势,旨在为LLMs在数据库运维领域的理论研究与工程实践提供参考框架与前瞻性洞见。 展开更多
关键词 大语言模型 数据库运维 智能运维(AIOps) text-to-sql 国产数据库
在线阅读 下载PDF
Towards Text-to-SQL over Aggregate Tables 被引量:1
13
作者 Shuqin Li Kaibin Zhou +2 位作者 Zeyang Zhuang Haofen Wang Jun Ma 《Data Intelligence》 EI 2023年第2期457-474,共18页
Text-to-SQL aims at translating textual questions into the corresponding SQL queries.Aggregate tables are widely created for high-frequent queries.Although text-to-SQL has emerged as an important task,recent studies p... Text-to-SQL aims at translating textual questions into the corresponding SQL queries.Aggregate tables are widely created for high-frequent queries.Although text-to-SQL has emerged as an important task,recent studies paid little attention to the task over aggregate tables.The increased aggregate tables bring two challenges:(1)mapping of natural language questions and relational databases will suffer from more ambiguity,(2)modern models usually adopt self-attention mechanism to encode database schema and question.The mechanism is of quadratic time complexity,which will make inferring more time-consuming as input sequence length grows.In this paper,we introduce a novel approach named WAGG for text-to-SQL over aggregate tables.To effectively select among ambiguous items,we propose a relation selection mechanism for relation computing.To deal with high computation costs,we introduce a dynamical pruning strategy to discard unrelated items that are common for aggregate tables.We also construct a new large-scale dataset SpiderwAGG extended from Spider dataset for validation,where extensive experiments show the effectiveness and efficiency of our proposed method with 4%increase of accuracy and 15%decrease of inference time w.r.t a strong baseline RAT-SQL. 展开更多
关键词 text-to-sql Question Answering Business Intelligence Deep Learning
原文传递
基于依存关系图注意力网络的SQL生成方法 被引量:1
14
作者 舒晴 刘喜平 +4 位作者 谭钊 李希 万常选 刘德喜 廖国琼 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第5期908-917,共10页
研究基于自然语言问题的结构化查询语言(SQL)生成问题(Text-to-SQL).提出两阶段框架,旨在解耦模式链接和SQL生成过程,降低SQL生成的难度.第1阶段通过基于关系图注意力网络的模式链接器识别问题中提及的数据库表、列和值,利用问题的语法... 研究基于自然语言问题的结构化查询语言(SQL)生成问题(Text-to-SQL).提出两阶段框架,旨在解耦模式链接和SQL生成过程,降低SQL生成的难度.第1阶段通过基于关系图注意力网络的模式链接器识别问题中提及的数据库表、列和值,利用问题的语法结构和数据库模式项之间的内部关系,指导模型学习问题与数据库的对齐关系.构建问题图时,针对Text-to-SQL任务的特点,在原始句法依存树的基础上,合并与模式链接无关的关系,添加并列结构中的从属词与句中其他成分间的依存关系,帮助模型捕获长距离依赖关系.第2阶段进行SQL生成,将对齐信息注入T5的编码器,对T5进行微调.在Spider、Spider-DK和Spider-Syn数据集上进行实验,实验结果显示,该方法具有良好的性能,尤其是对中等难度以上的Text-to-SQL问题具有良好的表现. 展开更多
关键词 text-to-sql 自然语言查询 依存句法分析 关系图注意力网络
在线阅读 下载PDF
基于自然语言的数据库查询生成研究综述 被引量:7
15
作者 刘喜平 舒晴 +2 位作者 何佳壕 万常选 刘德喜 《软件学报》 EI CSCD 北大核心 2022年第11期4107-4136,共30页
数据库能够提供对大量数据的高效存储和访问,然而查询数据库需要掌握数据库查询语言SQL,对于普通用户而言存在一定的门槛.基于自然语言的数据库查询(即text-to-SQL)在最近几年受到了广泛的关注.对text-to-SQL问题的当前进展进行了系统... 数据库能够提供对大量数据的高效存储和访问,然而查询数据库需要掌握数据库查询语言SQL,对于普通用户而言存在一定的门槛.基于自然语言的数据库查询(即text-to-SQL)在最近几年受到了广泛的关注.对text-to-SQL问题的当前进展进行了系统的分析.首先介绍了问题背景,并对问题进行了描述;其次,重点分析了目前提出的text-to-SQL技术,包括基于流水线的方法、基于统计学习的方法,以及为多轮text-to-SQL而开发的技术,对每种方法都进行了深入的分析和总结.再次,进一步讨论了text-to-SQL所属的语义解析(semantic parsing)这一领域的研究.接着,总结了目前研究中广泛采用的数据集和评价指标,并从多个角度对主流模型进行了比较和分析.最后,总结了text-to-SQL任务面临的挑战,以及未来的研究方向. 展开更多
关键词 自然语言 数据库查询 SQL text-to-sql 语义解析 自然语言处理
在线阅读 下载PDF
带复杂计算的金融领域自然语言查询的SQL生成 被引量:4
16
作者 何佳壕 刘喜平 +3 位作者 舒晴 万常选 刘德喜 廖国琼 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第2期277-286,共10页
研究金融领域基于自然语言查询的结构化查询语言(SQL)生成问题(Text-to-SQL),构建一个金融领域Textto-SQL数据集,称为SOFT数据集.该数据集覆盖了金融领域的常见查询,具有鲜明的特点,并对Text-to-SQL提出了挑战.提出金融领域Text-to-SQL... 研究金融领域基于自然语言查询的结构化查询语言(SQL)生成问题(Text-to-SQL),构建一个金融领域Textto-SQL数据集,称为SOFT数据集.该数据集覆盖了金融领域的常见查询,具有鲜明的特点,并对Text-to-SQL提出了挑战.提出金融领域Text-to-SQL模型FinSQL,该模型优化了对金融领域复杂查询的支持.通过分析一类复杂计算查询(行计算查询)的特点,提出一种基于分治的方法,即先将一个行计算查询分解为若干个子查询,分别针对每个子查询生成SQL语句,再将子查询的SQL语句组合在一起得到原始查询的SQL语句.在SOFT数据集上进行验证,结果显示,本研究所提的方法在复杂查询上效果优于已有方法.特别地,所提出的模型FinSQL能够较好地支持行计算查询. 展开更多
关键词 text-to-sql 自然语言查询 金融领域 行计算查询 分治方法
在线阅读 下载PDF
基于自然语言处理的SQL语句生成研究 被引量:3
17
作者 张康林 戴一成 《科学技术创新》 2023年第22期69-72,共4页
大数据时代下,数据的价值也随之提升,数据库作为海量数据的存储和管理工具,熟练掌握其查询语言至关重要。为了提升非专业数据库用户使用数据库的简捷度以及提高其数据库操作的效率和准确性,本研究提出了一种基于ChatGLM预训练模型的自... 大数据时代下,数据的价值也随之提升,数据库作为海量数据的存储和管理工具,熟练掌握其查询语言至关重要。为了提升非专业数据库用户使用数据库的简捷度以及提高其数据库操作的效率和准确性,本研究提出了一种基于ChatGLM预训练模型的自然语言转SQL查询语句的方法,即通过分词化、词嵌入、模型训练和模型测试等流程完成文本转SQL研究。在由1020条SQL查询语句构建的数据集上的实验表明,该方法的F1指数达到89.8%,能够满足普通用户的查询需求,促进了数据库的普及和应用。 展开更多
关键词 自然语言处理 SQL ChatGLM text-to-sql
在线阅读 下载PDF
基于问句语义图神经网络的中文问句生成SQL语句研究
18
作者 张海芳 何清龙 《运筹与模糊学》 2024年第1期83-90,共8页
自然语言问句转为结构化查询语句(Text-to-SQL)是语义解析领域中热点研究之一,其目标是将自然语言问句转化为数据库可以理解且执行的结构化查询语句。现有研究大部分仅考虑数据库层面的关联信息,忽略了问句中的实体关系信息的重要性。... 自然语言问句转为结构化查询语句(Text-to-SQL)是语义解析领域中热点研究之一,其目标是将自然语言问句转化为数据库可以理解且执行的结构化查询语句。现有研究大部分仅考虑数据库层面的关联信息,忽略了问句中的实体关系信息的重要性。为了提高模型捕捉问句中语义的有用信息,本文在IGSQL模型基础上,引入问句中实体之间的图网络信息,通过注意力机制来自动学习问句和数据库模式之间的关联。在Chase数据集上的实验结果表明,本文提出模型的完全匹配率达到46.2%。相比较于基线模型,完全匹配率提升了6.3%。 展开更多
关键词 text-to-sql 自然语言处理 图神经网络 中文多表SQL语句生成
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部