期刊文献+
共找到45,264篇文章
< 1 2 250 >
每页显示 20 50 100
RNSQL:融合逆规范化的Text2SQL生成
1
作者 帖军 范子琪 +2 位作者 孙翀 郑禄 朱柏尔 《计算机应用与软件》 北大核心 2025年第9期31-37,86,共8页
Text2SQL是自然语言处理科研领域中的一项重要任务,在研究智能问答系统中发挥关键性的作用,其核心任务是将自然语言描述的问题自动转换为SQL查询语句。当前研究重点为提高SQL子句任务的匹配准确率,但忽略了SQL的句法生成的正确性,涉及... Text2SQL是自然语言处理科研领域中的一项重要任务,在研究智能问答系统中发挥关键性的作用,其核心任务是将自然语言描述的问题自动转换为SQL查询语句。当前研究重点为提高SQL子句任务的匹配准确率,但忽略了SQL的句法生成的正确性,涉及多表连接的SQL生成仍存在大量错误。因此,提出一种基于神经网络的Text2SQL方法,该方法通过逆规范化技术,对数据库模式进行重构,关注SQL句法生成的正确性,称为逆规范化网络(Reverse Normalization SQL,RNSQL)。经理论分析和在公共数据集Spider上实验验证,RNSQL能有效提升Text2SQL任务的质量。 展开更多
关键词 逆规范化 语义解析 text2sql 槽填充
在线阅读 下载PDF
基于大语言模型的SQL注入漏洞检测载荷生成方法
2
作者 顾兆军 李丽 隋翯 《信息网络安全》 北大核心 2026年第2期274-290,共17页
针对现有SQL注入漏洞检测方法存在鲁棒性不足以及测试用例缺乏针对性等问题,文章提出一种基于大语言模型的SQL注入漏洞检测载荷生成方法。该方法通过生成针对性的检测载荷实现SQL注入漏洞检测,借助提示工程与DeepSeek-V3模型自动提取和... 针对现有SQL注入漏洞检测方法存在鲁棒性不足以及测试用例缺乏针对性等问题,文章提出一种基于大语言模型的SQL注入漏洞检测载荷生成方法。该方法通过生成针对性的检测载荷实现SQL注入漏洞检测,借助提示工程与DeepSeek-V3模型自动提取和统一构建漏洞特征;利用贡献度对漏洞特征进行分析和选择,构建模型的核心输入;通过将关键特征组织成思维链的形式促进多维度漏洞表征融合,并采用低秩适配技术对Qwen模型进行领域自适应监督微调。实验在多个公开漏洞靶场中验证Qwen模型与SqliGPT、GPT-2-web和SQLMap等模型的性能差异和生成质量,并深入分析DeepSeek-V3模型在复杂SQL注入漏洞数据中的特征提取能力。实验结果表明,Qwen模型的平均检测准确率达到75%以上,比SqliGPT、GPT-2-web和SQLMap模型分别提升49.18%、59.64%和15.19%,且载荷生成质量显著优于现有模型,证明了基于大语言模型生成检测载荷,实现SQL注入漏洞检测方法的有效性与优越性。 展开更多
关键词 大语言模型 sql注入漏洞 代码生成 检测载荷
在线阅读 下载PDF
基于弱监督学习的Text-to-SQL自动生成方法
3
作者 向宁 《无线电通信技术》 北大核心 2025年第3期520-529,共10页
结构化查询语言(Structured Query Language,SQL)生成模型对于非专业人员检索情报至关重要。通常训练SQL生成模型需要使用标注的SQL以及对应的自然语言问题,现有SQL生成模型难以推广到不同的训练数据。根据问题分解半结构化表示(Decompo... 结构化查询语言(Structured Query Language,SQL)生成模型对于非专业人员检索情报至关重要。通常训练SQL生成模型需要使用标注的SQL以及对应的自然语言问题,现有SQL生成模型难以推广到不同的训练数据。根据问题分解半结构化表示(Decomposition Semi-structed Representation,DSR),提出一种基于弱监督学习的Text-to-SQL自动生成方法(Text-to-SQL Automatic Generation Method Based on Weakly Supervised Learning,TS-WSL),给定问题、DSR和执行答案,能够自动合成用于训练Text-to-SQL模型的SQL查询。使用DSR解析器对问题进行解析,通过短语链接、连接路径推理以及SQL映射过程生成候选SQL;使用候选SQL搜索选择最佳的SQL查询;使用生成的SQL数据对T5模型进行训练。在5个基准数据集上进行实验,结果表明所提方法比基于注释SQL数据集上训练的模型更具泛化性,在无域内DSR场景下,仍然可以达到完全监督模型约90%的性能。 展开更多
关键词 结构化查询语言生成模型 分解半结构化表示 弱监督学习 大模型
在线阅读 下载PDF
面向研究生招生咨询的中文Text-to-SQL模型 被引量:1
4
作者 王庆丰 李旭 +1 位作者 姚春龙 程腾腾 《计算机工程》 北大核心 2025年第3期362-368,共7页
研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言... 研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言问题转化为SQL语句后到结构化数据库中查询答案并返回。搜集了研究生招生场景中的高频咨询问题,根据3所高校真实招生数据,构建问题与SQL语句模板,通过填充模板的方式构建数据集,共有训练集1501条、测试集386条。将RESDSQL的RoBERTa模型替换为具有更强多语言生成能力的XLM-RoBERTa模型、T5模型替换为mT5模型,并在目标领域数据集上进行微调,在招生领域问题上取得了较高的准确率,在mT5-large模型上执行正确率为0.95,精确匹配率为1。与基于ChatGPT3.5模型、使用零样本提示的C3SQL方法对比,该模型性能与成本均更优。 展开更多
关键词 中文文本转结构化查询语言 自然语言查询 中文sql语句生成 预训练模型 text-to-sql数据集
在线阅读 下载PDF
基于结构感知与蒙特卡洛树搜索的SQL生成
5
作者 富宇 李浩冉 《计算机技术与发展》 2026年第3期118-123,117,共7页
自然语言到SQL(Text-to-SQL)任务旨在将用户查询映射为可执行的SQL语句,是自然语言与数据库交互的核心技术。当前主流大型语言模型在处理复杂结构、多表关联及嵌套逻辑时,常出现结构错误、语义偏离和执行失败,限制了其可靠性与泛化能力... 自然语言到SQL(Text-to-SQL)任务旨在将用户查询映射为可执行的SQL语句,是自然语言与数据库交互的核心技术。当前主流大型语言模型在处理复杂结构、多表关联及嵌套逻辑时,常出现结构错误、语义偏离和执行失败,限制了其可靠性与泛化能力。为此,该文提出Struct-MCTS,一种基于结构感知与蒙特卡洛树搜索(MCTS)的Text-to-SQL生成框架。该框架通过细粒度结构化动作建模SQL生成过程,并结合多模型并行生成与协同辩论对候选路径进行动态打分,从而提升生成结果的鲁棒性与一致性。在零样本条件下,Struct-MCTS在Spider和BIRD等复杂数据集上表现出领先的执行准确率,显示出强泛化能力与实际应用潜力。 展开更多
关键词 text-to-sql 大语言模型 结构感知 蒙特卡洛树搜索 多模型辩论 零样本学习
在线阅读 下载PDF
基于检索增强Text-to-SQL生成的书目搜索对话问答系统研究
6
作者 王震宇 朱学芳 +2 位作者 张君冬 杨睿 刘崧印 《数据分析与知识发现》 北大核心 2025年第11期165-174,共10页
【目的】针对书目搜索场景中自然语言查询难以准确映射为结构化数据库查询的问题,本文构建对话式问答系统并提出改进方法。【方法】该系统采用模型上下文协议实现大语言模型与外部数据库的无缝集成。在此基础上,针对示例驱动的Text-to-... 【目的】针对书目搜索场景中自然语言查询难以准确映射为结构化数据库查询的问题,本文构建对话式问答系统并提出改进方法。【方法】该系统采用模型上下文协议实现大语言模型与外部数据库的无缝集成。在此基础上,针对示例驱动的Text-to-SQL生成易受噪声与领域差异影响的问题,设计了一种基于对比学习的示例选择策略,通过微调文本嵌入模型,使其更关注查询的句法结构与检索意图,从而提升相似度排序质量。实验基于构建的书目搜索语义解析数据集进行,在零样本与少样本条件下对系统性能进行对比验证。【结果】相较于零样本设置,采用本文方法的DeepSeek-V3模型在5-Shot场景下的SQL执行准确率提高了18.5个百分点,验证了该示例选择策略在专业领域Text-to-SQL任务中的有效性。【局限】由于实验数据集覆盖范围有限,系统对跨领域查询的适应性仍需进一步增强。【结论】研究证明了大语言模型结合对比学习示例选择策略在书目智能搜索场景中的有效性,可为其他垂直领域对话问答系统的构建与优化提供参考。 展开更多
关键词 书目搜索 检索增强生成 text-to-sql 对话问答系统 模型上下文协议
原文传递
一种基于RAG的离线中文Text-to-SQL技术
7
作者 周学文 江荣 +1 位作者 许超俊 秦基尧 《网络安全与数据治理》 2025年第S1期55-59,共5页
在现代数据驱动的决策过程中,数据的重要性不言而喻。有效的数据管理和分析不仅能提升业务效率,还能为策略制定提供科学依据。在众多数据处理领域,自然语言处理与结构化查询语言之间的转换显得尤为重要。针对离线环境下,大语言模型无法... 在现代数据驱动的决策过程中,数据的重要性不言而喻。有效的数据管理和分析不仅能提升业务效率,还能为策略制定提供科学依据。在众多数据处理领域,自然语言处理与结构化查询语言之间的转换显得尤为重要。针对离线环境下,大语言模型无法自动完成模型的更新迭代,这在一定程度上限制了提供精确和详细信息的能力的问题,提出一种基于RAG的离线中文Text-to-SQL技术。首先,根据用户输入自然语言查询请求,通过RAG技术对请求解析,生成结构化信息;其次,根据解析后的信息检索相关的数据库表和字段;最后,通过大语言模型生成精确的SQL查询语句。这一技术的应用,不仅能帮助非专业用户更容易地访问和分析数据,还能够有效提高模型语义理解能力和生成SQL精度,同时防止数据泄露。因此,研究和开发高效的自然语言到SQL的离线处理方法,将对数据分析的普及和应用产生深远的影响。 展开更多
关键词 text-to-sql 离线环境 RAG 自然语言处理 大语言模型
在线阅读 下载PDF
融合GAT与可解释DQN的SQL注入攻击检测模型
8
作者 邓钰洋 芦天亮 +2 位作者 李知皓 孟昊阳 马远声 《信息网络安全》 北大核心 2026年第1期150-167,共18页
随着Web应用的持续演进及数据库驱动系统的广泛部署,SQL注入攻击作为一种高度隐蔽且破坏力强的网络攻击方式,依然是当前Web安全防护的重要研究对象。针对SQL注入语句结构复杂、语义多样以及攻击样本稀缺等问题,文章提出一种融合图结构... 随着Web应用的持续演进及数据库驱动系统的广泛部署,SQL注入攻击作为一种高度隐蔽且破坏力强的网络攻击方式,依然是当前Web安全防护的重要研究对象。针对SQL注入语句结构复杂、语义多样以及攻击样本稀缺等问题,文章提出一种融合图结构建模与强化学习机制的SQL注入攻击检测方法。该方法将SQL语句建模为图结构,通过改进的图注意力网络GAT融合节点与边的语法特征,并构建了包含4个专门化检测专家的多智能体强化学习框架,实现动态集成决策。同时,该检测方法设计了针对SQL注入攻击混淆特点的对抗样本生成模块,增强了模型对复杂变形攻击的识别能力。此外,结合LIME与SHAP方法对检测结果进行可解释性分析,增强系统的透明度与实用性。实验结果表明,该方法在保持较低计算资源消耗的前提下,有效缓解了样本不均衡与攻击模式多样化引起的检测偏差问题。该方法在综合性SQL注入数据集上的检测准确率达0.955,AUC值为0.978,显著优于现有基线方法,为SQL注入攻击的智能化检测提供了有效解决方案。 展开更多
关键词 sql注入攻击检测 图注意力网络 多智能体 DQN 可解释强化学习
在线阅读 下载PDF
基于双向增强和多阶监督的Text2SQL训练语料生成
9
作者 黄浩 《计算机科学与应用》 2025年第7期1-8,共8页
针对Text2SQL任务中训练语料人工标注成本高、场景覆盖有限的问题,本文提出一种基于双向增强与多阶监督的语料生成框架。该方法通过问题到SQL的正向增强与SQL到问题的逆向增强构建双向数据流,结合大语言模型的上下文理解与代码生成能力... 针对Text2SQL任务中训练语料人工标注成本高、场景覆盖有限的问题,本文提出一种基于双向增强与多阶监督的语料生成框架。该方法通过问题到SQL的正向增强与SQL到问题的逆向增强构建双向数据流,结合大语言模型的上下文理解与代码生成能力,创新性地引入四阶段监督审查机制(提问多样性扩充、提问质量审查、SQL自动生成、生成质量审查),极大地提高了低资源条件下训练语料生成的效率与质量。实验表明,该方法生成的语料所训练出来的模型执行准确率相较于传统人工标注语料微调模型提升了16.3%,相较于少样本提示学习方法提升了35.7%。其次,在语料的泛化迁移性方面,本文方法生成的语料对模型尺寸大小和提问难易程度的适应性都高于人工少量标注方式。 展开更多
关键词 双向增强 多阶监督 text2sql 训练语料生成 低语言学习
在线阅读 下载PDF
基于特征融合的SQL注入多分类检测
10
作者 姜珍珍 杨彬彬 薛峰 《合肥工业大学学报(自然科学版)》 北大核心 2026年第2期167-172,193,共7页
SQL注入攻击是一种常见的网络安全威胁,因此检测SQL注入成为网络安全领域的一项重要研究内容。传统SQL注入检测方法存在准确性低、无法确定SQL注入攻击的具体类型等问题,文章提出一种基于特征融合的SQL注入攻击多分类检测方法(feature f... SQL注入攻击是一种常见的网络安全威胁,因此检测SQL注入成为网络安全领域的一项重要研究内容。传统SQL注入检测方法存在准确性低、无法确定SQL注入攻击的具体类型等问题,文章提出一种基于特征融合的SQL注入攻击多分类检测方法(feature fusion-based multi-class SQL injection detection,FMCSID)。实验结果表明,该方法不仅达到了99.99%的准确率,而且能够确定SQL注入攻击的具体类型,为安全人员提供更加具体的SQL注入攻击的描述信息和意图,以制定更有针对性的应对措施,提高网络安全的防护能力。 展开更多
关键词 sql注入检测 网络安全 多分类 特征融合 深度学习 sql标准化
在线阅读 下载PDF
基于知识库的Text-to-SQL准确性提升研究
11
作者 杨梅 王航 拜睿杰 《电脑知识与技术》 2025年第32期85-88,共4页
针对自然语言文本到结构化查询语言转换(Text-to-SQL)在人工智能与大模型飞速发展的背景下取得显著进展,但在领域术语和复杂查询中SQL生成准确性仍有不足的问题,本研究提出一种基于知识库与嵌入模型微调的Text-toSQL改进方法。该方法聚... 针对自然语言文本到结构化查询语言转换(Text-to-SQL)在人工智能与大模型飞速发展的背景下取得显著进展,但在领域术语和复杂查询中SQL生成准确性仍有不足的问题,本研究提出一种基于知识库与嵌入模型微调的Text-toSQL改进方法。该方法聚焦于提升特定领域的泛化能力与知识检索效能,通过构建专有领域知识库,为大模型提供丰富且精准的领域知识支撑,同时对嵌入模型实施针对性微调,以优化知识检索过程中的特征表示与匹配效果。实验表明,该方法能够有效提升SQL生成的准确性,并减少领域术语查询和复杂语句生成时的错误率。 展开更多
关键词 text-to-sql 知识库 嵌入模型 sql生成 自然语言处理
在线阅读 下载PDF
AI-Generated Text Detection:A Comprehensive Review of Active and Passive Approaches
12
作者 Lingyun Xiang Nian Li +1 位作者 Yuling Liu Jiayong Hu 《Computers, Materials & Continua》 2026年第3期201-229,共29页
The rapid advancement of large language models(LLMs)has driven the pervasive adoption of AI-generated content(AIGC),while also raising concerns about misinformation,academic misconduct,biased or harmful content,and ot... The rapid advancement of large language models(LLMs)has driven the pervasive adoption of AI-generated content(AIGC),while also raising concerns about misinformation,academic misconduct,biased or harmful content,and other risks.Detecting AI-generated text has thus become essential to safeguard the authenticity and reliability of digital information.This survey reviews recent progress in detection methods,categorizing approaches into passive and active categories based on their reliance on intrinsic textual features or embedded signals.Passive detection is further divided into surface linguistic feature-based and language model-based methods,whereas active detection encompasses watermarking-based and semantic retrieval-based approaches.This taxonomy enables systematic comparison of methodological differences in model dependency,applicability,and robustness.A key challenge for AI-generated text detection is that existing detectors are highly vulnerable to adversarial attacks,particularly paraphrasing,which substantially compromises their effectiveness.Addressing this gap highlights the need for future research on enhancing robustness and cross-domain generalization.By synthesizing current advances and limitations,this survey provides a structured reference for the field and outlines pathways toward more reliable and scalable detection solutions. 展开更多
关键词 AI-generated text detection large language models text classification WATERMARKING
在线阅读 下载PDF
基于BERT-TextCNN模型的基础研究与应用研究论文分类方法研究
13
作者 张萌萌 钟永恒 刘佳 《科技管理研究》 2026年第1期256-267,共12页
研究旨在构建一种高效且精准的分类模型用于判别单篇论文归属基础研究或应用研究。通过构建融合半自动标注的BERT-TextCNN模型,借助半自动标注策略降低人工标注工作量并提高模型分类效率,利用BERT生成文本向量,通过TextCNN提取关键特征... 研究旨在构建一种高效且精准的分类模型用于判别单篇论文归属基础研究或应用研究。通过构建融合半自动标注的BERT-TextCNN模型,借助半自动标注策略降低人工标注工作量并提高模型分类效率,利用BERT生成文本向量,通过TextCNN提取关键特征;通过文献计量法和BERTopic模型分析量子信息领域的分类结果。结果表明,该模型的F1值高达0.896,相较于BERT和TextCNN分别提升2.1%和7.9%,并显著优于Baichuan4-Turbo、DeepSeek-V3和GLM-4-Plus等大语言模型,F1值提升幅度分别为12.2%、13.1%和18.8%。这既验证了语义表征与局部特征融合机制的优越性,又有效克服了大语言模型在专业领域分类中存在的“高召回低精度”缺陷。将模型应用至量子信息领域,发现基础研究聚焦在量子态与纠缠、离子自旋等方向,应用研究重点关注密钥分发、量子传感与网络组件等研究。研究为科学文献分类提供了新方法,在科研评估与资源优化方面具有重要应用价值。 展开更多
关键词 文献分类 深度学习 半自动标注 文本挖掘 量子信息
在线阅读 下载PDF
Context-Aware Spam Detection Using BERT Embeddings with Multi-Window CNNs
14
作者 Sajid Ali Qazi Mazhar Ul Haq +3 位作者 Ala Saleh Alluhaidan Muhammad Shahid Anwar Sadique Ahmad Leila Jamel 《Computer Modeling in Engineering & Sciences》 2026年第1期1296-1310,共15页
Spam emails remain one of the most persistent threats to digital communication,necessitating effective detection solutions that safeguard both individuals and organisations.We propose a spam email classification frame... Spam emails remain one of the most persistent threats to digital communication,necessitating effective detection solutions that safeguard both individuals and organisations.We propose a spam email classification frame-work that uses Bidirectional Encoder Representations from Transformers(BERT)for contextual feature extraction and a multiple-window Convolutional Neural Network(CNN)for classification.To identify semantic nuances in email content,BERT embeddings are used,and CNN filters extract discriminative n-gram patterns at various levels of detail,enabling accurate spam identification.The proposed model outperformed Word2Vec-based baselines on a sample of 5728 labelled emails,achieving an accuracy of 98.69%,AUC of 0.9981,F1 Score of 0.9724,and MCC of 0.9639.With a medium kernel size of(6,9)and compact multi-window CNN architectures,it improves performance.Cross-validation illustrates stability and generalization across folds.By balancing high recall with minimal false positives,our method provides a reliable and scalable solution for current spam detection in advanced deep learning.By combining contextual embedding and a neural architecture,this study develops a security analysis method. 展开更多
关键词 E-mail spam detection BERT embedding text classification CYBERSECURITY CNN
在线阅读 下载PDF
Research on the Classification of Digital Cultural Texts Based on ASSC-TextRCNN Algorithm
15
作者 Zixuan Guo Houbin Wang +1 位作者 Sameer Kumar Yuanfang Chen 《Computers, Materials & Continua》 2026年第3期2119-2145,共27页
With the rapid development of digital culture,a large number of cultural texts are presented in the form of digital and network.These texts have significant characteristics such as sparsity,real-time and non-standard ... With the rapid development of digital culture,a large number of cultural texts are presented in the form of digital and network.These texts have significant characteristics such as sparsity,real-time and non-standard expression,which bring serious challenges to traditional classification methods.In order to cope with the above problems,this paper proposes a new ASSC(ALBERT,SVD,Self-Attention and Cross-Entropy)-TextRCNN digital cultural text classification model.Based on the framework of TextRCNN,the Albert pre-training language model is introduced to improve the depth and accuracy of semantic embedding.Combined with the dual attention mechanism,the model’s ability to capture and model potential key information in short texts is strengthened.The Singular Value Decomposition(SVD)was used to replace the traditional Max pooling operation,which effectively reduced the feature loss rate and retained more key semantic information.The cross-entropy loss function was used to optimize the prediction results,making the model more robust in class distribution learning.The experimental results indicate that,in the digital cultural text classification task,as compared to the baseline model,the proposed ASSC-TextRCNN method achieves an 11.85%relative improvement in accuracy and an 11.97%relative increase in the F1 score.Meanwhile,the relative error rate decreases by 53.18%.This achievement not only validates the effectiveness and advanced nature of the proposed approach but also offers a novel technical route and methodological underpinnings for the intelligent analysis and dissemination of digital cultural texts.It holds great significance for promoting the in-depth exploration and value realization of digital culture. 展开更多
关键词 text classification natural language processing textRCNN model albert pre-training singular value decomposition cross-entropy loss function
在线阅读 下载PDF
基于SQL的民营医院科室绩效计算与分析
16
作者 石晓宇 张晓斌 《通讯世界》 2026年第1期172-174,共3页
为解决医院科室架构重组、业务流程优化、评价规则迭代导致医院绩效系统难以适配医院业务的问题,以某二甲民营医院为例,针对绩效动态响应式计算展开研究,提出一种基于结构化查询语言(structured query language,SQL)的医院科室绩效计算... 为解决医院科室架构重组、业务流程优化、评价规则迭代导致医院绩效系统难以适配医院业务的问题,以某二甲民营医院为例,针对绩效动态响应式计算展开研究,提出一种基于结构化查询语言(structured query language,SQL)的医院科室绩效计算方法。该方法可深度挖掘SQL的动态扩展能力,围绕医院科室绩效评价指标与计算公式的既定规则,通过SQL语句实现数据提取、指标计算等核心操作,并依托数据库临时表技术完成绩效计算结果的入库存储,保障绩效数据计算过程的落地实施,可为相关人员提供参考。 展开更多
关键词 sql 医院科室绩效 动态计算 过程追溯
暂未订购
浅谈如何使用SQL中的image和text数据 被引量:1
17
作者 陈晓男 《电脑知识与技术》 2006年第5期123-124,共2页
SQL中的image和text类型的数据带给用户很多便利。但具体使用时常常会遇到许多问题,那幺该如何解决呢,我们可以用两个命令提示待下的命令bcp和textcopy来解决。
关键词 sql 数据 IMAGE text命令 bcp textcopy
在线阅读 下载PDF
SQL Server中text/image类型数据的使用
18
作者 兰丽辉 《电脑知识与技术(过刊)》 2007年第14期313-,315,共2页
使用MS SQL Server进行数据库软件开发时,对于text和image类型的数据在进行存取操作时,有别与其他数据类型.结合应用实例介绍了通过Transact-SQL语句、API函数、sp_tableoption存储过程、bcp命令、textcopy命令等几种常用的方法使用text... 使用MS SQL Server进行数据库软件开发时,对于text和image类型的数据在进行存取操作时,有别与其他数据类型.结合应用实例介绍了通过Transact-SQL语句、API函数、sp_tableoption存储过程、bcp命令、textcopy命令等几种常用的方法使用text/image类型数据. 展开更多
关键词 MS sql SERVER text/image TRANSACT-sql API函数
在线阅读 下载PDF
面向跨域自然语言生成SQL语句的超图神经网络
19
作者 郝志峰 黎阳霖 +1 位作者 许柏炎 蔡瑞初 《计算机工程》 北大核心 2025年第5期114-123,共10页
近年来,图神经网络(GNN)广泛-应用于跨域自然语言生成结构化查询语言(SQL)语句(Text-to-SQL)的编码器。基于GNN的编码过程通过捕获数据库架构和自然语言问题之间的关联信息,大幅提高生成模型在跨域SQL语句生成下的泛化性。现有的GNN方... 近年来,图神经网络(GNN)广泛-应用于跨域自然语言生成结构化查询语言(SQL)语句(Text-to-SQL)的编码器。基于GNN的编码过程通过捕获数据库架构和自然语言问题之间的关联信息,大幅提高生成模型在跨域SQL语句生成下的泛化性。现有的GNN方法在异构图结构编码学习过程中存在缺陷,以节点为中心进行数据库架构和自然语言问题的链接预测,在复杂语义场景下容易出现错配。针对这一问题,提出一种面向跨域Text-to-SQL的异构图学习框架。框架针对异构图以边为中心学习的过程提出关系边子图构建和边超图注意力网络,有效学习异构图中关系边与节点的差异化结构特征,实现复杂语义场景下SQL语句正确生成。为验证所提框架的有效性,在多个跨域Text-to-SQL数据集上进行充分实验对比。结果表明,相较于基线,该框架在F1值和完全匹配准确率(EMA)指标上均取得显著提升,且在复杂跨域场景下具有更强的泛化性。 展开更多
关键词 自然语言处理 自然语言生成sql语句解析 深度学习 图构建 图神经网络
在线阅读 下载PDF
一种利用词典扩展数据库模式信息的Text2SQL方法 被引量:1
20
作者 于晓昕 何东 +2 位作者 叶子铭 陈黎 于中华 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期78-88,共11页
现有Text2SQL方法严重依赖表名和列名在自然语言查询中的显式提及,在同物异名的实际应用场景中准确率急剧下降.此外,这些方法仅仅依赖数据库模式捕捉数据库建模的领域知识,而数据库模式作为结构化的元数据,其表达领域知识的能力是非常... 现有Text2SQL方法严重依赖表名和列名在自然语言查询中的显式提及,在同物异名的实际应用场景中准确率急剧下降.此外,这些方法仅仅依赖数据库模式捕捉数据库建模的领域知识,而数据库模式作为结构化的元数据,其表达领域知识的能力是非常有限的,即使有经验的程序员也很难仅从数据库模式完全领会该数据库建模的领域知识,因此程序员必须依赖详细的数据库设计文档才能构造SQL语句以正确地表达特定的查询.为此,本文提出一种利用词典扩展数据库模式信息的Text2SQL方法,该方法从数据库表名和列名解析出其中的单词或短语,查询词典获取这些单词或短语的语义解释,将这些解释看成是相应表名或列名的扩展内容,与表名、列名及其他数据库模式信息(主键、外键等)相结合,作为模型的输入,从而使模型能够更全面地学习数据库建模的应用领域知识.在Spider-syn和Spider数据集上进行的实验说明了所提出方法的有效性,即使自然语言查询中使用的表名和列名与数据库模式中对应的表名和列名完全不同,本文方法也能够得到较好的SQL翻译结果,明显优于最新提出的抗同义词替换攻击的方法. 展开更多
关键词 数据库模式 语义扩展 解释信息 text2sql
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部