在智慧城市发展进程中,交通系统的精细化管理和智能化服务面临海量异构数据处理的挑战。传统交通信息查询系统存在数据源异构性强、自然语言交互能力不足、长尾查询场景覆盖有限等问题。文章基于ChatGLM3大语言模型,创新性地构建了融合N...在智慧城市发展进程中,交通系统的精细化管理和智能化服务面临海量异构数据处理的挑战。传统交通信息查询系统存在数据源异构性强、自然语言交互能力不足、长尾查询场景覆盖有限等问题。文章基于ChatGLM3大语言模型,创新性地构建了融合NL2SQL(Natural Language to Structured Query Language)技术的智能问数系统,通过动态Schema对齐、LoRA微调优化及多维度提示工程技术,实现了交通领域复杂自然语言查询到精准SQL指令的智能转换。实验结果表明,经过微调的模型在交通信息查询任务中准确率达到78.9%,较基线模型提升15.8个百分点。本研究为交通管理智能化转型提供了创新技术路径,并对大模型在垂直领域的深度适配进行了系统性探索。展开更多
为解决电网业务数据的智能交互查询,降低数据查询成本,提高电网数据利用率等问题,文章提出基于BERT(bidirectional encoder representations from transformer)模型的NL2SQL(natural language to SQL)算法,拟实现电力数据的智能交互、...为解决电网业务数据的智能交互查询,降低数据查询成本,提高电网数据利用率等问题,文章提出基于BERT(bidirectional encoder representations from transformer)模型的NL2SQL(natural language to SQL)算法,拟实现电力数据的智能交互、提升服务质量、加快电网数据资产变现。该研究可以实现用户通过输入拟查询的问句,经BERT模型词嵌入后,利用Text2Sql技术将BERT模型的处理结果转化为SQL语句,实现从数据库中查询到所需要的信息。文章构建了NL2SQL模型和算法训练,实验结果表明该方法的可行性和易用性。该方法能够帮助移动作业人员便捷查询数据,快速找到结构化的电力数据信息,辅助经营管理者决策分析,为各层级业务研究人员节省查询成本,加快电力数据资产变现。展开更多
面对海量的兵棋数据,传统界面查询的方式已经无法满足指挥员快速、全面、精准查询数据的要求。通过深入分析兵棋数据特点与主流NL2SQL(natural language to struct query language)模型的缺陷,提出了一套适合兵棋数据智能统计查询的解...面对海量的兵棋数据,传统界面查询的方式已经无法满足指挥员快速、全面、精准查询数据的要求。通过深入分析兵棋数据特点与主流NL2SQL(natural language to struct query language)模型的缺陷,提出了一套适合兵棋数据智能统计查询的解决方案。针对领域数据集缺乏,提出了一套基于人机协助、动态迭代的兵棋数据集构建方案;针对兵棋查询问句时间敏感的问题,提出了一套“规则+深度学习”的时间表达式识别与规范方法;针对兵棋数据量大提取查询值困难的问题,修改完善了Bridge模型的值提取与SQL生成架构。综合运用以上方案,使兵棋数据查询的精准匹配准确率达到75%以上。展开更多
自然语言转换结构化查询语言(NL2SQL)能降低非专业人员操作数据库的技术门槛,从而提升用户体验和工作效率。此外,检索增强生成(RAG)技术可以通过引入外部知识库提升NL2SQL的性能。针对目前RAG在NL2SQL应用中存在的检索策略漏检率高和召...自然语言转换结构化查询语言(NL2SQL)能降低非专业人员操作数据库的技术门槛,从而提升用户体验和工作效率。此外,检索增强生成(RAG)技术可以通过引入外部知识库提升NL2SQL的性能。针对目前RAG在NL2SQL应用中存在的检索策略漏检率高和召回上下文的相关性不强等问题,提出一种分序检索重排序RAG(RAG-SRR)方法优化知识库构建、检索召回策略和提示词设计等环节。首先,从问答对、专业名词和数据库结构这3个方面进行领域知识库的构建:问答对根据文物艺术品拍卖监管的高频处理和查询的问题构建,专业名词根据拍卖行业标准构建,而数据库结构根据雅昌艺术拍卖网的数据构建;其次,在检索阶段采取分序检索的策略,并对3类知识库设置不同的优先级,且在召回阶段重排序检索的信息;最后,在提示词设计中给出提示词优化设计的原则及提示词模板。实验结果表明:在领域数据集、Spider数据集上,RAG-SRR方法与基于BERT(Bidirectional Encoder Representations from Transformers)模型和RESDSQL(Ranking-enhanced Encoding plus a Skeleton-aware Decoding framework for text-to-SQL)模型的方法的执行准确率分别至少提高了19.50、24.20和12.17、8.90个百分点。而在相同大语言模型下,RAG-SRR方法比未优化的RAG方法的执行准确率分别至少提高了12.83和15.60个百分点,与C3SQL方法相比,执行准确率分别至少提高了1.50和3.10个百分点。在使用Llama3.1-8B时,与DIN-SQL方法相比,执行准确率在中文语料数据集中提升0.30个百分点,在英文语料数据集中最多相差3.90个百分点;但在使用Qwen2.5-7B时,执行准确率分别提高1.60和4.10个百分点。可见,RAG-SRR方法具备较强的实用性和可移植性。展开更多
目前医院财务领域亟需一种能够高效、准确理解自然语言查询,并智能检索复杂财务数据的专业化解决方案,以支持决策和提升管理效率。针对医院财务数据检索中自然语言到结构化查询语言(Natural Language to SQL,NL2SQL)的挑战,文章提出了...目前医院财务领域亟需一种能够高效、准确理解自然语言查询,并智能检索复杂财务数据的专业化解决方案,以支持决策和提升管理效率。针对医院财务数据检索中自然语言到结构化查询语言(Natural Language to SQL,NL2SQL)的挑战,文章提出了一种结合大语言模型的医院财务数据智能检索方法。首先,基于医院财务业务场景构建数据集,为模型训练提供了基础支持,并通过应用思维链策略扩展数据集,提升其覆盖范围和多样性。随后,采用低秩适应(LoRA)算法,进一步优化模型在医院财务数据检索任务中的表现。实验结果表明,该方法在医院私有财务数据的检索准确率上相比现有主流模型BERT提升了20.5%,充分展示了该方法在医院财务数据智能检索中的应用价值与优越性。展开更多
文摘在智慧城市发展进程中,交通系统的精细化管理和智能化服务面临海量异构数据处理的挑战。传统交通信息查询系统存在数据源异构性强、自然语言交互能力不足、长尾查询场景覆盖有限等问题。文章基于ChatGLM3大语言模型,创新性地构建了融合NL2SQL(Natural Language to Structured Query Language)技术的智能问数系统,通过动态Schema对齐、LoRA微调优化及多维度提示工程技术,实现了交通领域复杂自然语言查询到精准SQL指令的智能转换。实验结果表明,经过微调的模型在交通信息查询任务中准确率达到78.9%,较基线模型提升15.8个百分点。本研究为交通管理智能化转型提供了创新技术路径,并对大模型在垂直领域的深度适配进行了系统性探索。
文摘为解决电网业务数据的智能交互查询,降低数据查询成本,提高电网数据利用率等问题,文章提出基于BERT(bidirectional encoder representations from transformer)模型的NL2SQL(natural language to SQL)算法,拟实现电力数据的智能交互、提升服务质量、加快电网数据资产变现。该研究可以实现用户通过输入拟查询的问句,经BERT模型词嵌入后,利用Text2Sql技术将BERT模型的处理结果转化为SQL语句,实现从数据库中查询到所需要的信息。文章构建了NL2SQL模型和算法训练,实验结果表明该方法的可行性和易用性。该方法能够帮助移动作业人员便捷查询数据,快速找到结构化的电力数据信息,辅助经营管理者决策分析,为各层级业务研究人员节省查询成本,加快电力数据资产变现。
文摘面对海量的兵棋数据,传统界面查询的方式已经无法满足指挥员快速、全面、精准查询数据的要求。通过深入分析兵棋数据特点与主流NL2SQL(natural language to struct query language)模型的缺陷,提出了一套适合兵棋数据智能统计查询的解决方案。针对领域数据集缺乏,提出了一套基于人机协助、动态迭代的兵棋数据集构建方案;针对兵棋查询问句时间敏感的问题,提出了一套“规则+深度学习”的时间表达式识别与规范方法;针对兵棋数据量大提取查询值困难的问题,修改完善了Bridge模型的值提取与SQL生成架构。综合运用以上方案,使兵棋数据查询的精准匹配准确率达到75%以上。
文摘自然语言转换结构化查询语言(NL2SQL)能降低非专业人员操作数据库的技术门槛,从而提升用户体验和工作效率。此外,检索增强生成(RAG)技术可以通过引入外部知识库提升NL2SQL的性能。针对目前RAG在NL2SQL应用中存在的检索策略漏检率高和召回上下文的相关性不强等问题,提出一种分序检索重排序RAG(RAG-SRR)方法优化知识库构建、检索召回策略和提示词设计等环节。首先,从问答对、专业名词和数据库结构这3个方面进行领域知识库的构建:问答对根据文物艺术品拍卖监管的高频处理和查询的问题构建,专业名词根据拍卖行业标准构建,而数据库结构根据雅昌艺术拍卖网的数据构建;其次,在检索阶段采取分序检索的策略,并对3类知识库设置不同的优先级,且在召回阶段重排序检索的信息;最后,在提示词设计中给出提示词优化设计的原则及提示词模板。实验结果表明:在领域数据集、Spider数据集上,RAG-SRR方法与基于BERT(Bidirectional Encoder Representations from Transformers)模型和RESDSQL(Ranking-enhanced Encoding plus a Skeleton-aware Decoding framework for text-to-SQL)模型的方法的执行准确率分别至少提高了19.50、24.20和12.17、8.90个百分点。而在相同大语言模型下,RAG-SRR方法比未优化的RAG方法的执行准确率分别至少提高了12.83和15.60个百分点,与C3SQL方法相比,执行准确率分别至少提高了1.50和3.10个百分点。在使用Llama3.1-8B时,与DIN-SQL方法相比,执行准确率在中文语料数据集中提升0.30个百分点,在英文语料数据集中最多相差3.90个百分点;但在使用Qwen2.5-7B时,执行准确率分别提高1.60和4.10个百分点。可见,RAG-SRR方法具备较强的实用性和可移植性。
文摘目前医院财务领域亟需一种能够高效、准确理解自然语言查询,并智能检索复杂财务数据的专业化解决方案,以支持决策和提升管理效率。针对医院财务数据检索中自然语言到结构化查询语言(Natural Language to SQL,NL2SQL)的挑战,文章提出了一种结合大语言模型的医院财务数据智能检索方法。首先,基于医院财务业务场景构建数据集,为模型训练提供了基础支持,并通过应用思维链策略扩展数据集,提升其覆盖范围和多样性。随后,采用低秩适应(LoRA)算法,进一步优化模型在医院财务数据检索任务中的表现。实验结果表明,该方法在医院私有财务数据的检索准确率上相比现有主流模型BERT提升了20.5%,充分展示了该方法在医院财务数据智能检索中的应用价值与优越性。