为解决电网业务数据的智能交互查询,降低数据查询成本,提高电网数据利用率等问题,文章提出基于BERT(bidirectional encoder representations from transformer)模型的NL2SQL(natural language to SQL)算法,拟实现电力数据的智能交互、...为解决电网业务数据的智能交互查询,降低数据查询成本,提高电网数据利用率等问题,文章提出基于BERT(bidirectional encoder representations from transformer)模型的NL2SQL(natural language to SQL)算法,拟实现电力数据的智能交互、提升服务质量、加快电网数据资产变现。该研究可以实现用户通过输入拟查询的问句,经BERT模型词嵌入后,利用Text2Sql技术将BERT模型的处理结果转化为SQL语句,实现从数据库中查询到所需要的信息。文章构建了NL2SQL模型和算法训练,实验结果表明该方法的可行性和易用性。该方法能够帮助移动作业人员便捷查询数据,快速找到结构化的电力数据信息,辅助经营管理者决策分析,为各层级业务研究人员节省查询成本,加快电力数据资产变现。展开更多
为解决铁路编组站工作人员难以快速查询生产数据和规章制度的问题,基于国产大模型DeepSeek-R1,设计了一套编组站智询系统。通过本地化私有部署DeepSeek-R1并将其与编组站综合自动化系统(CIPS,Computer Integrated Process System)安全集...为解决铁路编组站工作人员难以快速查询生产数据和规章制度的问题,基于国产大模型DeepSeek-R1,设计了一套编组站智询系统。通过本地化私有部署DeepSeek-R1并将其与编组站综合自动化系统(CIPS,Computer Integrated Process System)安全集成,结合分层智能体架构、混合检索及NL2SQL(Natural Language to Structured Query Language)技术,构建了自然语言交互式服务,支持工作人员实时获取列车状态、调车计划等生产数据及规章知识。应用表明,该系统能够准确回答用户提出的问题,为铁路货运智能化提供技术支撑。展开更多
自然语言转换结构化查询语言(NL2SQL)能降低非专业人员操作数据库的技术门槛,从而提升用户体验和工作效率。此外,检索增强生成(RAG)技术可以通过引入外部知识库提升NL2SQL的性能。针对目前RAG在NL2SQL应用中存在的检索策略漏检率高和召...自然语言转换结构化查询语言(NL2SQL)能降低非专业人员操作数据库的技术门槛,从而提升用户体验和工作效率。此外,检索增强生成(RAG)技术可以通过引入外部知识库提升NL2SQL的性能。针对目前RAG在NL2SQL应用中存在的检索策略漏检率高和召回上下文的相关性不强等问题,提出一种分序检索重排序RAG(RAG-SRR)方法优化知识库构建、检索召回策略和提示词设计等环节。首先,从问答对、专业名词和数据库结构这3个方面进行领域知识库的构建:问答对根据文物艺术品拍卖监管的高频处理和查询的问题构建,专业名词根据拍卖行业标准构建,而数据库结构根据雅昌艺术拍卖网的数据构建;其次,在检索阶段采取分序检索的策略,并对3类知识库设置不同的优先级,且在召回阶段重排序检索的信息;最后,在提示词设计中给出提示词优化设计的原则及提示词模板。实验结果表明:在领域数据集、Spider数据集上,RAG-SRR方法与基于BERT(Bidirectional Encoder Representations from Transformers)模型和RESDSQL(Ranking-enhanced Encoding plus a Skeleton-aware Decoding framework for text-to-SQL)模型的方法的执行准确率分别至少提高了19.50、24.20和12.17、8.90个百分点。而在相同大语言模型下,RAG-SRR方法比未优化的RAG方法的执行准确率分别至少提高了12.83和15.60个百分点,与C3SQL方法相比,执行准确率分别至少提高了1.50和3.10个百分点。在使用Llama3.1-8B时,与DIN-SQL方法相比,执行准确率在中文语料数据集中提升0.30个百分点,在英文语料数据集中最多相差3.90个百分点;但在使用Qwen2.5-7B时,执行准确率分别提高1.60和4.10个百分点。可见,RAG-SRR方法具备较强的实用性和可移植性。展开更多
文摘为解决电网业务数据的智能交互查询,降低数据查询成本,提高电网数据利用率等问题,文章提出基于BERT(bidirectional encoder representations from transformer)模型的NL2SQL(natural language to SQL)算法,拟实现电力数据的智能交互、提升服务质量、加快电网数据资产变现。该研究可以实现用户通过输入拟查询的问句,经BERT模型词嵌入后,利用Text2Sql技术将BERT模型的处理结果转化为SQL语句,实现从数据库中查询到所需要的信息。文章构建了NL2SQL模型和算法训练,实验结果表明该方法的可行性和易用性。该方法能够帮助移动作业人员便捷查询数据,快速找到结构化的电力数据信息,辅助经营管理者决策分析,为各层级业务研究人员节省查询成本,加快电力数据资产变现。
文摘为解决铁路编组站工作人员难以快速查询生产数据和规章制度的问题,基于国产大模型DeepSeek-R1,设计了一套编组站智询系统。通过本地化私有部署DeepSeek-R1并将其与编组站综合自动化系统(CIPS,Computer Integrated Process System)安全集成,结合分层智能体架构、混合检索及NL2SQL(Natural Language to Structured Query Language)技术,构建了自然语言交互式服务,支持工作人员实时获取列车状态、调车计划等生产数据及规章知识。应用表明,该系统能够准确回答用户提出的问题,为铁路货运智能化提供技术支撑。
文摘自然语言转换结构化查询语言(NL2SQL)能降低非专业人员操作数据库的技术门槛,从而提升用户体验和工作效率。此外,检索增强生成(RAG)技术可以通过引入外部知识库提升NL2SQL的性能。针对目前RAG在NL2SQL应用中存在的检索策略漏检率高和召回上下文的相关性不强等问题,提出一种分序检索重排序RAG(RAG-SRR)方法优化知识库构建、检索召回策略和提示词设计等环节。首先,从问答对、专业名词和数据库结构这3个方面进行领域知识库的构建:问答对根据文物艺术品拍卖监管的高频处理和查询的问题构建,专业名词根据拍卖行业标准构建,而数据库结构根据雅昌艺术拍卖网的数据构建;其次,在检索阶段采取分序检索的策略,并对3类知识库设置不同的优先级,且在召回阶段重排序检索的信息;最后,在提示词设计中给出提示词优化设计的原则及提示词模板。实验结果表明:在领域数据集、Spider数据集上,RAG-SRR方法与基于BERT(Bidirectional Encoder Representations from Transformers)模型和RESDSQL(Ranking-enhanced Encoding plus a Skeleton-aware Decoding framework for text-to-SQL)模型的方法的执行准确率分别至少提高了19.50、24.20和12.17、8.90个百分点。而在相同大语言模型下,RAG-SRR方法比未优化的RAG方法的执行准确率分别至少提高了12.83和15.60个百分点,与C3SQL方法相比,执行准确率分别至少提高了1.50和3.10个百分点。在使用Llama3.1-8B时,与DIN-SQL方法相比,执行准确率在中文语料数据集中提升0.30个百分点,在英文语料数据集中最多相差3.90个百分点;但在使用Qwen2.5-7B时,执行准确率分别提高1.60和4.10个百分点。可见,RAG-SRR方法具备较强的实用性和可移植性。
文摘为适应问答系统智能化程度越来越高的特点,提出基于自然语言处理转化为SQL(Structured Query Language,结构化查询语言)语言技术的政务智能搜索引擎系统。用户通过输入自然语言问题直接获得相关数据,数据可以表格、图形等方式直观地显示。建立了融合SQL语法和增强列信息的算法模型SQL Model,利用NL2SQL(Natural Language Processing to Structured Query Language,自然语言转化为结构化查询语言)技术设计政务智能搜索引擎系统,并以某市的人口数据进行实验。实验结果表明,该技术可有效降低数据应用的复杂度,实现多维度复杂查询,降低业务部门数据搜索应用难度,提高政务数据搜索效率。