期刊文献+
共找到145篇文章
< 1 2 8 >
每页显示 20 50 100
基于关键句和题型的阅读理解问题生成技术研究
1
作者 蒋玉茹 陶宇阳 +1 位作者 王霞 葛诗利 《计算机工程与应用》 北大核心 2025年第12期141-153,共13页
现有的阅读理解问题生成技术研究主要以答案已知为前提展开。为了使阅读理解问题生成技术可以摆脱对答案的依赖,从而促使教育领域的问题生成技术向着端到端自动化出题的应用场景进一步迈进,对答案未知前提下的阅读理解问题生成技术展开... 现有的阅读理解问题生成技术研究主要以答案已知为前提展开。为了使阅读理解问题生成技术可以摆脱对答案的依赖,从而促使教育领域的问题生成技术向着端到端自动化出题的应用场景进一步迈进,对答案未知前提下的阅读理解问题生成技术展开了研究。提出引入关键句和题型作为两种简单的控制信息,替代需要从文章中抽取总结的答案,规定问题的提问内容范围和提问特点。提出了一个基于关键句和题型信息的可控问题生成框架,通过给定文章、关键句和题型来生成阅读理解问题。通过自动化评测和人工评测,验证了框架包含的两种问题生成方法的有效性和先进性。框架所需的两种控制信息相比答案更容易获取,为问题生成技术的应用带来更好的易用性,为使用者提供更高的出题效率。 展开更多
关键词 英语阅读理解 问题生成 文本生成
在线阅读 下载PDF
新高考文学类文本阅读命题与学情研究——基于2020—2025年全国卷试题及学生答卷调研数据反馈
2
作者 桑哲 《齐鲁师范学院学报》 2025年第5期73-80,共8页
本文聚焦2020—2025年新高考文学类文本阅读试题,对全国卷(含新高考Ⅰ卷、Ⅱ卷及全国甲卷、乙卷)进行全景分析。从考查目标看,各卷均围绕“语言建构与运用”“审美鉴赏与创造”“文化传承与理解”展开,新高考卷侧重语言动态生成与跨文... 本文聚焦2020—2025年新高考文学类文本阅读试题,对全国卷(含新高考Ⅰ卷、Ⅱ卷及全国甲卷、乙卷)进行全景分析。从考查目标看,各卷均围绕“语言建构与运用”“审美鉴赏与创造”“文化传承与理解”展开,新高考卷侧重语言动态生成与跨文本关联,全国卷注重文本与生活、文化的直接勾连。题型结构上,新高考卷稳定为4小题(16-18分),全国卷多为3小题(15分)。选文以小说为主(新高考卷占比80%),兼顾散文与主辅文本组合,涵盖经典重释、地域文化、现实关怀等主题。通过学情分析发现,学生在“文本互证”“价值思辨”及细节解读、逻辑链条构建等方面存在短板。未来命题将强化跨文本互证、文化精神解码与现实关怀的微观叙事,备考需聚焦细节勾连、逻辑训练与文化反思。 展开更多
关键词 新高考 文学类文本阅读 试题分析 命题趋势 备考策略
在线阅读 下载PDF
基于正负例思维链的表格-文本混合金融数据自动问答方法
3
作者 李希 刘喜平 +3 位作者 舒晴 谭钊 万常选 刘德喜 《中文信息学报》 北大核心 2025年第7期102-113,共12页
金融领域表格-文本混合数据的自动问答面临复杂数值推理等挑战。针对这一挑战,该文提出了正负例思维链方法。思维链技术通过选取演示样本,搭配提示指令,能有效提升大语言模型的多步骤推理能力。但思维链的演示样本多为人工制作,费时费力... 金融领域表格-文本混合数据的自动问答面临复杂数值推理等挑战。针对这一挑战,该文提出了正负例思维链方法。思维链技术通过选取演示样本,搭配提示指令,能有效提升大语言模型的多步骤推理能力。但思维链的演示样本多为人工制作,费时费力,且影响大模型推理。受正例和负例对学习效果影响的启发,该文从大模型的推理结果中抽取样本,构建正例样本池和负例样本池。采用静态和动态相结合的策略选取不同类型的演示样本:选择最佳正例能够保障大语言模型输出的准确率,选择相似负例能够指导大语言模型规避错误推理。实验结果显示,该方法在FinQA数据集上的准确率提高了3.6%,在FinQA-fix数据集上的准确率提高了12.73%,显著提升了大模型的数值推理能力。 展开更多
关键词 思维链 正负例 表文混合问答 大语言模型 数值推理
在线阅读 下载PDF
基于多模态特征增强的场景文本视觉问答
4
作者 崔瑞雪 王旭智 +2 位作者 万旺根 孙学涛 张振 《工业控制计算机》 2025年第6期12-14,共3页
基于文本的视觉问答(TextVQA)通过阅读给定图像中的文本来回答与文本相关的问题。传统的视觉问答方法只关注图像中的视觉物体而忽略了图像中的文本信息,在回答有关图像文本的问题时效果会大大降低。为了更加充分地利用图像中的多模态信... 基于文本的视觉问答(TextVQA)通过阅读给定图像中的文本来回答与文本相关的问题。传统的视觉问答方法只关注图像中的视觉物体而忽略了图像中的文本信息,在回答有关图像文本的问题时效果会大大降低。为了更加充分地利用图像中的多模态信息,增强模型对场景的理解和推理能力,在SSBaseline模型的基础上使用了CLIP模型来丰富图像和OCR文本特征,并通过增加注意力模块来增强不同模态信息的融合。最后在TextVQA和ST-VQA数据集上的实验结果表明,所提方法有效提升了模型的推理能力。 展开更多
关键词 文本视觉问答 文本识别 多模态特征融合
在线阅读 下载PDF
面向军事领域知识问答系统的多策略检索增强生成方法 被引量:6
5
作者 张艳萍 陈梅芳 +4 位作者 田昌海 易子博 胡文鹏 罗威 罗准辰 《计算机应用》 北大核心 2025年第3期746-754,共9页
基于检索增强生成(RAG)的军事领域知识问答系统已经逐渐成为现代情报人员收集和分析情报的重要工具。针对目前RAG方法的应用策略中的混合检索存在可移植性不强以及非必要使用查询改写容易诱发语义漂移的问题,提出一种多策略检索增强生成... 基于检索增强生成(RAG)的军事领域知识问答系统已经逐渐成为现代情报人员收集和分析情报的重要工具。针对目前RAG方法的应用策略中的混合检索存在可移植性不强以及非必要使用查询改写容易诱发语义漂移的问题,提出一种多策略检索增强生成(MSRAG)方法。首先,根据用户输入的查询特点自适应地匹配检索模型来召回相关文本;其次,利用文本过滤器提取出能够回答问题的关键文本片段;再次,使用文本过滤器进行内容有效性判断以启动基于同义词拓展的查询改写,并将初始查询与改写后的信息合并输入检索控制器以进行更有针对性的再次检索;最后,合并能够回答问题的关键文本片段和问题,并使用提示工程输入生成答案模型来生成响应返回给用户。实验结果表明,MSRAG方法在军事领域数据集(Military)和Medical数据集的ROUGE-L(Recall-Oriented Understudy for Gisting Evaluation Longest common subsequence)指标上相较于凸线性组合RAG方法分别提高了14.35和5.83个百分点。可见,MSRAG方法具备较强的通用性和可移植性,能够缓解非必要查询改写导致的语义漂移现象,有效帮助大模型生成更准确的答案。 展开更多
关键词 检索增强生成 军事知识问答 信息检索 文本过滤 查询改写
在线阅读 下载PDF
课堂高阶问题的特征识别与设计策略优化--基于文本语料库循证的方法 被引量:1
6
作者 曲茜茜 刘晓楠 +1 位作者 解月光 武晓旋 《电化教育研究》 北大核心 2025年第5期94-102,共9页
思维的深度发展是创新型人才培养之路的应有之义。学源于思,思源于疑,开展高阶思维教学的课堂当以高阶问题为动力,以思维对话为载体。研究聚焦于课堂中的高阶问题,依循数据—证据—行动的循证实践与跃迁过程,基于一定的筛选标准与方法,... 思维的深度发展是创新型人才培养之路的应有之义。学源于思,思源于疑,开展高阶思维教学的课堂当以高阶问题为动力,以思维对话为载体。研究聚焦于课堂中的高阶问题,依循数据—证据—行动的循证实践与跃迁过程,基于一定的筛选标准与方法,历经样本筛选、问题提取、标注与存储等流程,从纵向追踪的5000余份教案文本中筛选出1055份教案文本及3042条高阶问题数据并建立文本语料库,采用质性分析方法通过开放性编码、主轴性编码、选择性编码等证据创制的实证分析过程,识别出包括目标、认知、内容与类型在内的高阶问题四维特征及其关系框架,并依据循证结果,提出高阶问题设计策略的优化方案,为提升教师高阶问题设计能力提供理论支持和实践指导。 展开更多
关键词 高阶问题 教案 文本语料库 循证 特征识别 策略优化
在线阅读 下载PDF
问句意图理解与识别技术研究进展
7
作者 韦婷婷 葛晓月 +1 位作者 宋世领 熊俊涛 《计算机应用与软件》 北大核心 2025年第9期9-17,共9页
问句意图理解与识别是问答和对话系统的重要组成部分,包含上下文语义理解及意图分类子任务。尽管问句意图理解和识别任务已取得大量研究成果,但是目前仍缺少相关系统性的回顾与总结的研究工作。因此,梳理近些年的研究,从问句意图理解与... 问句意图理解与识别是问答和对话系统的重要组成部分,包含上下文语义理解及意图分类子任务。尽管问句意图理解和识别任务已取得大量研究成果,但是目前仍缺少相关系统性的回顾与总结的研究工作。因此,梳理近些年的研究,从问句意图理解与识别的概念出发,介绍其研究目的与意义,总结归纳评测方法与数据来源,刻画方法间的代际差异,并重点阐述目前流行的深度学习方法在问句意图理解与识别上的研究现状,探讨其在未来潜在的发展方向。 展开更多
关键词 问答系统 问句意图理解与识别 文本分类 深度学习
在线阅读 下载PDF
多粒度单元格对比的文本和表格数值问答模型
8
作者 琚江舟 毛云麟 +3 位作者 吴震 陈宇飞 戴新宇 陈家骏 《软件学报》 北大核心 2025年第5期2167-2187,共21页
在文本和表格的数值问答任务中,模型需要在给定的文本和表格下进行数值推理.任务目标是生成一个包含多步数值计算的计算程序,并将计算程序结果作为问题的答案.为了建模文本和表格,当前工作通过模板将表格线性化为一系列单元格句子,再基... 在文本和表格的数值问答任务中,模型需要在给定的文本和表格下进行数值推理.任务目标是生成一个包含多步数值计算的计算程序,并将计算程序结果作为问题的答案.为了建模文本和表格,当前工作通过模板将表格线性化为一系列单元格句子,再基于文本和单元格句子设计生成器以产生计算程序.然而,这种方法面临一个特定问题:由模板生成的单元格句子间差异微小,生成器难以区分回答问题所必需的单元格句子(支撑单元格句子)和回答问题无关的单元格句子(干扰单元格句子),最终导致模型基于干扰单元格句子生成错误的计算程序.为了解决这个问题,在生成器上设计一个多粒度单元格语义对比方法,其主要目的是增加支撑单元格句子和干扰单元格句子表示距离,进而帮助生成器区分它们.这个方法由粗粒度单元格语义对比和细粒度单元格语义构成元素对比(包括行名对比,列名对比及单元格数值对比)共同构成.实验结果验证所提出的多粒度单元格语义对比方法可以使生成器在FinQA和MultiHiertt数值推理数据集上取得优于基准模型的表现.在FinQA数据集上,多粒度单元格语义对比方法上最高可以提升答案正确率达到3.38%;特别地,在更为困难的层次化表格数据集MultiHiertt中,该方法使生成器的正确率显著提高了7.8%.同大语言模型GPT-3结合思维链相比,基于多粒度单元格语义对比的生成器性能在FinQA和MultiHiertt上分别表现出5.44%和1.69%的答案正确率提升.后续分析实验进一步验证多粒度单元格语义对比方法有助于生成器区分支撑单元格句子和干扰单元格句子. 展开更多
关键词 表格和文本学习 数值问答模型 多粒度对比学习
在线阅读 下载PDF
基于多模态交叉融合的多图表联合问答方法
9
作者 王鑫鑫 陈亮 +1 位作者 刘昌宏 刘晋宇 《计算机集成制造系统》 北大核心 2025年第8期2829-2842,共14页
为了满足在无法直接访问底层数据库的情况下,用户对于多张图表间关联性问题的交互式探索需求,提出了一种多图表联合问答方法。该方法通过两个核心阶段——数据准备和答案生成,实现了对多张图表数据的联合解读。在数据准备阶段,通过将图... 为了满足在无法直接访问底层数据库的情况下,用户对于多张图表间关联性问题的交互式探索需求,提出了一种多图表联合问答方法。该方法通过两个核心阶段——数据准备和答案生成,实现了对多张图表数据的联合解读。在数据准备阶段,通过将图表数据提取重构为表格数据并对其每个单元格进行文本描述,为后续模型提供统一的数据格式。此外,为提高模型的准确性和回答效率,提出文本事实筛选方法,该方法能够在大量的表格文本描述中筛选出与用户问题相关的文本,为后续的答案生成提供精准的数据支持。在答案生成阶段,采用多模态融合技术,将这两种不同模态的信息进行交叉融合,以获取更精确的回答。 展开更多
关键词 多图表联合问答 多模态融合 表格文本描述 事实筛选
在线阅读 下载PDF
基于问题导向式提示调优小样本文本分类
10
作者 翟梦鑫 周艳玲 余杭 《计算机应用研究》 北大核心 2025年第3期708-713,共6页
低资源场景下提示调优比带有额外分类器的通用微调方法(fine-tuning)分类性能好,但提示调优中设计一个较好的提示模板和标签词映射器需要花费大量的精力。针对该问题,提出问题导向式提示调优的小样本分类方法(question-oriented prompt-... 低资源场景下提示调优比带有额外分类器的通用微调方法(fine-tuning)分类性能好,但提示调优中设计一个较好的提示模板和标签词映射器需要花费大量的精力。针对该问题,提出问题导向式提示调优的小样本分类方法(question-oriented prompt-tuning,QPT)。首先,利用数据集标签和可训练的连续提示构建提问形式的模板,通过预训练模型学习到最优提示模板;然后,每条样本用模板进行填充,将文本分类任务转换成完形填空任务;最后,使用外部知识及两种细化方法构建标签词映射器,通过预测的标签词与分类标签的映射关系得出分类结果。在公开数据集AG’s News和IMDB上进行实验,结果表明,该方法在5-shot、10-shot和20-shot任务上性能均有所提升,在5-shot任务上准确率分别提高了0.81和1.36百分点,与基线模型相比,不仅易于实现且性能取得了最优。 展开更多
关键词 小样本文本分类 提示调优 问题导向式模板
在线阅读 下载PDF
基于数据增强和SimBert的语义匹配方法研究
11
作者 王东升 王黎铭 +4 位作者 路曼 韩斌 王石 薄其乐 唐坤 《江苏科技大学学报(自然科学版)》 2025年第4期48-54,共7页
常见问题解答(frequently asked questions,FAQ)系统依赖语义相似度匹配,但面临训练数据不足和领域语义理解有限的问题.为此,提出融合句法信息和编辑向量的句子复述生成方法,通过检索模板句并构建编辑向量,增强预训练模型对句子差异的学... 常见问题解答(frequently asked questions,FAQ)系统依赖语义相似度匹配,但面临训练数据不足和领域语义理解有限的问题.为此,提出融合句法信息和编辑向量的句子复述生成方法,通过检索模板句并构建编辑向量,增强预训练模型对句子差异的学习,实现FAQ数据增强.同时,提出基于SimBERT的混合特征语义匹配模型,结合关键词和意图特征提升匹配效果.实验结果显示,所提方法在Quora、ParaNMT-small、LCQMC、BQ Corpus等数据集上均优于基线模型,并有效提升了特定领域FAQ问答的性能. 展开更多
关键词 问答系统 文本语义匹配 自然语言处理 数据增强
在线阅读 下载PDF
面向区块链漏洞知识库的大模型增强知识图谱问答模型 被引量:1
12
作者 解飞 宋建华 +2 位作者 姜丽 张龑 何帅 《现代电子技术》 北大核心 2025年第2期137-142,共6页
大语言模型(LLM)在专业领域特别是区块链漏洞领域应用时存在局限性,如专业术语噪声干扰和细粒度信息过重导致理解不足。为此,构建一种面向区块链漏洞知识库的增强型知识图谱问答模型(LMBK_KG)。通过整合大模型和知识图谱来增强知识表示... 大语言模型(LLM)在专业领域特别是区块链漏洞领域应用时存在局限性,如专业术语噪声干扰和细粒度信息过重导致理解不足。为此,构建一种面向区块链漏洞知识库的增强型知识图谱问答模型(LMBK_KG)。通过整合大模型和知识图谱来增强知识表示和理解能力,同时利用多粒度语义信息进行专业问题的过滤和精准匹配。研究方法包括使用集成的多粒度语义信息和知识图谱来过滤专业术语噪声,以及采用大模型生成的回答与专业知识图谱进行结构化匹配和验证,以提高模型的鲁棒性和安全性。实验结果表明,所提出的模型在区块链漏洞领域问答的准确率比单独使用大模型提高26%。 展开更多
关键词 大语言模型 知识图谱 问答模型 多粒度语义信息 区块链 漏洞信息 文本表征
在线阅读 下载PDF
遥感场景的图文跨模态理解研究进展
13
作者 郑向涛 赵郑营 +2 位作者 宋宝贵 李浩 卢孝强 《遥感学报》 北大核心 2025年第6期1566-1586,共21页
随着遥感技术和人工智能的深度融合,人类对遥感数据的应用需求日益精细化。然而,单一模态数据在复杂场景解译中存在局限性,难以充分挖掘遥感图像中的深层信息。为此,多模态数据协同分析成为提升遥感解译能力的关键途径,并推动着遥感领... 随着遥感技术和人工智能的深度融合,人类对遥感数据的应用需求日益精细化。然而,单一模态数据在复杂场景解译中存在局限性,难以充分挖掘遥感图像中的深层信息。为此,多模态数据协同分析成为提升遥感解译能力的关键途径,并推动着遥感领域的进一步发展。图文跨模态理解通过文本描述建立遥感图像和人类认知的联系,借助文本语义信息增强视觉特征表征,实现跨模态信息互补,显著提升了遥感解译的性能。本文以遥感图文跨模态理解为主线,将遥感图文跨模态理解划分为遥感图像描述、文本生成图像、遥感图文对齐和遥感图像问答4个任务。首先概述了国内外图文跨模态研究的发展状况;然后对遥感图文跨模态理解常用的公开数据集和评价指标进行介绍;最后,总结了遥感图文跨模态理解面临的技术挑战,并对未来研究方向进行展望。 展开更多
关键词 遥感图文跨模态 图像描述 文本生成图像 图文对齐 图像问答 遥感跨模态数据集
原文传递
基于科研情境的文本学习型试题命制与分析
14
作者 苏倩男 董卅姝 《生物学教学》 北大核心 2025年第1期84-87,共4页
文本学习型试题是目前北京市生物学学业水平等级性考试中必不可少的一种题型,在实现对核心素养更深层次考查的同时,丰富了核心素养的测评方式。以一道与免疫调节、ThTC疫苗相关的基于真实科研情境的原创试题为例,从命题背景和思路、设... 文本学习型试题是目前北京市生物学学业水平等级性考试中必不可少的一种题型,在实现对核心素养更深层次考查的同时,丰富了核心素养的测评方式。以一道与免疫调节、ThTC疫苗相关的基于真实科研情境的原创试题为例,从命题背景和思路、设计说明、质量分析、教学反馈等维度进行阐述,为有效提高学生文本学习能力和科学表述能力提供参考。 展开更多
关键词 文本学习 试题命制 免疫调节 疫苗 科研情境
在线阅读 下载PDF
2024年山东省高考生物学试题第15和25题的深度解析
15
作者 陈从兵 《生物学教学》 北大核心 2025年第1期94-96,共3页
通过对2024年山东省高考生物学试题分析发现,第15题为色氨酸依赖型突变体培养相关的微生物试题,而第25题为基因工程结合遗传相关的试题,这两道试题很好考查了科学思维和科学探究的能力,仔细剖析有利于促进学生纵向和横向的深度思考。
关键词 概念图 模型图 图文结合 试题分析 高考生物学
在线阅读 下载PDF
面向知识图谱的二阶段复杂问句生成框架
16
作者 张琨 王元卓 +6 位作者 仇韫琦 白龙 江旭晖 侯坤 岑建何 沈华伟 程学旗 《电子学报》 北大核心 2025年第6期2104-2117,共14页
面向知识图谱的问句生成(Question Generation over Knowledge Graph,KGQG)任务是根据知识图谱(Knowledge Graph,KG)子图生成自然语言问句.现有方法通常是直接将实例化的KG子图转换为问句,并且大多采用教师强制(Teacher-Forcing)的训练... 面向知识图谱的问句生成(Question Generation over Knowledge Graph,KGQG)任务是根据知识图谱(Knowledge Graph,KG)子图生成自然语言问句.现有方法通常是直接将实例化的KG子图转换为问句,并且大多采用教师强制(Teacher-Forcing)的训练策略.然而,当前方法仍然面临两个主要挑战:(1)实例化的KG子图缺乏确定性查询意图的整合,导致输入与目标输出之间存在语义歧义现象;(2)采用教师强制训练策略训练的生成模型在推理阶段存在曝光偏差问题.为了缓解语义歧义带来的挑战,本文提出了一个复杂问句生成框架,其包括两个阶段,即事实-查询和查询-问句生成阶段.在第一阶段,本文设计了一个查询图生成器,将KG子图转换为具有不同查询意图的查询图.在第二阶段,本文提出了一个问句生成模型,该模型利用密集连接图卷积网络(Densely Connected Graph Convolutional Network,DCGCN)对查询图进行编码,并利用双向自回归变换器(Bidirectional and Auto-Regressive Transformers,BART)模型进行解码以生成问句.此外,为了减轻曝光偏差问题,本文引入了生成对抗模仿学习对问句生成模型进行训练.其中,所采用的判别器通过模仿标记数据自适应地学习奖励函数,并指导问句生成模型探索潜在问题空间中的高奖励区域.本文在三个广泛使用的数据集上进行了大量实验,结果表明所提出的框架具有显著的有效性. 展开更多
关键词 问句生成(KGQG) 知识图谱(KG) 文本生成 曝光偏差 生成对抗模仿学习
在线阅读 下载PDF
多模态交互式语言学习系统的设计与实现
17
作者 蔡学森 李小彬 +3 位作者 戴金波 汝杰 王钰茹 王培瑜 《现代信息科技》 2025年第18期82-86,93,共6页
文章介绍了一个基于Flask框架的多功能语言学习工具的设计与实现。该工具集成了成语测试、绕口令练习、翻译和问答系统等功能,旨在为用户提供全面的语言学习体验。通过整合语音识别、语音合成、文本处理和机器学习等技术,系统实现了语... 文章介绍了一个基于Flask框架的多功能语言学习工具的设计与实现。该工具集成了成语测试、绕口令练习、翻译和问答系统等功能,旨在为用户提供全面的语言学习体验。通过整合语音识别、语音合成、文本处理和机器学习等技术,系统实现了语音输入、文本翻译、智能问答等核心功能。文章详细阐述了系统的架构设计、功能模块实现以及技术难点解决方案,为类似语言学习工具的开发提供了参考。此外,文章还探讨了在Linux环境下部署系统的具体方法,并结合树莓派硬件实现了便携式语言学习设备的原型设计。 展开更多
关键词 Flask框架 语言学习工具 语音识别 语音合成 文本翻译 智能问答 树莓派
在线阅读 下载PDF
基于人工智能的变电设备运行标准数字化研究
18
作者 李佳奇 王南 +1 位作者 于海川 赵振威 《标准科学》 2025年第S2期123-131,共9页
变电站作为智能电网电力转换与分配的核心枢纽,其设备种类繁杂、协同运行需求高,导致变电设备运行相关标准文件数量庞大且多为非结构化PDF格式,传统人工处理与检索方式效率低下,难以满足复杂关联查询及运维指导需求。为解决此问题,本研... 变电站作为智能电网电力转换与分配的核心枢纽,其设备种类繁杂、协同运行需求高,导致变电设备运行相关标准文件数量庞大且多为非结构化PDF格式,传统人工处理与检索方式效率低下,难以满足复杂关联查询及运维指导需求。为解决此问题,本研究引入人工智能技术实现变电设备运行标准的数字化转型,首先,开展文本预处理,选用基于统计语言模型的中文分词算法,构建电力专业文本词库,仅保留电气文本特有的高度专业化词汇。其次,通过神经网络与注意力机制结合的方法进行三元组抽取,构建包含“设备类型—测试指标—标准条款—处置措施”完整逻辑链的知识库,解决非结构化数据的知识提取问题。最后,设计两路召回策略,结合bge-reranker进行综合排序,将候选实体与关系输入大语言模型,借助大语言模型实现数字化问答。结果表明,该方法可准确识别标准文本、挖掘核心知识,实现运维知识的高效检索与人性化问答,显著提升变电设备运维效率与准确性。 展开更多
关键词 文本分词 知识库 三元组抽取 数字化问答 两路召回
在线阅读 下载PDF
基于BERT字向量和TextCNN的农业问句分类模型分析 被引量:14
19
作者 鲍彤 罗瑞 +2 位作者 郭婷 贵淑婷 任妮 《南方农业学报》 CAS CSCD 北大核心 2022年第7期2068-2076,共9页
【目的】研究不同词向量和深度学习模型组合对农业问句分类结果的影响,为构建农业智能问答系统提供技术支撑。【方法】通过爬虫获取农业种植网等网站的问答数据,选择20000条问句进行人工标注,构建农业问句分类语料库。采用BERT对农业问... 【目的】研究不同词向量和深度学习模型组合对农业问句分类结果的影响,为构建农业智能问答系统提供技术支撑。【方法】通过爬虫获取农业种植网等网站的问答数据,选择20000条问句进行人工标注,构建农业问句分类语料库。采用BERT对农业问句进行字符编码,利用文本卷积神经网络(TextCNN)提取问句高维度特征对农业问句进行分类。【结果】在词向量对比实验中,BERT字向量与TextCNN结合时农业问句分类F1值达93.32%,相比Word2vec字向量提高2.1%。在深度学习模型的分类精度对比方面,TextCNN与Word2vec和BERT字向量结合的F1值分别达91.22%和93.32%,均优于其他模型。在农业问句的细分试验中,BERT-TextCNN在栽培技术、田间管理、土肥水管理和其他4个类别中分类F1值分别为86.06%、90.56%、95.04%和85.55%,均优于其他深度学习模型。超参数设置方面,BERT-TextCNN农业问句分类模型卷积核大小设为[3,4,5]、学习率设为5e-5、迭代次数设为5时效果最优,该模型在数据样本不均衡的情况下,对于农业问句的平均分类准确率依然能达93.00%以上,可满足农业智能问答系统的问句分类需求。【建议】通过阿里NLP等开源平台提升数据标注质量;在分类过程中补充词频和文档特征,提高模型分类精度;农业相关政府职能部门加强合作,积极探索农业技术数字化推广和服务新模式。 展开更多
关键词 农业问句 智能问答系统 问句分类 预训练语言模型(BERT) 文本卷积神经网络
在线阅读 下载PDF
指向高阶思维能力培养的高考生物学开放性试题分析及启示 被引量:4
20
作者 高倩倩 曹苡 李雪峰 《生物学教学》 北大核心 2024年第1期60-63,共4页
开放性试题有着结论开放、情境真实以及要求学生通过复杂认知活动完成作答的特点,是考查学生高阶思维能力的重要题型之一。广东省2023年高考生物学试题中出现了多道开放性试题,通过对试题的分析发现其对学生的多项高阶思维能力展开了考... 开放性试题有着结论开放、情境真实以及要求学生通过复杂认知活动完成作答的特点,是考查学生高阶思维能力的重要题型之一。广东省2023年高考生物学试题中出现了多道开放性试题,通过对试题的分析发现其对学生的多项高阶思维能力展开了考查,也对开放性试题的命制和课堂教学有一定的借鉴意义。 展开更多
关键词 开放性试题 高考生物学 试题分析 高阶思维能力
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部