期刊文献+
共找到653篇文章
< 1 2 33 >
每页显示 20 50 100
‘海尔特兹’红树莓果实发育过程中NLPs(NIN-like proteins)转录因子家族的生物信息学分析 被引量:2
1
作者 范青 郑奕宸 +5 位作者 梁光毅 李明 张雪梅 赵志磊 李寒 顾玉红 《河北农业大学学报》 CAS CSCD 北大核心 2023年第2期1-7,共7页
为探究‘海尔特兹’红树莓中NLPs(NIN-like proteins)转录因子家族成员的基本特征和表达模式,本研究利用生物信息学技术对‘海尔特兹’红树莓4个发育时期(青果、黄果、红果、深红果)果实的NLP基因家族成员进行分析。结果表明:红树莓中3... 为探究‘海尔特兹’红树莓中NLPs(NIN-like proteins)转录因子家族成员的基本特征和表达模式,本研究利用生物信息学技术对‘海尔特兹’红树莓4个发育时期(青果、黄果、红果、深红果)果实的NLP基因家族成员进行分析。结果表明:红树莓中3个NLPs转录因子都含有RWP-RK结构域,其中RuNLP1和RuNLP2的保守基序相同;红树莓的NLPs转录因子家族成员与野草莓和月季的NLPs转录因子家族进化关系最近,且NLPs基因家族的基因扩增发生在单子叶植物和双子叶植物祖先分化之前;RuNLP1和RuNLP2为酸性不稳定的亲水性蛋白质,而RuNLP3为碱性不稳定的亲水性蛋白质;三者都不含信号肽和跨膜结构;RuNLP1和RuNLP2蛋白质均定位于细胞核,而RuNLP3定位于细胞核和叶绿体;二级结构的预测结果显示,结构占比均以无规卷曲为主,α螺旋次之,与三级结构预测结果基本一致,结果较为可靠;RuNLPs转录因子家族成员之间不存在互作现象;RuNLPs基因家族3个成员的表达量随果实逐渐成熟均减少。本研究为RuNLPs转录因子家族在红树莓果实发育过程中的分子机制提供了理论基础。 展开更多
关键词 红树莓 果实 发育 nlps转录因子家族 生物信息学分析
在线阅读 下载PDF
多模态水泥环境负荷实体-关系联合抽取
2
作者 郭玉臣 郭晓潞 +1 位作者 钱春香 李林熹 《水泥》 2026年第1期5-9,共5页
我国是全球最大的水泥生产国,控制水泥生产的环境负荷至关重要。然而,水泥生产过程中污染物数据不全、统计不统一且缺失严重,影响了环境负荷相关工作。为此,提出为水泥行业构建环境负荷知识图谱,并开发了一种新的多模态数据采集与集成方... 我国是全球最大的水泥生产国,控制水泥生产的环境负荷至关重要。然而,水泥生产过程中污染物数据不全、统计不统一且缺失严重,影响了环境负荷相关工作。为此,提出为水泥行业构建环境负荷知识图谱,并开发了一种新的多模态数据采集与集成方法,即多模态水泥环境实体-关系联合抽取(EREM)。EREM基于多模态数据,采用实体-关系联合抽取技术,自动抽取信息,简化水泥全生命周期知识库的构建,助力环境负荷的控制。实验表明,EREM能高效完成实体-关系抽取,简化知识图谱构建流程,具有实用价值。 展开更多
关键词 水泥环境负荷 实体-关系联合抽取 知识图谱 多模态数据处理 传统自然语言(NLP)
原文传递
小麦NLP转录因子的表达特点及其在不同氮效小麦品种中的差异
3
作者 李会强 肖福星 +6 位作者 王露露 能芙蓉 韦一昊 焦浩 张茜 都圳 王小纯 《河南农业大学学报》 北大核心 2026年第1期23-34,共12页
【目的】鉴定小麦转录因子NLP(NIN-like protein),探索其在不同氮效小麦中的表达特点,为提高小麦氮素利用效率提供理论依据。【方法】基于NLP的保守结构域RWP-RK和PB1在WheatOmics 1.0网站鉴定小麦NLP,利用生物信息学软件对其染色体分... 【目的】鉴定小麦转录因子NLP(NIN-like protein),探索其在不同氮效小麦中的表达特点,为提高小麦氮素利用效率提供理论依据。【方法】基于NLP的保守结构域RWP-RK和PB1在WheatOmics 1.0网站鉴定小麦NLP,利用生物信息学软件对其染色体分布、进化关系等进行分析。利用氮高效品种‘周麦27’(ZM27)和氮低效品种‘矮抗58’(AK58)在减氮(120 kg·hm^(-2),N8)和正常氮(225 kg·hm^(-2),N15)处理下的转录组数据,分析拔节期TaNLP家族成员的表达特点。【结果】小麦有18个NLP,在A、B、D染色体上呈现出不均匀分布,依据进化分析可分为4个亚家族,大部分定位于细胞核。不同氮效品种在不同氮处理下叶片中TaNLP无显著差异,而在根中表达存在差异。正常氮条件下TaNLP6D在ZM27根系中特异表达,减氮条件下TaNLP4B.2、TaNLP5A.2和TaNLP5D在AK58根系中特异表达;减氮条件下TaNLP3A和TaNLP3D在ZM27和AK58根系中均有较高表达量,TaNLP2A和TaNLP2B在ZM27根系中受氮水平正向调控,而在AK58中却相反。【结论】不同氮效小麦品种NLP家族成员在根系表达方面存在显著差异,并受施氮量影响,可能在调控小麦苗期根系氮素吸收中起重要作用。 展开更多
关键词 小麦 NLP转录因子 氮处理 表达特点
在线阅读 下载PDF
基于混合分词与动态平滑的藏文N-gram语言模型优化及性能分析
4
作者 曼拉才让 安见才让 仁欠扎西 《信息技术与信息化》 2026年第2期54-58,共5页
藏语自然语言处理的发展是推动藏语言信息化进程的核心支撑。针对藏语屈折性与黏着性复合形态特征,文章提出一种融合藏语特性优化混合分词策略与“黏着性因子α”动态平滑技术的语言模型构建方案。基于SRILM工具与Python并行计算技术,完... 藏语自然语言处理的发展是推动藏语言信息化进程的核心支撑。针对藏语屈折性与黏着性复合形态特征,文章提出一种融合藏语特性优化混合分词策略与“黏着性因子α”动态平滑技术的语言模型构建方案。基于SRILM工具与Python并行计算技术,完成1~7元N-gram模型的高效训练与系统评估,重点分析不同N值对模型性能的影响。实验结果显示,综合模型困惑度(PPL)与文本生成质量,当N值处于3~6范围时模型表现较优,其中N=4时效果最佳。该系统在分词灵活性、平滑技术适配性及计算效率上实现显著提升,不仅为藏语这一低资源、形态复杂语言的N-gram模型优化及基础参数确立提供了有效路径,也为后续更复杂藏语神经网络模型的研究奠定了坚实基准。 展开更多
关键词 藏语NLP N-GRAM模型 混合分词 低资源语言 黏着性因子
在线阅读 下载PDF
基于DeepSeek-NLP的“课赛融合”教学模式重构——职业技能大赛软件测试赛项性能测试教学实证研究
5
作者 何丽 江岸 《广东农工商职业技术学院学报》 2026年第1期72-77,共6页
本研究针对世界职业院校技能大赛软件测试赛项中因被测系统访问限制导致LoadRunner脚本录制困难的问题,提出基于DeepSeek-NLP的测试脚本自动生成方案。通过构建“课赛融合”教学模式,结合赛题知识库和大语言模型技术,分两阶段实施:首先... 本研究针对世界职业院校技能大赛软件测试赛项中因被测系统访问限制导致LoadRunner脚本录制困难的问题,提出基于DeepSeek-NLP的测试脚本自动生成方案。通过构建“课赛融合”教学模式,结合赛题知识库和大语言模型技术,分两阶段实施:首先利用DeepSeek-NLP分析赛题生成知识图谱优化教学,随后引导学生生成测试脚本并在LoadRunner中适配验证。实证表明,该方案显著提升脚本开发效率,降低技术门槛,为职业院校“以赛促教”提供智能化解决方案。 展开更多
关键词 世界职业院校技能大赛 软件测试 课赛融合 DeepSeek 大语言模型 NLP
在线阅读 下载PDF
NLP-EA-AI综合框架在广西职业本科教育心理辅导与智能化教学中的应用
6
作者 欧文辉 《科技风》 2026年第10期102-104,共3页
广西职业本科院校面向“产教深融、文理并重”的现实需求,正迎来心理健康教育与课堂教学双线升级的契机。本文提出一套整合自然语言处理(NLP)、教育分析(EA)与人工智能(AI)的校本平台,尝试在“识别-分析-干预-反馈”四环链路中嵌入四种... 广西职业本科院校面向“产教深融、文理并重”的现实需求,正迎来心理健康教育与课堂教学双线升级的契机。本文提出一套整合自然语言处理(NLP)、教育分析(EA)与人工智能(AI)的校本平台,尝试在“识别-分析-干预-反馈”四环链路中嵌入四种智能模块:情绪语义解析、学习画像建模、教学场景自适应推送和危机预警闭环。项目落地经过半年试运行,呈现出学生心理风险降低、课堂互动提升、教师负担缓解的多维成效。本文在梳理关键技术的同时,讨论了边缘计算、省域方言处理与伦理治理等议题,并基于真实测评数据提供了有效的推广路径。 展开更多
关键词 NLP EA AI 职业本科 教育
在线阅读 下载PDF
Effective Token Masking Augmentation Using Term-Document Frequency for Language Model-Based Legal Case Classification
7
作者 Ye-Chan Park Mohd Asyraf Zulkifley +1 位作者 Bong-Soo Sohn Jaesung Lee 《Computers, Materials & Continua》 2026年第4期928-945,共18页
Legal case classification involves the categorization of legal documents into predefined categories,which facilitates legal information retrieval and case management.However,real-world legal datasets often suffer from... Legal case classification involves the categorization of legal documents into predefined categories,which facilitates legal information retrieval and case management.However,real-world legal datasets often suffer from class imbalances due to the uneven distribution of case types across legal domains.This leads to biased model performance,in the form of high accuracy for overrepresented categories and underperformance for minority classes.To address this issue,in this study,we propose a data augmentation method that masks unimportant terms within a document selectively while preserving key terms fromthe perspective of the legal domain.This approach enhances data diversity and improves the generalization capability of conventional models.Our experiments demonstrate consistent improvements achieved by the proposed augmentation strategy in terms of accuracy and F1 score across all models,validating the effectiveness of the proposed method in legal case classification. 展开更多
关键词 Legal case classification class imbalance data augmentation token masking legal NLP
在线阅读 下载PDF
基于大语言模型的高考志愿填报智能决策支持系统研究
8
作者 何乐韬 张乐晨 《计算机应用文摘》 2026年第3期137-139,共3页
文章提出一种基于大语言模型(LLM)的智能决策支持系统,旨在应用自然语言处理(NLP)技术,为考生与家长提供高效的高考志愿填报决策支持。系统通过分析历史录取数据、院校信息、专业要求及考生个人背景等多维信息,生成个性化志愿填报建议,... 文章提出一种基于大语言模型(LLM)的智能决策支持系统,旨在应用自然语言处理(NLP)技术,为考生与家长提供高效的高考志愿填报决策支持。系统通过分析历史录取数据、院校信息、专业要求及考生个人背景等多维信息,生成个性化志愿填报建议,从而提升决策的准确性、适配性与智能化水平。 展开更多
关键词 LLM 智能决策支持 高考志愿填报 NLP 个性化推荐
在线阅读 下载PDF
基于NLP的节目字幕与语音一致性校验方法
9
作者 王庆 《计算机应用文摘》 2026年第1期238-240,共3页
现有字幕校验方法普遍未充分考虑字幕与语音在多维语义及语法层面的深层对应关系,导致校验效果有限,易出现信息传递失真。为此,文章提出一种基于自然语言处理(NLP)的节目字幕与语音一致性校验方法。首先,对节目语音信号进行预处理并转... 现有字幕校验方法普遍未充分考虑字幕与语音在多维语义及语法层面的深层对应关系,导致校验效果有限,易出现信息传递失真。为此,文章提出一种基于自然语言处理(NLP)的节目字幕与语音一致性校验方法。首先,对节目语音信号进行预处理并转写为文本;随后,利用NLP技术分别提取字幕和语音文本的特征表示;最后,通过多维度相似度度量实现二者的一致性校验。实验结果表明,该方法在多种节目场景下的F1值均显著优于现有对比方法,展现出优异的校验性能与适应性。 展开更多
关键词 NLP 节目字幕与语音 一致性校验 文本转写 相似度计算
在线阅读 下载PDF
基于改进NLP算法的配微网动态调度优化方法
10
作者 万达 《粘接》 2026年第4期1125-1128,共4页
由于传统的配微网调度方法往往采用单一目标优化,难以兼顾配电网和微网的不同需求。为此,提出基于改进NLP算法的配微网动态调度优化方法。首先构建一个双层配微网动态调度优化模型:上层以配电网网损最小、电压稳定性最优为优化目标;下... 由于传统的配微网调度方法往往采用单一目标优化,难以兼顾配电网和微网的不同需求。为此,提出基于改进NLP算法的配微网动态调度优化方法。首先构建一个双层配微网动态调度优化模型:上层以配电网网损最小、电压稳定性最优为优化目标;下层以微网总运行成本最小为优化目标;并设置一系列约束条件。然后引入启发式非线性规划(NLP)算法中的遗传算法,针对非线性双层规划的配微网动态调度优化模型进行改进,得到层次型遗传算法,有效求解该模型。最后通过实验验证所提方法的有效性,实验结果表明,所提方法能够显著降低配微网出力与负荷峰谷差,提高节点电压稳定性,并有效提升分布式电源消纳能力。 展开更多
关键词 改进NLP算法 配微网 微网调度 动态调度 调度优化
在线阅读 下载PDF
Automating the Initial Development of Intent-Based Task-Oriented Dialog Systems Using Large Language Models:Experiences and Challenges
11
作者 Ksenia Kharitonova David Pérez-Fernández +1 位作者 Zoraida Callejas David Griol 《Computers, Materials & Continua》 2026年第5期1021-1062,共42页
Building reliable intent-based,task-oriented dialog systems typically requires substantial manual effort:designers must derive intents,entities,responses,and control logic from raw conversational data,then iterate unt... Building reliable intent-based,task-oriented dialog systems typically requires substantial manual effort:designers must derive intents,entities,responses,and control logic from raw conversational data,then iterate until the assistant behaves consistently.This paper investigates how far large language models(LLMs)can automate this development.In this paper,we use two reference corpora,Let’s Go(English,public transport)and MEDIA(French,hotel booking),to prompt four LLM families(GPT-4o,Claude,Gemini,Mistral Small)and generate the core specifications required by the rasa platform.These include intent sets with example utterances,entity definitions with slot mappings,response templates,and basic dialog flows.To structure this process,we introduce a model-and platform-agnostic pipelinewith two phases.The first normalizes and validates LLM-generated artifacts,enforcing crossfile consistency andmaking slot usage explicit.The second uses a lightweight dialog harness that runs scripted tests and incrementally patches failure points until conversations complete reliably.Across eight projects,all models required some targeted repairs before training.After applying our pipeline,all reached≥70%task completion(many above 84%),while NLU performance ranged from mid-0.6 to 1.0 macro-F1 depending on domain breadth.These results show that,with modest guidance,current LLMs can produce workable end-to-end dialog prototypes directly fromraw transcripts.Our main contributions are:(i)a reusable bootstrap method aligned with industry domain-specific languages(DSLs),(ii)a small set of high-impact corrective patterns,and(iii)a simple but effective harness for closed-loop refinement across conversational platforms. 展开更多
关键词 Task-oriented dialog systems large language models(LLMs) RASA dialog automation natural language understanding(NLU) slot filling conversational AI human-in-the-loop NLP
在线阅读 下载PDF
研究揭示NLP1 SUMO化修饰调控硝酸盐信号转导和共生结瘤新机制
12
《中国科技信息》 2026年第8期4-4,共1页
硝酸盐是植物吸收利用的主要氮源,也是调控植物生长发育的重要信号分子。豆科植物不仅能吸收土壤中的氮素,还可通过与根瘤菌共生固氮获取氮营养。但是,共生固氮需要耗费大量植物能量,当土壤氮素较高时,氮会作为信号分子影响共生固氮基... 硝酸盐是植物吸收利用的主要氮源,也是调控植物生长发育的重要信号分子。豆科植物不仅能吸收土壤中的氮素,还可通过与根瘤菌共生固氮获取氮营养。但是,共生固氮需要耗费大量植物能量,当土壤氮素较高时,氮会作为信号分子影响共生固氮基因的功能,从而抑制根瘤的形成及固氮能力。 展开更多
关键词 NLP1 SUMO化修饰 硝酸盐信号转导
在线阅读 下载PDF
Transforming Healthcare with State-of-the-Art Medical-LLMs:A Comprehensive Evaluation of Current Advances Using Benchmarking Framework
13
作者 Himadri Nath Saha Dipanwita Chakraborty Bhattacharya +5 位作者 Sancharita Dutta Arnab Bera Srutorshi Basuray Satyasaran Changdar Saptarshi Banerjee Jon Turdiev 《Computers, Materials & Continua》 2026年第2期234-289,共56页
The emergence of Medical Large Language Models has significantly transformed healthcare.Medical Large Language Models(Med-LLMs)serve as transformative tools that enhance clinical practice through applications in decis... The emergence of Medical Large Language Models has significantly transformed healthcare.Medical Large Language Models(Med-LLMs)serve as transformative tools that enhance clinical practice through applications in decision support,documentation,and diagnostics.This evaluation examines the performance of leading Med-LLMs,including GPT-4Med,Med-PaLM,MEDITRON,PubMedGPT,and MedAlpaca,across diverse medical datasets.It provides graphical comparisons of their effectiveness in distinct healthcare domains.The study introduces a domain-specific categorization system that aligns these models with optimal applications in clinical decision-making,documentation,drug discovery,research,patient interaction,and public health.The paper addresses deployment challenges of Medical-LLMs,emphasizing trustworthiness and explainability as essential requirements for healthcare AI.It presents current evaluation techniques that improve model transparency in high-stakes medical contexts and analyzes regulatory frameworks using benchmarking datasets such asMedQA,MedMCQA,PubMedQA,and MIMIC.By identifying ongoing challenges in biasmitigation,reliability,and ethical compliance,thiswork serves as a resource for selecting appropriate Med-LLMs and outlines future directions in the field.This analysis offers a roadmap for developing Med-LLMs that balance technological innovation with the trust and transparency required for clinical integration,a perspective often overlooked in existing literature. 展开更多
关键词 Medical large language models(Med-LLM) AI in healthcare natural language processing(NLP)in medicine fine-tuning medical LLMs retrieval-augmented generation(RAG)in medicine multi-modal learning in healthcare explainability and transparency in medical AI FDA regulations for AI in medicine evaluation and benchmarking of medical large language models
在线阅读 下载PDF
基于NLP技术的学术著作翻译策略研究 被引量:2
14
作者 沈磊 殷依娜 《上海翻译(中英文)》 北大核心 2025年第3期56-62,共7页
自然语言处理(NLP)技术是提升翻译质量和效率的重要工具。本文结合方梦之先生《应用翻译研究:原理、策略与技巧(修订版)》的英译实践,基于现代学术著作翻译的特点,介绍机器翻译、术语提取和Alt Text等关键技术,探讨NLP技术在学术著作翻... 自然语言处理(NLP)技术是提升翻译质量和效率的重要工具。本文结合方梦之先生《应用翻译研究:原理、策略与技巧(修订版)》的英译实践,基于现代学术著作翻译的特点,介绍机器翻译、术语提取和Alt Text等关键技术,探讨NLP技术在学术著作翻译中的应用。现代学术著作翻译已超越文本转换的单一任务,为了推动译著国际出版,译员还需承担版权授权处理、书目规范化调整、图表编辑以及撰写提案与章节摘要等工作,译者不仅需要具备语言能力,还需兼具学术能力和出版流程知识,推动跨文化交流与学术出版,展现其从传统语言转换者向多维协作者角色的转变。 展开更多
关键词 自然语言处理(NLP) 学术著作翻译 翻译策略 机器翻译 术语提取
原文传递
基于VAE-GAN与改进RoPE的文本意图识别方法
15
作者 任喜伟 王瑞 +1 位作者 赵杉 何立风 《陕西科技大学学报》 北大核心 2025年第5期187-193,共7页
Transformer模型借助位置编码在处理长序列位置信息方面相较其他一些深度模型具有一定优势,但在意图识别特定任务场景下仍存在改进之处,针对高质量可用的细分领域文本语料库较少和使用Transformer模型进行意图识别存在局限等问题,提出... Transformer模型借助位置编码在处理长序列位置信息方面相较其他一些深度模型具有一定优势,但在意图识别特定任务场景下仍存在改进之处,针对高质量可用的细分领域文本语料库较少和使用Transformer模型进行意图识别存在局限等问题,提出了一种基于VAE-GAN与改进RoPE的文本意图识别方法.首先构建了一种融合VAE和GAN的语料拓展方法,在不降低语料库质量的同时,丰富了语料库;其次构建了一种改进RoPE的Transformer模型位置编码,在提高模型灵活程度的同时,使模型获得了长文本的依赖关系;最后在语料拓展和改进模型训练后,与一系列常用模型backbone进行对比实验,实验结果表明提出方法准确率达到了97.28%,且Precision、Recall、AUC值也均表现最佳,分别为89.988、92.925和0.945,证明了提出方法的有效性. 展开更多
关键词 NLP 语料拓展 Transformer 意图识别
在线阅读 下载PDF
融合NLP文本分析的精算类课程教学方法探讨与实践
16
作者 钱林义 康静文 +1 位作者 李丹萍 范堃 《上海保险》 2025年第12期49-51,共3页
随着科技的蓬勃发展和大数据时代的到来,保险行业的变革正在以前所未有的速度发生。传统精算课程在实践性、技术更新与前沿覆盖方面均存在不足,难以完全满足保险行业数字化转型和人才多元化需求。引入NLP技术,不仅能够提升学生处理非结... 随着科技的蓬勃发展和大数据时代的到来,保险行业的变革正在以前所未有的速度发生。传统精算课程在实践性、技术更新与前沿覆盖方面均存在不足,难以完全满足保险行业数字化转型和人才多元化需求。引入NLP技术,不仅能够提升学生处理非结构化数据的能力,还能促进精算教育与行业发展相结合,为培养跨学科的复合型人才提供有效路径。 展开更多
关键词 NLP文本分析 精算类课程体系 精算教育
在线阅读 下载PDF
结合特征降维技术的语言机器学习系统研究
17
作者 孙静 况灵巧 《自动化与仪器仪表》 2025年第3期135-139,共5页
针对智能家居系统在英语指令识别方面效率较低、设备数量增加导致英语指令识别冲突较高的问题,提出了一种结合特征降维技术的英语语言机器学习系统。首先结合自然语言处理和机器学习相关技术进行了系统的设计与分析,其次,利用线性循环... 针对智能家居系统在英语指令识别方面效率较低、设备数量增加导致英语指令识别冲突较高的问题,提出了一种结合特征降维技术的英语语言机器学习系统。首先结合自然语言处理和机器学习相关技术进行了系统的设计与分析,其次,利用线性循环网络、多头注意力机制和间隔卷积提出了一种时空多特征提取为基础的语言挖掘算法。实验验证显示,研究所提算法比其他算法的准确率平均增加了5.19%,平均精度平均增加了6.80%。所提算法基础上的系统检测准确率高达99.43%。结果表明,时空多特征提取基础上的语言挖掘算法能够提高智能家居系统对英语指令的识别检测精度,提高对文本信息特征的提取效率。研究提出的系统在智能家居系统指令检测和识别领域具有积极的应用价值。 展开更多
关键词 特征降维 NLP 英语指令识别 SHS
原文传递
大模型在NLP基准测试中的方法与挑战
18
作者 吴迪 《黎明职业大学学报》 2025年第2期85-92,共8页
为有效评估大规模预训练模型(如GPT,BERT,T5等)的性能,基准测试作为一种标准化的评估方法,变得愈发重要。首先,文中论述当前大模型(LLMs)在NLP(自然语言处理)基准测试的主要方法和数据集,分析诸如在知识类问答、代码生成、数学和中文能... 为有效评估大规模预训练模型(如GPT,BERT,T5等)的性能,基准测试作为一种标准化的评估方法,变得愈发重要。首先,文中论述当前大模型(LLMs)在NLP(自然语言处理)基准测试的主要方法和数据集,分析诸如在知识类问答、代码生成、数学和中文能力等不同任务中使用的基准测试框架。然后,探讨现有基准测试的优缺点,阐述其在模型比较、性能评估和研究在推动方面的作用及不足;同时,还讨论中文基准测试面临的挑战(如中文语言特性、中文数据集、传统评估指标和可解释性不足等)。最后,提出基准测试未来的发展方向,包括引入更具挑战性的任务、增强定性评估方法及促进多模态跨领域的基准测试(如ARC-AGI任务),以期推动NLP大模型的持续进步和更具智能化。 展开更多
关键词 自然语言处理(NLP) 大模型(LLMs) 基准测试 大规模预训练模型
在线阅读 下载PDF
基于自然语言处理(NLP)的生态环境准入清单政策内容分析 被引量:3
19
作者 魏泽洋 汪自书 +3 位作者 宫曼莉 谢丹 杨洋 刘毅 《环境工程技术学报》 北大核心 2025年第1期1-10,共10页
生态环境准入清单是生态环境分区管控制度的核心抓手,通过空间布局约束、污染排放管控、环境风险防控和资源能源利用效率控制等维度实现生态环境源头预防。生态环境准入清单存在政策文本庞大、管控措施多样、表达构成复杂特点,识别准入... 生态环境准入清单是生态环境分区管控制度的核心抓手,通过空间布局约束、污染排放管控、环境风险防控和资源能源利用效率控制等维度实现生态环境源头预防。生态环境准入清单存在政策文本庞大、管控措施多样、表达构成复杂特点,识别准入清单管控的对象、方式与力度是支撑生态环境分区管控政策实施的重要基础。本研究基于自然语言机器无监督学习技术对生态环境准入清单进行政策词汇模式挖掘并对政策文本设定多维定量化标签,应用自然语言深度学习模型对生态环境准入清单管控措施进行文本分类评估。河北省是我国产业门类最齐全、资源环境问题最复杂的省份之一,其生态环境准入管控具有典型性和代表性。以河北省生态环境准入清单的产业管控措施为例,识别了10类政策关键词特征、64项主要政策关键词,对全清单中对应关键词所在的语句覆盖率达95%;构造了24个管控措施-行业的分类标签,应用并比较了BERT、RoBERTa和ALBERT深度学习模型对政策文本的分类识别效果,预测精度、召回率和F1得分最高分别可达到0.95、0.79和0.86,训练模型可较好地识别准入清单政策内容。结果显示河北省准入清单在管控措施明确化、具体化、定量化方面仍存在不足,产业精细化管控、考核指标型以及时限型内容有待补充和细化。本研究提出的方法具有较好的适用前景,建议在此基础上结合前沿人工智能方法,进一步提高模型自动处理效率、动态分析以及提供精细化政策调整建议的能力。 展开更多
关键词 生态环境分区管控 生态环境准入清单 政策文本 自然语言处理(NLP)
在线阅读 下载PDF
上一页 1 2 33 下一页 到第
使用帮助 返回顶部