期刊文献+
共找到3,775篇文章
< 1 2 189 >
每页显示 20 50 100
基于卷积网络与多层感知机制的智能机器翻译技术研究 被引量:1
1
作者 王滨 郭黎娜 《自动化与仪器仪表》 2025年第9期172-176,共5页
针对神经机器翻译模型在多领域翻译中精度较低、适应性较差等问题,研究引入了基于自注意力机制的Transformer模型。在此基础上,采用卷积网络与多层感知机制对模型进行优化。具体在编码器中引入了基于卷积网络的单词上下文领域语境感知机... 针对神经机器翻译模型在多领域翻译中精度较低、适应性较差等问题,研究引入了基于自注意力机制的Transformer模型。在此基础上,采用卷积网络与多层感知机制对模型进行优化。具体在编码器中引入了基于卷积网络的单词上下文领域语境感知机制,在编码器与解码器结构中采用了基于多层感知机的判别机制。结果显示,改进后的Transformer模型在Al Challenger社交领域数据集上的双语评估替补(Bilingual Evaluation Understudy,BLEU)值高达42.32,相比于Transformer模型提升了5.28。在UM-Corpus新闻、教育、法律领域数据集中的BLEU值分别高达43.52、44.85、47.68,明显高于其余模型。说明研究采用的翻译模型能够适应不同领域的语言特点,具有较强的翻译效果,推动了智能机器翻译技术的发展。 展开更多
关键词 卷积网络 MLP TRANSFORMER 多领域 翻译
原文传递
基于RAG的文物艺术品拍卖数据NL2SQL实现方法
2
作者 李成华 张浏鹏 石鸿凌 《计算机应用》 北大核心 2025年第S2期82-87,共6页
自然语言转换结构化查询语言(NL2SQL)能降低非专业人员操作数据库的技术门槛,从而提升用户体验和工作效率。此外,检索增强生成(RAG)技术可以通过引入外部知识库提升NL2SQL的性能。针对目前RAG在NL2SQL应用中存在的检索策略漏检率高和召... 自然语言转换结构化查询语言(NL2SQL)能降低非专业人员操作数据库的技术门槛,从而提升用户体验和工作效率。此外,检索增强生成(RAG)技术可以通过引入外部知识库提升NL2SQL的性能。针对目前RAG在NL2SQL应用中存在的检索策略漏检率高和召回上下文的相关性不强等问题,提出一种分序检索重排序RAG(RAG-SRR)方法优化知识库构建、检索召回策略和提示词设计等环节。首先,从问答对、专业名词和数据库结构这3个方面进行领域知识库的构建:问答对根据文物艺术品拍卖监管的高频处理和查询的问题构建,专业名词根据拍卖行业标准构建,而数据库结构根据雅昌艺术拍卖网的数据构建;其次,在检索阶段采取分序检索的策略,并对3类知识库设置不同的优先级,且在召回阶段重排序检索的信息;最后,在提示词设计中给出提示词优化设计的原则及提示词模板。实验结果表明:在领域数据集、Spider数据集上,RAG-SRR方法与基于BERT(Bidirectional Encoder Representations from Transformers)模型和RESDSQL(Ranking-enhanced Encoding plus a Skeleton-aware Decoding framework for text-to-SQL)模型的方法的执行准确率分别至少提高了19.50、24.20和12.17、8.90个百分点。而在相同大语言模型下,RAG-SRR方法比未优化的RAG方法的执行准确率分别至少提高了12.83和15.60个百分点,与C3SQL方法相比,执行准确率分别至少提高了1.50和3.10个百分点。在使用Llama3.1-8B时,与DIN-SQL方法相比,执行准确率在中文语料数据集中提升0.30个百分点,在英文语料数据集中最多相差3.90个百分点;但在使用Qwen2.5-7B时,执行准确率分别提高1.60和4.10个百分点。可见,RAG-SRR方法具备较强的实用性和可移植性。 展开更多
关键词 中文自然语言转换结构化查询语言 检索增强生成 大语言模型 重排序 文物艺术品拍卖
在线阅读 下载PDF
基于语言模因神经网络的机器翻译质量研究
3
作者 王纯磊 范开芳 《常熟理工学院学报》 2025年第3期36-42,共7页
语言模因,作为文化传播的基本单位,其复制与传播机制为机器翻译提供了新的视角。本研究分析英汉双语语料库,提取具有代表性的语言模因,构建相应的神经网络模型。研究发现,在语言模因的传播过程中,特定的词汇、短语和句型往往具有较高的... 语言模因,作为文化传播的基本单位,其复制与传播机制为机器翻译提供了新的视角。本研究分析英汉双语语料库,提取具有代表性的语言模因,构建相应的神经网络模型。研究发现,在语言模因的传播过程中,特定的词汇、短语和句型往往具有较高的传播力和适应性。这些模因在不同语言和文化之间传递时,能保持其核心意义和形式,可以为机器翻译提供可借鉴的规律。实验结果表明,引入语言模因的神经网络模型在汉语俚语英译质量上显著优于传统模型,能够更好地保留原文的语义和风格,提高汉语俚语英译中神经网络机器翻译的流畅度和准确性。 展开更多
关键词 语言模因 神经网络 机器翻译 汉语俚语英译
在线阅读 下载PDF
融合多头与多跳注意力机制的双向LSTM翻译机器人研究
4
作者 刘莉 《自动化与仪器仪表》 2025年第6期197-201,共5页
英语作为国际交流的主要语言,在跨语言沟通中至关重要。然而,现有翻译技术在长句和复杂语法结构的处理上面临准确性和流畅度的挑战。因此,研究提出一种融合多头与多跳注意力机制的双向长短时记忆网络的英语翻译模型提高翻译机器人的性... 英语作为国际交流的主要语言,在跨语言沟通中至关重要。然而,现有翻译技术在长句和复杂语法结构的处理上面临准确性和流畅度的挑战。因此,研究提出一种融合多头与多跳注意力机制的双向长短时记忆网络的英语翻译模型提高翻译机器人的性能。该模型通过多头注意力机制增强对句法和语义的多角度捕获能力,并利用多跳注意力机制进一步提升对长距离依赖和复杂结构的处理效果。研究结果显示,消融实验中模型的双语评估下标提升至31.47,翻译编辑率降至0.39,准确率和F1值分别达到89.49%和0.91。长难句翻译实验中,模型的双语评估下标平均值为31.82,翻译编辑率最低为0.36,表现最佳。鲁棒性测试中,模型在拼写错误和语法错误场景下准确率下降最小,验证了其抗噪声能力强、性能稳健,适用于翻译机器人任务。研究提出的模型有效提升了翻译机器人的翻译质量,适用于多种实际应用场景。 展开更多
关键词 英语翻译 机器人 注意力 LSTM 编码器
原文传递
融入实体翻译的汉越神经机器翻译模型 被引量:1
5
作者 高盛祥 侯哲 +1 位作者 余正涛 赖华 《计算机应用》 北大核心 2025年第1期69-74,共6页
在汉越低资源翻译任务中,句子中的实体词准确翻译是一大难点。针对实体词在训练语料中出现的频率较低,模型无法构建双语实体词之间的映射关系等问题,构建一种融入实体翻译的汉越神经机器翻译模型。首先,通过汉越实体双语词典预先获取源... 在汉越低资源翻译任务中,句子中的实体词准确翻译是一大难点。针对实体词在训练语料中出现的频率较低,模型无法构建双语实体词之间的映射关系等问题,构建一种融入实体翻译的汉越神经机器翻译模型。首先,通过汉越实体双语词典预先获取源句中实体词的翻译结果;其次,将结果拼接在源句末端作为模型的输入,同时在编码端引入“约束提示信息”增强表征;最后,在解码端融入指针网络机制,以确保模型能复制输出源端句的词汇。实验结果表明,该模型相较于跨语言模型XLM-R(Cross-lingual Language Model-RoBERTa)的双语评估替补(BLEU)值在汉越方向提升了1.37,越汉方向提升了0.21,时间性能上相较于Transformer该模型在汉越方向和越汉方向分别缩短3.19%和3.50%,可有效地提升句子中实体词翻译的综合性能。 展开更多
关键词 汉越神经机器翻译 实体翻译 双语词典 指针网络 低资源
在线阅读 下载PDF
东南亚低资源语言神经机器翻译研究进展
6
作者 余正涛 文永华 高盛祥 《昆明理工大学学报(自然科学版)》 北大核心 2025年第4期55-72,共18页
针对东南亚低资源语言在神经机器翻译中面临的语料资源匮乏和语言结构复杂等挑战,本文系统梳理了该领域的最新研究进展与技术趋势.基于Flores-101多语言平行语料库,对Google翻译、云岭翻译及GPT大模型在泰语、老挝语等8种东南亚语言与... 针对东南亚低资源语言在神经机器翻译中面临的语料资源匮乏和语言结构复杂等挑战,本文系统梳理了该领域的最新研究进展与技术趋势.基于Flores-101多语言平行语料库,对Google翻译、云岭翻译及GPT大模型在泰语、老挝语等8种东南亚语言与中、英文互译任务中的表现进行了对比评估.实验结果表明,预训练模型与数据增强技术的结合显著提升了翻译质量,但泰语、老挝语、缅甸语和柬埔寨语因数据稀缺、语法结构复杂及非拉丁文字等因素,翻译质量仍落后于马来语、菲律宾语、印尼语及越南语.研究表明,大模型技术与本地化语料库建设是提升低资源语言翻译性能的关键.未来研究应深度融合多语言预训练、迁移学习及跨领域数据增强技术,着重攻克东南亚语言的多样性与文化适配机制瓶颈,构建更加鲁棒的低资源语言翻译系统. 展开更多
关键词 机器翻译 神经机器翻译 低资源语言 东南亚语言
原文传递
融合目标端历史信息的篇章级神经机器翻译
7
作者 王晓聪 余正涛 +3 位作者 张元 高盛祥 赖华 李英 《模式识别与人工智能》 北大核心 2025年第5期385-396,共12页
现有的篇章级神经机器翻译方法难以有效挖掘目标端远距离的上下文信息,翻译的译文不连贯.为此,文中提出融合目标端历史信息的篇章级神经机器翻译方法.首先,通过多头自注意力机制,获得源语言的上下文表征和目标语言的上文表征.然后,使用... 现有的篇章级神经机器翻译方法难以有效挖掘目标端远距离的上下文信息,翻译的译文不连贯.为此,文中提出融合目标端历史信息的篇章级神经机器翻译方法.首先,通过多头自注意力机制,获得源语言的上下文表征和目标语言的上文表征.然后,使用线性偏置注意力机制,动态地将历史信息注入当前目标语言表征.最后,通过融合源语言表征和经过增强后的目标语言上下文表征获得较优的篇章译文.在多个数据集上的实验表明,文中方法性能较优,在解码过程中融合通过循环机制建模的长序列信息,可有效提升篇章译文的连贯性和完整性. 展开更多
关键词 神经机器翻译 篇章翻译 线性偏置注意力 历史信息
在线阅读 下载PDF
基于分层强化学习的知识图谱约束问答模型
8
作者 许浩翔 余敦辉 +1 位作者 邓怡辰 肖奎 《计算机应用》 北大核心 2025年第12期3764-3770,共7页
针对知识图谱问答(KGQA)中忽略约束信息和长路径推理的维数灾难问题,提出一种基于分层强化学习(HRL)的知识图谱约束问答(KGQA-HRL)模型。首先,深度融合HRL理念,拆解知识图谱中的三元组,并设计出上层策略和底层策略,从而化解推理路径的... 针对知识图谱问答(KGQA)中忽略约束信息和长路径推理的维数灾难问题,提出一种基于分层强化学习(HRL)的知识图谱约束问答(KGQA-HRL)模型。首先,深度融合HRL理念,拆解知识图谱中的三元组,并设计出上层策略和底层策略,从而化解推理路径的维数灾难隐患;其次,为了提高路径选择的准确性,提出基于注意力机制的动作选择策略和融合约束信息的实体选择策略,从而有效压缩推理的搜索范围;再次,在动作选择与实体选择策略之间嵌入问题更新环节,从而使每跳问题进行二次更新;最后,在实体选择策略中构建约束集并计算约束得分,以考虑问题中的约束信息,从而提高实体选择的准确性。基于4个KGQA基准数据集,对KGQA-HRL模型的性能进行实验的结果显示:KGQA-HRL模型在所有数据集上均达到最优准确率,较之前最佳模型约束路径推理(COPAR)提升了2.9%,且在复杂的3跳查询任务中表现突出(PQ(PathQuestion)数据集上提升了3.6%,MetaQA数据集上提升了2.5%),验证了KGQA-HRL模型优异的推理能力。 展开更多
关键词 知识图谱问答 分层强化学习 复杂约束问题 注意力机制 维度灾难
在线阅读 下载PDF
融合句法感知的双向解码神经机器翻译模型
9
作者 徐欣瑶 陈海龙 +2 位作者 张秀霞 周信澎 魏海月 《哈尔滨理工大学学报》 北大核心 2025年第3期13-23,共11页
针对Transformer采用自回归解码器从左向右进行解码,不能充分利用上下文信息等问题,提出了一种融入句法感知的双向解码神经机器翻译模型。首先,在传统Transformer模型的基础上增加一个反向解码器,采用前向解码器和后向解码器进行双向解... 针对Transformer采用自回归解码器从左向右进行解码,不能充分利用上下文信息等问题,提出了一种融入句法感知的双向解码神经机器翻译模型。首先,在传统Transformer模型的基础上增加一个反向解码器,采用前向解码器和后向解码器进行双向解码,使得生成的解码结果可以包含上下文信息。其次,针对机器翻译中常见的曝光偏差问题,在模型中又加入一个前向解码器,通过优化Teacher Forcing机制来平衡Teacher Forcing训练阶段和自回归测试阶段解码环境的差异,缓解曝光偏差问题。最后,融合依存句法,生成具有句法指导的目标语言句子。实验结果表明,提出的翻译模型在中-英翻译任务上的BLEU值可以达到24.38,比基准模型提高了1.17个BLEU点,在英-德翻译任务上的BLEU值可以达到28.06,比基准模型提高了0.96个BLEU点。 展开更多
关键词 神经机器翻译 Transformer模型 双向解码 依存句法 自回归解码器
在线阅读 下载PDF
基于源代码迁移的编译器优化方法研究
10
作者 周放 刘茂福 李珊枝 《计算机工程与科学》 北大核心 2025年第10期1890-1900,共11页
编译器优化旨在通过在中间代码IR语言上进行一系列变换,提高代码在目标平台上的运行效率。传统方法通常依赖机器学习来分析IR特征,并预测LLVM编译器优化通道的最佳组合。然而,这些方法因受限于编译器现有优化策略和对全局信息的有限利用... 编译器优化旨在通过在中间代码IR语言上进行一系列变换,提高代码在目标平台上的运行效率。传统方法通常依赖机器学习来分析IR特征,并预测LLVM编译器优化通道的最佳组合。然而,这些方法因受限于编译器现有优化策略和对全局信息的有限利用,其扩展性受限。采用深度学习自动将函数级IR从未优化状态转换至O2级别优化,并将此优化过程视为翻译任务。通过引入密集数据流图DDFG,能够提取IR代码的全局结构信息,从而引导模型更全面地学习代码语义。使用Transformer模型进行的实验表明,所提方法的模型能在O2级别有效训练IR,且86.15%的函数级优化代码能在保证语义完整性的同时,在编译器上正确执行。 展开更多
关键词 编译器优化 代码翻译 密集数据流图 数据流预测
在线阅读 下载PDF
水稻生产机械化农机的专业术语翻译研究 被引量:4
11
作者 王翠 《北方水稻》 2025年第1期44-49,共6页
随着信息化和智能化水平的提高,农业设备使用逐渐向人工智能技术发展,同时人机交流和机器语言成为机械化设备应用的重要角色。研究对水稻生产机械化农机的应用进行了专业术语的双语语料库设计,并对语料库进行机器翻译模型的构建,从而实... 随着信息化和智能化水平的提高,农业设备使用逐渐向人工智能技术发展,同时人机交流和机器语言成为机械化设备应用的重要角色。研究对水稻生产机械化农机的应用进行了专业术语的双语语料库设计,并对语料库进行机器翻译模型的构建,从而实现农机智能化发展和国际市场的扩张。通过双语语料库和机器翻译模型的测试分析,得出专业术语中字符的识别正确率最高为99.03%,而字符的翻译准确率最高为98.16%。在语句识别中,平均精度为93.69%,翻译的平均准确度为92.76%。综合分析结果可说明研究提出的农机专业术语翻译方法具有优越性,可为智慧农业的发展提供有效的技术方案和服务平台。 展开更多
关键词 农业机械化 水稻生产 农机设备 专业术语 机器翻译
在线阅读 下载PDF
基于混合模型的机器翻译优化方法 被引量:2
12
作者 张乐 荆晓远 孙其航 《信息技术与信息化》 2025年第2期46-49,共4页
预训练语言模型通过学习大量文本数据中的语言模式和结构,展现出对自然语言任务的通用处理能力。通常,为了机器翻译任务而专门训练预训练模型,需要耗费大量的计算资源。为了解决这一问题,文章提出了一种新的混合模型,该模型将BERT、ROBE... 预训练语言模型通过学习大量文本数据中的语言模式和结构,展现出对自然语言任务的通用处理能力。通常,为了机器翻译任务而专门训练预训练模型,需要耗费大量的计算资源。为了解决这一问题,文章提出了一种新的混合模型,该模型将BERT、ROBERTA、ELECTRA和LUKE等预训练模型与Marian神经机器翻译模型相结合。该方法的目的是利用其他领域的预训练模型与机器翻译模型相结合,以低成本构建新的预训练机器翻译模型。实验结果表明,混合模型在多个语言数据集上比直接使用Marian模型进行微调BLEU值平均提升5.53,最高提升了16.05。结果显示,结合预训练模型和Marian,以低成本构建混合模型,可以有效提升机器翻译性能。 展开更多
关键词 自然语言处理 预训练模型 混合模型 机器翻译
在线阅读 下载PDF
基于智能机器的英语翻译错误纠正系统设计 被引量:1
13
作者 崇宁 《自动化技术与应用》 2025年第7期104-109,共6页
为了帮助教师完成英语教学任务,提升学生的英语语法学习效率。研究创新性地采用双编码器的结构,来抽取英语句法和语义特征。通过双向门控循环单元实现句法分析,而双向的Transformer结合双向门控循环单元则用于深入挖掘语义层面的信息。... 为了帮助教师完成英语教学任务,提升学生的英语语法学习效率。研究创新性地采用双编码器的结构,来抽取英语句法和语义特征。通过双向门控循环单元实现句法分析,而双向的Transformer结合双向门控循环单元则用于深入挖掘语义层面的信息。并结合中国学生的典型语法错误模式,设计融合规则和概率的数据增强技术,来拓展学习者语料库。结果表明,研究方法有效提升了语法纠错系统的效果。针对大学英语考试作文,模型显示出90.4%的精确率、81.33%的召回率和85.2%的F1得分,验证了其作为自动作文批改工具的优越性。研究为跨学科研究提供了新的视角和贡献。 展开更多
关键词 机器翻译 英语 纠错 Bi-GRU BERT
在线阅读 下载PDF
移动机器人履约系统中的订单分配研究
14
作者 刘昭凯 牟进睿 +1 位作者 蒋如意 王琳 《控制与信息技术》 2025年第3期1-13,共13页
随着电子商务与物流行业的快速发展,仓储配送对拣选效率的要求不断提高,自主移动机器人(autonomous mobile robot,AMR)在“货到人”拣选模式中的应用日益广泛。文章围绕移动机器人履约系统(robotic mobile fulfillment system,RMFS)中AM... 随着电子商务与物流行业的快速发展,仓储配送对拣选效率的要求不断提高,自主移动机器人(autonomous mobile robot,AMR)在“货到人”拣选模式中的应用日益广泛。文章围绕移动机器人履约系统(robotic mobile fulfillment system,RMFS)中AMR的订单分配问题展开系统综述。首先明确了订单分配的概念,并构建了包含关键变量、约束条件及优化目标的理论框架,同时根据不同特征对该问题进行分类讨论。其次,为进一步明确相关求解方法,从经典优化方法、启发式与元启发式算法、规则策略与仿真优化算法及人工智能与机器学习方法等多个角度介绍了国内外订单分配及多机器人任务调度方面的研究进展,并详细讨论了影响订单分配效率的多种因素,总结了相关核心性能指标。最后,归纳了当前AMR订单分配研究所面临的实时性、多目标冲突、多机器人协同与路径冲突、动态不确定性以及人因因素等关键挑战,并针对自适应决策、多智能体博弈、深度强化学习结合仿真平台以及绿色能源优化等未来研究方向提出了部分建议。 展开更多
关键词 移动机器人 订单分配 仓储履约系统 智能调度 深度强化学习
在线阅读 下载PDF
融合翻译记忆的神经机器翻译研究
15
作者 孙祎 靳晟 《计算机与数字工程》 2025年第10期2773-2778,2841,共7页
神经机器翻译作为机器翻译领域的主流研究方向,已有多种应用场景。翻译记忆作为计算机辅助翻译的基础,可以为要翻译的源语句提供最相似的双语句对,并将其用于辅助翻译的生成。而在小规模数据上翻译记忆的效果还有待提高。针对此问题,提... 神经机器翻译作为机器翻译领域的主流研究方向,已有多种应用场景。翻译记忆作为计算机辅助翻译的基础,可以为要翻译的源语句提供最相似的双语句对,并将其用于辅助翻译的生成。而在小规模数据上翻译记忆的效果还有待提高。针对此问题,提出一种新的将翻译记忆并与神经机器翻译相融合的方法。首先,通过聚类将训练语料分为多个蔟;其次,在翻译过程中根据输入向量与簇中心向量的相似度进行检索,获得高质量语义信息的翻译记忆;最后,将翻译记忆融合到模型中。该文在中英翻译数据集上进行实验,实验结果表明,与基准模型相比,该方法可以使模型性能获得显著提升。 展开更多
关键词 神经机器翻译 翻译记忆 聚类 检索
在线阅读 下载PDF
造纸企业数据平台可视化大屏UI设计流程与开发思路研究
16
作者 李嵩 《华东纸业》 2025年第10期85-87,共3页
数据可视化已成为造纸企业数据应用中不可或缺的一环。造纸企业可将晦涩难懂的数据转化为直观易读的视觉形式,揭示数据背后的规律和价值,为自身长效发展和决策提供有力支撑。本文针对造纸企业发展需求,从业务场景与多用户角色诉求出发,... 数据可视化已成为造纸企业数据应用中不可或缺的一环。造纸企业可将晦涩难懂的数据转化为直观易读的视觉形式,揭示数据背后的规律和价值,为自身长效发展和决策提供有力支撑。本文针对造纸企业发展需求,从业务场景与多用户角色诉求出发,探讨造纸企业大屏数据平台UI设计流程,并从用户需求分析、指标体系构建、视觉设计原则及前端实现技术等维度展开论述,以期为造纸行业数据可视化实践提供参考借鉴。 展开更多
关键词 造纸企业 数据平台 可视化大屏UI设计 交互呈现
原文传递
基于神经网络的机器翻译研究综述
17
作者 马潇 田永红 赵伟 《计算机工程与应用》 北大核心 2025年第22期36-54,共19页
随着计算机技术的进步,机器翻译已成为实现跨语言沟通的关键工具,其发展历程可分为基于规则的机器翻译、基于统计的机器翻译以及基于深度学习的神经机器翻译。聚焦于大语言模型在翻译领域的应用与创新,全面回顾并系统性梳理了神经机器翻... 随着计算机技术的进步,机器翻译已成为实现跨语言沟通的关键工具,其发展历程可分为基于规则的机器翻译、基于统计的机器翻译以及基于深度学习的神经机器翻译。聚焦于大语言模型在翻译领域的应用与创新,全面回顾并系统性梳理了神经机器翻译(neural machine translation,NMT)的最新进展。从早期的循环神经网络到卷积神经网络,再到当前广泛应用的Transformer模型及其变体,概述了机器翻译的演进历程,分析了NMT的主流架构发展。深入剖析了大语言模型翻译的三个关键维度,系统比较了全参数微调与高效参数微调等技术在翻译任务上的差异性表现;详细探讨了多语言大模型翻译技术、零样本与少样本跨语言迁移的技术挑战与解决方案;全面综述了知识图谱增强、领域专业知识融合及多模态知识融合的大模型翻译方法;介绍了机器翻译的评价指标与常用数据集,并对低资源语言翻译提升、可解释与可控翻译系统、跨文化适应性翻译、计算资源优化以及隐私保护与安全可控等方向的研究前景进行了展望。 展开更多
关键词 神经机器翻译 大语言模型 参数微调 多语言机器翻译 低资源语言翻译 知识图谱增强
在线阅读 下载PDF
基于大语言模型的智能译后编辑系统构建与应用
18
作者 赵泽龙 朱俊国 《厦门大学学报(自然科学版)》 北大核心 2025年第6期958-969,I0001-I0007,共19页
[目的]尽管神经机器翻译(NMT)已经成为当前机器翻译(MT)的主流方法,但在关键场景下,仍需要对NMT模型的输出进行译后编辑,以纠正错误并提高质量.[方法]提出了一种基于大语言模型GPT-4o mini自动译后编辑系统SSAE(smart suggest AutoEdit)... [目的]尽管神经机器翻译(NMT)已经成为当前机器翻译(MT)的主流方法,但在关键场景下,仍需要对NMT模型的输出进行译后编辑,以纠正错误并提高质量.[方法]提出了一种基于大语言模型GPT-4o mini自动译后编辑系统SSAE(smart suggest AutoEdit),SSAE系统通过引入术语约束以及多维翻译建议的自反馈机制,来确保翻译过程中术语使用的一致性和准确性,进而提高关键场景下翻译的整体质量.[结果]实验结果显示,该系统对翻译进行有意义且值得信赖的编辑,有助于提高其总体质量,并消除了翻译中的主要错误.在处理专业领域文本时,它的表现尤为出色,显著减少了术语错误和一致性问题.[结论]值得一提的是,本文提出的自动译后编辑系统在WMT-23术语翻译任务中提升了德语-英语、中文-英语和英语-捷克语的翻译性能. 展开更多
关键词 神经机器翻译 大语言模型 自动译后编辑
在线阅读 下载PDF
基于层叠隐马尔可夫模型的中文命名实体识别 被引量:167
19
作者 俞鸿魁 张华平 +2 位作者 刘群 吕学强 施水才 《通信学报》 EI CSCD 北大核心 2006年第2期87-94,共8页
提出了一种基于层叠隐马尔可夫模型的中文命名实体一体化识别方法,旨在将人名识别、地名识别以及机构名识别等命名实体识别融合到一个相对统一的理论模型中。首先在词语粗切分的结果集上采用底层隐马尔可夫模型识别出普通无嵌套的人名... 提出了一种基于层叠隐马尔可夫模型的中文命名实体一体化识别方法,旨在将人名识别、地名识别以及机构名识别等命名实体识别融合到一个相对统一的理论模型中。首先在词语粗切分的结果集上采用底层隐马尔可夫模型识别出普通无嵌套的人名、地名和机构名等,然后依次采取高层隐马尔可夫模型识别出嵌套了人名、地名的复杂地名和机构名。在对大规模真实语料库的封闭测试中,人名、地名和机构识别的F-1值分别达到92.55%、94.53%、86.51%。采用该方法的系统ICTCLAS在2003年5月SIGHAN举办的第一届汉语分词大赛中名列前茅。 展开更多
关键词 命名实体识别 角色标注 ICTCLAS
在线阅读 下载PDF
自然语言文本水印 被引量:51
20
作者 张宇 刘挺 +2 位作者 陈毅恒 赵世奇 李生 《中文信息学报》 CSCD 北大核心 2005年第1期56-62,70,共8页
本文主要介绍了基于自然语言处理的文本水印技术 ,也即自然语言文本水印技术。该技术是在不改变文本原意的前提下 ,将需要隐藏的文本信息 (水印信息 )插入到原始文本中的一种信息隐藏技术。这种技术对于确认信息来源和信息的秘密传送 ,... 本文主要介绍了基于自然语言处理的文本水印技术 ,也即自然语言文本水印技术。该技术是在不改变文本原意的前提下 ,将需要隐藏的文本信息 (水印信息 )插入到原始文本中的一种信息隐藏技术。这种技术对于确认信息来源和信息的秘密传送 ,以及版权维护等方面都有着很大的应用价值。本文首先给出了基于自然语言处理技术的文本水印的概念、特点及攻击模型 ,并对文本水印的研究现状进行了分析。通过分析可以看出 ,自然语言文本水印技术有着更好的灵活性 ,并且在适度的攻击下 ,不会破坏水印信息。本文详细介绍了文本水印系统的设计过程 ,包括该技术的基础数学理论 -二次余数理论。最后详细介绍了两种自然语言文本水印嵌入方法 ,分别是基于句法分析和基于语义的水印嵌入方法。 展开更多
关键词 人工智能 自然语言处理 文本水印 二次余数 本体语义
在线阅读 下载PDF
上一页 1 2 189 下一页 到第
使用帮助 返回顶部