ReLM(Rephrasing Language Model)是当前性能领先的中文拼写纠错(CSC)模型。针对它在复杂语义场景中存在特征表达不足的问题,提出深层语义特征增强的ReLM——FeReLM(Feature-enhanced Rephrasing Language Model)。该模型利用深度可分...ReLM(Rephrasing Language Model)是当前性能领先的中文拼写纠错(CSC)模型。针对它在复杂语义场景中存在特征表达不足的问题,提出深层语义特征增强的ReLM——FeReLM(Feature-enhanced Rephrasing Language Model)。该模型利用深度可分离卷积(DSC)技术融合特征提取模型BGE(BAAI General Embeddings)生成的深层语义特征与ReLM生成的整体特征,从而有效提升模型对复杂上下文的解析力和拼写错误的识别纠正精度。首先,在Wang271K数据集上训练FeReLM,使模型持续学习句子中的深层语义和复杂表达;其次,迁移训练好的权重,从而将模型学习到的知识应用于新的数据集并进行微调。实验结果表明,在ECSpell和MCSC数据集上与ReLM、MCRSpell(Metric learning of Correct Representation for Chinese Spelling Correction)和RSpell(Retrieval-augmented Framework for Domain Adaptive Chinese Spelling Check)等模型相比,FeReLM的精确率、召回率、F1分数等关键指标的提升幅度可达0.6~28.7个百分点。此外,通过消融实验验证了所提方法的有效性。展开更多
探知全球草地生态系统的土壤有机碳储量是调控全球陆地碳循环过程的必要环节和最大难题之一。本文回顾了草地生态系统土壤有机碳储量的研究进展,分析了现有的草地土壤有机碳模拟技术——草地土壤有机碳模型的主要技术特征,就模型的基础...探知全球草地生态系统的土壤有机碳储量是调控全球陆地碳循环过程的必要环节和最大难题之一。本文回顾了草地生态系统土壤有机碳储量的研究进展,分析了现有的草地土壤有机碳模拟技术——草地土壤有机碳模型的主要技术特征,就模型的基础数据、模型的结构和模型内的函数参数等三方面,讨论了现存草地土壤有机碳模拟技术的缺陷,提出样地清查、遥感分析和模型模拟方法的综合运用将是解决这一问题的根本途径。最后,提出了一种基于草地综合顺序分类系统(comprehensive sequential classification system of grassland,CSCS)的草地土壤有机碳储量分类指数模型的构架。将样地清查、基于CSCS的草地土壤有机碳分类指数模型与遥感的高时空分辨率特征三者耦合起来,分析不同草地类型、气候区划等生态条件下的草地土壤有机碳特征,以求提高草地土壤有机碳估算结果的准确性。此外,草地生态系统土壤的碳汇效应等生态功能与放牧利用不存在绝对对立关系,实现放牧的现代化转型是以对草地土壤有机碳储量精准估算为前提的。展开更多
卫星捕获的遥感数据容易受到成像过程中悬浮粒子的影响而造成图像雾化现象,极大地影响遥感图像的清晰度。为了弥补这一不足,遥感图像去雾(RSID)非常必要。最近兴起的状态空间模型State Space Model(SSM)在建模线性复杂性和远程依赖关系...卫星捕获的遥感数据容易受到成像过程中悬浮粒子的影响而造成图像雾化现象,极大地影响遥感图像的清晰度。为了弥补这一不足,遥感图像去雾(RSID)非常必要。最近兴起的状态空间模型State Space Model(SSM)在建模线性复杂性和远程依赖关系方面的性能卓越,受其启发,笔者设计了一种基于CSC-Mamba(Cross-Shaped Convolutional Mamba Model)视觉模型遥感图像去雾技术。该技术基于SSM设计了RSMamba模块,利用其线性复杂性来实现全局上下文编码,大大降低了模型的复杂度。同时,利用卷积神经网络CNN以及基于自注意力机制设计CSwin模块来聚合不同方向域上的特征,以有效地感知雾分布的空间变化特征。通过这种方式,CSC-Mamba能够更好地提取雾特征,从而有效地去除雾对遥感图像的影响。通过在SateHaze1K公共数据集上的实验,结果表明本CSC-Mamba模型遥感图像去雾技术不仅具有较好的轻量化特征的同时性,还具有较高的去雾效果。展开更多
文摘ReLM(Rephrasing Language Model)是当前性能领先的中文拼写纠错(CSC)模型。针对它在复杂语义场景中存在特征表达不足的问题,提出深层语义特征增强的ReLM——FeReLM(Feature-enhanced Rephrasing Language Model)。该模型利用深度可分离卷积(DSC)技术融合特征提取模型BGE(BAAI General Embeddings)生成的深层语义特征与ReLM生成的整体特征,从而有效提升模型对复杂上下文的解析力和拼写错误的识别纠正精度。首先,在Wang271K数据集上训练FeReLM,使模型持续学习句子中的深层语义和复杂表达;其次,迁移训练好的权重,从而将模型学习到的知识应用于新的数据集并进行微调。实验结果表明,在ECSpell和MCSC数据集上与ReLM、MCRSpell(Metric learning of Correct Representation for Chinese Spelling Correction)和RSpell(Retrieval-augmented Framework for Domain Adaptive Chinese Spelling Check)等模型相比,FeReLM的精确率、召回率、F1分数等关键指标的提升幅度可达0.6~28.7个百分点。此外,通过消融实验验证了所提方法的有效性。
文摘探知全球草地生态系统的土壤有机碳储量是调控全球陆地碳循环过程的必要环节和最大难题之一。本文回顾了草地生态系统土壤有机碳储量的研究进展,分析了现有的草地土壤有机碳模拟技术——草地土壤有机碳模型的主要技术特征,就模型的基础数据、模型的结构和模型内的函数参数等三方面,讨论了现存草地土壤有机碳模拟技术的缺陷,提出样地清查、遥感分析和模型模拟方法的综合运用将是解决这一问题的根本途径。最后,提出了一种基于草地综合顺序分类系统(comprehensive sequential classification system of grassland,CSCS)的草地土壤有机碳储量分类指数模型的构架。将样地清查、基于CSCS的草地土壤有机碳分类指数模型与遥感的高时空分辨率特征三者耦合起来,分析不同草地类型、气候区划等生态条件下的草地土壤有机碳特征,以求提高草地土壤有机碳估算结果的准确性。此外,草地生态系统土壤的碳汇效应等生态功能与放牧利用不存在绝对对立关系,实现放牧的现代化转型是以对草地土壤有机碳储量精准估算为前提的。