期刊文献+
共找到315篇文章
< 1 2 16 >
每页显示 20 50 100
Long Text Classification Algorithm Using a Hybrid Model of Bidirectional Encoder Representation from Transformers-Hierarchical Attention Networks-Dilated Convolutions Network 被引量:1
1
作者 ZHAO Yuanyuan GAO Shining +1 位作者 LIU Yang GONG Xiaohui 《Journal of Donghua University(English Edition)》 CAS 2021年第4期341-350,共10页
Text format information is full of most of the resources of Internet,which puts forward higher and higher requirements for the accuracy of text classification.Therefore,in this manuscript,firstly,we design a hybrid mo... Text format information is full of most of the resources of Internet,which puts forward higher and higher requirements for the accuracy of text classification.Therefore,in this manuscript,firstly,we design a hybrid model of bidirectional encoder representation from transformers-hierarchical attention networks-dilated convolutions networks(BERT_HAN_DCN)which based on BERT pre-trained model with superior ability of extracting characteristic.The advantages of HAN model and DCN model are taken into account which can help gain abundant semantic information,fusing context semantic features and hierarchical characteristics.Secondly,the traditional softmax algorithm increases the learning difficulty of the same kind of samples,making it more difficult to distinguish similar features.Based on this,AM-softmax is introduced to replace the traditional softmax.Finally,the fused model is validated,which shows superior performance in the accuracy rate and F1-score of this hybrid model on two datasets and the experimental analysis shows the general single models such as HAN,DCN,based on BERT pre-trained model.Besides,the improved AM-softmax network model is superior to the general softmax network model. 展开更多
关键词 long text classification dilated convolution BERT fusing context semantic features hierarchical characteristics BERT_HAN_DCN AM-softmax
在线阅读 下载PDF
基于TextRank和自注意力的长文档无监督抽取式摘要
2
作者 邢玲 程兵 闫强 《计算机应用与软件》 北大核心 2025年第3期274-283,共10页
针对中文长文档自动文本摘要问题,提出将TextRank与自注意力相融合的两种模型:TRAI和TRAO。TRAI将基于统计共现字数得到的句子相似性同基于自注意力得到的句子相关性进行加权求和,作为TextRank边的权重参与迭代计算,对句子进行打分。TRA... 针对中文长文档自动文本摘要问题,提出将TextRank与自注意力相融合的两种模型:TRAI和TRAO。TRAI将基于统计共现字数得到的句子相似性同基于自注意力得到的句子相关性进行加权求和,作为TextRank边的权重参与迭代计算,对句子进行打分。TRAO利用TextRank对句子打分;利用自注意力重新表示每个句子融合整个文档信息的分布式向量,在此基础上计算句子间余弦相似度,作为TextRank边的权重参与迭代计算,给句子打分;将两种得分加权求和作为句子最终得分。两种模型均根据得分对句子进行排序得到候选摘要。为去除摘要冗余性,利用最大边界相关法(Maximal Marginal Relevance,MMR)在候选摘要中选取摘要句子。将提出的两种模型在构建的长文档上进行实验,与TextRank方法相比,所提方法在ROUGE评价指标上有显著提高。 展开更多
关键词 中文长文本摘要 textRank 自注意力机制 分布式向量表示 语义信息 融合文档信息
在线阅读 下载PDF
基于长文本和特征增强的煤矿事故实体识别
3
作者 温乃宁 范爽爽 史晓楠 《计算机工程与设计》 北大核心 2025年第9期2683-2689,共7页
针对煤矿事故领域中长文本、长实体和复杂实体难以准确识别的问题,提出一种基于长文本和特征增强的煤矿事故实体识别模型。该模型嵌入层在ALBERT的基础上引入了全局注意力掩码,用来调节滑窗注意力和全局注意力之间的分配,从而更好的平... 针对煤矿事故领域中长文本、长实体和复杂实体难以准确识别的问题,提出一种基于长文本和特征增强的煤矿事故实体识别模型。该模型嵌入层在ALBERT的基础上引入了全局注意力掩码,用来调节滑窗注意力和全局注意力之间的分配,从而更好的平衡全局和局部信息;编码层引入门控线性单元和BiLSTM增强模型的特征表示能力;解码层使用CRF来获得最佳标记序列。实验结果表明,该模型较基准模型的F1值提升了1.9%,在煤矿事故实体识别中具有优越的性能。 展开更多
关键词 命名实体识别 煤矿事故 预训练语言模型 门控线性单元 注意力机制 长文本 特征增强
在线阅读 下载PDF
面向舆论情感识别的自然语言处理技术 被引量:2
4
作者 王敏 汪旭 《现代电子技术》 北大核心 2025年第12期115-119,共5页
为提高舆情风险预测的准确性和效率,提出一种基于注意力机制与双向长短期记忆(BiLSTM)网络相结合的舆情感知模型。该方法通过结合BiLSTM的双向建模能力与注意力机制的特征聚焦能力,精准捕捉舆论数据中的情感波动和上下文语义特征,从而... 为提高舆情风险预测的准确性和效率,提出一种基于注意力机制与双向长短期记忆(BiLSTM)网络相结合的舆情感知模型。该方法通过结合BiLSTM的双向建模能力与注意力机制的特征聚焦能力,精准捕捉舆论数据中的情感波动和上下文语义特征,从而提升舆情风险的预测精度。同时以“高考冒名顶替”事件为样本,展开网络舆论数据分析。通过与ELM、随机森林、决策树、LSTM、BiGRU和BiLSTM等多种主流算法进行对比实验,验证所提模型的有效性和优越性。在算法设计中,注意力机制的引入有效地提升了模型在长文本情感分类中的表现,能够精确捕捉情感变化的关键节点。实验结果表明,所提出的预测模型能够有效地识别出舆情风险,准确率达到94.87%,相比于表现最优的BiGRU算法提高了约5.75%。 展开更多
关键词 舆情风险预测 情感识别 自然语言处理 双向长短期记忆网络 注意力机制 文本分类
在线阅读 下载PDF
面向工艺设计的领域大模型构建方法 被引量:3
5
作者 刘祥根 郭彦 +6 位作者 李玥 史建成 刘文 邓洪波 孙晨伟 李阳 吕建成 《四川大学学报(自然科学版)》 北大核心 2025年第3期513-521,共9页
面向工艺设计的智能化需求,领域大模型的构建方法成为关键研究方向.尽管大规模语言模型(Large Language Models,LLMs)的发展极大地推动了自然语言处理技术的进步,但工艺设计领域的数据通常存在样本稀缺、格式复杂以及缺乏结构化标签等问... 面向工艺设计的智能化需求,领域大模型的构建方法成为关键研究方向.尽管大规模语言模型(Large Language Models,LLMs)的发展极大地推动了自然语言处理技术的进步,但工艺设计领域的数据通常存在样本稀缺、格式复杂以及缺乏结构化标签等问题,使得通用LLMs训练方法难以直接适用.此外,传统注意力机制在处理长文本和复杂任务时仍然面临计算复杂度高、资源消耗大、全局语义不稳定等挑战,进一步限制了大模型在工艺设计任务中的适应性.为解决这一问题,本研究提出了一种面向工艺设计的领域大模型构建方法,并在此基础上训练了具备100亿参数规模的工艺设计大模型——鲁班-10B.该方法引入混合稀疏注意力机制,通过保留起始词元的注意力权重,并基于查询内容动态选取相关性最高的若干历史词元,避免对完整序列计算密集型注意力矩阵,在有效降低计算复杂度的同时,提升模型对长文本中关键信息的建模能力.实验结果表明,鲁班-10B能够有效提升领域大模型在工艺设计任务中的适应能力与生成表现,为智能化工艺设计提供了新的技术路径与支撑. 展开更多
关键词 大规模语言模型 注意力机制 长文本生成 工艺设计
在线阅读 下载PDF
管理者长期主义促进了商业向善吗?——基于创业板上市公司社会责任的视角
6
作者 徐宁 张迪 李昱潼 《经济与管理研究》 北大核心 2025年第9期108-125,共18页
商业向善是维系企业乃至社会可持续发展的必由之路,但创业板公司在履行社会责任方面的积极性整体偏弱,内生动力尚不明确。本文基于跨期选择理论,在运用文本分析与机器学习方法构建管理者长期主义指标的基础上,以创业板上市公司为样本研... 商业向善是维系企业乃至社会可持续发展的必由之路,但创业板公司在履行社会责任方面的积极性整体偏弱,内生动力尚不明确。本文基于跨期选择理论,在运用文本分析与机器学习方法构建管理者长期主义指标的基础上,以创业板上市公司为样本研究管理者长期主义特质对企业社会责任承担的影响及机制。结果显示:(1)管理者长期主义能够有效促进创业板公司社会责任的履行;(2)管理者长期主义能够通过缓解两类委托代理问题与提高内部控制质量促进创业板公司的社会责任承担;(3)管理者激励强度与环境不确定性等内外部因素增强了管理者长期主义对创业板公司社会责任承担的积极效应;(4)在非国有产权性质下以及位于市场化指数较高的地区,管理者长期主义的作用更为明显。本文的研究结论丰富了创业板公司社会责任前因以及管理者长期主义作用后果的相关文献,拓展了跨期选择理论在管理学领域的应用边界,并为组建与激励高管团队以促进商业向善提供了新视角与新路径。 展开更多
关键词 管理者长期主义 企业社会责任 文本分析 机器学习 跨期选择理论
在线阅读 下载PDF
基于BERT融合算法的病例文本结构化模型研究
7
作者 张雪 王琛琛 职宁 《中国医疗设备》 2025年第9期12-19,共8页
目的为提升临床病例文本中非结构化信息的提取效率与准确性,推动医学智能化发展,本研究提出一种基于双向编码器表示融合算法的病例文本结构化模型。方法该模型采用双向编码器进行语义表示,利用图卷积神经网络提取词语间局部依赖,融合长... 目的为提升临床病例文本中非结构化信息的提取效率与准确性,推动医学智能化发展,本研究提出一种基于双向编码器表示融合算法的病例文本结构化模型。方法该模型采用双向编码器进行语义表示,利用图卷积神经网络提取词语间局部依赖,融合长短时记忆网络建立时序关系,并引入条件随机场优化标签序列的一致性。实验选用MIMIC-Ⅲ和ClinicalSTS这2个权威临床数据集进行分析,构建五类医学文本分类任务,对比所有模型在不同结构组合下的性能表现。结果本研究所提出的病例文本结构化模型的精准度、召回率和F1得分分别为0.92、0.90和0.91,均较传统双向编码器模型提升约10%;在处理超过1000字的长文本场景时,模型效率提升达12%,表现出良好的时效性与可扩展性。结论本研究通过验证深度融合多种结构对提高病例文本结构化处理能力的有效性,为智能医学文本分析提供了理论依据。 展开更多
关键词 病例文本 长短时记忆网络 BERT 图卷积神经网络 结构化模型 医学智能化
在线阅读 下载PDF
融合BiLSTM与CNN的推特黑灰产分类模型 被引量:3
8
作者 朱恩德 王威 高见 《计算机工程与应用》 北大核心 2025年第1期186-195,共10页
当前推特等国外社交平台,已成为从事网络黑灰产犯罪不可或缺的工具,对推特上黑灰产账号进行发现、检测和分类对于打击网络犯罪、维护社会稳定具有重大意义。现有的推文分类模型双向长短时记忆网络(bi-directional long short-term memor... 当前推特等国外社交平台,已成为从事网络黑灰产犯罪不可或缺的工具,对推特上黑灰产账号进行发现、检测和分类对于打击网络犯罪、维护社会稳定具有重大意义。现有的推文分类模型双向长短时记忆网络(bi-directional long short-term memory,BiLSTM)可以学习推文的上下文信息,却无法学习局部关键信息,卷积神经网络(convolution neural network,CNN)模型可以学习推文的局部关键信息,却无法学习推文的上下文信息。结合BiLSTM与CNN两种模型的优势,提出了BiLSTM-CNN推文分类模型,该模型将推文进行向量化后,输入BiLSTM模型学习推文的上下文信息,再在BiLSTM模型后引入CNN层,进行局部特征的提取,最后使用全连接层将经过池化的特征连接在一起,并应用softmax函数进行四分类。模型在自主构建的中文推特黑灰产推文数据集上进行实验,并使用TextCNN、TextRNN、TextRCNN三种分类模型作为对比实验,实验结果显示,所提的BiLSTM-CNN推文分类模型在对四类推文进行分类的宏准确率为98.32%,明显高于TextCNN、TextRNN和TextRCNN三种模型的准确率。 展开更多
关键词 文本分类 双向长短期记忆网络(BiLSTM) 卷积神经网络(CNN) 黑灰产 推特
在线阅读 下载PDF
融合降噪微调与图注意力机制的藏文长文本分类
9
作者 敬容 万福成 +2 位作者 黄锐 于洪志 马宁 《计算机工程与科学》 北大核心 2025年第6期1133-1140,共8页
在藏文长文本分类任务中,长距离依赖问题尤为突出。同时,多语言预训练模型在处理藏文文本分类任务时也存在一定的偏差。针对以上问题,基于预训练语言模型CINO-Large,提出融合降噪微调与图注意力机制的藏文长文本分类方法。首先,在CINO-L... 在藏文长文本分类任务中,长距离依赖问题尤为突出。同时,多语言预训练模型在处理藏文文本分类任务时也存在一定的偏差。针对以上问题,基于预训练语言模型CINO-Large,提出融合降噪微调与图注意力机制的藏文长文本分类方法。首先,在CINO-Large中引入不完全信任损失函数In-trust,通过任务适应性损失增强模型在下游任务中的泛化能力。其次,在图结构建模中引入滑动窗口和线性分类,选择性增加文档与文档边缘,提高节点间的特征区分度。最后,利用图注意力机制GAT捕捉不同节点在图中的重要性,完成藏文长文本分类任务。在TNCC中的新闻长文本上,由所提方法构建的模型的分类准确率达到了71.66%,与预训练语言模型CINO-Large相比,其准确率、精确度和F1分数分别提高了1.77%、2.67%和2.03%,在部分分类困难的子类别上,模型的F1分数能显著提升20%左右。 展开更多
关键词 预训练模型 降噪微调 图注意力机制 藏文长文本分类
在线阅读 下载PDF
面向房地产拍卖公告的长文本实体关系抽取方法
10
作者 韩郁 殷永峰 +2 位作者 宋友 仵伟强 王宝会 《中文信息学报》 北大核心 2025年第3期76-83,95,共9页
大多数实体关系联合抽取方法关注实体对在句子内反映的关系,忽略了长文本情景下存在的关系类型分布不均衡等问题。该文面向房地产拍卖公告,基于实体关系抽取思想,针对房地产拍卖公告实体长度较长、关系复杂的情况,设计了一种关系补充抽... 大多数实体关系联合抽取方法关注实体对在句子内反映的关系,忽略了长文本情景下存在的关系类型分布不均衡等问题。该文面向房地产拍卖公告,基于实体关系抽取思想,针对房地产拍卖公告实体长度较长、关系复杂的情况,设计了一种关系补充抽取机制,并结合全局指针网络和二部图匹配算法,最终形成了一个新的关系抽取模型LRCM,增强了模型对长实体和关系重叠三元组的抽取能力,减小了关系类型分布不均衡对关系抽取性能的影响。实验结果显示,该文方法优于其他主流的实体关系抽取方法,在构建的房地产拍卖数据集和WebNLG数据集上,F 1值分别达到了86.0%和92.7%。 展开更多
关键词 实体关系联合抽取 长文本 房地产拍卖公告 关系补充抽取机制
在线阅读 下载PDF
长征国家文化公园价值评价及其分类发展路径研究
11
作者 陈庚 陈熙 《兰州大学学报(社会科学版)》 北大核心 2025年第5期87-100,共14页
长征国家文化公园是传承革命文化和构建“长征精神”符号标识的重要载体,对促进革命文化资源创造性转化与创新性发展、增强中华民族文化认同、筑牢共同体意识具有独特的价值作用。构建长征国家文化公园价值评价维度,客观评价不同区域的... 长征国家文化公园是传承革命文化和构建“长征精神”符号标识的重要载体,对促进革命文化资源创造性转化与创新性发展、增强中华民族文化认同、筑牢共同体意识具有独特的价值作用。构建长征国家文化公园价值评价维度,客观评价不同区域的价值特征和优劣势,是推动长征国家文化公园分类发展的重要路径。通过构建涵盖五大维度的价值评价体系,基于29个长征重要地市相关数据的分析发现,不同地区长征国家文化公园的综合价值差异显著,事件指向性明显;基因传承价值处于均质化初级形态,文物保护价值呈“大分散,小集中”的极差化保护态势,研学教育价值西南区域配置相对不均,红旅融合价值形成弱极差格局,观光收益价值契合“经济—地形”双因素耦合特征;29个地市可划分为高价值—事件驱动型、中等价值—潜力挖掘型、低价值—资源阻滞型三种发展类型。鉴于不同区域长征国家文化公园的价值差异,建议通过协调范式跃迁、观光经济效益转化、公园空间叙事、文化资源拓扑的方式分类推动长征国家文化公园的建设实践。 展开更多
关键词 长征国家文化公园 价值评价 发展类型 政策文本分析
原文传递
LtoG:局部到全局映射的长文本自动摘要
12
作者 王强 卢玲 王爱娟 《重庆理工大学学报(自然科学)》 北大核心 2025年第7期94-101,共8页
自动摘要技术可帮助人们迅速获取文本的核心观点及主要内容,提高用户的信息获取速度,但是传统的长文本摘要技术主要集中于抽取句子,会导致抽取信息碎片化,严重影响了生成摘要的质量。为了解决这些问题,提出了一种局部到全局映射的抽取-... 自动摘要技术可帮助人们迅速获取文本的核心观点及主要内容,提高用户的信息获取速度,但是传统的长文本摘要技术主要集中于抽取句子,会导致抽取信息碎片化,严重影响了生成摘要的质量。为了解决这些问题,提出了一种局部到全局映射的抽取-生成式摘要方法(LtoG)。LtoG是一种结合了“扫描”和“基于深度阅读的生成”两阶段的框架。在扫描阶段,将输入文本切分成块,抽取显著的块。在生成阶段,引入了一种层次训练方法来训练一个模型,利用局部信息到全局映射生成总体摘要。该方法在ICSI和QMSum数据集上分别取得了2.00/1.53/1.62、1.45/0.42/0.69的ROUGE-1/2/L分数提升。证明本文中提出的LtoG能够使用相对较小的内存处理任意长的文本,有效解决了传统基于句子抽取方法中存在的信息碎片化问题。 展开更多
关键词 长文本 切分 抽取-生成 局部到全局
在线阅读 下载PDF
融合N-Gram的水产养殖长文本实体关系联合抽取 被引量:1
13
作者 毕甜甜 张思佳 +3 位作者 孙旭菲 王水涛 王祎涵 安宗诗 《哈尔滨理工大学学报》 北大核心 2025年第2期91-103,共13页
针对水产养殖长文本中存在大量与目标主题无关的信息,导致模型误判和丢失有效信息的问题,提出了融合N-Gram的水产养殖长文本实体关系联合抽取方法。该方法首先采用多模型融合算法提取基于BERT初始化的文本矩阵特征图,进一步利用级联BiL... 针对水产养殖长文本中存在大量与目标主题无关的信息,导致模型误判和丢失有效信息的问题,提出了融合N-Gram的水产养殖长文本实体关系联合抽取方法。该方法首先采用多模型融合算法提取基于BERT初始化的文本矩阵特征图,进一步利用级联BiLSTM提取深层次特征。然后逐层提取融合N-Gram算法预处理的长文本切片矩阵特征,建模切片矩阵的相对位置和绝对位置。在自构建的水产养殖长文本数据集和SKE公共数据集上的实验效果与基准模型相比有了明显提升。实验结果表明,该方法能够充分获取并处理水产养殖长文本中的语义信息,有效提高了实体关系抽取的准确性和完整性。 展开更多
关键词 水产养殖 长文本 实体关系联合抽取 N-Gram算法 多模型融合算法
在线阅读 下载PDF
中文科技政策文本分类:增强的TextCNN视角 被引量:8
14
作者 李牧南 王良 赖华鹏 《科技管理研究》 CSSCI 北大核心 2023年第2期160-166,共7页
近年尽管针对中文本文分类的研究成果不少,但基于深度学习对中文政策等长文本进行自动分类的研究还不多见。为此,借鉴和拓展传统的数据增强方法,提出集成新时代人民日报分词语料库(NEPD)、简单数据增强(EDA)算法、word2vec和文本卷积神... 近年尽管针对中文本文分类的研究成果不少,但基于深度学习对中文政策等长文本进行自动分类的研究还不多见。为此,借鉴和拓展传统的数据增强方法,提出集成新时代人民日报分词语料库(NEPD)、简单数据增强(EDA)算法、word2vec和文本卷积神经网络(TextCNN)的NEWT新型计算框架;实证部分,基于中国地方政府发布的科技政策文本进行算法校验。实验结果显示,在取词长度分别为500、750和1000词的情况下,应用NEWT算法对中文科技政策文本进行分类的效果优于RCNN、Bi-LSTM和CapsNet等传统深度学习模型,F1值的平均提升比例超过13%;同时,NEWT在较短取词长度下能够实现全文输入的近似效果,可以部分改善传统深度学习模型在中文长文本自动分类任务中的计算效率。 展开更多
关键词 NEWT 深度学习 数据增强 卷积神经网络 政策文本分类 中文长文本
在线阅读 下载PDF
融合情感簇的混合神经网络短文本情感分类模型
15
作者 谢修娟 刘雪娟 《高技术通讯》 北大核心 2025年第10期1069-1077,共9页
针对文本分类的深度学习主流模型中存在的特征提取不全面、位置结构信息缺失等问题,提出一种融合情感簇的混合神经网络短文本情感分类模型(sentiment clustering and fusion of multiple neural networks,SCMN)。该方法首先通过双向变... 针对文本分类的深度学习主流模型中存在的特征提取不全面、位置结构信息缺失等问题,提出一种融合情感簇的混合神经网络短文本情感分类模型(sentiment clustering and fusion of multiple neural networks,SCMN)。该方法首先通过双向变换器模型(bidirectional encoder representations from Transformers,BERT)预训练模型生成词向量,并进行情感簇聚类和情感权重增强;然后使用带有注意力机制的双向长短期记忆网络(bidirectional long short term memory,BiLSTM),捕获文本的上下文特征;再通过胶囊网络(capsual network,CapsNet)提取带有句子结构信息的局部语义特征并完成分类。基于公开数据集和自爬取数据集,将本文模型与深度学习主流分类模型进行对比实验及不同组件的消融实验。实验结果表明,相较于其他方法,本文模型精确率实现了平均5.5%的增长,证实了不同组件能为模型带来有效增益,提升文本情感分类效果。 展开更多
关键词 文本情感分类 情感簇 胶囊网络 双向长短期记忆网络 注意力机制
在线阅读 下载PDF
基于BERT与要素提取的相似案例匹配 被引量:1
16
作者 焦宇超 阎刚 《智能计算机与应用》 2025年第1期130-135,共6页
相似法律案件检索是一项特殊的检索任务,对于给定的查询案例,需要从给定的候选案例中搜索相似的案例。与传统的文本匹配不同,法律案件匹配具有文本较长、主题性强的特点。针对上述问题,本文提出了一种基于案件要素的相似案例检索方法。... 相似法律案件检索是一项特殊的检索任务,对于给定的查询案例,需要从给定的候选案例中搜索相似的案例。与传统的文本匹配不同,法律案件匹配具有文本较长、主题性强的特点。针对上述问题,本文提出了一种基于案件要素的相似案例检索方法。首先对BERT模型使用通用语料进行微调;然后采用段落聚合方法,对案件文书上下文语义信息进行编码,同时将法律文书数据融入模型。本文在LeCaRD数据集上进行了广泛的实验,实验结果表明,本文提出的模型优于现有模型。 展开更多
关键词 相似案例匹配 BERT 长文本 法律要素
在线阅读 下载PDF
基于BERT-BiLSTM-ATT的大宗商品新闻情感分析 被引量:1
17
作者 柳标良 谷晓燕 《软件导刊》 2025年第5期35-39,共5页
为了实现对大宗商品新闻的情感分析,针对传统方法未联系上下文语义关系,且忽略了文本中的重要信息,以及BERT难以处理长文本的问题,提出一种基于完整句分割的BERT-BiLSTM-ATT情感分析模型。首先,按照完整句的分割模式将新闻文本分割成多... 为了实现对大宗商品新闻的情感分析,针对传统方法未联系上下文语义关系,且忽略了文本中的重要信息,以及BERT难以处理长文本的问题,提出一种基于完整句分割的BERT-BiLSTM-ATT情感分析模型。首先,按照完整句的分割模式将新闻文本分割成多个部分;其次,使用BERT模型获取大宗商品新闻文本的特征表示;再次,将获取的文本特征最大池化后输入到BiLSTM,提取新闻的情感特征,在BiLSTM输出前增加注意力层提高分类精度;最后,使用Softmax分类器对提取的特征进行分类。实验结果表明,该模型的F1指标相较于BERT-LSTM、BERT-BiLSTM、BERT-BiLSTM-ATT分别提高了5.4%、3.4%、2.2%,证明了该方法在情感分析中的有效性。 展开更多
关键词 大宗商品新闻 情感分析 长文本处理 完整句分割
在线阅读 下载PDF
基于BEiT-RoBERTa的藏文吾美体识别
18
作者 贡保杰布 黄鹤鸣 +1 位作者 才让当知 周子琦 《计算机仿真》 2025年第7期395-401,455,共8页
针对藏文吾美体字形复杂以及数据稀缺导致藏文吾美体长文本识别精度低的问题,提出了一种端到端的藏文吾美体长文本识别方法BEiT-RoBERTa。首先,通过在汉文手写数据集上预训练的BEiT模型来提取藏文吾美体长文本特征,然后,使用RoBERTa解... 针对藏文吾美体字形复杂以及数据稀缺导致藏文吾美体长文本识别精度低的问题,提出了一种端到端的藏文吾美体长文本识别方法BEiT-RoBERTa。首先,通过在汉文手写数据集上预训练的BEiT模型来提取藏文吾美体长文本特征,然后,使用RoBERTa解码器对提取到的特征和输入的文本标签进行解码。同时,考虑到藏文文字结构与提出方法的适配度,分析并选取了最适合本方法的藏文文字识别单元。实验结果表明,BEiT-RoBERTa在自行构建的藏文吾美印刷体数据集TCPD上,音节识别准确率达到了99.80%;接近当前最先进方法上吾坚体的识别效果;行识别准确率达到了83.40%,与目前主流方法相比,提升了7.9个百分点,证明了该方法对藏文长文本吾美体识别的有效性。 展开更多
关键词 藏文文字识别 端到端方法 预训练模型 吾美体 长文本
在线阅读 下载PDF
企业创新信息披露与耐心资本认同——基于机构投资者结构的经验证据 被引量:8
19
作者 张悦 汪顺 周泽将 《上海财经大学学报(哲学社会科学版)》 北大核心 2025年第1期31-46,共16页
基于长期价值投资原则,耐心资本往往更注重企业的创新能力和长期发展潜力。然而创新是一项周期长、风险大的投资活动,信息不对称程度极高,难以准确反映企业的投资价值。因此,探究如何有效缓解创新信息不对称,进而吸引更多的耐心资本投... 基于长期价值投资原则,耐心资本往往更注重企业的创新能力和长期发展潜力。然而创新是一项周期长、风险大的投资活动,信息不对称程度极高,难以准确反映企业的投资价值。因此,探究如何有效缓解创新信息不对称,进而吸引更多的耐心资本投资对企业可持续发展具有重要意义。为此,文章基于上市公司创新文本信息数据,从机构投资者结构的视角,考察了企业创新信息披露对耐心资本认同的影响。研究发现,创新信息披露能够通过优化信息环境效应和提升风险共担效应获取耐心资本认同,表现为长期机构投资者持股比例明显上升。在外部信息环境更好、内部治理水平更高以及管理层决策视阈更长期、自身创新禀赋更丰裕的企业组中,创新信息披露提升耐心资本认同的作用更为显著。此外,相对于交易型和压力敏感型机构投资者而言,创新信息披露更利于获取稳定型和压力抵抗型机构投资者的认同。文章有助于理解企业信息披露与机构投资者结构之间的内在关联,为公司合理制定创新信息披露策略、引入更多的长期耐心资本提供理论参考。 展开更多
关键词 创新信息披露 创新文本信息 耐心资本 机构投资者结构 长期机构投资者
原文传递
基于外部知识查询的视觉问答
20
作者 徐钰涛 汤守国 《计算机科学》 北大核心 2025年第S1期247-254,共8页
为了有效解决现阶段视觉问答(Visual Question Answering,VQA)模型难以处理需要额外知识才能解答的问题,文中提出了一种问题引导的外部知识查询机制(Question-Guided Mechanism for Querying External Knowledge,QGK),旨在集成关键知识... 为了有效解决现阶段视觉问答(Visual Question Answering,VQA)模型难以处理需要额外知识才能解答的问题,文中提出了一种问题引导的外部知识查询机制(Question-Guided Mechanism for Querying External Knowledge,QGK),旨在集成关键知识以丰富问题文本,从而提高VQA模型的准确率。首先,开发了一种问题引导的外部知识查询机制(QGK),以扩充模型内的文本特征表示并增强其处理复杂问题的能力。其中包含了多阶段处理流程,包括关键词提取、查询构造、知识筛选和提炼步骤。其次,还引入了视觉常识特征以验证所提方法的有效性。实验结果表明,所提出的查询机制能够有效提供重要的外部知识,显著提升模型在VQA v2.0数据集上的准确率。当将查询机制单独加入基线模型时,准确率提升至71.05%;而将视觉常识特征与外部知识查询机制相结合时,模型的准确率进一步提高至71.38%。这些结果验证了所提方法对于提升VQA模型性能的显著效果。 展开更多
关键词 视觉问答 外部知识库 查询机制 长短时记忆网络 文本特征
在线阅读 下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部