期刊文献+
共找到1,222篇文章
< 1 2 62 >
每页显示 20 50 100
多智能体驱动的虚拟学生模拟助力教师答疑能力提升
1
作者 孙建文 冯锦天 万仟 《华中师范大学学报(自然科学版)》 北大核心 2025年第5期721-729,共9页
随着大模型等生成式人工智能技术的快速发展,其在教育领域的应用不断拓展,为教师专业发展带来了新的机遇.答疑能力作为教师教学过程中的关键技能,在高度抽象化和逻辑化的数理学科教学中尤为重要.然而,当前教师教育中缺乏贴近真实、可反... 随着大模型等生成式人工智能技术的快速发展,其在教育领域的应用不断拓展,为教师专业发展带来了新的机遇.答疑能力作为教师教学过程中的关键技能,在高度抽象化和逻辑化的数理学科教学中尤为重要.然而,当前教师教育中缺乏贴近真实、可反复练习的答疑训练手段,限制了教师实践能力的提升.基于此背景,本文提出学生模拟引擎(student simulation engine,SSE),由大模型驱动的多智能体协作构成.该系统基于IDEAL问题解决理论,将学生的答题过程拆解为读题、思考、解题和检查四个子步骤,通过动态建模学生状态,并在各阶段引入类人错误,以实现不同能力水平学生的真实模拟.SSE包括控制模块与执行模块,前者负责推理学生状态与规划错误策略,后者逐阶段执行任务并生成自然对话.在公开数学数据集GSM8K上的实验表明,SSE能够生成具有人类学生特征的互动过程,并显著提升教师的答疑训练体验.本研究为教师答疑能力提升提供了新的训练场景,同时为大模型赋能教师教育提供了实践路径. 展开更多
关键词 教师教育 答疑能力 学生模拟 大模型 智能体
在线阅读 下载PDF
基于TILT、DBNet与CRNN的图书封面文字识别算法
2
作者 秦燕 《图书情报导刊》 2025年第5期27-34,共8页
从图书封面自动识别文字是获取元数据的关键,但书籍摆放角度、复杂设计及光照条件显著影响识别精度。为此,提出多阶段协同的级联框架,融合DBNet检测网络、改进的TILT姿态矫正算法与CRNN序列模型,构建“检测—矫正—再检测”闭环流程。... 从图书封面自动识别文字是获取元数据的关键,但书籍摆放角度、复杂设计及光照条件显著影响识别精度。为此,提出多阶段协同的级联框架,融合DBNet检测网络、改进的TILT姿态矫正算法与CRNN序列模型,构建“检测—矫正—再检测”闭环流程。首先通过DBNet初步定位文字区域,随后采用局部低秩优化的TILT算法对所有文字区域进行一次性几何校正,再通过DBNet二次检测精确定位文字位置,最终结合CRNN实现多语言混合文本的高效识别。双重检测机制抑制误差传播,局部低秩优化避免全局矫正对背景的敏感性,在常规与倾斜场景下均提升识别鲁棒性。实验表明,较传统OCR及主流深度学习模型,该方法在复杂图书封面场景中准确性与适应性更优,为图书馆数字化管理的文字信息提取提供有效技术路径。 展开更多
关键词 深度学习 光学字符识别 神经网络 图书馆自动化 图书元数据管理
在线阅读 下载PDF
基于语义特征提取的隐式情感分析方法 被引量:1
3
作者 丛眸 彭涛 朱蓓蓓 《吉林大学学报(理学版)》 北大核心 2025年第1期107-113,共7页
针对目前隐式情感语句中情感词不明显或较少、表达方式委婉等问题,提出一种基于语义特征提取的隐式情感分析方法.该方法通过引入与隐式情感语句相关的事实信息作为辅助特征,并利用RoBERTa预训练模型对文本及其辅助特征进行深度语义交互... 针对目前隐式情感语句中情感词不明显或较少、表达方式委婉等问题,提出一种基于语义特征提取的隐式情感分析方法.该方法通过引入与隐式情感语句相关的事实信息作为辅助特征,并利用RoBERTa预训练模型对文本及其辅助特征进行深度语义交互,以获取全局特征;同时,采用双向门控循环单元(BiGRU)捕捉局部特征,最后结合注意力池化技术计算情感权重,从而更准确地识别和理解隐含的情感信息.在数据集Snopes和PolitiFact上进行仿真实验,实验结果表明,该方法在隐式情感分析方面性能优异,不仅在多个评价指标上超越了现有方法,且整体性能得到显著提升,为更广泛的情感分析应用场景提供了有效的解决方案,特别是在处理复杂和间接表达的情感内容时,具有重要的应用价值和意义. 展开更多
关键词 语义特征 隐式情感分析 双向门控循环单元 注意力池化
在线阅读 下载PDF
文本问答中基于双向叠加注意力的证据区间预测
4
作者 吐尔地·托合提 罗长虹 艾斯卡尔·艾木都拉 《计算机工程与科学》 北大核心 2025年第8期1470-1482,共13页
文本问答通常仅依靠文本与问题的单向匹配关系来定位证据区间并作答,在面临远端干扰及多处答案词等语义困难时难以捕捉精短证据区间。针对此问题,提出一种基于双向叠加注意力机制的证据区间预测模型ESP-BSA。首先,将问题与文本进行交叉... 文本问答通常仅依靠文本与问题的单向匹配关系来定位证据区间并作答,在面临远端干扰及多处答案词等语义困难时难以捕捉精短证据区间。针对此问题,提出一种基于双向叠加注意力机制的证据区间预测模型ESP-BSA。首先,将问题与文本进行交叉匹配来丰富隐式交互的文本语义;其次,根据证据分布互异性设计软证据标签对来表示前向和后向证据得分;最后,对序列中每个位置的证据得分双向叠加以获得更符合上下文语境要求的证据区间。实验结果表明,所提方法在Span-F1,Span-EM等评价指标上较基线模型有所提升,证实了其在复杂语境中能够有效提高证据区间预测精确度和问答准确性。 展开更多
关键词 文本问答 证据区间 注意力机制 双向叠加 软证据标签
在线阅读 下载PDF
融合多特征的藏语方言自动辨识方法
5
作者 尕藏才让 高定国 仁青东主 《计算机工程与科学》 北大核心 2025年第6期1114-1120,共7页
藏语方言众多,内部差异显著,因此藏语方言自动辨识研究在语言学、语音信息处理和刑事侦查与公共安全等领域均具有重要价值。目前,藏语方言辨识的常用方法依赖于各种声学特征和基于大数据的深度学习模型。然而,传统声学特征不能充分表示... 藏语方言众多,内部差异显著,因此藏语方言自动辨识研究在语言学、语音信息处理和刑事侦查与公共安全等领域均具有重要价值。目前,藏语方言辨识的常用方法依赖于各种声学特征和基于大数据的深度学习模型。然而,传统声学特征不能充分表示藏语各方言之间的细微差别,深度学习在小规模数据集上难以实现高精度的方言识别。为解决这一问题,提出了一种融合多种特征的藏语方言自动辨识方法。该方法结合梅尔频率倒谱系数(MFCC)、伽马通频率倒谱系数(GFCC)以及包含清浊音信息的短时能量(STE)值,形成一个多信息融合的方言辨识特征,采用双向长短期记忆(Bi-LSTM)网络对卫藏、安多和康巴等主要藏语方言进行了识别。实验结果表明,提出的多特征融合方法相对于采用单一特征的MFCC,GFCC和STE方法分别提高了10.73%、10.78%和59.48%的辩识准确率,最终达到94.89%的辨识准确率,有效地验证了所提方法的有效性和实用性。 展开更多
关键词 多特征融合 藏语方言 自动辨识
在线阅读 下载PDF
基于知识图谱中多维元路径的科技文档查询扩展
6
作者 徐建民 仝思梦 张国防 《计算机工程与科学》 北大核心 2025年第8期1493-1502,共10页
针对现有科技文档的查询扩展方法存在文档信息利用不充分、文档间关联关系未能有效利用等方面的局限性,提出一种基于知识图谱中多维元路径的科技文档查询扩展方法。首先,对伪相关反馈文档集进行处理得到候选扩展词集;其次,在对科技文档... 针对现有科技文档的查询扩展方法存在文档信息利用不充分、文档间关联关系未能有效利用等方面的局限性,提出一种基于知识图谱中多维元路径的科技文档查询扩展方法。首先,对伪相关反馈文档集进行处理得到候选扩展词集;其次,在对科技文档知识图谱进行分析的基础上,寻找合适的元路径表示用户查询与候选扩展词的关联关系,并基于节点间不同的元路径关联计算用户查询与候选扩展词之间的多维语义相关度;最后,融合多维语义相关度以及候选扩展词在伪相关反馈文档集中的权重选择最终扩展词,实现对用户查询的扩展。实验结果显示,与已有的查询扩展方法相比,基于知识图谱中多维元路径的科技文档查询扩展方法在mAP,DCG和NDCG上分别至少提升了9.21%,10%和11.7%。 展开更多
关键词 知识图谱 查询扩展 多维元路径 科技文档 信息检索
在线阅读 下载PDF
一种基于改进加权LDA模型的敏感词识别模型
7
作者 曾玲 林天余 +2 位作者 何秋霞 陈莹 胡娟娟 《兵工自动化》 北大核心 2025年第6期28-32,共5页
针对目前互联网中主题识别时存在数据复杂、预测精度低的缺陷,提出一种基于改进加权潜在狄利克雷分配(latent Dirichlet allocation,LDA)模型的敏感词识别模型。建立特定领域敏感词语料库;为提高敏感信息主题的识别效率,对语料库进行粗... 针对目前互联网中主题识别时存在数据复杂、预测精度低的缺陷,提出一种基于改进加权潜在狄利克雷分配(latent Dirichlet allocation,LDA)模型的敏感词识别模型。建立特定领域敏感词语料库;为提高敏感信息主题的识别效率,对语料库进行粗粒度文本分类;通过加权模型,提高共现频率低但敏感特征明显的词的分布权重,从而可以发现更多具有低频隐式关系的词;以主流新闻网站爬取的数据为例,对所提模型进行验证。结果表明:该模型可识别和提取每个类别的文本更详细的敏感信息主题,该模型有效且准确。 展开更多
关键词 主题识别 敏感词 自然语言处理 潜在狄利克雷分配
在线阅读 下载PDF
低资源场景下的汉语—传统蒙古语跨语言摘要方法研究
8
作者 班琪 云静 邓磊 《计算机工程与科学》 北大核心 2025年第5期931-939,共9页
跨语言摘要任务旨在给定一种语言的源文档(如中文)生成目标语言(如传统蒙古文)的摘要。传统的多任务框架通常采用序列到序列的网络,应用多个专用于各特定任务的解码器。然而,在将文档从一种语言提炼为另一种具有不同形态和结构特性语言... 跨语言摘要任务旨在给定一种语言的源文档(如中文)生成目标语言(如传统蒙古文)的摘要。传统的多任务框架通常采用序列到序列的网络,应用多个专用于各特定任务的解码器。然而,在将文档从一种语言提炼为另一种具有不同形态和结构特性语言的摘要时,多任务框架无法有效捕捉和理解2种语言之间的关系和差异。特别是对于传统蒙古语,其形态变化繁杂、构词形式多样的特点,使得低资源下语言特征的学习和处理变得更加困难。为了解决这一问题,提出一种在多任务框架中引入一致性学习的跨语言摘要模型。通过计算源语言摘要和生成的目标语言摘要之间概率分布差异的距离度量进行一致性建模,在交叉熵损失和一致性损失的约束下优化跨语言摘要模型。此外,构建了一个中—蒙跨语言摘要数据集,在此数据集上获得了有竞争力的ROUGE分数,表明了所提模型在资源匮乏情况下的有效性。 展开更多
关键词 中—蒙跨语言摘要 一致性学习 低资源
在线阅读 下载PDF
基于RT-DETR的变电站作业人员误入带电区域检测算法研究
9
作者 魏家宇 许欣 《机电信息》 2025年第21期54-57,共4页
变电站是电力系统的关键枢纽区域,承担着电力传输和分配的重要任务。变电站中的带电区域具有极高的危险性,作业人员误入往往会引发严重的人身伤害和设备故障。针对现有的电力作业工作票制度存在的响应滞后问题,提出一种基于RT-DETR(Real... 变电站是电力系统的关键枢纽区域,承担着电力传输和分配的重要任务。变电站中的带电区域具有极高的危险性,作业人员误入往往会引发严重的人身伤害和设备故障。针对现有的电力作业工作票制度存在的响应滞后问题,提出一种基于RT-DETR(Real-Time Detection Transformer,实时检测转化器)的作业人员误入带电区域行为识别与预警算法。该算法融合视频图像识别、实时目标检测、混合编码器等,可对带电区域内作业人员做到实时、精准检测定位,再结合电力作业工作票制度,实现对作业人员误入行为的精准识别与快速预警,以满足现代智能电网对高效、精确、安全的要求,为智慧变电站安全管理提供了新思路。 展开更多
关键词 变电站 安全管控 RT-DETR 多模态
在线阅读 下载PDF
基于Tesseract-O的抽水蓄能电站工程项目电子档案管理数字化研究
10
作者 范纪琨 王艳 +2 位作者 钱向清 周保宗 刘芳 《自动化技术与应用》 2025年第6期61-66,共6页
针对抽水蓄能电站工程项目中,传统的纸质档案管理方式效率低下,易丢失、难查找等问题,研究系统将数据采集、图像预处理、文字识别等多个核心模块集成在一个统一的框架中,设计一种新的基于Tesseract-O的抽水蓄能电站工程项目电子档案数... 针对抽水蓄能电站工程项目中,传统的纸质档案管理方式效率低下,易丢失、难查找等问题,研究系统将数据采集、图像预处理、文字识别等多个核心模块集成在一个统一的框架中,设计一种新的基于Tesseract-O的抽水蓄能电站工程项目电子档案数字化管理系统。实验结果表明,该系统的识别准确率为81.2%,成本效益得分为63.4,易用性得分为85.9。综合来看,所提系统在提升档案管理效率、降低丢失风险、增强信息检索便捷性等方面展现出了显著优势。 展开更多
关键词 文字识别 管理系统 双边滤波器
在线阅读 下载PDF
基于ER Rule的多分类器汽车评论情感分类研究 被引量:1
11
作者 周谧 周雅婧 +1 位作者 贺洋 方必和 《运筹与管理》 CSSCI CSCD 北大核心 2024年第5期161-168,共8页
该文针对汽车评论语料的情感二分类问题,提出一种基于证据推理规则的多分类器融合的情感分类方法。在情感特征构建方面,通过实验对比不同特征模型对分类结果的影响,并改进传统的TFIDF权重计算方法。同时,在此基础上使用ER Rule融合不同... 该文针对汽车评论语料的情感二分类问题,提出一种基于证据推理规则的多分类器融合的情感分类方法。在情感特征构建方面,通过实验对比不同特征模型对分类结果的影响,并改进传统的TFIDF权重计算方法。同时,在此基础上使用ER Rule融合不同分类器进行文本情感极性分析,并考虑各分类器的权重和可靠度。最后,爬取汽车网站上的评论数据对上述方法进行测试,并用公开的中文酒店评论语料数据进行了验证,结果表明该方法能够有效集成不同分类器的优点,与传统机器学习分类算法相比,其结果在Recall,F1值和Accuracy三个指标上得到了提高,与目前流行的深度学习算法和集成学习算法相比,其结果总体占优。 展开更多
关键词 证据推理规则 多分类器融合 TFIDF权重 深度学习算法 集成学习算法
在线阅读 下载PDF
融合特征投影和负监督的文本分类
12
作者 冯兴杰 曹若轩 《计算机工程与科学》 CSCD 北大核心 2024年第10期1864-1874,共11页
用于分类的文本往往存在语义模糊、特征稀疏的问题,并且句中的某些词语含义会与文本真实标签所代表的语义不一致,这都会导致分类错误。针对上述问题,提出一种融合特征投影和负监督的多任务文本分类模型,主任务利用特征投影网络提取类别... 用于分类的文本往往存在语义模糊、特征稀疏的问题,并且句中的某些词语含义会与文本真实标签所代表的语义不一致,这都会导致分类错误。针对上述问题,提出一种融合特征投影和负监督的多任务文本分类模型,主任务利用特征投影网络提取类别特征明显的纯化向量并进行分类;辅助任务给予模型负监督,以扩大不同类别文本的向量差别,消除个别词语的负面影响。此外,使用RoBERTa和BiL-STM同时对正、负样本进行特征提取,捕捉丰富的语义信息。在THUCNews新闻标题分类和微粒贷语义相似度分析数据集上进行了实验,结果表明本文模型相比现有模型具有更好的效果。 展开更多
关键词 文本分类 特征投影 负监督 多任务模型 RoBERTa BiLSTM
在线阅读 下载PDF
大模型提示词的生成、共享和复用
13
作者 杨栋 孙秋瑞 《北京联合大学学报》 2025年第4期1-6,共6页
大模型提示词从早期的口语对话,发展到当今的智能体角色和技能描述。提示词的使用效果依赖于用户自行摸索,目前仍缺乏自动生成、共享与复用机制。构建基于提示词要素规范化的生成机制,以及基于提示词数据库的共享和复用机制,并提出未来... 大模型提示词从早期的口语对话,发展到当今的智能体角色和技能描述。提示词的使用效果依赖于用户自行摸索,目前仍缺乏自动生成、共享与复用机制。构建基于提示词要素规范化的生成机制,以及基于提示词数据库的共享和复用机制,并提出未来发展方向,旨在促进大模型在教育及其他领域的高效应用。 展开更多
关键词 大模型 提示词 生成 共享 复用
在线阅读 下载PDF
基于注意力机制的海关报表识别方法研究
14
作者 万燕 李毅凡 姚砺 《智能计算机与应用》 2024年第4期26-33,共8页
海关报表作为进出口业务中的重要材料,需要快速识别文本并录入系统,提高业务效率。海关报表图像通常存在字迹模糊粘连、字号过小和噪声污染等问题,增加了报表文本识别的难度。本文针对海关报表图片识别准确率低的问题,提出了基于注意力... 海关报表作为进出口业务中的重要材料,需要快速识别文本并录入系统,提高业务效率。海关报表图像通常存在字迹模糊粘连、字号过小和噪声污染等问题,增加了报表文本识别的难度。本文针对海关报表图片识别准确率低的问题,提出了基于注意力机制的海关报表识别方法。在DBNet模型中引入了注意力机制,提升小字符文本检测能力,使网络更加关注字符相关区域;在视觉模型中引入可变形卷积模块,扩大感受野,并将视觉特征和语义特征增强后通过门控机制实现多模态融合,提升对低质量字符的识别精度。实验结果表明,本文方法在海关报表低质量图像的检测和识别准确率方面领先其他方法。 展开更多
关键词 海关报表识别 注意力机制 文本识别
在线阅读 下载PDF
基于话题决策模型的英文文本切题度计算方法研究
15
作者 胡婷 《自动化技术与应用》 2024年第4期60-62,98,共4页
为了对英文作文考试中英文文本的切题度加以判断,提出一套基于话题决策模型的英文文本切题度计算方法。介绍该算法的数据处理流程与话题决策模型的数据处理方法,最后通过WIKI_727K数据集对话题决策模型进行训练与测试,经实验研究发现,... 为了对英文作文考试中英文文本的切题度加以判断,提出一套基于话题决策模型的英文文本切题度计算方法。介绍该算法的数据处理流程与话题决策模型的数据处理方法,最后通过WIKI_727K数据集对话题决策模型进行训练与测试,经实验研究发现,所提出的话题决策模型在精确率、召回率等方面具有一定的应用优势,并在ASAP数据集上表现出较为理想的切题度判断效果。 展开更多
关键词 英文文本 切题度 话题决策模型
在线阅读 下载PDF
基于多头注意力机制与长短期记忆网络的自然场景文本识别 被引量:2
16
作者 姚炜 冯宪伟 《传感技术学报》 CSCD 北大核心 2024年第12期2107-2112,共6页
随着计算机视觉和自然语言处理技术的不断发展,自然场景文本检测与识别技术已成为计算机视觉领域的研究热点之一。提出了一种基于多头注意力机制与长短期记忆网络(LSTM)的自然场景文本检测与识别方法。该方法通过结合目标检测算法和序... 随着计算机视觉和自然语言处理技术的不断发展,自然场景文本检测与识别技术已成为计算机视觉领域的研究热点之一。提出了一种基于多头注意力机制与长短期记忆网络(LSTM)的自然场景文本检测与识别方法。该方法通过结合目标检测算法和序列识别算法,利用多头注意力机制对图像中的文本区域进行精确的定位和特征提取,进而通过LSTM网络对提取的特征进行编码和解码,实现对自然场景中文本的准确识别。在文本检测阶段,采用基于深度学习的目标检测算法,结合多头注意力机制,通过并行计算多个独立的注意力头来捕获图像中不同尺度和方向上的文本信息,提高文本检测的准确性和鲁棒性。在文本识别阶段,利用LSTM网络对检测到的文本区域进行序列建模,通过编码和解码过程将图像中的文本信息转化为可读的字符序列。实验结果表明,所提出的方法在自然场景文本检测与识别任务上取得了优异的性能。与现有的方法相比,所提出的方法在准确性和鲁棒性方面均有所提升,尤其是在处理复杂背景和多样化文本时表现出更好的适应性。 展开更多
关键词 文本检测与识别 多头注意力机制 自然场景文本 长短期记忆网络
在线阅读 下载PDF
基于改进TextSnake的印章字符检测算法
17
作者 甘辉鑫 巩荣芬 +1 位作者 储茂祥 杨永辉 《辽宁科技大学学报》 CAS 2024年第3期213-220,共8页
针对字符模糊、宽高比多变、与背景文字重叠等因素导致的印章字符易被漏检、误检等问题,提出基于TextSnake的印章字符检测算法,记作TextSnake-CR算法。首先在特征融合中嵌入手工设计的感受野增强模块,使浅层特征拥有更大感受视野,从而... 针对字符模糊、宽高比多变、与背景文字重叠等因素导致的印章字符易被漏检、误检等问题,提出基于TextSnake的印章字符检测算法,记作TextSnake-CR算法。首先在特征融合中嵌入手工设计的感受野增强模块,使浅层特征拥有更大感受视野,从而有效地降低误检率;其次提出颜色特征提取模块,用于提取印章字符中颜色特征,增强模糊印章字符的检测精度;最后改进模型的分类损失函数,抑制背景噪声对模型的干扰,进一步提高模型检测性能。实验结果表明,TextSnake-CR在公开印章数据集与自制数据集上的F值分别达到90.71%和81.79%,与其他算法相比,有效地提高了印章字符检测准确率。 展开更多
关键词 印章字符检测 TextSnake 颜色特征提取 感受野增强 分类损失函数
在线阅读 下载PDF
基于多尺度混合域注意力机制的笔迹鉴别方法 被引量:1
18
作者 熊武 曹从军 +2 位作者 宋雪芳 邵云龙 王旭升 《计算机应用》 CSCD 北大核心 2024年第7期2225-2232,共8页
针对笔迹鉴别任务中图像大面积是背景、笔迹信息稀疏、关键性信息难以捕捉,并且个人笔迹签名风格具有微小变化而刻意模仿的笔迹高度相似,以及公开的中文笔迹数据集的匮乏的问题,通过对注意力机制和孪生网络模型进行改进,提出一种基于多... 针对笔迹鉴别任务中图像大面积是背景、笔迹信息稀疏、关键性信息难以捕捉,并且个人笔迹签名风格具有微小变化而刻意模仿的笔迹高度相似,以及公开的中文笔迹数据集的匮乏的问题,通过对注意力机制和孪生网络模型进行改进,提出一种基于多尺度混合域注意力机制的笔迹鉴别方法(MMDANet)。首先,在有效通道注意力模块上并联一个最大池化层,并将二维条带池化模块的通道数扩展到三维,将改进的有效通道注意力模块和条带池化模块融合生成混合域模块(MDM),解决了笔迹图像大面积是背景、笔迹信息稀疏、细节特征难以提取的问题;其次,利用PANet特征金字塔进行多尺度提取特征,捕获真伪笔迹间的细微差异,采用孪生网络的对比损失与AM-Softmax损失加权融合进行训练,增加类别间的区分度,解决个人笔迹风格变化和真伪笔迹高度相似的问题;最后自制了总体样本数为8000的中文笔迹数据集(CHD)。所提方法在自制中文数据集CHD上的准确率达到了84.25%,且相较于次优的Two-stage SiamNet方法,所提方法在3个外文数据集Cedar、Bengla和Hindi上准确率分别提升了4.53%、1.02%和1.67%。实验结果表明,MMDANet可以更准确地捕获真伪笔迹的细微差异,完成复杂的笔迹鉴别任务。 展开更多
关键词 笔迹鉴别 孪生网络 注意力机制 多尺度 混合域
在线阅读 下载PDF
改进CRNN网络的直播弹幕文本识别 被引量:1
19
作者 张荣泽 王修晖 《计算机工程与应用》 CSCD 北大核心 2024年第15期143-149,共7页
在直播带货场景中,通过分析消费者发送的弹幕信息,能够在一定程度上反映出当前商品的实际评价是否与主播的描述一致,对直播行业中假冒伪劣产品的监管具有重要指导意义。针对弹幕文本识别的特殊性,提出了一种基于改进CRNN(convolutional ... 在直播带货场景中,通过分析消费者发送的弹幕信息,能够在一定程度上反映出当前商品的实际评价是否与主播的描述一致,对直播行业中假冒伪劣产品的监管具有重要指导意义。针对弹幕文本识别的特殊性,提出了一种基于改进CRNN(convolutional recurrent neural network)的实时弹幕识别网络,以解决CRNN算法对于复杂背景环境下的文本特征信息提取不全等问题。为此所设计的网络采用了编解码结构对特征提取模块进行强化设计,以解决弹幕像素区域小造成的特征提取过程中的特征丢失问题。使用Transformer模型对输入的帧画面构建长距离全局特征关系,以强化网络模型对弹幕信息的捕捉能力,并对提取的特征信息进行序列建模及转录得到具体的弹幕语义信息。实验结果表明,所设计的网络在测试集上检测精度高达0.926,平均精度值提高了0.101。 展开更多
关键词 文本识别 深度学习 循环卷积网络 Transformer模型
在线阅读 下载PDF
PosiGPT:基于预训练的中文积极情感评论模型
20
作者 卢晨耀 李敏波 《计算机应用与软件》 北大核心 2024年第9期33-40,共8页
近年来,越来越多的人因为工作和生活的压力处于抑郁状态,许多人没有得到足够的鼓励和正确的指导。基于这个背景,提出中文评论模型PosiGPT。基于生成式预训练模型,使用中文微博数据进行训练,可以检测抑郁状态的博文,并产生积极回复。除... 近年来,越来越多的人因为工作和生活的压力处于抑郁状态,许多人没有得到足够的鼓励和正确的指导。基于这个背景,提出中文评论模型PosiGPT。基于生成式预训练模型,使用中文微博数据进行训练,可以检测抑郁状态的博文,并产生积极回复。除了该模型外,还发布了PosiChat数据集,其包含源自新浪微博的抑郁文本及其积极评论。在PosiChat数据集上进行评估,结果表明模型生成的文本具有较强的流畅性和合理性,且在情感倾向上属于积极情感状态,初步达到了抑郁检测及积极回复的功能。 展开更多
关键词 文本生成 抑郁检测 积极情感评论 预训练
在线阅读 下载PDF
上一页 1 2 62 下一页 到第
使用帮助 返回顶部