期刊文献+
共找到486篇文章
< 1 2 25 >
每页显示 20 50 100
Integrating Audio-Visual Features and Text Information for Story Segmentation of News Video 被引量:1
1
作者 Liu Hua-yong, Zhou Dong-ru School of Computer,Wuhan University,Wuhan 430072, Hubei, China 《Wuhan University Journal of Natural Sciences》 CAS 2003年第04A期1070-1074,共5页
Video data are composed of multimodal information streams including visual, auditory and textual streams, so an approach of story segmentation for news video using multimodal analysis is described in this paper. The p... Video data are composed of multimodal information streams including visual, auditory and textual streams, so an approach of story segmentation for news video using multimodal analysis is described in this paper. The proposed approach detects the topic-caption frames, and integrates them with silence clips detection results, as well as shot segmentation results to locate the news story boundaries. The integration of audio-visual features and text information overcomes the weakness of the approach using only image analysis techniques. On test data with 135 400 frames, when the boundaries between news stories are detected, the accuracy rate 85.8% and the recall rate 97.5% are obtained. The experimental results show the approach is valid and robust. 展开更多
关键词 news video story segmentation audio-visual features analysis text detection
在线阅读 下载PDF
Real-Time Data and Visualization Monitoring of Computer Numerical Control Machine Tools Based on Hyper Text Markup Language 5 被引量:1
2
作者 WU Yan XIAO Lijun +2 位作者 DING Xiaoying WANG Bing ZHANG Jieren 《Journal of Donghua University(English Edition)》 EI CAS 2019年第3期261-266,共6页
In order to ensure the safety,quality and efficiency of computer numerical control(CNC)machine tool processing,a real-time monitoring and visible solution for CNC machine tools based on hyper text markup language(HTML... In order to ensure the safety,quality and efficiency of computer numerical control(CNC)machine tool processing,a real-time monitoring and visible solution for CNC machine tools based on hyper text markup language(HTML)5 is proposed.The characteristics of the real-time monitoring technology of CNC machine tools under the traditional Client/Server(C/S)structure are compared and analyzed,and the technical drawbacks are proposed.Web real-time communication technology and browser drawing technology are deeply studied.A real-time monitoring and visible system for CNC machine tool data is developed based on Metro platform,combining WebSocket real-time communication technology and Canvas drawing technology.The system architecture is given,and the functions and implementation methods of the system are described in detail.The practical application results show that the WebSocket real-time communication technology can effectively reduce the bandwidth and network delay and save server resources.The numerical control machine data monitoring system can intuitively reflect the machine data,and the visible effect is good.It realizes timely monitoring of equipment alarms and prompts maintenance and management personnel. 展开更多
关键词 computer numerical control(CNC) machine tools real-time MONITORING visualIZATION hyper text MARKUP language(HTML)5 WebSocket CANVAS
在线阅读 下载PDF
TEXTINSIGHT: A NEW TEXT VISUALIZATION SYSTEM BASED ON ENTROPY AND GMAP
3
作者 Zhang Yuanben Huang Yu +2 位作者 Fu Kun Song Jun Qi Xiang 《Journal of Electronics(China)》 2014年第5期453-464,共12页
In recent years, text visualization has been widely acknowledged as an effective approach for understanding the structure and patterns hidden in complicated textual information. In this paper, we propose a new visuali... In recent years, text visualization has been widely acknowledged as an effective approach for understanding the structure and patterns hidden in complicated textual information. In this paper, we propose a new visualization system called TextInsight with two of our contributions. Firstly, a textual entropy theory is introduced to encode the semantic importance distribution in the corpus. Based on the proposed multidimensional joint probability histogram in vector fields, the improved algorithm provides a novel way to position valuable information in massive short texts accurately. Secondly, a map-like metaphor is generated to visualize the textual topics and their relationships. For the problem of over-segmentation in the layout and clustering procedure, we propose an optimization algorithm combining Affinity Propagation(AP) and MultiDimensional Scaling(MDS), and the improved geographical representation is more comprehensible and aesthetically appealing. Our experimental results and initial user feedback suggest that this system is effective in aiding text analysis. 展开更多
关键词 text visualization text mining Information visualization textual entropy GMap Affinity Propagation(AP)
在线阅读 下载PDF
LRV: A Tool for Academic Text Visualization to Support theLiterature Review Process
4
作者 Tahani Almutairi Maha Al-yahya 《Computers, Materials & Continua》 SCIE EI 2019年第6期741-751,共11页
Text visualization is concerned with the representation of text in a graphicalform to facilitate comprehension of large textual data. Its aim is to improve the ability tounderstand and utilize the wealth of text-based... Text visualization is concerned with the representation of text in a graphicalform to facilitate comprehension of large textual data. Its aim is to improve the ability tounderstand and utilize the wealth of text-based information available. An essential task inany scientific research is the study and review of previous works in the specified domain,a process that is referred to as the literature survey process. This process involves theidentification of prior work and evaluating its relevance to the research question. With theenormous number of published studies available online in digital form, this becomes acumbersome task for the researcher. This paper presents the design and implementationof a tool that aims to facilitate this process by identifying relevant work and suggestingclusters of articles by conceptual modeling, thus providing different options that enablethe researcher to visualize a large number of articles in a graphical easy-to-analyze form.The tool helps the researcher in analyzing and synthesizing the literature and building aconceptual understanding of the designated research area. The evaluation of the toolshows that researchers have found it useful and that it supported the process of relevantwork analysis given a specific research question, and 70% of the evaluators of the toolfound it very useful. 展开更多
关键词 text visualization information extraction text mining literature review
在线阅读 下载PDF
Visualization of Special Features in “The Tale of Genji” by Text Mining and Correspondence Analysis with Clustering
5
作者 Hisako Hosoi Takayuki Yamagata +1 位作者 Yuya Ikarashi Nobuyuki Fujisawa 《Journal of Flow Control, Measurement & Visualization》 2014年第1期1-6,共6页
In this paper, visualization of special features in “The Tale of Genji”, which is a typical Japanese classical literature, is studied by text mining the auxiliary verbs and examining the similarity in the sentence s... In this paper, visualization of special features in “The Tale of Genji”, which is a typical Japanese classical literature, is studied by text mining the auxiliary verbs and examining the similarity in the sentence style by the correspondence analysis with clustering. The result shows that the text mining error in the number of auxiliary verbs can be as small as 15%. The extracted feature in this study supports the multiple authors of “The Tale of Genji”, which agrees well with the result by Murakami and Imanishi [1]. It is also found that extracted features are robust to the text mining error, which suggests that the classification error is less affected by the text mining error and the possible use of this technique for further statistical study in classical literatures. 展开更多
关键词 visualIZATION SCIENTIFIC Art The TALE of GENJI text Mining CORRESPONDENCE Analysis CLUSTERING
暂未订购
从次生文本到复合文本:重审当代电影海报的体裁边界与文化属性
6
作者 马睿 杨眉 《上海大学学报(社会科学版)》 北大核心 2026年第1期63-73,共11页
在视觉传播媒介谱系中,电影海报有其独特的文本属性和功能定位。传统的电影海报作为一种次生文本,其创作是通过平面设计构建一个以电影本体为元文本、以海报为载体的跨媒介表意系统。随着数字化传播生态的成型,视觉传达呈现出以话题为... 在视觉传播媒介谱系中,电影海报有其独特的文本属性和功能定位。传统的电影海报作为一种次生文本,其创作是通过平面设计构建一个以电影本体为元文本、以海报为载体的跨媒介表意系统。随着数字化传播生态的成型,视觉传达呈现出以话题为聚集点,跨媒介、多平台、线上线下联动共生的样态。身处其中的电影海报,其生产方式和文本形态正在发生显著变化。以电影海报自身发展脉络和媒介技术演进为双重参照系,当前的电影海报日益发展出复合文本的样态,集多主体协同、多媒介融合、多功能整合和多样化表达于一体,旨在创造一个以传递电影信息为起点,以视觉感知和共享话题为纽带,吸纳观众参与,具有复合性文化功能的开放性话语空间。 展开更多
关键词 电影海报 复合文本 媒介演进 视觉文化
在线阅读 下载PDF
基于Visual C++的自动组卷系统的实现 被引量:1
7
作者 王芸 吴志强 《计算机与现代化》 2007年第12期42-44,共3页
自动组卷系统是在已有的题库基础上,按照考核目的随机生成一份满足一定要求的试卷管理系统。在该系统中,计算机如何自动选题形成一套科学合理的试卷是最关键的问题,本文以《C语言程序设计》试题库为例,详细阐述在试题库中自动组卷的过程。
关键词 自动选题 试题库 visualC++6.0
在线阅读 下载PDF
视觉语言模型驱动的目标计数
8
作者 曹锋 张孝文 +2 位作者 岳子杰 李莉 史淼晶 《中国图象图形学报》 北大核心 2026年第1期289-302,共14页
目的大型视觉语言模型的进展给解决基于文本提示的目标计数问题带来新的思路。然而,现有方法仍面临类别语义错位与解码器架构局限两大挑战。前者导致模型易将相似背景或无关类别误检为目标,后者依赖单一卷积神经网络(convolutional neur... 目的大型视觉语言模型的进展给解决基于文本提示的目标计数问题带来新的思路。然而,现有方法仍面临类别语义错位与解码器架构局限两大挑战。前者导致模型易将相似背景或无关类别误检为目标,后者依赖单一卷积神经网络(convolutional neural network,CNN)架构的局部特征提取,可能引发全局语义与局部细节的割裂,严重制约复杂场景下的计数鲁棒性。针对上述问题,提出跨分支协作对齐网络(cross-branch cooperative alignment net⁃work,CANet)。方法其核心包括:1)双分支解码器架构:通过并行Transformer分支(建模全局上下文依赖)与CNN分支(提取细粒度局部特征),结合信息互馈模块实现跨分支的特征交互和密度图预测;2)视觉—文本类别对齐损失:通过约束图像与文本特征的跨模态对齐,迫使模型区分目标与干扰语义,实现对类别的准确检测。结果在5个基准数据集上与先进的4种基于文本的目标计数方法进行比较实验。在FSC-147(few-shot counting-147)数据集上,CANet相较于性能第2的模型,在测试集上的平均绝对误差(mean absolute error,MAE)和均方根误差(root mean squared error,RMSE)分别降低1.22和8.45;在CARPK(car parking lot dataset)和PUCPR+(Pontifical Catholic Univer⁃sity of Parana+dataset)数据集的交叉验证实验上,相较于性能第2的模型,MAE分别降低0.08和3.58;在SHA(ShanghaiTech part-A)和SHB(ShanghaiTech part-B)数据集的交叉验证实验上,相较于性能第2的模型,MAE分别降低了47.0和9.8。同时也在FSC-147数据集上进行丰富的消融实验以验证算法的有效性,消融实验结果表明提出的方法针对两个问题做出了有效改进。结论本文方法能够解决现有方法所面临的两个问题,使计数结果更加准确。本文方法在4个数据集的交叉验证实验均取得SOTA(state-of-the-art)的性能,表明了CANet在零样本目标计数任务中的强大泛化能力。 展开更多
关键词 目标计数 视觉语言模型(VLM) 文本提示 双分支解码器 信息互馈
原文传递
基于文献计量和文本挖掘的中国数字体育研究可视化分析
9
作者 伍锦乐 王晓玲 《体育科技文献通报》 2026年第1期305-310,共6页
目的:对2014—2024年中国数字体育领域的相关文献展开文献计量与文本挖掘分析,系统梳理该领域的研究现状、热点主题及发展趋势,以期为我国数字体育的高质量发展提供理论参考。方法:检索中国知网(CNKI)数据库中2014—2024年数字体育领域... 目的:对2014—2024年中国数字体育领域的相关文献展开文献计量与文本挖掘分析,系统梳理该领域的研究现状、热点主题及发展趋势,以期为我国数字体育的高质量发展提供理论参考。方法:检索中国知网(CNKI)数据库中2014—2024年数字体育领域核心期刊文献共314篇,研究从宏观与微观双维度展开分析:宏观层面采用VOSviewer与CiteSpace可视化分析软件,通过作者、机构及关键词共现分析,系统把握该领域研究脉络与整体发展态势;微观角度借助ROSTCM6与Netdraw文本挖掘工具,开展高频词提取与语义网络分析,深度揭示文本集合中潜在的主题关联逻辑。结论:我国数字体育领域的发文量整体呈现持续增长态势,核心作者群体尚未形成,机构间合作交流相对较少;研究热点围绕“产业发展”“技术赋能”“场景应用”三大核心模块展开;研究趋势可以归纳为技术融合与数字转型升级、数字经济与产业生态构建、公共服务与治理体系优化、国家战略与文化价值融合4个方向,划分为概念引入与初步探索期、技术应用与产业转型加速期、体系深化与多元创新期3个阶段。建议:加强学术交流与合作,优化资源配置与引导,深化技术融合与应用创新。 展开更多
关键词 数字体育 文献计量 文本挖掘 可视化分析
在线阅读 下载PDF
基于VisualFoxPro的Excel文件与文本文件的转换 被引量:1
10
作者 薛转花 《电脑知识与技术》 2006年第2期129-130,共2页
本文旨在提供一种基于VisualFoxPro程序开发软件,将Excel文件转换为银行等单位有特定要求的文本文件的一种方法,以解决在一般企事业用户与银行等专业机构之间在数据交换时常常产生的文件格式不能兼容的问题。
关键词 EXCEL电子表格 visual FOXPRO 文本文伴
在线阅读 下载PDF
数字人文视角下空间表达的新路径
11
作者 庄良 叶超 《热带地理》 北大核心 2026年第1期98-109,共12页
可视化分析技术作为数字人文研究的核心方法,可以将计算模型与人文数据深度匹配,构建起跨学科研究的桥梁。数字人文视角下空间表达的技术内核在于运用图形化映射机制,将体现文本意义、地理场所、关系联接的多源异构数据转化为具备认知... 可视化分析技术作为数字人文研究的核心方法,可以将计算模型与人文数据深度匹配,构建起跨学科研究的桥梁。数字人文视角下空间表达的技术内核在于运用图形化映射机制,将体现文本意义、地理场所、关系联接的多源异构数据转化为具备认知适配性的视觉表征,从而突破传统人文研究的分析局限。基于人文地理学的空间转向,当代数字人文的空间表达主要形成了文本可视化、地理可视化、关系可视化三大支柱,分别对应空间生产理论中关于概念空间、经验空间与生活空间的三元辩证关系。在数字人文范式下,可视化技术不仅革新了释义、情境、结构的空间化方法,更通过人机协同的交互式探索机制,推动形成了数据驱动与人文阐释相结合的创新模式。文章系统解析了典型可视化技术的设计原则与实现路径,并揭示其在数字人文前沿领域中的方法论价值。空间表达的新路径是对地理学三元空间的数字化转译,旨在构建多维人文空间解释框架以便型塑空间融合的研究新范式。在此过程中必须同时警惕技术工具主义与视觉中心主义,进而为数字人文的范式转型与学科建设提供积极参考。 展开更多
关键词 数字化 人文科学 文本可视化 地理可视化 关系可视化
在线阅读 下载PDF
利用Visual FoxPro实现Excel文件转化成文本文件 被引量:1
12
作者 袁婷 《西安航空技术高等专科学校学报》 2007年第3期37-38,共2页
通过提供一种Visual FoxPro的程序开发软件,该软件将WINDOWS系统下的Excel文件转换为适合银行操作系统的、具有特定格式要求的文本文件,实现了企业用户与银行之间的数据交换,提高了企业会计表格与银行系统文件处理的兼容性,解决了数据... 通过提供一种Visual FoxPro的程序开发软件,该软件将WINDOWS系统下的Excel文件转换为适合银行操作系统的、具有特定格式要求的文本文件,实现了企业用户与银行之间的数据交换,提高了企业会计表格与银行系统文件处理的兼容性,解决了数据交换时常常产生的文件格式不兼容的问题。 展开更多
关键词 EXCEL visual FOXPRO 文本文件 文件转化 数据转换
在线阅读 下载PDF
海外敦煌医学多模态研究与中医药文化国际传播
13
作者 张曼玉 王明强 《南京中医药大学学报(社会科学版)》 2026年第1期24-32,共9页
基于跨文化传播与多模态研究框架,系统梳理19世纪末以来海外敦煌医学研究的整体脉络,涵盖欧美、东亚、东南亚及大洋洲等多地学术成果,剖析其地域特征与贡献。发现海外敦煌医学研究呈现三大特征:其一,以文献形态考辨、文本训释、图像视... 基于跨文化传播与多模态研究框架,系统梳理19世纪末以来海外敦煌医学研究的整体脉络,涵盖欧美、东亚、东南亚及大洋洲等多地学术成果,剖析其地域特征与贡献。发现海外敦煌医学研究呈现三大特征:其一,以文献形态考辨、文本训释、图像视觉研究为核心,形成多模态交织互证研究路径;其二,依托多学科交叉协作模式;其三,彰显东西方医学的文明对话特质。海外敦煌医学多模态研究推动中医药文化国际传播在内容、路径与视野方面实现三重进阶,为中医药文化国际传播提供了建构中医药文化多维阐释体系,深化中医药文化价值共鸣、情感认同及重塑中医药话语体系与国际形象的启示,既可为中医药的全球表达提供思路,也可为传统医学的全球共享与国际传播提供实践指引。 展开更多
关键词 敦煌医学 多模态 文献形态 文本内容 图像视觉 中医药文化 国际传播
在线阅读 下载PDF
用于高质量胸片数据合成的医学潜在扩散模型
14
作者 刘佳霖 孙丽萍 +1 位作者 韩力 杜慧江 《电子科技》 2026年第3期65-74,共10页
针对现有医学影像合成技术在准确捕捉复杂解剖结构和病理状态方面存在不足,从而生成低质量且与实际情况不符的胸片问题,文中提出了一种创新性的医学潜在扩散模型Chest-Chat。基于先前研究结果改进了所提模型,引入一种多模态文本编码器Me... 针对现有医学影像合成技术在准确捕捉复杂解剖结构和病理状态方面存在不足,从而生成低质量且与实际情况不符的胸片问题,文中提出了一种创新性的医学潜在扩散模型Chest-Chat。基于先前研究结果改进了所提模型,引入一种多模态文本编码器MedA-BERT(Medical Attention Strategy Pre-training of Deep Bidirectional Transformers for Language Understanding)。采用跨模态视觉-语言预训练策略构建该编码器并强化胸片影像与对应文本报告间的深刻语义联系,结合双向交叉注意力机制和对比学习显著增强了模型对医学影像报告语义的理解和处理能力。将MedA-BERT与潜在扩散模型的视觉模块相结合,使Chest-Chat能够生成具有详细解剖和病理描述的高质量胸片。在CheXpert和MIMIC-CXR(Chest X-ray)两个公开数据集上进行了广泛评估。实验结果表明,Chest-Chat的FID InceptionV3(Fréchet Inception Distance)、FID XRV和MS-SSIM(Multi-Scale Structural Similarity)分别为58.38、3.69和0.12±0.11,其表现优于现有方法。 展开更多
关键词 胸片 图像生成 多模态文本编码器 视觉-语言预训练 注意力机制 对比学习 潜在扩散模型 条件生成
在线阅读 下载PDF
Visual C#开发Oracle文本导入器
15
作者 郭文超 《电脑编程技巧与维护》 2009年第14期63-66,共4页
为了帮助数据库维护人员进行数据迁移,研究了Visual C#对Oracle数据库的支持,编写了一个通用的文本导入器。首先,通过Get Schema这一关键函数读取了表结构信息并进行分组显示;其次,按照指定的分隔符号读取选定的文本文件并存入数据集Dat... 为了帮助数据库维护人员进行数据迁移,研究了Visual C#对Oracle数据库的支持,编写了一个通用的文本导入器。首先,通过Get Schema这一关键函数读取了表结构信息并进行分组显示;其次,按照指定的分隔符号读取选定的文本文件并存入数据集DataSet;最后插入Oracle数据库。这样就避免了繁琐的Oracle SQL*LOADER配置,提高了工作效率。 展开更多
关键词 ORACLE SQL*LOADER visual C# GetSchema 文本导入 表结构显示
在线阅读 下载PDF
Using Luhn’s Automatic Abstract Method to Create Graphs of Words for Document Visualization
16
作者 Luiz Cláudio Santos Silva Renelson Ribeiro Sampaio 《Social Networking》 2014年第2期65-70,共6页
Visualization methods for single documents are either too simple, considering word frequency only, or depend on syntactic and semantic information bases to be more useful. This paper presents an intermediary approach,... Visualization methods for single documents are either too simple, considering word frequency only, or depend on syntactic and semantic information bases to be more useful. This paper presents an intermediary approach, based on H. P. Luhn’s automatic abstract creation algorithm, and intends to aggregate more information to document visualization than word counting methods do without the need of external sources. The method takes pairs of relevant words and computes the linkage force between them. Relevant words become vertices and links become edges in the resulting graph. 展开更多
关键词 text visualIZATION Graph of WORDS
暂未订购
符号互文、数据重组与拟像再现——Sora影像叙事的修辞学建构及其审美逻辑 被引量:3
17
作者 张伟 《云南社会科学》 北大核心 2025年第1期162-170,共9页
视觉修辞作为一种认识论的理论属性为考察Sora的先锋艺术实践提供了契机,也使得从宏观、整体性立场审视Sora成为可能。“图—文”关系作为视觉修辞符号层级的审美实践成为Sora文生视频的修辞参照,Sora对语言文本指令的修正与丰富架构了... 视觉修辞作为一种认识论的理论属性为考察Sora的先锋艺术实践提供了契机,也使得从宏观、整体性立场审视Sora成为可能。“图—文”关系作为视觉修辞符号层级的审美实践成为Sora文生视频的修辞参照,Sora对语言文本指令的修正与丰富架构了影像叙事的时空框架,使得由之形成的影像更具“故事性”。Sora对庞大视觉数据的学习与处理铺垫了其影像生成的深层路径,对视觉数据元素的提取与重组及其形成的互文关系成为其视觉叙事的另一修辞表征。“真实感”作为视觉修辞的内在意指为审视Sora的“形象”构建提供了理论合法性,一定程度上也揭示了Sora社会影响力的成因。符号表征、文本构建与传播效应是视觉修辞切入Sora影像叙事的三个视点,它在深度揭示人工智能视觉生产审美本质的同时,也加持了人们审视人类视觉表征场域这一非人化行动者的理性立场。 展开更多
关键词 视觉修辞 SORA “图—文”关系 互文 拟像
在线阅读 下载PDF
绘本视角下的《动画分镜头设计》课程教学策略研究——以马鞍山职业技术学院动漫专业为例 被引量:2
18
作者 任莹莹 刘颖 《安徽冶金科技职业学院学报》 2025年第1期65-68,共4页
本研究通过案例分析和教学实践,探索绘本资源在动画分镜头设计教学中的应用价值。绘本与动画分镜头在叙事逻辑、视觉语言构建及情感表达机制上具有显著共性,基于高职院校学情特点通过“视觉修辞迁移”“绘本项目贯穿式教学”方法将绘本... 本研究通过案例分析和教学实践,探索绘本资源在动画分镜头设计教学中的应用价值。绘本与动画分镜头在叙事逻辑、视觉语言构建及情感表达机制上具有显著共性,基于高职院校学情特点通过“视觉修辞迁移”“绘本项目贯穿式教学”方法将绘本作为动画分镜头设计教学的载体,有效解决高职专业动画分镜头教学的难题,同时该模式能提升学生的艺术感知力和创意表现能力。 展开更多
关键词 绘本 动画分镜头设计 教学策略 图文叙事
在线阅读 下载PDF
Detection and Recognition of Spray Code Numbers on Can Surfaces Based on OCR
19
作者 Hailong Wang Junchao Shi 《Computers, Materials & Continua》 SCIE EI 2025年第1期1109-1128,共20页
A two-stage algorithm based on deep learning for the detection and recognition of can bottom spray codes and numbers is proposed to address the problems of small character areas and fast production line speeds in can ... A two-stage algorithm based on deep learning for the detection and recognition of can bottom spray codes and numbers is proposed to address the problems of small character areas and fast production line speeds in can bottom spray code number recognition.In the coding number detection stage,Differentiable Binarization Network is used as the backbone network,combined with the Attention and Dilation Convolutions Path Aggregation Network feature fusion structure to enhance the model detection effect.In terms of text recognition,using the Scene Visual Text Recognition coding number recognition network for end-to-end training can alleviate the problem of coding recognition errors caused by image color distortion due to variations in lighting and background noise.In addition,model pruning and quantization are used to reduce the number ofmodel parameters to meet deployment requirements in resource-constrained environments.A comparative experiment was conducted using the dataset of tank bottom spray code numbers collected on-site,and a transfer experiment was conducted using the dataset of packaging box production date.The experimental results show that the algorithm proposed in this study can effectively locate the coding of cans at different positions on the roller conveyor,and can accurately identify the coding numbers at high production line speeds.The Hmean value of the coding number detection is 97.32%,and the accuracy of the coding number recognition is 98.21%.This verifies that the algorithm proposed in this paper has high accuracy in coding number detection and recognition. 展开更多
关键词 Can coding recognition differentiable binarization network scene visual text recognition model pruning and quantification transport model
在线阅读 下载PDF
基于DBNet与SVTR的轮胎压印字符识别方法
20
作者 康朝海 蔡成颖 +1 位作者 孙行衍 任伟建 《自动化与仪表》 2025年第9期89-93,98,共6页
为解决汽车智能制造行业高效读取轮胎胎面信息的问题,针对轮胎压印字符识别研究存在的难点,构建了一种基于DBNet与SVTR的压印字符识别模型。首先改进梯度Hough变换和极坐标转换将胎面弯曲文本展平;然后利用模板匹配依据相对位移定位ROI... 为解决汽车智能制造行业高效读取轮胎胎面信息的问题,针对轮胎压印字符识别研究存在的难点,构建了一种基于DBNet与SVTR的压印字符识别模型。首先改进梯度Hough变换和极坐标转换将胎面弯曲文本展平;然后利用模板匹配依据相对位移定位ROI区域;最后基于DBNet检测字符、SVTR识别字符。实验表明,所提方法的检测Hmean达97.24%,识别准确率达99.22%,能有效解决轮胎压印字符识别的实际应用问题。 展开更多
关键词 轮胎压印字符 DBNet SVTR 字符识别
在线阅读 下载PDF
上一页 1 2 25 下一页 到第
使用帮助 返回顶部