-
题名基于ESPnet的中文语音翻译实现
- 1
-
-
作者
赵勇
-
机构
南京熊猫汉达科技有限公司
-
出处
《无线互联科技》
2023年第6期55-57,共3页
-
文摘
当前,很多场合急需实现从语音翻译为文本的功能,如视频字幕制作、实时语译等。文章介绍了一种ESPnet语音识别框架架构,并基于ESPnet框架,训练得到最优模型,该架构模型能将语音识别过程扩展为网页在线识别,对目前主流语音识别框架进行对比试验并总结其优缺点。
-
关键词
espnet
语音识别
CTC
-
Keywords
espnet
speech recognition
CTC
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向数字孪生工厂的多模态仪表数据异常检测
被引量:1
- 2
-
-
作者
沈世贤
王建国
冯勇
李英娜
-
机构
昆明理工大学云南省计算机技术应用重点实验室
中国铜业有限公司
-
出处
《微电子学与计算机》
2025年第1期65-74,共10页
-
基金
云南省重大科技专项(202202AD080006)。
-
文摘
针对工业生产过程中数据异常监测成本高、准确率低、实时性差等问题,提出了一种面向数字孪生工厂的多模态仪表数据异常检测方法。首先,将动态非单调聚焦机制引入到YOLOv5s目标检测模型,通过改进后的模型检测指针式仪表所在位置;同时利用仿射变换和透视变换对存在倾斜、旋转的图像进行校准。其次,将可变卷积引入ESPNet分割网络,以自适应性的捕获图像中指针和刻度盘非线性形变元素,从而提取完整的指针和刻度盘关键信息;然后进行霍夫变换操作拟合指针所在直线,同时利用轮廓跟踪方法提取刻度盘数据的有效范围,依据线性比例关系计算出指针式仪表示数。最后,将基于图像获取的仪表数据和相应的传感器数据进行综合建模,从多模态数据分析的角度检测异常。实验结果表明:该方法的指针式仪表识别准确率96.21%,检测速度平均耗时0.216 s,数据异常检测率99.43%,能够准确迅速的识别数据异常情况,满足工业生产中关键指标监控的需求。
-
关键词
数字孪生
指针式仪表
动态非单调聚焦机制
espnet
异常检测
-
Keywords
digital twin
pointer-type instrument
dynamic non-monotonic focus mechanism
espnet
anomaly detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名改进ESP-YOLO的PCB缺陷检测算法
- 3
-
-
作者
王海群
王炳楠
葛超
-
机构
华北理工大学电气工程学院
-
出处
《计算机工程与科学》
北大核心
2025年第2期317-326,共10页
-
基金
河北省自然科学基金(F2021209006)。
-
文摘
PCB板的缺陷检测是保证其质量的重要手段。为了避免漏检、误检现象的发生,并提高PCB缺陷检测速度,提出了一种改进ESP-YOLO的PCB缺陷检测算法。引入ESP网络结构,通过ESPblock实现下采样,并改进特征提取模块,采用更轻量的网络结构实现特征提取,解决PCB缺陷检测模型较大并且难以部署的问题;引入一种无参数注意力机制SimAM,在不增加网络参数的同时提高复杂环境中算法对目标的关注度,解决由于背景复杂导致的PCB缺陷漏检问题;引入RFB多尺度特征提取模块,扩大算法感受野并提高多尺度特征提取能力,解决由于缺陷大小差异导致的漏检问题;引入可学习参数特征融合模块BiFPN,提高融合特征图的特征表达能力。实验结果显示,ESP-YOLO算法的参数量和GFLOPs分别为5.32×106和11.2,相比YOLOv5s算法分别降低了23.8%和29.1%;平均精度为97.8%,相比于原YOLOv5s算法提升了3.2%。
-
关键词
PCB缺陷检测
espnet
SimAM
RFB
BiFPN
YOLOv5s
-
Keywords
PCB defect detection
efficient spatial pyramid network(espnet)
simple and parameter-free attention module(SimAM)
receptive field block(RFB)
bi-directional feature pyramid network_add(Bi-FPN)
YOLOv5s
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-