期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
利用OCR识别技术实现视频中文字的提取 被引量:22
1
作者 陈义 李言俊 孙小炜 《计算机工程与应用》 CSCD 北大核心 2010年第10期180-183,共4页
为了在视频图像中进行字幕信息的实时提取,提出了一套简捷而有效的方法。首先进行文字事件检测,然后进行边缘检测、阈值计算和边缘尺寸限制,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕,提出的叠加水平和垂直方向边缘的方... 为了在视频图像中进行字幕信息的实时提取,提出了一套简捷而有效的方法。首先进行文字事件检测,然后进行边缘检测、阈值计算和边缘尺寸限制,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕,提出的叠加水平和垂直方向边缘的方法,加强了检测到的文字的边缘;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘。应用投影法最终确定视频字幕所在区域。最后,利用OCR识别技术对提取出来的文字区域进行识别,完成视频中文字的提取。以上方法的结合保证了提出算法的正确率和鲁棒性。 展开更多
关键词 光学文字识别 文字事件检测 数字视频
在线阅读 下载PDF
基于OCR的沥青搅拌站生产远程监控系统
2
作者 朱爱玺 《沙洲职业工学院学报》 2024年第3期1-5,11,共6页
本文深入分析了沥青搅拌站生产数据采集过程,提出了基于OCR(Optical Character Recognition,光学字符识别)的沥青搅拌站生产远程监控系统的技术路线,通过部署监控探头,开发图像处理软件,并现场实施,验证了该技术路线的可行性。
关键词 沥青搅拌站 生产监控 配合比 ocr 视频监控
在线阅读 下载PDF
基于动态边缘的OCR算法在航检影像切分中的应用 被引量:1
3
作者 杨伟旗 关鑫 +1 位作者 汪洋 皇甫云霞 《内蒙古电力技术》 2017年第6期16-20,共5页
借鉴统计模式识别方法,提出了基于动态边缘的OCR算法,以字符形态为分析样本,确定在动态视频图像中字符特征边缘区域的选择,然后找出每个字符的体征特性,通过大量试验得出每个字符的特征规律,最后通过相似性概率统计方法实现字符的识别... 借鉴统计模式识别方法,提出了基于动态边缘的OCR算法,以字符形态为分析样本,确定在动态视频图像中字符特征边缘区域的选择,然后找出每个字符的体征特性,通过大量试验得出每个字符的特征规律,最后通过相似性概率统计方法实现字符的识别。经在内蒙古超高压供电局航检视频处理中的实际应用,该算法准确率高达99.45%,为复杂背景下视频字符识别提供了新算法。 展开更多
关键词 ocr技术 航检视频 动态边缘 字符特征 统计模式识别
在线阅读 下载PDF
基于笔画和Adaboost的两层视频文字定位算法 被引量:10
4
作者 程豪 黄磊 +1 位作者 刘昌平 谭怒涛 《自动化学报》 EI CSCD 北大核心 2008年第10期1312-1318,共7页
在定位和验证的两级框架下提出了一种新的视频文字定位算法.在定位模块中,充分利用字符的笔画属性,引入对字符区域有很强的响应的笔画算子;经笔画提取,密度过滤,区域分解得候选文本行.在验证模块中,提取对文字有较强鉴别能力的边缘方向... 在定位和验证的两级框架下提出了一种新的视频文字定位算法.在定位模块中,充分利用字符的笔画属性,引入对字符区域有很强的响应的笔画算子;经笔画提取,密度过滤,区域分解得候选文本行.在验证模块中,提取对文字有较强鉴别能力的边缘方向直方图特征,使用Adaboost算法训练的分类器对候选文本行进行筛选.实验结果表明,该算法具有较强的鲁棒性,在不同类型的视频帧中都能得到较好的定位结果. 展开更多
关键词 文字定位 笔画提取 边缘方向直方图 ADABOOST 视频ocr
在线阅读 下载PDF
基于笔画提取和颜色模型的视频文字分割算法 被引量:4
5
作者 程豪 黄磊 刘金刚 《计算机工程》 CAS CSCD 北大核心 2009年第4期193-195,共3页
提出综合利用视频文字时空、笔画、颜色和几何特征的文字分割算法,快速准确地从复杂背景的视频图像中分割出文字。利用多帧融合进行图像增强,基于笔画宽度特征,使用笔画特征算子提取文字笔画,根据笔画图标注的文字区域建立颜色模型,提... 提出综合利用视频文字时空、笔画、颜色和几何特征的文字分割算法,快速准确地从复杂背景的视频图像中分割出文字。利用多帧融合进行图像增强,基于笔画宽度特征,使用笔画特征算子提取文字笔画,根据笔画图标注的文字区域建立颜色模型,提取文字颜色层,并用改进的连通域分析法去除文字颜色层中的同色背景和噪声。实验结果表明,该算法比传统算法能更好解决复杂背景的视频文字分割问题。 展开更多
关键词 视频文字识别 视频文字分割 笔画提取 颜色建模
在线阅读 下载PDF
远洋捕捞渔船电子监控视频文字信息提取 被引量:4
6
作者 张胜茂 樊伟 +3 位作者 张衡 杨胜龙 沈介然 邹国华 《渔业信息与战略》 2020年第2期141-146,共6页
计算机图像处理技术发展迅速,基于OCR(Optical Character Recognition)的图像文字提取得到广泛应用。在远洋渔业捕捞中,EMS(Electronic Monitoring System)逐渐开始使用,视频中文字信息提取是系统的重要功能之一。通过左右舷、前甲板、... 计算机图像处理技术发展迅速,基于OCR(Optical Character Recognition)的图像文字提取得到广泛应用。在远洋渔业捕捞中,EMS(Electronic Monitoring System)逐渐开始使用,视频中文字信息提取是系统的重要功能之一。通过左右舷、前甲板、后甲板安装的4个摄像头,获取渔船作业的视频影像,再利用jTessBoxEditor软件生成图片样本,人工添加文字标签,然后通过tesseract软件训练标注的样本,制作traineddata字库,最后用Python编程提取远洋捕捞渔船监控视频中的时间、位置、航速、航向等信息,提取的960条记录,经与原图片对比全部正确,提取的文字信息可为视频存档和渔业管理提供参考。 展开更多
关键词 远洋渔业 视频监控 ocr 电子监控系统
在线阅读 下载PDF
基于全局Otsu分割算法和二值化的AR巡检视频图像OCR字符识别方法
7
作者 左轩 高松 关峻峰 《自动化应用》 2026年第6期68-71,共4页
针对固定灰度阈值影响字符区域分割准确性,难以识别AR巡检视频图像OCR字符问题,现提出基于全局Otsu分割算法和二值化的AR巡检视频图像OCR字符识别方法。基于收集到的AR巡检视频图像,结合OCR技术,首先对图像进行灰度化处理。在全局Otsu... 针对固定灰度阈值影响字符区域分割准确性,难以识别AR巡检视频图像OCR字符问题,现提出基于全局Otsu分割算法和二值化的AR巡检视频图像OCR字符识别方法。基于收集到的AR巡检视频图像,结合OCR技术,首先对图像进行灰度化处理。在全局Otsu分割算法的作用下,随机假设灰度阈值,以划分背景区域和前景区域,计算不同区域的灰度均值和全局灰度均值,定义两个区域之间的类间方差,从而确定最优的灰度阈值。在二值化的作用下,分割出图像的字符区域。基于此,将其作为输入图像,输入到卷积神经网络(CNN)中,提取字符区域的特征图,计算特征图与字符预设库中特征图的匹配度,实现对图像中的字符识别。实验结果表明,该方法在实际应用中能精准识别图像中的字符,且识别结果的字符漏识率仅为3.68%。 展开更多
关键词 全局Otsu分割算法 二值化 AR巡检视频图像 ocr技术 字符识别
在线阅读 下载PDF
基于机器视觉原理的平显视频信息提取研究
8
作者 吴卫玲 杨建新 《仪表技术》 2017年第4期18-20,24,共4页
平显记录视频与飞行记录参数构成了完备的反映飞机状态和作战过程的数据源。设计了内嵌式OCR字符集编辑系统,消除背景和视频帧转换过程带来的噪声影响,解决了机器视觉助手(NI Vision Assistant)无法融入到软件系统的难题。开发了二次区... 平显记录视频与飞行记录参数构成了完备的反映飞机状态和作战过程的数据源。设计了内嵌式OCR字符集编辑系统,消除背景和视频帧转换过程带来的噪声影响,解决了机器视觉助手(NI Vision Assistant)无法融入到软件系统的难题。开发了二次区域分割算法,通过构建平显画面信息模板,以实现显示参数区域的大粒度划分;通过自动分割单个字符显示区域,实现参数显示区域的横向精细划分;根据参数显示格式和自动识别的结果产生相应的参数信息。 展开更多
关键词 信息提取 机器视觉 平显记录视频 ocr
原文传递
平显记录视频中的刻度带信息提取研究
9
作者 杨建新 《自动化技术与应用》 2011年第10期48-50,56,共4页
平显记录视频与飞行记录参数互补一起构成完备的反映飞机状态和作战过程的数据源。分析了航向和航向刻度带的显示属性及其提取方法。应用机器视觉原理,构建航向信息提取模型,并给出航向信息提取方法。此模型和方法还适用于采用垂直方向... 平显记录视频与飞行记录参数互补一起构成完备的反映飞机状态和作战过程的数据源。分析了航向和航向刻度带的显示属性及其提取方法。应用机器视觉原理,构建航向信息提取模型,并给出航向信息提取方法。此模型和方法还适用于采用垂直方向刻度带来指示的指示空速和高度信息提取。 展开更多
关键词 信息提取 机器视觉 平显记录视频 刻度带 ocr
在线阅读 下载PDF
基于颜色和边缘特征的新闻视频标题条检测 被引量:2
10
作者 杨哲 史萍 《电视技术》 北大核心 2012年第19期163-166,共4页
提出了一种基于颜色和边缘特征的新闻视频标题条检测和文字识别方法。该方法首先利用颜色和边缘特征检测出新闻视频中含有标题条的帧,然后由先验知识得出标题条帧中的字幕区域,对字幕区域进行预处理和光学字符识别(OCR),得到文字内容。... 提出了一种基于颜色和边缘特征的新闻视频标题条检测和文字识别方法。该方法首先利用颜色和边缘特征检测出新闻视频中含有标题条的帧,然后由先验知识得出标题条帧中的字幕区域,对字幕区域进行预处理和光学字符识别(OCR),得到文字内容。实验结果表明该方法具有较高的查全率和查准率。 展开更多
关键词 新闻视频 标题条 颜色特征 边缘特征 ocr
在线阅读 下载PDF
智能视频分析系统在防范药品差错中的初步构建 被引量:2
11
作者 张小娟 杨晓红 +1 位作者 吴燕燕 陈琳 《中国数字医学》 2021年第2期59-62,共4页
目的:药品差错存在于临床用药的各个环节,直接关系到患者的生命健康。利用人工智能技术,构建药品差错智能视频分析系统,保障临床用药安全。方法:根据视频监控,采用人工智能中的深度神经网络技术,实时分析识别监控视频中药品的名称、规... 目的:药品差错存在于临床用药的各个环节,直接关系到患者的生命健康。利用人工智能技术,构建药品差错智能视频分析系统,保障临床用药安全。方法:根据视频监控,采用人工智能中的深度神经网络技术,实时分析识别监控视频中药品的名称、规格、剂型、厂家和数量,与HIS中处方/医嘱的药品信息进行对比,若有药品差错,实时报警提醒。结果:药品差错智能视频分析系统与医院HIS的处方/医嘱对接,适用于分析防范开具处方/医嘱后调剂、发药、配置和给药环节的药品差错。结论:基于人工智能的视频分析系统可防范临床药品差错,保障临床安全用药。 展开更多
关键词 智能视频分析系统 深度神经网络 药品差错 ocr
暂未订购
一种免除二值化的视频叠加中文字符识别方法 被引量:2
12
作者 田洁 王伟强 孙翼 《中国科学院大学学报(中英文)》 CSCD 北大核心 2018年第3期402-408,共7页
提出一种新的用于识别视频中字幕文字的方法。鉴于视频中文字的大小、颜色、渲染风格和分辨率的不同,以及视频中各种复杂背景的影响,识别视频中的叠加文字是一个尚未解决的问题。目前,大多数视频叠加文字识别方法都基于视频文字的二值... 提出一种新的用于识别视频中字幕文字的方法。鉴于视频中文字的大小、颜色、渲染风格和分辨率的不同,以及视频中各种复杂背景的影响,识别视频中的叠加文字是一个尚未解决的问题。目前,大多数视频叠加文字识别方法都基于视频文字的二值化和传统OCR引擎的结合。然而,二值化过程容易引入噪声和文字笔划信息的丢失。另外,传统OCR技术主要专注于高分辨率的扫描打印文档,这些文档具有背景单一、噪声少和笔划信息较完整的特点。因此,传统OCR引擎用于识别叠加文字二值化后的结果可能不够鲁棒。为解决这个问题,直接从未二值化的叠加视频文字图像中提取Gabor特征用于训练二层字符识别器。实验结果表明,本文提出的方法在多字体视频叠加中文文字识别上有良好的效果。 展开更多
关键词 视频叠加文字 ocr GABOR 最近原型分类(NPC)
在线阅读 下载PDF
基于深度学习的短视频分类技术及监控预警系统 被引量:1
13
作者 徐音 《长江信息通信》 2024年第7期37-39,46,共4页
针对目前互联网上传播的海量短视频,设计并实现了一套短视频文本检测预警系统。该系统通过检测短视频中文本的位置,利用OCR识别技术对文本内容进行识别,运用NLP技术对文本内容进行校正、理解和匹配,最后上传检测结果,实现了对短视频中... 针对目前互联网上传播的海量短视频,设计并实现了一套短视频文本检测预警系统。该系统通过检测短视频中文本的位置,利用OCR识别技术对文本内容进行识别,运用NLP技术对文本内容进行校正、理解和匹配,最后上传检测结果,实现了对短视频中文本信息的结构化。系统可以通过上传短视频来进行短视频文本内容的结构化以及分类,同时对含敏感信息的视频进行预警上报,对非敏感短视频确定相应的标签以进行后续搜索、推荐等附加服务。测试结果表明:短视频分类技术及监控预警系统的分类准确率为96.3%,召回率为93.7%,单帧图像响应时间快,软件成熟度评估达到CMMI3级,兼容性良好。 展开更多
关键词 深度学习 短视频 ocr 文本检测
在线阅读 下载PDF
基于AI视频分析的煤矿瓦斯抽采钻场远程监督管理方法 被引量:8
14
作者 胡金成 张立斌 +3 位作者 蒋泽 姚超修 蒋志龙 王正义 《工矿自动化》 CSCD 北大核心 2023年第11期167-172,共6页
传统的煤矿瓦斯抽采钻场视频监控系统在钻孔施工及退钻杆期间,只具有监测和存储功能,重要的过程参数或信息只能由监测人员通过视频录像查看,存在记录施工信息易出错、钻场管理人员难以连续监控现场视频等问题。针对上述问题,提出了一种... 传统的煤矿瓦斯抽采钻场视频监控系统在钻孔施工及退钻杆期间,只具有监测和存储功能,重要的过程参数或信息只能由监测人员通过视频录像查看,存在记录施工信息易出错、钻场管理人员难以连续监控现场视频等问题。针对上述问题,提出了一种基于AI视频分析的煤矿瓦斯抽采钻场远程监督管理方法。该方法包括信息牌检测、OCR识别、退杆分析3种算法。信息牌检测用于检测当前施工环节,OCR识别用于识别信息牌上打钻流程与施工信息,退杆分析用于分析收孔阶段的退杆数,从而实现打钻作业的全过程分析与管控。在接收并开始打钻任务后,启用信息牌检测与OCR识别服务,根据依次识别到的开孔、收孔、封孔流程与施工参数,自动保存施工信息。当识别出开始收孔,启用退杆分析服务;当识别出结束收孔,停止退杆分析服务。实验结果表明:信息牌检测算法的识别准确率为96%。PaddleOCR识别算法平均用时17.51 ms,较EasyOCR、ChineseOCR识别算法分别降低了25.25,4.34 ms;PaddleOCR识别算法的准确率较其他2种识别算法分别提高了5.75%,2.29%,召回率较其他2种识别算法分别提高了9.77%,2.36%。退杆分析算法能够有效识别现场退杆数,准确率约为95%。 展开更多
关键词 瓦斯抽采钻场 AI视频分析 打钻 退杆分析 信息牌检测 ocr识别 全过程分析
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部