期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于S-YOLO V5和Vision Transformer的视频内容描述算法
被引量:
2
1
作者
徐鹏
李铁柱
职保平
《印刷与数字媒体技术研究》
CAS
北大核心
2023年第4期212-222,共11页
视频内容描述的自动生成是结合计算机视觉和自然语言处理等相关技术提出的一种新型交叉学习任务。针对当前视频内容生成描述模型可读性不佳的问题,本研究提出一种基于S-YOLO V5和Vison Transformer(ViT)的视频内容描述算法。首先,基于...
视频内容描述的自动生成是结合计算机视觉和自然语言处理等相关技术提出的一种新型交叉学习任务。针对当前视频内容生成描述模型可读性不佳的问题,本研究提出一种基于S-YOLO V5和Vison Transformer(ViT)的视频内容描述算法。首先,基于神经网络模型KATNA提取关键帧,以最少帧数进行模型训练;其次,利用S-YOLO V5模型提取视频帧中的语义信息,并结合预训练ResNet101模型和预训练C3D模型提取视频静态视觉特征和动态视觉特征,并对两种模态特征进行融合;然后,基于ViT结构的强大长距离编码能力,构建模型编码器对融合特征进行长距离依赖编码;最后,将编码器的输出作为LSTM解码器的输入,依次输出预测词,生成最终的自然语言描述。通过在MSR-VTT数据集上进行测试,本研究模型的BLEU-4、METEOR、ROUGEL和CIDEr分别为42.9、28.8、62.4和51.4;在MSVD数据集上进行测试,本研究模型的BLEU-4、METEOR、ROUGEL和CIDEr分别为56.8、37.6、74.5以及98.5。与当前主流模型相比,本研究模型在多项评价指标上表现优异。
展开更多
关键词
视频内容描述
s-yolo
V5
Vision
Transformer
多头注意力
在线阅读
下载PDF
职称材料
油气站场视频监控系统的设计与应用
被引量:
3
2
作者
文炜
黄腾
+4 位作者
彭竟飞
方正
闫井超
刘凯书
顾继俊
《计算技术与自动化》
2023年第3期47-53,共7页
安全监控系统的集成化、智能化升级是油气站场亟待解决的问题。针对当前系统的弊端,设计开发油气站场智能视频监控系统。利用宽动态技术,解决早期监控摄像头采集到的视频信号易受天气影响,画质不佳,有用信息不足等问题。并利用YOLO目标...
安全监控系统的集成化、智能化升级是油气站场亟待解决的问题。针对当前系统的弊端,设计开发油气站场智能视频监控系统。利用宽动态技术,解决早期监控摄像头采集到的视频信号易受天气影响,画质不佳,有用信息不足等问题。并利用YOLO目标检测算法,实现对区域内人员未戴安全帽的行为进行监控。最后构建基于B/S架构的安防设备集成管理平台,将算法同监控视频画面集成,并显示站场三维地图,为后续站场数据可视化预留扩展接口。实践应用表明该系统能显著提升油气站场智能视频监控水平。
展开更多
关键词
视频监控
宽动态技术
YOLO
B/S架构
在线阅读
下载PDF
职称材料
一种改进YOLOv3的学校场所目标识别方法
被引量:
2
3
作者
高锦风
陈玉
+2 位作者
魏永明
李剑南
江若楠
《中国科学院大学学报(中英文)》
CAS
CSCD
北大核心
2023年第4期531-539,共9页
基于遥感影像进行特定场所类型的识别在智慧城市规划、土地利用分析、平安城市建设等多方面都具有重要意义。然而,不同场所的环境景观属性(如道路和停车场等)比较复杂,难以用传统的分类或目标识别方法基于简单的规则进行识别。卷积神经...
基于遥感影像进行特定场所类型的识别在智慧城市规划、土地利用分析、平安城市建设等多方面都具有重要意义。然而,不同场所的环境景观属性(如道路和停车场等)比较复杂,难以用传统的分类或目标识别方法基于简单的规则进行识别。卷积神经网络具有较强的空间信息挖掘能力,尝试对著名的YOLOv3模型进行改进,提出一种名为YOLO-S-CIoU的新模型,用于学校场所目标的识别。主要改进工作包括:1)使用SRXnet模块替换YOLOv3中的Darknet53模块以提高特征学习能力;2)利用complete-IoU loss(CIoU loss)优化边界框的回归;3)基于自制的学校场所样本数据集(SS数据集)进行训练和验证。实验结果表明,YOLO-S-CIoU的平均精度(AP)达到96.46%;参数量为226 MB。与改进前YOLOv3相比,YOLO-S-CIoU实现了参数量9 MB的下降以及AP 2.3%的提升。此外,在新疆图木舒克市和烟台市区域遥感影像中对学校场所目标识别,召回率比YOLOv3分别提高37.5%和42.2%。这表明改进后的网络模型在不同地理区域的遥感影像识别中具有更强的鲁棒性和更高的识别能力。
展开更多
关键词
YOLO-S-CIoU
SE-ResNeXt
CIoU
loss
特定场所识别
遥感
学校识别
在线阅读
下载PDF
职称材料
题名
基于S-YOLO V5和Vision Transformer的视频内容描述算法
被引量:
2
1
作者
徐鹏
李铁柱
职保平
机构
黄河水利职业技术学院信息工程学院
河南大学计算机与信息工程学院
开封市虚拟现实应用工程技术研究中心
出处
《印刷与数字媒体技术研究》
CAS
北大核心
2023年第4期212-222,共11页
基金
国家自然科学基金青年项目——基于原型观测的水电机组-厂房结构振动传递路径识别研究(No.51709125)
河南省科技攻关项目——概率-区间混合不确定的渡槽抗震可靠性研究——以沙河为例(No.212102310479)。
文摘
视频内容描述的自动生成是结合计算机视觉和自然语言处理等相关技术提出的一种新型交叉学习任务。针对当前视频内容生成描述模型可读性不佳的问题,本研究提出一种基于S-YOLO V5和Vison Transformer(ViT)的视频内容描述算法。首先,基于神经网络模型KATNA提取关键帧,以最少帧数进行模型训练;其次,利用S-YOLO V5模型提取视频帧中的语义信息,并结合预训练ResNet101模型和预训练C3D模型提取视频静态视觉特征和动态视觉特征,并对两种模态特征进行融合;然后,基于ViT结构的强大长距离编码能力,构建模型编码器对融合特征进行长距离依赖编码;最后,将编码器的输出作为LSTM解码器的输入,依次输出预测词,生成最终的自然语言描述。通过在MSR-VTT数据集上进行测试,本研究模型的BLEU-4、METEOR、ROUGEL和CIDEr分别为42.9、28.8、62.4和51.4;在MSVD数据集上进行测试,本研究模型的BLEU-4、METEOR、ROUGEL和CIDEr分别为56.8、37.6、74.5以及98.5。与当前主流模型相比,本研究模型在多项评价指标上表现优异。
关键词
视频内容描述
s-yolo
V5
Vision
Transformer
多头注意力
Keywords
Video content description
s-yolo
V5
Vision Transformer
Multi-head attention
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
油气站场视频监控系统的设计与应用
被引量:
3
2
作者
文炜
黄腾
彭竟飞
方正
闫井超
刘凯书
顾继俊
机构
国家管网集团川气东送天然气管道有限公司
中国石油大学(北京)机械与储运工程学院
出处
《计算技术与自动化》
2023年第3期47-53,共7页
基金
国家管网集团川气东送天然气管道有限公司科技项目(35150573-20-ZC0607-0002)。
文摘
安全监控系统的集成化、智能化升级是油气站场亟待解决的问题。针对当前系统的弊端,设计开发油气站场智能视频监控系统。利用宽动态技术,解决早期监控摄像头采集到的视频信号易受天气影响,画质不佳,有用信息不足等问题。并利用YOLO目标检测算法,实现对区域内人员未戴安全帽的行为进行监控。最后构建基于B/S架构的安防设备集成管理平台,将算法同监控视频画面集成,并显示站场三维地图,为后续站场数据可视化预留扩展接口。实践应用表明该系统能显著提升油气站场智能视频监控水平。
关键词
视频监控
宽动态技术
YOLO
B/S架构
Keywords
video surveillance
wide dynamic technology
YOLO
B/S architecture
分类号
X937 [环境科学与工程—安全科学]
在线阅读
下载PDF
职称材料
题名
一种改进YOLOv3的学校场所目标识别方法
被引量:
2
3
作者
高锦风
陈玉
魏永明
李剑南
江若楠
机构
中国科学院空天信息创新研究院
中国科学院大学
天津市城市规划设计研究总院有限公司天津市智慧城市规划企业重点实验室
出处
《中国科学院大学学报(中英文)》
CAS
CSCD
北大核心
2023年第4期531-539,共9页
基金
兵团科技攻关项目(2017DB005-01)资助。
文摘
基于遥感影像进行特定场所类型的识别在智慧城市规划、土地利用分析、平安城市建设等多方面都具有重要意义。然而,不同场所的环境景观属性(如道路和停车场等)比较复杂,难以用传统的分类或目标识别方法基于简单的规则进行识别。卷积神经网络具有较强的空间信息挖掘能力,尝试对著名的YOLOv3模型进行改进,提出一种名为YOLO-S-CIoU的新模型,用于学校场所目标的识别。主要改进工作包括:1)使用SRXnet模块替换YOLOv3中的Darknet53模块以提高特征学习能力;2)利用complete-IoU loss(CIoU loss)优化边界框的回归;3)基于自制的学校场所样本数据集(SS数据集)进行训练和验证。实验结果表明,YOLO-S-CIoU的平均精度(AP)达到96.46%;参数量为226 MB。与改进前YOLOv3相比,YOLO-S-CIoU实现了参数量9 MB的下降以及AP 2.3%的提升。此外,在新疆图木舒克市和烟台市区域遥感影像中对学校场所目标识别,召回率比YOLOv3分别提高37.5%和42.2%。这表明改进后的网络模型在不同地理区域的遥感影像识别中具有更强的鲁棒性和更高的识别能力。
关键词
YOLO-S-CIoU
SE-ResNeXt
CIoU
loss
特定场所识别
遥感
学校识别
Keywords
YOLO-S-CIoU
SE-ResNeXt
CIoU loss
specific place identification
remote sensing
school identification
分类号
TP751.1 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于S-YOLO V5和Vision Transformer的视频内容描述算法
徐鹏
李铁柱
职保平
《印刷与数字媒体技术研究》
CAS
北大核心
2023
2
在线阅读
下载PDF
职称材料
2
油气站场视频监控系统的设计与应用
文炜
黄腾
彭竟飞
方正
闫井超
刘凯书
顾继俊
《计算技术与自动化》
2023
3
在线阅读
下载PDF
职称材料
3
一种改进YOLOv3的学校场所目标识别方法
高锦风
陈玉
魏永明
李剑南
江若楠
《中国科学院大学学报(中英文)》
CAS
CSCD
北大核心
2023
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部