期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
VIPLFaceNet: an open source deep face recognition SDK 被引量:15
1
作者 Xin LIU Meina KAN +2 位作者 Wanglong WU Shiguang SHAN Xilin CHEN 《Frontiers of Computer Science》 SCIE EI CSCD 2017年第2期208-218,共11页
Robust face representation is imperative to highly accurate face recognition. In this work, we propose an open source face recognition method with deep representation named as VIPLFaceNet, which is a lO-layer deep con... Robust face representation is imperative to highly accurate face recognition. In this work, we propose an open source face recognition method with deep representation named as VIPLFaceNet, which is a lO-layer deep convolu- tional neural network with seven convolutional layers and three fully-connected layers. Compared with the well-known AlexNet, our VIPLFaceNet takes only 20% training time and 60% testing time, but achieves 40% drop in error rate on the real-world face recognition benchmark LFW. Our VIPLFaceNet achieves 98.60% mean accuracy on LFW us- ing one single network. An open-source C++ SDK based on VIPLFaceNet is released under BSD license. The SDK takes about 150ms to process one face image in a single thread on an i7 desktop CPU. VIPLFaceNet provides a state-of-the-art start point for both academic and industrial face recognition applications. 展开更多
关键词 deep learning face recognition open source viplfacenet
原文传递
面向开源视频的深度学习情报分析系统设计与实现
2
作者 鄢靖昀 姜君 曹秀云 《现代电子技术》 北大核心 2025年第12期167-178,共12页
针对传统视频情报分析中信息提取效率低下的问题,设计一种基于深度学习的人机交互式视频情报分析系统,以满足快速提取大量视频关键情报的需求。系统框架围绕数据采集、存储、处理及应用进行分层设计,采用组件化设计实现功能模块的独立运... 针对传统视频情报分析中信息提取效率低下的问题,设计一种基于深度学习的人机交互式视频情报分析系统,以满足快速提取大量视频关键情报的需求。系统框架围绕数据采集、存储、处理及应用进行分层设计,采用组件化设计实现功能模块的独立运行,并集成基于深度学习的自动语音识别、神经机器翻译、光学字符识别以及大模型文本摘要生成等前沿技术,提供端到端的解决方案,实现全面的视频分析功能。功能测试结果显示,所有模块均能按设计要求正常运行。性能测试结果表明,系统在处理大规模视频数据的实时环境中表现稳定、性能优异,高并发情况下响应时间在3 s以内,支持最多2万并发用户。所设计系统不仅能高效提取视频情报,还拥有直观的用户交互界面,可以提供多样化的情报分析应用服务,并满足大规模用户在视频分析场景下的业务需求。 展开更多
关键词 情报分析 开源视频 深度学习 自动语音识别 神经机器翻译 光学字符识别
在线阅读 下载PDF
开源文本中军事目标动向事件抽取方法研究 被引量:1
3
作者 张宇恒 郑胜 陈晓玥 《武汉工程大学学报》 CAS 2024年第3期299-303,共5页
从海量非结构化的开源军事目标动向文本中抽取指定军事目标的事件信息以及运动轨迹,是识别和预测军事目标的行动意图、挖掘战场动态信息的基础工作。针对目前事件抽取研究中忽略地点论元之间空间关系信息从而导致无法抽取移动目标的运... 从海量非结构化的开源军事目标动向文本中抽取指定军事目标的事件信息以及运动轨迹,是识别和预测军事目标的行动意图、挖掘战场动态信息的基础工作。针对目前事件抽取研究中忽略地点论元之间空间关系信息从而导致无法抽取移动目标的运动轨迹问题,提出划分细粒度空间关系标签的方法来识别空间关系,通过序列标注方法进行事件抽取,使用预训练语言模型进行底层语义编码、双向长短时记忆网络进行深层次特征提取、条件随机场进行标签分类的联合事件抽取模型以完成动向事件抽取。在动向事件抽取结果的基础上,使用运动轨迹抽取算法来加强空间关系信息。通过在自建的真实军事目标动向新闻数据集上进行实验,获取了84.0%的F1分数值。 展开更多
关键词 开源军事情报 事件抽取 空间关系识别 深度学习
在线阅读 下载PDF
DTZH1505:大规模开源中文普通话语音库 被引量:1
4
作者 王东 王丽媛 +1 位作者 王大亮 齐红威 《计算机工程与应用》 CSCD 北大核心 2022年第11期295-301,共7页
近年来,深度学习在语音识别领域取得了突破性进展,并推动语音识别技术广泛应用到人们的日常生活中。语音识别模型的进一步优化需要更大规模标定数据的驱动,然而,目前开源的语音数据集规模仍太小,语料多为偏向书面用语的新闻类长文本。... 近年来,深度学习在语音识别领域取得了突破性进展,并推动语音识别技术广泛应用到人们的日常生活中。语音识别模型的进一步优化需要更大规模标定数据的驱动,然而,目前开源的语音数据集规模仍太小,语料多为偏向书面用语的新闻类长文本。针对人机交互、智能客服等热门语音识别应用,通过众包模式采集朗读式语音,构建并开源了迄今为止最大规模的中文普通话语音数据集DTZH1505。数据集记录了6408位来自中国八大方言地域、33个省份的说话人的自然语音,时长达1505 h,语料内容涵盖社交聊天、人机交互、智能客服以及车载命令等,可广泛用于语料库语言学、会话分析、语音识别、说话人识别等研究。开展一系列基准语音识别实验,实验结果表明:相较于同规模中文语音数据集aishell2,基于此数据集训练的语音识别模型效果更好。 展开更多
关键词 中文普通话语音库 开源数据 语音识别 深度学习 音素平衡
在线阅读 下载PDF
基于开源框架的人机交互危险姿态识别系统设计
5
作者 潘萍 彭高丰 潘凌云 《自动化与仪器仪表》 2023年第10期95-98,103,共5页
老年人因年龄增长、身体机能衰退和认知功能减弱而面临不同程度的生活危险。因此,为了及时发现、监测和处理老年人的危险姿势,从而保护老年人的安全和健康。研究提出一种融合端对端思想和卷积神经网络(Port to port convo-lutional neur... 老年人因年龄增长、身体机能衰退和认知功能减弱而面临不同程度的生活危险。因此,为了及时发现、监测和处理老年人的危险姿势,从而保护老年人的安全和健康。研究提出一种融合端对端思想和卷积神经网络(Port to port convo-lutional neural network,PTP-CNN)的老年人危险位姿虚拟模型识别算法,从而做出预防性措施或及时的护理。研究结果表明,该系统在运用PTP-CNN算法时,Epochs的训练次数为15~30之间,MSE评价指标上PTP-CNN模型分别比SW-CNN、AlexNet降低25.33%、5.17%,说明PTP-CNN模型拥有更高的准确性和精确性,可以更好地进行图像识别任务,从而及时发现老年人的危险姿势。 展开更多
关键词 深度学习 开源框架 信息采集 位姿虚拟模型 卷积神经网络 图像识别
原文传递
人脸活体检测综述 被引量:5
6
作者 陈宁珏 《信息与电脑》 2019年第8期108-109,112,共3页
活体检测是生物特征识别在安全领域应用的关键技术之一。人脸的活体检测是人脸识别的前置环节,在以人脸识别后按身份授权的安全领域,扮演十分重要的角色。基于此,笔者从活体与非活体的特征差异着手,分析近年来活体检测的技术发展,找出... 活体检测是生物特征识别在安全领域应用的关键技术之一。人脸的活体检测是人脸识别的前置环节,在以人脸识别后按身份授权的安全领域,扮演十分重要的角色。基于此,笔者从活体与非活体的特征差异着手,分析近年来活体检测的技术发展,找出当前活体检测技术的不足,并展望未来的可能发展方向。 展开更多
关键词 人脸识别 活体检测 深度学习 单目技术 开源数据集
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部