期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
创客背景下I3D ONE校本课程教学路径分析
1
作者 李永全 《天津教育》 2019年第24期77-78,共2页
I3D ONE课程的开展是基于互联网创客时代的一种现代化教学课程,当前创客教育俨然已经成为时代背景下的重要命题,而I3D ONE更是创客空间的重点实施者。本文就以“创客创新意识、3D打印实践意识、软硬件配置、系统性校本课程”四点为基点... I3D ONE课程的开展是基于互联网创客时代的一种现代化教学课程,当前创客教育俨然已经成为时代背景下的重要命题,而I3D ONE更是创客空间的重点实施者。本文就以“创客创新意识、3D打印实践意识、软硬件配置、系统性校本课程”四点为基点,对创客背景下I3D ONE校本课程教学实施路径进行简要的分析与探讨。 展开更多
关键词 创客 i3d ONE 校本课程 教学路径
在线阅读 下载PDF
试论高中信息技术教学与i3d技术教学的融合
2
作者 熊希艳 《中华少年》 2018年第34期206-206,共1页
在高中信息技术教学过程中,我们应本着'教育要面向现代化、面向世界、面向未来'的原则,积极引入先进的信息技术,让这些先进的信息技术能够切实地促进学生信息技术素养的发展。我们在教学中,通过引入i3d(交互式3D)技术,使学生们... 在高中信息技术教学过程中,我们应本着'教育要面向现代化、面向世界、面向未来'的原则,积极引入先进的信息技术,让这些先进的信息技术能够切实地促进学生信息技术素养的发展。我们在教学中,通过引入i3d(交互式3D)技术,使学生们接触到了最前沿的科学技术成果,有效发展了信息技术素养。本文就试图讨论高中信息技术教学与i3d技术教学的融合,希望能够为高中信息技术教学研究事业的发展做出积极的贡献。 展开更多
关键词 高中信息技术 i3d技术教学 融合
原文传递
Fusing Geometric and Temporal Deep Features for High-Precision Arabic Sign Language Recognition
3
作者 Yazeed Alkharijah Shehzad Khalid +2 位作者 Syed Muhammad Usman Amina Jameel Danish Hamid 《Computer Modeling in Engineering & Sciences》 2025年第7期1113-1141,共29页
Arabic Sign Language(ArSL)recognition plays a vital role in enhancing the communication for the Deaf and Hard of Hearing(DHH)community.Researchers have proposed multiple methods for automated recognition of ArSL;howev... Arabic Sign Language(ArSL)recognition plays a vital role in enhancing the communication for the Deaf and Hard of Hearing(DHH)community.Researchers have proposed multiple methods for automated recognition of ArSL;however,these methods face multiple challenges that include high gesture variability,occlusions,limited signer diversity,and the scarcity of large annotated datasets.Existing methods,often relying solely on either skeletal data or video-based features,struggle with generalization and robustness,especially in dynamic and real-world conditions.This paper proposes a novel multimodal ensemble classification framework that integrates geometric features derived from 3D skeletal joint distances and angles with temporal features extracted from RGB videos using the Inflated 3D ConvNet(I3D).By fusing these complementary modalities at the feature level and applying a majority-voting ensemble of XGBoost,Random Forest,and Support Vector Machine classifiers,the framework robustly captures both spatial configurations and motion dynamics of sign gestures.Feature selection using the Pearson Correlation Coefficient further enhances efficiency by reducing redundancy.Extensive experiments on the ArabSign dataset,which includes RGB videos and corresponding skeletal data,demonstrate that the proposed approach significantly outperforms state-of-the-art methods,achieving an average F1-score of 97%using a majority-voting ensemble of XGBoost,Random Forest,and SVM classifiers,and improving recognition accuracy by more than 7%over previous best methods.This work not only advances the technical stateof-the-art in ArSL recognition but also provides a scalable,real-time solution for practical deployment in educational,social,and assistive communication technologies.Even though this study is about Arabic Sign Language,the framework proposed here can be extended to different sign languages,creating possibilities for potentially worldwide applicability in sign language recognition tasks. 展开更多
关键词 Arabic sign language recognition multimodal feature fusion ensemble classification skeletal data inflated 3D ConvNet(i3d)
在线阅读 下载PDF
基于人类演示视频的机器人指令生成框架 被引量:3
4
作者 莫秀云 陈俊洪 +1 位作者 杨振国 刘文印 《机器人》 EI CSCD 北大核心 2022年第2期186-194,202,共10页
为了提高机器人学习技能的能力,免除人工示教过程,本文基于对无特殊标记的人类演示视频的观察,提出了一种基于序列到序列模式的机器人指令自动生成框架。首先,使用Mask R-CNN(区域卷积神经网络)来缩小操作区域的范围,并采用双流I3D网络... 为了提高机器人学习技能的能力,免除人工示教过程,本文基于对无特殊标记的人类演示视频的观察,提出了一种基于序列到序列模式的机器人指令自动生成框架。首先,使用Mask R-CNN(区域卷积神经网络)来缩小操作区域的范围,并采用双流I3D网络(膨胀3D卷积网络)从视频中提取光流特征和RGB特征;其次,引入双向LSTM(长短期记忆)网络从先前提取的特征中获取上下文信息;最后,使用自我注意力机制和全局注意力机制,学习视频帧序列和命令序列的关联性,序列到序列模型最终输出机器人的命令。在扩展后的MPII烹饪活动2数据集和IIT-V2C数据集上进行了大量的实验,与现有的方法进行比较,本文提出的方法在BLEU 4(0.705)和METEOR(0.462)等指标上达到目前最先进性能水平。结果表明,该方法能够从人类演示视频中学习操作任务。此外,本框架成功应用于Baxter机器人。 展开更多
关键词 视频命令学习 细粒度视频描述 机器人学习 双流i3d网络(双流膨胀3D卷积网络) 双向LSTM(长短期记忆)
原文传递
基于视频和文本的机器人技能指令生成方法研究 被引量:1
5
作者 黄可思 陈俊洪 +2 位作者 林大润 王思涵 刘文印 《计算机应用与软件》 北大核心 2023年第8期161-166,173,共7页
由于视觉单模态转译技能方法容易出现错误,针对该问题,设计一种结合视觉和文本的多模态视频转译技能方法。该方法包含两个模块,第一个模块通过使用I3D网络、Mask R-CNN模型和XGBoost分类器识别视频中的动作和物体,并组合生成视觉机器人... 由于视觉单模态转译技能方法容易出现错误,针对该问题,设计一种结合视觉和文本的多模态视频转译技能方法。该方法包含两个模块,第一个模块通过使用I3D网络、Mask R-CNN模型和XGBoost分类器识别视频中的动作和物体,并组合生成视觉机器人指令。第二个模块使用BERT-GRU模型从文本语料库中进行机器指令的学习,再将模块一的机器人指令输入到BERT-GRU模型上进行测试,最终生成修正过的机器人指令给机器人执行。通过在MPII Cooking 2数据集上进行实验,证明了框架性能相比于只有视频单模态情况具有较大的提升。 展开更多
关键词 视频和文本知识 机器人指令 i3d MASK R-CNN
在线阅读 下载PDF
视频与音频特征融合生成动作指令组的方法研究 被引量:1
6
作者 林大润 陈俊洪 +2 位作者 王思涵 钟经谋 刘文印 《计算机应用与软件》 北大核心 2023年第7期132-138,144,共8页
为了提高人与机器人的语音交互能力,提出一个基于视频特征与音频特征融合的动作三元组分类的神经网络框架,其本质是从音视频中提取高度概括动作的指令组。该框架包含三个模块,分别是视频特征提取网络模块、音频特征提取网络模块、特征... 为了提高人与机器人的语音交互能力,提出一个基于视频特征与音频特征融合的动作三元组分类的神经网络框架,其本质是从音视频中提取高度概括动作的指令组。该框架包含三个模块,分别是视频特征提取网络模块、音频特征提取网络模块、特征融合模块。视频特征提取网络模块使用I3D网络结构提取视频特征;音频特征提取网络模块使用卷积神经网络以及双向长短期记忆网络提取音频特征;特征融合模块将视频特征和音频特征进行融合并输出动作三元组的分类。通过在制作的动作音视频数据集上的实验证明,所提出的音视频特征融合网络能达到74.92%的准确率,且具有较强的鲁棒性。 展开更多
关键词 动作三元组 特征融合 i3d 卷积神经网络
在线阅读 下载PDF
Applying Deep Learning Models to Mouse Behavior Recognition
7
作者 Ngoc Giang Nguyen Dau Phan +7 位作者 Favorisen Rosyking Lumbanraja Mohammad Reza Faisal Bahriddin Abapihi Bedy Purnama Mera Kartika Delimayanti Kunti Robiatul Mahmudah Mamoru Kubo Kenji Satou 《Journal of Biomedical Science and Engineering》 2019年第2期183-196,共14页
In many animal-related studies, a high-performance animal behavior recognition system can help researchers reduce or get rid of the limitation of human assessments and make the experiments easier to reproduce. Recentl... In many animal-related studies, a high-performance animal behavior recognition system can help researchers reduce or get rid of the limitation of human assessments and make the experiments easier to reproduce. Recently, although deep learning models are holding state-of-the-art performances in human action recognition tasks, these models are not well-studied in applying to animal behavior recognition tasks. One reason is the lack of extensive datasets which are required to train these deep models for good performances. In this research, we investigated two current state-of-the-art deep learning models in human action recognition tasks, the I3D model and the R(2 + 1)D model, in solving a mouse behavior recognition task. We compared their performances with other models from previous researches and the results showed that the deep learning models that pre-trained using human action datasets then fine-tuned using the mouse behavior dataset can outperform other models from previous researches. It also shows promises of applying these deep learning models to other animal behavior recognition tasks without any significant modification in the models’ architecture, all we need to do is collecting proper datasets for the tasks and fine-tuning the pre-trained models using the collected data. 展开更多
关键词 MOUSE BEHAVIOR RECOGNITION DEEP Learning i3d MODELS R(2 + 1)D MODELS
暂未订购
基于多模态特征记忆库的视频语音检索模型
8
作者 李劼博 陈俊洪 +2 位作者 林大润 杨振国 刘文印 《计算机科学与应用》 2022年第7期1747-1755,共9页
由于不同模态间的数据表示方式不一致,跨模态检索是多媒体领域中的一大难题。本文设计了一种基于多模态特征记忆库的视频语音检索模型,该模型主要分为三个模块,分别为特征提取模块,多模态特征映射融合模块和特征记忆库模块。在特征提取... 由于不同模态间的数据表示方式不一致,跨模态检索是多媒体领域中的一大难题。本文设计了一种基于多模态特征记忆库的视频语音检索模型,该模型主要分为三个模块,分别为特征提取模块,多模态特征映射融合模块和特征记忆库模块。在特征提取模块中,我们分别使用I3D和Bi-LSTM来提取视频中的操作动作特征和语音中的特征信息。在特征映射融合模块中,先将两种模态特征对齐到同一空间中,再进行融合。在第三个模块中,本文创新性地引入了两个对应视频和语音的特征记忆库,根据特定条件在训练和测试过程中不断更新。在经过我们拓展过的MPII Cooking 2数据集进行实验,结果表明我们的模型能够实现更好的视频语音检索效果。 展开更多
关键词 跨模态检索 视频语音检索 i3d网络 Bi-LSTM 特征记忆库
在线阅读 下载PDF
四川盆地西北部超深层碳酸盐岩孔缝带地震检测 被引量:4
9
作者 徐明华 付建元 +2 位作者 杨迅 刘俊海 王宇峰 《天然气工业》 EI CAS CSCD 北大核心 2019年第11期18-24,共7页
近年来,四川盆地西北部地区(以下简称川西北地区)在超深层海相碳酸盐岩气藏勘探方面取得了突破,多个构造在中二叠统茅口组三段(以下简称茅三段)获得高产气流并证实裂缝是天然气高产的主要控制因素,但是常规地震处理对裂缝识别能力差、... 近年来,四川盆地西北部地区(以下简称川西北地区)在超深层海相碳酸盐岩气藏勘探方面取得了突破,多个构造在中二叠统茅口组三段(以下简称茅三段)获得高产气流并证实裂缝是天然气高产的主要控制因素,但是常规地震处理对裂缝识别能力差、预测效果不佳。为此,以川西北地区九龙山构造为例,在归纳总结茅三段储层特征的基础上,分析已钻井茅三段储层的地震响应特征;再通过对原始叠前道集优化处理和频谱恢复高分辨处理提高地震资料分辨率,同时保持裂缝孔洞发育的地震微弱信号;进而采用照明对称体、分频混沌体、导向似然体等叠后地震属性处理技术开展裂缝检测,最后通过三色融合技术预测茅三段缝洞体的平面展布特征。研究结果表明:①川西北地区茅三段超深层碳酸盐岩储层主要为岩溶裂缝型储层,构造裂缝及溶蚀孔缝发育,易形成较大规模的裂缝发育带;②该区超深层原始地震资料主频介于25~30 Hz,对裂缝带响应不明显,采用叠前道集优化处理技术和频谱恢复技术组合,可以保护裂缝带的微弱信号,使地震资料主频达到45 Hz,有效地提升了地震资料的频谱,地质现象表现明显;③采用照明对称体、导向似然体、分频混沌体可以从不同角度反映地震资料表达的地质信息,三色融合技术能较好地反映茅三段碳酸盐岩断裂发育带、岩溶孔缝发育带。结论认为,地震预测裂缝成果与钻井、测井、测试等成果匹配良好,为该区天然气开发井的部署与调整提供了依据。 展开更多
关键词 四川盆地西北部 中二叠世 超深层 岩溶裂缝储集层 裂缝检测 频谱恢复 照明对称体 分频混沌体 导向似然体
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部