联系人:科技处
所在地:陕西西安市
成果简介;
随着 VR、AR 等技术的发展, 非接触式的人机交互方式正逐渐取代传统的键鼠输入,而基于手势的交互则是其中的一种较为常见的方法。项目以此需求为牵引,针对基于视频的大规模手势识别任务中, 容易受到光照、背景及表演者服饰
等因素干扰的问题,提出了一种基于同源数据融合的大规模的手势识别方法。首先通过对视频的增 强消除无关因素的干扰,随后通过对数据分布特征的分析,根据时空注意力机制, 获取与手势最相关的区域。此后,利用三维深度卷积神经网络模型,对同源的 RGB、深度和光流数据同时提取空域和 时域上的特征信息,并将这些特征加以融合,最终通过SVM 分类器来获得手势类别