近期,金沙9001cc诚为本HPC实验室两篇论文分别被国际顶级会议CVPR2023 (IEEE Conference on Computer Vision and Pattern Recognition)和国际顶级期刊TNNLS(IEEE Transactions on Neural Networks and Learning Systems)在线发表,另有一篇被国际顶级期刊TCSVT(IEEE Transactions on Circuits and Systems for Video Technology)录用。
TCSVT:由于以运动为中心动作具有细粒度和速度方差大,基于骨骼点的动作识别是一项具有挑战性的任务。基于RGB方法因缺少空间建模,在骨骼点分割任务上表现不好。为了解决这一问题,实验室硕士研究生李运恒的论文“Involving Distinguished Temporal Graph Convolutional Networks for Skeleton-Based Temporal Action Segmentation”提出带有时序片段回归模块的涉及差异性时空图卷积网络(IDT-GCN)。IDT-GCN使用涉及差异性图卷积自适应地捕获关节之间的相似性和差异性依赖关系;时序片段回归模块来建模片段内动作执行顺序和动作边界。IDT-GCN的性能优于基于TCN和基于Transformer的动作分割方法性能。
MCFS-22和MCFS-130数据集不同动作分割模型的结果对比
CVPR2023:针对单帧监督时序动作分割过度依赖时间戳标注的问题,实验室刘铠源和李运恒提出“Reducing the Label Bias for Timestamp Supervised Temporal Action Segmentation”。该方法主要包括掩蔽时间戳预测和面向动作中心的时间戳集合拓展两个主要部分。掩蔽时间戳预测在初始化模型时会掩蔽时间戳的输入特征,以消除模型对注释帧的依赖。通过这种方式,初始化的模型被迫在相应的输出特征中重建注释的框架,然后通过时间戳的上下文信息预测它们的行动类别。受查询扩展的启发,我们提出了一种面向中心的时间戳扩展(CTE)方法,用于获得潜在的可信赖的未标记的帧,我们称之为伪时间戳,以逐步扩展比单一注释的时间戳包含更多语义的伪时间戳组。该方法在三个标准数据集上取得了先进的结果。
时间戳动作分割示意图
TNNLS:刘胜蓝副教授和硕士于洋提出层次的近邻嵌入算法(Hierarchical Neighbors Embedding, HNE)来解决现有流形学习算法在稀疏数据或弱连接流形数据上失效的问题。HNE算法框架引入了层次的近邻结构,并在低维嵌入过程中保持该层次性结构,从而增强了流形学习算法的几何与拓扑保持能力。
稀疏流形数据上的近邻选择
以上三个成果均是在刘胜蓝副教授(通讯作者)指导下完成的。HPC实验室自2017年成立以来始终致力于科研和硕士研究生的培养。实验室的硕士毕业生绝大多数就职于腾讯、阿里巴巴、大疆和今日头条等知名企业。
上一条:学院校友论坛“AI新时代的创业与就业”主题访谈成功举办
下一条:全国大学生嵌入式芯片与系统设计竞赛北部赛区竞赛训练营成功举办