
2025年2月,哈尔滨工业大学(深圳)计算机科学与技术学院连牛和黎俊以第一作者身份在CVPR-25发表论文《AutoSSVH: Exploring Automated Frame Sampling for Efficient Self-Supervised Video Hashing》。技术提出了一种基于自监督学习的视频哈希框架AutoSSVH,通过优化关键帧选取策略,在保持检索精度的同时显著降低了计算资源消耗
从“暴力计算”到“智能抽帧”的转变
当前短视频平台日均处理量已突破亿级,传统视频检索技术因需逐帧处理存在效率瓶颈。团队创新性地将对抗训练与Gumbel-Softmax采样方法结合,开发出动态帧采样机制。该技术通过分析视频内容复杂度,自动选择信息量大的关键帧进行特征提取,避免了对冗余帧的计算。
图1:AutoSSVH的技术细节和核心创新点
性能跃升数据:
实验数据显示,在UCF101标准数据集上,32位哈希编码的跨模态检索准确率达到89.7%,较现有方法提升约36%,模型训练效率提高3倍。实际应用测试表明,该技术可将短视频平台的哈希匹配速度提升66%,在安防监控场景中,十万小时级视频的异常事件检索效率提升8倍,误报率控制在2%以内。项目组已与多家企业展开合作,探索在移动端设备的落地应用。
陈斌副教授表示:“AutoSSVH不仅是算法创新,更是一次数据压缩范式的重构。我们正与头部企业合作,推动技术嵌入边缘计算设备,实现端侧实时视频分析。”
图2:连牛跟黎俊在探讨AutoSSVH论文的细节
本科生主导的科研奇迹
连牛的成长轨迹:大二加入陈斌课题组,一年内以本科生身份发表CVPR一作、AAAI共一等顶会论文。其突破得益于课题组“早进团队、早定方向、早出成果”的培养模式。陈斌副教授强调:“科研需要敢于走出舒适区。连牛从零开始学习深度学习,很快便掌握对抗生成网络的核心技术。”
课题组另一核心成员黎俊在算法优化中提出关键思路:“我们将对抗训练与集成学习结合,解决了采样器与哈希码生成器的博弈失衡问题。”
中国团队的“哈希改进”
CVPR-2025审稿人评价:“AutoSSVH为视频哈希领域提供了全新的方法论框架,其可微分采样机制具有普适价值。”
未来,该团队正将AutoSSVH与多模态大模型结合,陈斌副教授透露:“下一阶段目标是实现PB级视频库的秒级检索,并构建基于哈希的AI内容安全防火墙。”