3 月 25 日,全省科技创新大会在广州召开,大会颁发了 2019 年度广东省科学技术奖。其中,技术发明奖一等奖共 9 项,由中国科学院深圳先进技术研究院(简称“深圳先进院 ” )联合深圳市商汤科技有限公司、南京大学研发完成的“视频的深度表征与识别技术及应用”项目为其中之一。 近年来,随着信息通信技术的发展,视频数据呈现爆炸式增长。现有技术虽然能够较好地采集、存储和传输视频,但大规模视频识别仍面临内容复杂、识别精度和计算效率等巨大挑战。解决这些挑战的核心是构建让 AI 既能 “ 看得懂 ” ,又能“认得准 ” ,同时还能“算得快 ” 的能力,即实现对复杂多变内容的理解、海量对象的高精度识别及快速处理。 项目第一完成人深圳先进院数字所所长乔宇研究员带领团队,经过多年研究开发和应用验证,提出了视频长短时表征与识别等一系列创新性方法,突破了轨迹卷积、中心损失等核心技术,显著提升了复杂视频行为分类、大规模人像识别、物体检测、场景分类等重要视觉任务的性能。 该技术在多个著名视觉数据库的验证下取得了同期国际领先的识别率,并在 ImageNet 、 ActivityNet 等重要视觉国际竞赛多次取得第一或名列前茅。在计算机视觉重要国际期刊和会议如 PAMI 、 IJCV 、 CVPR 、 ICCV 等发表一系列创新论文,根据谷歌学术统计论文累计被引超过 8000 次,获国内外授权发明专利 10 余项。 目前,项目研发的技术已广泛应用于智慧城市、机器人及互联网多媒体等多个领域,提高了城市的管理效率和能力,创造了显著的经济和社会效益。 时序分割网络,可在显存限制条件下,实现全视频到端到端优化训练。