视觉理解:从网络到表征|SPP第60期
视觉基础任务(例如图像识别、目标检测、跨模态物体定位等)是计算机视觉理解的基石。随着深度学习和大模型的迅猛发展,有大量的工作聚焦到了神经网络的主干网络架构和网络表征学习上。本期SPP报告将基于主干网络架构、网络表征设计这两方面介绍讲者团队近年来发表于CVPR、ICCV和NeurIPS上的一些代表性的粗浅工作,探讨架构层面和表征层面对视觉目标识别任务的一些设计原理。欢迎参加本期SPP:9月20日(本周三) 19:30-21:00
本期直播你将收获哪些
1、学习视觉神经网络架构上的设计思路
2、了解视觉任务表征设计上的机制机理
演讲嘉宾
李翔
南开大学计算机学院副教授
李翔博士,南开大学计算机学院副教授,入选南开大学百青计划、博士后创新人才支持计划,主持国家自然科学青年基金,获江苏省人工智能学会优秀博士论文奖,CCF优秀博士论文提名奖。李翔博士在CCF A 类会议CVPR、NeurIPS及权威期刊TPAMI等上发表40余篇学术论文,包括第一作者和通讯作者20余篇;谷歌学术总引用达7700余次,一作代表工作SKNet(CVPR19)引用1800余次,是著名工作ResNeSt(李沐组)和SimCLRv2(Hinton组)的基石网络。所提出的目标检测算法GFL系列(NeurIPS20, CVPR21, TPAMI23)累积获得600余次谷歌学术引用,收录于权威目标检测工具箱mmdetection,并成为主流轻量目标检测器YOLO系列(如YOLOv8)中的标准配置。其合作提出的PVT模型入选ICCV21 Top-10最具影响力工作(排名第二,第一名为马尔奖Swin Transformer)。长期担任国际人工智能顶级会议AAAI、CVPR及权威期刊TPAMI、TIP、TMM审稿人,担任Image and Vision Computing期刊副主编。
开课时间
2023年9月20日(本周三)19:30-21:00