视觉理解：从网络到表征｜SPP第60期

阅读量:0 2024-02-22 收藏本文

视觉基础任务（例如图像识别、目标检测、跨模态物体定位等）是计算机视觉理解的基石。随着深度学习和大模型的迅猛发展，有大量的工作聚焦到了神经网络的主干网络架构和网络表征学习上。本期SPP报告将基于主干网络架构、网络表征设计这两方面介绍讲者团队近年来发表于CVPR、ICCV和NeurIPS上的一些代表性的粗浅工作，探讨架构层面和表征层面对视觉目标识别任务的一些设计原理。欢迎参加本期SPP：9月20日（本周三） 19:30-21:00

本期直播你将收获哪些

1、学习视觉神经网络架构上的设计思路

2、了解视觉任务表征设计上的机制机理

演讲嘉宾

李翔

南开大学计算机学院副教授

李翔博士，南开大学计算机学院副教授，入选南开大学百青计划、博士后创新人才支持计划，主持国家自然科学青年基金，获江苏省人工智能学会优秀博士论文奖，CCF优秀博士论文提名奖。李翔博士在CCF A 类会议CVPR、NeurIPS及权威期刊TPAMI等上发表40余篇学术论文，包括第一作者和通讯作者20余篇；谷歌学术总引用达7700余次，一作代表工作SKNet（CVPR19）引用1800余次，是著名工作ResNeSt（李沐组）和SimCLRv2（Hinton组）的基石网络。所提出的目标检测算法GFL系列（NeurIPS20, CVPR21, TPAMI23）累积获得600余次谷歌学术引用，收录于权威目标检测工具箱mmdetection，并成为主流轻量目标检测器YOLO系列（如YOLOv8）中的标准配置。其合作提出的PVT模型入选ICCV21 Top-10最具影响力工作（排名第二，第一名为马尔奖Swin Transformer）。长期担任国际人工智能顶级会议AAAI、CVPR及权威期刊TPAMI、TIP、TMM审稿人，担任Image and Vision Computing期刊副主编。

开课时间

2023年9月20日（本周三）19:30-21:00

CCF学生分会

视觉理解：从网络到表征｜SPP第60期