返回首页
登录

CCF青岛崂山论坛多模态智能视觉感知研讨会成功举办

阅读量:0 2024-11-22 收藏本文

20241117日,由中国计算机学会(CCF)主办、CCF青岛、青岛科技大学数据科学学院承办的CCF青岛崂山论坛——模态智能视觉感知研讨会在青岛科技大学(崂山校区)成功举行。本次研讨会汇聚了来自中国科学院自动化研究所、天津大学、哈尔滨工业大学、中国海洋大学等多所知名高校与研究机构的专家学者,共同探讨多模态智能视觉感知领域的前沿技术与发展趋势。

会议由青岛科技大学数据科学学院副院长李辉主持,在青岛科技大学软控报告厅拉开帷幕。CCF青岛分部主席、山东科技大学赵建立教授发表了开幕词,感谢与会专家学者的到来,并简要介绍了论坛的主题和目的。在接下来的专题论坛环节,天津大学朱鹏飞教授、哈尔滨工业大学张盛平教授、中国海洋大学董兴辉教授以及中国科学院自动化研究所原春锋研究员分别做了精彩报告。


朱鹏飞教授以“协同进化学习”为主题,详细阐述了智能无人系统如何依赖多传感器实现对复杂环境的鲁棒感知。他的团队在此领域取得了一系列重要进展,尤其是在数据平台构建和学习范式创新方面。朱教授介绍了团队构建的VisDrone大规模无人机视觉数据平台,该平台包含可见光数据、双光数据和多机协同数据等,支持目标检测、目标跟踪、群体分析和协同感知等多种任务。基于此平台,团队围绕以下关键方向展开研究:一是低代价学习范式,应对数据和算力受限的挑战;二是协同学习机制,解决多机多传感器不同步情况下的协作问题;三是进化学习机制,应对未知场景和类别下的自适应学习。朱教授特别强调,未来团队将主要聚焦无人机具身智能的理论与方法,并在军事安防等场景中展开应用。

张盛平教授以“视频数据增强与恢复”为主题,聚焦如何在复杂极端场景下提升视频数据的质量,并提出了一系列创新性解决方案。张教授指出,传统可见光相机在低光照环境中常出现亮度过暗的问题,现有方法在处理亮度退化时易产生伪影和时序不一致现象。此外,在高速运动场景下,传统RGB相机难以消除运动模糊。为解决这些难题,张教授团队提出了基于频域扩散与时空注意力的低光照视频增强方法。该方法利用频域特性与自然图像生成先验,结合时空联合注意力机制,捕获视频帧内与帧间的长距离依赖,有效缓解伪影,实现亮度与清晰度的同步增强。此外,团队提出了基于时空隐式表达的事件运动去模糊方法,利用事件相机的高时间分辨率和高动态特性,通过尺度感知的时空特征聚合策略,融合不同时空尺度的事件数据,处理高速运动场景的运动模糊,显著提升重建视频的清晰度,实现高速、高动态视频数据的恢复和重建。

董兴辉教授以“水下图像增强与质量评估”为主题,分享了团队在这一领域的最新研究进展。董教授指出,水下图像在海洋开发以及军事、科研等活动中扮演着重要的角色。然而,由于水体对光线的吸收和散射,水下图像普遍存在色偏、细节模糊和能见度低等问题的存在,不仅限制了水下图像处理算法的有效性,也对相关应用带来了诸多挑战。为此,针对水下图像质量还原和增强的现实需求,团队提出了一系列创新方法。传统增强方法多依赖卷积神经网络,但该网络存在局部特征提取的限制。为突破这一瓶颈,董教授团队通过结合局部与全局图像特征,从图像增强和复原两方面入手,显著提升了水下图像的质量。此外,团队还着眼于水下图像数据稀缺的问题,构建了包含6万余张带人工图像质量评分的水下图像数据集,为研究提供了高质量的基础数据支持。在此基础上,团队设计了一种视觉感知启发的水下图像质量评估算法,实现了更贴近人类视觉感知的图像质量评价。此外,受多模态融合视觉技术的启发,团队在文本引导的水下图像增强领域也展开了探索,并取得了初步的成果。

原春锋研究员以“面向开放语义的跨模态视觉内容理解及应用”为主题,深入探讨了视觉内容理解领域的前沿研究进展。报告重点介绍了视觉内容的深度语义理解如何推动计算机视觉技术的突破,以及这一进展如何促进自动驾驶、安防监控、医疗影像等领域的技术发展。原春锋研究员详细阐述了视觉内容理解的演变,强调了深度学习和预训练模型技术在视觉任务中的应用,如开放词汇目标检测和跨模态视频描述等。她提出,通过基于语言引导的蒸馏方法,现有模型可以跨越预定义的类别限制,识别新类别的物体和场景,为开放语义的目标检测任务提供了新的思路。同时,原春锋研究员还分享了自己团队在跨模态检索和视频描述生成等技术上的创新,特别是在解决视频描述多样性、评价方法以及跨模态知识迁移方面的研究。

在每位专家报告结束后,与会人员都积极提问、深入交流,共同探讨相关领域的热点问题和发展趋势。赵建立主席还为每位特邀讲者颁发了感谢证书,以表彰他们在多模态智能视觉感知领域所做出的重要贡献和精彩报告。

本次研讨会的成功举办,不仅促进了多模态智能视觉感知领域的学术交流与技术进步,也为该领域的发展提供了新的思路与方向。与会专家学者纷纷表示,将把本次研讨会的收获带回各自的工作和研究中,为推动多模态智能视觉技术的发展贡献力量。同时,他们也期待在未来的学术活动中能够再次相聚,共同探讨新的技术与机遇。