CNCC|如何攻克多模态人机交互领域面临的挑战
CNCC|如何攻克多模态人机交互领域面临的挑战
CNCC2022将于12月8日至10日在贵州省贵阳市国际生态会议中心举办,今年CNCC技术论坛数量达到122个,内容涵盖了“计算+行业、人工智能、云计算、教育、安全”等30个方向。本文特别介绍将于12月10日举行的【多模态交互发展】技术论坛。
报名及了解更多技术论坛信息请识别下图二维码进入CNCC2022官网。目前早鸟票限时优惠报名正在进行,抓住机会立享大幅优惠!
随着人工智能产业走向了发展的快车道,已经越来越被更多的人所熟知,对于人机交互技术的研究也是越发深入成熟。多模态交互也成为人机交互的必然趋势。技术与数据的融合则是推动行业发展的关键,也是赋能行业和各大应用场景的前提。
论坛主要讨论多模态人机交互的最新进展、多模态在各大行业领域的应用与实现,以及如何攻克多模态人机交互领域面临的挑战等。
论坛安排
顺序 | 主题 | 主讲嘉宾 | 单位 |
1 | 大数据大模型大计算时代的思考
| 颜永红 | 中国科学院声学研究所
|
2 | 浅谈以多模态数据为中心的人工智能
| 张晴晴
| Magic Data
|
3 | 非接触感知系统和未来健康管理 | 王鹏
| 英特尔
|
4 | 多模态多视角医学影像分析
| 张彤
| 鹏城实验室
|
论坛主席
张晴晴
Magic Data创始人兼CEO
CCF语音对话与听觉专委会委员、CCF智能汽车分会执行委员、CCF女计算机工作者委员会委员。语音技术专家、对话式AI先行者,中科院声学所副研究员、博士,法国国家实验室LIMSI-CNRS博士后,获得《财富》2021年中国最具影响力的商界女性未来榜。创业邦2021年最值得关注的女性创业者,获中国科学院杰出科技成就奖。微软亚洲研究院“微软学者”奖学金获得者。
论坛共同主席
颜永红
中科院声学所 研究员
中国科学院声学所首席科学家,科学院核心骨干特聘研究员。他长期从事语音信号处理和识别的研究,牵头承担国家自然基金委重大项目、863、科技支撑、重点领域专项等国家级科研项目十余项,国家自然基金委国家杰出青年基金获得者、全国优秀科技工作者称号获得者。发表论文300余篇,持有发明专利100余项,曾获国家科技进步二等奖一项,中科院杰出科技成就奖一项,省部科技一等奖两项。
报告及讲者介绍
颜永红
中科院声学所 研究员
报告题目:大数据大模型大计算时代的思考
近年来随着计算技术的发展,以深度学习为核心的智能技术在各个领域都呈现出了大数据大计算大模型的特征,如何在资源有限的情况下构建实用的系统成为了从业人员的一个挑战。本报告将简要回顾声学所近年来在知识驱动的机器学习方面主要进展,试图给科研单位的多模态研究者提供一些研究的思路。
张晴晴
Magic Data 创始人兼CEO
报告题目:以多模态数据为中心的人工智能
传统的深度学习算法主要通过单一数据源训练其模型,这主要与单模态人工智能有关。近年来,随着AI作画、多模态情感分析、文本生成图像、虚拟人等成为AI研究的热点。构建统一的、跨场景、多任务的多模态基础模型已经成为机器学习的主流。多模态数据已成为数据资源的主要形式。是否有可用的多模态数据集以及数据如何标注、各模态数据之间如何进行更好的融合等问题给模型训练带来了巨大的挑战。本次演讲主要针对AI产学研新生态的构建以及数字人的语音多情感合成等方向进行探讨。
王鹏
英特尔中国研究院 副院长
英特尔中国研究院政府与企业合作部总监,清华大学计算机科学与技术系博士 ,香港城市大学创意媒体学院访问学者,中国计算机学会IT女性精英大会执委,IEEE女性工程师国际高峰论坛程序主席,曾获得英特尔全球品牌大使、英特尔技术最高奖、英特尔中国最佳员工。国际消费电子展最佳创新奖、最佳无线应用奖、最佳技术奖。发表国内外学术论文30余篇,申请国际专利10多项。
报告题目:非接触感知系统和未来健康管理
非接触式感知技术包括视觉、音频、雷达、超声等多模态信号的采集、处理和分析,能够从不同角度提取和描述人的运动、生理、姿态、情绪等信息。在移动计算和边缘计算越来越关注数据发源地的同时,感知技术要考虑处理数据的实时性、舒适性、方便性和连续性。对于未来健康管理和服务而言,既要提供可靠易用的设备体验给患者,也要提供高效的辅助工具和系统给医生,两者形成良性循环以及服务闭环,实现主动健康监测和健康风险评估,为临床治疗和干预提供预警和筛查。
张彤
鹏城实验室 助理研究员
CCF YOCSEF深圳副主席,澳大利悉尼大学博士,深圳市海外高层次引进人才,国家优秀自费留学生奖学金获得者;CCF女工委主任助理;深圳市女科技工作者协会副会长;深圳市人工智能学会副秘书长;主要研究方向为多模态医学影像时空建模及分析,已发表学术论文30余篇,其中ESI高被引论文1篇,受邀担任Medical Physics期刊特邀副主编,多次受邀在国内外学术会议上给主题/邀请报告,谷歌学术引用1900余次。
报告题目:多模态多视角医学影像分析
现实世界及其信息感知的方式是多模态的,在医疗场景中,生理电信号、超声、磁共振、基因等多维度多模态大数据在临床诊断有独特且相关的作用,但由于跨模态数据的同质性差,联合建模方法尚属于探索阶段。多模态AI模型构建及分析面临着不同模态的信息如何表示、关联、对齐和融合的挑战。本报告将总结多模态医学影像AI领域模型构建等相关理论及创新成果,分享团队近年来在多模态动态医学图像建模及分析的工作。
CNCC是级别高、规模大的高端学术会议,探讨计算及信息科学技术领域最新进展和宏观发展趋势,展示计算领域学术界、企业界最重要的学术、技术成果,搭建交流平台,促进科技成果转换,是学术界、产业界、教育界的年度盛会。今年邀请嘉宾包括ACM图灵奖获得者、田纳西大学教授Jack Dongarra,以及高文、管晓宏、江小涓、钱德沛、徐宗本、张平等多位院士及专家,还有七百余位国内外名校学者、名企领军人物、各领域极具影响力的业内专家,CNCC在计算领域的水准及影响力逐年递增。本届CNCC的主题是:算力、数据、生态。
CNCC2022将汇聚国内外顶级专业力量、专家资源,为逾万名参会者呈上一场精彩宏大的专业盛宴。大会期间还将举办“会员之夜”大型主题狂欢活动,让参会者畅快交流,燃爆全场。如此盛会,岂能缺席!等你来,马上行动,欢迎参会报名!