“CCF语音对话与听觉专业组走进阿里”圆满收官
2020年7月11日,由中国计算机学会(CCF)主办,CCF语音对话与听觉专业组和阿里巴巴集团承办、北京智源人工智能研究院支持的“CCF语音对话与听觉专业组走进企业系列活动”第二期之“走进阿里”通过线上方式成功举办。本次研讨会邀请到阿里四位对话领域的专家介绍京东语音及对话领域的最新成果,旨在加强企业与高校以及个科研院所的联系,为语音对话与听觉研究人员和企业搭建交流平台。本次大会由西北工业大学谢磊教授主持,包含4个学术报告,现场互动热烈,B站参看人数超过8000余人。会议视频资料经过讲者同意后将上传至CCF数字图书馆,供广大学者进一步参考。
CCF语音对话与听觉专业组常务委员、西北工业大学谢磊教授主持
阿里巴巴达摩院语音实验室负责人鄢志杰博士
鄢志杰博士作了题为《语音技术在阿里巴巴》的学术报告,提到语音技术哎阿里巴巴有着非常广泛的应用,此次报告主要以视频展示的方式,向大家介绍了语音技术向大家介绍语音技术在阿里巴巴的一些典型应用,并与大家共同探讨语音技术的新疆界。
阿里巴巴达摩院语音实验室资深算法专家鄢李威博士
李威博士作了题为《阿里语音AI产品化之路》的学术报告,围绕语音的两大能力——语音原子能力和语音交互能力展开分享,通过案例的方式,阐述了阿里是如何建立技术和市场之间真正的良性闭环。同时介绍了阿里在模组方面的一些进展和落地,为大家展示了达摩院语音团队在产品和商业化层面的一些思考,希望和诸位同仁一起为语音AI能力落地碰撞出更好的火花。
阿里巴巴达摩院语音实验室研究员付强博士
付强博士作了题为《面向AIoT的远场语音技术和方案》的学术报告,介绍到AIoT时代语音交互在各类生活电器终端的渗透率越来越高,如何在保证高体验的前提下,降低客户接入成本的要求也越来越高。此次报告系统地介绍了阿里达摩院在此背景下的技术探索和实践,主要介绍语音交互发展趋势、阿里语音AI交互链路技术特色,重点介绍了端侧算法理论和框架,以及相应的应用案例等。
阿里巴巴达摩院语音实验室张仕良博士
张仕良博士作了题为《阿里端到端语音识别研究进展》的学术报告,介绍到近几年端到端语音识别成为学术界和工业界的研究热点。相比于传统的混合系统,端到端语音识别系统通过单个神经网络来联合优化语音识别系统的各个模块,不仅简化了系统的构建流程,也提升了最终的识别效果,同时解锁了小尺寸的设备端上识别。本次报告介绍了达摩院语音实验室在端到端语音识别研究进展,主要介绍基于SAN-M离线端到端语音识别和基于SCAMA的流式端到端语音识别。
最后,谢磊教授此次线上活动完满结束,表达了对演讲嘉宾、北京智源人工智能研究院以及工作组人员的衷心感谢。