CCF C³-03@搜狗丨深度语义学习和脑机接口将如何影响搜索的发展?
4月16日晚,30位企业技术高管齐聚搜狗,共同探讨深度语义学习和脑机接口将如何影响搜索的发展。讲者报告后的75分钟,与会者以技术话题为核心,充分展开交流。
CCF C³活动是CCF CTO Club发起的,面向企业技术专家的热门技术和战略分享会,第一站在京东分享了关于智能客服的相关技术,第二站在小米分享了智能家居的发展趋势,第三站来到搜狗讲述深度语义学习在搜索的应用。
近年来深度学习使得语义理解取得不少突破,信息检索从基于关键词搜索逐渐走向语义搜索。然而在真实的网络搜索引擎中,面对海量规模的互联网数据和纷繁复杂的用户意图,仍然面临不少挑战。
作为国内第二大搜索引擎,搜狗搜索在搜索技术以及语言AI的创新和发展上均有着深厚的积累。近年来,搜狗一直致力于解决深度语义学习应用于大规模网络搜索中的问题,力求通过深度语义检索、深度匹配排序、深度问答能力增强,实现网络搜索用户体验升级。
CCF副秘书长、亿邦动力CEO王超主持了全程活动,CCF副理事长、创新工场首席科学家周明代表CCF致辞,并为CCF企工委副主任、CCF CTO Club主席、搜狗CEO王小川颁发了CCF C³活动承办单位感谢牌。
王超主持会议
周明致辞
周明为王小川颁发承办单位感谢牌
王小川作报告
在本次分享会现场,王小川以题为“深度语义学习在网络搜索的应用研究与实现”的报告,对现阶段深度语义学习在网络搜索的核心过程“索引检索-候选排序-结果展现”中所面临的技术和工程挑战,给出了系统性的解决方法。这些方法已经在搜狗搜索中完整实现并上线,大大提升了搜索品质。
其中,融合稀疏检索内容匹配和稠密向量检索语义匹配的检索模型,通过系统设计引入倒排检索系统中的内容匹配特征,使得稠密向量检索的意图漂移大大缓解,候选结果的优质召回率提升幅度增长了7.0%,语义检索带来的收益显著。
而针对当前深度排序模型只利用文本内容语义匹配而丢失结构信息的问题,王小川在报告中提出了融合页面关键词、站点语义表示、查询和网页标题词项重要度、紧密度、精确和同义词匹配信号的深度语义匹配模型,有效提升了深度语义匹配模型排序能力。
此外,对于基于机器阅读理解的问答式搜索所面临的一般较长、形式不定、答案位置可能非连续等非事实型问题的机器阅读理解的挑战,王小川也在现场展示了搜狗搜索在实际的应用中的相关研究以及取得的突破。
随后,清华大学计算机系党委书记刘奕群教授就脑机接口技术对搜索过程可能带来的机遇与挑战在现场进行了分享。
刘奕群作报告
限于当前人机交互方式的限制,搜索引擎对于信息需求产生的上下文环境缺乏深度感知,造成了搜索性能进一步提升的显著瓶颈。近年来,脑机接口技术研究取得的进步使得人机交互模式有望产生根本性的变革。而在脑机接口技术尚无法大量普及的现状下,刘奕群教授重点讨论了当前的信息技术研究如何为未来的脑机接口搜索开展前瞻性的准备工作,以及目前脑机技术的取得的一些成果。
刘奕群认为,无法良好的理解用户想要表达的信息,收集用户反馈时存在歧义,难以判断用户搜索时完整的上下文语义环境是当前搜索需要解决的难题。通过脑机,拥有用户的情感,感知用户的情绪,便可以建立良好的心智模型,提供用户在搜索关键词之外更加精准的用户信息需求描述,更好的提升搜索的体验。
报告结束后举办了承办单位旗帜交接仪式,揭晓了下一次活动承办单位是百度,具体时间是5月14日晚上6:30-9:30。
承办单位旗帜交接
自由交流环节
在Q&A环节,与会者提问踊跃,两位讲者作了充分解答,最后自由交流环节更是持续75分钟,活动在9:30以合影结束。
合影
关于CCF C³活动:
C³活动旨在联结企业CTO及高级技术人才和资深学者,每次以一个技术话题为核心,走进一家技术领先企业。线下为主,线上为辅。线下参会人员必须是公司CTO或者技术负责人,CTO Club成员优先,CCF企业会员的技术负责人优先,CCF会员优先。如需加入CTO Club,请扫描下方二维码,下载填写申请表后邮件至cto@ccf.org.cn。
CCF C³-03@搜狗,活动特邀名单:
特邀人员:
周明 | CCF副理事长,创新工场首席科学家 |
王超 | CCF副秘书长,亿邦动力CEO |
王小川 | CCF CTO Club主席,搜狗CEO,本期报告嘉宾 |
刘奕群 | 清华大学计算机系党委书记,本期报告嘉宾 |
陈刚 | 北京学而思教育科技有限公司研发专家 |
陈欢 | 滴滴出行高级专家算法工程师 |
程智聪 | 百度杰出研发架构师 |
高翔 | 新浪资深算法专家 |
贺海波 | 网易技术副总经理 |
胡辰 | 中科曙光研发工程师 |
胡娟 | 滴滴出行算法工程师 |
姜大昕 | CCF CTO Club创始成员,微软亚洲互联网工程院首席科学家 |
李长亮 | CCF CTO Club成员,金山软件集团副总裁兼人工智能研究院院长 |
林锋 | 北京学而思教育科技有限公司学而思编程技术负责人 |
刘珊瑞 | 自如信息科技有限公司AI算法总监 |
罗磊 | 北京爱数智慧科技有限公司ASR技术负责人 |
马维英 | CCF企工委执委,清华大学智能产业研究院教授 |
王华明 | CCF CTO Club成员,中星微电子总工程师 |
肖熠 | 中科曙光博士后 |
叶晓虎 | 绿盟科技集团CTO |
张鹏 | 新浪技术经理 |
张宇宙 | 自如信息科技有限公司首席科学家 |
赵锴 | CCF CTO Club成员,北京悦享数字科技有限公司总经理 |
郑政 | 达内时代科技集团有限公司高级技术总监 |
金磊 | 量子位副主编 |
韩梦晨 | 量子位编辑 |
拟承办单位及观摩人员:
刘芸 | 百度飞桨技术运营经理 |
李跃华 | 联想研究院高级经理 |
刘布楼 | 清华大学博士生 |
关于搜狗:
搜狗成立于2003年,于 2017年在纽交所上市。
目前搜狗月活跃用户数仅次于BAT,是中国用户规模第四大互联网公司。
2004年,搜狗推出搜狗搜索,现已成为中国第二大搜索引擎。
2006年,推出搜狗输入法,重新定义了中文输入,目前搜狗手机输入法日活用户数达4.8亿,是国内第一大中文输入法。
2018年,搜狗正式发布了AI硬件,这是搜狗AI战略首次落地硬件产品。此后,搜狗还向行业推出了搜狗AI开放平台,并与多家硬件厂商成立了AI创新联盟。
作为中国领先的人工智能企业,搜狗通过以语言为核心的人工智能技术,在“自然交互+知识计算”的战略引领下,在语音、图像、对话、问答、翻译等领域取得诸多突破性进展。搜狗创新性提出的分身理念,让机器突破性首次做到逼真模拟人类专业行为,在媒体、金融、医疗等行业引起巨大关注。
在全球经济增速放缓,宏观经济形势持续面临挑战的背景下,搜狗凭借在搜索、输入法、智能硬件、AI领域的完善与创新,整体业务健康稳步发展。