分论坛 > 青岛 > 新闻动态
CCF YOCSEF青岛举办“推荐系统遇到大模型:探讨大模型狂飙时代的推荐系统变革与趋势”技术论坛
2024-10-25 阅读量:12 小字

推荐系统作为过去十年中 AI 落地最成功的案例,也是互联网科技中最核心的技术手段,已广泛应用于电商、短视频、音乐、生活服务等各类互联网产品中。自ChatGPT 发布以来,大模型相关技术呈井喷之势,其带来的技术革新和交互范式革新引起了全球的关注。推荐系统也正在经历着一场革命性的变革,在大模型的加持下正在进行新一轮的升级改造,如淘宝问问、“小地瓜”、言犀、Llama 3等。然而,看到大模型与推荐系统结合潜力的同时,也要真正发现其中的挑战和局限性,才能在百舸争流中抓住先机,掌握竞争和发展的主动权。本次论坛邀请到了推荐系统和大模型方面的专家学者,从专业技术的角度探讨大模型与推荐系统结合的潜力、挑战以及对现有研究范式的影响,为推荐系统的发展提供有益的参考和启发。

本次论坛由YOCSEF青岛副主席刘金环(青岛科技大学)与YOCSEF青岛23-24主席于彦伟(中国海洋大学)担任执行主席,CCF YOCSEF青岛委员孙丽敏(青岛科技大学)和李永庆(青岛科技大学)担任线上主席,由CCF YOCSEF青岛学术委员会组织,并受到青岛科技大学信息科学技术学院和中国海洋大学信息科学与工程学部的大力支持。论坛邀请到了中国石油大学(华东)计算机科学与技术学院教授齐连永、南京航空航天大学计算机科学与技术学院教授李丕绩和香港大学计算机科学系的助理教授黄超担任引导发言嘉宾,并邀请到了中国海洋大学教授彭冲、中国海洋大学助理教授刘皓冰和南京航空航天大学助理教授臧天梓担任思辨嘉宾出席。CCF YOCSEF青岛22-23主席包永堂、现任主席晁国清以及来自来自哈尔滨工业大学(威海)、山东科技大学、浪潮、亚马逊AWS、青岛国实、长烽数智科技、安瑞信息科技和并行科技等高校、企业和事业单位的近60位专家和师生参与了本次论坛。

在论坛的引导发言阶段,齐连永以“智能推荐系统:动态模型、隐私挑战与未来方向”为题,介绍了推荐系统在动态环境中面临的挑战,特别是在隐私保护、多样性和兼容性等方面。重点讨论了如何在保护用户隐私的同时,通过机器学习技术提高推荐系统的鲁棒性和准确性。提出了局部敏感哈希算法和联邦推荐技术来解决隐私问题,同时采用内容树和DPP采样方法来增强推荐的多样性。此外,还探讨了推荐系统中的兼容性问题,并通过数据驱动的方法和最小群Steiner树问题来评估和改进推荐项的兼容性。这些策略有助于构建更可信、更准确的推荐模型,满足用户的个性化需求。

李丕绩以“大模型交叉应用研究”为题,分享了团队在大模型基础研究方面的工作,而后重点分享大模型与脑认知交叉研究中的初步探索和成果。提出KnowEE框架,从大型语言模型中探索多源多类型知识,并以粗细粒度的方式利用这些知识来生成对话。针对大语言模型在知识更新时难以平衡局部性与泛化性的问题,提出了一种基于专家混合架构(MoE)和知识锚点路由策略的模型编辑方法。而后介绍了基于大模型的脑语义编码分析以及语义联想现象的探究,最后提出了细粒度信息增强与预测编码的脑解码技术,并经过试验和分析验证了所提方法的有效性。

黄超以“基于大模型的图学习研究与探索”为题,探讨了图数据结构在现实生活中的应用及其与大型语言模型(LLMs)的结合潜力。图模型能有效表达实体间的复杂联系,而LLMs在处理图数据方面展现出巨大潜力。研究重点在于开发专门处理图数据的LLMs,通过设计能编码和推理图结构的模型,把握节点和边的复杂关系。报告也介绍了多种结合LLMs和图模型的方法,包括LLMs作为增强器、嵌入器和预测器的角色。提出了GraphGPT和HiGPT模型,强调了图结构理解的重要性,并探讨了如何通过图功能模型增强LLMs。最后,介绍了LightRAG通过图模型来增强LLMs的方法,旨在提升模型在处理关系型数据时的性能和可解释性。

引导发言阶段结束后,论坛进入思辨环节。会场的嘉宾围绕3个议题展开了思辨研讨。

议题1:大模型与推荐系统的结合是大材小用还是大有可为?

大部分嘉宾认为大模型与推荐系统的结合是非常有优势的,可以增强推荐系统的功能:(1)从动机角度,大模型与推荐系统的结合提升一点性能就能有效刺激和提升销售规模和网商生态,促进零售端、制造业以及社会经济的发展;(2)从数据集角度,推荐系统受数据集限制(如司法系统需要专业数据服务于工作),而大模型数据生成能力强,可助力推荐系统的数据集的构建;(3)从推荐多样性角度,常规的推荐系统局限于类别多样性,而大模型大模型推荐内容更丰富,可助力推荐的多样性。(4)从用户的角度,大模型有很强的表征能力,能同时对多模态大量的数据进行处理,具有很强的表征能力,例如让用户在首次购买和搜索的过程中就能掌握红茶的特点,这是大模型与推荐系统结合的优势。(5)从应用场景角度,教育系统基于对话的场景,非常适合用大模型的推荐系统,还有零售行业使用推荐系统过程中涉及用户的隐私等问题,大模型更适合。

有少部分嘉宾认为目前的科研形势促使大家追求热点使用大模型,而对于一些普通高校和企业在数据、资金和算力等方面发展空间有限,且在很多实际具体应用时,不使用大模型也能满足要求,应该根据具体场景选择是否应用大模型。

总之,大模型也越来越小,可以大材小用,也可以小材小用,每个人都可以用大模型实现自己的奇思妙想。虽然双非高校目前研究该领域相对困难,但是这个方向发展潜力巨大,应用场景广阔,在大部分领域还是大有可为的。

议题2:大模型是否会颠覆现有推荐系统的研究范式?

大模型是目前研究热点,从性能上可帮助用户获取更多有价值的信息,提供多方面的辅助。大模型也是建立在巨大的知识之上的,具有一定的推理能力,有望打破现有的推荐系统通过拟合用户在场景内的行为进行各种预测的现状。推荐问题的本质是研究用户和项目如何关联的比较准,目前的推荐系统应用效果确实很好,但在工业界更加注重用户的体验,所以目前还是常规的推荐模型,大模型的应用比较有限。现在推荐系统的架构仍旧不会立刻颠覆,大模型的出现只是增加了推荐系统的一种范式(如Agents应用于推荐系统),但是确实存在颠覆的趋势。已有的推荐重ID,如果用文本表示实现泛化,在冷启动方面可能会颠覆。在搜索方面,大模型Bert的出现颠覆了之前的搜索范式。未来,大模型越来越完善,推荐系统可能只需制定规则范式,调用大模型实现即可,大模型的使用可以变通,颠覆会是一个长期的过程。

议题3:大模型加持下推荐系统的“能力边界”在哪里?仍需解决的挑战是什么?

推荐系统的“能力边界”包括:(1)数据本身存在的稀疏性;(2)冷启动问题;(3)为了追求推荐准确性,不可避免涉及到的用户隐私泄露和安全,以及用了大模型之后,使用脱敏数据生成的数据是否包含隐私,带来的隐私问题该如何界定问题;(4)信息茧房效应;(5)算法的可解释性;(6)推荐的多样性等。推荐系统与大模型结合后,可解决数据稀疏性、冷启动、可解释性、推荐的多样性等问题。仍需解决的挑战包括:数据的问题、隐私和安全问题(隐私泄露、潜在偏见、内容监管)、信息茧房效应(舆论引导、审美趋势、思想控制)、系统的实时性(学习&更新、成本vs收益)等。

在思辨环节之后,YOCSEF青岛22-23主席包永堂做论坛总结,感谢邀请嘉宾的精彩报告和观点分享,感谢所有参加的观众和组织人员。历时近四个小时,本次论坛在热烈的会场氛围中圆满结束。欢迎大家继续关注CCF YOCSEF青岛的微信公众号,关注我们的后续活动。





CCF聚焦