在横店,齐聚800余位计算机行业讲者实属不易,CNCC2024思想火花持续迸发
10月25日,CNCC2024精彩继续。
10月25日,CNCC2024第二日上午,CCF常务理事、CNCC2024论坛委员会主席(学术界)、中国人民大学文继荣教授主持。邬江兴院士、林惠民院士、周伯文教授、刘湘雯女士、刘伟华先生、王桂荣先生带来特邀报告。唐杰教授、王小川博士、谢幸博士、马毅教授热议大模型能否通往AGI?
大会特邀报告
CCF常务理事、CNCC2024论坛委员会主席(学术界)、中国人民大学教授
“
特邀报告1:邬江兴院士《高效能先进计算新路径》
”
邬江兴教授,中国工程院院士,中国国家数学交换系统工程技术研究中心主任,复旦大学大数据研究院院长。
邬江兴教授在报告中提出了生成式结构计算的概念,以应对当前计算技术新浪潮对算力的极度高涨需求,并实现可持续发展。他指出了先进计算发展的困局,主要矛盾是计算架构的单调性与算力需求的多样性之间的矛盾。为了解决这一矛盾,邬教授提出了“双重不可能三角”理论,即资源复用性、服务有效性、业务多样性之间的不可能三角,以及效能、性能、灵活性之间的不可能三角。
邬教授认为,要破解这些困境,必须寻找先进计算的新路径。他提出了智能绿色可信三角(IGS)作为先进计算的发展愿景,即智能的计算、绿色的计算、可进的计算。他强调必要多样性是破解多样化算力需求下计算系统结构性适配的根本路径。
邬教授还提出了软件定义节点和软件定义互联的概念,以发展到生成式互联结构,从而使计算从刚性计算发展到生成式结构计算。他以人脑神经网络为例,说明了生成式互联结构的优越性,并提出了晶圆级超高阶层集成封装和布线密度作为生成式结构计算的理想物理载体。
最后,邬教授提出了高阶生成式结构计算工程技术路线,有望实现体积、性能、效能的显著提升,并在数字领域及产业中迎来晶圆级集成和封装的新时代。他鼓励在独创、独有上下功夫,以开辟晶上生成式计算结构的新赛道。
邬江兴院士
“
特邀报告2:林惠民院士《计算 智能 安全》
”
林惠民院士,CCF会士,中国科学院院士,中国科学院软件研究所研究员。
林惠民院士在报告中探讨了计算的本质、计算机的历史和局限性,以及人工智能的发展和挑战。他指出,计算通常被认为是人类特有的智能活动,但对计算的确切定义仍有争议。他回顾了数学史上关于计算基础的重要讨论,包括罗素悖论、希尔伯特的数学基础问题、哥德尔不完备性定理和图灵机的提出。
林院士强调,尽管计算机在执行特定任务方面超越了人类,但它们缺乏创新性和创造性智能,因此不能自主增加功能。他提到,计算机的发展依赖于人类编写的软件,而软件设计需要人类的创造性智能。
在讨论人工智能时,林院士指出,尽管人工智能在某些领域取得了显著进展,如大语言模型,但这些模型仍然缺乏对外部世界的理解和批判性思维能力。他强调,大语言模型的成功依赖于大量的文字材料,但这些模型并不知道它们生成的语句是否正确,因为它们缺乏与外部世界的联系。
林院士还讨论了大语言模型的局限性,包括它们在创新性方面的不足,以及它们对训练数据集的依赖。他警告说,基于统计的推断可能导致不可控的近似误差,这在某些应用中可能是危险的。
最后,林院士强调了计算机作为工具的角色,以及人类在创新过程中的主导地位。他呼吁计算机学会的成员继续努力解决未解决的问题,并发挥创造力进行原创性研究。他总结说,尽管机器学习取得了巨大成功,但仍有许多挑战需要人类的智慧来克服。
林惠民院士
“
特邀报告3:周伯文教授《以通专融合方式构建AGI——路径与关键问题》
”
周伯文教授,上海人工智能实验室主任、首席科学家、清华大学惠妍讲席教授。
周伯文教授他对人工智能发展的深入思考。他指出,基于深度学习的高度监督算法属于狭义人工智能,而AGI的愿景虽然模糊,但确定会比人类更聪明且能独立学习。
周伯文提出,从狭义人工智能走向AGI需要经历广义人工智能(ABI)阶段,这要求具备自监督能力、端到端能力和从判别式人工智能向深层次助手的转变。他回顾了ChatGPT的出现,认为它实现了广义人工智能,但同时也指出了其在专业性和创新性上的不足。
他进一步阐述了自己对AGI路径的看法,认为AGI的发展需要通专融合,即结合专业性和泛化性。他提出了一个二维路线图,横轴表示专业性,纵轴表示泛化性,认为AGI的高价值区域应该具备超过90%以上的专业人士水平,并能低成本在不同任务间迁移。
周伯文还介绍了上海人工智能实验室开源的书生系列大模型,并强调了基础模型层、系统融合层和多智能体协同的重要性。他展示了书生大语言模型在多领域应用的潜力,并提出了人在环路的大模型多智能体协同新范式,以促进科学研究。
周伯文教授
“
特邀报告4:刘湘雯女士《AI时代的云计算技术体系演进》
”
刘湘雯女士,CCF常务理事,阿里云副总裁。
刘湘雯在报告中强调了云计算在数字经济中的重要作用。她指出,云计算是数字经济的重要基础设施,已成为社会算力供给的主流形式,并为企业数字化转型和社会创新发展提供了重要支持。
随着AI技术的爆发,云计算在提供AI能力方面将发挥更加重要的作用。刘湘雯提到,AI对云计算基础设施提出了新的要求,包括更大规模的计算资源、更高性能的网络和存储,以及智能管理和调度能力。同时,AI作为一种生产力工具,也推动了云平台的发展,优化了成本效益,实现了自动化工作流、智能监控和预测分析等。
她预测,随着AI时代的到来,云计算将进化为AI原生云,具备全球性、全栈性和开放性三个特点。刘湘雯详细介绍了阿里云在全球部署、全栈服务和开放生态方面的进展,包括支持巴黎奥运会的云计算和AI应用,以及为企业在全球范围内提供研发效率和抗风险能力的支持。
在全栈方面,刘湘雯提到了阿里云在计算层、数据层、模型层和应用层的技术创新,包括GPU算力、网络优化、存储解决方案、多模态数据处理、大模型训练性能优化等。
刘湘雯女士
“
特邀报告5:刘华伟《展望2030·共筑计算新时代》
”
刘华伟,华为计算产品线研发副总裁、计算技术规划部部长。
刘华伟在报告中识别了八大重要场景,包括更聪明的AI、更普惠的AI、人工智能与感知融合、深层次感知、超越现实体验、高性能计算、数据驱动业务和低碳运营。他预测到2030年,通用算力将增长10倍,AI算力将增长4000倍,数据量将增长23倍。
刘华伟强调了六大技术特征:智能认知、内生安全、绿色集约、多样性计算、多维协同和物理层突破。他详细讨论了17个具体的技术方向,包括生成式AI、数据工程、具身智能、类脑智能、知识计算、数字信任与隐私、AI安全可信、新计算范式安全、芯片工程、DC as a computer、算力网络、数据为中心计算、应用驱动的多样性计算、端边云协同、数字孪生、模拟计算、非硅基计算和新兴存储介质。
他提到,华为已经发布了鲲鹏昇腾相关的产品和技术,并推出了原生创新计划,旨在三年内赋能100万原生人才,支持1000家原生创新和1000家方向引领。华为还计划每年投入10亿元用于激励,并开放鲲鹏昇腾原生创新汇,提供设施便利,计划在三年内免费赠送10万片算力,以赋能产业数智创新。
刘华伟先生
“
特邀报告6:王桂荣《中国电信新一代数字基础设施的实践与探索》
”
王桂荣先生,中国电信集团有限公司科学技术委员会副主任、科技创新部总经理。
王桂荣在演讲中介绍了中国电信在新一代基础设施实践中的探索和成果。他强调了中国电信作为传统电信运营商向科技型企业转型的努力,特别是在算力服务和人工智能领域的进展。
王桂荣提到,中国电信积极响应国家战略,致力于从网络运营商向算力服务提供商的转变。他指出,全球电信运营商的收入增长停滞,而中国电信的收入和利润增长远超全球平均水平,这得益于抓住了新型基础设施,尤其是云计算和人工智能的机会。在算力方面,中国电信建立了两个液冷的万卡资源池,解决了液冷技术的多个挑战。此外,中国电信还建立了弹性网络,实现了跨数据中心的算力联合训练,提高了训练效率。王桂荣还介绍了中国电信的息壤平台,该平台已接入了40多个算力资源,实现了算力的联合训练和推理。他还提到了中国电信在数据方面的工作,推动了数据流动和数据要素的发展。在安全方面,王桂荣特别提到了量子通信产业城域网的建设,这将成为数字新基建的重要核心能力。
王桂荣先生
大会论坛-《大模型能否通往AGI》
文继荣在主持论坛时提出了关于AGI(通用人工智能)的讨论,尽管这是一个有争议的话题,但鉴于近年来大模型的发展,这是一个值得计算机界讨论的重要话题。他提到了人工智能在诺贝尔物理学奖、化学奖中的横扫表现,以及AI热度的前所未有的高度。
本场大会论坛邀请到清华大学教授唐杰、百川智能创始人兼CEO王小川、微软亚洲研究院全球研究合伙人谢幸、香港大学教授、加州大学伯克利大学教授马毅四位嘉宾都是在大模型或人工智能领域具有代表性。
唐杰提到了原生多模态作为一个热门趋势,它涉及到将文本、语音等多种模态的数据融合在一起进行处理。他认为这是一个很有前景的方向,因为它模仿了人脑处理多种感官信息的方式,可能是实现通用人工智能(AGI)的一个途径。
尽管原生多模态是一个有希望的方向,但它也面临着挑战。唐杰提到了O1,这是一个有争议的话题。一方面,有人认为O1能够进行复杂的推理,解决了之前模型无法解决的问题;另一方面,也有人认为O1是否能够处理真正复杂的逻辑推理还是一个未知数。唐杰指出,生成视频和图像的研究目前还没有与大模型的主体研究紧密结合,这是一个需要解决的难题。未来的大模型可能需要具备语言理解、多模态处理、推理、使用工具甚至创新的能力、自我学习能力作为一个重要的研究方向,这可能涉及到如何让大模型自主学习和改进。
目前存在一些挑战和未知数,但这些领域都是值得深入研究的,并且可能对未来的人工智能发展产生重大影响。
马毅从科学的角度提出了对人工智能发展的深刻见解:他强调了技术发展与对人工智能深层次理解之间的区别,认为我们对智能的本质理解还不够深入。通过比喻DNA作为自然界的大模型,指出生命的早期进化类似于当前的机器学习过程,但这种方式非常原始且代价巨大。他提出真正的智能特征是自我学习的能力,即系统能够理解、判断并增加自己的知识。马毅认为下一代人工智能应该具备自主学习能力,而目前的大模型还远未达到这一水平。他建议我们应该客观地看待现有技术,不应过于狂热,而应更加科学和理性地认识技术的限制和潜力。马毅认为,尽管人工智能取得了显著的技术进步,智能的发展还有很长的路要走,未来的发展空间是巨大的,我们应该对此保持乐观。
王小川在讨论中提出了对中国在大模型技术发展现状的看法,以及对未来超级应用的展望:王小川明确指出中国在大模型技术方面与美国存在差距,这种差距不仅体现在算力上,还体现在创新精神和技术创新上。他认为美国的学术界和企业界在引领时代发展方面走在前面。他提到,中国的学者和企业面临的挑战是如何在已有的创新基础上进行再创新,这是一个前所未有的机会和挑战。他认为,并不是模型规模的增长就能带来超级应用的实现。他强调了对技术和应用方向的选择的重要性,认为中国应该在应用开发上更具前瞻性,以弥补模型技术上的不足。他特别提到了医疗健康作为超级应用的一个方向,认为医疗、教育和法律等领域是大模型的强项。AGI的定义不是科学问题,而是哲学问题,需要重新定义。他建议,可以不严谨地将AGI的能力等同于医生的能力,认为如果能够造出医生,就达到了AGI。在AGI实现之前,可以开发医生助理或辅助保健医生等应用,这些应用不仅符合技术发展趋势,而且为AGI时代提供了评判标准和引导。
谢幸在讨论中提出了对AGI(通用人工智能)定义的质疑,并强调了AI对社会的广泛影响,特别是医疗、教育、科研和创作等领域。谢幸认为,在没有明确定义的情况下讨论AGI可能是主观的,因此需要更好的定义来指导讨论。他提到AI的发展对教育、科研、社会等方面产生了深远的影响,这些影响需要被认真研究和管理,以确保它们对人类的长期益处。谢幸强调了与社会科学学者合作的重要性,以研究AI的社会问题,如就业、教育未来等,并借鉴社会科学的理论来评估AI。随着AI从任务导向转向通用导向,传统的评测方法变得过时。他提出,可以借鉴教育学和心理学中评估学生未来表现的方法来评测AI。谢幸讨论了AI价值观对齐的重要性,并提出需要探讨价值观本身的定义和发展,以及如何将社会科学中的价值观研究应用于AI。他指出,跨学科研究需要不同学科的研究思路、思维方式和人才培养的融合,这是一个需要共同开拓的领域。
谢幸认为AI的安全和社会影响需要跨学科的研究和合作,以确保AI的正面影响并解决可能出现的社会问题。
10月26日,CNCC还将有精彩内容呈现,一起期待!