返回首页
您的位置:首页 > 新闻 > CCF新闻 > CNCC

CNCC2024 | “大模型如何使能软件工程”专题论坛在横店举办

阅读量:39 2024-11-08 收藏本文

2024年10月26日,2024年度中国计算机大会(CNCC2024)——“大模型如何使能软件工程”专题论坛在浙江省东阳市横店圆满举办。


随着大模型技术的迅猛发展,软件工程领域正迎来前所未有的变革。通过融合大模型技术,软件开发人员能够在设计、开发和运维过程中实现更高程度的自动化与智能化,从而显著提升软件开发效率和确保代码质量。理解并掌握大模型使能软件工程,对于促进技术进步、产业升级、产品开源及应对未来挑战至关重要。本次论坛分为嘉宾分享和Panel两个环节,聚焦于大模型使能软件工程的前沿技术、应用案例、方法实践和关键挑战,力图重新定义软件工程的发展方向与实践路径,吸引了来自高校和企业的学者与专家进行成果交流与问题讨论。


本次论坛由CCF会士、监事长、北京大学金芝教授担任主席,哈尔滨工业大学(深圳)高翠芸副教授担任共同主席。论坛伊始,金芝教授首先对各位嘉宾的到场表示热烈欢迎。紧接着,她详细阐述了智能化软件工程近年来的发展状况,同时分析了现有工具的优势与不足,引出本次论坛的主题——利用大模型使能软件工程。她提出,下一代软件工程将以大模型为基,形成人机物融合的体系结构,但目前依然存在众多挑战亟待解决,引发嘉宾和观众的广泛思考。


图片

金芝教授作开场报告


第一位分享嘉宾南京大学的马晓星教授,带来《神经符号系统——非确定性管理的视角》的主题分享,主要围绕“神经符号系统”的构建与非确定性的挑战展开。神经符号系统是融合神经网络和符号推理的混合系统,旨在模仿人类的快速直觉推理和精确逻辑推理。他谈到,神经网络部件引入了不可避免的非确定性,使得传统软件工程中的模块化组合方法难以适用,因而需要新的方法保障质量。针对神经符号系统的端到端构建,他提出了“符号接地”问题,即如何从直观的神经网络输出生成符号概念。现有的双层优化方法常面临收敛性问题,他提出交替梯度下降法,以增强不同模块间的交互,有效处理符号约束的连续化。最后,他介绍了如何利用不可信的神经网络生成可信的符号内容,包括数学命题的自动形式化和复杂不等式的自动证明。


图片

马晓星教授作报告

图片

金芝教授为嘉宾颁发证书


第二位分享嘉宾是来自北京理工大学的刘辉教授,他分享的主题是《大模型时代软件工程研究的新范式》。首先,刘辉教授回顾了传统软件工程的两种研究范式,即发现新问题或挖掘老问题的新解法,通过设计新方法来解决问题。然而,随着大模型技术的迅速发展,传统算法的作用逐渐被大模型替代,这对软件工程带来了新的挑战和机遇。他通过分析2024年发表在软件工程顶会ICSE的13篇论文指出,大模型在代码生成、缺陷定位、代码重构等方面展现了强大的潜力,并通过“提示词工程”、知识图谱等技术为软件工程问题提供创新解决方案。接着,他进一步分析了基于大模型的新研究范式,包括分步处理、反馈迭代和知识增强等方法,但同时也指出,这种范式依赖于大模型的性能,可能导致研究结果的可持续性受到影响。他认为,应避免简单地将大模型作为工具,而是深入挖掘其在复杂问题解决中的潜力,使研究具有长远价值。


图片

刘辉教授作报告

图片

金芝教授为嘉宾颁发证书


第三位分享嘉宾是来自阿里通义实验室的李永彬博士,他分享的主题是《软件工程智能化的应用进展和前沿探索》。他结合阿里巴巴通义实验室推出的“通义灵码”智能编码助手和“通义星尘”数字人系统,分享了在代码生成、代码补全及开发者辅助等方面的技术应用。针对代码补全任务,他认为应该以开发者需求为中心,在给定上下文的情况下,不仅要生成正确的代码,更要精准猜中程序员的心中所想。他介绍了一个自动构建评测数据的Agent系统Codev-Bench,使用户可以自定义自己的评测集合,有效防止数据泄露。随后,他介绍了Lingma-SWEGPT软件工程大模型,该模型在在SWE-bench Lite 和 Verified上取得开源模型最好效果。讲者还提到“云工开物”计划,为高校提供免费或优惠的云资源支持,助力产教融合和科学研究,推动AI技术的普及与应用。


图片

李永彬博士作报告

图片

金芝教授为嘉宾颁发证书


第四位分享嘉宾是来自浙江大学的胡星副教授,她的分享主题是《大模型驱动的代码智能:生成、测试与评估》。首先,她指出大模型(如ChatGPT)在代码生成和代码解释方面显著提升了开发效率,且通过自然语言与代码的交互实现了智能化辅助开发。在测试生成方面,她提到了TestPilot系统,可自动生成单元测试,减少了手动编写的工作量,并探索了将相似项目间的测试用例进行迁移,以提升代码质量。接着,她还提出了评估代码推理能力的方法,强调了在运行时信息的基础上评估模型的执行路径预测等推理任务,并展示了思维链(CoT)在增强推理准确性上的效果。最后,她总结了大模型在代码生成和测试生成中的实际成效,并指出未来的发展将进一步优化模型在复杂开发任务中的应用。


图片

胡星副教授作报告

图片

金芝教授为嘉宾颁发证书


第五位分享嘉宾是来自华东师范大学的陈小红副教授,她分享的主题是《驾驭大语言模型:需求工程的机遇挖掘与挑战应对》。她探讨了大模型在需求工程中的应用机遇与挑战,需求工程是软件工程中至关重要且复杂的任务,传统方法因耗时费力且易受人为误差影响而面临局限。大模型的引入为需求获取、分析、验证等任务带来了新机遇。例如,利用大模型的自然语言处理能力,可以辅助需求抽取、生成需求规格说明,并支持需求文档的自动化生成与优化。然而,大语言模型的应用也面临挑战,包括生成内容的“幻觉”问题、上下文理解的局限性及隐私安全问题。她强调,为实现智能化需求工程,需依赖人机协作,将领域知识和专业知识嵌入大模型,同时增强模型的输出评估机制。她总结道,未来的需求工程将朝着智能化与人机协作的方向发展,需持续提升大模型的性能和可靠性,并加强伦理与责任意识。


图片

陈小红副教授作报告

图片

金芝教授为嘉宾颁发证书


在五位嘉宾的精彩分享后,论坛进入第二阶段——Panel环节,由高翠芸副教授主持,邀请论坛主席金芝教授,五位分享嘉宾和华为夏鑫博士等共同参与讨论。讨论议题集中在“大模型在软件工程中的角色定位”,“大模型的伦理和社会影响”和“大模型在软件开发中的前景”等三个方面。各位嘉宾结合自己的研究工作,提出了自己的看法,引发现场嘉宾和观众的思考和讨论,现场反响热烈。


图片
图片
图片

Panel环节


会后,金芝教授邀请全体参会嘉宾合影留念。


图片

全体嘉宾合影留念