返回首页
您的位置:首页 > 新闻 > CCF新闻 > CNCC

“面向新基建的计算机系统结构”技术论坛总结

阅读量:937 2020-11-04 收藏本文

CNCC“面向新基建的计算机系统结构”技术论坛10月22日在北京成功举行。邀请大学与科研机构的专家学者通过线下结合线上的方式探讨计算机系统结构面临的机遇与挑战。


本论坛由华中科技大学的华宇教授主持,邀请了来自清华大学、香港城市大学、上海交通大学、香港大学、中山大学和阿里巴巴达摩院等机构的专家学者线上线下共同研讨以云计算、大数据和人工智能等技术为代表的新型基础设施建设的未来发展趋势,以及对计算机系统结构提出的新挑战和面临的新机遇。


来自清华大学的李振华老师以“移动模拟器的创新设计与工业应用”为题,详细介绍了移动模拟器在移动操作系统(Android和iOS)的研发、测试、调试、自动化部署、跨平台执行等方面起到的基础性支撑作用。特别是在过去的20年里,移动模拟器的核心架构经历了从动态二进制翻译(QEMU)、全虚拟化(VirtualBox)、类半虚拟化(Xen)、硬件辅助虚拟化(Intel-VT)到操作系统虚拟化(Windows上的Linux子系统)的代际变迁。每一次核心架构的升级,都进一步缩小了移动模拟器和宿主机之间的性能差距。相关技术通过团队的密切合作,研发出匹配各种需求的移动模拟器产品,报告交流分享了一系列实用模拟器产品中的创新设计和运维经验。



香港城市大学的薛春老师介绍了基于近数据计算对大数据应用的优化技术,着重指出随着云计算、5G、物联网等技术产业的快速发展,传统计算机架构的计算能力已经难以满足大数据的增长需求。近数据计算技术的出现突破了大数据的技术瓶颈,将新型介质和硬件加速模块融合到计算机系统中已经成为一个必然的趋势,可以在靠近数据存储位置加入硬件加速模块,帮助CPU加速处理部分计算单元。报告从数据库读和写两方面来介绍硬件加速对系统性能的提升。特别是利用FPGA的高效并行模块加速过滤大量冗余数据,以及利用FPGA加速对写性能有高要求的键值存储数据库的管理。同时也可以用新型的NVM内存代替传统的DRAM以加速神经网络训练,分析了在基于NVM的CNN训练过程中训练精度和性能之间的平衡问题。 



上海交通大学的陈榕老师详细介绍了以远程直接内存访问(RDMA)为代表的高性能硬件特性在数据中心计算场景中的特点和重要科学问题,特别是在以RDMA为核心的新型硬件体系中构建高效分布式内存计算系统栈方面的一系列工作,以及围绕如何利用RDMA和其他新型硬件特性支持在大规模图数据上的低时延、高并发操作等具体系统实现机制。 


清华大学的陆游游老师分析了过去十年在闪存存储重构与系统设计方面的研究和探索,特别是在软件直管闪存新架构及存储系统软件新设计方面。通过介绍基于Open-Channel SSD的软件直管闪存结构,从文件系统存储管理、命名空间管理及并发感知的数据布局等多个方面介绍闪存文件系统的研究进展。同时,也和大家讨论了分布式闪存存储系统的设计,以及基于闪存的存储系统设计中的机遇与难点。 



香港大学的崔鹤鸣老师介绍了数据中心的高速分布式容错与区块链系统。数据中心网络层的硬件与软件技术正越来越受到重视,相关技术包括远程直接数据读写和软件定义网络等。面向数据中心的数据包分发与同步操作的性能提升,为高速分布式容错与协商系统的研发提供了坚实的基础,特别是在高速分布式容错系统中优势尤其明显。报告以基于远程直接数据读写硬件的高速虚拟机容错系统Plover和基于软件定义网络的低延迟、高吞吐量的区块链并行工作流BIDL为例,详细介绍了相关先进技术和性能优势。


中山大学的张献伟老师介绍面向下一代计算需求的GPU优化技术。报告内容强调随着高性能和智能计算的飞速发展,以GPU为代表的加速设备已成为算力核心。而未来E级超算和以数据中心及AI为代表的新基建将对算力设施提出更高需求。新算力时代,GPU面临并行、能耗和易用性等多方面挑战,需要在硬件和软件层面作出一系列提升。报告介绍了在模拟平台(simulation)、硬件设计(design)和程序分析(profiling)等方面的研究工作,相关技术能够显著提升系统效能。


阿里巴巴达摩院的孙园园博士介绍了热点感知的内存键值存储技术。内存中键值存储广泛用于缓存热数据,以解决基于磁盘的存储或分布式系统中的热点数据问题。由于现有内存键值存储难以有效管理热点数据,这使得相关系统性能受限并在特点负载下的工作效率不高。报告介绍了一种内存中索引结构的热点感知设计方法,提出了新型热点感知键值存储HotRing技术。同时针对大规模并发访问进行了优化。HotRing基于有序环哈希索引结构,该结构通过将头部指针移近热数据,从而实现快速访问。通过采用无锁结构可以采用多核架构支持大量并发操作。



论坛注重讨论了存储系统技术和器件架构、分布式系统和近数据计算技术、持久内存可靠性和安全一致性等重要科学问题,致力于促进以智能、协同、融合为标志的新型基础设施建设体系的研究和发展,提供基于通用平台的支撑服务,形成安全可控的计算机体系架构,加快数字产业化进程,推进算法、算力和数据之间的协同发展,促进我国学术界与工业界在新基建的计算机系统结构方面的研究与发展。