面向新基建的计算机系统结构——揭示存算网的新融合
本论坛将于CNCC第一天(10月22日)在北京新世纪日航饭店三层重庆厅举行,共邀清华大学、香港城市大学、上海交通大学、香港大学、中山大学和阿里巴巴达摩院等机构的专家学者共同研讨。
以云计算、大数据和人工智能等技术为代表的新型基础设施建设的快速发展对计算机系统结构提出了新的挑战。本论坛将讨论面向新型基础设施建设的计算机体系结构相关的重要和关键问题,包括存储系统技术和器件架构、分布式系统和近数据计算技术、持久可靠和安全一致等年度热点问题和技术挑战,促进以智能、协同、融合为标志的新型基础设施建设体系的研究和发展,构建通用平台支撑服务,形成安全可控的计算机体系架构,加快数字产业化进程,推进算法、算力和数据之间的协同发展。此次论坛深入讨论这些问题,并达成共识,促进我国学术界与工业界在新基建的计算机系统结构方面的研究与发展。
扫码报名CNCC,参加百场技术论坛
论坛主席
华宇
华中科技大学教授,CCF杰出会员、ACM和IEEE高级会员,CCF和ACM的杰出演讲者。曾在加拿大麦吉尔大学,美国内布拉斯加大学林肯分校做博士后研究工作。研究方向是新型存储器件、云存储系统、非易失存储系统等。主持和参加国家重点研发计划、973、863重大、国家自然科学基金、教育部创新团队等项目,在OSDI、MICRO、FAST、USENIX ATC、SC、ACM ToS、IEEE TPDS/TCAD/TC等会议和期刊上发表150多篇学术论文,出版专著一部。在ACM APSys 2019和IEEE NAS 2019会议担任程序共同主席,OSDI、FAST、USENIX ATC、ASPLOS、ISCA、MICRO、HPCA、SC、EuroSys等学术会议上担任程序委员(PC或ERC)。研究成果获得2018年湖北省科技进步一等奖和2011年中国电子学会信息科学技术二等奖。
讲者简介
李振华
清华大学软件学院副教授、博导,主要研究移动云计算及新型网络协议。主持国家自然科学基金优青和面上项目、CCF-腾讯犀牛鸟基金科研和创新项目、北京信息科学与技术国家研究中心青年创新基金项目等。已发表论文90余篇、他引1600余次,四次登上国内外重要期刊封面《中国科学:信息科学》《中国计算机学会通讯》《IEEE云计算汇刊》《清华学报》,多项研究成果被百度、腾讯、小米等公司实际采用,受益用户过亿。曾获得2009年中国大学出版社图书奖一等奖、2015年中国人工智能学会优秀博士论文奖、2015年教育部自然科学一等奖、2016年CCF-腾讯犀牛鸟科研优秀奖、2017年ACM多媒体系统年会(MMSys)最佳学生论文奖、2019年清华学报高被引优秀论文奖、2019年ACM移动计算年会(MobiCom)最佳系统演示奖等。
演讲题目:移动模拟器的创新设计与工业应用
摘要:移动模拟器在移动操作系统(Android和iOS)及其应用的研发、测试、调试、自动化部署、跨平台执行方面具备基础性支撑作用。过去的20年里,伴随云计算和虚拟化技术的发展,移动模拟器的核心架构经历了从动态二进制翻译(QEMU)、全虚拟化(VirtualBox)、类半虚拟化(Xen)、硬件辅助虚拟化(Intel-VT)到操作系统虚拟化(Windows上的Linux子系统)的代际变迁。每一次核心架构的升级,都进一步缩小了移动模拟器和宿主机之间的性能差距,同时又可能损失兼容性和安全性,总的来说对于复杂多样的模拟需求“没有银弹”。从2017到2020,我们和腾讯公司多个团队密切合作,研发出匹配各种(极端)需求的移动模拟器产品,包括和腾讯安天实验室联合研发的基于动态二进制翻译的“物联网蜜罐云”,和腾讯应用市场联合研发的基于全虚拟化的“悬浮窗医生”和“API医生”,以及和腾讯游戏部门联合研发的基于操作系统虚拟化的“手游助手”。本次报告期待与大家交流分享这一系列实用模拟器产品中的创新设计和运维经验。
薛春
香港城市大学计算机科学系副教授,主持完成了包括香港政府科研计划及公司合作在内的20余个科研项目。在国际顶级学术会议和期刊上发表论文200余篇,包括存储以及系统领域顶级会议FAST,ATC,调度算法领域顶级会议RTSS,体系结构领域顶级期刊TC、TCAD,数据处理领域顶级期刊TKDE等。担任Transactions on Storage(TOS),Transactions on CPS等多个国际期刊的副主编,担任DAC,DATE等多个国际会议的审稿人。主要研究方向包括移动与嵌入式体系结构、非易失性存储架构、存储与大数据。
演讲题目:基于近数据计算对大数据应用的优化技术
摘要:随着云计算、5G、物联网等技术产业的快速发展,传统计算机架构的计算能力已经没有办法满足大数据的增长需求。近数据计算技术(Near Data Computing)的出现突破了大数据的瓶颈,将新型介质和硬件加速模块融合到计算机系统中已经成为一个必然的趋势。一方面,我们可以在靠近数据存储位置加入硬件加速模块,帮助CPU加速处理部分计算单元,本报告将从数据库读和写两方面来介绍硬件加速对系统性能的提升:(1)利用FPGA 加速以读操作为主的关系型数据库查询,如MySQL。利用FPGA的高效并行模块加速过滤大量冗余数据。(2)利用FPGA加速对写性能有高要求的键值存储数据库,如LevelDB。这类数据库中的垃圾回收问题(Compaction),会造成数据库的性能抖动,利用FPGA可以加速Compaction操作,来减少性能抖动带来的影响。另一方面,我们可以用新型的NVM内存代替传统的DRAM,本报告将以加速神经网络训练为例,分析在基于NVM的CNN训练过程中,训练精度和性能之间的平衡问题。
陈榕
副教授,并行与分布式系统实验室(IPADS),上海交通大学。主要研究方向为并行与分布式处理、内存计算和操作系统。在SOSP、OSDI、NSDI、EuroSys、Usenix ATC等本领域重要学术会议与期刊发表论文20余篇,获得EuroSys等三项最佳论文奖,受邀多次担任OSDI、ASPLOS、EuroSys、Usenix ATC, VEE等国际会议PC。
演讲题目:基于RDMA的高效分布式内存计算系统栈
摘要:以远程直接内存访问(RDMA)为代表的高性能硬件特性在数据中心计算场景中受到越来越多的关注。本次报告将与大家分享我们在基于以RDMA为核心的新型硬件体系构建高效分布式内存计算系统栈方面的一系列工作,将主要围绕如何利用RDMA和其他新型硬件特性支持在大规模图数据上的低时延、高并发操作(如,查询、分析和学习等)。
陆游游
清华大学计算机系副教授、博士生导师。主要研究方向是非易失性存储、文件系统及分布式存储等,在FAST、USENIX ATC、ASPLOS、EuroSys、SC、VLDB、DAC等国际顶级会议以及ACM ToS、IEEE TC、TPDS等国际顶级期刊上发表论文20余篇。以第一作者在存储领域最高水平会议FAST 2013和FAST 2014上连续发表论文,并获得IEEE NVMSA 2014大会最佳论文奖和MSST 2015最佳论文提名奖。曾获得中国计算机学会优秀博士学位论文奖、ACM中国操作系统分会新星奖、教育部技术发明一等奖(第2完成人),并入选首届中国科协青年人才托举工程。
演讲题目:闪存存储重构与系统设计
摘要:闪存带来了存储系统的颠覆性革新需求。由于磁盘作为外存的主要设备已经历70余年,现有的存储系统过多地针对磁盘特性进行设计与优化,难以发挥闪存的优势。本报告基于过去十年的探索,汇报软件直管闪存新架构及存储系统软件新设计。首先探讨面向闪存的存储系统在存储结构上的变革,介绍基于裸闪存设备(也被称为Open-Channel SSD)的软件直管闪存结构。接着从文件系统存储管理、命名空间管理及并发感知的数据布局等多个方面介绍闪存文件系统的研究进展。最后,介绍分布式闪存存储系统的设计,并总结基于闪存的存储系统设计中的机遇与难点。
崔鹤鸣
香港大学计算机系的助理教授(https://www.cs.hku.hk/people/academic-staff/heming),独立地指导着约15名博士生的分布式系统研究组。他的研究兴趣包括分布式系统,大数据平台,分布式人工智能训练与服务等,并专注于构建新型的软件体系结构和工具,来极高地提升这些领域的软件的可靠性与安全性。崔老师最近五年的论文发表在国际知名系统软件会议和期刊,包括SOSP ,NSDI,ATC,DSN,SOCC,ACSAC,SRDS,JSAC和TPDS。最近两年,崔老师受邀加入NSDI,ATC,DSN,EuroSys,SOCC和ICDCS等国际知名系统软件会议的编程委员会。作为项目主负责人,崔老师获得2016年香港求搓基金会前瞻科研大奖(500万港元科研奖金),获两项华为创新科研计划奖励(其中一项为旗舰项目),三项香港研究资助局基础科研基金的奖励。在加入港大工作前, 崔老师于清华大学计算机系获得本科与硕士学位, 并于纽约市哥伦比亚大学计算机系获得博士学位。
演讲题目:基于数据中心同步网络的若干高速分布式容错与区块链系统
摘要:数据中心网络层的一系列硬件与软件技术潮流,包括远程直接数据读写和软件定义网络等,极大促进了单数据中心或多数据中心互连网络的数据包分发的可靠性与同步性,这为高速分布式容错与协商系统的研发,提供了丰富的潜力。这些分布式容错与协商系统,不仅包括可容忍计算机单点失效的传统分布式容错系统,还包括可容忍拜占庭失效、可支持前沿区块链业务(例如去中心化的证券交易所和票据结算业务)的系统。本报告将介绍我在港大工作期间与我的博士生们研发的若干高速分布式容错系统,包括:(1)Plover,基于远程直接数据读写硬件的高速虚拟机容错系统;(2)BIDL,基于软件定义网络的低延迟、高吞吐量的区块链并行工作流。实验数据表明,Plover和BIDL的吞吐量,均比国际上相应的最高性能的软件系统(例如VSphere FT和Hyperledger Fabric)优数倍。
张献伟
中山大学数据科学与计算机学院副教授。2017年于美国匹兹堡大学获得博士学位,2017至2020年任职于AMD公司从事GPU软硬件研发。研究集中在计算机系统结构和高性能计算领域,包括处理器、存储和系统模拟等。研究成果有十余篇论文发表在HPCA、PACT等会议,并获得ISLPED’2013最佳论文奖。AMD工作期间,作为核心成员参与了PathForward和Frontier超算项目,完成多项专利申请和技术转让,荣获Spotlight杰出贡献奖。
演讲题目:面向下一代计算需求的GPU探索与优化
摘要:随着高性能和智能计算的飞速发展,以GPU为代表的加速设备已成为算力核心;而未来E级超算和以数据中心及AI为代表的“新基建”将对算力设施提出更迫切的需求。新算力时代,GPU面临并行、能耗和易用性等多方面挑战,因而需要在硬件和软件层面作出一系列提升。硬件方面,如何提升效能及快速可靠的探索验证潜在方案?软件上,如何更快捷准确的优化应用程序?围绕以上问题,本报告将探讨GPU计算前沿问题,介绍在模拟平台(simulation)、硬件设计(design)和程序分析(profiling)等方面的研究工作。
孙园园
阿里巴巴达摩院数据库与存储实验室Research Scientist。分别于2014年和2019年在华中科技大学获得学士和博士学位。主要研究领域为云存储系统、安全数据库等。在FAST、USENIX ATC、DAC、SoCC、MSST、TPDS等国际会议和期刊上发表多篇论文。在MSST’20等会议上担任程序委员,TPDS、TOS、JCN等多个期刊担任审稿人。
演讲题目:HotRing: A Hotspot-Aware In-Memory Key-Value Store
摘要: In-memory key-value stores (KVSes) are widely used to cache hot data, in order to solve the hotspot issue in disk-based storage or distributed systems. The hotspot issue inside in-memory KVSes is however being overlooked. Due to the recent trend that hotspot issue becomes more serious, the lack of hotspot-awareness in existing KVSes make them poorly performed and unreliable on highly skewed workloads. In this paper, we explore hotspot-aware designs for in-memory index structures in KVSes. We first analyze the potential benefits from ideal hotspot-aware indexes, and discuss challenges (i.e., hotspot shift and concurrent access issues) in effectively leveraging hotspot-awareness. Based on these insights, we propose a novel hotspot-aware KVS, named HotRing, that is optimized for massively concurrent accesses to a small portion of items. HotRing is based on an ordered-ring hash index structure, which provides fast access to hot items by moving head pointers closer to them. It also applies a lightweight strategy to detect hotspot shifts at run-time. HotRing comprehensively adopts lock-free structures in its design, for both common operations (i.e., read, update) and HotRing-specific operations (i.e., hotspot shift detection, head pointer movement and ordered-ring rehash), so that massively concurrent requests can better leverage multi-core architectures. The extensive experiments show that our approach is able to achieve 2.58× improvement compared to other in-memory KVSes on highly skewed workloads.
CCF推荐
【精品文章】
CCF颁奖典礼限量门票开售