(CWW)日前,在中国深圳举办的第 20 届华为全球分析师大会,长江学者特聘教授、华中科技大学计算机科学与技术学院院长冯丹对数据中心 Diskless 架构及近数据处理发展趋势做出了权威解读,为传统云存储、大数据等计算域和存储域不完全分离造成的资源浪费,提出了一个新的技术解决方向,帮助云和互联网数据中心降本增效,实现数据中心高质量演进。
(资料图片仅供参考)
冯丹教授提到,传统存算融合架构下,企业通常采用应用与本地盘耦合的服务器一体化架构,存在存力效率低、无效数据迁移、资源浪费等典型问题:
1.计算域和存储域未彻底分离,仍各自存在独立的本地存储,往往按照最大容量预设配置,存力利用率低;
2.采用通用算力进行数据处理,IO 效率低,存储域仍以 CPU 为中心,存取性能无法充分发挥;
3.数据从盘到计算域 CPU, 需要 8 次以上数据搬迁,无效搬迁带来了网络和算力资源的浪费;
4.在存算融合的上千节点大规模集群中,算力、容量空间配比无法均衡,扩容时需要额外迁移数据,不仅带来现有业务风险,还会浪费投资;
5.数据爆发增长,面向结构化数据的数据缩减策略不完全适用于非结构化场景。
随着算力多样化、高性能网络和存储介质的发展,数据中心架构从以 CPU 中心朝着以数据为中心的 Diskless 架构演进。Diskless 架构下,单一 CPU 算力发展到 GPU、DPU、XPU 等多样算力,算力效率得以充分发挥;网络从 IP、NOF 发展到高通量的 CXL,为算力和存力等硬件解耦奠定了基础;存力也从传统 HDD 到 SSD,性能、功耗实现全面提升。在 Intel、华为、KIOXIA、阿里云等业界芯片、存储、云和互联网厂商的积极推进下,Diskless 架构借助专用 DPU / IPU 等数据处理芯片和 OceanDisk 等专用存储模块,进一步提升数据处理和存储的效能,充分调动数据中心资源。
冯丹教授表示,资源池化共享的 Diskless 架构应具备以下关键技术:
1.网存协同,DPU 硬件卸载加速,数据高效协同处理。通过 DPU 等专有数据处理模块,使服务器 CPU 全为应用服务,基础设施与应用任务解耦,将 VirtIO、NVMe-oF 等 CPU 计算效率低任务转移到 DPU 的专用加速器执行,实现资源弹性扩展。
2.数控分离 + IO 直通,实现控制流与 IO 流分离,IO 直通到存储介质,进一步提升存储效率。通过数控分离,可达到极致 IO 访问时延,通过存储域 IO 读写数据流与 IO 控制处理的分离,使得读写 IO 直通到存储介质中,减少 IO 处理路径,降低处理复杂度,极大提升存储域访问性能。计算域则可以借助 DPU bypass CPU,减少数据拷贝开销,提升 IO 访问性能。
3.盘控协同,盘芯片与控制器芯片配合,提升集成度,达到最佳成本和能耗。盘控协同技术的关键是要实现高性能、低成本的大盘,通过硬件对盘控系统内的算法进行加速,比如利用 FPGA 实现 FTL / DIF / 在线压缩 / 加密 / EC / GC 等硬化,提升性能;盘内和框内的各类驱动和缓存层合一,实现盘框一体,构建极致成本和能耗的大盘存储。
4.算子卸载,EC、数据缩减等算法通过硬件卸载到存储端,实现近数据处理。通过计算语义的卸载,存储直出语义接口,主机侧软件栈打薄,减少 80% 的 IO 交互次数,实现对整系统的 CPU 和网络带宽节省。同时,在大数据 / 数据仓库场景,可以利用引擎的下推接口,下推谓词和投影等运算操作到存储资源池,减少无效数据的搬移。
冯丹教授表示:“从技术趋势来看,高性能异构算力、高速网络、大存力新型盘框、算子卸载等技术的发展,带来了数据中心架构的变革,加速了以 CPU 为中心的耦合架构走向彻底存算分离、资源池化共享的以数据为中心的 Diskless 架构,这种架构进一步简化了数据中心基础设施构建,能够实现存力和算力资源的集约高效发展,已经成为大规模数据中心发展的重要技术趋势。”
华为去年发布的 OceanDisk 智能盘框产品,是一个标准的大存力新型盘框产品。OceanDisk 通过 NoF + 高速网络连接 Diskless 服务器,实现计算和存储独立弹性扩展,帮助客户提高资源利用率,机柜空间和设备功耗分别降低 40%;内置 FlashLink® 智能盘框协同算法等软硬结合技术,带来最大 250 万 IOPS,50GB / s 带宽的高性能;依托华为多年存储研发实力,OceanDisk 智能盘框提供硬盘亚健康管理、智能慢盘优化等技术,保持大规模数据中心 10 万级硬盘的性能稳定,大幅降低运维难度。OceanDisk 作为业界首个面向 Diskless 架构的新型盘框,将以高性能、高可靠、绿色集约重新定义下一代云和互联网数据中心存储架构。