(CWW)8月19日,在2023中国算力大会期间,由中国信息通信研究院和中国互联网协会联合主办的“先进数据存力”论坛在宁夏银川举办。论坛邀请产、学、研、用各界专家一起探讨先进存力发展、可信存力建设、数据高效流动等产业热点话题,并发布系列数据存力成果,推动中国存力高质量发展。
华为公司副总裁、数据存储产品线总裁周跃峰博士受邀出席论坛并发表“先进数据存力,做AI大模型时代领先者”主题演讲。他表示,我国数据存储产业有望成为国家科技新名片,发展先进的数据存力是确保AI大模型时代国家基础设施领先的关键。
人工智能的进化,是不断收集和分析数据的过程。数据作为信息的载体,是人工智能学习和理解世界的原料。通用智能作为人工智能发展的终极目标,能够自主地学习、理解、推理和解决问题,其最大的驱动力是数据。
(资料图片)
周跃峰认为,数据质量决定机器AI智能的高度:缺数据,无AI。数据质量越高,越有价值的数据给人工智能提供更可靠的输入,AI服务能力越智能。
AI大模型由数据、算力、算法三要素构成。当下算力逐渐趋同、算法逐渐收敛,而数据仍在蓬勃发展,在AI大模型进行准备、预处理、训练、推理的全生命周期过程中,先进数据存力是构建AI差异化优势的关键。发展先进数据存力,未来应聚焦新型数据范式、先进介质应用、数据安全可靠这三个方面的创新:
●新型数据范式:以存补算,突破算力局限
通过近存计算实现近数据预处理,让数据在存储完成部分过滤、归一、转码与增强的数据准备任务,减少数据搬移,从而提升GPU利用率。同时,把企业最新垂直化的数据进行向量化存储和检索,大幅度降低企业接入和使用AI大模型的难度。
●先进介质应用:加速SSD应用,夯实领先基础
根据IDC统计,目前企业级与消费级SSD硬盘达到80%,已成为一种趋势。相比HDD,全闪存介质支持高IOPS、低时延,更适用于AI大模型训练阶段的随机读写场景。另外SSD的功耗仅为HDD的20%,适配AI大模型的低碳目标。因此,AI大模型时代应加速推进高性能、低功耗的全闪存介质应用。
●数据安全可靠:存储内生安全,构筑数据安全最后一道防线
存储内生安全体系架构从存储设备安全、数据安全防护能力,结合安全管理流程,为AI大模型构筑数据安全最后一道防线。最后,周跃峰表示,我国数据存储产业正在蓬勃发展,从芯片到部件,再到整机,我国已经具备全栈可控的存储产业链。以华为为代表的存储企业快速突围,持续投入,有望将数据存储产业打造成为国家科技的新名片。