܄

看存算协同,如何化解AI时代的“存储焦虑”?

【数据猿导读】 存储问题正逐渐成为限制大模型实际应用的关键瓶颈

看存算协同,如何化解AI时代的“存储焦虑”?

“存储问题正逐渐成为限制大模型实际应用的关键瓶颈

随着AI大模型的竞争步入2026年,焦点已从单纯的“比拼参数”转变为“比拼落地”和“比拼效率”。在实际应用中,不少企业发现,即便已经购置了算力卡,但数据读写却难以跟上,推理响应速度迟缓,成本居高不下。这一现象的核心矛盾之一,正是存储架构能否契合AI智能计算的特殊需求,尤其是近期备受瞩目的KV Cache存储瓶颈。

3月17日,一场题为《算力先行,存力为王——谁主沉浮AI智算新生态?》的直播活动盛大开启。此次活动由数据猿主办,特别邀请西部数据资深售前工程师芦浩、极道科技首席技术官张京城,以及数据猿联合创始人兼主编张艳飞担任直播主持,现场上演了一场精彩绝伦的思想交锋。

本次活动聚焦KV Cache优化、模型训练加速以及高性价比存储系统的构建,探讨了通过软硬协同如何有效化解AI时代的“存储焦虑”。随着人工智能技术在全球范围内的飞速发展,算力固然是核心驱动力,但存储问题却日益成为制约大模型实际应用的关键短板。无论是在训练阶段对大规模数据的高效处理,还是在推理阶段对KV Cache的频繁访问,传统存储架构都面临着前所未有的挑战。

针对这一情况,数据猿特别邀请两位行业专家展开探讨。西部数据与极道科技分别作为软硬件领域的代表,围绕六个核心议题进行了深研讨论,这些议题涵盖了AI智算存储所面临的技术瓶颈、协同优化、降本增效、实战落地、未来趋势以及生态共建等方面。此次对话为AI智算新生态的发展提供了实践路径和发展参考。

议题一:大模型训练“粮草”保卫战,软硬件协同破解高带宽瓶颈

直播开始,主持人张艳飞抛出了核心问题:千亿甚至万亿级参数的AI模型训练,对存储带宽提出严苛要求,硬件与软件层面分别面临哪些“卡脖子”挑战?

西部数据芦浩表示,当前AI发展对存储的实时性、及时性提出全新要求,模型训练需存储硬件具备微秒级响应速度与超高带宽,而行业正面临性能、容量、成本的三重考验。机械硬盘虽凭借高容量、低成本优势主导AI数据中心,但读写速度、延迟等指标与固态硬盘差距明显,在高性能场景中竞争力下滑。

为破解困境,西部数据推出三项创新技术:一是高带宽硬盘技术,采用三阶执行器技术实现精准磁道定位,通过双读写磁头并行访问,读写吞吐量达现有硬盘1.7倍,顺序读写性能提升至2倍,未来有望实现8倍提升,该技术计划在50TB级产品中引入,未来100TB产品可实现8轨道同时处理以提升I/O速率;二是双枢轴技术,通过双独立执行器并行操作,结合算法优化合并IO,带宽可提升2倍,未来将实现4倍突破;三是HAMR热辅助磁记录技术,借助磁头上激光二极管瞬时加热碟片磁道使磁粒位磁性反转,从而实现数据稳定写入,助力大容量硬盘研发。芦浩透露,西部数据预计2027年推出60TB硬盘,性能将接近主流固态硬盘水平。

存算协同_AI时代_存储焦虑-1

极道科技张京城从存储系统视角补充道,西部数据的高性能硬盘是基础,极道科技则聚焦端到端优化,核心是消除应用到硬盘的通信瓶颈,充分释放硬件效能。他强调,可靠性是存储系统的核心,需先保障数据不丢失,再通过差异化适配优化性能、控制成本。极道科技通过自主研发的统一调度引擎,实现“按需加载、智能预取”,与西部数据硬件形成协同,缓解存算瓶颈。

议题二:KV Cache优化,软硬件“快上加快”赋能AI推理

探讨完训练瓶颈后,张艳飞聚焦AI推理场景提问:“KV Cache技术对低延迟要求极高,西部数据EBOF与极道软件如何实现‘快上加快’?”

芦浩表示,西部数据OpenFlex Data24 EBOF盘框天生适配KV Cache特性,为AI推理提供高并发、低延迟、大容量硬件支撑,可满足TB级上下文、PB级存储需求,解决GPU显存不足、I/O瓶颈等痛点。其采用NVMe SSD搭配100G RoCE网络,通过NVMe over Fabric架构实现存算直连,属于Diskless架构创新实践;双控架构,控制内部采用PCIe 4.0标准硬件架构,支持多种无损网络协议,无性能瓶颈。

实测数据显示,EBOF配置闪迪SN655 NVMe SSD时,12台服务器压测下,随机IOPS达2700万,顺序读带宽135GB/s、写带宽近90GB/s,单盘随机读延迟仅96微秒。该产品支持全局共享、近计算节点、分层三种部署方式,可弹性扩展,通过RDMA直连与GPU Direct软件实现存算协同,为极道软件提供坚实支撑。据悉,OpenFlex Data24系列EBOF最大容量可达1474TB,顺序读性能最高达129.34GB/s,随机读最高可达29.41M IOPS。

张京城表示,AI 推理核心诉求是低延迟。极道科技采用 “QA Cache 存储 + 智能网关” 组合方案,通过架构级协同优化,实现推理性能大幅提升。智能网关可智能调度算力资源、追踪 KV Cache 分布,最大化缓存命中效率;QA Cache 采用开放架构,实现多层次智能缓存,通过零拷贝读写进一步提升性能。该方案兼容主流推理引擎与国产算力卡,具备企业级高可用性,可有效降低 token 生成延迟、优化使用成本。

议题三:降本增效,多模态时代的存储最优解

针对AI多模态时代的海量数据存储难题,张艳飞问道:“面对视频、三维数据等百倍于文字的数据吞吐量,如何构建‘既能打又省钱’的存储系统?”

对此,芦浩表示,智慧城市、自动驾驶等场景数据已达PB级甚至EB级,需软硬件协同构建高效存储架构。西部数据聚焦硬件创新,通过分层硬盘产品与高密磁盘扩展柜组合降本增效。其企业级硬盘家族涵盖26TB-32TB SMR硬盘、22TB-26TB CMR硬盘等多规格,22TB以上产品搭载OptiNAND技术,12TB以上采用氦气封装,MTBF达250万小时。

针对海量存储场景,西部数据推出60盘、102盘两种磁盘扩展柜,阿里、字节等大厂均采用JBOD磁盘扩展柜方案。举例规划50PB存储需求下,“服务器+60盘扩展柜”需40个节点,采购成本、机柜数量下降近一半;102盘扩展柜仅需26个节点,采购成本下降超一半,5年运营成本与硬盘故障率大幅降低,帮助客户降低整体TCO。西部数据磁盘扩展柜具有振动隔离技术、冷温区技术两项专利技术,支持远程集中管理,简化运维。

张京城表示,极道科技通过软件自适应优化实现了性能与成本的精准平衡。具体而言,我们先深度拆解各类应用的实际需求,精准区分不同场景的性能差异,采用“HDD+SSD”混合介质架构进行场景化适配,让存储资源与业务需求高度匹配;同时基于数据热度实现存储介质的智能动态调度,让数据流转更高效,从底层规避IO拥堵问题;更推出“AI Pipeline”解决方案,实现存储调度全流程自动化,大幅简化操作门槛的同时,高效应对多模态数据的爆发式增长,从软件层面彻底打通数据读写链路,让IO不再成为制约业务发展的存储瓶颈。

存算协同_AI时代_存储焦虑-2

议题四:实战派分享——医学科研领域的AI存储落地实践

围绕技术落地,张艳飞邀请嘉宾分享医学科研、前沿科创领域的实战案例,并询问Agent及“小龙虾”智能体对行业的影响。

张京城表示,极道科技与西部数据在医学科研领域落地多个AI存储实践案例,核心采用自研ALAMO分布式并行存储系统搭配西部数据高性能硬件,精准适配各类科研与医疗机构的业务需求。该系统兼具高性能、高可靠与高可扩展性,可同时承载AI训练推理、基因测序分析等多元业务,兼容英伟达及国产GPU,支持X86与ARM架构,保障医疗科研核心数据高效流转与高性能存取。

存算协同_AI时代_存储焦虑-3

针对智能体,张京城认为,当前其主要应用于个人场景,企业级应用仍面临安全可靠性不足、数据增长压力大等挑战,未来将推动AI与业务深度耦合,增加存储需求多样性。

芦浩认同这一观点,他表示,智能体进入企业场景需提升安全可靠性,西部数据通过高稳定硬件与专利技术,降低故障概率,为企业级AI场景筑牢硬件根基,助力智能体落地。

议题五:存算协同,下一个五年AI架构的核心趋势

聚焦AI架构未来发展,主持人问道:“存算分离时代数据搬运成本过高,存储系统是否需具备更强‘计算感知’能力?”

张京城表示,下一个五年AI架构核心趋势是AI与业务高度耦合,存算协同是关键,未来需构建AI专属操作系统。该系统需包含存储、非结构化数据管理、融合计算三大模块,通过协同优化降低数据搬运成本、提升算力利用率,实现数据价值转化。他认为,AI技术迭代极快,未来大模型能力将深度融入各类应用,重构行业形态。

芦浩补充道,存算协同核心是最小化IO损耗、减少数据搬运,并非物理设备融合,而是通过软件实现逻辑一体化。西部数据通过高速以太网与并行NVMe闪存组合,提供硬件支撑。其与极道科技合作的存算协同案例显示,开启GPU Direct Storage功能后,带宽从20多GB/s提升至93GB/s,解决三维仿真卡顿问题,验证了方案有效性。两位嘉宾一致认为,存算协同将成为未来五年核心演进方向,需软硬件深度协同。

议题六:共建生态,“存、算、用”闭环助力行业发展

作为直播最后一个议题,主持人询问两家企业如何打破“黑盒”协同,构建“存、算、用”闭环生态。

芦浩表示,西部数据正从单一硬件供应商向全线解决方案服务商转型,在科罗拉多普林斯组建开放兼容性实验室(OCCL),推动行业互操作性。其已形成完善生态矩阵,软件端与极道科技、英伟达等深度合作,硬件端联动闪迪、英特尔等厂商,未来将加大研发,推出AI全生命周期配套解决方案。

张京城表示,AI将成为生态协同的核心工具,借助AI编程可大幅缩短厂商对接周期、降低成本。他强调,数据安全与隐私保护是生态协同的前提,未来AI将同时作为服务对象与协同工具,推动“存、算、用”闭环完善,扩大AI智算“朋友圈”。

此次直播中,西部数据与极道科技从硬件创新、软件优化、案例落地、趋势预判等多维度,展现了软硬件协同破解AI存储瓶颈的路径,为行业高质量发展提供了宝贵经验。未来,随着存算协同趋势深化与生态体系完善,AI存储将更好支撑多领域智能化落地。


来源:数据猿

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

“CEO还需要CIO吗?”——一顿年夜饭,击中了AI时代的管理焦虑
“CEO还需要CIO吗?”——一顿年夜饭,击中了AI时代的管理焦虑
【“致敬十年”系列】所有TO B企业,都得在AI时代“重做一遍”:是危,还是机?
【“致敬十年”系列】所有TO B企业,都得在AI时代“重做一遍...
夯实工业AI时代的数据底座,蓝卓supOS X工厂操作系统全球首发
夯实工业AI时代的数据底座,蓝卓supOS X工厂操作系统全球首发

我要评论

数据猿微信公众号
第22届国际物联网展
返回顶部