AI基础设施新现实:让计算靠近数据而非数据靠近计算
创始人
2025-06-27 00:00:33
0

随着人工智能在各行各业的企业运营中发挥着变革性作用,数据存储方面的关键挑战不断涌现——无论模型多么先进,其性能都取决于快速、安全、可靠地访问海量数据的能力。如果没有合适的数据存储基础设施,即使是最强大的AI系统也可能因缓慢、分散或低效的数据管道而陷入困境。

这一话题成为VB Transform大会第一天的焦点,会议聚焦于由PEAK:AIO和Solidigm引领的医学影像AI创新。他们与医学AI开放网络(MONAI)项目——一个用于开发和部署医学影像AI的开源框架——携手合作,正在重新定义数据基础设施如何支持医院中的实时推理和训练,从增强诊断到推动先进研究和操作用例。

在临床AI边缘的存储创新

在微软风投基金M12管理合伙人Michael Stewart的主持下,会议汇集了PEAK:AIO首席执行官Roger Cummings和Solidigm产品与市场总监Greg Matson的深刻见解。对话探讨了下一代高容量存储架构如何通过提供处理临床环境中海量数据集所需的速度、安全性和可扩展性,为医学AI开辟新的道路。

至关重要的是,两家公司从早期就深度参与了MONAI项目。MONAI与伦敦国王学院等机构合作开发,专门用于开发和部署医学影像AI模型。这个开源框架的工具集专为医疗保健的独特需求量身定制,包括用于DICOM支持、3D图像处理和模型预训练的库和工具,使研究人员和临床医生能够构建用于肿瘤分割和器官分类等任务的高性能模型。

MONAI的一个关键设计目标是支持本地部署,允许医院在利用标准GPU服务器进行训练和推理的同时,保持对敏感患者数据的完全控制。这将框架的性能与其底层数据基础设施紧密联系,需要快速、可扩展的存储系统来充分支持实时临床AI的需求。这正是Solidigm和PEAK:AIO发挥作用的地方:Solidigm提供高密度闪存存储,而PEAK:AIO专门为AI工作负载定制存储系统。

Cummings解释道:"我们很幸运能够早期与伦敦国王学院和Sebastien Orslund教授合作开发MONAI。通过与Orslund的合作,我们开发了底层基础设施,使生命科学领域的研究人员、医生和生物学家能够在这个框架基础上快速构建。"

满足医疗AI的双重存储需求

Matson指出,他看到存储硬件出现了明显的分化,不同的解决方案针对AI数据管道的特定阶段进行了优化。对于MONAI等用例、类似的边缘AI部署以及涉及训练集群供给的场景,超高容量固态存储发挥着关键作用,因为这些环境通常受到空间和功耗限制,但仍需要本地访问海量数据集。

例如,MONAI能够在医院现有IT基础设施的单个节点上存储超过200万次全身CT扫描。Matson说:"非常受限的空间、功耗和超高容量存储实现了相当令人瞩目的结果。"这种效率对医疗保健边缘AI来说是游戏规则的改变者,使机构能够在本地运行先进的AI模型,而不会影响性能、可扩展性或数据安全性。

相比之下,涉及实时推理和主动模型训练的工作负载对系统提出了截然不同的要求。这些任务需要能够提供极高每秒输入/输出操作数(IOPS)的存储解决方案,以跟上高带宽内存(HBM)所需的数据吞吐量,并确保GPU得到充分利用。PEAK:AIO的软件定义存储层与Solidigm的高性能固态硬盘(SSD)相结合,解决了这一范围的两端需求——在整个AI管道中提供所需的容量、效率和速度。

边缘临床AI工作负载的软件定义层

Cummings解释说,PEAK:AIO的软件定义AI存储技术与Solidigm的高性能SSD配对时,使MONAI能够以临床AI所需的速度读取、写入和存档海量数据集。这种组合加速了模型训练并提高了医学影像的准确性,同时在为医疗保健环境量身定制的开源框架内运行。

Cummings说:"我们提供了一个可以部署在任何商用服务器上的软件定义层,将其转换为AI或HPC工作负载的高性能系统。在边缘环境中,我们采用相同的能力并将其缩放到单个节点,使推理更接近数据所在的位置。"

一个关键能力是PEAK:AIO如何通过将内存更直接地集成到AI基础设施中来帮助消除传统的内存瓶颈。Cummings说:"我们将内存视为基础设施本身的一部分——这一点经常被忽视。我们的解决方案不仅扩展存储,还扩展内存工作空间和与之相关的元数据。"这对于那些无法承受——无论是在空间还是成本方面——重复运行大型模型的客户来说意义重大。通过保持内存驻留令牌的活跃和可访问性,PEAK:AIO实现了高效的本地化推理,无需持续重新计算。

让智能更接近数据

Cummings强调,企业需要采用更战略性的方法来管理AI工作负载。"你不能只是一个目的地。你必须理解工作负载。我们与Solidigm及其基础设施合作开展了一些令人难以置信的技术工作,在如何处理数据方面更加智能,从如何从单个节点获得性能开始,"Cummings解释道。"因此,随着推理成为如此巨大的推动力,我们看到通才变得更加专业化。我们现在正在将从单个节点完成的工作推向更接近数据的地方,以提高效率。我们想要更智能的数据,对吧?做到这一点的唯一方法就是更接近那些数据。"

大规模AI部署中出现了一些明显的趋势,特别是在新建的绿地数据中心。这些设施设计有高度专业化的硬件架构,将数据尽可能接近GPU。为了实现这一点,它们严重依赖全固态存储——特别是超高容量SSD——旨在提供具有保持GPU持续高吞吐量数据供给所需速度和可访问性的PB级存储。

Cumming解释道:"现在同样的技术基本上在企业边缘以微观形式出现。因此,对于AI系统的采购者来说,确定如何选择硬件和系统供应商变得至关重要,甚至要确保如果你想从系统中获得最佳性能,你要在全固态上运行。这允许你在单个系统中引入大量数据,就像MONAI示例一样——它在单个系统中有超过1500万张图像。这在边缘的小型系统中实现了令人难以置信的处理能力。"

转自:至顶网

相关内容

热门资讯

神舟二十号航天员乘组圆满完成第... 新华社北京6月26日电(蔡琳琳、李陈虎)6月26日21时29分,经过约6.5小时的出舱活动,神舟二十...
腾讯研究院AI速递 20250... 二、 谷歌对编程Agent出手,推出Gemini CLI业界最高免费限额 1. 谷歌推出开源免费的G...
自主研发、自主可控,国产芯片破... 央视网消息:处理器(CPU)是计算机的核心组成部分,就像“大脑”一样指挥各个部件的运行。6月26日,...
原创 以... 本文刊载于《中国科学院院刊》2025年第5期专刊“建设世界科技强国”——专题"科技创新与产业创新深度...
三星S26 Ultra确认取消... 6月26日消息,据博主@PandaFlashPro 在X平台发布的推文,三星Galaxy S26 U...
VR赋能,智炼尖兵!生态铁军电... 深圳商报·读创客户端首席记者 吴蕾 6月25日,深圳市生态环境局2025年第二期VR实景模拟考练圆满...
科学与健康|生态防范蝗灾!我国... 秋天的田野被大量蝗虫振翅的轰鸣惊扰。这些生物为何能在一夕之间“集结”?如何开辟化学农药之外的治蝗“新...
超级未来科技:不是做大模型,而... 在AI、大模型、Web3等技术风口频繁更替的当下,几乎所有科技企业都在讲“场景化应用”“产品即服务”...
打破国外垄断,中广核核电管道堆... 深圳商报·读创客户端记者 张妍 通讯员 朱丹 近日,国家知识产权局公布第二十五届中国专利奖授奖决定。...
南昌市国企不动产监管迈入“可信... 6月24日,南昌市可信数据空间发布会暨数商生态联盟成立大会在南昌市市民中心隆重举行。作为全国18个数...