Necciai指出,目前存在多种存储解决方案,对于特定的人工智能应用,云存储或传统硬盘可能已足够。该公司运用人工智能和成像技术来监控行驶中的火车。
然而,Necciai和其他专家认为,对于那些需要即时响应或处理信息的人工智能系统,硬盘和云存储可能因距离过远而响应缓慢。Necciai举例说明,Duos Technologies能在扫描铁路车辆后60秒内发出通知,这要求公司采用超高速存储与人工智能计算单元协同工作。
Necciai强调,对于大型人工智能项目,企业必须考虑所需存储容量以及存储处理多任务的能力。他补充说:“我们需要能够同时快速地向存储写入数据,并从存储中快速读取数据。”“对我们而言,能够并行操作存储至关重要。”
去年,Duos Technologies扫描了850万辆火车车厢,每次扫描可能产生超过1050张图像。Duos轨道车检查门户使用了四个高性能存储阵列,每个阵列包含16个NVMe驱动器,总容量约为500TB。此外,公司还使用了大约25TB的传统存储空间,用于内部培训和开发人工智能,这减少了对即时结果的需求。Necciai表示:“我们希望充分利用所有这些资源来完成我们的工作。归根结底,就是用正确的工具完成正确的工作。”
随着人工智能项目规模的扩大,其他企业也在转向大容量SSD或NAND闪存来满足其存储需求。尽管高速内存的成本远高于硬盘,每千兆字节高达1,000美元,但它们提供了其他优势。企业固态硬盘制造商Solidigm的领导力营销高级总监Roger Corell指出,固态硬盘的能效几乎是服务器和硬盘机架的三倍,占用空间也更小。
随着企业采用更复杂、多模式的人工智能项目,以及越来越多的员工开始使用人工智能工具,对高容量、多线程存储选项的需求只会增加。Corell补充说:“人工智能在需要存储的数据量以及需要多快的速度访问这些海量数据集方面是如此强大。”
人工智能和机器学习项目的对象存储公司MinIO的首席技术官Ugur Tigli表示,除了SSD或NAND选项外,一些公司正在使用私有云或托管设施来满足他们的存储需求。他说,采用人工智能的MinIO客户通常会将存储容量增加4到10倍,并鼓励大规模人工智能用户在公共云之外寻找存储需求,因为使用私有云或托管服务的成本可能比公共云低60%。
他说:“在数百P字节或1E字节或2E字节的规模上,在公共云中行不通。根据容量、分层和数据访问配置,每年的总成本将在数千万到数亿美元之间。”Tigli补充说,与公共云不同,企业用户可以私下构建并“突发”到云上,以获得额外的GPU使用。他说:“这里的关键是,计算是弹性的,但数据有引力,并且以可预测的(尽管是加速的)速度增长,因此需要相应地构建计算。”
数字转型服务商AHEAD公司的领域首席技术官Priyanka Karan补充说,另一个选择涉及PB规模存储平台。她表示,“PB规模存储平台旨在减少数据移动的挑战,即将数据从最初降落的地方带到可以用于人工智能训练的地方。我们的目标不是建立一个新的仓库。”
她说,一些可用的存储平台建立在NAND闪存上,这提供了高吞吐量和低延迟,对于将数据馈送到GPU和TPU至关重要。
一些人工智能用户和专家表示,现在有几种选择,所需的存储数量和类型取决于组织正在部署的人工智能项目。Karan表示,脱机批处理比实时工作负载的内存需求更低。她补充说,在某些情况下,二级存储选项可用于保存训练和运行人工智能模型所需的大量数据。
选择正确的存储选项还取决于经常提到的数据重力(也就是数据集的大小),是否可以将其移动到云中进行处理,或者对数据进行处理是否有意义。在一些人工智能项目中,数据存储与人工智能计算一起位于数据中心、另一个公共云或数据创建的边缘。
企业还有许多其他因素需要考虑,包括安全性、法规或遵从性挑战。对于云存储,Karan说:“网络、距离和延迟都是考虑因素,但他们必须考虑额外的成本变量。”此外,除了存储本身的成本之外,可能还有数据传输费用、访问费用和非本地存储的管理费。另一方面,本地存储选项可能涉及巨大的前期投资,以及维护、电力和冷却以及员工工资。
发表评论 取消回复