迈向 exascale AI 数据基础设施

我在 MinIO 工作刚刚过了一周。通过沉浸在白板会议、架构审查和客户电话中,我最大的收获是,产品的简洁性既是其区别特征,也是其最主要的价值驱动因素之一。这在大规模应用中尤其如此。由于人工智能进步带来的计算能力的爆炸式增长,对数据格局产生了重大影响,将我们带入了艾克斯级数据基础设施时代。
对于创始人及产品负责人来说,有一些很棒的资源/成功秘诀,但它们都可以归结为一个对大多数初创公司来说仍然难以捉摸的东西——“**解决客户愿意为之付费的紧迫且普遍存在的问题。**”
对于 MinIO 来说,这个问题是关于解决动态工作负载的大规模数据基础设施的挑战。例如,人工智能/机器学习、安全信息和事件管理/威胁狩猎数据湖、HDFS 替代方案、数据库持久性存储、高级分析等等,不一而足。在人工智能领域,每一家企业公司,无论其规模大小,都在尝试利用人工智能进行自我重塑。关键指标是人工智能计划的价值实现时间。为了实现这一点,需要三件事结合在一起。
- 正确的数据,在正确的时间窗口内。
- 能够以高性能方式服务、存储和流式传输这些数据的正确基础设施。
- 利用这些数据实现预期业务成果的正确的人工智能应用程序。
让我们从正确的时间窗口内的正确数据开始。正确的数据具有 X 个属性。正确的时间窗口具有 Y 个属性。它们共同构成了数据计划的基础——人工智能或其他任何计划,并且它们在人工智能领域的重要性会成倍增加,因为如果你的数据错误,你将延续错误,你将教授错误,并且你需要重新开始。
接下来是正确的基础设施。我的同事 Keith Pijanowski 撰写了一篇关于AI 数据湖的精彩文章,值得你花时间阅读。人工智能生态系统围绕对象存储展开。OpenAI 在对象存储上进行训练。Mistral 在对象存储上进行训练。Anthropic 的 Claude 在对象存储上进行训练。
云模型为人工智能的突破铺平了道路。这对提供 NAS(网络附加存储)的传统数据存储公司来说是令人担忧的。他们在人工智能时代面临着走向磁带的风险。因此,他们试图通过文件对象二元性为现有数据提供对象存储接口来保持相关性。从架构上讲,这是错误的方法,因为这种方法导致将对象存储网关接口用于文件,而不是提供真正的原生对象存储。这种解决方案试图将人工智能工作负载的需求不成功地改造为 NAS 工作负载的功能,但其唯一真正的目标是确保数据不会离开他们的设备。无论这些存储设备供应商提供的硬件如何,这种运营模型都不能满足人工智能工作负载所需的必要速度、简洁性、成本和规模。现代人工智能应用程序是使用云原生技术构建的。从数据持久性角度来看,大多数这些人工智能应用程序工作负载默认情况下需要一个可扩展的分布式、高可用对象存储,支持非结构化/半结构化数据。MinIO 从一开始就是为了精确满足这些云原生人工智能应用程序的需求而构建的。无论是裸机还是容器,MinIO 企业对象存储确实是为这些应用程序提供支持的软件定义的云原生对象存储。
事实胜于雄辩。MinIO 的 Docker 拉取次数同比增长 84%,并且刚刚创下每天 160 万次的记录。花点时间消化一下这个数字。每天 160 万次。这可能比我们所有非公共云竞争对手一个季度的总和还要多!其中许多 Docker 拉取来自试图利用 MinIO 云原生“即用型”简洁性的企业。
要取得这种程度的成功,需要一个更好的捕鼠器。请记住,每个采用 MinIO 的公司都已经拥有某种类型的存储——即使它是传统的的文件和块存储。
这里还有另一个动态因素——云回迁。企业客户渴望避免他们在匆忙转向公有云时犯下的错误——锁定和不受控制的账单。训练人工智能所需的数据量更大,并且在处理这些大型数据集时,计算以及网络出口成本也会变得更高。在提供业务弹性的同时控制这些云成本是需求所在——而这可以通过迁移到像 Equinix 这样的托管服务提供商或回到私有数据中心来实现,客户希望节省成本——节省 50% 或更多,同时无论他们从公有云迁移数据到哪里,都利用 MinIO 进行云原生对象存储。
总之,我们将继续发展壮大,成为人工智能工作负载的主要数据基础设施,帮助客户以运营敏捷性、安全性并提供大规模新型人工智能工作负载所需性能进行创新。如有任何疑问,请通过 hello@min.io 与我们联系,或点击咨询专家按钮。