通往可扩展 AI 的更轻松路径:英特尔 Tiber 开发者云 + MinIO 对象存储

An Easier Path to Scalable AI: Intel Tiber Developer Cloud + MinIO Object Store

如今,企业在 AI 和数据管理方面面临的最大挑战之一是获得可靠的基础设施和计算资源。英特尔 Tiber 开发者云专为需要环境来进行概念验证、实验、模型训练和服务部署的工程师而设计。与其他可能难以接近且复杂的云不同,英特尔 Tiber 开发者云简单易用

阅读更多...

开源还是闭源?AI 困境

Open Source or Closed? The AI Dilemma

这篇文章最初发表于 2024 年 7 月 29 日的 The New Stack 上。人工智能正在软件行业经历一场完美的风暴,而现在马克·扎克伯格呼吁开源 AI。三种强大的观点正在发生冲突,这些观点围绕如何控制 AI:1. 所有的 AI 都应该开源,以便共享和透明。 2. 保持 AI 闭源和

阅读更多...

使用 Snorkel 和 MinIO 的数据中心 AI

Data-Centric AI with Snorkel and MinIO

在今天所有关于大型语言模型的讨论中,它们的编码器、解码器、多头注意力层以及数十亿(很快将达到万亿)个参数,人们很容易相信优秀的 AI 仅仅是模型设计的结果。不幸的是,情况并非如此。优秀的 AI 需要更多的东西,不仅仅是设计良好的模型。它还需要构建良好的训练

阅读更多...

全栈 AI 工程师:现代全才

The Full Stack AI Engineer: A Modern-Day Polymath

任何在团队环境中工作过的人都知道,每个成功的团队都有一个可以依靠的人——那个无论你遇到什么问题都能帮助你的特殊人物。在传统的软件开发团队中,这个人是一位经验丰富的程序员,并且也是另一项技术的专家,这可能是像 Snowflake 这样的数据库技术。

阅读更多...

使用 Ray Train、MLflow 和 MinIO 进行分布式训练和实验跟踪

Distributed Training and Experiment Tracking with Ray Train, MLflow, and MinIO

在过去的几个月里,我写过关于多种不同技术的文章(Ray Data、Ray Train 和 MLflow)。我认为将它们全部整合在一起,提供一个易于理解的配方,用于使用面向生产的 MLOPs 工具进行分布式数据预处理和分布式训练,以进行跟踪和模型服务,将很有意义。本文整合了我在

阅读更多...