AI 的未来是开源的

探索开源环境中 AI 的未来,挑战大型科技公司隐秘的努力。了解拥抱极端开放式创新如何促进协作,推动市场增长,并为开源 AI 数据栈奠定基础。
阅读更多...探索开源环境中 AI 的未来,挑战大型科技公司隐秘的努力。了解拥抱极端开放式创新如何促进协作,推动市场增长,并为开源 AI 数据栈奠定基础。
阅读更多...在这篇文章中,我们将了解对象在复制过程中可能处于的各种状态,以及如何在其他一些技巧中尽快恢复并运行,以便您在复制的第二天获得愉快的体验。
阅读更多...服务器池可帮助您快速轻松地扩展现有 MinIO 集群的容量。这篇博文重点介绍如何提高一个集群的容量,这与添加另一个集群并在多个集群之间复制相同的数据不同。
阅读更多...您现在可以使用 MinIO 批处理框架执行 S3 删除操作,以通过单个 API 请求删除大量对象。MinIO 批处理框架使您能够快速轻松地执行重复性或批量操作,例如跨 MinIO 部署执行批处理复制和批处理密钥轮换。MinIO 批处理框架处理所有手动工作,包括管理重试和报告。
阅读更多...使用 LanceDB(一个针对开源 Lance 格式上的 AI/ML 进行了优化的闪电般快速的向量数据库)来对抗数据复杂性。与 MinIO 合作,它可以无缝扩展,提供高性能的云原生存储。深入教程,快速部署。
阅读更多...2023 年仅剩几天(还有谁不敢相信?),我们花了一些时间回顾这一年取得的惊人成就。亮点层出不穷。无论是众多奖项、会议,还是与众多朋友的相遇,我们都心怀感激!MinIO 最重要的部分
阅读更多...在过去的几个月里,我写过许多关于不同技术的文章(Ray Data、Ray Train 和 MLflow)。我认为将它们整合在一起,提供一个易于理解的配方,用于使用生产就绪的 MLOps 工具进行分布式数据预处理和分布式训练,并进行跟踪和模型服务,是很有意义的。这篇文章整合了我之前介绍的代码。
阅读更多...几年来,我们一直认为在现代数据栈中,对象存储是主要存储。在人工智能时代,这一点更加突出,企业几乎完全专注于对象存储。现代数据栈依赖于解耦的计算和存储,以及在 Kubernetes 上运行的容器中的云原生微服务。随着越来越多的企业转向这种
阅读更多...大多数机器学习项目都从单线程概念验证开始,其中每个任务都必须在下一个任务开始之前完成。下面所示的单线程 ML 管道就是一个例子。但是,在某些时候,您将超出上述管道的范围。这可能是由于数据集不再适合单个进程的内存造成的。
阅读更多...2023 年日历年将是一个有意义的一年,也许是在人工智能史上最具意义的一年之一。从本质上讲,它是“大爆炸”。它始于 2022 年底 OpenAI 的 ChatGPT,但令人叹为观止的是其反响。几个月内,我们就有 Meta 的 LLaMA 2、谷歌的 Bard 聊天机器人
阅读更多...人们对 ClickHouse Cloud 和 MotherDuck 等超快速分析数据库的兴趣日益浓厚,突显了解耦存储和计算的好处。这种架构在 AI 应用中得到了体现,它增强了可扩展性、速度和成本效率,并推动了向对象存储的转变。
阅读更多...Microsoft SQL Server 2022 是最常部署的企业关系数据库之一。无论垂直行业如何,世界上许多最成功的公司都拥有大量的 SQL Server 部署。数千家公司几十年来一直依赖 SQL Server。过去十年,微软在拥抱开源和符合标准的技术方面取得了长足进步。结果是
阅读更多...MinIO 集群作为一个统一的集群运行。这意味着任何请求都必须由任何服务器无缝处理。因此,服务器需要相互协调。到目前为止,这已通过传统的 HTTP RPC 请求来处理——这为我们提供了良好的服务。每当服务器 A 想要调用服务器 B 时,HTTP 请求就会
阅读更多...在这篇文章中,我们将讨论什么是隔离网络,在这样的环境中部署 MinIO 时需要考虑什么,以及如何随后与其他隔离站点进行复制和扩展。
阅读更多...在采用 AI 的热潮中,有一个至关重要且经常被忽视的事实——任何 AI 计划的成功都与底层数据基础设施的质量、可靠性和性能息息相关。如果您没有适当的基础,那么您在构建方面受到限制,因此在您所能实现的目标方面也受到限制。您的数据基础设施
阅读更多...StarRocks 和 MinIO 的组合为现代企业提供了一个云原生、灵活且高效的数据架构,实现了独立扩展和优化的资源利用。阅读完整教程,了解有关使用 StarRocks 和 MinIO 进行云原生分析的见解。
阅读更多...探索 Dockerized MinIO 与本地 Flask 应用程序的集成。本指南解决了 Docker 网络挑战,确保开发环境中 MinIO 和 Flask 之间的无缝通信,使其与生产环境非常相似。深入了解健壮工作流程的实用解决方案。
阅读更多...在今天的文章中,我们将更深入地探讨一些您需要考虑的长期 MinIO 管理事项,以便在 48 小时后的第二天到来时,您已经万事俱备。
阅读更多...麦肯锡发布了一份有趣的报告,探讨了人工智能对企业云投资的迫在眉睫的影响。文章开头有一段麦肯锡的引言:“虽然对不同行业的影响可能有所不同,但采用云为普通公司提供了将盈利能力提高 20% 到 30% 的机会。”对许多人来说,这将
阅读更多...简介 分布式数据处理是高效端到端分布式机器学习训练管道的关键组成部分。如果您正在构建用于统计预测的基本神经网络,那么分布式训练可能意味着每个实验运行 10 分钟而不是 1 小时,这同样适用。如果您正在训练或微调大型语言模型 (LLM),那么
阅读更多...