MinIO Blog
客户登录
产品
MinIO 企业对象存储
概述 架构
功能
复制 加密 对象不变性 身份 + 访问管理 信息生命周期 版本控制 密钥管理服务器
控制台 目录 防火墙 缓存 可观察性 S3 兼容性
适用于公共云的 MinIO
AWS GCS Azure
适用于私有云的 MinIO
Kubernetes OpenShift SUSE Rancher Tanzu
适用于裸机服务器的 MinIO
Linux 和 Windows
确定您的原始容量和可用容量 擦除码计算器 MinIO 的推荐硬件配置 参考硬件
解决方案
AI 存储 对象存储正在推动 AI 革命。了解 MinIO 如何通过规模化的性能引领 AI 存储市场。 现代数据湖 现代的多引擎数据湖依赖于能够提供规模化性能的对象存储。详细了解此 MinIO 核心用例。 混合云 有效的多云存储策略依赖于利用能够在不同环境中无缝运行的架构和工具。 HDFS 迁移 使用 MinIO 的高性能、Kubernetes 原生对象存储来现代化和简化您的海量数据存储基础设施。 Equinix 将您的数据迁移到您控制的云上,使用 Equinix 上的 MinIO 来降低成本,同时保持公共云邻近性。 Splunk 了解 MinIO 如何为 Splunk SmartStores 提供规模化的性能。 Snowflake 使用 Snowflake 数据云查询和分析驻留在 MinIO 上的多个数据源,包括流式数据。无需移动数据,只需使用 SnowSQL 查询。 SQL Server 了解如何将 SQL Server 2022 与 MinIO 配对,以在任何云上运行您的数据查询,无需移动数据。 VMware 了解 MinIO 如何在整个 VMware 产品组合中与 VMware 集成,从持久数据平台到 TKG,以及我们如何支持他们的 Kubernetes 愿景。 Veeam 了解 MinIO 和 Veeam 如何合作推动各种备份用例的性能和可扩展性。 Commvault 了解 Commvault 和 MinIO 如何合作,为关键任务备份和还原工作负载提供规模化的性能。 集成 浏览我们广泛的集成组合。
社区
GitHub 加入我们的 GitHub 开源社区:探索、实验、提问和贡献。 Slack 频道 MinIO 社区 Slack 提供了一个公开论坛,供讨论与 MinIO 相关的主题。所有支持均按尽力而为原则提供。
文档 博客 资源 培训 合作伙伴 价格 下载
主题
全部 企业对象存储 架构师指南 运营商指南 案例研究 最佳实践 AI/ML 现代数据湖 性能 Kubernetes 集成 基准测试 安全 多云
Try the Erasure Code Calculator
尝试擦除
代码计算器
来配置您的
可用容量
立即尝试

赋能 AI/ML 创新:使用 MinIO 的高性能对象存储构建特征存储

David Cannan David Cannan on AI/ML 2024 年 3 月 12 日
Powering AI/ML Innovation: Building Feature Stores with MinIO’s High-Performance Object Storage

MinIO 的高性能对象存储是 AI 创新的关键,它为特征存储提供可扩展性和集成。其功能使无缝的 ML 工作流成为可能,增强了 AI 开发和部署的数据管理,影响了电子商务和医疗保健等行业。

阅读更多...

MinIO 企业缓存:分布式 DRAM 缓存,实现超高性能

Keith Pijanowski Keith Pijanowski on 企业对象存储 2024 年 3 月 12 日
MinIO Enterprise Cache: A Distributed DRAM Cache for Ultra-Performance

随着计算世界的不断发展和 DRAM 价格的不断下降,我们发现服务器配置通常配备 500GB 或更大的 DRAM。当您处理更大规模的部署时,即使是那些使用超密集 NVMe 驱动器的部署,服务器数量乘以这些服务器上的 DRAM 也可以迅速增加,通常达到数 TB。这种 DRAM

阅读更多...

动态 ETL 管道:使用 Unstructured-IO 将 Web 数据灌入 MinIO 和 Weaviate 以增强 AI

David Cannan David Cannan on AI/ML 2024 年 2 月 27 日
Dynamic ETL Pipeline: Hydrate AI with Web Data for MinIO and Weaviate using Unstructured-IO

Unstructured-IO、MinIO 和 Weaviate 重新定义了 ETL,将非结构化 Web 数据转化为可操作的见解。这种合作增强了数据管理,为动态数据转换和分析提供了一个强大的解决方案,标志着我们处理和利用 Web 生成内容的方式的飞跃。

阅读更多...

使用 MinIO SDK 为 LLM 工具使用开发 Langchain 代理

David Cannan David Cannan on AI/ML 2024 年 2 月 20 日
Developing Langchain Agents with the MinIO SDK for LLM Tool-Use

探索 Langchain 的 LLM 工具使用,并利用 Langgraph 监控 MinIO 的 S3 对象存储。本指南将指导您完成开发自定义对话式 AI 代理并创建功能强大的 OpenAI LLM 链,以实现高效的数据管理和增强的应用程序功能。

阅读更多...

使用 GitOps 自动化赋能 AI/ML 工作流

David Cannan David Cannan on AI/ML 2024 年 2 月 13 日
Powering AI/ML workflows with GitOps Automation

探索 GitOps、MinIO、Weaviate 和 Python 在 AI 开发中的融合,以实现无与伦比的自动化和创新。这种组合为创建可扩展、高效和自动化的 AI 解决方案提供了坚实的基础,使项目能够轻松地从概念过渡到现实。

阅读更多...

使用 MinIO 的 SDK 自动执行 ML 数据准备

Brenna Buuck Brenna Buuck Brenna Buuck on AI/ML 2024 年 2 月 8 日
Automated Data Prep for ML with MinIO's SDK

本教程将指导您构建边缘上的强大数据管道,确保灵活性和可扩展性。学习如何无缝创建、填充和转换数据集,同时优先考虑数据隐私。使用 MinIO 的 Python SDK 掌握自动化技巧。

阅读更多...

使用 MinIO S3 存储桶备份 Weaviate

David Cannan David Cannan on AI/ML 2024 年 2 月 6 日
Backing Up Weaviate with MinIO S3 Buckets

探索使用 Docker Compose 将 MinIO 与 Weaviate 集成,以增强 AI 的数据管理。学习将 Weaviate 备份到 MinIO S3 存储桶,使用实用的 Docker 和 Python 示例确保数据完整性和可扩展性。使用这种强大的设置简化您的 AI 驱动搜索和分析。

阅读更多...

SQL Server 2022 机器学习服务释放数据的价值

Matt Sarrel Matt Sarrel @msarrel Matt Sarrel on Integrations 2024年2月6日
SQL Server 2022 Machine Learning Services Unlock the Value of Your Data

了解如何在 SQL Server 2022 上运行 Python 存储过程。

阅读更多...

MinIO 和 Apache Tika:文本提取模式

Sidharth Rajaram Sidharth Rajaram @sidharrrrrth Sidharth Rajaram on AI/ML 2024年2月2日
MinIO and Apache Tika: A Pattern for Text Extraction

简而言之:在本文中,我们将使用 MinIO Bucket 通知和 Apache Tika 进行文档文本提取,这是大型语言模型 (LLM) 训练和检索增强生成 (RAG) 等关键下游任务的核心。前提假设我想要构建一个文本数据集,然后可以使用它来微调一个

阅读更多...

饥饿的 GPU 需要快速的对象存储

Keith Pijanowski Keith Pijanowski on AI/ML 2024年1月31日
Hungry GPUs Need Fast Object Storage

一条链条的强度取决于它最薄弱的环节——而您的 AI/ML 基础设施的速度仅取决于最慢的组件。如果您使用 GPU 训练机器学习模型,那么您的薄弱环节可能是您的存储解决方案。结果就是我所说的“饥饿的 GPU 问题”。饥饿的 GPU 问题出现在您的网络或您的

阅读更多...

为什么您的企业 AI 战略很可能在 2024 年失败:模型下降 vs. 数据上升

Jonathan Symonds Jonathan Symonds on AI/ML 2024年1月30日
Why Your Enterprise AI Strategy Is Likely to Fail in 2024: Model Down vs. Data Up

我怀疑有些人会指责我标题党。另一些人会说,这并不夸张——大多数人在最初的 AI 尝试中都会失败,但这并不重要,收获的经验教训是值得的。从某种程度上来说,这两种说法都是正确的——但我认为企业为什么会失败值得探讨,并且可能让

阅读更多...

创新 S3 存储桶检索:Langchain 社区 S3 加载器与 OpenAI API

David Cannan David Cannan on AI/ML 2024年1月30日
Innovating S3 Bucket Retrieval: Langchain Community S3 Loaders with OpenAI API

探索 MinIO、Langchain 和 OpenAI 在增强数据存储和处理方面的协同作用。本文说明了 MinIO 的集成如何使用 Langchain 和 OpenAI 的 GPT 有效地进行文档摘要,从而彻底改变 AI 和 ML 数据处理。

阅读更多...

模型之前的数据:解锁真实 AI 成果的无名英雄

Brenna Buuck Brenna Buuck Brenna Buuck on AI/ML 2024年1月29日
Data Before Models: The Unsung Heroes Who Unlock Real AI Results

探索数据工程师在释放 AI 真正力量方面的重要作用!数据工程师在清理和构建原始数据以实现 ML 成功方面拥有坚实的基础。了解他们为什么在数据基础设施、特征工程和管道优化方面的专业知识必不可少。

阅读更多...

LLM 的优势、弱点和危险

Sidharth Rajaram Sidharth Rajaram @sidharrrrrth Sidharth Rajaram Keith Pijanowski Keith Pijanowski on AI/ML 2024年1月25日
The Strengths, Weaknesses and Dangers of LLMs

最近关于大型语言模型 (LLM) 奇迹的言论很多。这些赞誉中的大多数是应得的。让 ChatGPT 描述广义相对论,你会得到一个非常好的(和准确的)答案。然而,归根结底,ChatGPT 仍然是一个计算机程序(所有其他 LLM 也是如此),它是在盲目地执行

阅读更多...

AI 的未来是开源

Brenna Buuck Brenna Buuck Brenna Buuck on Open Source 2024年1月15日
The Future of AI is Open-Source

探索 AI 在开源环境中的未来,挑战大型科技公司的隐秘努力。了解拥抱极端开放式创新如何促进协作、推动市场增长,并为开源 AI 数据堆栈奠定基础。

阅读更多...

LanceDB:您在对抗数据复杂性时的可靠战马

Brenna Buuck Brenna Buuck Brenna Buuck on Vector Database 2023年12月29日
LanceDB: Your Trusted Steed in the Joust Against Data Complexity

使用 LanceDB 抗衡数据复杂性,LanceDB 是一个闪电般快速的矢量数据库,针对开源 Lance 格式上的 AI/ML 进行了优化。与 MinIO 合作,它可以无缝扩展,提供高性能的云原生存储。深入教程,快速部署。

阅读更多...

使用 Ray Train、MLflow 和 MinIO 进行分布式训练和实验跟踪

Keith Pijanowski Keith Pijanowski on AI/ML 2023年12月28日
Distributed Training and Experiment Tracking with Ray Train, MLflow, and MinIO

在过去几个月里,我写了一些关于不同技术的文章(Ray Data、Ray Train 和 MLflow)。我认为将它们全部整合在一起并提供一个易于理解的配方来使用生产就绪的 MLOPs 工具进行分布式数据预处理和分布式训练以进行跟踪和模型服务是有意义的。本文整合了我提出的代码

阅读更多...

使用 Ray Train 和 MinIO 进行分布式训练

Keith Pijanowski Keith Pijanowski on AI/ML 2023年12月20日
Distributed Training with Ray Train and MinIO

大多数机器学习项目从单线程概念验证开始,其中每个任务都必须在下一个任务开始之前完成。下面描绘的单线程 ML 管道就是一个例子。但是,在某些时候,您将超出上面显示的管道的范围。这可能是由于数据集不再适合单个进程的内存导致的。

阅读更多...

树林中的森林——我们 AI 年的要点

Jonathan Symonds Jonathan Symonds on AI/ML 2023年12月20日
The Forest Amidst the Trees - The Takeaway from our AI Year

2023 年将是意义非凡的一年,也许是 AI 历史上的最意义非凡的一年。从本质上讲,这是大爆炸。它始于 2022 年底 OpenAI 的 ChatGPT,但令人叹为观止的是人们的反应。几个月内,我们有了 Meta 的 LLaMA 2、Google 的 Bard 聊天机器人

阅读更多...

从超大型企业学习:对象存储如何为下一波托管服务成功提供动力

Brenna Buuck Brenna Buuck Brenna Buuck on AI/ML 2023年12月19日
Lessons from the HyperScalers: How Object Storage Powers the Next Wave of Managed Services Success

对 ClickHouse Cloud 和 MotherDuck 等超快分析数据库的兴趣日益浓厚,突出了解耦存储和计算的好处。这种架构以 AI 应用程序为例,增强了可扩展性、速度和成本效益,并正在推动向对象存储的转变。

阅读更多...
较新的帖子
较旧的帖子
  • © 2014-2024 MinIO, Inc.
    法律 隐私政策 许可证合规性
    AICPA SOC 2 Certified
  • 公司
    关于 活动 职业 合作伙伴 标识
  • 联系
    • 275 Shoreline Dr, Ste 100,
      Redwood City, CA 94065,
      美国
  • 注册 MinIO 更新
加入我们 Slack 加入我们 Slack