2023 年博客回顾:十大热门文章

The Blog Year in Review: Top 10 for 2023

2023年只剩下几天了(还有谁不敢相信?),我们花了一些时间回顾这一年,真是太棒了。 亮点太多了。无论是众多奖项、会议,还是与这么多人见面,我们都心怀感激!

MinIO 最重要的部分是我们的社区,因此,我们自然密切关注大家喜欢的东西。以下是 2023 年十大热门文章的细分,从第 10 名开始,一直到第一名。

#10 - 将 MinIO 用作 Elasticsearch 冷存储层

我们从将 MinIO 和 Elasticsearch 结合起来,使故障排除和日志分析更快、更轻松地开始倒计时。通过利用 MinIO 作为冷存储层后端,您可以在部署中实现云无关性。AJ 为您提供了所有需要了解的信息。(顺便说一句:您会看到他的名字在这份清单中反复出现。加油,AJ。)

#9 - 更多 MinIO 数据选项 - MinIO FTP/SFTP 服务器

我们已经看到了 FTP 这些年来是如何发展演变的,同时它仍然是用于通过互联网传输文件的广泛使用的协议。虽然 S3 API 从根本上来说更优越,但它缺乏 FTP/SFTP 的简单性和在高度受限的环境中运行的能力。因此,MinIO 已在 MinIO 服务器中添加了对 FTP 和 SFTP 的支持。感谢 Harshavardhana 提供的信息。

#8 - 架构师指南:数据和文件格式

Raghav Karnam 涵盖了现代数据栈以及在数据和文件格式方面您的选择。MinIO 支持所有这些格式,让您和您的云架构师来决定使用哪种格式。

#7 - 使用 MLFlow 和 MinIO 设置开发机器

对于 AI 和 ML 来说,今年是蓬勃发展的一年,感谢我们优秀的主题专家 Keith Pijanowski,我们掌握了所有来龙去脉。我们的受众非常喜欢我们关于 MLflow 的系列文章——它从这里开始。

#6 - GitLab 和 MinIO:实现大规模 DevOps

开发人员喜欢 MinIO,也喜欢 GitLab。MinIO 可以轻松配置为基本安装,作为 GitLab Runner 的共享缓存。这确保在多个作业并发运行时可靠地使用缓存。我们相信,任何运行自托管 GitLab 安装的人都会从添加 MinIO 中受益。

#5 - 数据迁移工具:助您轻松接入 MinIO

MinIO 可以在任何地方运行——裸机、Kubernetes、Docker、Linux 等等。组织选择运行 MinIO 以在其任何平台上托管其数据,并且越来越多地依赖多个平台来满足多个需求。AJ 回顾了一些可用于将数据导入 MinIO 集群的工具,这些工具可以将其公开给云原生 AI/ML 和分析包。

#4 - 为什么不应该在 SAN/NAS 设备上运行 MinIO(以及一个例外)

MinIO 以其极简主义方法而闻名,优先考虑简单性和自动化。我们体现了拥有恰到好处的东西的概念。添加一个功能,它就会变成杂乱或多余;删除某些东西,它就会有缺失的感觉。在 SAN/NAS 上运行 MinIO 等同于添加不需要的东西。是的,您可以这样做,但最终会在多个层面上受到影响,多个系统执行冗余操作。从 Eco 处获取完整信息。

#3 - 将 Apache Airflow 与 MinIO 结合使用

由于其卓越的性能和可扩展性,MinIO 是 Airflow 的完美搭档,能够轻松处理任何数据密集型工作负载。AJ 带您了解这对动态组合的多个用例。

#2 - Spark、MinIO 和 Kubernetes

Apache Spark 和 MinIO 在数据湖和分析方面表现出色。在 Kubernetes 上运行 Spark 提供了卓越的资源管理和可扩展性。结合高性能、可扩展的 MinIO,它支持跨各种平台(如公有/私有云、数据中心和边缘)的 Spark 工作负载,并支持您选择的 Kubernetes 设置。Dileeshvar Radhakrishnan 为您提供试驾体验。

#1 - 使用 Spark 管理 Iceberg 表

隆重登场……我们已经到达第一名了!它是“使用 Spark 管理 Iceberg 表”,这是上一篇文章的后续内容。Dil 通过构建可扩展的高性能数据湖的这种强大的技术组合,保持冷静。你们非常喜欢它。可以肯定地说,我们将向您提供更多此类内容。

呼……我们做到了。感谢 MinIO 社区,没有你们,我们无法做到。感谢你们让 2023 年成为不可思议的一年。我们期待着 2024 年以及更多美好的未来。