推出 SUBNET 健康

Introducing SUBNET Health

SUBNET是MinIO的商业引擎。它是生产环境中MinIO实例的使用方式,从初创公司到全球最有价值的技术公司都在使用它。

SUBNET将商业许可证(对于AGPLv3义务非常重要)与独特的支持模型相结合,通过MinIO构建的平台提供全天候的工程师直连支持,将Slack和Zendesk的优势融合到一个解决问题的机器中。还有许多其他功能,包括安全和架构审查、访问紧急按钮和赔偿,但核心功能是将我们的专业知识传递给我们的客户,以提供大型数据基础设施解决方案。

SUBNET之所以具有颠覆性,是因为我们对简单性的痴迷。软件的简单性。方法的简单性(我们只做一件事,对象存储)。这些因素共同创造了一个易于支持的产品。

此外,还有自动化。大量的自动化。

这就是这篇文章的主题。自动化。

作为软件的可支持性

我们在SUBNET中的最新功能是SUBNET Health,它完全围绕自动化可维护性。SUBNET Health提供了一个图形用户界面来访问关键的可支持性组件,同时自动对您的MinIO实例运行数十项检查,以确保其以最佳状态运行。



它从一个简单的命令开始:mc admin subnet health TARGET

这反过来会从您的实例创建JSON文件(稍后在讨论隔离环境时会详细介绍)。然后,您将此文件上传到SUBNET,瞧!您就看到了上面的内容。

让我们来讨论一下我们在这里看到的内容,并将其分解成几个部分。

首先,此报告实际上是对分布式系统的比较分析。SUBNET Health对从硬件到软件的每个组件进行编目,以确保任何给定池中的组件一致性,并标记存在差异的实例。以前,这意味着编写一个脚本并对每个节点运行该脚本。仅此一项,此自动化功能就节省了大量时间。生成的报告可以细分为三个主要类别

硬件

在硬件测试中,MinIO正在寻找服务器池内的一致性。在MinIO架构中,服务器池是一组具有独立计算、网络和存储资源的节点。可以将其视为一个集群本身。集群/池之间可能存在异构性,但MinIO需要池内存在同构性。因此,MinIO检查每个池的

  • CPU标志
  • CPU匹配
  • 驱动器匹配
  • 驱动器使用率
  • 驱动器吞吐量
  • 存储控制器吞吐量
  • 内存大小

让我们以驱动器匹配为例。这很重要,因为如果您在同一个池中拥有六个500GB驱动器和四个1TB驱动器,那么1TB驱动器将被欠利用。了解这一点将使您能够快速地将这些1TB驱动器重新分配到其自己的池中,从而优化整个实例。

软件

软件检查代表了IT人员固有擅长的内容(CPU、网络、驱动器)与开发人员固有擅长的内容(版本、配置)之间的微妙桥梁。以下健康检查属于此类别

  • MinIO版本
  • 操作系统匹配
  • 文件系统Atime
  • 服务器进程
  • 文件系统匹配
  • 文件系统支持
  • 交换内存

让我们以文件系统Atime为例。这是另一个经验告诉我们需要注意的领域,但很少被我们的企业客户放在心上。这有效地确保了,出于性能原因,您没有选择记录对每个文件的每次访问(文件系统性能的一个经常被忽视的可调参数),而是记录对业务重要的元素。

基准测试

基准测试并非深度测试,而是细粒度测试。它们旨在标记经常被忽视但可能产生影响的问题。这些问题通常表现为瓶颈,除非您将它们放在眼前,否则您根本不知道它们的存在——因为同样,没有人会去检查这些问题。

  • 驱动器延迟
  • 存储控制器延迟
  • 网络链路延迟
  • 网络链路吞吐量
  • 网络交换机吞吐量

虽然我们刚刚介绍了检查内容,但花点时间了解仪表盘也很有价值。在SUBNET Health中,您可以轻松查看所有实例的关键要素


此外,您可以深入了解任何单个实例以查看更多详细信息

详细版本提供了对该实例配置文件的完整视图,包括

  • 利用率
  • 服务器数量
  • 每个服务器的驱动器数量
  • 每个服务器的CPU数量
  • 每个服务器的内存
  • 对象
  • 文件系统吞吐量和延迟
  • HTTPS吞吐量

触手可及地拥有这些信息,对于管理员和开发人员来说都是巨大的时间节省。

隔离环境

SUBNET Health的一个巧妙之处在于,它既是可选的,也完美适用于隔离环境。许多生产实例,不仅仅是国防和情报部门的实例,没有连接到网络。出于各种原因,这是有道理的,SUBNET Health通过将JSON文件的创建与诊断过程分开来满足这些需求。这样,就可以在不与系统上的数据交互的情况下创建有关系统的信息。然后可以独立地将该文件上传到SUBNET。无需连接即可获得完整的诊断信息。

所以呢。

那么,这对我们的用户有什么意义?为什么现在很重要?答案在于MinIO在过去一年多的时间里商业加速发展。在此期间,我们见证了企业采用率的飞速增长。我们在超过60%的财富500强企业中都有使用。从ABSA到Ziraat Banksai,几乎所有主要的金融机构都在某种程度上运行着MinIO。

随着采用率的提高,MinIO的用户群体也变得更加广泛,所承担的风险也更高。虽然MinIO的简单性、云原生特性和性能推动了大部分采用,但我们需要将我们的可维护性提升到另一个水平。

SUBNET Health使我们的客户和我们能够比以往更快地找到根本原因。它全面。它是自动化的,并且具有很强的描述性(有一个高级功能部分,超出了本文的范围)。

“所以呢”的意思是,当我们遇到问题时(请参阅我们的技术领域日演示文稿以了解相关统计数据),我们能够快速解决问题。不是几天解决,而是几分钟解决。

您可以在命令行中获取这些数据,但这种方法的实用性和速度受到挑战。

我们鼓励您查看SUBNET的简短介绍。如果您有任何疑问,请在我们的咨询专家聊天中与我们联系,该聊天由真实的人员以及非常聪明的人员提供支持。