随着另一届 Strata 大会落下帷幕,是时候回顾一下我们在这一周中所见所闻了。Strata 目前显然已经成为了一场数据科学盛会,但数据科学是一个广泛的主题。作为高性能对象存储的提供商,我们的视角也因此而定,我们更关注数据栈本身,而不是单个算法。
以下是来自数据领域盛会的五个关键 takeaways
- Cloudera 可能会声称 Hadoop 并没有死,但他们的产品路线图却暗示着相反的情况。哲学立场已经让位于务实立场——Cloudera 正在抛弃与存储和计算共置相关的包袱,以及其他遗留实现,例如 YARN。虽然这值得称赞,但可能为时已晚。在与大型企业的每次谈话中,使用对象存储替换 Hadoop 的可行性都是其中的一部分。MapR 也无济于事——那些客户正像他们剩余的员工一样迅速地离开。
- 人们仍在逐渐了解与超高性能对象存储相关的可能性。当数据团队第一次看到 我们 NVMe 的性能数据 时,他们都感到震惊。能够在读写操作中达到 ~40GB/s 的速度是一个真正的游戏规则改变者——它将 Spark、Presto、TensorFlow 和 H2O.ai 带入了对象存储领域。这以前从未实现过——不是因为人们不想要,而是因为使用传统的、面向设备的对象存储无法做到这一点。
- Kubernetes 已经胜出。每个人都在谈论引入、集成或操作这种变革性方法。如果你没有这样做——那是因为你做不到,这意味着你已经过时了。虽然 Kubernetes 吸引了所有的关注,但事实是,微服务栈的快速发展同样重要,甚至更加重要。在 Kubernetes 对象存储领域,有四大主要参与者:亚马逊、谷歌、微软和 MinIO。 问问 VMware 就知道了。
- Presto 正在崛起。虽然 Spark 仍然是领先的数据处理框架,但越来越多的与会者正在谈论并询问 Presto,因为它在 SQL 查询方面的速度。这是由于 SQL 仍然是数据科学的通用语言,并且其受欢迎程度正在复苏。这对其他面向 MPP 的方法(如 Vertica、Greenplum、Teradata 和 Splunk)来说是个好兆头,因为它们都利用了 SQL。
- 开源在企业中是一个巨大的优势。这与成本(总成本或其他成本)无关,而与规模和弹性有关。强大的开源软件项目拥有极大的覆盖面,这意味着它们在部署方面得到了强化——从规模到安全性。我们荣幸地获得了 最具影响力的开源项目 奖项——因为有如此多的不同项目参与评选。这说明了我们的规模、我们的社区以及人们越来越认识到最好的软件确实是开放的——而不是伪装的专有许可证。
对于我们公司来说,这些都是激动人心的时刻,我们在 Strata 大会上受到的欢迎真正突显了这一点。与我们互动的人数和公司数量比旧金山时增加了许多,而且在我们非科学的估计中,已经在使用 MinIO 的公司数量至少提高了 50%。
如果你还没有加入这场运动——现在就加入吧。您可以 下载代码,加入我们的 Slack 频道,或者直接通过 hello@min.io 与我们联系。在高性能、私有云对象存储方面,我们志在必得,这意味着要让你取得成功,所以不要犹豫,在我们构建你的私有云时与我们互动。