使用 Apache Arrow 和 MinIO 构建高性能数据基础设施

Building Performant Data Infrastructure with Apache Arrow and MinIO

如今,Apache Arrow 发展势头强劲。它是开发人员和数据从业人员的最爱,其在业务关键型应用程序中的使用大幅增长,Dremio、InfluxData、Snowflake、Streamlit 和 Tellius 等数据驱动型组织都对其投入巨资。推动这种采用的因素是卓越的互操作性、更简单的数据架构、更高的速度和效率、更多的工具选择

阅读更多...

Cassandra的问题:为什么它不适合用作对象存储的元数据数据库

The Trouble With Cassandra: Why It's a Poor Choice For a Metadata Database for Object Stores

Cassandra是一款流行且经过验证的NoSQL数据库,支持键值宽列表。像任何强大的工具一样,Cassandra也有其理想的用例——特别是,Cassandra擅长支持写入密集型工作负载,而在支持读取密集型工作负载时存在局限性。Cassandra的最终一致性模型以及缺乏事务、多表支持(如联接、子查询)也会限制其实用性。然而,使用

阅读更多...

为什么小对象如此重要

Why Small Objects Are Such a Big Deal

在过去十年左右的时间里,对象存储的用例已经发生了很大变化,它们取代了传统的文件和块用例。特别是,处理小型数据对象的需求变得越来越普遍。没错,仍然存在大量的大对象,但对于特定工作负载和应用程序环境来说,小对象正变得比大对象更普遍。传统的对象存储

阅读更多...

五个Strata要点

Five Strata Takeaways

随着另一场Strata落下帷幕,是时候回顾一下我们在本周看到了什么,听到了什么。Strata现在显然是一个数据科学展,但数据科学是一个广泛的主题。我们作为高性能对象存储提供商的视角因此得到了相应的构建,我们更多地关注数据栈,而不是

阅读更多...