从 HDFS 迁移数据到 MinIO
将数据从 HDFS 迁移到 MinIO,并享受云原生架构带来的优势。
阅读更多...将数据从 HDFS 迁移到 MinIO,并享受云原生架构带来的优势。
阅读更多...在最近几个月,推动在 Kubernetes 中标准化对象存储的趋势获得了显著的势头。名为 COSI 的新标准(容器对象存储接口)与 CSI(一种用于在 Kubernetes 中使用存储的知名标准)具有异曲同工之妙。在本文中,我将深入探讨 COSI、其架构以及它如何与 CSI 相结合。最后,我将
阅读更多...在本世纪初,世界上总的数据量加起来为 2 ZB。如今已增长到 59 ZB。在短短 10 年内,增长了 30 倍。非结构化数据今天存在的大多数数据都是照片、视频或某种类型的点时间事件。这些类型的数据没有
阅读更多...正如我们在之前的基准测试中反复证明的那样,MinIO 提供了同类最佳的性能 [https://min-io.cn/resources/#benchmarks]。在这些基准测试中,我们选择了最高端的硬件,并衡量了 MinIO 是否能够榨干其所有资源。这证明了两个关键点:1. 确保 MinIO 利用了可用的最大 CPU、网络和存储资源。2.
阅读更多...MinIO 速度很快,这已经不是什么秘密了。我们定期发布我们的基准测试,并与 HDFS [https://blog.min-io.cn/hdfsbenchmark/] 和 AWS(Spark [https://blog.min-io.cn/benchmarking-apache-spark-vs-aws-s3/] + Presto [https://blog.min-io.cn/running-presto-on-minio-benchmarking-vs-aws-s3/]) 进行了对比,此外还有我们的 HDD [https://blog.min-io.cn/s3-benchmark-using-hdd/] 和 NVMe [https://blog.min-io.cn/s3-benchmark-minio-on-nvme/] 数据。
阅读更多...很少有人会反驳 Hadoop HDFS 正在衰落的说法。事实上,Hadoop 生态系统中的 HDFS 部分不仅仅是衰落 - 它正在自由落体。在其诞生之初,它作为一种高吞吐量、容错的分布式文件系统发挥了重要作用。秘诀在于数据本地性。通过共同定位
阅读更多...Apache Spark是一个分布式计算框架。它提供了一种最佳机制,用于在集群中的多台机器之间分发数据并在其上执行计算。Spark 通过构建称为 RDD(弹性分布式数据集)的数据结构来实现这一点。RDD 允许将数据分解成不同的块,并独立地对其进行处理。各个块可以
阅读更多...Presto 在企业中的增长与其速度、SQL 兼容性、可扩展性和企业功能集相关。虽然最初旨在加速 Hadoop,但该项目的成功已导致更广泛的采用——在 S3、Cassandra、MySQL 等上。Presto 允许跨越数据存储和位置的数据查询——一大优势
阅读更多...编写良好的软件就是快速的软件。MinIO 在构思之初就从头开始设计,使其简单、可扩展(因为简单的东西更容易扩展)且快速。简单性和可扩展性有其自身的主观和客观衡量标准——但快速通常是一个数字游戏。当您将编写良好的、快速的软件与快速的硬件配对时,
阅读更多...高性能对象存储是当今企业中最热门的话题之一。一方面,对象存储已成为企业存储策略(公有或私有云)不可或缺的一部分——在以 TB 或 PB 为单位衡量时,承担着企业绝大多数的负担。另一方面,对象存储传统上服务于
阅读更多...