构建可扩展、数据主权的国家 ID 系统

一些慈善界最聪明的人士正在支持一个简单而强大的国家身份识别系统的概念。 比尔及梅琳达·盖茨基金会, 塔塔信托, 奥米迪亚网络 和 普拉蒂克沙信托 他们都参与了这场运动,因为该系统能够为各种社会项目提供基础功能。他们投入资金支持了一个 名为 MOSIP 的开源项目,它正在悄然改变非洲和亚洲的国家身份识别系统。
国家身份识别系统是一个集中式数据库,存储着有关一个国家所有公民和合法居民的信息。这些信息可能包括姓名、出生日期、地址、照片、指纹和其他生物识别数据。核心应用包括:
- 增强安全性:这些系统可以通过提供一种安全可靠的方式验证一个人的身份来帮助防止身份盗窃和欺诈。这对于许多目的非常重要,例如开立银行账户、申请工作或投票。
- 提高效率:国家身份识别系统可以通过让公民和合法居民更容易获得政府服务来帮助简化政府服务。例如,国家身份识别卡可以在申请驾照、护照或其他政府证件时用来验证一个人的身份。
- 鼓励金融包容:国家身份识别系统可以通过让以前被排除在正规金融体系之外的人更容易获得金融服务来帮助提高金融服务的可及性。这是因为,即使一个人没有其他文件,例如出生证明或结婚证明,国家身份识别卡也可以用来开立银行账户或获得贷款。
- 改善医疗保健服务:国家身份识别系统可以通过让民众更容易在医生或医院登记,从而帮助改善医疗保健服务的可及性。这对于经常搬迁或没有其他文件(例如永久地址)的人来说很重要。
还有其他辅助益处。其中包括减少腐败(通过减少身份欺诈),通过获得金融体系和减少摩擦/增加社会凝聚力来促进经济增长。
MOSIP 显然可以在绿地模式下运行,在这种模式下,该程序是从头开始构建的,并且每个开源模块都被定制 - 从预注册到签发和验证。MOSIP 还在棕地模式下运行,在这种模式下,开源模块与现有的数据库或身份识别系统集成在一起。
从本质上讲,这是一个技术问题,MinIO 深度嵌入其中。事实上,MOSIP 最终推荐了两种部署选项 - MinIO 用于将数据保存在其边界的国家,以及当允许将数据移出国家并进入云时使用的 AWS。
我们希望记录这种架构是如何组合在一起的,以及为什么基于 MinIO 的数据主权方法很重要。
在考虑能够处理国家身份识别程序的存储平台时,以下方面很重要:
强大的安全性
从本质上讲,国家身份识别程序存储着最敏感的数据 - 包括个人数据、图像和生物识别数据在内的可识别个人身份的信息。在处理此类数据时,需要 最高级别的數據安全。MinIO 提供企业级加密,用于使用 TLS 对数据进行传输中加密,以及使用存储在外部密钥管理系统中的外部密钥对数据进行静止加密。
MinIO 支持群集中的所有组件之间的传输层安全 (TLS) v1.2+。这种方法确保了群集间或群集内加密流量中没有薄弱环节。TLS 是一种无处不在的加密框架:它是在 https 中添加“s”的原因,也是银行、电子商务网站和其他依赖数据存储加密的企业级系统所使用的相同加密协议。
MinIO 的最先进加密方案支持使用现代的行业标准加密算法(例如 AES-256-GCM、ChaCha20-Poly1305 和 AES-CBC)进行细粒度的对象级加密。MinIO 与 S3 加密语义完全兼容,并且还通过支持非 AWS 密钥管理服务(例如 Hashicorp Vault、Gemalto KeySecure 和 Google Secrets Manager)扩展了 S3。
易于扩展的容量
随着时间的推移,人口往往会增长,每个 ID 存储的数据类型和数量也可能随着时间的推移而增长。通常,MOSIP 部署从几百万个 ID 开始,然后增长到数亿个。对于国家身份识别程序等部署来说,容量以及轻松扩展容量的能力至关重要。MinIO 的 擦除编码 提供了非常高效的存储,并能够在丢失驱动器和节点的情况下存活下来。通过使用 服务器池 可以轻松扩展容量。服务器池消除了对数据重新平衡的需要 - 这种传统的做法既昂贵又耗时。在池中进行扩展允许根据需要从 TB 级增长到 PB 级。
一致的高吞吐量性能
随着 ID 数量的增长以及每个 ID 数据量的增长,吞吐量对于成功的国家级程序来说至关重要,以确保快速的用戶體驗。ID 的数据结构由大量数据项组成。MinIO 是一个为这些类型的负载而设计的高性能对象存储系统。在 32 个节点上正确部署时,MinIO 可以提供超过 320 GiB/秒的持续读取吞吐量。
用于 BC/DR 的实时复制
大规模复制是跨站点提供数据弹性的唯一合理方法。例如,在缓慢的网络上备份或恢复少量数据(例如 10TiB)所需的时间对于几乎所有用例来说都是不可接受的,对于需要全天候可用的政府 ID 系统来说更是不可接受的。对象存储的活动-活动复制是关键任务生产环境的关键要求。MinIO 是唯一一家提供同步的对象级复制到多个站点的供应商,今天就是这样。
高效且经济高效的部署和增长
每个 ID 需要的存储量会随着部署的 MOSIP 模块、存储的数据类型、图像的分辨率以及生物识别数据项而变化。有关更准确的 存储需求预测,请咨询 MOSIP。也就是说,当部署从几百万个 ID 开始时,所需的数据存储量通常约为 10TiB。当它增长到 1 亿个 ID 时,存储需求可能约为 1PiB,并且吞吐量需求也按比例增长。一个 典型的 MinIO 初始部署(能够处理几百万个 ID)将由 4 个节点组成,每个节点有 4 个驱动器。
MinIO 运行在 通用硬件 上,因此任何供应商都可以。例如,以下是来自 Supermicro 的一个 4 节点 2U 设备(在单个 2U 机箱中拥有 4 个独立的 CPU、RAM 和驱动器集),它使部署变得容易。该设备支持每个 CPU 在机箱中最多有 6 个磁盘,总共 24 个驱动器。使用这样的硬件,可以使用 MinIO 轻松且经济高效地部署企业级对象存储,以支持 MOSIP。
Supermicro GrandTwin™ SuperServer 和 MinIO
Supermicro GrandTwin™ SuperServer SYS-211GT-HNTR 2U 服务器机箱 是一个密集的机架优化平台,用于部署 MinIO 对象存储。
随着 MOSIP 部署的增长,可以添加额外的单元来扩展 MinIO 存储容量。在 3 个机架中部署上述 Supermicro 单元中的 3 个,将为超过 3PiB 的存储提供极快的數據访问速度。MinIO 是有弹性的,擦除编码 将允许丢失 96 个驱动器、4 个服务器或 1 个机架,同时仍然保持完整的功能。
将国家身份识别程序变为现实
随着国家身份识别系统为了上面概述的所有益处而不断普及,以及它们存储的数据量不断增长,政府有责任将这些数据安全地存储在安全、经济高效、快速可扩展且高性能的对象存储中。
在国家身份识别系统方面,政府和非政府组织不能冒风险,因为公民数据太宝贵、太敏感,不能丢失。实施基于企业级对象存储系统(如 MinIO)的国家身份识别系统(如 MOSIP)可以保证部署成功以及整个项目的成功。
MinIO 始终乐于接听您的电话,讨论您的对象存储需求、增长路径,并与您的硬件供应商合作,确保正确部署对象存储。请通过 Slack 或发送电子邮件至 hello@min.io 与我们联系。