1 月 18 日消息,中国电子云自研 CeaStor 海量分布式对象存储正式发布,主要面向海量非结构化数据场景,实现数据资产统一运营管理。
据 IDC 估计,到 2025 年电子邮件、视频、照片、网页、音频文件、传感器数据、网页等非结构化数据或将占全球所有数据的 80%。IT之家了解到,对象存储融合了块存储和文件存储的优点,拥有速度快、容量大等特性,适合处理大规模海量非结构化数据。
中国电子云 CeaStor 分布式对象存储基于云原生多协议一体化架构进行设计,在此架构之上,构建磐石引擎作为核心,在效率上领先传统分布式存储。
图:云原生多协议一体化架构
-
多协议存储服务:一套存储可同时提供块 / 文件 / 对象 / 大数据服务,满足各种协议需求。
-
声明式存储资源:块和文件存储资源服务通过定制化 CSI 驱动,以声明式方式无缝对接云原生应用。
-
各故障快速自愈:存储软件栈模块服务 POD 故障后,新服务 POD 自动快速拉起,实现故障快速自愈。
-
自动化部署运维:存储软件 PXE 一键式自动化部署,存储管理一键式自动化巡检并且自动化进行亚健康检测。
-
敏捷发布新特性:利用云原生特性,产品具备敏捷开发优势、用户具备快速升级能力、同时支持算子下推实现计算能力下沉。
图:磐石引擎架构
新架构支持全用户态设计,节省大量的处理器时间开销;CPU 资源无锁化,大大提升处理器的利用效率;独立协程模型,保障处理器不间断工作,任务切换时间降低至纳秒级;介质资源无锁化,去除锁机制干扰,避免资源争抢;大 IO 直通小 IO 聚合,大大提升随机小 IO 的性能;智能缓存预读,大大提升存储读性能。
中国电子云称 CeaStor 分布式对象存储还具备以下优势:
单桶对象无限
面对海量的电子票据影像、自动驾驶图片、卡口图片、电子卷宗等场景中,单一命名空间动辄百亿千亿级别的非结构化文件存储需求,CeaStor 分布式对象存储可实现单桶对象数量无限制。
CeaStor 分布式对象存储通过元数据索引动态分片方式,能够自动匹配负责支撑元数据的硬盘数量,解决传统对象存储由于元数据索引分片太少无法发挥全部硬盘能力,太多分片又导致对象列举效率低下的问题。当出现存储异常情况(如坏盘,死机重启,断网重连等),元数据索引分片所在的对象修复采用无锁化增量修复机制,可实现每一个索引分片所管辖的对象数量可以无限增加;结合新数据的多版本控制,可以做到数据修复的同时不影响新数据写入。
超大比例纠删
在大规模集群存储场景下,最大可支持“32+2”的大比例纠删,空间可用率高达 94% 以上,可以大大降低用户的投资成本。
全局生命周期管理
通过该特性用户可以自定义规则,指定对象文件的扫描前缀以及修改时间等属性,对桶内对象设置有效期限,超过该期限的对象将被自动删除或者自动搬迁至更廉价的存储介质,让不同活跃度的数据与不同类型的存储介质动态匹配或自动清除,实现数据更高效的全生命周期管理。以下是一些示例用例:
-
将超过 90 天的对象从 SSD 存储池降级至 HDD 存储池。
-
删除 2022 年 1 月 1 日之前创建的对象。
-
在启用版本控制的存储桶中仅保留每个对象的 3 个最新版本。
多租户资源管理
多租户特性提供基于租户粒度的统一资源管理,以租户为单位分配和管理资源,多个租户共享同一套物理存储系统,租户间资源隔离,确保安全性和隐私。在实际应用中,多租户技术的设计思想正是希望利用多租户模式带来资源的高度整合,从而提高资源利用率,降低组织的资源成本,同时又保障了资源的安全性。
业务负载均衡
不同业务客户端的应用,配置相同的域名,域名经过 DNS 解析后,会被解析为不同的 VIP,然后通过轮询或节点负载等策略将数据打散到对应 VIP 的存储节点上,从而实现业务的负载均衡。当出现某节点故障,该节点的 VIP 会漂移到其他健康节点上,该节点上的业务会快速切换到对应节点进行支撑。
中国电子云 CeaStor 分布式对象存储应用场景如下: