【云宏大讲坛】浅谈分布式存储系统架构设计

2018-05-09

分布式存储系统,本质是将数据分散存储在多台独立的x86设备上。传统的网络存储系统通常采用集中的存储服务器存放数据,存储服务器很容易成为系统性能的瓶颈,也容易成为可靠性和安全性的瓶颈。分布式存储系统采用可扩展的系统结构,利用多台x86服务器分担存储负荷,利用位置服务器定位存储信息,不但提高了系统的可靠性、可用性和存储读写效率,还易于扩展。

传统架构VS分布式架构
 
 

分布式存储系统架构设计核心原则
 
 
1.分布式、无共享架构
 
采用基于策略的分布式哈希表数据路由算法,使得客户端无需查找元数据节点,通过计算就能直接寻址到数据所在的存储节点,大大缩短了数据IO访问路径,提升了系统性能。
同时,整个系统也无集中管理和控制节点,每一个数据节点都有能力承担另一数据节点的功能,节点之间通过内部高效的分布式协议完成相互协作和通信。这种去中心化、无状态的全分布式数据处理架构是系统实现水平、线性扩展能力的关键,有力确保整个系统无单点故障,无性能瓶颈。
 
 
2.全冗余可靠性设计
 
实际硬件环境中,磁盘可能损坏,服务器可能宕机,网络可能失效……为处理这些不可预期的硬件故障,保证数据的完整性和业务的可用性,需要通过全冗余设计等一系列软件层面的设计,来弥补硬件不可靠带来的数据可靠性和可用性问题。
分布式存储采用了多副本冗余机制,基于策略配置,实现数据及其副本跨硬盘、跨存储节点、跨机架的存储,并通过强一致性复制技术确保各个数据副本的一致性,这样即便一个数据服务器甚至整个机架停机也完全不影响数据可靠性和可用性。
 
 
3.块存储优化
 
分布式存储的架构和数据路径完全为一个块存储系统而设计和优化,拥有如下特性:读写操作流程都非常简单,以尽可能少占用资源;采用强一致性复制协议保证数据多副本的完整性和一致性;充分利用SSD的高性能特点,通过智能缓存算法,将热数据缓存到快速的SSD中,以应对随机 I/O 访问;除了支持私有客户端访问接口,也支持业界标准的iSCSI和SCSI块访问接口,使得应用可以无缝切换到分布式存储系统。
 
 
4.自动化管理运维
 
分布式存储设计的另一大目标就是简化数据中心存储系统的运维,从安装部署、日常维护、故障恢复等都力争做到全自动化。分布式存储集群做到了设备自动发现、自动安装,只需简单配置IP地址等网络信息就能在20分钟内完成整个系统的安装部署;当硬盘损坏,数据可靠性降低时,会触发自动修复功能,将数据快速复制到正常的节点,整个过程无需人工参与。分布式存储做到了全自动化扩容,自动发现和添加新增节点,自动数据复制,自动负载均衡;提供了Web可视化管理和监控功能,可以采集和监控当前系统的容量、性能等多维度指标,并设置多种预警方式,第一时间通知管理员。
 
 
 
其他新闻动态

版权所有©云宏信息科技股份有限公司   粤ICP备10104379号-1