
要说近几年存储这条街 靓的仔,莫过于分布式存储了。
自诞生以来,分布式存储就被视为存储的未来,被万众期待。然而分布式存储起步于寒门, 早应用于互联网日志、企业备份归档、开发测试等场景,追求极致成本,性能和可靠性却不敢恭维。但它还算争气,凭借多年的打怪练级,越来越多地开始承载自动驾驶研发、超高清编辑、运营商5G网络云等企业的关键业务,走上变成高富帅、赢取白富美的道路。
正所谓人红是非多,存储领域也是一样,坊间一直流传着关于分布式存储的各种流言蜚语。好事的笔者今天就来探寻一番,揭开谎言背后的真相。
谎言一:分布式存储就是软件+服务器
目测分布式存储领域有两个派系,一派是SDS(软件定义存储),一派是软硬一体。前者以vSAN、Ceph为代表,以软件厂商为主在推广。分布式存储软件+通用服务器组合,打着重定义存储市场的旗帜,颇有“有王侯将相宁有种乎”的气势;另一派是老牌存储玩家的产品,他们以软硬一体为主,如Isilon、HCP等。
楚河汉界已然形成,未来谁主沉浮?
谁主沉浮很难判断,不过我们不妨从产业动态窥见一斑。虽然用过的客户都诟病分布式存储软件+服务器的方式存在各种兼容性、可靠性、可维护性的问题,但笔者认为SDS这种模式会长期存在,尤其是在传统的低端领域,如备份归档、开发测试环境。而越往高端走,软硬一体越是占据主流。业界主流厂商也在持续推出软硬一体的产品:
•国外,DELL&EMC的PowerScale(Isilon)、DDN的EXAScaler等产品;
•国内XSKY、浪潮等Ceph系开源厂商也推出了软硬件一体产品如XScaler Express。尤其有趣的是XSKY,这可是国内Ceph系软件定义存储的旗帜啊,你品,你细品。
另一方面,笔者也注意到近些年运营商开展了大规模的分布式存储集采,有文件的有块的。以中国移动2019~2020年分布式块存储集采为例,3个标段中2个为软硬一体采购,占比超过了90%;电信集团2020年集采也放弃了分布式存储纯软件采购,首次全面转向软硬一体。从这个角度看,用户在尝试了多种采购模式之后,也开始逐步转变到软硬一体的道路上来,尤其是大型用户。
#真相#:分布式存储诞生初期主要是纯软形态,近十年来,随着分布式存储逐步进入企业市场,软硬一体的形成已经成为主流。
谎言二:分布式存储就是低价值存储
如文章开头讲到的,分布式存储早期主要用于互联网日志、企业备份归档、开发测试等场景,这些场景无疑是低价值场景,成本是 一诉求甚至唯一诉求。
然此一时彼一时,士别三日也当刮目相看。
首先是分布式存储产品能力已今非昔比,逐渐具备了承载企业高价值业务的关键能力,例如毫秒级时延、TB/s级带宽、双活/3DC业务级容灾、端到端DIF等,无论是结构化数据还是非结构化数据的承载,功能完备性的 大短板早已补齐。
其次,分布式存储已走入众多高价值关键业务,如运营商BOM业务、金融渠道类业务以及超算、油藏探测HPC等高价值业务,通过大规模应用实践来检验成色。(小道消息,某些高价值场景全闪出货价达到1000美金/TB以上啦)
看完当下还要看看未来,笔者认为未来高价值的非结构化数据场景,分布式存储的版图还会持续扩展。如自动驾驶训练、4K/8K超高清、5G日志留存等场景,对多协议访问、极致带宽、扩展性诉求强烈,分布式存储已然成为这些未来业务的首选架构。
#真相#:分布式存储早期主要用在备份归档等低价值、强成本诉求的场景,如今随着企业级能力的提升,分布式存储也逐步成为企业生产系统的承载平台,尤其是面向海量非结构数据场景,全面支撑文件资源池和HPC等高价值场景。
谎言三:开源架构是分布式存储的未来
笔者对开源从来是持开放、支持的态度,正是因为开源的存在,IT产业才能有今天的缤纷色彩;也正是因为开源,存储这个高大上的产品,才走进了更多的寻常百姓家。
但如果说存储的未来在开源,我不敢苟同。
开源分布式存储软件的出现,一定程度上降低了存储的门槛,小公司可快速包装出存储产品,带动服务器销售。但产品同质化问题是所有开源不得不面临的问题,由于架构限制,很难在不动架构的情况下,真正做出差异化竞争力。互联网类公司、部分科研机构,以及有技术情结和充足资金投入的客户可能选择开源,而对于金融、电信运营商、大企业商用HPC、政府等对可靠性、性能、安全合规有要求的企业,开源从来不是 一选择,因为数据太重要了。(听说,国内某知名银行曾经投入500人基于开源软件搭建分布式存储,投入巨大且无法达银行业务对性能、可靠性、易运维诉求, 终于2年后放弃。)
版权声明:本文为原创文章,版权归 头条123 所有,欢迎 本文,转载请保留出处!