现在的位置: 首页 > 自动控制 > 工业·编程 > 正文

任宇翔:如何用闪存介质实现一个全新的存储架构

2015-10-19 20:54 工业·编程 ⁄ 共 2977字 ⁄ 字号 暂无评论

IT产业链中,对每一环的安全与可靠性要求并不一致,网络出错可以重发,而存储不可靠,则将对用户造成毁灭性的打击,这种风险与压力,行业之外的人鲜有体会。存储厂商往往并不愿冒风险,在新技术的采用上普遍趋于保守。从某种角度看,存储是整个IT产业链中最薄弱的一环——相比CPU、内存、网络,以及软件技术的突飞猛进,存储的密度和性能虽有提高,但受介质与机械的制约严重。XtremIO工程师思考的是,如何用闪存介质,实现一个全新的存储架构。

2009年,XtremIO在以色列特拉维夫近郊,高科技公司聚集的小城Herzliya创立。“创始人之一,加州理工学院教授Shuki Bruck是我的老朋友。他告诉我,这家公司正在寻找一位美国CTO,于是我飞去以色列。”任宇翔回忆起他与XtremIO缘分的开始。以色列是个地域狭小的国度,虽然创业公司众多,却难把握全球市场的需求,在它们当中有一条默认规则——在美国找到第一名员工,将成为转折点。

没有标准答案的试卷

这是一次双方面试,“我的优势是曾在EMC工作,对高端存储市场有切身了解,也熟悉硅谷生态环境。而当时XtremIO团队只有几个人,产品还只存在于草图与大家的脑海中,彼时的闪存技术未臻成熟,市场是个未知数。尚没有人出题,但你需要找到最好的答案。”任宇翔说,他对这里的技术感兴趣,也信任每个人,他们聪明、友好,相互尊重——这种氛围在创业团队中很重要,因为在小团队中,每个人好似家庭的一员,不可取代,如果无法担负自己的责任,就会影响整支团队。

“对我来说,在初创公司担任CTO,是个不小的挑战。我向前辈学习,也在工作中不断总结。”任宇翔说,那时最大的挑战是怎样说服投资人,说服潜在的合作伙伴。而说服投资人之前,先要说服自己,克服内心的恐惧与不确定性,它值得自己放弃大公司稳定的工作,付出几年的宝贵时光。

“还记得Shuki与我长谈的那个下午,在加州理工学院校园里我们漫步了许多个来回。最后坐下来,他对我说,‘创业公司,就像你与你的背包。’”Shuki告诉任宇翔不要顾虑,放手做自己想做的事,并把它当成自己的唯一依靠。“有能力创新者多,具备勇气者寡,技术人往往从心底希望能做一番大事业,征服前人未曾解决的问题,但往往夹杂着太多顾虑。”任宇翔觉得,假如能找到合适的导师,有机会跟他们一起工作,从他们身上学习,体验整个创业的过程,增长眼界与能力之后,创业就会更有信心。2010年,他决定离开VMware,加入XtremIO。

“最初九个月,我是XtremIO在美国的唯一员工。没有固定的工作场所,美国的白天,是以色列的黑夜,这段时光我独自开车在住处与硅谷间往来,与潜在的伙伴交流,几乎坐遍了南湾的每家星巴克。”

尽管有出色的工程师,但当时并不确定产品将来会用在怎样的场景中。“从一张白纸开始, 一方面我开始帮助公司研究,通过这项技术能解决哪些实实在在的挑战;另一方面,我将这些挑战,转换成工程师能理解的技术语言。”任宇翔说,“CTO必须把握技术与市场的结合点”这句话远非泛泛而谈,在这个领域,面对的是整天摸爬滚打的客户,CTO需要对技术自身有深入的理解,才能有效交流。

除非一项存储技术已被证明成熟可靠,否则客户不会考虑采用。但面对这种阻力,总要寻找第一个吃螃蟹的人,也许因为性能,也许因为价格,他们有足够大的痛点,愿意尝试激进的技术。找到这样的突破点,非常关键。

这是个不断自我批判、否定的过程,往往原以为有十件事可做,却发觉全是错误的方向。例如XtremIO最初认为企业电子邮件存储,是个大而成熟的市场,但深入进来,就意识到它并不适合初创公司。而在那时看起来不起眼又不成熟的虚拟桌面,倒逐渐变得大有可为。“像一份没有标准答案的试卷,需要自己摸索、判断,有时还要靠运气。”这是他对那段时光的回忆。

不加掩饰

XtremIO的技术团队如今已有150人,他们带着强烈的以色列文化风格——坦率、不加掩饰。激烈的争论在其他商业文化中令人厌恶,但在以色列,这恰恰是解决问题的最好办法。外地人在以色列随处都能见到这种交流方式——学生诘问教授,雇员挑战老板,军士质疑长官。任宇翔认为XtremIO成功的部分原因也得益于此,“在这里,上下级、新老员工、年轻与资深程序员的界限并不明显,他们关注的只有对与错。

这种文化,让人与人交流卸下包袱,将所有的异议带到桌面上来,公开讨论以找到解决之道,这令公司拥有自我纠错的机制,不会在错误的方向上走太远。” 这种文化与诸多因素有关,他们四面受敌,接受犹太人宗教教育,在大学前经历强制兵役和预备役制度的磨练——当一名出租车司机能指挥百万富翁,年轻人能训练自己的叔叔时,等级制度自然就消失了。任宇翔说,若想对这个国家的技术文化了解更多,《Start-up Nation 》这本书做了完整的解读。

“我们实现的是一套全新架构,而非传统存储,我更看重一个人的批判精神,而不是他在存储领域中的经验。”任宇翔举例说,有十几年数据库管理经验的DBA,对存储或服务器该怎样配置,往往有自己的法则。许多人将其视为铁律执行,却不思考这些法则是在何种情形制定的,“存在并不意味着合理,许多决定受历史局限,彼时的决定在今日有可能被推翻。在XtremIO,许多时候你会发现,需要将原有的规则全部打破。不仅数据库领域如此,开发、测试团队都面对着相似的考验。”

能做存储的超级计算机

XtremIO工程师,大多拥有高性能计算、网路、安全或分布式计算背景。“XtremIO设计的产品更像一台分布式计算机,只是最后才将数据写入闪存。同事间有时开玩笑,说自己在偶然的情况下,制造了一台能做存储的超级计算机。”任宇翔回忆道。

传统存储阵列,磁盘是唯一介质,因其旋转的读写机制,使得顺序读写的性能远优于随机读写。如果对存储技术有一些了解,你就会发现,应用软件、操作系统、文件系统,以及硬件设计的方方面面,都尽量将随机读写转化为顺序进行,以提高性能。

倘若单纯将闪存作为存储介质,性能确实会有提高,但若想充分发挥它的优势,则需要否定既有的软硬件规则,设计和实现全新架构。“所有数据被彻底粉碎,经过Hash分配在闪存盘上。”任宇翔说,这样做的好处有很多,资源实现了均匀分配,即使对很小的区域密集访问,也不会出现热点。另外,不同来源的数据块,只要内容相同,经过Hash,都会被写入同一处。这意味着,第二次写操作完全可以避免,从架构上引入了去重的功能——这是个并非有意为之的副产品,却令物理机上写入的数据量大大减少。

这个时期闪存可靠性得到提高,价格变得平易近人。之所以说“偶然间制造了一台能做存储的计算机”,是因为整个系统中存储只占一小部分,而且正是他们极力避免的。数据去重、压缩目的都是尽量减少写操作——这背后意味着大量运算,需要高性能CPU。“Intel真正将多核CPU商用化,才让XtremIO有足够的能力进行运算,假如全闪存阵列的想法在2009年之前提出来,就会过于超前了。”任宇翔说XtremIO能成功,也带着几分运气。

2012年,XtremIO被EMC收购,任宇翔又回到了曾开始自己存储事业的地方。一年后,XtremIO产品正式发布。“真正企业级的产品,而不是初创公司的作品,需要加入企业级功能,”任宇翔说,远程数据复制、无缝横向扩展都已在XtremIO 2015年的发展路线图上。

给我留言

留言无头像?