時,“去E”也需要在儲存效能、可靠性和容災方面考慮對策。
實際上,“去I”和“去E”,在技術上難度和複雜程度都不算太大……
“去IOE”真正的難點和重點,
是“去O”!
因為資料庫非常難被替換。
它處在整個產品或者產業鏈最底層的位置,替換風險很大,但收益相比起來卻小得多。
這也是為什麼像IBM、微軟這樣的後來者,也無法取代Oracle。
而對於星河集團而言,“去O”的主要難點在於:
傳統關聯式資料庫都是透過外部硬體來保證可用性,在用便宜的PC機替換高階伺服器之後,硬體更容易出故障了,如何保證資料庫高可用?
高可用和資料一致性如何同時保證?
分散式系統怎麼同時實現CAP的要求?(CAP指:一致性(Consistency,C)、可用性(Availability,A)、分割槽容錯性(PartitionTolerance,P))
幾十年來,這麼多做資料庫的廠商,國內國外基本沒有人成功過……
而且從公司的業務發展的角度,也不可能等你幾年把資料庫做出來,再去發展業務。
更可行的做法,是先基於開源做出一些東西,讓業務先往前走。
所以,目前王堅為首的技術團隊,採用的是資料切分(sharding)的策略。
將部分海量資料應用,先從集中式Oracle切換到分散式MySQL叢集,從縱向擴充套件到水平擴充套件,解決了資料庫擴充套件性的問題。
同時,目前百度研究院正在研發自有的分散式關聯式資料庫——OceanBase。
這裡不得不提到一個人,陽振坤博士。
這也是一位“超級大牛”:
84級帝大數學系,碩士師從本系的張恭慶院士,後又轉向計算機領域,博士師從計算機系的王選院士。
大學只用了3年,碩士1年多,24歲成為王選院士博士……
95年其所在團隊研究成果獲國家科技進步一等獎(排名第四),1997年,32歲被破格晉升為教授、99年成為帝大首批“長江學者獎勵計劃”特聘教授。
他是跟隨王堅博士,從微軟亞洲研究院“跳槽”,來到百度研究院的十幾名科學家之一。
目前擔任百度研究院系統資料庫專案組組長、高階技術專家(P9)。
陽振坤博士一直都是研究分散式技術和分散式系統的。
他十分看好雲端計算系統的發展機會,在加入百度研究院後,就主動請纓,開始擔綱主持分散式關聯式資料庫OceanBase的研發。
而王堅對於他的研發專案,也非常支援。
認為OceanBase資料庫,將會是未來星河雲端計算戰略中,最重要的一環!
隋波聽到這裡,也不禁有些慶幸。
正是他提前請來了王堅博士,並且全力支援“雲端計算”戰略。
才能有這麼多前世的技術大牛,彙集到星河旗下,並且能夠提前發揮出巨大的作用……
最後,王堅博士也向大家彙報了目前集團“去IOE”計劃的工作進度:
易趣商品庫已在去年6月,完成去“I”,計劃於今年年中,完成去“OE”;
百度搜尋資料庫,將在今年3月完成去“I”,10月完成去“OE”;
易迅社交及遊戲資料庫,將於今年10月,一次性完成“去IOE”;
目前集團資料量最大的易趣交易庫、現金流結算系統;易付寶交易系統和賬戶系統,則預計要到明年底,才能完