Linux核心貢獻全球第二,開源四大基礎軟體,為什麼華為要啃下這塊硬骨頭

2020-09-29 11:00:34

作者 | Just

出品 | CSDN(ID:CSDNnews)

回顧計算機發展的歷史,任何一個計算架構的成功都離不開強大的硬體,但這背後更需要繁榮的軟體生態。

1960年的集中式計算出現後,諸多基礎軟體應運而生,隨後進入「Win-tel」獨霸PC的時代,近年來,Intel和Linux又帶來了分散式計算的高潮。

 

如今,隨著5G的到來,行動網際網路業務進一步發展,巨量資料、物聯網、人工智慧等創新應用場景層出不窮,應用場景的多樣性催生出資料的多樣性,導致原有的單一計算架構明顯跟不上龐雜的業務需求,業界對提出一種全新計算架構的呼聲愈烈。

 

很快,華為瞄準了多樣性算力架構。在去年9月的華為全聯接大會上,他們提出了「鯤鵬+昇騰」的雙引擎計算戰略以應對算力需求的爆發式增長。

 

這是一個全棧協同創新的過程,需要硬體提供算力,軟體釋放算力,盡最大可能讓上層應用使用算力,並且最終創造價值。硬體是整個生態的基礎,但決定多算力架構能否取得成功的關鍵樞紐是軟體,這是華為需要啃下的另一塊硬骨頭。

 

四大基礎軟體再升級

要想充分釋放硬體的算力,需要先了解其瓶頸究竟是什麼。

華為鯤鵬計算領域副總裁江大勇告訴CSDN,在硬體方面,ARM這樣的主流處理器從百核甚至到千核的多核方向發展,但問題在於,核數的線性增長並不意味著算力的效能會隨之增長,因為算力的分配和排程複雜度的增加反而會消耗一部分算力的效能。與此同時,端邊雲協同的趨勢對ARM計算架構也提出了相應需求,而X86、ARM和xPU的異構計算框架的趨勢也正在形成。

 

如此,多核多算力的硬體架構轉變相應地迫使基礎軟體架構做出調整。

 

去年以來,趁著國內開源的熱烈氣氛,華為也相繼開源了四大基礎軟體:openEuler(尤拉)作業系統、openGauss(高斯)資料庫、openLooKeng(羅庚)高效能資料虛擬化引擎,以及MindSpore全場景AI計算框架。

 

作業系統是所有計算機系統軟體的「根」,但目前的作業系統並不能很好地支援多樣性算力和ARM等架構。華為則希望面向未來的場景,通過openEuler建立一個創新平臺,能夠全面支援ARM,X86,RISC-V 等現在主流計算機架構。openEuler已於去年12月31日正式開源。

而在9月24日的HC大會分論壇上,江大勇釋出了openEuler 20.09版本,包括極致效能、安全可信、生態引擎三大特點,背後提供支撐的專案主要是輕量級虛擬機器器StratoVirt 1.0和雲原生容器iSula 2.0,secGear機密計算框架和IMA完整性度量架構,自動化測試平臺Compass-CI和UKUI桌面。OpenEuler21.03及後續版本,將在雲、邊、端全場景協同上持續創新,支援應用一次開發,多場景部署。

目前,openEuler作業系統,程式碼量超過100萬行,程式碼貢獻者數量已超過1000個,下載量超1.4萬次,社群存取量超過150萬次,已有多傢伙伴基於openEuler做了商業應用。

同樣,資料庫是基礎軟體皇冠上的明珠,也是客戶業務系統的核心,所有應用軟體的執行和資料處理都要與其進行資料互動。雖然以MySQL, PGSQL為代表的開源資料庫已成為主流選擇,但真正的企業級使用者對企業關鍵資料、核心業務的承載體,有著效能、安全和運維的更高要求。江大勇認為,現在開源的資料庫沒有完全達到企業級的能力。

今年6月已經開源的openGauss資料庫則具備企業級效能,包括高效能、高可用、高安全三大特性。openGuass第一個開源版本聚焦在與鯤鵬協同效能優化上,基於2路鯤鵬伺服器,效能可達到150萬tmpC,相對業界主流產品的效能超過50%。

而在今年12月底,openGauss還會進一步迭代企業級特性,包括行列混合儲存引擎,支援混合負載,記憶體引擎MOT達到250W tmpC,有512個功能引數推薦的智慧運維以及安全審計。明年3月底,openGauss則會關注企業安全,實現全密態資料庫和智慧增強功能。江大勇稱,未來,openGauss將在每6個月釋出一個新版本,每年釋出一個穩定版本。

面向海量資料,儘管目前有HBase、Hadoop、Hive,MySQL等各種數倉,但缺乏統一的SQL介面,支援多數倉的軟體,這是巨量資料使用的一大難題。

今年3月,華為開源的openLooKeng則是一個資料虛擬化引擎,致力於為巨量資料使用者提供極簡的資料分析體驗,讓使用者像用「資料庫」一樣使用「巨量資料」。

openLooKeng具備引擎歸一、多樣分析,生態引擎以及高可靠、易用性特點,可以進行跨格式、跨倉、跨域使用,讓開發者做資料治理更加簡單。江大勇稱,百億級的資料量可以做到10秒級的分析處理。未來,openLooKeng將在極致效能、全場景高效融合分析、批流互動式方面持續突破。

此外,華為正式釋出了端邊雲全場景的AI計算框架MindSpore 1.0:支援模型、運算元及硬體處理單元級全自動並行;對端邊雲裝置如手機、攝像機、伺服器等全場景自適配;開發流程極簡,開發者可基於MindSpore快速實現模型匯入、靈活偵錯。

 

為什麼要開源基礎軟體

 

開源軟體的商業模式早已被驗證。華為也希望通過開源的方式快速構建上述基礎軟體能力,並繁榮軟體生態。

事實上,在Linux最新的核心5.8版本中,華為在全球範圍對核心的貢獻排名第二,修改程式碼量全球排名第一。另外,華為還為ARM架構打通全棧能力,貢獻了全球超過40+的主流開源社群。

這些基礎軟體能開源也主要得益於華為過去10多年的技術積累,比如openEuler、openGauss資料庫在開源前,就已在運營商業務中廣泛使用,背後凝結了數千名工程師的技術研發投入。

 

由此也不難看出,現在的華為在貢獻開源和引領開源上是齊頭並進。

 

當然,華為也並非能完全參考英特爾等廠商的開源模式。江大勇對CSDN稱,與原來其他廠商做產品和解決方案不同,華為做計算產業更強調「生態」,這就決定了華為「有所為有所不為」。

 

這一點也讓華為在基礎軟體的開源策略上更加清晰,華為所做的即是為開發者和合作方提供開發工具和應用實踐等底層支援,幫助後者應用快速遷移到整個鯤鵬平臺,以此促進計算產業的發展。

 

在江大勇看來,現在應用的發展已經遠快於以前做應用標準的方式,所以開源可能是當下更能被認可和接受的一種趨勢,而通過這種方式也更能促進社會效率的提升。更重要的是,通過開源社群的共同作業模式把底層的基礎技術做好後,差異化應用也會更快落地,社會效益也會更大,這也會形成事實上的統一標準。

 

最具挑戰的是開源意識

 

對華為來說,開源上述四大基礎軟體只是開始。因為應用、處理器、新的專案需求還在不斷髮展,江大勇認為,只開源這些軟體並不足夠。

 

「openEuler剛開放的時候大約有30多個SIG組,但現在已經有70多個,因為不斷地有開發者提出了新的業務需求或創新想法,也有開發者主動把RISC-V等能力開放到了社群。」

 

他預計,在分散式方面,未來可能還會增加一些新的能力,在元函數方面,可能在今年年底或明年年初也會有相應能力開放。而要壯大軟體功能和生態,更重要的是依靠開發者社群的力量。

 

作為一家公認的執行力強悍的企業,華為在社群建設上也卓有成效。近期的鯤鵬開發者活動首次進行18個城市同步聯動,採用線下+線上的方式進行,吸引了上萬名開發者參與。

 

在江大勇看來,中國的開發者軟體開發者數量並不少,但需要形成一種活躍的開源社群文化,而不只是把社群當做程式碼託管的地方。

 

而通過華為在構建開發者社群和生態過程中的經歷,他也總結了中國開源需要提升的地方:

首先,開源社群本身的程式碼託管等基礎設施服務要加強;其次,中國需要有更適合的開源協定;最後,最具挑戰的是擁有開源意識和文化,他認為,應該鼓勵高校學生和研究機構參與到開源中,加快社會性的協同創新,持續性支援和發揚開源共同作業精神。最終,讓中國開發者實現從貢獻開源進一步在全球範圍內引領開源。


更多精彩推薦
☞為什麼雲原生+分散式是資料庫的未來?

☞Swift、Flutter 共同瞄準 Windows!
☞不是「老賴」是「真還」!羅永浩 6 億債務還了 4 億

☞雲原生安全模型與實踐
☞AI視覺大牛朱鬆純擔任北大AI研究院院長,提出通過構建大任務平臺走向通用AI
☞區塊鏈+生鮮:杜絕「偷樑換柱」和「以次充好」
點分享點點贊點在看