中國算力大會聯(lián)想展臺,鈦媒體App拍攝
(資料圖片)
通用人工智能時代到來,大模型訓(xùn)練的參數(shù)量突破萬億級關(guān)卡,AI算力已成為企業(yè)訓(xùn)練開發(fā)使用人工智能的硬門檻,以及算力基礎(chǔ)設(shè)施的重要發(fā)展方向。據(jù)IDC報告顯示,隨著生成式人工智能應(yīng)用的爆發(fā),各行業(yè)對智算的需求首次超過通用算力,AI算力已成為算力發(fā)展的主要方向。
同時,中國信通院發(fā)布的數(shù)據(jù)也指出,截至2021年底,基礎(chǔ)算力穩(wěn)定增長,規(guī)模為95EFLOPS,增速為24%,占比為47%。智能算力增長迅速,2021年規(guī)模達到104EFLOPS,增速為85%,占比為51.5%。智能算力的比重提升代表智算應(yīng)用場景的不斷豐富,智能算力成增長動力。
聯(lián)想中國區(qū)基礎(chǔ)設(shè)施業(yè)務(wù)群服務(wù)器事業(yè)部總經(jīng)理陳振寬
聯(lián)想集團副總裁、聯(lián)想中國區(qū)基礎(chǔ)設(shè)施業(yè)務(wù)群服務(wù)器事業(yè)部總經(jīng)理陳振寬表示,AI算法模型的變革使AI算力需求進入爆發(fā)式增長階段,2010年之前,訓(xùn)練算力的增長率約20個月翻一番;2012年深度學(xué)習(xí)來臨,訓(xùn)練算力每6個月翻一番;2018年以來基于Transformer架構(gòu)的大模型訓(xùn)練算力需求每年數(shù)百倍增長。
“AI算力已經(jīng)成為中國算力發(fā)展的主要方向,根據(jù)IDC統(tǒng)計,中國AI算力持續(xù)高速增長,2022年規(guī)模達268百億億次/秒(EFLOPS)。同時未來幾年的復(fù)合增長率高達52.3%?!?/p>
相比較通用算力,AI算力有著明顯的差異。從千萬級的參數(shù)到千億級的參數(shù),從深度學(xué)習(xí)需要中等規(guī)模的訓(xùn)練和推理到現(xiàn)在要全面地去實現(xiàn)超大規(guī)模的訓(xùn)練,AI算力需要依據(jù)AI數(shù)據(jù)和算法的特性設(shè)計和優(yōu)化,具體到AI算力基礎(chǔ)設(shè)施層面就需要根據(jù)特性進行針對性的優(yōu)化。
此前,在聯(lián)想集團2023/24財年第一季度業(yè)績會上,聯(lián)想集團執(zhí)行副總裁兼中國區(qū)總裁劉軍透露,聯(lián)想在AI的基礎(chǔ)設(shè)施上,也有比較前瞻和顯著的布局。截至目前,有60多款產(chǎn)品都是AI基礎(chǔ)設(shè)施產(chǎn)品,包括推理服務(wù)器、訓(xùn)練服務(wù)器、AI存儲等。
鈦媒體App了解到,普慧算力包含“普適”和“智慧”,是聯(lián)想算力發(fā)展的戰(zhàn)略方向,也是聯(lián)想的價值主張。其中,普適是指希望算力能夠像水和電一樣,可以人人即取即用而不必見;智慧更多是指人人可以隨需使用而不必問,人們無需在使用算力前,詢問它能否滿足要求,需要使用、隨需使用就可以。
陳振寬稱,聯(lián)想AI算力戰(zhàn)略有兩大特征,一個是AI賦智,二是綠色賦能。其中,“AI賦智”即讓100%算力基礎(chǔ)設(shè)施產(chǎn)品支持AI,50% 基礎(chǔ)設(shè)施研發(fā)投入在AI領(lǐng)域,全面AI技術(shù)覆蓋全域AI應(yīng)用;“綠色賦能”則是全面布局和引領(lǐng)液冷技術(shù),打造液冷集群方案燈塔,以綠色算力基礎(chǔ)設(shè)施助推智算產(chǎn)業(yè)可持續(xù)發(fā)展。
在中國算力大會上,聯(lián)想發(fā)布了兩款全新AI服務(wù)器產(chǎn)品—聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器和聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器。聯(lián)想方面表示,在通用算力向AI算力發(fā)展的當(dāng)下,聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器和聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器兩款新品將分別滿足不同類型的AI應(yīng)用場景需求。
聯(lián)想問天WA7780 G3
具體來看,聯(lián)想問天WA7780 G3是一款專為AI大模型訓(xùn)練所打造的服務(wù)器,采用了三重獨立風(fēng)道設(shè)計,預(yù)留了液冷冷板,基于第四代英特爾?至強?可擴展處理器,將AI算力提升了3.44倍,至高可達32P FLOPS AI算力。NVIDIA H800 GPU匹配第四代Tensor Core配合Transformer引擎(FP8精度),與上一代產(chǎn)品相比,可為大模型AI訓(xùn)練速度帶來高達9倍提升,可將大模型AI推理速度提升高達30倍。
聯(lián)想問天WA5480 G3
聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器是一款4U機架式AI服務(wù)器,支持多元算力和豐富的生態(tài),采用2顆第四代英特爾?至強?可擴展處理器,支持最新PCIe 5.0。通過PCIe擴展,最多可以支持10張包括最新NVIDIA H800 GPU在內(nèi)的,多類型、多品牌AI加速卡。
在聯(lián)想的理念中,兼顧不同算力形態(tài),會從不同場景上提供全面的產(chǎn)品來滿足不同算力需求。這次推出的這兩款產(chǎn)品比較偏向于大規(guī)模的推理和大規(guī)模的訓(xùn)練,就是大規(guī)模和超大規(guī)模。同時,兩款A(yù)I服務(wù)器新品也可以配合聯(lián)想的邊緣計算的產(chǎn)品來實現(xiàn)邊緣推理。
聯(lián)想集團董事長兼CEO楊元慶在業(yè)績會上表示,在未來三年里會追加投入10億美元(70億人民幣)在人工智能方向的所有領(lǐng)域,這個領(lǐng)域包括適合人工智能計算需要的服務(wù)器存儲的產(chǎn)品,包括給云計算廠商的,也包括企業(yè)級的。
面向未來的發(fā)展,陳振寬稱,聯(lián)想也在積極了解客戶在不同領(lǐng)域上的需求和痛點,以AI導(dǎo)向的基礎(chǔ)設(shè)施助力人工智能加速,通過AI技術(shù),覆蓋全域應(yīng)用,加速實現(xiàn)普慧算力。(本文首發(fā)鈦媒體App,作者/杜志強,編輯/鐘毅)
關(guān)鍵詞: