導讀:近日,中國聯(lián)通研究院與浙江聯(lián)通、聯(lián)通服裝制造軍團協(xié)同攻關(guān),針對 AI 敏感數(shù)據(jù)的本地存儲異地訓練需求提出了創(chuàng)新的業(yè)務模式,并成功在杭州與金華兩地間實施了業(yè)界首次 30TB 樣本數(shù)據(jù)的跨 200 公里存算分離拉遠訓練,經(jīng)過實際測算,訓練效率高達 97% 以上。
據(jù)中國聯(lián)通官方,近日,中國聯(lián)通研究院與浙江聯(lián)通、聯(lián)通服裝制造軍團協(xié)同攻關(guān),針對 AI 敏感數(shù)據(jù)的本地存儲異地訓練需求提出了創(chuàng)新的業(yè)務模式,并成功在杭州與金華兩地間實施了業(yè)界首次 30TB 樣本數(shù)據(jù)的跨 200 公里存算分離拉遠訓練,經(jīng)過實際測算,訓練效率高達 97% 以上。
從官方介紹獲悉,通過本次測試充分驗證了存算分離技術(shù)的安全性、可行性和高效性,為未來 AI 技術(shù)的發(fā)展提供了新的思路和方向。
存算分離技術(shù)是指將存儲數(shù)據(jù)的倉庫和對數(shù)據(jù)進行計算的加工廠獨立開來,在訓練時直接將數(shù)據(jù)從遠端存儲設(shè)備中拉過來進行計算,而不需要先存儲到本地的磁盤再進行處理,可以有效保證用戶數(shù)據(jù)的安全性和一致性。
中國聯(lián)通稱,海量樣本數(shù)據(jù)處理過程中存在兩大挑戰(zhàn):一是數(shù)據(jù)多存儲于企業(yè)端,部分安全性要求較高的數(shù)據(jù)不便外遷;二是樣本數(shù)據(jù)量激增,AI 智算中心在具備強大算力的同時,還需額外配備存儲資源,顯著提升了建設(shè)成本。在此背景下,業(yè)內(nèi)對實現(xiàn)“存算分離拉遠、樣本隨訓隨拉”需求迫切。
▲ 圖源中國聯(lián)通公眾號
本次存算拉遠測試驗證的主要特色包括:
第一,以跨地市 AI 大模型訓練能力創(chuàng)新重構(gòu)智算訓練模式。傳統(tǒng)的智算集中訓練模式,需要用戶將樣本上傳到智算中心進行落盤訓練,但是部分用戶對隱私樣本落盤存在安全顧慮。浙江聯(lián)通通過 IP 廣域無損方案,實現(xiàn)了杭州存、金華訓的“數(shù)據(jù)不落盤”拉遠訓練,以算網(wǎng)協(xié)同的能力,為企業(yè)用戶隱私樣本訓練探索出了一條新路。
第二,樣本數(shù)據(jù)總量達 30TB,傳輸距離超 200 公里,計算拉遠效率大于 97%。通過聯(lián)通服裝制造軍團“衣瞳行業(yè)模型”的 AI 訓練存算分離現(xiàn)網(wǎng)測試。充分驗證了針對 AI 訓練業(yè)務存算拉遠的技術(shù)可行性,未來有相關(guān)數(shù)據(jù)敏感業(yè)務需求的用戶可通過運營商算力服務,完成隱私樣本不出園區(qū)的拉遠訓練,實現(xiàn)成本與安全的最佳平衡。