導讀:北京2023年7月4日 -- 就在前段時間,繼ChatGPT迎來「iPhone時刻」之后,OpenAI又計劃推出LLM版的App Store。簡單來講,OpenAI打造獨屬的「大模型應用商店」,就是要把市面上的大模型拉進一個雙向對接的平臺。這樣,開發(fā)者根據特殊用途,去出售基于ChatGPT定制的AI模型。而企業(yè)也能夠根據自身需求快速找到適配的LLM。
北京2023年7月4日 -- 就在前段時間,繼ChatGPT迎來「iPhone時刻」之后,OpenAI又計劃推出LLM版的App Store。簡單來講,OpenAI打造獨屬的「大模型應用商店」,就是要把市面上的大模型拉進一個雙向對接的平臺。這樣,開發(fā)者根據特殊用途,去出售基于ChatGPT定制的AI模型。而企業(yè)也能夠根據自身需求快速找到適配的LLM。
OpenAI此舉,意味著生態(tài)系統將實現融合,大家能夠更容易去獲取使用各種應用,無需重復「造輪子」。
無獨有偶,國內的浪潮信息在走這樣的生態(tài)開放之路。更有趣的是,浪潮信息打造了AIStore,作為元腦生態(tài)的內容承載平臺。LLM爆火之后,OpenAI也順勢打造了APPstore。
元腦AIStore,智算時代的「App Store」
浪潮信息的生態(tài)開放之路是怎么走的?其中一個生動的例子,就是它打造的元腦AIStore平臺。在這里,「左手伙伴」負責提供場景化應用以及服務;當「右手伙伴」有業(yè)務創(chuàng)新需求時,就可以在平臺上根據提供的信息尋找合作。同時,「右手伙伴」也可以在平臺上發(fā)布自己的需求,由左手伙伴承接,然后提供定制服務。而作為「平臺」的AIStore,就是把二者連接起來,依托算力、算法、資源平臺等全棧化的生態(tài)優(yōu)勢,助力伙伴雙方實現技術和商業(yè)的雙融合,助力大家進行更高效的合作與營銷。
如果說,小紅書是C端的種草內容生態(tài),AIStore平臺可以理解成是B端應用的線上社區(qū)化商城。
元腦生態(tài)致力于牽手伙伴輸出技術領先、落地性強的聯合方案,不斷提升方案的可服務性、開放性和易購性,滿足客戶需求的同時,助力伙伴獲取更多商機。這個過程中,體現的是連接、信任、合作,是這種合作模式的價值認同。也正是在這樣的實踐探索中,浪潮信息的生態(tài)伙伴數量在不斷增加,據了解,截止至2022年底,浪潮信息的生態(tài)伙伴數量已達20000余家。
如今,在元腦AlStore平臺上,我們已經可以看到很多面向不同AI業(yè)務場景的解決方案,其中有不少是兩家以上合作伙伴聯合開發(fā)的。此外,為了方便客戶獲得更直觀的體驗,浪潮信息還在元腦AIStore平臺加入了部分解決方案的demo。比如打開「合合信息OCR」,就可以一鍵試用各種票據和證件的識別。
據介紹,目前元腦AlStore已經入駐了超過1200家伙伴,上線產品和解決方案超過150個,有幾十家伙伴的產品方案通過了元腦認證。
其實早在2019年,浪潮信息便提出了智算時代之下的生態(tài)新范式——元腦生態(tài)。元腦AIStore正是元腦生態(tài)的內容承載平臺,不僅如此,AIStore還是合作伙伴的營銷平臺。而2022年底生成式AI爆火后產生的產業(yè)需求,更是驗證了這一路線的前瞻性。
技術落地,建立開放產業(yè)生態(tài)環(huán)境
ChatGPT引爆技術革新,徹底帶火了生成式AI等新一代技術的突破。如何將技術和場景融合,賦能產業(yè),已經成為新一輪時代科技革命的一個重點。那么在這樣大背景之下, 生態(tài)又將如何重構?「變」與「不變」的革新又在于何處?這是新型產業(yè)化落地最后一公里面臨的困境。
我們看到,大型語言模型的發(fā)展越來越成熟,如何實現轉化,才是展現大模型真正實力的關鍵一環(huán)。技術與產業(yè)的關系猶如毛與皮的關系,有「皮」的存在,「毛」才有存在的可能和價值?!钙ぁ故钱a業(yè),更是市場需求,技術通過真正地賦能場景,解決市場需求,才能夠持續(xù)獲得收益而發(fā)展。對于一些特定場景,如果沒有定制化的適配,就無法100%發(fā)揮技術的價值?;蛘哒f,若沒有多配套的產線支撐與需求市場,做出的技術也將偏離產業(yè)化初衷。而OpenAI計劃打造的LLM「應用商店」,正是要推動技術賦能場景的一個新生態(tài)的形成。
比如,教育APP制造商Khan Academy(可汗學院),就是在ChatGPT的基礎上,開發(fā)了個性化AI導師Khanmigo。而另一家企業(yè)AI平臺Aquant,則利用獨有數據微調了ChatGPT大模型,打造了聊天機器人應用Service Copilot。開發(fā)的產品能夠智能回復客戶有關設備維護、維修等方面的問題。
由此可見,面向未來產業(yè)的發(fā)展,生態(tài)亟需應勢而變,在變局中以「競爭、合作、開放」的姿態(tài)變革重構。這樣做的優(yōu)勢在于:首先,從場景實踐中提升技術的創(chuàng)新能力。技術推動產業(yè)發(fā)展,進而反哺技術創(chuàng)新。通過跨界融合,能夠促進數據、技術、知識等業(yè)務共享和協同,由此再推動不同領域的創(chuàng)新。用「開放共贏」的姿態(tài)提升個體伙伴的競爭力,以此提升整體產業(yè)的效率與競爭力。其次,優(yōu)化產業(yè)布局,發(fā)揮生態(tài)內的單一環(huán)節(jié)的競爭優(yōu)勢。未來的產業(yè)生態(tài),需要根據不同環(huán)節(jié)的發(fā)展特點和優(yōu)勢,將單一伙伴的價值最大化,實現產業(yè)優(yōu)化升級和可持續(xù)發(fā)展力。
浪潮信息的元腦生態(tài),從2019年開始,一直就走在這種合作新范式的路上。即用技術賦能場景,用「智算」聚生態(tài)之力,建立場景共同體,打通產業(yè)AI落地的最后一公里。
元腦生態(tài),智算時代的生態(tài)新范式
元腦生態(tài),正是要開啟一個新時代的生態(tài)范式?,F在,浪潮信息打造的元腦生態(tài)中,已經有了500余個左手伙伴,4500余個右手伙伴。他們始終倡導所踐行的「聚合產業(yè)力量」,便是指具備AI開發(fā)核心能力的「左手伙伴」和具備行業(yè)AI整體方案交付能力的「右手伙伴」。
簡言之,元腦生態(tài)不獨屬于某一個企業(yè),而是左手伙伴+右手伙伴+浪潮信息的三元素結合,是熱帶雨林式的合作范式,從而實現優(yōu)勢互補、各取所需、合作共贏的局面。也就是說,元腦生態(tài)將成為一片肥沃的土壤,促進AI行業(yè)融合和落地發(fā)展。這一生態(tài)構建,已在具體實踐中取得了卓越成效。
聚生態(tài)之力,用AI賦能場景落地最后一公里
在金融行業(yè)中,許多業(yè)務已實現了數字化轉型,并實現效率提升。不得不承認的是,目前仍存在一些無法用AI亟待解決的問題。比如,在票據處理方面,許多銀行還依舊采用人工錄入的方式,不僅耗時且成本高昂,柳州銀行便是其中一個的代表。
當前,OCR技術的發(fā)展,已經能夠將圖像文件中的字符快速識別,并轉化成文本。而且在算法的加持下,即便遇到票據背景復雜、清晰度不高、文字傾斜等情況,也能實現智能提取。
一直深耕智能文字識別領域的合合信息(左手伙伴)便是典型代表。它在智能文字識別技術上破解了傳統OCR應用識別難題,推出的TextIn Studio智能文字訓練平臺,能夠提供上百種文檔圖像處理服務。另外,與其他行業(yè)不同,「高網絡安全性、高數據備份要求性、高監(jiān)控和審計能力性、高應急響應能力」的銀行特性,讓金融行業(yè)落地的挑戰(zhàn)變得更加困難。而深耕金融隱私計算領域多年的可利邦(右手伙伴),能夠提供整體的IT、金融化信息的解決方案。
立于元腦生態(tài),合合信息和可利邦,能夠全面利用浪潮信息提供的AI計算平臺、AI資源平臺、AI工具平臺的能力。那么,有了這個行業(yè)AI大腦,浪潮信息的左右手伙伴在柳州銀行案例中是如何發(fā)揮所長,打造生態(tài)新范式?
在柳州銀行OCR智能平臺建設中,面臨著極為兩難的現實問題:一方面,銀行面臨數據繁多、場景復雜的核心瓶頸,隨著高爆發(fā)、高增長的數據量,都對模型訓練和推理提出了更高要求。另一方面,就用戶數據安全維度考慮,定制模型的所有數據標注、訓練,都必須在銀行內網完成。
由此,針對柳州銀行「算力資源少,場景應用多」等實際落地的困難,合合信息攜手可利邦聯合打造了業(yè)內領先的一站式智能OCR解決方案。這樣,通過生態(tài)的協同優(yōu)勢,跨越產業(yè)落地鴻溝,打通金融數智化轉型的最后一公里。那么,他們具體又是如何基于浪潮信息元腦生態(tài),幫助柳州銀行解決業(yè)務中的痛點?
首先,從算力方面入手。AIGC時代來臨,許多大語言模型基于海量數據集進行訓練和推理時,對算力提出極大需求。傳統銀行業(yè)務在技術側方面,對高爆發(fā)、高增長業(yè)務數據處理、以及大量定制模型訓練提出了需求。只有底層算力系統,足夠強大才能滿足這一極高的要求。然而,當硬件性能已經到頂,就需要用軟件平臺對算力實現更精細調度。通過優(yōu)化底層資源調度,實現算力最大化利用。針對柳州銀行業(yè)務流量潮汐特征,合合信息與可利邦進行了解決方案算力調配的快速移植與優(yōu)化,從而實現算力資源均衡分配。具體來講,基于業(yè)務流量波峰波谷特征,進行算力的自動彈性收縮,在保障業(yè)務不受影響的前提下,將資源利用率提升約40%。
另外,基于銀行多業(yè)務場景常規(guī)并發(fā)需求,通過算力資源的細粒度切分,實現一卡多用。最大化提高算力利用率,在幾乎零性能損失情況下(≈1%),將算力利用率提升至3-5倍。
其次,從算法框架來看。合合信息針對柳州銀行初始化樣本不足,缺少數據標注、憑證板式復雜等問題,進行了模型定制,然后針對復雜的單據、票證進行針對性訓練。由此,構建了高敏強化學習訓練機制,讓OCR票證識別精度和效率大幅提升。
這一方案,將合合信息的算法識別能力發(fā)揮至極致,實現了一站式覆蓋端到端AI業(yè)務。而元腦生態(tài)之下的資源平臺AIStation,則助力其實現了模型的一鍵部署,能夠將人證核驗、圖像定損、單據識別等AI 應用快速嵌入到銀行業(yè)務流程中。值得一提的是,整個過程中,模型訓練時間也大幅縮短,從2天削減到4小時,部署時間也從2天縮短到5分鐘。
一站式智能OCR解決方案,能夠讓金融機構「0門檻」開發(fā)OCR?;趲资畯埰弊C小樣本,開發(fā)者便能完成OCR模型開發(fā),實現快速部署與訓練。顯然,這可以大大加快金融機構智能OCR應用的開發(fā)與上線的速度。同時,最大化滿足特定場景智能OCR應用需求。實踐證明,一站式智能OCR解決方案,將柳州銀行票證錄入效率提升百倍以上,人力資源成本節(jié)省數百萬元,實現業(yè)務提速。未來,這個OCR解決方案,也不僅限于柳州銀行,甚至在證券、保險等金融機構,同樣適用。除了算力、算法,在智能平臺運維方面,基于浪潮信息的AIStation平臺,通過建立穩(wěn)定的智能容錯機制,不斷強化上層應用的業(yè)務安全保障能力。真正實現了為金融數智化轉型的最后一公里保駕護航。
全流程「保駕護航」:AIStation一鍵部署,高效算力平臺管理,加速技術迭代革新
可以看到,在方案的落地過程中,一套穩(wěn)健的人工智能應用系統必不可少。而浪潮信息推出的智能業(yè)務生產創(chuàng)新平臺——AIStation,滿足的正是這個需求。具體來說,AIStation是專為人工智能開發(fā)和部署打造的端到端平臺,可以實現從模型開發(fā)、訓練、部署、測試、發(fā)布、服務的全流程一站式高效交付?;谫Y源管理調度、平臺流程支持能力,它在異構芯片、創(chuàng)新生產工具、行業(yè)伙伴應用、客戶方案等不同層面,與元腦合作伙伴展開了大量適配對接認證工作,并積累了大量經驗、模式與方案,成為了元腦生態(tài)的重要承載平臺。
舉個例子,比如智源研究院的FlagAI一站式大模型工具,就是基于AIStation平臺進行本地化部署的。我們都知道,大模型的訓練,需要構建包含計算、網絡、存儲、框架等在內的系統性分布式訓練環(huán)境。傳統的分散化管理,讓平臺的整體協同性較差,訓練效率低。而AIStation實現了異構算力集群的統一池化管理,通過自適應系統將訓練底層的計算、存儲、網絡環(huán)境自動化配置。通過多種資源高效管理和調度策略,AIStation能實現萬卡集群的毫秒級調度,提升整體資源利用率到70%以上。通過數據緩存機制,AIStation可以讓模型訓練效率獲得200%-300%的提升。并且,還達到了健壯性與穩(wěn)定性這樣的大模型訓練的強要求。根據服務資源需求的變化,AIStation可以及時調整資源配給,實現秒級服務擴縮容,可支持百萬級高并發(fā)的大規(guī)模AI推理服務場景,服務響應平均延遲低于1ms,突發(fā)的訪問高峰的響應效率提升50%。
就在6月25日,AIStation憑借著專業(yè)的AI開發(fā)與部署能力支撐,有效降低大模型時代的大規(guī)模分布式AI算力平臺的配置與維護門檻,榮獲了2023全球人工智能產品應用博覽會「產品金獎」。
水利萬物,普惠AIGC
從元腦生態(tài)的角度來看,浪潮信息布局產業(yè)AI是率先布局、并率先入局,從2019年到現在,短短四年間,獲得了極多合作伙伴的支持。今年AIGC才開始迸發(fā)出來,之前大家都處于探索期。在實踐中可以發(fā)現,大家都在面臨著可落地的商業(yè)化途徑的問題,比如量化金融智能客服,大模型+數字人等等。許多客戶都有非常理想、非常美好的需求,但實現起來并不那么容易。
有的客戶是有數據、有資源,他們的訴求是希望基于自己的數據進行挖掘,從而讓它變得更智能;有的客戶是有場景,希望能讓場景變成更智能化的體驗;有的是中間的集成方軟件服務商,希望被賦能。這就對生態(tài)提出了全方位的考驗。相對來說,元腦生態(tài)不是中心化的生態(tài),不強調誰依附于誰,更開放。不同企業(yè)的產品落地,所面臨的鴻溝,以及面臨的困境,是完全不同的。在快速迭代的時代背景下,生態(tài)需要去融合、去重塑。這也正是元腦生態(tài)中所謂「水利萬物」的要義。
而出乎意料的是,元腦生態(tài)真正上線之后,許多客戶都表現出了意想不到的熱情。這是因為,在此期間,客戶發(fā)現了浪潮信息具有的獨特優(yōu)勢——
1. 圍繞大模型提供的算力算法,具有一個全棧的基礎設施方案服務能力。尤其是在超大規(guī)模的算力集群中,可以圍繞遷移參數的算法進行調優(yōu)優(yōu)化。浪潮信息作為基礎設施廠商,在這方面有得天獨厚的優(yōu)勢。有算力,但更懂如何去用好算力。猶如足球比賽中的教練,賽前根據「對手」情況部署戰(zhàn)術安排,臨場根據比賽進程實時進行人員和位置調整。此外,還要善于激發(fā)每名球員的潛能。
2. 作為多元化的算力平臺,浪潮信息信息提供的是更開放、更多元的平臺。既能支持目前國際領先的GPU,也能率先支持數十種國產算力。不管是圍繞大模型的超大集群訓練場景,還是針對于特定的AI推理場景,都有更多元化的算力產品和適配能力。
3. 通過元腦生態(tài),打造AIGC時代的生態(tài)鏈。不論是浪潮信息自身推廣的算力算法服務,還是圍繞更多的合作伙伴,基于這種生態(tài)把伙伴的能力開放共享給更多的終端客戶。在這個過程中,或許有人是鎖,有人是鑰匙,一旦鎖找到了鑰匙,就是迸發(fā)中心的商業(yè)模型。To B領域的業(yè)務正在AIGC的時代被逐個重塑。也許新的商機就在不遠處。
面對如雨后春筍般的大模型,我們是否真的已經準備好了掘金AIGC?除了面對技術的挑戰(zhàn)之外,在技術與產業(yè)的這臺天平上,通過生態(tài)形成協同優(yōu)勢的重要性,也漸漸顯露了出來。聚生態(tài)之力,普惠AIGC,讓AIGC真的成為像「水一樣的利萬物」,是當下最好的答案。而這,也是浪潮信息元腦生態(tài)始終在踐行的。