導(dǎo)讀:人工智能已經(jīng)成為目前芯片行業(yè)的一個重要驅(qū)動力。回顧人工智能在半導(dǎo)體行業(yè)的發(fā)展,我們可以清晰地看到一條從云到終端的演進(jìn)路線。
人工智能已經(jīng)成為目前芯片行業(yè)的一個重要驅(qū)動力?;仡櫲斯ぶ悄茉诎雽?dǎo)體行業(yè)的發(fā)展,我們可以清晰地看到一條從云到終端的演進(jìn)路線。
最初,人工智能主要是作為一種服務(wù)部署在云端。本代人工智能基于大數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò),因此在訓(xùn)練時候需要大量的算力,在云端部署的時候也需要算力做支撐,因此云端人工智能領(lǐng)域中以Nvidia為代表的GPU加速人工智能成為了關(guān)注焦點,同時也有以Graphcore、Habana為代表的云端專用人工智能芯片公司與GPU分庭抗禮。2018年之后,隨著模型和芯片設(shè)計的優(yōu)化,人工智能逐漸從云端下沉到手機(jī)等強(qiáng)智能設(shè)備終端,在手機(jī)上基于人工智能算法的超分辨、美顏、人臉識別等應(yīng)用也漸漸得到了主流認(rèn)可,相應(yīng)的芯片(IP)也就成為了手機(jī)SoC上不可或缺的一部分,高通、蘋果、華為海思等都擁有自己的高性能人工智能加速IP,用以支持手機(jī)人工智能應(yīng)用。
而隨著人工智能技術(shù)的進(jìn)一步演進(jìn),我們看到它正在進(jìn)一步和物聯(lián)網(wǎng)結(jié)合,超低功耗人工智能正是這個人工智能繼續(xù)下沉的新動向。
超低功耗人工智能芯片的應(yīng)用場景
超低功耗人工智能芯片(IP)的工作功耗在數(shù)十毫瓦或更低(作為比較,手機(jī)端人工智能IP的工作功耗往往在數(shù)百毫瓦到瓦級別,而云端人工智能加速卡功耗通常在數(shù)百瓦),同時往往結(jié)合事件驅(qū)動技術(shù),即絕大部分時間計算部分都處于休眠狀態(tài),僅僅在發(fā)生相關(guān)事件時才會啟動,這樣就可以把平均功耗降低到毫瓦數(shù)量級以下。
超低功耗人工智能可以應(yīng)用在什么場景下呢?消費電子領(lǐng)域中就有超低功耗人工智能的一席之地。在下一代智能設(shè)備如可穿戴設(shè)備和智能眼鏡類設(shè)備中,設(shè)備由于尺寸等原因電池容量有限,而這些設(shè)備需要執(zhí)行智能生物信號處理(例如智能手表上的心率檢測)、手勢識別(例如在目前的HoloLens中,基于人工智能的手勢識別是主要用戶交互方式)、語音識別等等,因此需要非常高能效比的人工智能加速模塊。除此之外,在智能家庭等領(lǐng)域,超低功耗人工智能也有落地機(jī)會,例如目前的智能門鎖市場,加入人臉識別會使智能門鎖的用戶體驗大大改善,但是智能門鎖通常必須依靠電池供電,而且預(yù)期的電池壽命至少要半年到一年,這樣一來對于執(zhí)行人工智能計算的模塊就提出了非常高的能效比需求。
除了消費電子之外,工業(yè)應(yīng)用中也需要超低功耗人工智能。工業(yè)應(yīng)用中對于超低功耗人工智能的需求往往來源于智能傳感器。這類傳感器安裝在機(jī)器、機(jī)械臂、管道等重要環(huán)境中,需要能時刻監(jiān)測各類信號并且運(yùn)行相應(yīng)的人工智能算法來判斷運(yùn)行狀況。在這些場景下,傳感器必須依靠電池供電,而超低功耗人工智能可以大大減少電池消耗,這也意味著傳感器更換電池的間隔可以提升,這也就大大降低了這類傳感器系統(tǒng)的部署和維護(hù)成本。
超低功耗人工智能芯片的技術(shù)路徑
目前,超低功耗人工智能芯片大概可以分為三種技術(shù)路徑。
首先是基于數(shù)字電路的超低功耗人工智能加速模塊設(shè)計。使用數(shù)字電路向超低功耗方向的優(yōu)化方法首先是從系統(tǒng)架構(gòu)層面做優(yōu)化,盡量減小模型的體積,并優(yōu)化數(shù)據(jù)流以降低內(nèi)存訪問開銷。此外,在電路層面可以降低電源電壓,甚至使用亞閾值邏輯門設(shè)計,以降低電路運(yùn)行時的功耗,以及漏電流。使用數(shù)字電路方法的優(yōu)勢在于可以更容易地與人工智能計算之外的模塊集成并構(gòu)成SoC,而無需在數(shù)模轉(zhuǎn)換上消耗額外能量。
第二條技術(shù)路徑是使用模擬計算來完成神經(jīng)網(wǎng)絡(luò)的計算。模擬計算往往和內(nèi)存內(nèi)計算相結(jié)合以實現(xiàn)高能效比,其具體的思路是目前人工智能計算中往往存儲訪問是能量消耗最大的部分,而使用模擬計算則可以在存儲(如SRAM或Flash等NVM)讀出電路中直接做計算,這樣就省去了數(shù)據(jù)讀出再計算的步驟,而可以直接在內(nèi)存內(nèi)完成計算。使用模擬計算配合內(nèi)存內(nèi)計算往往可以實現(xiàn)很高的能效比,例如歐洲的著名半導(dǎo)體研究機(jī)構(gòu)IMEC宣布將在未來數(shù)年內(nèi)完成能效比高達(dá)10000TOPS/W的模擬計算人工智能加速模塊。但是模擬計算對于模型往往有較多限制,例如必須在計算精度較低時仍然能保證準(zhǔn)確率等,因此需要很好的軟件/硬件協(xié)同設(shè)計。
存內(nèi)模擬計算是超低功耗人工智能的主要技術(shù)路徑之一
第三條道路則是在模型設(shè)計上使用脈沖神經(jīng)網(wǎng)絡(luò)的設(shè)計(神經(jīng)模態(tài)芯片)。使用脈沖神經(jīng)網(wǎng)絡(luò)設(shè)計的神經(jīng)模態(tài)芯片僅僅在神經(jīng)元被激活時消耗能量,而絕大部分神經(jīng)元在大部分情況下都處于休眠狀態(tài)而幾乎不消耗能量,因此其平均能效比可以做到比基于主流卷積神經(jīng)網(wǎng)絡(luò)的芯片高一個數(shù)量級。脈沖神經(jīng)網(wǎng)絡(luò)和神經(jīng)模態(tài)芯片的難點主要在于模型設(shè)計和訓(xùn)練上存在很高的門檻,此外如何對相應(yīng)的脈沖神經(jīng)網(wǎng)絡(luò)模型做電路級優(yōu)化也有很高的技術(shù)含量。
超低功耗人工智能芯片競爭格局:中國公司占據(jù)有利地位
超低功耗人工智能芯片市場目前仍然處于起步階段,但是隨著未來物聯(lián)網(wǎng)和下一代智能設(shè)備的技術(shù)演進(jìn),預(yù)計在未來幾年內(nèi)市場熱度會越來越高。目前,從事超低功耗人工智能芯片開發(fā)的主要初創(chuàng)公司,但是未來超低功耗人工智能芯片的下一代領(lǐng)導(dǎo)者很可能就出現(xiàn)在這些初創(chuàng)公司中。
在消費電子領(lǐng)域,美國的Syntiant得到了亞馬遜Alexa Fund、微軟M12和Intel Capital等行業(yè)資本的支持,其主要產(chǎn)品是針對智能設(shè)備語音處理的超低功耗芯片。與此相對,中國的初創(chuàng)公司在這個領(lǐng)域的布局則更加多樣。來自清華大學(xué)的清微科技使用可重構(gòu)電路技術(shù),其超低功耗產(chǎn)品能覆蓋語音識別、視覺識別等多個領(lǐng)域,可望為下一代智能設(shè)備賦能。另一家中國公司則是SynSense,SynSense的技術(shù)路線是使用脈沖神經(jīng)網(wǎng)絡(luò),技術(shù)來自于神經(jīng)脈沖網(wǎng)絡(luò)權(quán)威,蘇黎世大學(xué)Giacomo Indiveri教授的團(tuán)隊。目前SynSense的脈沖神經(jīng)網(wǎng)絡(luò)已經(jīng)完成了多次流片迭代和驗證,相關(guān)的產(chǎn)品覆蓋了視覺、生物信號處理、語音識別等,平均功耗可以低至微瓦數(shù)量級。此外,SynSense還于最近推出了使用神經(jīng)脈沖網(wǎng)絡(luò)結(jié)合動態(tài)視覺傳感器DVS的產(chǎn)品Speck,該產(chǎn)品能真正實現(xiàn)事件驅(qū)動,在絕大多數(shù)時間運(yùn)行于超低的功耗下,而在檢測到動態(tài)事件后DVS能提供超高的視覺采樣頻率,并且配合脈沖神經(jīng)網(wǎng)絡(luò)實現(xiàn)超高性能/超低延遲的視覺信號處理,從而兼具超低功耗和高性能。
而在工業(yè)應(yīng)用領(lǐng)域,同樣來自清華大學(xué)的湃方科技走在了全球前列,成為了在工業(yè)領(lǐng)域能真正落地的超低功耗人工智能算法和芯片解決方案公司。湃方科技的應(yīng)用場景涵蓋了衛(wèi)星、機(jī)械臂、發(fā)電機(jī)、電機(jī)等等重要的工業(yè)應(yīng)用,其芯片能提供高達(dá)50TOPS/W的能效比。
目前,在超低功耗人工智能芯片領(lǐng)域,中國的初創(chuàng)公司和團(tuán)隊無論是數(shù)量還是質(zhì)量都走在了全球前列。讓我們期待中國能在未來的超低功耗人工智能領(lǐng)域繼續(xù)引領(lǐng)全球的潮流。