導讀:上周,2018年度的斯坦福AI報告發(fā)布,從學界、企業(yè)、政府和公眾等不同主體出發(fā),通過論文發(fā)布及引用、學術會議、初創(chuàng)公司、技術進展等幾個主題對當前全球人工智能格局進行了全面的數(shù)據(jù)呈現(xiàn)和分析解讀。
上周,2018年度的斯坦福AI報告發(fā)布,從學界、企業(yè)、政府和公眾等不同主體出發(fā),對人工智能當前的進展進行了數(shù)據(jù)呈現(xiàn)。經(jīng)過長期的跟蹤、整理和分析人工智能相關數(shù)據(jù),報告發(fā)現(xiàn),美國目前在人工智能的學術影響力專利產(chǎn)出、和商業(yè)活躍質量具有明顯優(yōu)勢,中國則在學術論文發(fā)表方面相當高產(chǎn),但就發(fā)展質量而言仍有待提升。在人工智能內部,機器學習和概率推理、神經(jīng)網(wǎng)絡、計算機視覺三個子領域備受學界關注,這也影響到了企業(yè)創(chuàng)業(yè)和人才需求。
以下,億歐智庫以論文發(fā)布、論文引用、學術會議、初創(chuàng)公司等幾個模塊,對報告的主要內容進行呈現(xiàn)整理:
從發(fā)布論文主題來看,AI相關的論文增速(8x)在2010年后已經(jīng)大幅超過計算機科學領域(6x),從一定程度表明人工智能領域的論文增長不僅僅是由人們對計算機科學興趣的提高所驅動的。
從區(qū)域來看,歐洲一直是AI論文主要的發(fā)布來源地,占到整體的28%。中國(25%)自2006年后開始超越美國(17%),并在2008年實現(xiàn)出版數(shù)的高漲,報告推測是《國家中長期科學和技術發(fā)展規(guī)劃綱要(2006-2020)》和其他政府項目為人工智能研究提供資金和一系列激勵政策的結果。
在AI領域的子類目中(類別間不互相排斥),機器學習和概率推理(Machine Learning and Probabilistic Reasoning)占到最高比例,為56%,而神經(jīng)網(wǎng)絡(Neural Networks)是2014年以來增速最快的研究領域,年復合增長率達到37%。計算機視覺也保持了較高的增速。搜索及優(yōu)化、自然語言處理及知識表示、模糊系統(tǒng)、規(guī)劃和決策類論文目前還未呈現(xiàn)大的增長。
ArXiv是收錄科學文獻預印本的在線數(shù)據(jù)庫(其中預印本是指學者的還未在正式出版物上發(fā)表,而出于和同行交流目的自愿發(fā)布的科研論文或報告),投稿量每月高達上萬篇。鑒于知識的更迭速度和研究主題的競爭性,學者往往會在漫長的期刊/學術會議審核期之前就投稿在ArXiv上。數(shù)據(jù)顯示投稿的AI相關論文整體呈現(xiàn)增長,其中計算機視覺和模式識別占最大比例,體現(xiàn)了學者較高的傳播意愿。
從關注領域來看,中國對AI的研究側重于工程技術和農(nóng)業(yè)科技,歐美則集中在人文和醫(yī)藥科學。
從論文發(fā)布的主體來看,學術論文仍占絕大部分,其次則來自政府、企業(yè)。以中國為例,92%的AI論文來自學術領域。此外,2017年中國政府主體發(fā)布的論文是企業(yè)的4倍。而美國的企業(yè)主體發(fā)布的論文不論從數(shù)量還是所占比例來講都高于中國。由此可見,美國在人工智能科研方面的商業(yè)化驅動力相對更強。
FWCI(Field-Weighted Citation Impact,領域權重引用影響系數(shù))是指該區(qū)域AI學者收到的平均引用次數(shù)除以所有AI作者的平均引用次數(shù),能在一定程度反映論文質量。從數(shù)據(jù)來看美國的FWCI指數(shù)達到1.83,盡管歐洲的AI論文發(fā)布量最高,但其FWCI指數(shù)略高于平均水平。中國的論文質量則在持續(xù)穩(wěn)步的提高中。
考慮到AI學者的國際流動性,報告也針對做出研究。數(shù)據(jù)顯示,中美歐三個區(qū)域的久居型學者(指從未遷移至外國發(fā)表論文)的產(chǎn)出率最低,而那些動態(tài)遷出遷入的“候鳥型”作者的論文產(chǎn)出和被引用水平更高。其中中國的久居型學者所占比例最高(75%),相比歐美同類型學者更加高產(chǎn),但論文質量仍有待提升。
在AI相關的老牌學術會議中,NeurIPS(神經(jīng)信息處理系統(tǒng)大會)、CVPR(計算機視覺與模式識別會議)、ICML(國際機器學習大會)人數(shù)增長較快。此外,學界對深度學習和強化學習的關注,助推ICLR(國際學習表征會議)的新興小型學術會議規(guī)??焖僭鲩L。
AAAI(美國人工智能協(xié)會)作為國際性的重要AI學術會議,具備較強的專業(yè)度和影響力。按所屬國家對會議提交和接受的論文歸類,70%均來自于中美兩國,兩國的論文通過率分別為29%、21%。
如今,超過50%的人工智能相關機構是非營利組織,包括美國公民自由聯(lián)盟、牛津大學人類未來研究所和聯(lián)合國開發(fā)計劃署。同時,人們更加認識到性別和種族多樣性對AI進步的重要性,AI4ALL和WiML等鼓勵多元群體參與到AI研究的組織成員數(shù)有所增加。
報告通過統(tǒng)計美國初創(chuàng)公司(接受過風險投資支持)每年的累計數(shù)量,發(fā)現(xiàn)在初創(chuàng)公司數(shù)量整體穩(wěn)步增長的同時,AI領域初創(chuàng)公司則開始呈現(xiàn)指數(shù)級增長的趨勢,成為創(chuàng)業(yè)主旋律。
每年獨立的風險投資數(shù)額呈現(xiàn)波動趨勢。自2015年以來,AI領域的投資金額迅速高漲,峰值比2014年來的風投擴張期來得更早。
在此背景下,企業(yè)對人工智能相關人才的需求也更加旺盛,機器學習和深度學習尤為明顯,其中深度學習的職位需求在2015~2017年間有了35倍的增長。
針對紐交所上市公司,研究發(fā)現(xiàn),財報電話會議中提及人工智能和機器學習的頻次自2015年來大幅增長。而提及兩者最多的行業(yè)依次是IT、非必需消費品、金融和醫(yī)療保健行業(yè),企業(yè)則分別是英偉達(AI提及93次)、Alphabet(機器學習提及57次)。在中國,大量的科技和互聯(lián)網(wǎng)公司也呈現(xiàn)言必提AI的程度。
麥肯錫在2018年對受訪者所在公司在某些業(yè)務中嵌入AI功能的情況進行了調研,結果發(fā)現(xiàn)不同的人工智能技術在世界各地和不同行業(yè)中得到廣泛采用,大約一半的公司已經(jīng)將人工智能嵌入到公司的業(yè)務流程中。然而,AI應用還處在早期,大多數(shù)公司還未采取措施從人工智能大規(guī)模獲取價值。
在2015年,ImageNet視覺識別挑戰(zhàn)賽中的算法模型識別精度已經(jīng)超過人類水平,2017年進一步提升至了97%左右。盡管競賽在2017年已是最后一屆,ImageNet2012開放數(shù)據(jù)集仍在被引用,可以說,ImageNet所構建的規(guī)則為研究者提供了標準的研究度量進行比較競爭。
利用ImageNet數(shù)據(jù)集培訓能夠進行高精度圖像分類的大型網(wǎng)絡在以往需要耗費不少時間。對于擁有足夠資源機進行開發(fā)的參與者而言,培訓網(wǎng)絡所需的時間已經(jīng)從一年半前的1小時降到了大約4分鐘,速度提升了16倍,算法創(chuàng)新和硬件進步在其中發(fā)揮了重要作用。
其他如COCO(微軟發(fā)布的圖像數(shù)據(jù)庫,用于對象檢測、分割、人體關鍵點檢測、語義分割和字幕生成等)、Parsing(語法分析)、機器翻譯、機器問答等競賽或應用領域在近年來的算法精度也均有不同程度的提高,此處不一一贅述。
專利:從區(qū)域來看,2014年,人工智能專利中有30%便來自美國,其次則是日、韓兩國,各占有16%的比例。
學校開設課程:AI的火熱也發(fā)生在高校中,學生報名注冊人工智能和機器學習的比例和數(shù)量也隨之增長。在報告的統(tǒng)計的幾所美國頂尖計算機科學高校中,2017年機器學習基礎課程的注冊人數(shù)是2012年水平的5倍,AI課程注冊人數(shù)是2012年的3.4倍。在中國,清華大學的AI及機器學習課程自2010年到2017年更是實現(xiàn)了16倍的增長。
Github星數(shù):GitHub(知名開源軟件網(wǎng)站)的星數(shù)類似于關注數(shù),基本能判定AI編程語言的流行程度。目前TensorFlow(Google)一騎絕塵,其后是Pytorch(Facebook)、mxnet(Amazon)。
ROS安裝:ROS(robot operating system,機器人操作系統(tǒng))是目前在人工智能領域被廣泛使用的機器人軟件平臺。自2014年, 來自唯一IP地址的ROS安裝包下載次數(shù)實現(xiàn)了567%的增長。從頁面瀏覽量來看,中國增長最為明顯,值得一提的是,百度的自動駕駛平臺Apollo就是基于ROS開發(fā)的。
工業(yè)機器人安裝量:自2012年以來,中國每年的機器人安裝量增長了500%,而韓國和歐洲等其他地區(qū)分別增長了105%和122%。
媒體報道情緒:在包含人工智能一次的媒體文章中,情感表達正面的文章所占比例逐步增多,為30%,負面文章則一直保持低水平。
政府關注度:通過采集美國、加拿大、英國議會的記錄文本,報告發(fā)現(xiàn)自2016年來政府對人工智能和機器學習的提及次數(shù)大幅增加。
報告最后還列舉了歷年來重要的里程碑式事件、中國及歐美政府在人工智能領域的主要舉措、專家對人工智能目前缺陷所給的建議等內容。以上僅對報告的主體部分進行了闡述,如需了解報告完整內容,官網(wǎng)鏈接如下:https://aiindex.org/