應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊個(gè)人注冊登錄

脫碳入硅,美國SaaS企業(yè)的智能化進(jìn)程

2019-09-09 09:42 虞兆愷Kelvin
關(guān)鍵詞:SaaSSaaS產(chǎn)業(yè)

導(dǎo)讀:人是一種由規(guī)則組成的碳基生命,進(jìn)食之于存續(xù),猶如生病之于凋零。企業(yè)組織是一種由規(guī)則組成的群體,在人類進(jìn)化的長河中,將人所被制定的規(guī)則轉(zhuǎn)嫁到了組織之上,直到現(xiàn)在,企業(yè)成為了新的群體性生命。

融資,金融,美國SaaS,SaaS,中國SaaS,SaaS產(chǎn)業(yè)

圖片來自“123RF”

作者介紹:

本文作者虞兆愷Kelvin現(xiàn)就讀于普林斯頓大學(xué)計(jì)算機(jī)科學(xué)本科二年級,于2019年6月加入線性資本作為全職暑期實(shí)習(xí)生。

他的郵箱為zkyu@princeton.edu,對此話題感興趣的讀者可以與他聯(lián)系,感謝來信。

▍編者按

人是一種由規(guī)則組成的碳基生命,進(jìn)食之于存續(xù),猶如生病之于凋零。

而企業(yè)組織是一種由規(guī)則組成的群體,在人類進(jìn)化的長河中,將人所被制定的規(guī)則轉(zhuǎn)嫁到了組織之上,直到現(xiàn)在,企業(yè)成為了新的群體性生命。

直覺是發(fā)自內(nèi)心的,而理性則是反人性的。

企業(yè)的管理如同人的生存之道,這是一個(gè)由直覺慢慢總結(jié)為經(jīng)驗(yàn),再由經(jīng)驗(yàn)出發(fā)提煉出規(guī)則的過程。

就像對于獵食動(dòng)物的恐懼深植在草原部落上原始祖先的海馬體中,同樣的,對于企業(yè)組織的未雨綢繆也是企業(yè)領(lǐng)導(dǎo)記憶深處的商業(yè)案例的反射。

所以,靠直覺和經(jīng)驗(yàn)管理企業(yè),是企業(yè)大腦中最直接的反射。

一套可被參照且自動(dòng)執(zhí)行的智能化流程,是每一個(gè)企業(yè)最終極的理想。

從最早由經(jīng)驗(yàn)管理公司,再到S.O.P.的出現(xiàn),借由網(wǎng)絡(luò)把S.O.P搬上云端變?yōu)镾aaS,最后,其實(shí)還是期望能進(jìn)化成可被AI執(zhí)行的流程。

但是,對于經(jīng)驗(yàn)的迷信,對于證據(jù)的直覺依賴,是存于人類碳基結(jié)構(gòu)的基因之中的。

基于硅體的人工智能不是要復(fù)制人的智能,而只是要適應(yīng)經(jīng)驗(yàn)的短板。

本文作者縱覽發(fā)跡于美國硅谷與其他北美地區(qū)的SaaS企業(yè),希望能較為全面地展示一套企業(yè)組織如何利用A.I.進(jìn)入到智能化的進(jìn)程中,勾畫一個(gè)脫碳入硅的藍(lán)圖,為中國SaaS企業(yè)提供方法論的參考。

▍作者序

111.jpg

橫軸表示為公司規(guī)模(以員工數(shù)量單位);縱軸表示為SaaS產(chǎn)品的使用量

眾所周知,美國的企業(yè)們擁有世界上相對來說最深厚的技術(shù)儲備。

隨著各個(gè)體量的大小公司紛紛采購SaaS產(chǎn)品,服務(wù)于企業(yè)端的軟件數(shù)量激增,也因此造就了一條成熟的軟件供給與采購的鏈條。

以銷售科技類公司Chiefmartec為例,在2011年公司旗下?lián)碛?50名銷售人員,覆蓋了廣告、內(nèi)容管理、客戶關(guān)系管理、銷售、數(shù)據(jù)分析與公司運(yùn)營管理等領(lǐng)域。

這一數(shù)字在2017年達(dá)到了5000名,在如今的2019年更是達(dá)到了7040名。

222.jpg

2011年度的銷售科技板塊:共有150家供貨商

333.jpg

2017年度的銷售科技板塊:共有5000家供貨商,到了2019年,數(shù)字為7040家供應(yīng)商

現(xiàn)如今的美國SaaS市場以趨近于飽和,且已經(jīng)出現(xiàn)了許多平臺級的解決方案。

為了用來區(qū)分這些產(chǎn)品,我們將傳統(tǒng)的SaaS公司歸納為四個(gè)不同屬性的戰(zhàn)略:

1. 用戶精準(zhǔn)型

區(qū)別于傳統(tǒng)通用的解決方案,比如Salesforce所提供的,用戶精準(zhǔn)型的企業(yè)擅于在一個(gè)絕對垂直領(lǐng)域?yàn)槠淇蛻艏?xì)分提供適配且精準(zhǔn)的服務(wù),在一定程度上放棄了廣闊的市場來達(dá)成市場與產(chǎn)品的高度匹配,即「Product-Market-Fit」。

2. 市場細(xì)分型

與前者不同的是,市場細(xì)分型的企業(yè)是從一個(gè)市場大小的絕對值來看的,這類企業(yè)專注在一個(gè)體量比較有限的市場細(xì)分下,比如專門服務(wù)中小型企業(yè),即「Small and Medium-sized Businesses, SMBs」。

3. 產(chǎn)品精耕型

產(chǎn)品精耕型企業(yè)的產(chǎn)品通常強(qiáng)調(diào)極大限度地優(yōu)化產(chǎn)品,可能僅以20%的產(chǎn)品功能便獲得了80%的回報(bào),以一個(gè)極簡化的姿態(tài)來參與市場競爭。

4. 雙邊優(yōu)化型

雙邊指的是客戶端與企業(yè)端,雙邊優(yōu)化型的企業(yè)擅于在產(chǎn)品戰(zhàn)略上讓企業(yè)端與客戶端同時(shí)產(chǎn)出價(jià)值,讓客戶成為產(chǎn)品自傳播的渠道,從而提升企業(yè)價(jià)值。

但是,在過去幾年中,我們開始看到一種更為獨(dú)特的企業(yè)戰(zhàn)略,并且因此孕育了一大批新興企業(yè)。

盡管在這些企業(yè)中,他們擁有不同的行業(yè)區(qū)分和業(yè)務(wù)區(qū)分,但是他們都擁有一個(gè)共同的「人工智能先行的戰(zhàn)略」,即「AI-First Strategy」。

AI為傳統(tǒng)SaaS賦能的過程,可以被看作是一場范式的躍遷。

因?yàn)锳I賦能之后的軟件行業(yè),將呈現(xiàn)出一些從未有過的業(yè)務(wù)形態(tài)、一種千人千面的使用體驗(yàn)、一個(gè)未曾想過的商業(yè)潛能。

但這也不是說所有的商業(yè)模型都適合被AI智能化,企業(yè)需要考慮的是從傳統(tǒng)架構(gòu)遷移到智能化平臺后所帶來的投資回報(bào),一味地追求數(shù)字化與智能化,并不會簡單地提升所有業(yè)務(wù)的價(jià)值。

因此,本文的核心訴求是給予讀者一個(gè)價(jià)值判斷的框架,去理解這個(gè)時(shí)代變遷后的商業(yè)新格局,從新的緯度來看目前格局的企業(yè)劃分,以及思考一下人工智能為行業(yè)和企業(yè)帶來的結(jié)果。

在接下來的章節(jié)中,將要為讀者展示三種獨(dú)特的AI結(jié)合SaaS戰(zhàn)略,正式他們讓這些新興企業(yè)與傳統(tǒng)SaaS服務(wù)提供商區(qū)別開來,以及五個(gè)來自不同公司的AI應(yīng)用。

另外,在最后一個(gè)章節(jié)中,將要討論為什么SaaS企業(yè)的AI賦能卻不能帶來一個(gè)贏者通吃的終局。

值得一提的是,企業(yè)AI智能化產(chǎn)業(yè)的先驅(qū)之一李開復(fù)博士是極為看好AI賦能的未來,但是在這里本文根據(jù)三個(gè)緯度的數(shù)據(jù)分析,來一一駁斥其中玄機(jī)。

▍三種獨(dú)特的AI+SaaS結(jié)合戰(zhàn)略

AI+SaaS結(jié)合型的企業(yè)在功能上也具備之前提到的四種戰(zhàn)略的特征,并且在一定程度上,大部分企業(yè)可以很輕易使用用戶精準(zhǔn)型戰(zhàn)略的。

但是AI為這些新興企業(yè)賦予了一個(gè)全新的產(chǎn)品形態(tài),這點(diǎn)是傳統(tǒng)SaaS企業(yè)難以望其項(xiàng)背的。

舉例來說,隨著計(jì)算機(jī)視覺技術(shù)的演進(jìn),一個(gè)基于面部捕捉和情感分析的商業(yè)智能化產(chǎn)業(yè)就被開辟出來了。

如今,經(jīng)銷商可以根據(jù)客戶在購物過程中的體態(tài)和表情變化來分析哪一類商品更受歡迎,大學(xué)課堂上的演講和當(dāng)堂反應(yīng)也可以被用來分析哪一位老師更能吸引學(xué)生注意力。

所以,「AI先行」的公司可以被歸納為三種獨(dú)特的戰(zhàn)略模式:

1. 能借助AI運(yùn)行超復(fù)雜系統(tǒng)和超負(fù)荷任務(wù)。

以Invenica為例,憑借基于機(jī)器學(xué)習(xí)開發(fā)的預(yù)測模型能夠通過預(yù)測多個(gè)單點(diǎn)電力柵極的活動(dòng)狀態(tài)來管理整個(gè)復(fù)雜的電力網(wǎng)。憑借此項(xiàng)技術(shù),Invenica更是拿下多個(gè)訂單,為多個(gè)管理系統(tǒng)提供預(yù)測模型。

2. 能夠借助AI轉(zhuǎn)錄和分析以往并不能被數(shù)字化的數(shù)據(jù)形式(e.g. 計(jì)算機(jī)視覺)。

拿Tractable AI來說,其AI+SaaS的解決方案被應(yīng)用于汽車保險(xiǎn)領(lǐng)域,通過一套成熟的計(jì)算機(jī)視覺算法,在經(jīng)過成千上萬張受損汽車的圖片集訓(xùn)練之后,能夠精準(zhǔn)快速的分揀車禍保單并移交到相應(yīng)的流程化處理環(huán)節(jié)。

3. 能夠借助AI將傳統(tǒng)SaaS的體驗(yàn)提升10倍以上。

在這里舉一個(gè)中國公司的例子,助理來也通過搭建智能化的自動(dòng)應(yīng)答機(jī)器人為企業(yè)提供了一個(gè)定制化場景的客服應(yīng)答體驗(yàn)。

「AI先行」的定義可以被詮釋為「缺少了AI的賦能,產(chǎn)品所提供的核心價(jià)值將一無是處」。

換言之,一個(gè)真正的以「AI先行」為核心戰(zhàn)略的企業(yè)應(yīng)將AI納入其價(jià)值主張之中。

如果剔除掉AI技術(shù),「AI先行」企業(yè)將運(yùn)行超復(fù)雜系統(tǒng)和超負(fù)荷任務(wù);同理,缺少了AI,「AI先行」企業(yè)將無法理解極為抽象的數(shù)據(jù)形態(tài),更談何在其上建構(gòu)邏輯關(guān)系;如果沒有了AI,那與傳統(tǒng)SaaS企業(yè)和企業(yè)服務(wù)產(chǎn)品有何不同,在已經(jīng)飽和的市場何來容身之地。

▍三種獨(dú)特的AI+SaaS結(jié)合戰(zhàn)略

如前文所述,「AI先行」的SaaS企業(yè)與傳統(tǒng)SaaS企業(yè)在本質(zhì)上是不同的,接下來我們將探討一下AI在企業(yè)級服務(wù)中的實(shí)際作用。

盡管AI的功能性劃分不盡其數(shù),我們不妨以一種終局的思維分類一下AI多起的作用。傳統(tǒng)的功能性劃分將AI拆解如下:

首先,智能應(yīng)用的目的是為了分析商業(yè)形式,即「模式識別Pattern Recognition」;其次,便是對未來可能性的預(yù)測,即「預(yù)測分析Predictive Analytics」;然后,是針對特定限制條件的行為設(shè)定以達(dá)成結(jié)果優(yōu)化,即「行為優(yōu)化Optimization」;接著,將這套方法融合進(jìn)特定的應(yīng)用場景中,即「場景定制Personalization」;最后,達(dá)成在復(fù)雜數(shù)據(jù)之上建立邏輯關(guān)聯(lián),以此將這套算法推廣,即「數(shù)據(jù)商用Data-as-a-Commodity」。

我們沿著這個(gè)邏輯,將公司分別在垂直業(yè)務(wù)和平行行業(yè)兩個(gè)緯度做更細(xì)化的解讀:

模式識別

在「模式識別」這個(gè)語境中的企業(yè)往往擅于從龐大的歷史數(shù)據(jù)中找出隱藏著的關(guān)聯(lián)性,但是這樣僅僅是幫助他們理解過去、分析現(xiàn)在,卻不能預(yù)測未來。

舉例來說,Tractable公司從車禍照片的數(shù)據(jù)中判斷出肇事者、損傷程度以及其他的數(shù)據(jù)樣本。

但需要注意的是,Tractable是在利用過去的數(shù)據(jù)來判斷當(dāng)下所發(fā)生的交通事故,并不能對何時(shí)何地發(fā)生交通事故做出預(yù)判。

承上,主要圍繞「模式識別」發(fā)展業(yè)務(wù)的公司在自動(dòng)化決策上是有點(diǎn)薄弱的。

這類公司雖然詬病粗放的人工操作,但是一定不會用機(jī)器取而代之。

因?yàn)椋麄冋J(rèn)為人工智能還沒有發(fā)展足夠可靠的地步,而往往項(xiàng)目的沉沒成本讓公司難以在一個(gè)機(jī)器程序上試錯(cuò)。

但是也有公司在嘗試跳出「模式識別」固有模式,這里有兩個(gè)典型的案例:

首當(dāng)其沖的是CB Insights公司,其業(yè)務(wù)核心便是利用聚合和分析私有公司底層數(shù)據(jù)的能力為投資機(jī)構(gòu)提供商業(yè)決策。

私有化投資其實(shí)和其他品類的投資產(chǎn)品類似,要求挖掘和分析跨行業(yè)的、極細(xì)顆粒度的行為數(shù)據(jù),這原本是人更擅長的抽象工作,而非機(jī)器。

第二個(gè)例子是利用「模式識別」在早期癌癥診斷上的應(yīng)用。

雖然基于AI技術(shù)的癌癥診斷工具在許多準(zhǔn)確性測試中都優(yōu)于人類,但是萬分之一誤診的可能性都是災(zāi)難性的,所以人類常常作為機(jī)器診斷的補(bǔ)充,在其后充當(dāng)著最后一道關(guān)卡。

444.jpg

預(yù)測分析

應(yīng)用「預(yù)測分析」技術(shù)的這類企業(yè)很好的詮釋了一個(gè)問題- “你從哪里來,要到哪里去?”

其實(shí),這類企業(yè)所預(yù)測和分析的遠(yuǎn)遠(yuǎn)超出了簡單地匹配模型并給出可能的預(yù)測。

在這個(gè)預(yù)測的基礎(chǔ)上,系統(tǒng)會給出一套可供人做執(zhí)行的深度建議或直接用機(jī)器自動(dòng)執(zhí)行任務(wù)。

以Zest Finance為例,這家企業(yè)利用機(jī)器學(xué)習(xí)幫助借款人可以做更快、更精準(zhǔn)的貸款信用的評判。

另一個(gè)例子是InsideSales,這家企業(yè)通過一個(gè)基于人工智能的智能系統(tǒng)為客戶做推薦,并實(shí)現(xiàn)了15% - 30%的轉(zhuǎn)化。

大多數(shù)情況下,預(yù)測過程呈現(xiàn)了一個(gè)黑箱狀態(tài),有一些分析預(yù)測型企業(yè)往往是將最終決策丟回給人工來操作。

但是,需要指出的是,由機(jī)器來做也無非是一個(gè)典型的二選一,比如對于Zest Finance來說就是「借」與「不借」的區(qū)別。

555.jpg

行為優(yōu)化

專注于「行為優(yōu)化」的企業(yè)們在解決的問題是- “如何才能在特定路徑上通過優(yōu)化自身決策來接近企業(yè)目標(biāo)?”

在過去,企業(yè)只能依靠一些不盡完美的標(biāo)的,諸如點(diǎn)擊率等來推測一個(gè)模糊的用戶動(dòng)向。

但是,自從有了人工智能技術(shù),各項(xiàng)業(yè)務(wù)都可以在極細(xì)分的數(shù)據(jù)集下來做分析,像是光標(biāo)路徑分析、頁面停留時(shí)間等等,以此來提升利潤空間和留存率等。

舉例來說,Nextail和Focal System這兩家零售領(lǐng)域的商業(yè)智能平臺通過分析存貨量和跨門店的購買歷史,以此給出一個(gè)合理的進(jìn)貨數(shù)量或是建議周轉(zhuǎn)調(diào)配到其他門店。

另一個(gè)例子是Amplero,它是一個(gè)主要做市場營銷的智能平臺,所做出的商業(yè)分析都是圍繞企業(yè)的績效指標(biāo)來指定的,而非傳統(tǒng)的諸如點(diǎn)擊率等提升銷售、利潤空間和留存率等。

表面上看,「行為優(yōu)化」與「預(yù)測分析」類似,兩者都是在做面向未來的決策。

但是,不同之處就在于「行為優(yōu)化」會給出現(xiàn)在可執(zhí)行的「行為建議」;而「預(yù)測分析」,正如其名,是提出可能的「未來走向」。

這就像是一個(gè)病人走進(jìn)醫(yī)院告訴醫(yī)生她感到胃疼,這種情況下,「預(yù)測分析」算法通常會基于病人的病史以及現(xiàn)在的胃部病癥來預(yù)測「未來走向」,接下來胃疼程度是會緩解還是更糟.

相較而言,「行為優(yōu)化」算法會給出一個(gè)「行為建議」來指導(dǎo)如何控制疼痛、判斷生存預(yù)期等等。

甚至,還是在這個(gè)例子中,「模式識別」算法也會利用相同的數(shù)據(jù)來判斷病人再次患病的概率。

666.png

場景定制

主要做「場景定制」業(yè)務(wù)的企業(yè)會利用人工智能技術(shù)營造一種私人訂制的體驗(yàn)給終端用戶。

還記得第三章第一節(jié)所著的Salesforce是如何打敗Oracle和SAP的嗎?

其勝利的主要原因就是傳統(tǒng)大廠即使提供了一系列產(chǎn)品服務(wù),但是很少能匹配云端的需求。

如今又是風(fēng)水輪流轉(zhuǎn),當(dāng)Salesforce身為SaaS大廠在做幾乎所有的事情的時(shí)候,也不能做到十全十美,因?yàn)樵诟鱾€(gè)細(xì)分領(lǐng)域都需要做到定制化和功能優(yōu)化。

根據(jù)細(xì)分需求是可以讓商業(yè)決策變得更加精準(zhǔn)的,以MailChimp為例,這是一個(gè)價(jià)值40億美金的市場營銷自動(dòng)化生意,這家企業(yè)為客戶提供郵件訂閱服務(wù)的營銷內(nèi)參,讓企業(yè)用戶們掌握客戶畫像以及點(diǎn)擊數(shù)據(jù)。

企業(yè)用戶可以輕易掌握到這些數(shù)據(jù),了解其客戶的所做所想,但是沒有「場景定制」的弊端就在于,這家企業(yè)的郵件訂閱內(nèi)容在同一時(shí)段給不客戶提供的是同樣的內(nèi)容。

客戶根據(jù)各自的需求去挑選合適的產(chǎn)品,但是大部分的SaaS營銷工具并不能提供場景定制化的功能。

但是有一家目前走過B輪的中國創(chuàng)業(yè)公司能提供不一樣的角度,那就是由人工智能驅(qū)動(dòng)的數(shù)字內(nèi)容平臺特贊,它為企業(yè)客戶提供了千人千面的網(wǎng)頁頭版和橫幅等的設(shè)計(jì)。

在一份埃森哲于2018年發(fā)布的調(diào)查中,來自歐洲和北美的8000名受訪者中有接近91%的人認(rèn)為基于個(gè)人需求定制的廣告和推薦是更受歡迎的,另有74%的人愿意提供個(gè)人數(shù)據(jù)以供運(yùn)營商為他們推送定制化內(nèi)容。

對于直接那些需要與客戶直接打交道的SaaS產(chǎn)品來說,諸如CRM平臺、市場營銷平臺還有聊天機(jī)器人應(yīng)用等等,擁有定制化的功能和內(nèi)容將為公司在早期建立起一定的競爭壁壘。

但是隨著人工智能商業(yè)化的普及,定制化需求正在成為必要的前提,提供定制化的服務(wù)一定是未來「AI+SaaS」的發(fā)展方向。

777.png

數(shù)據(jù)商用

當(dāng)數(shù)據(jù)收集的需求和對人工智能技術(shù)的依賴在不斷增加時(shí),便會產(chǎn)生平臺效應(yīng),一些高階的技術(shù)工具聚集在平臺之上可供各個(gè)量級的用戶調(diào)取,這就像是用戶在使用亞馬遜云服務(wù)平臺一樣方便。

谷歌便是利用其自身的人工智能和機(jī)器學(xué)習(xí)的技術(shù)儲備在向這樣一個(gè)開放的數(shù)據(jù)平臺發(fā)展,但是與其同時(shí),這一領(lǐng)域已經(jīng)匯集不少玩家。

比如說,有提供計(jì)算機(jī)視覺引擎API的Clarifai公司、提供人工數(shù)據(jù)整合服務(wù)的MostlyAI公司、為企業(yè)客戶提供原始銷售數(shù)據(jù)的Tonic公司等。

這些公司甚至不必成為一家真正的、以「AI」為核心的公司,因?yàn)樵谒麄兯幍母髯灶I(lǐng)域都在享受到有人工智能增值帶來的二階效應(yīng)。

以Segment和Snowflake為例,這兩家公司都推出了企業(yè)客戶系統(tǒng)化管理數(shù)據(jù)的服務(wù),但是他們都不是典型的有人工智能技術(shù)起家的公司,而且他們現(xiàn)在分別估值15億美元和39億美元。

「數(shù)據(jù)商用」型企業(yè)和此前提到的「場景定制」型企業(yè)類似,都是為典型的垂直領(lǐng)域用戶服務(wù),因?yàn)樗麄冋嬲谑圪u的是一種企業(yè)后臺工具。

不過數(shù)據(jù)/AI商用型公司與只服務(wù)于垂直場景的AI定制化公司的規(guī)模似乎比較能看到天花板,當(dāng)這個(gè)細(xì)分場景的掘金潮來臨時(shí),似乎是一門好生意。

Domino Data Lab的發(fā)跡歷史就是很好的證明,他們向數(shù)據(jù)科學(xué)家出售軟件解決方案,以此幫助他們的客戶進(jìn)行模型的快速搭建和配置。

自然地,他們也獲得了來自風(fēng)險(xiǎn)投資機(jī)構(gòu)的超過8000萬美元的融資。

888.jpg

▍為什么AI技術(shù)不會導(dǎo)向贏者通吃的市場終局

此前,我們已經(jīng)基本遍歷了AI在SaaS企業(yè)中的應(yīng)用前景。

而至于AI在SaaS企業(yè)中的應(yīng)用弊端,這就說來話長了。

不過,似乎有一種聲音正在出現(xiàn),即是通過應(yīng)用AI技術(shù)可以讓企業(yè)走向一個(gè)相對壟斷的市場地位。

因?yàn)锳I行業(yè)的入門門檻是相對高的,只有資源頂端的公司可以為如此高成本的人力買單。

與此同時(shí),AI的產(chǎn)業(yè)鏈條中,數(shù)據(jù)收集、將數(shù)據(jù)喂給AI模型、打造AI產(chǎn)品、收集更多數(shù)據(jù)來正向反饋給這個(gè)鏈條,可以看出這是一個(gè)贏者愈贏、強(qiáng)者愈強(qiáng)的局面。

表面上看,這是符合邏輯的,因?yàn)槟P褪且蕾囉诟_的數(shù)據(jù)源,只要是能獲取到精準(zhǔn)的數(shù)據(jù),那么占據(jù)在這個(gè)身位上就一定能比后來者更有先手優(yōu)勢。

而所訓(xùn)練出來的模型,反過來會讓先發(fā)企業(yè)創(chuàng)造更好的產(chǎn)品,這樣一來就擁有更多的資源去投入到獲取數(shù)據(jù)中。

知名的技術(shù)領(lǐng)域風(fēng)險(xiǎn)投資人、AI領(lǐng)域的研究專家李開復(fù)博士曾經(jīng)在其著作《AI·未來》中有總結(jié)到:

AI在某些行業(yè)內(nèi)是一定會取得贏者通吃的局面。深度學(xué)習(xí)與數(shù)據(jù)挖掘的關(guān)系造就了一個(gè)閉環(huán),并且在不斷地為優(yōu)秀的公司和產(chǎn)品賦能。

因?yàn)楦渥愕臄?shù)據(jù)會造就更優(yōu)秀的產(chǎn)品,這也會吸引更多的用戶,而用戶會產(chǎn)生更多的數(shù)據(jù)為產(chǎn)品迭代產(chǎn)生動(dòng)力。

這些數(shù)據(jù)池和其帶來的巨大利潤會為頭部的公司們吸引來頭部的開發(fā)人員,這樣一來,公司與公司之間的差距就愈發(fā)明顯

其實(shí),爭議主要圍繞三個(gè)最基本的假設(shè):

1. 頭部玩家可以在很長的一段時(shí)間持續(xù)獲取到有效數(shù)據(jù)。

2. 更多的數(shù)據(jù)和更好的模型之間存在線性正相關(guān)的關(guān)聯(lián)。

3. 未來AI方面的人才仍然處于一個(gè)供應(yīng)短缺的高價(jià)狀態(tài)。

顯然,這些假設(shè)并不能成立,而以下是三個(gè)駁斥點(diǎn):

1. AI技術(shù)和數(shù)據(jù)的商用化正在崛起。

2. 數(shù)據(jù)和數(shù)據(jù)產(chǎn)生的價(jià)值正逐漸成負(fù)相關(guān)。

3. AI技術(shù)從業(yè)者的入門門檻正在降低。

▍AI技術(shù)和數(shù)據(jù)的商用化正在崛起

當(dāng)數(shù)據(jù)收集的需求和對人工智能技術(shù)的依賴在不斷增加時(shí),便會產(chǎn)生平臺效應(yīng),一些高階的技術(shù)工具聚集在平臺之上可供各個(gè)量級的用戶調(diào)取,這就像是用戶在使用亞馬遜云服務(wù)平臺一樣方便。

谷歌便是利用其自身的人工智能和機(jī)器學(xué)習(xí)的技術(shù)儲備在向這樣一個(gè)開放的數(shù)據(jù)平臺發(fā)展,但是與其同時(shí),這一領(lǐng)域已經(jīng)匯集不少玩家。

比如說,有提供計(jì)算機(jī)視覺引擎API的Clarifai公司、提供人工數(shù)據(jù)整合服務(wù)的MostlyAI公司、為企業(yè)客戶提供原始銷售數(shù)據(jù)的Tonic公司等。

這些公司甚至不必成為一家真正的、以「AI」為核心的公司,因?yàn)樵谒麄兯幍母髯灶I(lǐng)域都在享受到有人工智能增值帶來的二階效應(yīng)。

以Segment和Snowflake為例,這兩家公司都推出了企業(yè)客戶系統(tǒng)化管理數(shù)據(jù)的服務(wù),但是他們都不是典型的有人工智能技術(shù)起家的公司,而且他們現(xiàn)在分別估值15億美元和39億美元。

999.jpg

開復(fù)老師認(rèn)為的頭部公司所具有的顯著優(yōu)勢是持續(xù)獲得有效數(shù)據(jù)的能力,但是在未來這一點(diǎn)很可能不復(fù)存在。

真實(shí)的數(shù)據(jù)生產(chǎn)過程是為了能測試和改進(jìn)AI模型的人工數(shù)據(jù)生產(chǎn)過程。

一個(gè)實(shí)現(xiàn)的基本路徑是記錄真實(shí)世界的數(shù)據(jù)是如何分布的,之后根據(jù)分布結(jié)果來做統(tǒng)計(jì)。

問題的復(fù)雜之處在于這個(gè)過程需要足夠先進(jìn)的收集方法,但是正如讀者所見,在文章開頭的板塊圖中,已經(jīng)有創(chuàng)業(yè)公司在嘗試「數(shù)據(jù)創(chuàng)造即服務(wù),Data-Generation-as-a-Service」。

此項(xiàng)技術(shù)已經(jīng)被Waymo和Tesla應(yīng)用在自動(dòng)駕駛的模擬中。

在2019年7月,Waymo已經(jīng)完成了1千萬英里的模擬駕駛,但于此同時(shí),真人駕駛的數(shù)據(jù)累計(jì)也才1千萬英里,此處可以看到模擬數(shù)據(jù)在執(zhí)行時(shí)的效率。

總結(jié)來說,獲取、管理、應(yīng)用數(shù)據(jù)正日益變得漸變,當(dāng)真實(shí)數(shù)據(jù)的生產(chǎn)方式讓相關(guān)數(shù)據(jù)變得更容易獲取時(shí),獨(dú)角獸企業(yè)Segmet和Snowflake證明了數(shù)據(jù)管理可以更簡化10倍,Clarifai和Google將AI集成到棧也可以更簡化10倍。

▍數(shù)據(jù)和數(shù)據(jù)產(chǎn)生的價(jià)值正逐漸成負(fù)相關(guān)

風(fēng)險(xiǎn)投資基金Andreessen Horowitz的投資人Martin Casado和Peter Lauten曾經(jīng)對于數(shù)據(jù)領(lǐng)域的護(hù)城河效應(yīng)有一個(gè)著名的論調(diào):

誠然,這個(gè)行業(yè)是有規(guī)模效應(yīng)的,但是我們觀察到數(shù)據(jù)領(lǐng)域的護(hù)城河并不穩(wěn)固。

因?yàn)楹蛡鹘y(tǒng)行業(yè)的規(guī)?;煌瑐鹘y(tǒng)行業(yè)往往越早吸引到投資,相對優(yōu)勢就越發(fā)明顯。

而數(shù)據(jù)領(lǐng)域其實(shí)有些背道而馳,獲取特異性的數(shù)據(jù)資源讓成本陡升,但是數(shù)據(jù)所累計(jì)的價(jià)值缺越來越不明顯。

有一種論調(diào)是說數(shù)據(jù)的門檻是當(dāng)收集了更多的數(shù)據(jù)之后能正向促進(jìn)模型的精準(zhǔn)度。

在某些語境下這是對的,比如當(dāng)AI可以很顯著地達(dá)成網(wǎng)絡(luò)效應(yīng)的地方(e.g. Tiktok)。

但是更多的時(shí)候,數(shù)據(jù)收集和清洗帶來的成本往往高居不下或持續(xù)增加,而新數(shù)據(jù)的多樣性卻不能被保證。

最終數(shù)據(jù)采集的價(jià)值曲線持續(xù)放緩,甚至?xí)兴芈洹?/p>

10.jpg

a16z基金還表示

以上圖表來自于Eloquent Labs的Aru Chaganty,顯示了客戶支持領(lǐng)域內(nèi)提交給智能問答機(jī)器人的一些提問。

在這其中,在20%的系統(tǒng)資源臨界點(diǎn),系統(tǒng)一共處理了20%的客戶請求。

在這個(gè)臨界點(diǎn)之上,數(shù)據(jù)處理的效率曲線不但明顯增長緩慢,處理成本也隨著數(shù)據(jù)抓去和清洗量上升而陡增。

另外一個(gè)值得注意的點(diǎn)是,數(shù)據(jù)分布的極限是往40%這個(gè)點(diǎn)無限趨近,這就意味著自動(dòng)應(yīng)答可被執(zhí)行的內(nèi)容范圍的極限就是這個(gè)量。

如果讀者熟悉機(jī)器學(xué)習(xí)的話,還可以從另一個(gè)角度來思考這個(gè)問題,那就是「主成分分析Principal Component Analysis」,即「PCA」。

「PCA」是一種數(shù)據(jù)降維算法,將n維特征映射到k維上,這k維是全新的正交特征也被稱為主成分,是在原有n維特征的基礎(chǔ)上重新構(gòu)造出來的k維特征。

事實(shí)上,在噪音較大的數(shù)據(jù)集中,在前幾個(gè)緯度內(nèi)捕捉到了大部分信號內(nèi)容,而之后的緯度充滿了噪音。

同樣的,數(shù)據(jù)收集在達(dá)到某一個(gè)臨界點(diǎn)之后,再增加的新數(shù)據(jù)邊際效應(yīng)就很有限了。

換言之,數(shù)據(jù)收集呈現(xiàn)了一種明顯的冪次法則,或者說帕累托分布:在某一個(gè)臨界點(diǎn)之下,數(shù)據(jù)對于達(dá)成更精準(zhǔn)的模型是很重要的,但是當(dāng)數(shù)據(jù)的采集量逐漸逼急10倍或100倍時(shí),對于模型精準(zhǔn)度的貢獻(xiàn)在成本和功能上都十分有限。

AI對于有些終端是管用的,比如最終目的是提升用戶體驗(yàn)和用戶價(jià)值的,而不是模型本身。

至此,再回過頭來看一下「AI贏者通吃論」的前兩個(gè)假設(shè)條件。

第一,頭部玩家可以在很長的一段時(shí)間持續(xù)獲取到有效數(shù)據(jù);第二,更多的數(shù)據(jù)和更好的模型之間存在線性正相關(guān)的關(guān)聯(lián)。

本文所秉承的觀點(diǎn)就是「AI/數(shù)據(jù)商用化」企業(yè)會有效降低行業(yè)的入門門檻,因此第一個(gè)假設(shè)不攻自破。

第二點(diǎn),也是更重要的一點(diǎn),即更多的數(shù)據(jù)并不一定會造就更精確的模型。

▍AI技術(shù)從業(yè)者的入門門檻正在降低

如果「AI/數(shù)據(jù)的商用化」正在從技術(shù)層面上讓AI模型的搭建變得簡易,但是為什么這拉低AI從業(yè)者的入門門檻呢?

接下來需要用軟件工程來做一下類比。

比方說,讀者想要學(xué)習(xí)如何在iPhone上搭建一個(gè)移動(dòng)端應(yīng)用,在早期會怎么做呢?

很大可能是買來一本厚重的編程書,或是雇傭一個(gè)助教,又或者是在網(wǎng)上鉆研晦澀難懂的文章。

在過去的十年中,這一局面獲得了很大的改觀。

如今,根本用不上翻閱難啃的開發(fā)教程或是上昂貴的編程課,在網(wǎng)絡(luò)上已經(jīng)擁有了龐大的、已用的公開教學(xué)資源,而且大部分還是免費(fèi)的。

比如,在StackOverflow上,無需依靠閱讀文檔來艱難地找出Bug,論壇里的帖子能回答幾乎所有新手會犯的錯(cuò)誤。

但是不僅如此,AWS和Heroku提供的SaaS、PaaS和IaaS的解決方案能夠顯著地帶來簡單易用的機(jī)會去視覺化、檢測、運(yùn)維和發(fā)布任何客戶端應(yīng)用產(chǎn)品。

讀者也許會反駁到,這個(gè)論述只看到了產(chǎn)業(yè)中下游的提升,在上游的精英級別從業(yè)者們并不會因此改變太多。

在此,本文的立場應(yīng)該是與這種反駁完全對立的。

當(dāng)一個(gè)行業(yè)的信息壁壘降低,有機(jī)會讓足夠多的人持續(xù)進(jìn)入這個(gè)行業(yè)時(shí),處于頂層的精英人數(shù)一定有機(jī)會同比增加。

不過,在這里還是引用一下行業(yè)專家李開復(fù)自己的話。

他的這段文字闡述了他認(rèn)為的為什么科技人才可能造就AI領(lǐng)域成為領(lǐng)頭行業(yè)的原因:

頂尖的公司把充足的數(shù)據(jù)量與資本結(jié)合起來,就能吸引到頂尖的人工智能人才,進(jìn)一步擴(kuò)大產(chǎn)業(yè)領(lǐng)先者與落后者之間的差距。

同意。我們繼續(xù)來看他在書中是如何比較研究領(lǐng)域和應(yīng)用領(lǐng)域的:

許多人之所以誤認(rèn)為美國在人工智能領(lǐng)域具有重大優(yōu)勢,主要是因?yàn)樗麄冞€停留在我們生活在「發(fā)明的年代」的印象中:

在發(fā)明的年代,人工智能的頂尖研究人員不斷打破舊有典范,最終破解存在已久的謎題,媒體不斷報(bào)道人工智能的最新成就,更是助長了這種印象。

例如在某些癌癥的診斷上,人工智能做得比醫(yī)生更好;在德州撲克的人機(jī)大賽中,人工智能擊敗了人類冠軍;不用人為干預(yù),人工智能就自己學(xué)會并精通新技能等。

媒體如此關(guān)注報(bào)道人工智能的每一項(xiàng)新成就,也難怪一般觀察者甚至是專業(yè)分析師會認(rèn)為人工智能研究將不斷獲得突破性的新發(fā)現(xiàn)。

他認(rèn)為,這種現(xiàn)象有誤導(dǎo)作用,因?yàn)樵谶@些「新里程碑」中,很多成就其實(shí)只是把過去10年的技術(shù)性突破應(yīng)用到新問題上。

其中主要是深度學(xué)習(xí),但還有一些互補(bǔ)的技術(shù),例如強(qiáng)化學(xué)習(xí)(reinforcement learning)和遷移學(xué)習(xí)(transfer learning)。

研究人員做這些事,需要卓越的技能和深度的專業(yè)知識,不僅要有能力思考、撰寫復(fù)雜的數(shù)學(xué)算法,還要能夠處理巨量數(shù)據(jù),針對不同問題調(diào)整人工神經(jīng)網(wǎng)絡(luò)。

這往往需要博士級的專業(yè)知識技能,但這些發(fā)展都不過是依賴著深度學(xué)習(xí)這項(xiàng)科技的大發(fā)展所做的漸進(jìn)式改善和優(yōu)化。

這些漸進(jìn)式的改善和優(yōu)化,其實(shí)是把深度學(xué)習(xí)在模式識別與預(yù)測上的強(qiáng)大能力應(yīng)用到種種不同的領(lǐng)域上,如疾病診斷、核發(fā)保單、開車、中英翻譯等。

這其中理由也很簡單:

但這些改善和優(yōu)化并不代表我們正在朝著「通用人工智能」的方向快速前進(jìn),或是出現(xiàn)了類似深度學(xué)習(xí)的重大技術(shù)性突破。

簡單來說,人工智能正式進(jìn)入了實(shí)干的年代,想要利用這個(gè)時(shí)期賺錢的公司,需要擁有有遠(yuǎn)見和才干的創(chuàng)業(yè)者、工程師和產(chǎn)品經(jīng)理。

他還補(bǔ)充到:

想要訓(xùn)練處成功的深度學(xué)習(xí)算法,需要運(yùn)算力、工程能力以及大量的數(shù)據(jù)。

在未來這三點(diǎn)中最重要的是數(shù)據(jù)量,因?yàn)楣こ棠芰_(dá)到一定水平后,就會開始出現(xiàn)收益遞減,這時(shí)數(shù)據(jù)量才能決定一切。

只要數(shù)據(jù)量足夠大,由優(yōu)良但非頂尖的工程師設(shè)計(jì)出的深度學(xué)習(xí)算法,也有機(jī)會超過全球頂尖專家設(shè)計(jì)的算法。

行業(yè)精英們肯定可以幫助頭部企業(yè)鞏固住他們的地位。

但是,我們是處于一個(gè)增量的時(shí)代,是不是普通工程師也能完成實(shí)操,因?yàn)楫吘箶?shù)據(jù)為王?

答案是否定的,不,這并不能說得通。

持續(xù)吸引優(yōu)秀的人才和保持人才的運(yùn)轉(zhuǎn)是創(chuàng)造任何壁壘的必要條件,但是開復(fù)博士自己也坦言,這在AI并不是至關(guān)重要的。

雖然AI的核心人才還是相對稀缺的,但是需要指出的是,行業(yè)的入門門檻正在降低。

此外,市場的流動(dòng)性給越來越多的從業(yè)者提供了機(jī)會,類似于1997年和2014年計(jì)算機(jī)從業(yè)者數(shù)量翻番。

中國發(fā)布了將要在2030年引領(lǐng)全球AI市場的國家戰(zhàn)略,因此2019年已有超過400所高校開展并設(shè)立了AI、大數(shù)據(jù)、機(jī)器人相關(guān)的專項(xiàng)教育。

這樣的宏觀刺激會顯著提升AI從業(yè)者的基數(shù),而且技術(shù)工具的使用壁壘也在下降,所以AI從業(yè)者的總體數(shù)量會比預(yù)計(jì)樂觀很多。

▍總結(jié)

來到最后。

這樣的宏觀刺激會顯著提升AI從業(yè)者的基數(shù),而且技術(shù)工具的使用壁壘也在下降,所以AI從業(yè)者的總體數(shù)量會比預(yù)計(jì)樂觀很多。

回到本文所給出的三個(gè)最終結(jié)論:

1. AI技術(shù)和數(shù)據(jù)收集管理正在被大幅度簡化和商用化;

2. 數(shù)據(jù)和數(shù)據(jù)產(chǎn)生的價(jià)值正逐漸成負(fù)相關(guān);

3. AI技術(shù)從業(yè)者的入門門檻和使用工具的學(xué)習(xí)壁壘正在降低,人才供應(yīng)會逐步提升且成本會降低。

我們可以得出一個(gè)結(jié)論,AI技術(shù)并不能確保運(yùn)用它的企業(yè)走向贏者同者通吃的局面。

在一個(gè)行業(yè)中的絕對優(yōu)勢是建立在能夠同時(shí)在多個(gè)緯度處于領(lǐng)先:人才儲備、數(shù)據(jù)廣度、數(shù)據(jù)深度、產(chǎn)品體驗(yàn)還有資本儲備。

無數(shù)的例子證明,曾經(jīng)的領(lǐng)先者會因?yàn)橄嗤脑蚨錄]。

首先,他們獲得資金;然后,安于舒適區(qū);最后,他們死去。

AI是某些終端的解決辦法之一,但是不要讓這個(gè)技術(shù)本身蒙蔽了企業(yè)未來的發(fā)展道路。

保持多條路徑并行,持續(xù)饑渴、不斷迭代,去尋找未來新的增長點(diǎn)。