導讀:很多沒有接觸過大數據的人,都很難清楚地知道,究竟多大的數據量才可以稱之為大數據。那么,根據數據收集的端口,企業(yè)端與個人端之間,大數據的數量級別是不同的。
圖片來自“東方IC”
大數據是什么?多大的數據叫大數據?
很多沒有接觸過大數據的人,都很難清楚地知道,究竟多大的數據量才可以稱之為大數據。那么,根據數據收集的端口,企業(yè)端與個人端之間,大數據的數量級別是不同的。
企業(yè)端(B端)數據近十萬的級別,就可以稱為大數據;個人端(C端)的大數據要達到千萬級別。收集渠道沒有特定要求,PC端、移動端或傳統渠道都可以,重點要達到這樣數量級的有效數據,形成數據服務即可。很有趣,大家可以看到2B和2C,兩類大數據差了兩個數量級。
有些小公司,數據只有千到萬級的規(guī)模,但經過收集分析,也能從中有針對性的總結出這一群體的原則,同樣能指導企業(yè)進行一定程度的用戶分析、獲取或者是服務工作,但這并不是大數據,而是一般性的數據挖掘。
剛剛天小妹分享的那個案例,說今年年初有個用50塊本金擺地攤賣水果的中年人,他并不懂得大數據,但是他對水果的收成了若指掌:他知道哪個地方下了多少雨,水果的甜度會到多少,哪些地方的消費者會喜歡吃這個甜度的水果。賣到最后賣出了137家門店、4.7億的年銷售額。
這確實是一種小的數據挖掘,但并不是數據分析。大數據分析雖然脫胎于此,但大數據面向的是更海量的一個數據,借助了更廣義的知識數據庫的分析方法。大部分的數據公司的數據來源是海量的,它的收集和分析,并不是局限于個體,而是以一個非常非常廣泛的群體為對象展開的。
2B是大數據行業(yè)的突破口
之前有提到BAT對大數據收集是壟斷性的,創(chuàng)業(yè)企業(yè)想要在C端達到海量數據(千萬級甚至上億的C端用戶)非常難。目前,國內月活真正過億的app只有15個,滲透率前10的app都是BAT所控制的,比如微信、QQ、淘寶、UC瀏覽器等。如果繞開BAT,能擁有C端海量數據的,就只有相對傳統的電信業(yè)、金融業(yè)等等。
可見,如果想投資大數據領域的公司,從C端下手難度很高。所以,我覺得在如果想在大數據行業(yè)布局,2B領域才是關鍵:一方面2B發(fā)展較晚,BAT還沒有形成壟斷;第二,開發(fā)門檻相對較高的;第三,數據量需求量相對較少,達到十萬級別就可以為大數據的分析服務,所以如果想在大數據領域進行投資,要關注的主要領域是2B領域。
第一類,是現在很火的企業(yè)服務,以SaaS為主;比如客戶管理的CRM、人力板塊的HRM等等。他們在得到用戶許可并保證數據安全的前提下,通過服務大量的企業(yè)來積累企業(yè)用戶,和企業(yè)員工數據。比如理才網等等。
第二類,是B2B交易平臺;目前的趨勢,基本上是行業(yè)垂直領域的電子商務交易平臺,核心競爭力就是打破買賣雙方的信息不對稱、不透明。所以這種領域公司的關鍵點并不是記錄交易量,而是每一個有效的數據信息。在這個領域,我們投資過惠民網,主要服務于中小商超和其供貨商的交易平臺,再比如各種“找”系列項目等等。
第三類,是針對于開發(fā)者的服務;云存儲、運行數據的統計推送以及app內的即時通信等。
復星昆仲主要是在這三類的2B項目當中的進行投資,因為這些項目的2B業(yè)務模式可以有效積累大數據。這就是為什么復星同時關注大數據和2B領域的企業(yè)服務——因為在2B領域的企業(yè)服務,能夠找到最好最有效的大數據。
2B行業(yè)的未來投資標的
如果我們預測一下這個行業(yè)的未來,我有以下幾個觀點。
擁有豐富大數據源的企業(yè),會成為整個行業(yè)內最炙手可熱的投資標的。
在大數據行業(yè)里,分析算法上的差別,造成的分析結果準確性、實用性的差異是93分和95分的區(qū)別。而因數據源質量造成的差別,是60分和90分的不同。特別是,一個不斷更新的大數據,是能夠驗證這個算法準確性并不斷優(yōu)化大數據分析結果的有效途徑。
先行綁定最急需數據的需求方的項目,將獲得勝利。
目前,在大數據領域最愿意買單的基本都是金融領域的客戶,銀行、保險公司等等。他們要對用戶進行多方位的分析和服務,所以購買意愿非常強。下一層,是新興的互聯網公司,為了更精準的獲取用戶、提高轉化率,也比較愿意買單,比如說像新美大等等。下一步,可能會過渡到消費品行業(yè)當中去。
基于大數據的那些商機,SaaS類項目憑什么火?
很多人其實不明白SaaS模式和傳統的軟件服務到底有什么區(qū)別,為什么說它是一個基于大數據而興起的行業(yè)呢?
SaaS和傳統軟件服務,中間有非常多的區(qū)別。最基礎的區(qū)別,就是他們整個架構是不同的:SaaS是建立在公有云上的,標準化的模塊服務,數據也儲存在SaaS的公有云平臺上。而傳統的軟件服務基本上是部署在局域網內的。這種架構上的區(qū)別決定所有的其他區(qū)別。
比如,因為SaaS架構在云端,而且秉承標準化、普適化原則,所以,實施過程非??臁V辽?,實施前的現場搭建工作要少很多,那么獲取用戶也相應的加快。能傳統模式要很長時間才能累計幾百個客戶,而SaaS模式可以在短時間內累積上千、上萬的客戶都不難。
再比如,付費模式上的不同,傳統軟件有前期實施費、每年更新的費用、專門的定制服務費用、故障解決費用等等。整體來講,費用高、繳費繁復,往往只有大企業(yè)才消費的起。而SaaS一方面減少了初期部署成本、且系統和架構可以服務于多個用戶。它的收費模式基本上,是收月費或者年費,一個月只有幾百塊,很多中小企業(yè),都可以享受到服務。
智能硬件和人工智能的收獲期還很漫長
大數據和智能硬件相結合的模式,其實目前還很有挑戰(zhàn)性,最主要的原因還是出在大數據的數量級上。目前智能硬件的出貨量遠不能匹配大數據所需的數量級。目前,國內出貨量最大的是小米手環(huán),第二是360兒童衛(wèi)士。剩下的智能硬件出貨量,往往在十幾萬到幾十萬就是比較好的量級。這跟C端大數據千萬、億級的要求還相差百倍呢。
人工智能領域相對好一些,屬于如日方升的情況。在海外的谷歌、亞馬遜、軟銀,已經在投資一些投資標的,但是依然是一些概念領域的項目,不是立即可以商業(yè)化的服務。包括谷歌的無人車,就算已經能夠積累了上百萬英里的安全駕駛里程,但要應用還是有一定過程。國內也有少數的天使、早期機構,已經看好這個領域開始投資,但它的開花結果期那可能還要至少再等五年。
所以,這個領域的投資要有一定耐心,目前比較有希望兌現的領域,包括語音語義識別、AR/VR、無人機等。