導(dǎo)讀:在大數(shù)據(jù)的研究上,樊院士奠定了大數(shù)據(jù)計算復(fù)雜性的基礎(chǔ),重塑了數(shù)據(jù)質(zhì)量研究領(lǐng)域?!按髷?shù)據(jù)具有四個主要特征:規(guī)模大(量)、類型多、變化速度快以及真實性(質(zhì)量)。國內(nèi)外目前在數(shù)據(jù)規(guī)模方面做的功課比較多,但在其他三個方面的研發(fā)相對比較少,還有很多未解問題”。樊院士認(rèn)為,針對數(shù)據(jù)類型多樣性的異源異構(gòu)數(shù)據(jù)共享模型與方法,針對數(shù)據(jù)變化速度的自動增量計算理論,以及針對數(shù)據(jù)真實性的數(shù)據(jù)質(zhì)量模型與方法等都有很多痛點,有待發(fā)展。
緊隨著先行示范區(qū)落地,由粵港澳大灣區(qū)和中國特色社會主義先行示范區(qū)組成的“雙區(qū)驅(qū)動”給深圳帶來了改革開放之后又一重大且嶄新的歷史機遇?;诖耍?019前海世界數(shù)字論壇”于12月6日如期舉辦。
在本次論壇上,物聯(lián)傳媒有幸采訪到了數(shù)據(jù)庫專家、中國科學(xué)院外籍院士的樊文飛。熟悉樊院士的人都知道,他給人印象最深的可能就是那純粹的笑容,讓人感覺親切而踏實。
而樊院士純粹的笑容背后,我們看到的是讓人肅然起敬的成就。2019年11月,樊文飛當(dāng)選中國科學(xué)院外籍院士,這是他繼英國皇家學(xué)會院士(FRS),歐洲科學(xué)院院士(MAE),英國愛丁堡皇家學(xué)會院士(FRSE),國際計算機學(xué)會會士(ACM Fellow)之后獲得的第5個院士稱號。作為享譽國內(nèi)外的知名院士,樊文飛在接受采訪中談到,“我是搞技術(shù)的”,將自己定位為技術(shù)從業(yè)人員?;蛟S,這就是真正潛心研究技術(shù)、深挖理論潛力的科學(xué)家該有的淳樸。
樊院士對于數(shù)據(jù)庫科學(xué)最卓著的貢獻(xiàn)是從理論突破到系統(tǒng)的落地,英國皇家學(xué)會提名詞上寫道,樊文飛是世界上極少數(shù)同時在數(shù)據(jù)庫理論與系統(tǒng)兩個領(lǐng)域做出突破性貢獻(xiàn)的學(xué)者之一。同時,樊院士也是國際數(shù)據(jù)庫領(lǐng)域歷史上僅有的兩個“大滿貫”得主之一,囊括了數(shù)據(jù)庫四大頂級理論和系統(tǒng)會議的最佳論文獎和時間檢驗獎(SIGMOD 2017, PODS 2010 和2015,VLDB 2010, ICDE 2007)。
在大數(shù)據(jù)的研究上,樊院士奠定了大數(shù)據(jù)計算復(fù)雜性的基礎(chǔ),重塑了數(shù)據(jù)質(zhì)量研究領(lǐng)域?!按髷?shù)據(jù)具有四個主要特征:規(guī)模大(量)、類型多、變化速度快以及真實性(質(zhì)量)。國內(nèi)外目前在數(shù)據(jù)規(guī)模方面做的功課比較多,但在其他三個方面的研發(fā)相對比較少,還有很多未解問題”。樊院士認(rèn)為,針對數(shù)據(jù)類型多樣性的異源異構(gòu)數(shù)據(jù)共享模型與方法,針對數(shù)據(jù)變化速度的自動增量計算理論,以及針對數(shù)據(jù)真實性的數(shù)據(jù)質(zhì)量模型與方法等都有很多痛點,有待發(fā)展。
解決痛點既是挑戰(zhàn),更是創(chuàng)新的機遇。樊院士在接受采訪的時候表示:“做科研,我一直堅持創(chuàng)新,創(chuàng)新的關(guān)鍵不在于你的論文數(shù)量、引用率、發(fā)表平臺,而重在提出的基礎(chǔ)、原創(chuàng)理論和系統(tǒng)能否領(lǐng)跑國際學(xué)術(shù)界并且在工業(yè)界落地?!?/p>
在樊院士的創(chuàng)新基礎(chǔ)理論當(dāng)中,最讓筆者印象深刻的是有界計算理論。通俗來講,有界計算理論就是把大數(shù)據(jù)變小,用聰明的方法找到大數(shù)據(jù)中滿足需要的那一部分小數(shù)據(jù)集,并且滿足查詢結(jié)果的精確解要求。
“這項研究的攻克,我們花了五年時間,如何找到小數(shù)據(jù)集成為關(guān)鍵,其中涉及邏輯性和計算的復(fù)雜性,而這個問題從當(dāng)時的理論上來看是不可計算的,所以我們要從理論出發(fā)實現(xiàn)創(chuàng)新”。據(jù)樊院士日前透露,一家國際領(lǐng)先公司在數(shù)十億條數(shù)據(jù)的實時查詢場景下,91%的查詢可以用有界計算來解決,并且查詢效率提升25倍到10萬倍。從企業(yè)的角度來看,這項理論的落地能夠解決大多數(shù)企業(yè)因資源受限無力從事真正的大數(shù)據(jù)計算的現(xiàn)實問題,做到企業(yè)無論大小都能享受大數(shù)據(jù)分析的利益。
本次來到前海,樊院士正式受聘進(jìn)入前海科技創(chuàng)新專家咨詢委員會。在聊到深圳在大數(shù)據(jù)這一領(lǐng)域發(fā)展?jié)摿r,樊院士認(rèn)為,深圳的政策相對較為寬松,本地優(yōu)秀企業(yè)的工程人才也比較集中,有與硅谷媲美的創(chuàng)新環(huán)境,因此我們在深圳市政府和龍華區(qū)的支持下,組建了深圳計算科學(xué)研究院。希望通過這個平臺,做出中國自己的大數(shù)據(jù)基礎(chǔ)理論和計算引擎,并和深圳的本地企業(yè)合作,打造屬于中國的大數(shù)據(jù)基礎(chǔ)軟件國際品牌。
“要實現(xiàn)創(chuàng)新才能不讓別人牽著鼻子走。此前,我們和國際領(lǐng)先的國內(nèi)企業(yè)在異構(gòu)數(shù)據(jù)處理和開源社區(qū)方面有著良好的合作”。樊院士表示,“在做好自己的同時,也要與國際接軌,吸納國外的優(yōu)秀技術(shù)和人才”。
可見,樊院士對于深圳以及前海的大數(shù)據(jù)發(fā)展持有非常樂觀的態(tài)度。從行業(yè)發(fā)展的角度來看,樊院士表示大數(shù)據(jù)行業(yè)的研究者更需要沉下心來,解決目前理論研究和實際應(yīng)用中存在的問題,從理論到系統(tǒng),做出對社會有價值的原創(chuàng)研究和突破。