導讀:十年前Cloud Computing火爆的時候,大家自然而然開始了想站在生物云計算的風口,可是沒起風,豬肉去漲價了。生物云計算究竟是遺失的美好,還是霧里看花,水中望月;究竟是出身未捷身先死,還是懷才不遇,壯志未酬。
十年前Cloud Computing火爆的時候,大家自然而然開始了想站在生物云計算的風口,可是沒起風,豬肉去漲價了。生物云計算究竟是遺失的美好,還是霧里看花,水中望月;究竟是出身未捷身先死,還是懷才不遇,壯志未酬。
生物云計算,看上去很美
首先,我們的定義是什么?
按照字面定義,目的就是做生物的計算,主要包括各種生物序列的分析工作,加上云,就是能夠在云端處理。其實和其他云計算也沒太大的不同。這是非常好的想法,后面在結合上5G技術,就更好了。比如在野外利用孔測序儀進行測序,數據實時傳輸到云端開始處理,然后結果返回結果。通過各種終端都可以直接查看結果,看起來非常完美是不是。
然而現實情況是,這些年很多公司推出的生物云計算,大方向都是在炒概念,生物大數據,生物云計算,5G,物聯網,人工智能,精準醫(yī)學……都是當前時髦的熱詞,如果不帶幾個這樣的詞兒,都不好意思和別人打招呼。但是當街頭老大媽都準備入市賺錢的時候,也就說明股市泡沫要來了。
硅谷有一個臭名昭著的技術成熟度曲線,也叫做技術循環(huán)曲線,或者直接叫做炒作周期,是指新技術、新概念在媒體上曝光度隨時間的變化曲線。是指經過新聞媒體和學術會議的大肆宣傳之后,新技術趨勢一下子跌倒了谷底。生物云計算就是這樣的一個例子。
生物云計算的烏托邦之夢
云計算其實是一種非常好的解決方案。然而目前為何還沒有完全普及,雖然市面上有很多產品,有些做得確實也還可以,但依然不是主流。能效升近7萬倍!新興超導量子技術實現神經網絡硬件加速系統(tǒng)
很多公司的產品是想做成傻瓜式的操作,有一個圖形化界面,用戶購買之后,登錄賬戶,然后上傳數據,選擇要分析的流程,點擊運行,然后等待結果就行,用戶體驗非常好是不是,你甚至不需要任何生物信息經驗就可以了。
利用這段時間,去樓下點上一杯咖啡,曬曬太陽,伸個懶腰,刷刷手機,然后回來等待結果就行了,生活真美好……
甚至還有很多人預言,已經不需要做生物信息的人了,這些工作會像精算師一樣逐漸被生物云計算以及人工智能所取代,這個我不肯定也不否定。
夢醒時分
喝完咖啡回來,查看一下結果?!皐ow,fxxx”,出錯了,到底哪里有問題呢?這就是當前生物云計算的問題所在。將所有分析封裝起來,如果中間環(huán)節(jié)有問題,就比較麻煩。
舉個簡單的例子,例如做人全基因組的變異檢測。從拿到原始測序數據,到最終得到可靠的結果,中間可能需要10幾個處理過程。這些過程都是承上啟下的,有一個過程有問題,整個流程就斷掉。如果斷掉在查找原因,重新從這里開始,這反而更加繁瑣。
其次,像這種非常標準化的分析過程,采用目前的云計算是沒有問題的。但如果是做科學研究。科學研究本身就是一個反復探索的過程,需要反復測試,不斷調參,使用這種圖形化反而更加復雜。
第三:所有圖形化本質上只不過是給命令行添加上一個按鈕,本質上內容都是一樣的,根本不存在不懂生物信息也能使用的情況,如果不懂的話那些參數就只能按照默認的來處理了。
回到未來
由于當前的生物云計算現實情況,就會造成一種現象:懂分析的人不喜歡圖形界面,不懂分析的人有了圖形界面也還是不會用。我并不是一棒子打死各種生物云計算,每個用戶的具體需求不同,具體分析內容也不同,有些分析云計算非常方便。相反,我覺得需要生物云計算,甚至我們自己也運營生物云計算平臺,只不過不是圖形化界面,需要用戶自己熟悉敲命令。
其實云計算有諸多的優(yōu)勢。
首先,方便數據管理,也就是同一份文件不需要進行多個拷貝,測序完成之后直接上傳到云服務器,用戶可以在任何地點聯網訪問。
第二,軟件和數據庫也無需進行多個拷貝,并且可以第一時間進行更新,省去很多麻煩,例如,只需要在云端下載一份nt數據庫,所有的用戶都可以與之進行比對,而不需要下載很多份。
第三,云計算可以進行彈性計算,也就是資源可以充分利用,需要多大資源,就提供多大資源,不會像本地資源存在計算資源不足的情況。
第四,云計算不需要很多的配置以及系統(tǒng)維護。