導(dǎo)讀:隨著 5G 和 AI 的快速迭代,機器視覺也進入了高速發(fā)展的新階段。
機器視覺是指利用相機、攝像機等傳感器,配合機器視覺算法賦予智能設(shè)備人眼的功能,從而進行物體的識別、檢測、測量等功能。簡單說來,機器視覺就是用機器代替人眼來做測量和判斷。
機器視覺是在 20 世紀 50 年代從統(tǒng)計模式識別開始的,當(dāng)時的工作主要集中在二維圖像分析和識別。如今,隨著 5G、AI 等技術(shù)的日益發(fā)展,為機器視覺的升級帶來可能,將加速信息顯示從二維向三維過渡。
三維機器視覺是在二維機器視覺的基礎(chǔ)上增加了物理空間的深度信息,更全面、更真實地記錄了物理世界。因此,業(yè)內(nèi)一致認為三維機器視覺技術(shù)是機器視覺領(lǐng)域新的技術(shù)突破,也是機器視覺領(lǐng)域新的商業(yè)風(fēng)口。
目前,機器視覺是正在快速發(fā)展的一個領(lǐng)域,正處于不斷突破、走向成熟的階段。它的發(fā)展不僅將大大推動智能系統(tǒng)的發(fā)展,提高生產(chǎn)效率和自動化程度,也將拓寬計算機與各種智能機器的研究范圍和應(yīng)用領(lǐng)域。
3D 視覺如何取代 2D?
縱觀行業(yè)發(fā)展,2D 視覺雖為當(dāng)前主流,但隨著測量精度要求越來越高,被測物體條件越來越復(fù)雜,2D 系統(tǒng)的缺陷也愈發(fā)突出。目前市場上可見的 2D 識別,實質(zhì)上屬于軟件層面驗證技術(shù),雖然能夠做檢測,但是存在可靠性不高、局限性、安全性差等諸多缺陷。
相比之下,3D 視覺技術(shù)在精度、靈活性和速度方面都是 2D 無可比擬的。的盧深視創(chuàng)始人兼 CEO 戶磊向筆者說道,3D 機器視覺能夠精準識別視野內(nèi)空間每個點位的三維坐標信息,通過算法復(fù)原智能獲取三維立體成像。不但可以提高測量和識別的效率,從三個維度獲取信息,更增加了信息的準確性和可靠性。
從技術(shù)角度來看,普通的 2D 成像是用平面?zhèn)鞲衅鹘邮毡慌臄z物體反射或者發(fā)出的可見光,從而形成二維圖像。由于現(xiàn)實世界是三維世界,2D 成像存在物體特征信息損失的情況,這意味著 2D 成像并不支持與物體三維信息的測量。例如 3D 人臉識別、三維建模、人機交互、AR、智能安防等功能。
為了彌補 2D 人臉識別的不足,3D 人臉識別應(yīng)運而生。3D 傳感技術(shù)實現(xiàn)了物體實時三維信息的采集,為后期的圖像分析提供了關(guān)鍵特征,智能設(shè)備能夠根據(jù) 3D 傳感復(fù)原現(xiàn)實三維世界,并實現(xiàn)后續(xù)的智能交互。
根據(jù) Yole 的數(shù)據(jù),2017-2023 年全球 3D 成像和傳感器市場規(guī)模的復(fù)合年均增長率為 44%,預(yù)計 2023 年,3D 傳感市場規(guī)模將達到 184 億美元。
不難判斷,在此趨勢下,3D 機器視覺將面臨較快的增長趨勢,3D 視覺未來將逐步取代 2D 識別技術(shù),在許多“痛點型應(yīng)用場景”中大顯身手,發(fā)展成為主流視覺系統(tǒng)。
安全問題凸顯
眾所周知,隨著人臉識別技術(shù)的深入,千萬級人臉大庫的重要性日益顯現(xiàn)。采集建庫既是三維人臉識別應(yīng)用的基礎(chǔ),也是三維人臉識別技術(shù)落地的關(guān)鍵。
近日《2019 年中國刷臉支付技術(shù)應(yīng)用社會價值專題研究報告》顯示,2019 年成為刷臉支付的“新元年”,刷臉支付用戶將達到 1.18 億人,到 2022 年有望突破 7 億人,或取代掃碼成為主流支付方式?,F(xiàn)在人臉識別方式越來越為大眾所使用,但關(guān)于個人信息安全等問題也隨之而來。
對此,戶磊表示,“人臉識別領(lǐng)域沒有絕對的安全,安全是與成本息息相關(guān)的。從商業(yè)層面考慮,安全更多是取決于安全成本與作偽成本之間的考量?!?/p>
安全性上,的盧深視也有布局。一方面其算法已通過 BCTC 增強級認證,滿足國家認證金融支付增強級安全標準,可實現(xiàn)高強度防作偽。
另一方面,的盧深視對于小群體應(yīng)用場景產(chǎn)品做了針對性的設(shè)計,以其 3D-Face ID 一體化解決方案智能門鎖為例,內(nèi)嵌一顆 AIoT 專用芯片,人臉信息存儲以及人臉比對均在門鎖端完成。借助在金融支付行業(yè)內(nèi)的豐富終端安全經(jīng)驗,打造了一個安全、受信的安全比對環(huán)境,外界是無法通過任何物理手段或者其他暴力拆解手段來獲取模組內(nèi)的私密個人生物特征信息。
基于成熟落地經(jīng)驗,的盧深視把三維機器視覺技術(shù)從高端安防領(lǐng)域切入金融支付、智慧社區(qū)、消費電子、商超零售、虛擬現(xiàn)實等垂直細分領(lǐng)域,要用成熟的三維全棧技術(shù)賦能百業(yè)千家。
目前市場上主流的3D 識別技術(shù)
近日,在 2020 全球人工智能產(chǎn)品應(yīng)用博覽會(AIExpo2020)的現(xiàn)場,的盧深視向與非網(wǎng)全面展示了其三維視覺全棧技術(shù)解決方案。
戶磊介紹道,的盧深視深耕三維機器視覺領(lǐng)域近 5 年,是國內(nèi)唯一打通“真三維”全棧技術(shù)、并實現(xiàn)國家級項目落地應(yīng)用的公司。公司基于“云+端+芯”一體化戰(zhàn)略,布局產(chǎn)品矩陣,下鉆垂直行業(yè)應(yīng)用領(lǐng)域,實現(xiàn)垂直整合及系統(tǒng)優(yōu)化。公司可提供大規(guī)模普及的、交互距離內(nèi)高精度的三維視覺感知產(chǎn)品及方案,產(chǎn)品形態(tài)涵蓋 Edge AI 芯片、智能模組、通用產(chǎn)品和行業(yè)解決方案。
談到三維識別技術(shù)方案,目前市場上主流的有結(jié)構(gòu)光、ToF、雙目視覺等三種 3D 視覺技術(shù)。
3D 結(jié)構(gòu)光通過紅外光投射器,將具有一定結(jié)構(gòu)特征的光線投射到被拍攝物體上,再由專門的紅外攝像頭進行采集。主要利用三角形相似的原理進行計算,從而得出圖像上每個點的深度信息,最終得到三維數(shù)據(jù)。
ToF 是利用激光測距,照射光源一般采用方波脈沖調(diào)制,根據(jù)脈沖發(fā)射和接收的時間差來測算距離。
雙目立體視覺則是基于視差原理并由多幅圖像獲取物體三維幾何信息的方法。由雙攝像機從不同角度同時獲得被測物的兩幅數(shù)字圖像,并基于視差原理恢復(fù)出物體的三維幾何信息,從而得出圖像上每個點的深度信息、最終得到三維數(shù)據(jù)。
可以看到,三種 3D 視覺測量原理都有各自的優(yōu)缺點。
與非網(wǎng)制圖
就目前看來,3D 結(jié)構(gòu)光是各大廠商普遍采用的技術(shù)。同樣以的盧深視為例,的盧深視推出了兩款基于 3D 結(jié)構(gòu)光技術(shù),針對安全需求高小型人臉庫場景推出的自研國產(chǎn) 3D CV 相機:高精度 RGBD 相機(標準型)和 3D-Face ID 智能模組。
戶磊進一步指出,公司自研的 3D CV 相機均已實現(xiàn)量產(chǎn),在 3 米范圍誤差小于 1mm,指標超越國際 3D 相機巨頭,且量產(chǎn)良率超 99%,精度全球領(lǐng)先,具備獨家專利技術(shù),高度自主可控。
的盧深視 3D-Face ID 智能模組
其中,高精度 RGBD 相機可用于刷臉支付終端、銀行 ATM、無人貨柜、地鐵刷臉閘機、AR/VR、物品體積測量等場景;3D-Face ID 智能模組可用于家庭智能門鎖、智能保險柜、酒店公寓智能鎖、智能門禁等場景。
此外,對于可靠性和精度要求較高的制造業(yè)等領(lǐng)域來看,戶磊表示,將幾種測量原理結(jié)合一起的 3D 視覺技術(shù)也是未來發(fā)展的一個方向。
趨勢之外,痛點仍在
產(chǎn)業(yè)鏈匹配不完善
相對 2D 成像而言,3D 傳感技術(shù)的優(yōu)勢還體現(xiàn)在可產(chǎn)生大量的三維數(shù)據(jù),這些數(shù)據(jù)未來可應(yīng)用于大數(shù)據(jù)等行業(yè),具有巨大的行業(yè)應(yīng)用價值。
但是數(shù)據(jù)本身的豐富度反過來也會影響數(shù)據(jù)質(zhì)量和精度,這也對傳感器和相機提出了較高要求。現(xiàn)階段 3D 視覺行業(yè)的核心難點集中在產(chǎn)業(yè)鏈匹配不完善。
據(jù)了解,現(xiàn)階段 3D 視覺行業(yè)的核心難點集中在產(chǎn)業(yè)鏈匹配不完善。和很多新興行業(yè)一樣,在 3D 視覺行業(yè)蓬勃發(fā)展的同時,產(chǎn)業(yè)鏈條體系混亂、產(chǎn)業(yè)關(guān)鍵鏈路無法閉環(huán)等問題逐步凸顯,這些問題成為制約行業(yè)發(fā)展的瓶頸。
三維視覺產(chǎn)業(yè)鏈涵蓋核心器件、模組裝配、像機成像系統(tǒng)設(shè)計、算法、感知技術(shù)方案與模塊、終端產(chǎn)品與行業(yè)方案多個環(huán)節(jié),由于三維機器視覺仍屬于較前沿的技術(shù),供應(yīng)鏈匹配上存在技術(shù)難度高、標準不統(tǒng)一等諸多問題,整合產(chǎn)業(yè)鏈是 3D 視覺產(chǎn)業(yè)化應(yīng)用的必要路徑。
在產(chǎn)業(yè)鏈環(huán)節(jié),的盧深視定位為三維視覺感知系統(tǒng)技術(shù)方案提供商,上游承接相機模組裝配,通過團隊研發(fā)的相機的系統(tǒng)設(shè)計和內(nèi)部算法形成 3D 感知技術(shù)模組、3D 通用產(chǎn)品、Edge AI 芯片以及行業(yè)解決方案,對于安防行業(yè)主要提供通用的終端產(chǎn)品,對于其它行業(yè)提供相關(guān)智能模組,并由下游的集成商合作伙伴將最終產(chǎn)品供給消費者。
從行業(yè)整體來看,在現(xiàn)階段,如何借著轟轟烈烈的 AI 和 5G 浪潮,為行業(yè)搭建起一個凝聚上下游資源、協(xié)同產(chǎn)業(yè)鏈創(chuàng)新發(fā)展的平臺成為迫在眉睫的事情。
硬件價格和系統(tǒng)成本
傳統(tǒng)的機器視覺穩(wěn)定發(fā)展多年,目前處于硬件和軟件的發(fā)展基本匹配的階段。但是隨著檢測需求以及對安全性及可靠性等要求的提高,未來將用到深度學(xué)習(xí)來完成功能賦能,現(xiàn)在基礎(chǔ)的硬件需要做到領(lǐng)先于軟件一代。
因此,成本高又成為了當(dāng)前產(chǎn)業(yè)痛點之一。有行業(yè)資深人士表示,從硬件價格和系統(tǒng)成本來看,要突破傳統(tǒng)上所謂二年投入回報周期這一困局。兩年回收成本已經(jīng)無法撬動行業(yè)需求,一年左右的時間周期才會帶動中小企業(yè)愿意買單。
技術(shù)價值最大化的關(guān)鍵在于逐漸形成大規(guī)模的普及應(yīng)用,通過大面積提升行業(yè)的生產(chǎn)力水平和經(jīng)濟效益獲得,通過給客戶帶來價值而盈利,這是一個較為艱難的過程,但也是一個需要慢慢推進的必要過程。
從機器視覺發(fā)展的客觀現(xiàn)狀來講,其實并不缺市場需求,但是缺少能夠真正落地的、真正發(fā)揮出經(jīng)濟效益的好產(chǎn)品。那么,應(yīng)該如何打破這個“緊箍咒”?推動更多的落地應(yīng)用?
解決核心零部件的性價比,做到系統(tǒng)成熟穩(wěn)定可靠,是迫在眉睫的事情。只要將性價比做到極致,就能滿足目前工業(yè)機器視覺中絕大多數(shù)的應(yīng)用需求。另一方面,也體現(xiàn)在產(chǎn)品的適用性、標準化程度上。需要對視覺應(yīng)用真正的剛性需求逐漸顯現(xiàn)出來,進而實現(xiàn)降本增效的效果。
寫在最后
在國內(nèi)如火如荼的科技發(fā)展浪潮和國內(nèi)經(jīng)濟發(fā)展的時代大背景下,3D 視覺產(chǎn)業(yè)鏈的優(yōu)化和鏈路閉環(huán)正在加劇進行,產(chǎn)業(yè)形態(tài)的完備也將釋放出巨大的集群紅利,為產(chǎn)業(yè)鏈各環(huán)節(jié)創(chuàng)造新的發(fā)展局面。
在用戶日常觸達較高的刷臉支付方面,中國企業(yè)表現(xiàn)不俗,產(chǎn)業(yè)圍繞 3D 視覺技術(shù)研究及應(yīng)用開展合作,共同推進金融領(lǐng)域科技創(chuàng)新,成為中國金融支付領(lǐng)域?qū)崿F(xiàn)彎道超車的關(guān)鍵。
從智能支付到智能門鎖,包括的盧深視在內(nèi)的行業(yè)企業(yè)在探索 3D 機器視覺應(yīng)用的更多新方向。的盧深視配合式三維人臉采集終端填補了國內(nèi)三維人臉數(shù)據(jù)采集設(shè)備的技術(shù)空白,為千萬級大庫時代人臉識別技術(shù)及場景奠定了基礎(chǔ),標志著的盧深視三維全棧閉環(huán)已然成熟,打通了從云端建庫、算法比對、模組方案到終端產(chǎn)品的全鏈條,真正實現(xiàn)了技術(shù)應(yīng)用的“最后一公里”。
如今,中國已突破 3D 人臉識別技術(shù)的壁壘,相信在不久的將來,中國 3D 傳感技術(shù)定會再上一個臺階,為更多用戶及其行業(yè)帶來更安全、方便、快捷的智慧生活體驗。