本文受訪?|?李陳 產(chǎn)業(yè)政策研究所(先進(jìn)制造業(yè)研究中心)助理研究員
近日,深圳留形科技有限公司(以下簡稱“留形科技”)宣布完成金額為數(shù)千萬元的Pre-A輪融資,投資方包括弘毅投資等著名投資機(jī)構(gòu)。此前,該企業(yè)曾獲得真格基金種子輪投資,以及君盛投資的天使輪投資。據(jù)了解,留形科技成立于2022年,該企業(yè)研發(fā)的智能三維感知和重建算法可以賦予機(jī)器人等具身智能設(shè)備空間感知、智能記憶及主動交互能力。這成為空間感知領(lǐng)域企業(yè)的最新舉措。
機(jī)器人三維空間感知的重要性
空間感知,是機(jī)器人在非結(jié)構(gòu)化環(huán)境中實(shí)現(xiàn)自主決策的關(guān)鍵能力,決定了機(jī)器人除“只會看”外,是否還能“看得懂、記得住、認(rèn)得清”。具體地說,人形機(jī)器人若要模仿人在空間執(zhí)行任務(wù),就必須感知、理解和記憶真實(shí)世界中的復(fù)雜環(huán)境,而空間感知能力解決的是“認(rèn)知”和“執(zhí)行”的連接問題。
留形科技首席技術(shù)官(CTO)徐威表示,很多機(jī)器人能做動作但做不到“自主判斷”。例如,機(jī)器人取外賣需要識別門的位置、判斷電梯在哪里、是否有人、如何走最短的路,下了樓還能識別出哪個柜子是“目標(biāo)”,這些都需要實(shí)時構(gòu)建空間模型并作出判斷。如果沒有空間感知,機(jī)器人就只能“看得見但看不懂,走得動但走不對”。
賽迪智庫產(chǎn)業(yè)政策研究所助理研究員李陳表示,傳統(tǒng)機(jī)器人依賴預(yù)設(shè)地圖或固定路徑,難以應(yīng)對突發(fā)狀況。而三維感知技術(shù)通過實(shí)時生成厘米級精度的三維點(diǎn)云地圖,結(jié)合IMU(慣性測量單元)實(shí)現(xiàn)時空同步,使得機(jī)器人能夠動態(tài)識別障礙物、狹窄通道和可通行區(qū)域。此外,傳統(tǒng)機(jī)器人依賴“傳感器+控制器”的分離式架構(gòu),而三維感知技術(shù)通過多傳感器深度融合和邊緣計算能力實(shí)現(xiàn)了“感知-計算-執(zhí)行”的一體化。綜合地看,通過將環(huán)境信息轉(zhuǎn)化為可計算的結(jié)構(gòu)化數(shù)據(jù),空間感知技術(shù)不僅賦予機(jī)器人物理世界的“認(rèn)知地圖”,更是通過多模態(tài)數(shù)據(jù)融合構(gòu)建起深度理解能力,從而使人形機(jī)器人從“程序化執(zhí)行”邁向“類人交互”。
“通過精準(zhǔn)感知和識別所處環(huán)境的三維結(jié)構(gòu)、動態(tài)變化及物體狀態(tài),機(jī)器人能夠在坡面、不平整地面、樓梯等復(fù)雜地形中實(shí)現(xiàn)穩(wěn)定自主運(yùn)動與路徑規(guī)劃,同時準(zhǔn)確識別任務(wù)對象的位置與形態(tài)變化,助力完成抓取、搬運(yùn)等操作任務(wù)。這一能力不僅提升了機(jī)器人在復(fù)雜環(huán)境中的導(dǎo)航穩(wěn)定性與交互準(zhǔn)確性,還顯著降低了其對陌生環(huán)境的適應(yīng)難度和重復(fù)學(xué)習(xí)成本,為實(shí)現(xiàn)智能泛化提供了堅實(shí)支撐?!盜DC中國研究經(jīng)理李君蘭說。
這一能力的獲得將給機(jī)器人行業(yè)帶來巨大改變。
徐威表示,從行業(yè)角度看,空間感知是實(shí)現(xiàn)“機(jī)器人從實(shí)驗(yàn)室走向真實(shí)場景”的關(guān)鍵一步,尤其是在建筑測繪、工業(yè)巡檢、機(jī)器人導(dǎo)航與數(shù)字孿生等領(lǐng)域。如果機(jī)器人不具備一定的空間感知和記憶能力,就只能依賴提前設(shè)定的路徑規(guī)劃或人為控制,無法適應(yīng)動態(tài)、真實(shí)的場景。
李君蘭認(rèn)為,當(dāng)前,人工智能(AI)大模型正加速推動機(jī)器人邁向具身智能,但機(jī)器人在智能泛化方面亟待突破。作為“感知—學(xué)習(xí)—決策—執(zhí)行”閉環(huán)中的核心環(huán)節(jié),空間感知技術(shù)正在成為實(shí)現(xiàn)環(huán)境理解、任務(wù)泛化與人機(jī)協(xié)同的關(guān)鍵突破口。該技術(shù)能為機(jī)器人賦能路徑規(guī)劃、目標(biāo)識別等核心能力,推動其從結(jié)構(gòu)化環(huán)境走向復(fù)雜、多變的開放場景,并進(jìn)一步加快具身智能的演進(jìn)與應(yīng)用落地。
三維空間感知能力如何實(shí)現(xiàn)
此前,機(jī)器人空間感知能力主要依賴導(dǎo)航定位、視覺與激光雷達(dá)等方案,有著明顯的不足:GPS信號無法在室內(nèi)環(huán)境中穩(wěn)定接收;UWB(超寬帶)、藍(lán)牙等室內(nèi)定位技術(shù)需提前布設(shè)基礎(chǔ)設(shè)施,部署過程復(fù)雜且成本高昂;視覺與激光雷達(dá)方案泛化性弱,難以應(yīng)對多變復(fù)雜環(huán)境,導(dǎo)致機(jī)器人在導(dǎo)航過程中頻繁出現(xiàn)感知誤差、定位失準(zhǔn)甚至作業(yè)停滯。智能三維感知和重建則通過激光雷達(dá)、深度相機(jī)、IMU等多傳感器融合的方式,賦予機(jī)器人實(shí)時構(gòu)建環(huán)境三維模型、精準(zhǔn)定位及動態(tài)避障的能力。徐威介紹說,這項技術(shù)的難點(diǎn)主要在于多傳感器融合。如果把機(jī)器人比作人類,大腦能自然整合來自眼睛、耳朵和身體的各種感知信息,但機(jī)器人卻要靠攝像頭、深度傳感器、IMU等“器官”,再通過算法統(tǒng)一到“腦中地圖”里。這些傳感器采樣頻率不同、數(shù)據(jù)維度也不一樣,想讓機(jī)器人“看得懂、走得對”,就必須解決時間同步、空間配準(zhǔn)、數(shù)據(jù)融合和實(shí)時建圖等一整套復(fù)雜問題。李陳表示,該技術(shù)的難點(diǎn)在于多模態(tài)數(shù)據(jù)的融合問題,需解決傳感器時空同步、異構(gòu)數(shù)據(jù)對齊及決策沖突問題。不同傳感器的數(shù)據(jù)存在時空錯位與噪聲干擾,相機(jī)、IMU、激光雷達(dá)等多傳感器數(shù)據(jù)因采樣頻率差異會導(dǎo)致融合失真。同時,復(fù)雜場景泛化不足,當(dāng)前大部分訓(xùn)練數(shù)據(jù)集中于工廠等標(biāo)準(zhǔn)化場景,而家庭、災(zāi)害現(xiàn)場等非結(jié)構(gòu)化環(huán)境任務(wù)成功率較低,動態(tài)光照、強(qiáng)磁干擾等仍挑戰(zhàn)3D重建準(zhǔn)確性。除了技術(shù)難題,該項技術(shù)還面臨其他挑戰(zhàn):成本控制(如高性能傳感器高成本)、材料與供應(yīng)鏈不穩(wěn)定、缺乏統(tǒng)一標(biāo)準(zhǔn)、用戶隱私顧慮以及生態(tài)配套不完善等難題。李陳表示,與國際領(lǐng)先技術(shù)相比,我國在中低端市場已實(shí)現(xiàn)國產(chǎn)化替代,且在結(jié)構(gòu)光、雙目視覺等特定領(lǐng)域技術(shù)領(lǐng)先,本土企業(yè)已在工業(yè)檢測、支付系統(tǒng)等場景實(shí)現(xiàn)規(guī)?;瘧?yīng)用,但基礎(chǔ)算法創(chuàng)新與高端傳感器、感光芯片等硬件研發(fā)仍需突破。高精度三維重建需強(qiáng)大算力支持,人形機(jī)器人、自動駕駛等領(lǐng)域所使用的高端ToF傳感器單價超千元,制約消費(fèi)級應(yīng)用。(完)本文刊于6月30日《中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報》
溫馨提示
如果你喜歡本文,請分享到朋友圈,想要獲得更多信息,請關(guān)注“賽迪智庫”。
我們的推送時間是10:00或17:00,一定不要忘了給“賽迪智庫”設(shè)星標(biāo)哦!
看都看完了,還不點(diǎn)這里試試
【未經(jīng)授權(quán),嚴(yán)禁轉(zhuǎn)載!聯(lián)系電話028-86968276】