人形機(jī)器人也要“進(jìn)校學(xué)習(xí)”?數(shù)據(jù)采集成必答題
記者 孫燕 鄧浩
7月9日,德馬科技與智元機(jī)器人合作建立全球首家具身智能人形機(jī)器人物流訓(xùn)練工廠,部署數(shù)十臺(tái)人形機(jī)器人開(kāi)展真實(shí)物流場(chǎng)景(搬運(yùn)、拆箱、分揀等)的數(shù)據(jù)采集與訓(xùn)練。
此前在6月,合肥市具身智能機(jī)器人數(shù)據(jù)采集預(yù)訓(xùn)練場(chǎng)啟用,帕西尼具身智能超級(jí)數(shù)據(jù)工廠也投入運(yùn)營(yíng)。
數(shù)據(jù)被認(rèn)為是具身智能的“卡脖子”問(wèn)題。
東吳證券指出,不同于大語(yǔ)言模型可以使用互聯(lián)網(wǎng)海量信息作為訓(xùn)練數(shù)據(jù),機(jī)器人所用的具身智能模型沒(méi)有現(xiàn)成數(shù)據(jù)可以使用,需要投入大量時(shí)間和資源進(jìn)行機(jī)器人操作實(shí)踐或仿真模擬,以收集視覺(jué)、觸覺(jué)、力覺(jué)、運(yùn)動(dòng)軌跡以及機(jī)器人本體狀態(tài)等多源異構(gòu)數(shù)據(jù)。
為助力數(shù)據(jù)采集,訓(xùn)練場(chǎng)應(yīng)運(yùn)而生。
企業(yè)、政府爭(zhēng)相落地
去年下半年以來(lái),具身智能數(shù)據(jù)采集廠密集落地。
企業(yè)率先搭建數(shù)據(jù)采集中心,如智元機(jī)器人數(shù)據(jù)采集中心于去年9月啟用,帕西尼主導(dǎo)建設(shè)的具身智能超級(jí)數(shù)據(jù)工廠于今年6月投入運(yùn)營(yíng)。
之所以要采集數(shù)據(jù),是因?yàn)槿诵螜C(jī)器人在落地場(chǎng)景之前,需逐步學(xué)習(xí)并優(yōu)化技能。
通常而言,單個(gè)場(chǎng)景的訓(xùn)練就可能需要百萬(wàn)量級(jí)的數(shù)據(jù),但是行業(yè)早期缺少高質(zhì)量且格式統(tǒng)一的數(shù)據(jù)庫(kù),從而制約了機(jī)器人泛化能力的提升。
為了突破數(shù)據(jù)困境,行業(yè)內(nèi)出現(xiàn)了兩種思路。民生證券研究指出,其一,以英偉達(dá)、銀河通用為代表的企業(yè)試圖通過(guò)仿真數(shù)據(jù)的方式,生成數(shù)據(jù)用于機(jī)器人訓(xùn)練;其二,以智元機(jī)器人為代表的企業(yè)建立大規(guī)模數(shù)據(jù)采集廠以收集高質(zhì)量的真實(shí)場(chǎng)景數(shù)據(jù),再尋求合適的比例將真實(shí)數(shù)據(jù)與仿真數(shù)據(jù)混合,以實(shí)現(xiàn)較優(yōu)的訓(xùn)練效果。
一位產(chǎn)業(yè)人士告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,該企業(yè)先在數(shù)采中心搭建工廠實(shí)景,依靠人工遙操,讓機(jī)器人采集真機(jī)數(shù)據(jù),從而訓(xùn)練出單個(gè)工種的小模型(或算法),以達(dá)到客戶的交付要求!耙粋(gè)項(xiàng)目POC(概念驗(yàn)證)要兩個(gè)月左右時(shí)間,要達(dá)到較高準(zhǔn)確性可能要半年以上。但由于工廠作業(yè)環(huán)境以及其他安全考慮,人形機(jī)器人無(wú)法一直在現(xiàn)場(chǎng)采集數(shù)據(jù),所以我們根據(jù)制造現(xiàn)場(chǎng)搭建了實(shí)景給機(jī)器人訓(xùn)練!
除了廠商自采集,地方政府也在建設(shè)數(shù)據(jù)采集中心:國(guó)家地方共建人形機(jī)器人創(chuàng)新中心建設(shè)的全國(guó)首個(gè)異構(gòu)人形機(jī)器人訓(xùn)練場(chǎng)于今年1月啟用,合肥市具身智能機(jī)器人數(shù)據(jù)采集預(yù)訓(xùn)練場(chǎng)于今年6月啟用。
前述產(chǎn)業(yè)人士告訴記者,在G端,主要是工業(yè)、人工智能產(chǎn)業(yè)發(fā)達(dá)的地方政府采購(gòu)人形機(jī)器人去建數(shù)采中心。由政府主導(dǎo)建設(shè)的數(shù)據(jù)采集中心一般是公共服務(wù)平臺(tái),所采集的數(shù)據(jù)歸政府平臺(tái)所有,待積累了足夠多的數(shù)據(jù)后,可以提供給轄區(qū)內(nèi)的機(jī)器人企業(yè)訓(xùn)練。
青瞳視覺(jué)相關(guān)業(yè)務(wù)人士對(duì)記者表示,該公司從2023年左右開(kāi)啟了人形機(jī)器人數(shù)據(jù)采集業(yè)務(wù)。“主要是to G和to B,目前在政府端、學(xué)校端、企業(yè)端都有落地。”
一套數(shù)據(jù)采集解決方案通常包括機(jī)器人、硬件、軟件、云數(shù)據(jù)處理服務(wù)、軟硬件售后維護(hù)、模型訓(xùn)練平臺(tái)等。據(jù)青瞳視覺(jué)相關(guān)業(yè)務(wù)人士透露,一套數(shù)采中心解決方案售價(jià)在40萬(wàn)-50萬(wàn)元。
效率有待提高
前述產(chǎn)業(yè)人士指出,目前人形機(jī)器人行業(yè)都在做數(shù)據(jù)采集!爸灰菍W⑾掠螒(yīng)用的企業(yè),哪怕不建大規(guī)模數(shù)采中心,也因?yàn)橐鯬OC、交付,會(huì)搭建小規(guī)模數(shù)采中心。”
其預(yù)計(jì),這兩年行業(yè)內(nèi)人形機(jī)器人出貨量最多的可能在數(shù)據(jù)采集場(chǎng)景!肮I(yè)場(chǎng)景里幾十臺(tái)訂單,量已經(jīng)很大了。但建設(shè)一個(gè)數(shù)采中心,起碼要到百臺(tái)級(jí)別,否則經(jīng)濟(jì)效益不夠。 ”
但當(dāng)前,人形機(jī)器人數(shù)據(jù)采集仍然面臨挑戰(zhàn)。
一方面,硬件方案未收斂,數(shù)據(jù)孤島問(wèn)題提高了數(shù)據(jù)采集成本。華源證券研究指出,目前廣義的人形機(jī)器人硬件結(jié)構(gòu)尚存在不確定性,例如本體存在輪式方案與雙足方案,手部結(jié)構(gòu)如夾爪、靈巧手、三爪等機(jī)械結(jié)構(gòu)尚未確定;傳感器方案中視觸覺(jué)、磁變傳感器的方案選擇與具體排布位置也未有定論。
前述產(chǎn)業(yè)人士也指出,人形機(jī)器人仍在快速迭代階段:每個(gè)星期都會(huì)有模組修改,一兩個(gè)月就會(huì)有零部件、局部改造,可能幾個(gè)月到半年就會(huì)更新一代。
另一方面,當(dāng)前人形機(jī)器人數(shù)據(jù)采集方法多數(shù)集中在關(guān)節(jié)層數(shù)據(jù),如各自由度的角度、速度、力矩等,硬件不統(tǒng)一導(dǎo)致不同機(jī)器人關(guān)節(jié)結(jié)構(gòu)差異較大,采集的數(shù)據(jù)具有極強(qiáng)的平臺(tái)依賴性,可復(fù)用性低,數(shù)據(jù)孤島問(wèn)題極大提高了數(shù)據(jù)采集成本,使得產(chǎn)業(yè)端難以通過(guò)規(guī);档蛿(shù)據(jù)成本。
而本體高自由度的累計(jì)傳遞誤差帶來(lái)的本體精度問(wèn)題以及機(jī)器人本體-人體自由度不匹配導(dǎo)致映射算法構(gòu)建困難,進(jìn)而導(dǎo)致真實(shí)數(shù)據(jù)采集精度不夠,有效數(shù)據(jù)比例較低。
前述產(chǎn)業(yè)人士指出,不同結(jié)構(gòu)的機(jī)器人所采集的數(shù)據(jù),若映射到新的本體上作業(yè),數(shù)據(jù)的準(zhǔn)確性、模型的有效性會(huì)大打折扣。
但在行業(yè)發(fā)展初期,采集數(shù)據(jù)依然是第一步。
本網(wǎng)站所刊載信息,不代表中新經(jīng)緯觀點(diǎn)。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。
[京B2-20230170] [京ICP備17012796號(hào)-1]
[互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120220005] [互聯(lián)網(wǎng)宗教信息服務(wù)許可證:京(2022)0000107]
違法和不良信息舉報(bào)電話:18513525309 報(bào)料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn
Copyright ©2017-2025 jwview.com. All Rights Reserved
北京中新經(jīng)聞信息科技有限公司