日韩精品导航,失落十三年,亚洲a∨精品一区二区三区下载,91国内在线

創(chuàng)澤機(jī)器人
CHUANGZE ROBOT
當(dāng)前位置:首頁 > 新聞資訊 > 行業(yè)動(dòng)態(tài) > ICRA 自然語義引導(dǎo)的機(jī)器人技能操作

ICRA 自然語義引導(dǎo)的機(jī)器人技能操作

來源:CAAI認(rèn)知系統(tǒng)與信息處理專委會(huì)     編輯:創(chuàng)澤   時(shí)間:2023/11/7   主題:其他 [加盟]

隨著自然語言處理技術(shù)的發(fā)展以及客戶需求的提高,當(dāng)機(jī)器人進(jìn)入以人為主的環(huán)境時(shí),必須學(xué)會(huì)理解人類語言,完成指定任務(wù)。相較于傳統(tǒng)只對(duì)場(chǎng)景做出反應(yīng)的機(jī)器人操作方法,結(jié)合語義輸入,讓機(jī)器人理解人類語言,根據(jù)場(chǎng)景和自然語言指令完成相應(yīng)任務(wù),能為人機(jī)協(xié)作帶來更大的便利性。然而,目前該方法具有如下限制:

(1)依賴手工編碼任務(wù)符號(hào)來實(shí)現(xiàn)語義表達(dá),限制了語義層面的泛化性。

(2)從指令中推斷動(dòng)作序列時(shí),需要密集的子目標(biāo)監(jiān)督。

(3)缺乏更深層次的以目標(biāo)為中心的推理方法,在解釋復(fù)雜指令時(shí)不連貫。

針對(duì)上述問題,該文章提出了一種可感知視覺場(chǎng)景,同時(shí)處理語言輸入的端到端可訓(xùn)練的模型。該模型使用視覺輸入得到當(dāng)前場(chǎng)景中物體在初始狀態(tài)下的位置關(guān)系,以語義文字推理目標(biāo)狀態(tài)下對(duì)應(yīng)的位置關(guān)系,實(shí)現(xiàn)由自然語言引導(dǎo)機(jī)器人進(jìn)行技能操作。 相關(guān)成果以“Learning Neuro-symbolic Programs for Language Guided Robot Manipulation”為題發(fā)表于International Conference on Robotic and Automation (ICRA)會(huì)議中。

該文章提出了一種新型神經(jīng)符號(hào)模型,使用自然語言推理目標(biāo)場(chǎng)景,實(shí)現(xiàn)在給定初始場(chǎng)景和目標(biāo)場(chǎng)景的情況下即可學(xué)習(xí)執(zhí)行復(fù)雜的操作任務(wù),并展示了如何在不需要任何中間監(jiān)督的情況下,僅使用初始與目標(biāo)兩個(gè)場(chǎng)景作為監(jiān)督來獲取機(jī)器人操作動(dòng)作的密集表示。 實(shí)驗(yàn)表明,該文章的方法可通過端到端的訓(xùn)練而不需進(jìn)行任何子目標(biāo)監(jiān)督,即可展現(xiàn)出強(qiáng)大的指令理解能力,并對(duì)新場(chǎng)景和指令展現(xiàn)出強(qiáng)大的泛化能力,為將來基于自然語言的人機(jī)協(xié)作,機(jī)器人的語義指令集的拓展提供了新的參考思路。

1、模型結(jié)構(gòu)設(shè)計(jì)

該端到端模型的結(jié)構(gòu)如圖1所示,由視覺提取器、語言解釋器、視覺解釋器、動(dòng)作模擬器組成。輸入初始場(chǎng)景和基于自然語言的任務(wù)指令,模型輸出完成該指令所需的動(dòng)作參數(shù),以及預(yù)測(cè)完成任務(wù)后的最終場(chǎng)景。

視覺提取器相當(dāng)于一個(gè)目標(biāo)檢測(cè)模型,用于識(shí)別初始場(chǎng)景下的物體信息。以圖11為例,輸入桌面初始狀態(tài)的圖像,視覺提取器輸出各個(gè)物體的外接框、顏色信息及物體名稱,并由外接框在桌面上的相對(duì)位置推斷物體的位置信息。

語言解釋器用于處理自然語言指令推理任務(wù)中隱含的操作動(dòng)作。例如圖中“移動(dòng)綠色骰子后面的紅色骰子至紅色方塊的右邊”這句指令,語言解釋器經(jīng)過推理會(huì)得到完成該任務(wù)需要進(jìn)行“移動(dòng)”動(dòng)作,移動(dòng)的物體是“位于綠色骰子后面的紅色骰子”,目標(biāo)是“紅色方塊右邊”,并可屏蔽“綠色方塊”和“藍(lán)色骰子”這些與完成任務(wù)無關(guān)的信息。推理完畢后,以專用指令集組合出推理結(jié)果。

專用指令集的結(jié)構(gòu)如圖2所示,分為“關(guān)鍵詞”和“操作詞”,前者用于描述物體信息,后者用于表示操作信息。

視覺解釋器結(jié)合前二者輸出的場(chǎng)景信息和任務(wù)指令集,輸出完成該任務(wù)所需的參數(shù)化表示,交由任務(wù)模擬器生成機(jī)器人所能執(zhí)行的動(dòng)作參數(shù),并預(yù)測(cè)完成任務(wù)后的場(chǎng)景情況。

以預(yù)測(cè)場(chǎng)景和數(shù)據(jù)集中提前設(shè)定好的目標(biāo)場(chǎng)景做差,設(shè)置損失函數(shù),即可實(shí)現(xiàn)端到端的訓(xùn)練過程。


人形機(jī)器人的落地思考-場(chǎng)景聚焦明確產(chǎn)品形態(tài)考慮成本設(shè)計(jì)

要立足場(chǎng)景正向設(shè)計(jì)產(chǎn)品從場(chǎng)景出發(fā)解決問題;續(xù)航能力將是制約人形機(jī)器人應(yīng)用和發(fā)展的又一個(gè)重要因素;需要做到萬元級(jí)別的成本才有可能大面積進(jìn)入家庭

中國(guó)公共服務(wù)機(jī)器人產(chǎn)業(yè)鏈研究報(bào)告2023-市場(chǎng)規(guī)?偭刻嵘^快,企業(yè)總量增速放緩

服務(wù)機(jī)器人的市場(chǎng)規(guī)模在2019年后快速增長(zhǎng),預(yù)計(jì)到2025年CAGR將達(dá)到近65%;人形機(jī)器人會(huì)是未來公共服務(wù)機(jī)器人主要形態(tài),軟件升級(jí)引領(lǐng)硬件發(fā)展

中國(guó)服務(wù)機(jī)器人行業(yè)未來的主要發(fā)展趨勢(shì)

商業(yè)模式創(chuàng)新,打造一體化服務(wù),持續(xù)拓展下游細(xì)分賽道;業(yè)務(wù)模式創(chuàng)新,多場(chǎng)景融合,實(shí)現(xiàn)實(shí)現(xiàn)一個(gè)服務(wù)機(jī)器人可以完成在多場(chǎng)景下完成工作

中國(guó)服務(wù)機(jī)器人行業(yè)發(fā)展目前面臨的潛在風(fēng)險(xiǎn)

新科技的出現(xiàn)可能會(huì)對(duì)傳統(tǒng)服務(wù)機(jī)器人廠商造成 一些沖擊;優(yōu)秀畢業(yè)生首選行業(yè)是軟件和信息服務(wù)可能會(huì)導(dǎo)致人才供給不足等風(fēng)險(xiǎn);行業(yè)內(nèi)公司經(jīng)營(yíng)模式相似度過高

中國(guó)服務(wù)機(jī)器人行業(yè)發(fā)展目前面臨的主要挑戰(zhàn)

收入和研發(fā)費(fèi)用的比例均超過了5%;國(guó)產(chǎn)機(jī)器人推廣應(yīng)用面臨新場(chǎng)景拓展慢的挑戰(zhàn);代理商分銷的方式可以有效的幫助服務(wù)機(jī)器人廠商也會(huì)造成市場(chǎng)的惡意競(jìng)價(jià)

服務(wù)機(jī)器人在中國(guó)市場(chǎng)短期迎來向好拐點(diǎn) 需求增長(zhǎng)

在已使用或計(jì)劃使用服務(wù)機(jī)器人的企業(yè)中,酒旅,金融服務(wù),餐飲快消行業(yè)滲透率最高,均超過20%;2023年6月我國(guó)服務(wù)機(jī)器人產(chǎn)量為662658臺(tái),同比增長(zhǎng)40%

服務(wù)機(jī)器人產(chǎn)業(yè)迎來向好拐點(diǎn) 增長(zhǎng)空間巨大

進(jìn)入2023年后服務(wù)機(jī)器人產(chǎn)量同比增長(zhǎng)47.6%,結(jié)束了連續(xù)12個(gè)月的同比下滑;人工智能技術(shù)的突破也將給服務(wù)機(jī)器人從語音,視覺,決策,控制四個(gè)方面帶來賦能

創(chuàng)澤上市輔導(dǎo)進(jìn)展情況報(bào)告(第十三期)20230414

中原證券參與輔導(dǎo)工作的人員為高巖,趙巖,鄒堅(jiān)貞,胡殿軍,李雅璇,開展輔導(dǎo)的方式主要包括持續(xù)關(guān)注相關(guān)行業(yè)領(lǐng)域熱點(diǎn)信息

環(huán)境感知的核心SLAM算法基本結(jié)構(gòu)可分為前端和后端

算法在前端完成占據(jù)柵格地圖的構(gòu)建,得出激光雷達(dá)掃描幀的最佳位姿后,后端根據(jù)掃描幀間的位姿關(guān)系進(jìn)行全局的地圖優(yōu)化,得出閉環(huán)掃描幀在全局地圖中的最佳位姿

環(huán)境感知模塊中基于激光雷達(dá)或視覺傳感器的SLAM算法是核心

環(huán)境感知模塊的基礎(chǔ)硬件是各類不同的傳感器,收集不同的測(cè)量信息,SLAM算法用于融合收集的信息數(shù)據(jù),機(jī)器人可以在未知環(huán)境中進(jìn)行自主探索和導(dǎo)航

運(yùn)動(dòng)控制、環(huán)境感知與人機(jī)交互是公共服務(wù)機(jī)器人三大核心技術(shù)模塊

環(huán)境感知模塊主要依靠如激光雷達(dá)實(shí)現(xiàn)對(duì)內(nèi)外部環(huán)境狀態(tài)信息的獲取;運(yùn)動(dòng)控制模塊主要依靠控制器等硬件實(shí)現(xiàn)派發(fā)的位置指令;人機(jī)交互模塊主要依靠多模態(tài)信息理解交互技術(shù)

公共服務(wù)機(jī)器人產(chǎn)業(yè)鏈價(jià)值集中于上游核心技術(shù)與下游商業(yè)服務(wù)環(huán)節(jié)

公共服務(wù)機(jī)器人產(chǎn)業(yè)鏈符合“微笑曲線”理論,產(chǎn)業(yè)鏈附加價(jià)值集中于上游核心技術(shù)部分以及中游機(jī)器人廠商對(duì)下游用戶的商業(yè)行為,中游機(jī)器人 整機(jī)制造商一般具備部分上游核心技術(shù)
資料獲取
行業(yè)動(dòng)態(tài)
== 最新資訊 ==
ICRA 自然語義引導(dǎo)的機(jī)器人技能操作
2023語義增強(qiáng)可編程知識(shí)圖譜SPG白皮
2023 中國(guó)人工智能系列白皮書--人工
2023中國(guó)人工智能系列白皮書《人工智能
AI大模型市場(chǎng)研究報(bào)告(2023)邁向通
深圳2023人工智能發(fā)展白皮書-人工智能
人形機(jī)器人的落地思考-場(chǎng)景聚焦明確產(chǎn)品形
銀行保險(xiǎn)金融機(jī)構(gòu)生成式人工智能戰(zhàn)略報(bào)告-
中小學(xué)階段的人工智能課程報(bào)告-人工智能課
中國(guó)公共服務(wù)機(jī)器人產(chǎn)業(yè)鏈研究報(bào)告2023
上海機(jī)器人產(chǎn)業(yè)園產(chǎn)業(yè)政策及入住代表性企業(yè)
2023年中國(guó)AI技術(shù)變革企業(yè)服務(wù)白皮書
中國(guó)服務(wù)機(jī)器人行業(yè)未來的主要發(fā)展趨勢(shì)
中國(guó)服務(wù)機(jī)器人行業(yè)發(fā)展目前面臨的潛在風(fēng)險(xiǎn)
中國(guó)服務(wù)機(jī)器人行業(yè)發(fā)展目前面臨的主要挑戰(zhàn)
== 機(jī)器人推薦 ==
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人開發(fā)平臺(tái)

機(jī)器人開發(fā)平臺(tái)


機(jī)器人底盤 Disinfection Robot 消毒機(jī)器人  講解機(jī)器人  迎賓機(jī)器人  移動(dòng)機(jī)器人底盤  商用機(jī)器人  智能垃圾站  智能服務(wù)機(jī)器人  大屏機(jī)器人  霧化消毒機(jī)器人  紫外線消毒機(jī)器人  消毒機(jī)器人價(jià)格  展廳機(jī)器人  服務(wù)機(jī)器人底盤  核酸采樣機(jī)器人  機(jī)器人代工廠  智能配送機(jī)器人  噴霧消毒機(jī)器人  圖書館機(jī)器人  導(dǎo)引機(jī)器人  移動(dòng)消毒機(jī)器人  導(dǎo)診機(jī)器人  迎賓接待機(jī)器人  前臺(tái)機(jī)器人  消殺機(jī)器人  導(dǎo)覽機(jī)器人 
版權(quán)所有 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 中國(guó)運(yùn)營(yíng)中心:北京 清華科技園九號(hào)樓5層 中國(guó)生產(chǎn)中心:山東日照太原路71號(hào)
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728