具身智能是人工智能從數字空間走向物理世界的重要形態,是推動
機器人從“程序化執行”邁向“自主理解與行動”的關鍵支撐。面向智能制造、智慧農業、醫療輔助、家庭服務和復雜環境作業等現實需求,開展具身智能基礎模型與機器人自主決策研究,對于提升機器人自主作業能力、發展新質生產力具有重要意義。《2026年國務院政府工作報告》明確提出將“具身智能”作為我國前瞻布局的未來產業之一。
機器人如何在長時程任務中始終保持對目標的理解和執行一致性,是當前具身智能面臨的核心基礎問題之一。現有“視覺—語言—動作”模型在短任務中已展現出較好能力,但在復雜連續任務中,機器人容易受到局部觀測、環境擾動和動作累積誤差影響,出現階段性動作合理但整體目標偏離的現象,制約其在開放物理環境中的穩定執行和泛化應用。
針對這一問題,重慶研究院尚明生研究員團隊提出面向長程任務的按需搜索方法。該方法將任務執行中的目標偏移重新理解為采樣過程中的系統性誤差,以執行過程中的不確定性變化為線索,識別可能導致目標偏移的關鍵節點。當機器人面對相似物體、遮擋環境、空間關系歧義和多步驟銜接等情形時,模型容易進入決策不穩定狀態。針對這類關鍵不確定節點,研究引入軌跡重采樣與一致性校驗機制,在全局目標約束下對候選動作序列進行篩選,從而降低局部最優決策造成的長程任務偏移風險,提升機器人在復雜連續任務中的執行穩定性。
實驗結果表明,該方法在多個長程機器人任務基準上取得良好效果。在 LIBERO-Long 基準上,方法平均成功率達到 97.6%,高于斯坦福大學、加州大學伯克利分校和 NVIDIA Research 提出的 RoboMonkey 方法;以具身智能頭部企業 Physical Intelligence 提出的π0模型為基礎模型進行驗證時,該方法在 RoboTwin 1.0 基準上將任務成功率提高 15.2%;在 RoboTwin 2.0 基準上,方法較清華大學提出的 RDT 模型提高 31.6%,并優于同期代表性測試時擴展方法 TACO。
相關研究工作已被國際學術會議ICML 2026、ACL 2026 和國際期刊ESWA等收錄。相關研究獲得中國科學院先導項目、國家自然科學基金等項目的支持。
版權與免責聲明:
凡本站注明“來源:智能制造網”的所有作品,均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網”。違反上述聲明者,本站將追究其相關法律責任。
本站轉載并注明自其它來源(非智能制造網)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網”,本站將依法追究責任。
鑒于本站稿件來源廣泛、數量較多,如涉及作品內容、版權等問題,請與本站聯系并提供相關證明材料:聯系電話:0571-89719789;郵箱:1271141964@qq.com。