理工學(xué)院師生共7篇論文被機(jī)器人與智能系統(tǒng)領(lǐng)域頂會(huì)之一IROS 2025接收
近日,香港中文大學(xué)(深圳)理工學(xué)院共有7篇論文被IEEE智能機(jī)器人與系統(tǒng)國(guó)際會(huì)議(IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2025)接收。
在被接收的論文中,作者包括理工學(xué)院:
在讀碩士生—成就、林澤昕、王陳煒、吳東昊
在讀博士生—李紹銘、錢(qián)程、王浩、徐映天
碩士畢業(yè)生—蔡昌亨、萬(wàn)瀚文
博士畢業(yè)生—季廣霖
通訊作者或指導(dǎo)老師為理工學(xué)院朱建副教授、孫正隆助理教授、鐘仿洵助理教授、冀曉強(qiáng)研究助理教授。
?
會(huì)議介紹
IEEE智能機(jī)器人與系統(tǒng)國(guó)際會(huì)議(IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS) 是機(jī)器人與智能系統(tǒng)領(lǐng)域最著名、影響力最大的頂級(jí)學(xué)術(shù)會(huì)議。?
作為國(guó)際機(jī)器人與自動(dòng)化領(lǐng)域的兩大影響最大的學(xué)術(shù)會(huì)議之一,自機(jī)器人技術(shù)發(fā)展初期的1988年開(kāi)始,IROS每年舉辦一屆。每年,來(lái)自世界各個(gè)頂尖機(jī)器人研究機(jī)構(gòu)的專(zhuān)家和業(yè)界人士匯聚在這個(gè)盛會(huì),探討和展示機(jī)器人行業(yè)最前沿的技術(shù)。IROS 2025共收到來(lái)自66個(gè)國(guó)家/地區(qū)的4306篇論文投稿,以及來(lái)自IEEE期刊(TRO, RAL, RAM, TASE, TIE, TII, TMech)轉(zhuǎn)載的論文777篇,最終接收論文共計(jì)1991篇,接收率為46%。
?
論文介紹
論文一
題目:Modeling of Viscoelastic Liquid Crystal Elastomer Actuators
摘要:近年來(lái),傳統(tǒng)導(dǎo)管技術(shù)已在神經(jīng)介入手術(shù)中展現(xiàn)出臨床實(shí)用性,但腦血管系統(tǒng)的曲折性對(duì)外科醫(yī)生的專(zhuān)業(yè)技能提出了極高的要求,需要通過(guò)手動(dòng)操作克服復(fù)雜的解剖結(jié)構(gòu)。為了通過(guò)降低技術(shù)門(mén)檻和優(yōu)化手術(shù)效率來(lái)推進(jìn)神經(jīng)介入實(shí)踐,實(shí)現(xiàn)具有更高靈活性的主動(dòng)可操控導(dǎo)管已成為一項(xiàng)關(guān)鍵目標(biāo)。液晶彈性體作為軟體驅(qū)動(dòng)器具有大變形和多種驅(qū)動(dòng)模式等獨(dú)特特性,有助于實(shí)現(xiàn)柔性醫(yī)用微導(dǎo)管的可控彎曲,提高其在醫(yī)療過(guò)程中的可操作性。然而該驅(qū)動(dòng)器表現(xiàn)出明顯的遲滯特性,其建??刂朴泻艽筇魬?zhàn)。本文提出了一個(gè)動(dòng)力學(xué)模型來(lái)描述光激勵(lì)液晶彈性體驅(qū)動(dòng)器的非線(xiàn)性時(shí)變表現(xiàn)。首先建立輸入激光功率與軟驅(qū)動(dòng)器溫度響應(yīng)的非線(xiàn)性關(guān)系,并應(yīng)用粘彈性模型擬合其形變的遲滯特性,然后基于伸縮型驅(qū)動(dòng)器,采用灰箱模型辨識(shí)算法擬合未知參數(shù),驗(yàn)證了該模型的可靠性,最終應(yīng)用于彎曲型驅(qū)動(dòng)器中,實(shí)現(xiàn)了較好的前饋控制效果。此外,該工作也為未來(lái)多驅(qū)動(dòng)器組合的全向彎曲微導(dǎo)管的實(shí)時(shí)控制奠定了基礎(chǔ)。
?
理工學(xué)院參與作者:
第一作者:王浩,2020級(jí)計(jì)算機(jī)與信息工程專(zhuān)業(yè)在讀博士生。
通訊作者:朱建,香港中文大學(xué)(深圳)理工學(xué)院副教授,深圳市人工智能與機(jī)器人研究院兼職研究員。
?
論文二
題目:Multimodal Deformation Estimation of Soft Pneumatic Gripper During Operation
摘要:許多機(jī)器人任務(wù)都需要知曉機(jī)器人精確的三維幾何結(jié)構(gòu),然而,軟體機(jī)器人的結(jié)構(gòu)無(wú)法通過(guò)一組有限的可測(cè)參數(shù)(如關(guān)節(jié)角度和連桿長(zhǎng)度)推算。這就使得精確掌握軟體機(jī)器人三維幾何形態(tài)極為困難,難以完成復(fù)雜的接觸型操作任務(wù),阻礙了廣泛使用。為攻克這一難題,我們首先設(shè)計(jì)了能夠突破傳統(tǒng)單軸彎曲的局限的雙腔道氣動(dòng)執(zhí)行器,其具有高自由度和腔室間耦合交互的特性。其次,我們提出了一種低成本且低侵入性的傳感器設(shè)置模式,復(fù)用腕部攝像頭視覺(jué)信號(hào)并使用尖端IMU信號(hào)融合補(bǔ)足,再基于物理模型和數(shù)據(jù)可得性計(jì)算夾爪的幾何點(diǎn)云模型,本體感受幾何分辨率(PGR)達(dá)到558;然后,我們使用結(jié)合了注意力機(jī)制LSTM網(wǎng)絡(luò)的深度學(xué)習(xí)架構(gòu)融合多模態(tài)進(jìn)行形態(tài)學(xué)重建。我們的方法關(guān)鍵點(diǎn)預(yù)測(cè)的平均誤差為 3.67 毫米(方差為 8.39),相比之下,僅使用視覺(jué)信號(hào)的平均誤差為 4.36 毫米(方差 10.47),而僅使用IMU的平均誤差為9.32 毫米(方差 21.29)。這項(xiàng)工作為軟體機(jī)器人在復(fù)雜環(huán)境中的自主操作提供了新的可能性,為服務(wù)機(jī)器人、康復(fù)機(jī)器人及人機(jī)協(xié)作等領(lǐng)域的實(shí)際應(yīng)用鋪平了道路。
?
理工學(xué)院參與作者:
第一作者:蔡昌亨,2025屆計(jì)算機(jī)與信息工程專(zhuān)業(yè)碩士畢業(yè)生。
通訊作者:朱建,香港中文大學(xué)(深圳)理工學(xué)院副教授,深圳市人工智能與機(jī)器人研究院兼職研究員。
?
論文三
題目:Towards Fully Autonomous Robotic Ultrasound-guided Biopsy for Superficial Organs
摘要:為應(yīng)對(duì)超聲引導(dǎo)治療中對(duì)醫(yī)生技能高度依賴(lài)、培訓(xùn)成本高及專(zhuān)業(yè)醫(yī)師短缺等挑戰(zhàn),該工作提出了一種面向淺表器官穿刺的自主機(jī)器人系統(tǒng)。該系統(tǒng)集成了超聲探頭與自動(dòng)進(jìn)針機(jī)構(gòu),可在無(wú)需人工干預(yù)的情況下,按照臨床操作流程完成實(shí)時(shí)圖像導(dǎo)航與穿刺取樣操作。通過(guò)非線(xiàn)性?xún)?yōu)化方法,系統(tǒng)實(shí)現(xiàn)了2D超聲圖像與3D體積數(shù)據(jù)之間的實(shí)時(shí)切片-體積配準(zhǔn),并輔助醫(yī)生選擇目標(biāo)圖像平面。在精準(zhǔn)定位目標(biāo)后,系統(tǒng)自主完成穿刺與取樣流程。
系統(tǒng)整體設(shè)計(jì)充分結(jié)合了臨床操作規(guī)范與3D解剖先驗(yàn),實(shí)現(xiàn)了從圖像獲取、配準(zhǔn)導(dǎo)航到穿刺執(zhí)行的完整閉環(huán)。本文還提出了一種在精度與實(shí)時(shí)性之間取得平衡的導(dǎo)航方法,顯著提升了目標(biāo)定位的準(zhǔn)確性與穿刺的可靠性。實(shí)驗(yàn)驗(yàn)證結(jié)果表明,該系統(tǒng)在多種場(chǎng)景下均表現(xiàn)出良好的可行性、魯棒性與泛化能力,為超聲引導(dǎo)治療的智能化與自動(dòng)化提供了全新解決方案。該工作為面向?qū)嶋H應(yīng)用的智能醫(yī)療機(jī)器人系統(tǒng)提供了有力支撐。
圖:自主超聲引導(dǎo)穿刺活檢工作流程:1)3D解剖結(jié)構(gòu)預(yù)處理;2)基于配準(zhǔn)的視覺(jué)伺服和導(dǎo)航;3)細(xì)針穿刺活檢
圖:多淺表器官體模(左:甲狀腺,右:乳腺)全流程實(shí)驗(yàn)評(píng)估
?
理工學(xué)院參與作者:
第一作者:王陳煒,2023級(jí)計(jì)算機(jī)與信息工程專(zhuān)業(yè)在讀碩士生。
共同一作:錢(qián)程,2024級(jí)計(jì)算機(jī)與信息工程專(zhuān)業(yè)在讀博士生。
通訊作者:孫正隆,香港中文大學(xué)(深圳)理工學(xué)院助理教授,校長(zhǎng)青年學(xué)者,博士研究生導(dǎo)師。
?
論文四
題目:High-dynamic Tactile Sensing for Tactile Servo Manipulation: Let Robots Swing a Hammer
摘要:本研究聚焦于高動(dòng)態(tài)觸覺(jué)感知與伺服控制的實(shí)時(shí)性與魯棒性挑戰(zhàn),以機(jī)器人釘釘子任務(wù)為例,通過(guò)允許錘子在剛性雙指夾爪中受控滑動(dòng),指間的觸覺(jué)系統(tǒng)能夠?qū)崟r(shí)感知連續(xù)滑動(dòng),并據(jù)此動(dòng)態(tài)調(diào)節(jié)夾緊力。動(dòng)態(tài)滑動(dòng)觸覺(jué)伴隨著震動(dòng)與高頻信號(hào),觸覺(jué)傳感器感知頻率為1 kHz,論文采用短時(shí)傅里葉變換(STFT)與雙流物理知識(shí)引導(dǎo)機(jī)器學(xué)習(xí)(PIML)模型,提取高頻觸覺(jué)特征并降低反饋延遲,平均延遲僅為1.04 ms。系統(tǒng)采用鼓勵(lì)旋轉(zhuǎn)滑動(dòng)增強(qiáng)沖擊力并吸收反沖,抑制平行滑動(dòng)以維持夾持穩(wěn)定性的動(dòng)態(tài)調(diào)整策略。
實(shí)驗(yàn)表明,該方法相比傳統(tǒng)將錘子剛性固定的方式,在增強(qiáng)沖擊力(提升179.97%,從28.06 N提升至78.56 N)和減少反沖(下降64.26%,從223.30 N降至79.81 N)方面表現(xiàn)顯著。該方法還適配不同質(zhì)量分布的錘子,展現(xiàn)出優(yōu)越的操作靈活性和動(dòng)態(tài)適應(yīng)能力。研究成果為高動(dòng)態(tài)觸覺(jué)交互任務(wù)提供了有效的新思路。
圖:錘擊過(guò)程中動(dòng)態(tài)握持與剛性握持的受力比較
?
理工學(xué)院參與作者:
第一作者:徐映天,2021級(jí)計(jì)算機(jī)與信息工程專(zhuān)業(yè)博士研究生,研究方向?yàn)闄C(jī)器人觸覺(jué)感知與應(yīng)用。
通訊作者:孫正隆,香港中文大學(xué)(深圳)理工學(xué)院助理教授,校長(zhǎng)青年學(xué)者,博士研究生導(dǎo)師。
?
論文五
題目:An Open-Source Snake Hole-Digging Inspired Safety-Critical Insertion Planning and Replanning Framework for Continuum Robots
摘要:本論文提出了一種受蛇類(lèi)挖洞行為啟發(fā)的開(kāi)源安全關(guān)鍵插入規(guī)劃與重規(guī)劃框架,用于多節(jié)段連續(xù)體機(jī)器人在動(dòng)態(tài)環(huán)境中的運(yùn)動(dòng)控制。論文的主要貢獻(xiàn)包括:蛇類(lèi)挖洞行為(圖4)啟發(fā)的最優(yōu)插入規(guī)劃框架:與傳統(tǒng)的前導(dǎo)跟隨(FTL)運(yùn)動(dòng)不同,該框架利用所有節(jié)段調(diào)整整體構(gòu)型,而不僅依賴(lài)遠(yuǎn)端節(jié)段引導(dǎo)運(yùn)動(dòng)。通過(guò)逆向運(yùn)動(dòng)規(guī)劃(Algorithm 1),機(jī)器人在插入過(guò)程中逐步擬合預(yù)規(guī)劃的最終形狀,顯著降低了與目標(biāo)路徑的平均偏差,與傳統(tǒng)方法相比提升75.36%)。
實(shí)時(shí)全局避障與目標(biāo)跟蹤:通過(guò)將控制屏障函數(shù)(CBF)和控制李雅普諾夫函數(shù)(CLF)集成到二次規(guī)劃(QP)框架中(CLF-CBF-Q),實(shí)現(xiàn)了動(dòng)態(tài)障礙物環(huán)境下的在線(xiàn)運(yùn)動(dòng)重規(guī)劃。實(shí)驗(yàn)顯示,CLF-CBF-QP在移動(dòng)障礙物干擾下仍能保證機(jī)器人末端到達(dá)目標(biāo)位置(圖7),其平均誤差比僅用CBF-QP降低了48.43%。?
圖:蛇類(lèi)挖洞行為
圖:利用Adjusting space調(diào)整全局位姿
圖:逆向運(yùn)動(dòng)規(guī)劃:從最終姿態(tài)規(guī)劃到初始姿態(tài)全過(guò)程
圖:CLF-CBF-QP與CBF-QP動(dòng)態(tài)避障對(duì)比
開(kāi)源實(shí)現(xiàn):論文提供了完整的開(kāi)源代碼,涵蓋運(yùn)動(dòng)規(guī)劃、避障算法及仿真測(cè)試模塊,為連續(xù)體機(jī)器人社區(qū)的研究與應(yīng)用提供了實(shí)用工具,詳情請(qǐng)見(jiàn):https://github.com/bentferrari/Online-Planning-CR
?
理工學(xué)院參與作者:
第一作者:季廣霖,2025屆博士畢業(yè)生,博士期間主要從事連續(xù)體機(jī)器人控制以及運(yùn)動(dòng)規(guī)劃研究工作。其研究成果發(fā)表在IEEE Transactions on Robotics, IEEE Transactions on Industrial Electronics, IEEE Robotics and Automation Letters, IEEE IROS, IEEE AIM, IEEE EMBC,Cyborg and Bionic Systems等國(guó)際知名期刊與會(huì)議。
通訊作者:孫正隆,香港中文大學(xué)(深圳)理工學(xué)院助理教授,校長(zhǎng)青年學(xué)者,博士研究生導(dǎo)師。
?
論文六
題目:Efficient Underwater Object Detection With Enhanced Feature Extraction and Fusion(高效水下目標(biāo)檢測(cè)與增強(qiáng)的特征提取和融合)
摘要:水下目標(biāo)檢測(cè)在環(huán)境監(jiān)測(cè)、資源勘探和自主水下航行器(AUV)導(dǎo)航等領(lǐng)域至關(guān)重要。然而,由于水下成像條件嘈雜、光照多變和背景復(fù)雜,精確檢測(cè)小型目標(biāo)仍然充滿(mǎn)挑戰(zhàn)。針對(duì)這些難題,本文提出了一個(gè)名為“自適應(yīng)殘差注意力網(wǎng)絡(luò)”(ARAN)的優(yōu)化深度學(xué)習(xí)框架,旨在增強(qiáng)對(duì)復(fù)雜水下環(huán)境中微小目標(biāo)的檢測(cè)與精確識(shí)別能力。
ARAN框架的核心是一個(gè)創(chuàng)新的“融合PANet”(Fusion PANet),它通過(guò)有效地區(qū)分目標(biāo)與背景來(lái)優(yōu)化空間特征。該框架集成了三個(gè)關(guān)鍵的新模塊:(1)多尺度特征注意力(Multi-Scale Feature Attention, MFA),用于增強(qiáng)低級(jí)特征的提??;(2)高低特征殘差學(xué)習(xí)(High-Low Feature Residual Learning, HFRL),通過(guò)跨維度交互捕捉像素級(jí)關(guān)系;(3)自適應(yīng)多級(jí)特征聚合(Adaptive Multi-Level Feature Aggregation, AMFA),動(dòng)態(tài)調(diào)整融合權(quán)重,以促進(jìn)漸進(jìn)式多級(jí)特征融合,并緩解多尺度集成中的沖突,確保小目標(biāo)不會(huì)被忽略。
在四個(gè)基準(zhǔn)數(shù)據(jù)集上的大量實(shí)驗(yàn)證明,ARAN的性能顯著優(yōu)于主流模型。特別是在CSIRO數(shù)據(jù)集上,ARAN實(shí)現(xiàn)了98%的mAP50,精確率、F2分?jǐn)?shù)和召回率均達(dá)到94.7%。這些結(jié)果證實(shí)了該模型在水下目標(biāo)檢測(cè)方面具有卓越的準(zhǔn)確性、魯棒性和效率,凸顯了其在復(fù)雜水下環(huán)境中實(shí)際部署的巨大潛力。
圖:網(wǎng)絡(luò)結(jié)構(gòu)
圖:識(shí)別結(jié)果
?
理工學(xué)院參與作者:
第一作者:李紹銘,2024級(jí)計(jì)算機(jī)與信息工程專(zhuān)業(yè)在讀博士生,導(dǎo)師為理工學(xué)院鐘仿洵教授。主要研究方向?yàn)榛趯W(xué)習(xí)的三維感知與交互、醫(yī)療機(jī)器人視覺(jué)導(dǎo)航。
通訊作者:鐘仿洵,香港中文大學(xué)(深圳)理工學(xué)院助理教授,人工智能學(xué)院兼職教授,博士生導(dǎo)師(副研究員),校長(zhǎng)青年學(xué)者。
由鐘仿洵教授作為組織者之一的研討會(huì)“Soft Tissue Manipulation In Robotic Surgery(面向機(jī)器人輔助手術(shù)的軟組織自主操控技術(shù))”也被IROS 2025接收,研討會(huì)將探討機(jī)器人軟組織操作的前沿挑戰(zhàn)與最新進(jìn)展。組織安全操作是最常見(jiàn)的普外科手術(shù)類(lèi)型之一,其自動(dòng)化對(duì)于進(jìn)一步提升機(jī)器人手術(shù)的精確性、可靠性和安全性至關(guān)重要。近年來(lái),機(jī)器人軟組織操作雖已取得重大突破,但由于軟組織固有的復(fù)雜性(如非線(xiàn)性彈性、不同組織及患者間的力學(xué)特性差異等),要實(shí)現(xiàn)穩(wěn)定可靠的操作仍面臨諸多挑戰(zhàn)。研討會(huì)將重點(diǎn)圍繞精確建模與仿真、實(shí)時(shí)感知與交互、魯棒控制策略、機(jī)器人設(shè)計(jì)、智能決策能力等關(guān)鍵領(lǐng)域展開(kāi)討論。詳情請(qǐng)見(jiàn):https://sites.google.com/view/iros25-softtissuemanipulation/home
?
論文七
題目:EmbodiedAgent: A Scalable Hierarchical Approach to Overcome Practical Challenge in Multi-Robot Control
摘要:本文提出了 EmbodiedAgent,一個(gè)面向異構(gòu)多機(jī)器人的分層控制框架,旨在解決大模型在處理反物理事實(shí)任務(wù)時(shí)易產(chǎn)生幻覺(jué)的問(wèn)題。該方法融合了下一步動(dòng)作預(yù)測(cè)范式與結(jié)構(gòu)化記憶系統(tǒng),能夠?qū)?fù)雜任務(wù)動(dòng)態(tài)分解為可物理性執(zhí)行的機(jī)器人技能,并實(shí)時(shí)驗(yàn)證動(dòng)作是否符合環(huán)境約束。
為支持訓(xùn)練與評(píng)估,我們構(gòu)建了 MultiPlan+ 數(shù)據(jù)集,涵蓋 100 個(gè)場(chǎng)景、超過(guò)18,000條帶注釋的規(guī)劃實(shí)例,其中包含部分反事實(shí)任務(wù),用于緩解幻覺(jué)風(fēng)險(xiǎn)。除此之外,本文提出了機(jī)器人規(guī)劃評(píng)估框架(RPAS),結(jié)合自動(dòng)化指標(biāo)與大語(yǔ)言模型輔助的專(zhuān)家評(píng)估,以全面衡量模型性能。實(shí)驗(yàn)結(jié)果顯示,EmbodiedAgent 在多個(gè)基準(zhǔn)任務(wù)中均優(yōu)于現(xiàn)有先進(jìn)方法,RPAS 得分達(dá)到 71.85%,并在真實(shí)辦公服務(wù)任務(wù)中展現(xiàn)出多機(jī)器人的長(zhǎng)時(shí)序協(xié)作控制與執(zhí)行能力。
圖:EmbodiedAgent的渠道
?
理工學(xué)院參與作者:
第一作者:萬(wàn)瀚文,2025屆計(jì)算機(jī)與信息工程專(zhuān)業(yè)碩士畢業(yè)生,即將繼續(xù)攻讀計(jì)算機(jī)與信息工程專(zhuān)業(yè)博士學(xué)位,導(dǎo)師為理工學(xué)院冀曉強(qiáng)教授。主要研究方向?yàn)榫呱碇悄芸刂啤⒋竽P秃蛷?qiáng)化學(xué)習(xí)控制等。
獨(dú)立通訊作者:冀曉強(qiáng),香港中文大學(xué)(深圳)理工學(xué)院研究助理教授,東盟-中國(guó)人工智能實(shí)驗(yàn)室首席科學(xué)家。
其他作者包括理工學(xué)院碩博學(xué)生:林澤昕、吳東昊、成就
