近日,我院智能农机动力技术与无人系统团队在国际权威期刊Journal of Manufacturing Systems(IF=14,中科院一区TOP,南农A类)发表题为Large language models in human-robot collaboration: A systematic review, trends, and challenges的综述性研究论文。该研究系统梳理了1278篇相关文献,剖析了三大智能体范式与分层训练框架,揭示了大语言模型如何推动人机协作从“规则驱动”迈向“认知协同”,对推动制造业向智能化、人本化转型具有重要学术与工程价值。

该研究指出,大语言模型凭借其强大的语义理解、上下文推理与任务分解能力,正推动人机协作从传统的“固定规则响应”模式,向更具认知性、自适应性的“语义协同”模式转变。尤其在动态环境感知、长周期任务规划、多模态交互等方面,大语言模型展现出显著优势,为人与机器人在复杂制造场景中的高效、自然协作提供了新的技术路径。
综述同时揭示了当前大语言模型在人机协作中面临的几大核心挑战:包括在动态环境中的实时适应能力不足、多模态信息融合中的语义对齐困难、系统决策的可解释性与安全性保障,以及跨场景任务泛化能力的局限。这些问题限制了其在工业环境中的大规模可靠部署。
为推进该领域的发展,研究团队提出未来潜在研究方向:
构建融合实时反馈的世界模型,增强动态感知与响应能力;
设计轻量化自适应融合架构,提升多模态信息处理效率;
建立系统化定量评估体系,科学衡量任务规划性能;
采用模块化系统设计,增强系统可扩展性与可维护性;
开发双向可解释性工具,增进人机互信、推动协作透明化。

该综述不仅为智能制造学界梳理了研究重点,也为工业界在智能制造、柔性生产等场景中引入大语言模型提供了理论依据与技术路线参考。随着技术的进一步融合与突破,大语言模型有望成为实现人机共融、认知制造的关键赋能技术,推动产业向更高效、更安全、更智能的方向持续演进。
南京农业大学工学院袁刚副教授为本文第一作者,肖茂华教授为共同通讯作者。此外,本综述研究也得到了东南大学、米兰理工大学和瑞典皇家理工学院的多位资深学者的理论指导。研究工作得到国家自然科学基金项目(NO:52405537)、教育部人文社会科学基金项目(NO:24YJCZH446)以及江苏省卓越博士后科研项目(NO:2023ZB634)的资助。