答辩博士:刘少华
指导老师:薛金林 教授
论文题目:双臂梨果采摘机器人视觉感知定位与自适应采摘技术研究
答辩委员会:
主席:
康敏 教授/博导 南京农业大学
委员:
张保华 教授/博导 南京农业大学
丁启朔 教授/博导 南京农业大学
倪 超 教授/博导 南京林业大学
李 旭 教授/博导 东南大学
鲁植雄 教授/博导 南京农业大学
答辩秘书:
陈昊宇 南京农业大学
答辩时间:2026年05月29日 14:30
答辩地点:滨江校区12#B442
论文简介:
目前,我国乃至全球范围内,梨果收获仍以人工采收为主。然而,随着人口老龄化加剧与就业观念的转变,梨果规模化种植正面临劳动力日益短缺、用工成本逐年增加以及生产季节用工不稳定的问题。因此,研发面向实际生产需求的梨果采摘机器人,不仅是缓解用工矛盾的有效途径,更有助于梨果产业向标准化、规模化方向发展。近年来,苹果、番茄和猕猴桃等采摘机器人的关键技术研究已取得一定进展,但针对梨果的专用机器人研究仍较为匮乏。现有文献多将梨果作为果实检测或定位任务中的试验对象,缺乏结合梨果生物特性与梨园农艺条件的系统性采摘技术研究及完整装备验证。因此,本文搭建了一款基于梨园种植农艺约束的双臂梨果采摘机器人,提出了面向低算力嵌入式设备部署的轻量化YOLO结构重构与特征增强的遮挡分类检测方法,以及侧重检测精度的融合YOLO-CDS与RAFT-Stereo协同优化的双目三维定位方法,并构建了级联视觉感知自适应采摘方法,实现了面向果台保护的梨果采摘,并在果园环境中验证了采摘机器人的自主作业性能。本文主要完成了如下工作:
1. 搭建了一台双臂梨果采摘机器人作为关键技术研究的平台载体。集成了履带式移动底盘、随臂视觉感知系统、双臂协同执行机构、集果装置及自主导航模块,并针对挂果分布特征使用“双臂—滑轨”构型以扩展作业空间;基于ROS框架开发了控制系统,实现了多模块的协同调度与稳定运行;在依托该平台完成各项关键技术验证后,于真实梨园环境中开展了自主采摘试验;结果表明,在单点自主停靠采摘模式下,该平台针对无遮挡目标实现了73.1%的采摘成功率,果台损伤率为31.6%,验证了级联视觉感知自适应采摘方法在真实环境中的可靠性,并表明该平台具备支撑其稳定运行的工程基础。
2. 提出了一种面向低算力嵌入式设备部署的轻量化YOLO结构重构与特征增强的遮挡分类检测方法。针对复杂果园环境中多类型遮挡及通用检测模型在特定检测任务中存在计算冗余的问题,通过对梨果的遮挡状态进行了细粒度划分与结构化建模,构建了多分类梨果遮挡数据集DetectClass;通过检测层重构解决了计算冗余问题;通过优化特征提取模块和损失函数,增强了模型对遮挡目标的特征表达与判别能力以及训练收敛速度。在模型大小与模型参数量分别压缩至5.9 MB和2,499,072的同时,实现97.0%的mAP@50(提升2.0个百分点),并在算力受限的Jetson Xavier NX平台上达到31.9 FPS实时推理,验证了该方法在复杂果园环境下的高效性与工程适用性。该工作也揭示了剔除计算冗余后模型参量规模与检测精度间的正向耦合机制,为本文后续针对不同视觉感知任务开展差异化的模型选型与算法迭代提供了理论支撑。
3. 提出了一种基于YOLO-CDS与RSIQR协同优化的三维定位方法,构建检测与深度估计协同优化的三维感知框架。针对复杂果园环境中光照变化剧烈、遮挡干扰显著及传统立体匹配算法鲁棒性不足等问题,在检测层面,引入多尺度特征增强与边界回归优化策略,实现复杂遮挡条件下97.5%的mAP@50(提升1.9个百分点),为稳定定位提供可靠目标约束;在深度感知层面,采用RAFT-Stereo替代传统SGM算法,并结合四分位距统计方法对目标区域深度进行优化,有效抑制误匹配与背景噪声干扰。定位试验结果表明,在300–1000 mm作业范围内,该方法在多种光照条件下均保持较高稳定性,最大定位误差为2.357% ± 0.415%;果园试验对无遮挡目标的实际采摘成功率达到91.93%,验证了所提出的三维定位方法在复杂环境下的工程实用性。
4. 提出了面向果台保护的级联视觉感知自适应采摘方法,构建“远距离筛选—近距离姿态解析—自适应采摘”的级联感知与决策框架。针对复杂果园环境中多源遮挡与视角变化导致单一视觉难以兼顾全局筛选与局部结构解析的问题,同时考虑缺乏生长姿态感知易引发果台损伤的实际约束,构建了远近双数据集体系,为级联视觉感知提供了数据基础;在远距离阶段,依托前文构建的视觉感知模型完成可采目标的全局筛选与空间定位,引导机械臂到达采摘目标近距离范围;在近距离阶段,针对果梗—离层区关键结构设计了高精度关键点检测模型,实现了目标分阶段的多尺度信息逐级表征,并完成了生长姿态的稳定推断,由此引导机械臂顺应生物力学薄弱面进行采摘轨迹规划,最终实现保护果台的梨果采摘作业。试验结果表明,所提出方法在实验室模拟水平棚架环境中可显著提升采摘完整率(56% vs. 92%),并在真实果园采摘试验中有效降低果台损伤率(64% vs. 18%),验证了农艺机理引导的感知—决策一体化方法在复杂环境下的有效性与工程应用价值。
本文创新点如下:
(1)提出了一种任务驱动的轻量化重构与特征增强的梨果遮挡分类检测方法。通过检测层重构大幅减少冗余计算,并围绕遮挡类别判别对特征增强模块进行针对性优化,提升模型对不同遮挡形态的区分能力,压缩模型体积的同时兼顾了检测精度与推理速度。
(2)提出了一种基于检测与深度估计协同优化的抗干扰双目三维定位方法。使用改进的检测模型提供精确的二维边界约束,使用深度学习立体匹配网络优化视差计算,并结合四分位距统计构建深度滤噪机制以剔除异常值,实现了复杂果园环境下梨果三维空间信息的稳定获取。
(3)提出一种面向果台保护的生长姿态自适应采摘方法。使用级联感知机制:远距利用目标检测模型筛选可采目标并定位,近距依托关键点检测解析果梗—离层区结构以推断生长姿态,从而引导机械臂实现保护果台的采摘,形成作物特性驱动的感知—决策闭环。