机器人在陌生环境找东西不再瞎逛!HyPerNav:看眼前+看地图,VLM帮它精准定位目标
摘要:HyPerNav 是无训练的目标导航框架,结合第一视角局部感知(RGB-D+Qwen-VL 检测)和俯视图全局感知(VLM 选路线),通过目标投影优化解决遮挡 / 障碍物问题,在 HM3D/OVON 仿真及真实环境中成功率超 60%,SPL 领先基线ÿ

