如何评价高博的《视觉SLAM十四讲》?

SLAM技术在20世纪90年代开始应用于电脑游戏。玩星际争霸,每个士兵穿越迷雾前进,都离不开SLAM算法。在几百块钱的扫地机器人里,用几十块钱的嵌入式单板,几块钱的红外传感器,1块钱的玩具电机,遍历房间打扫卫生。说实话,在这些算法中,更不用说李代数甚至线性代数都不需要状态估计。通过使用红外传感器,机器人的位置估计更简单、更精确和更有效,并且不需要使用摄像机。而且在大多数实际应用中,机器人其实根本不需要估计自己的位置。机器人只需要找到目标,向目标移动,遇到障碍物时避开障碍物。如果视觉系统找不到目标,它将遍历房间。

所以依我拙见,SLAM技术也就2000左右,根本不需要创新。摄像机和视觉在机器人工程中的应用,真正要解决的问题是让机器人明白哪里是客厅,哪里是厨房,哪里是冰箱。当主人下令来到冰箱前,机器人可以自己移动到冰箱附近,打开冰箱门,拿东西。这是一个四五岁的孩子到了陌生的环境,能够自己观察环境,听到大人的指令,才能做到的事情。这才是今天真正的创新应该做的。你的状态估计不仅是三维空间的内部估计,也是视觉语义空间的估计。视觉语义空间就是让机器人建立和人类一样的对周围环境的理解。因为机器人进行的三维空间建模无法与人直接交流。只有对房间的视觉语义空间进行建模,才能真正与人交流,解决实际应用问题。能做到这一点,那NB就大了!