创新

视觉导航


视觉导航是机器视觉的一部,指通过图像摄取装置将被摄取的目标转换成图像信号,传送给专用的图像处理系统,根据像素分布和宽度、颜色等信息,转换成数字信号,图像系统对这些信号进行各种运算,抽取目标的特征,进而根据判别的结果来控制现场的设备动作。机器视觉的主要研目标是使计算机具有通过二维图像认知三维坏境信息的能力,能够感知与处理三维环境中物体的形状、位置、姿态、运动等几何信息。


目前视觉导航广泛应用在无人驾驶和无人机技术上面。在无人驾驶中感知是 无人驾驶的最基础部分,没有对车辆周围三维环境的定量感知,就有如人没有了眼睛,无人驾驶的决策系统就无法正常工作。而视觉导航为无人机提供了很重要的避障功能,通过视觉感知周围环境,是无人机自主的进行导航,避免出现碰撞行为。


意欧斯一直致力于 AGV 的视觉导航的研发工作,以求通过精密的视觉算法, 来降低 AGV 的制造成本 。 目前 SLAM 是最主流的视觉导航方式, Slam(Simultaneous Localization And Mapping,同时定位和同时建图),即利用传感器来进行机器人的自身定位以及对周围环境的建图。当机器人来到一个陌生的环境中时,它需要迅速的建立自身与环境的关系,“我现在在哪里?”“我要去哪里?”“我从哪里来?”,“我现在要干什么?”“我现在看到的世界是什么样子”“我能在已有的抽象世界中定位我的位置吗?”等一系列问题,依据这些问题,机器人能完美的做出回答即是 SLAM 方法需要解决的。SLAM 通过激光扫描头将激光打在周边环境中以获取反射,形成激光点位,进而形成点云,再通过 内部算法,讲目前点云和预先在系统中形成的地图进行对比,以确认车辆当前的位置。


SLAM 大概可分为激光 SLAM(也分 2D 和 3D)和视觉 SLAM 两大类。


SLAM

关于激光 SLAM 2D, 就是SLAM定位时,仅用单线激光传感器,在激光传感器扫描的这一个平面上进行二维定位,在获取精密的二维定位后,在此基础上解算三维激光点云,成为一个完整的空间三维数据。


同理,激光 SLAM 3D,就是要用三维激光传感器,获取三维数据,然后通过三维数据的特征点匹配进行定位,然后在三维定位基础上,来计算和匹配完整的三维数据,最后得到其位姿。


SLAM方案已经相对成熟但是激光扫码头的价格非常昂贵,这个直接导致 AGV小车的价格增加。


意欧斯尝试和一些视觉方面的专家共同研发,基于视觉处理,图算法的导航技术。我们将机器在四个方向装上摄像头,通过不断拍摄周边图片,结合视觉算法,让机器知道自己处在什么地方,让机器知道前方是不是有人,我是不是需要停下来避让。这里的难点是我们需要将拍摄到的大量的图片经过图算法后告知调度系统我现在在哪里,我下一步改往哪里走,这种算法将消耗大量的硬件资源。 我们想在将来配合 5G 技术,和雾计算,来将大量的计算工作可以不在机器本身计算,以节省机器本身的功耗,而通过雾计算来处理大量的图片。这样既能避免网络延时问题,又能起到高速计算,节省功耗。而对比SLAM 来讲,普通的工业摄像头将大大降低车辆本省的一个成本。


意欧斯知道视觉导航将在未来的智能仓储中得到大量的应用,给我们的智能、设备长上眼睛后,将使我们的设备越来越智能,越来越灵活。