深度摄像头已过基础期 未来将掀起3D浪潮

字号:T|T

[导读]目前,深度摄像头已经渡过技术基础期,方向明确了,将进入3-5年的成长期,未来将掀起3D传感器的浪潮。

  众多前沿领域的应用将越来越依赖深度摄像头,就好像VR、机器人、安防等为了得到更精准的体验,这也是为什么国际巨头都在布局于此的原因。深度摄像头(又称3D传感器)从视觉数据获取的角度提升机器感知能力。由于其具有一定的技术门槛,国内外涉足此研发的比较少。集中在国外有苹果、微软、谷歌、INTEL、Oculus、SONY,国内奥比中光、华捷艾米,图漾,乐行天下等。目前,深度摄像头已经渡过技术基础期,方向明确了,将进入3-5年的成长期,未来将掀起3D传感器的浪潮。

  别被2D的背景虚化给骗了

  3维视觉相比于2维视觉,多了一个维度,可以实现更加正确的物体分割,合适精度的三维测量,三维数据的模型重建以及智能视觉识别和分析。上海图漾信息科技有限公司徐韬解析,2维图像在复杂场景下由于缺少深度的信息无法正确分割物体。

  一个例子是,以前荣耀出过一款双摄像头的手机,但并非用来做深度,仅是两个不同摄像头的集合,然后进行图像优化,效果是要把背景虚化,但这个其实是假的。它只是把背景模糊了一下,靠猜测背景和人是不一样的物体,这个和深度没有关系,也就是说还只是通过2D处理实现背景虚化,并非真正的3D。而目前智能视觉识别和分析大部分也仍用2D来做。

  用3D做出的分割,去除背景和多物体分割都更精准。现在许多创业公司会利用微软kinect进行现场3D建模。同时利用3D图像进行面部识别的准确度更高。以上种种可以看出,3D视觉的确拥有巨大的优势。

  3D传感器市场格局

  之所以3D视觉还没有普及,因其技术不成熟且供应商仅少数几家企业。徐韬说,3D图像是在2D图像的基础上通过颜色渲染每一个点来代表不同的深度,深度图相对传统的平面图还有很大的提高空间。此外,由于多了一维,其数据处理却不只多一个数量级。在人工智能方面,如果用三维做分析,算法与计算量会有显著的增长,这就需要有新的处理方法来应对,在目前大部分还在用二维图形做处理的情形下,这也是一个挑战。

  深度摄像头的三种主要技术方法和代表公司分别为:一是单目结构光,代表公司有苹果(收购最大的结构光技术公司PrimeSense)、微软Kinect-1、英特尔RealSense、Google Project Tango等,目前可见的其他创业公司几乎都沿用此技术路线。二是双目可见光,代表公司LeapMotion。三是飞行时间法(TOF),代表公司微软Kinect-2。

  在国内,单目结构光供应商有奥比中光科技、华捷艾米软件,双目结构光方案有图漾科技,TOF方案的有乐行天下科技。此外,有两家上市公司也开始了内部研发项目。

  不过,徐韬表示图漾的3D传感器技术更像是单目结构光和双目可见光两种技术的结合,可获得更高的图像质量,并且应用场景更广,同时知识产权更加干净。

  “在光线不好的情况下,传统的单路结构光会有很大的问题,无法识别或者失效。而我们的产品可靠性更高,这一点在行业应用中占有优势。因为许多特定的行业对产品的可靠性要求非常高,有些竞品在多设备情况下存在互相干扰无法协同,而我们在多设备条件下能够协高工作。” 徐韬说道。

  最早是一些以色列的创业公司进行深度摄像头的研发,现在这些公司几乎都被科技界巨头收购。比如苹果收购PrineSense,这家公司是深度摄像头的民用化先锋。收购后,不再对外供货。微软使用PrineSense技术做出了Kinect一代,Kinect-2采用内部开发技术,趋于封闭生态。谷歌则不会成为一项产品或技术的供应商,而在于推动应用开发。同样Intel力推Realsense方案需搭配X86芯片使用。可以说巨头的深度摄像头都有为己所用的形态。徐韬认为,这种现状留给了深度摄像头创新型公司更大的市场空间,尤其在行业应用方面。

  有望取代激光雷达 引发机器人及VR内容应用革命

  深度摄像头最知名的消费级应用是体感摄像头,如微软XBOX游戏机的体感摄像头Kinect。微软的HOLOLENSE也大量采用了深度摄像头。深度摄像头最热的领域是机器人,自动驾驶,AR/VR,智能安防智能家居,消费娱乐等,它们对深度摄像头有着非常巨大的需求。

  例如VR配备手势识别和动作识别时用视觉做更多的捕捉,而AR对深度摄像头的需求更大,因为要感知环境,与真实环境融合。联想TANGO手机用深度摄像头做AR应用,据悉已在小批量发货,主打行业应用。

  未来,可以利用深度摄像头直接生成内容,无需其他处理或用电脑生成。这充分解决了现在缺少优质VR内容的短板,将带来民众直接拍摄的VR内容的激增。

  智能安防领域,通过智能摄像头分析人的行为是否在有潜在危害,在金融行业颇有用途,但对算法要求非常高,到目前为止,还没有非常好的产品出现。

  另外,用来做视觉导航在目前大热的领域包括机器人、无人机以及其他移动的场景,这是消费刚需。徐韬认为,现在机器人用激光雷达进行视觉导航,存在价格昂贵,信息缺失的问题。因为它只是在面上作扫描,获得的信息并不完整,导航作用有限。深度摄像头做视觉导航,被普遍认为是行业的发展方向。据介绍,目前已经有具备一定技术研发能力的机器人公司开始用图漾的3D传感器做视觉导航。

  机器人的导航主要有无线定位、激光雷达、视觉导航、惯性导航以及超声波等方式。随着3D传感器的发展,视觉导航有望成为最主流的方式。“我认为视觉导航是终结且最好的解决方法,但目前深度摄像头还不成熟,因此激光雷达还有一定的空间,一旦3D传感器技术成熟,那么激光雷达在机器人导航领域可能被秒杀。”

  再看看各方的动作,Intel正在推动深度摄像头在电脑中的普及,Google正在尝试深度摄像头与平板的结合。此外手机公司对深度摄像头小型化开始关注,创业公司则投入在硬件与移动设备的结合,利用深度测量能力的应用开发的创新。

  深度摄像头是技术门槛非常高的行业,徐韬表示图漾在掌握自有技术的同时,定位在专业的深度摄像头供应商,针对不同行业推出不同版本,提供完整的技术支持做定制化方案。由于具备了一定的优势,也受到了资本市场的认可。随着巨头的积极布局以及技术的逐渐成熟,还有3-5年的技术爆发期,目前是一个很好的时间窗口。

编辑:Eve
加载中...