房叔话安防 之 深鉴科技姚颂要扛起深度学习的大旗

2018-02-05 · 作者:房叔话安防

[导读]2018年起始之时,深鉴科技已经拥有六款产品:深度学习开发SDK DNNDK、人脸检测识别模组(前端)、人脸分析解决方案(后端)、视频结构化解决方案(人/车分析)、深鉴ARISTOTLE架构平台、语音

房叔话安防 之 深鉴科技姚颂要扛起深度学习的大旗 - 张新房 - 张新房的博客 - AI+安防

缘起深圳安博会

2017年11月1日,深圳安博会的现场,虽然展会进行到了最后一天还是人头攒动。AI毫无疑问引爆了整个安博会。早就听说深鉴科技的大名,在空闲时间赶紧按照我事先列好的AI企业名单来到了深鉴科技的展位,他们的商务经理Fleda Liu很热情的招待了我们,耐心仔细的解释促使我写一篇文章,我向她表明我自媒体的身份,打算写一篇关于深鉴科技的文章,我要信守我的承诺,就有了这一篇文章。

一个好汉三个帮

详究深鉴科技的发展历程,就是一个好汉三个帮的故事。

好汉姚颂1992年出生,深鉴科技创始人兼CEO。大概是长沙人,因为姚颂第一次见诸报端,2008年就读长沙市一中的他被保送清华大学。

媒体报道高中时期的姚颂还是有几分腼腆,笑起来圆圆的脸庞上还有两个酒窝。据姚颂自己说“从小学二年级开始到初三都是学的数学奥赛。进入高一时,他非常喜欢物理,同时也仰慕学校的金牌物理教练黄洪才,听说他带三届学生拿了4块金牌,于是临时决定转攻物理奥赛。”而他不负众望获得全国中学生物理竞赛二等奖,含金量极高的全国联赛一二等奖都可保送清华、北大。除了物理,姚颂还是多才多艺的,吉他、绘画、篮球都是他的最爱。

得知保送后,姚颂开始自学C语言编程,也坚持学习英语。

2011年进入清华大学后,姚颂就读电子系,在大一的时候就天赋初现。2012年年初进入汪玉博士的实验室,从三维集成电路设计、硬件安全等CAD方面的研究开始,后转而钻研计算机体系结构。2014年7月前往斯坦福大学电子系进行2个月的LLVM编译器开发实习。2014年9月以后在微软亚洲研究院实习(上篇文章报道印奇也是在这里实习),方向是设计与开发应用于必应搜索引擎专用加速处理器的专用编译器,正是在此奠定了姚颂的创业基础和方向:深度学习硬件。大学期间他还担任电子系科协主席,举办过一系列科创赛事,因此大三时就被同学称为“姚老板”(现在是名副其实,这是后话),主要成就是获得ACM学生科研竞赛金牌、“星火计划”第八期成员。

2015年毕业之际,姚颂获得卡内基梅隆大学的博士Offer(当然还有高额学术奖金),虽然父母反对他还是放弃了这个机会,创业和深造之间他选择创业。

2015年的清华学子想必很躁动,做出一番事业深入人心,姚颂也不例外。将最前沿的深度学习理论应用到产品中,他们看到了其中的商业价值和历史机遇,姚颂的导师早在2013年就布局以机器智能为核心的硬件加速研究,大洋彼岸另一位深度学习的专家也在寻找创业机会。清华大学对技术和产业的孵化作用,就好比斯坦福和麻省理工。这类学校的技术可以孵化出来很多现在著名的科技企业,那清华可不可以?这是他们的目标。

2015年7月,姚颂毕业之际,随着实验室算法做的越来越好,合作的项目也在不断增加的情况下,技术的商业落地情况却始终不能让姚颂满意,姚颂判断是时候成立一家公司来解决这个问题了。“2015年11月28日,我们几个联合创始人一拍即合,准备创业。第二天我就拉着姚颂开始写BP,清华很支持创新创业,人工智能又需要有基础的硬件平台,当时我们的技术可演示,就觉得天时地利人和。”另外一个创始人事后回忆,市面上也流传玩笑说:清华这拨人上了清华以后,毕业找个好工作,培养一个娃,再上清华,就这样做轮回。姚班之后,这种情况大大改观。姚颂是清华大学“星火计划”八期成员,学校允许大三、大四的学生申请,这样深鉴科技就在清华“创+”孵化项目的支持下开始创业,用他自己的话说,是“比较特殊的一期”。

2016年3月,姚颂与来自清华和斯坦福的学者们联合创立深鉴科技,目前专注于利用深度学习提高运算效率,为AI提供落地处理器平台和SDK。但创业都没有一帆风顺的,据姚颂回忆“在创业前融资那段是特别黑暗的时期,但同时也是对他整个人提升最大的时期。”公司成立之后,面临诸多挑战,姚颂身兼CEO、CTO、CFO和COO多个角色但不能间顾,想必是手忙脚乱、沟通不畅。当然对于一名刚刚毕业的学生而言,自然有个自我学习的过程,初始团队能够随着企业业务的壮大同步成长,是所有伟大企业的共同特征。

好在这是一只聪明大脑组成的队伍,虽然团队年轻却充满活力和学习能力。创始初期深鉴拥有8名员工,3位创始人、2位有工作经验的工程师、3个姚颂的同学,然而这8个人并没有全部坚持下来,中途有人离队,初创AI企业大多数面临了更大的困境,团队要能够抵住压力、不断学习,还要将技术尽快转换成产品落地,而时间却是以天为单位进行计算的,人工智能的发展速度实在是太快了。

最初深鉴的产品定位是无人机,很明显大疆是市场的绝对领导者,而且数量级也在百万台,留给深鉴科技的机会并不多。后来决定专注于深度学习处理器领域,深度学习处理器一定要经过模型压缩、模型定点化、编译三大步骤,并且一定要拥有针对神经网络的专用结构。发现问题之后的团队决定攻克难关,经过努力,另一位创始人也成功研发了一种名为“深度压缩”的技术,它不仅可以将神经网络压缩数十倍而不影响准确度,还可以使用“片上存储”来存储深度学习算法模型,减少内存读取,大幅度减少功耗,从而奠定了深鉴的技术基础。经过转型深鉴科技终于有了清晰的使命“开拓人工智能的应用边界,开发压缩、编译、加速三位一体的自动化流程,实现算法、软件、硬件协同优化,赋予世界每个节点以智慧。”

聚焦哪些行业深鉴考虑过很多,无人机、安防、自动驾驶、医疗设备、家居物联网等,最终选择转型做安防(当然无人机的积累并没有放弃)。基于无人机技术的积累,着手开发压缩、编译、加速三位一体的自动化流程,试图实现算法、软件、硬件协同优化,为开发者打造高效的深度学习DPU平台(Deep Learning Processing Unit,深度学习处理单元)。姚颂的团队在适应AI热浪的过程中也是花了大力气的,不仅从事算法层面的研究、还关注技术在硬件层面的应用,高度聚焦算法压法,这让深鉴明显有别与市面上的AI初创企业,独树一帜。

2018年起始之时,深鉴科技已经拥有六款产品:深度学习开发SDK DNNDK、人脸检测识别模组(前端)、人脸分析解决方案(后端)、视频结构化解决方案(人/车分析)、深鉴ARISTOTLE架构平台、语音识别加速方案。而DNNDK要对标英伟达的TensorRT,DNNDK提供了一套完整全流程软件工具链,涵盖了神经网络推理(Inference)阶段从模型压缩、异构编程、编译到部署运行的全流程支持。降低了深度学习算法工程师和软件开发工程师DPU平台深度学习应用开发的门槛和部署难度,缩短算法部署到硬件的周期,加快了AI产品研发过程。当然姚颂还有更大的雄心“建立人工智能的软件生态环境、活跃的社区才有更本质的发展空间。”

根据媒体报道,在AI芯片大热的如今,预计深鉴科技自主研发了“听涛”和“观海”AI芯片将于2018年面世,留给深鉴的时间并不多,“加速快跑,在巨头推出落地产品之前,把自己的产品落地并实现商业化。”,目前,深鉴已经和三星在存储方面达成合作,加速深鉴迈进商业化阶段,在金融领域深鉴和蚂蚁金服共同开拓市场和应用场景。

最近三年,得益于GPU在深度学习的应用,中国诞生了一大批人工智能企业,包括人脸识别四大独角兽:旷视、云从、商汤和依图,而相比前者,深鉴的名气要小很多。2017年2月,创始人一篇论文《ESE: Efficient Speech Recognition Engine with Sparse LSTM onFPGA》获得了FPGA大会最佳论文奖,使得深鉴科技被国内外媒体大面积曝光,而深鉴科技的业务也逐渐走向正轨。

2017年入选福布斯中国30位30岁以下精英榜,这一年姚颂25岁。

汪玉老师

企业的成功离不开团队,好汉姚颂就有三个帮手:汪玉(创始人)、韩松(首席科学家)和单羿(CTO)。

房叔话安防 之 深鉴科技姚颂要扛起深度学习的大旗 - 张新房 - 张新房的博客 - AI+安防

姚颂大一进入汪玉的实验室,作为姚颂的导师,汪玉博士出生于1982年,毕业于清华大学。正是因为汪玉两位清华学长韩松和单羿也加入了深鉴科技,四个合伙人对深度学习有不同的细分研究,汪玉负责带领学生重点研究硬件加速、韩松擅长处理器芯片和压缩技术、姚颂除了做研究院更多承担了管理者的智能。

深鉴科技能够被创立,少不了电子系汪玉博士的功劳。汪玉本是清华大学长聘副教授,本着同在清华姚班的影响,汪玉也大抵希望自己的团队也能够走出优秀的创业企业,实现产学研的结合。1996年初中毕业的汪玉就以优异成绩考入“全国理科实验班”,进入了清华大学附属中学学习,此后就一直未离开清华。清华大学电子工程系是有名的高分、难考,而学霸们都是因为这个原因选择它,汪玉在电子系读到博士毕业,并未选择留美深造,最终选择留校成为一名助理教授,放弃了一直研究的集成电路设计转型“硬件加速”,汪玉也有在微软的实习经历,具备天然的创业条件,但汪老师最终还是选择教书育人,教育是更伟大的事业,具备长期效应而不仅仅是金钱的回报。后来汪玉老师创建了实验室,其中的学生就包括了姚颂,正是在这个时期,他们开始了对深度学习软件的深入研究。当然最后汪老师经不住姚颂劝说,最终还是走出校门和自己的学生们联合成立了深鉴科技,当然老师的身份还是保留了。

汪老师的想法显然更久远一些“我们希望所有带摄像头的地方,或者需要语音交互的地方,都有我们的产品存在。”这是一个巨大的市场,深鉴有别于同行,着力于打造基于DPU的端到端的深度学习硬件解决方案,除了承载在硬件模块(订制的PCB板)上的DPU的芯片架构外,还打造了针对该架构的DPU压缩编译工具链SDK,深鉴科技不会只做“一家卖芯片的公司”。

汪玉在接受媒体采访时曾说:“创新是一个企业的原动力。然而,在追求创新的过程中,时间成本与市场需求是万万不可忽视的关键因素,当一项技术的应用离现实太远、而市场回报又十分的不确定,只一味的追求企业‘自嗨’,那结果便可想而知了。”如今面对客户,汪老师就变成企业主,更加关于产品的迭代和用户的需求,而不限于学术研究的某项性能或者参数。汪玉很清楚自己的责任,也很享受当前的状态。他相信终有一天,深鉴科技可以改变人们的生活,而那时的他也将拿着深鉴科技所带来的利润反哺清华。

韩松是深鉴科技联合创始人

本科毕业于清华大学电子工程系、是斯坦福大学电子工程系博士,获得ICLR2016最佳论文、FPGA2017最佳论文,一直引领世界深度学习压缩与硬件加速研究。韩松博士提出的深度学习部署方案,跟传统的方案相比,可以使得推理更快、能耗更低。该项工作聚焦于使用 LSTM进行语音识别的场景,结合深度压缩(Deep Compression)、专用编译器以及 ESE 专用处理器架构,在中端的 FPGA 上即可取得比 Pascal Titan X GPU 高3倍的性能,并将功耗降低3.5倍。这正式韩松厉害的地方,也是深鉴的。

韩松认为创业是一个很自然的过程,在实验室做的研究成果到了成熟的地步,如果遇到合适的商业机会,一拍即合,一切就水到渠成了。然后就可以去和风投讲,风投一般会对校园里研究出来的黑科技很感兴趣,相比起门槛低一点的商业模式的创新,更加具有吸引力。

市面上关于CTO单羿的消息很少,这里就不加详述了。单羿1985年出生,2004年考入清华大学电子工程系,是汪玉老师的第一个博士生,先后任职百度深度学习研究院高级工程师、地平线机器人FPGA技术负责人。

基础数据分析

房叔话安防 之 深鉴科技姚颂要扛起深度学习的大旗 - 张新房 - 张新房的博客 - AI+安防

深鉴科技成立于2016年3月3日,员工约有70+人(初创企业,人数在不断增长中),先后融资5000万+美元,尚未透露收入和利润信息,专注于安防领域的深度学习,以深度学习芯片名扬天下。

深度学习的大旗

2016年6月在OpenPOWER峰会上,FPGA芯片领头企业Xilinx介绍了有关深度学习处理器的新方法,而其中有关技术的部分大多来自于深鉴科技。2017年2月,在顶级学术大会FPGA 2017会议上,深鉴科技又成为该届最佳论文奖的唯一获得者。姚颂也承认他们很幸运:“不得不说,我们真的很幸运,把刚刚崭露头角的‘深度学习’定为研究方向,在AI即将爆发之际创立的深鉴科技,如果早诞生三年,我们可能一直无法突破技术与产品之间那一层薄薄的窗户纸。同样,当我们每次取得重大突破的时候,都好像在不断触及心里那个‘深度’的极限。”

算法的实现高度依赖于高性能的计算能力,而图形处理器(GPU)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)扮演着重要的角色。GPU可以平行处理大量琐碎的信息,代表厂商是Nvidia;而FPGA凭借其可编程专用性、高性能、低功耗的特征,同样在深度学习应用中展现独特的优势,代表厂商为英特尔、赛灵思(Xilinx)。在中国提供基于FPGA解决方案的代表厂商就是深鉴科技。

ICLR(the International Conference on Learning Representations)大会是近年来在深度学习领域影响力飙升的行业会议,旨在讨论如何更好的学习有意义、有价值的数据,从而应用于视觉、音频和自然语言处理等领域。大会联合主席为深度学习领军人物Yoshua Bengio和Yann LeCun。在2016 年5月举办的ICLR大会上,有两篇论文获得了“2016年ICLR最佳论文”奖。一篇来自AlphaGo开发者谷歌DeepMind,另一篇则来自深鉴科技首席科学家韩松,他在论文中解释了如何利用“深度压缩”(Deep Compression)技术,将神经网络压缩数十倍而不影响准确度,从而降低计算复杂度和存储空间。可见深鉴科技在深度学习领域的影响力。

深鉴科技的英文名为DeePhi,而“DeePhi”源于“Deep Learning”与“Philosophy”,深鉴相信只有从根源理解和探索深度学习,从底层不断地创新,才能驱动更多的人工智能技术走向应用,可见深鉴科技的“姚老板”是要扛起深度学习这面大旗的。

技术之路

在探讨深鉴科技的技术之路前,先来了解英伟达。人工智能性技术革命甚至可以比肩第三次工业革命,被称之为第四次工业革命,而人工智能的本质之争正是芯片之争,谁能掌握AI芯片领域的主导权,谁就有可能领先世界,这波AI热潮成绩了英伟达。2008年那一年,英伟达内忧外患,大客户AMD收购了ATI,形成了CPU整合GPU的新Solution,因此AMD和英伟达由合作变为竞争关系,要命的是Intel也终止了和英伟达的合作,两个大客户的丢失,摆在英伟达面前的只有高端独立显卡一条路,屋漏偏逢连阴雨,高端显卡因质量问题遭到诸多质疑,股票暴跌、营收大减,由此进入4年的蛰伏期。事情的转机出现在2012年,英伟达将CPU芯片用于斯坦福大学深度学习项目上,开拓显卡用于图像计算以外的用途,终于释放了GPU芯片的大规模并行计算能力,成为人工智能发展的底层基础。之后的英伟达势不可挡,市值2年内暴涨了10倍并很快突破千亿美元市值,这都归功于GPU在AI领域的应用。有人甚至断言“没有GPU就没有英伟达,而没有英伟达,就没有现今这一波人工智能浪潮!”。不夸张的说,现今世界上所有涉足人工智能的公司几乎都在使用英伟达的GPU芯片。

接下来还需要阐述一个基本概念:FPGA(现场可编程门阵列,Field-Programmable Gate Array)。简而言之,这是一种程序驱动逻辑器件,就像一个微处理器,其控制程序存储在内存中,加电后,程序自动装载到芯片执行。FPGA作为专用集成电路领域中的一种半定制电路而出现的,既解决了全定制电路的不足,又克服了原有可编程逻辑器件门电路数有限的缺点。

FPGA的“可编程”指的是可以用户通过重新配置逻辑资源来不停尝试,通过编辑不同的配置文件把同一个FPGA进行不同属性的设置,直到获得最佳方案,非常灵活。而深度学习作为一门尚在发展中的技术,FPGA的这种灵活、可编程、允许试错的特性对它来说是非常友好的,这是第一点。除了灵活性外,第二点则是功耗,一块GPU的功耗多数超过100W,明显不适用与无人机、摄像机这样功耗敏感型硬件,而FPGA的功耗可以做到3W、4W。第三点则是延迟问题,虽然GPU的运行速度比FPGA快,但是GPU的高性能来自于它的并行处理能力,训练时效果很好,但在应用时一次性只能处理一张输入图像,优势不能完全发挥,造成延时。正是这三个特点,不少大公司开始逐渐注意到维护、采购、散热、内部损耗成本等问题,开始逐渐将FPGA引入自己的系统内,比如亚马逊和赛灵思合作,推出了基于FPGA的亚马逊云服务、百度大脑使用了基于FPGA版的AI专有芯片、腾讯云也发布FPGA云服务器等。

FPGA方案也有缺点,那就是开发难度。FPGA需要使用硬件描述语言(Verilog或VHDL)而不是计算机语言,程序员需要在FPGA公司提供的编译器基础上进行二次开发,开发难度大、开发周期长等问题,这也是很多公司不愿意使用它的原因。深鉴相当于给这些不愿意直接使用FPGA的厂商提供了一个带接口的黑盒子,厂商把自己的算法模型训练好之后,将模型与数据通过接口传入,由深鉴科技进行压缩和编译,生成的指令可以在FPGA上运行,厂商直接得到需要的输出结果。据此深鉴科技提出了“DPU”这一概念,DPU相当于把压缩、编译、执行的整个“黑盒子”过程具象化,最后的落地形态是一块板卡。

姚颂表示,现在很多公司在做各种各样的算法,是最快的切入方式,但落地受限于性能、功耗和成本因素。“深鉴科技的产品将以ASIC级别的功耗,来达到优于GPU的性能,可把它称作DPU,深鉴的产品将会基于FPGA平台。” 深鉴科技目前的开发板功耗在4瓦左右,能够做到比一个15至20瓦的GPU性能高出两倍。“相当于原来是先训练一个算法,然后再编译到CPU或GPU上运行,现在你也可以通过我们的编译器,把训练好的算法编译到DPU就可以直接运行了,在同样的开发周期内,获得相对于GPU一个数量级的能效提升。”姚颂说。

深鉴科技最早做研究时,这还是一个“冷门”的方向,国内学界也仅有中科院的陈云霁博士在做类似的研究。但时至今日,深度学习专属芯片已经成为一种逐渐被认可的方向。前百度IDL创始人余凯博士2015年创立了地平线机器人,国内中科院背景的寒武纪科技已经做出深度学习芯片,利用专有硬件实现深度学习及其相关应用,已是大势所趋。

现有的GPU采用“读—算—写 ”这样的处理流程,只适用于深度学习算法的训练,在应用层面性能低下且功耗很高。利用专有硬件实现深度学习及其相关应用,则能高性价比解决性能与功耗的问题。2016年1月,深鉴科技就已经设计出一套基于DPU的一整套深度学习硬件解决方案,包括DPU的芯片架构、DPU编译器、硬件模块(订制的PCB板)三部分。直接呈现的产品就是硬件模块,共有嵌入式端和服务器端两款。

产品功耗的降低和性能的提升主要依赖于算法上的创新和芯片结构的创新。深鉴首席科学家韩松一直在研究“深度压缩”技术,可以将神经网络压缩数十倍而不影响准确度,可以使用片上存储来存储深度学习算法模型,减少内存读取,从而大幅度减少功耗。这一研究也得到了学界的认可,已经被选为2016年ICLR两篇最佳论文之一。

在芯片结构上,深鉴重新设计了专门的DPU架构及编译器。用户可以正常通过GPU训练深度学习模型,并直接将模型编译到DPU指令集,指令直接下载到DPU上,使得深度学习算法的运行效率提高。另外还打造了针对该架构的DPU压缩编译工具链SDK,而工具链里面的软硬件协同优化则是深鉴科技的一大优势。

现阶段,深鉴科技正在打造云加端的深度学习应用生态,选择的应用领域都是大体量市场里具有提升空间的重要玩家。其中嵌入式端的产品将主要应用在无人机、安防监控、机器人、AR等领域,服务器端的产品将主要面向大型互联网公司的语音处理、图像处理等。

不过,由于DPU是专门针对于深度学习算法设计,其应用范围只能是深度学习算法,而不像CPU与GPU那样通用。因此,在一些应用场景中,需要以DPU为核心,辅之以非机器学习或者非深度学习的方式相结合来打造完整系统。

深鉴科技的未来技术之路将更加的崎岖。继续加大核心技术的研发和投入,重点加强在安防和数据中心行业的产品打造与市场推广,为安防领域和行业用户带来智能化的变革。另一方面,将深度学习图像和语音处理上的成果落地到更多的应用场景,为更多行业提供最前沿的、端到端式的人工智能解决方案,这是深鉴目前的选择。

融资+烧钱

深鉴科技天使轮之前,阿尔法狗还没有引起人们对人工智能的关注,姚颂团队专注技术研发,做出的成果更不知道以怎样的方式让社会上的人知道。姚颂坦言漫长的大半年内,深鉴科技在外界并没有太多的名声,那段时间融资极其不顺利。

2016年4月,姚颂先后约见了金沙江创投和高榕资本两家投资机构。出乎意料的是,一周内便拿到了这两家的天使轮融资。彼时的金沙江创投已经在人工智能领域盘旋多时,合伙人予彤认为,人工智能初期解决算法能力问题,建立通用的基础设施非常重要。更重要的原因天使轮最靠谱的就是熟人投资熟人,予彤同样出身于清华大学电子系,认识汪玉以及韩松,金沙江创投比其它一线基金有更多的机会和维度去深度感知深鉴科技的基础技术、企业氛围等。“中国有做这件事的团队,所以我们直接投了。”其后,2016年5月获得500万美元天使轮融资,投资方为金沙江创投和高榕资本。拿到融资后,姚颂安静下来,开始带领团队朝着既定的计划往前走。前文述及他们选择了两条路线:技术线、产品线,直到转型安防成功之后,路线才定下来。深鉴科技在技术和产品层面的同时推进,很快让其迎来接下来的两轮融资,2017年5月数千万A轮融和2017年10月A+轮约4000万美元融资。

A 轮融资投资方包括赛灵思(Xilinx)、联发科(MediaTek)、清华控股、方和资本,原有投资方金沙江创投、高榕资本跟投,具体金额不详。A+轮融资由蚂蚁金服与三星风投领投,招商局创投与华创资本跟投。其中A+轮资方之一华创资本的投资人公元对姚颂印象深刻,“他表现出来的为人处事的成熟、对商业思考的成熟以及对适应事物的反应速度,都远超同龄人。”金沙江创投的予彤也给了同样的评价。

值得一提的是,除了资本方和产业合作伙伴捧场,清华大学副校长,以及众多清华教授也都在融资现场站台。因为深鉴具有浓厚的“清华DNA”。创始团队中,姚颂、汪玉,韩松等,均为清华校友。

股东及出资信息

工商信息显示深鉴股东及出资信息如下表所示。姚颂是大股东,未被稀释前持股比例24.12%;汪玉是第二大股东,未被稀释前持股比19.60%;韩松持股10.34%。

房叔话安防 之 深鉴科技姚颂要扛起深度学习的大旗 - 张新房 - 张新房的博客 - AI+安防

产品和解决方案

房叔话安防 之 深鉴科技姚颂要扛起深度学习的大旗 - 张新房 - 张新房的博客 - AI+安防

在了解深鉴科技的产品线和解决方案之前,需要先了解深度学习。深度学习分为训练(Training)和应用(Inference)两部分,深鉴科技主要解决应用问题。简单来说就是企业将自己的深度学习算法模型训练好之后,由深鉴科技将其压缩20-50倍并编译,最终产品以板卡形式呈现。

深鉴科技基于的是FPGA平台:与擅长训练的GPU相比,FPGA功耗更小、整体性价比更高,更适合用于应用。但是由于FPGA的开发难度高、周期长,因此很多公司不愿使用。深鉴科技相当于给用户提供了一个黑盒子,企业只需要提供输入模型和数据,由深鉴科技提供应用层的FPGA解决方案。

2017年,深鉴科技着眼于智慧城市与智能数据中心两大市场,通过包括板卡模组、FPGA、编译器、深度压缩等在内的完整解决方案,让用户轻易地将人工智能能力植入到大大小小的产品中。

2017年,深鉴科技发布了六款产品。分别为视频结构化解决方案(DP-2100-O16)、人脸分析解决方案(DP-2100-F16)、人脸检测识别模组(DP-1200-F1)、深鉴Aristotle架构平台、深鉴深度学习开发SDK(DNNDK,Deep Neural Network Development Kit)以及深鉴语音识别加速方案(DP-S64)。其中前五款均为视频监控应用及相关解决方案。其中DNNDK是深鉴科技面向AI异构计算平台DPU(Deep-Learning Processor Unit,深度学习专用处理器)自主研发的国内首款原创深度学习开发SDK。深鉴CEO姚颂表示,DNNDK能极大降低DPU平台深度学习应用开发门槛和部署难度,并大大缩短算法部署到硬件的周期,提速AI产品研发过程。“DNNDK是国内首个深度学习开发套件,可以对标英伟达TensorRT。”

深鉴的产品和解决方案大体包括以下部分(不限于):

智能安防:智能IPC-深度学习加速模块、智能NVR/DVR-深度学习加速模块、视频结构化服务器-深度学习加速卡、人脸检测识别模组DP-1200-F01、硬件架构-亚里士多德ARISTOTLE架构平台、硬件架构-笛卡尔架构

智能大数据:语音分析-LSTM加速卡、图像分析-CNN加速卡

智能机器人:嵌入式端图像处理-深度学习加速模块

软件:深度学习开发SDK DNNDK

解决方案:人脸分析解决方案DP-2100-F16、人脸识别平台、SoC“听涛”芯片、“雨燕”深度学习处理平台、DP-S64语音识别加速方案、基于FPGA平台DPU产品开发板

深鉴战略

姚颂在一次接受采访的过程中曾经透露过公司的战略,着重解决AI中一些产品化的问题。首先是分析方面,研究与分析深度学习算法的计算与存储上的特征(Pattern)。其次是设计方面,利用这些深度学习算法的特征,设计针对于神经网络的压缩方法、设计DPU体系结构、并且设计对应指令集,使得DPU能够支持各类深度学习算法。第三是应用方面,打通从算法到硬件的全流程,用软硬件协同设计达到最好效果,并且开发好用的压缩编译工具,让所有人都能够方便的使用DPU产品。最后是协同优化与迭代,针对实际应用的算法模型,进行DPU体系结构的评估,发现算法中不适合加速部分,再对于算法与体系结构进行优化或调整,使得应用中全系统性能进一步提升。

姚颂还表示:“深鉴科技是一个深度学习解决方案的提供商,而非一家只是卖芯片的公司。” 这样的定位源于他对市场端的深度思考:“如果只是单独做一个芯片公司,风险非常高。因为周期比较长,资金消耗大,只有从一个单纯的芯片走到一个系统,再到一个解决方案,公司的前景才会更广阔一些。”

目前,深鉴定位为安防、数据中心等行业提供完整的人工智能硬件模组与配套软件。同时不断加强在安防领域、数据中心领域上的产品研发和市场销售。既然定位为平台提供商,深鉴提供DPU平台、编译器与压缩为一体的开发环境,供第三方在此基础上搭建自己的算法以及解决方案。

深鉴始终坚持一个观点认为带宽一定是一个最核心的问题需要解决。而传统堆带宽的方式一定会在造价和将来实际物理带宽层面遇到一些瓶颈,所以深鉴科技把软和硬结合在一起来做。先在软件上做压缩,然后在硬件上针对压缩的神经网络做一个专用体系结构的优化。目前在这条技术路线上的公司还非常之少,但陆续开始有公司注入跟进这个领域。而深鉴进入很早,拥有先发优势,而AI目前属于分散的细分市场,市场足够大使得每个方向的创业者都可能获得巨大的成功,随后可能会出现产业整合和合并,那是多年后的事情了。深鉴科技更像一个制作Drive PX2的英伟达,所有的产品都是针对于某个行业的方案,用户最终看到的是一个板卡,它支持的东西一样,只是性能和功耗不同,包含一些推理、设计和算法,用户还可以自行开发。

那么,深鉴未来会不会布局AI手机市场呢?A+轮投资三星领投已经给出了部分答案,作为数量级最大的芯片使用设备,手机似乎正在迎来越来越多的AI应用。姚颂认为,手机里做深度学习的应用肯定会特别特别多。至于如何布局,姚颂表达了自己的看法:“我觉得手机里面提供的计算力是有限的,真正要去做到很精细的对于场景的理解或者分析等等,还是需要更大的计算力。所以很多厂商经常会将一些事情传到云端,再做更细致的分析,而AI应用方面,以后云和端一定是配合的,不会完全限制在手机里。” 至于深鉴-听涛芯片有没有可能布局在手机端,姚颂表示有希望。他说,首发的听涛芯片功耗大概在1.1W,几T的数字芯片,这个芯片可以裁剪到适合更低功耗的场景,比如说物联网芯片的功耗通常是在100毫瓦以下,手机里面是100到500毫瓦,在安防里面我们希望它是1瓦。至于未来深鉴会不会为三星手机打造AI芯片,姚颂并没有给出答案。

已经在安防领域扛起人工智能深度学习大旗的姚颂,我们期盼深鉴可以走的更远,拭目以待。

更多的信息,请下载深鉴科技深度分析报告,文后下方附有下载链接,pdf格式文件,41页。https://zhang.xin.fang.blog.163.com/blog/static/390570201814101224831/


版权声明
本文由智客号作者上传并发布,智客号仅提供信息发布平台。文章仅代表作者个人观点,不代表千家智客立场。

相关推荐

评论文章

全部评论(0)

房叔话安防

房叔,真名张新房,人称“房叔”,17年视频监控和安防行业经验,目前专注于视频监控、人工智能、计算机视觉技术。

格式jpg品质60图片即可