智能家居

【论坛演讲】刘飞——视频云平台的建设及阿里云的优势

14年05月17日     千家安防网

[导读]大家都比较关注大数据,大数据无外乎两点,一点就是数据的采集,一个是数据的分析。当上千万、上亿的数据进来能不能把数据实时采集下来、存储下来?能不能在很短的时间内把数据分析完?

        2014年5月15日,由千家品牌传媒主办,千家安防网承办的“2014年安防行业发展新趋势论坛”在杭州恒生科技园成功举办。本次活动主题为:物联网与移动互联网时代下的安防行业新趋势,重点关注物联网、云计算与大数据。海康威视、宇视科技、大华股份、阿里云、悠络客等行业知名企业高层与近200名行业人士共同探讨移动互联网环境下,安防行业发展的新趋势。

        以下是阿里云资深架构师刘飞在现场演讲的精彩实录:

        主讲人:阿里云资深架构师刘飞

        主题:视频云平台的建设及阿里云的优势

               

        刘飞:大家下午好,今天跟大家讲一下阿里云在做的事情,把我们今天做的、想做的事情跟大家分享。讲到云计算就必须讲到大数据,大家不知道为什么做云计算,是因为互联网的特性决定了必须做云计算,因为有了互联网之后我们所有之前的行为都被记录下来了。举个例子,以前获取信息的时候可能会看报纸,但是看报纸具体看了哪些条目,其实没有人知道,包括自己,看完之后就忘了。但有了互联网之后这一切就改变了,对什么感兴趣,上了什么网站,这所有的数据都被记录下来。因为互联网集聚了这么多的数据,才必须用云计算的平台来解决它根本的问题。今天物联网已经逐步发展起来了,我们也有了更成熟的包括3G、4G,包括遍布全城市的无线网,采集设定的数据也更加的容易。阿里云不是说因为想做阿里云而做阿里云,是因为淘宝、天猫扛不住了我们才做阿里云。在07年的时候,我们用W的数据库,经常服务中断,打电话找W公司,他们要传到美国可能需要两个星期,然后再告诉你这个规划可能还要一个月,我们等不起也伤不起,所以我们决定自己来做。也因为软件的教训,现在阿里巴巴内部有一个不成文的规定,对于服务端的软件,如果哪个部门还用商务软件的话,那一定是这个部门的耻辱。我们所有的东西都自己做,包括用的数据库等。正是因为有了自己业务的需求,做了很多的平台,然后慢慢的把这些平台融会贯通,把自己曾经走过的路分享给大家,我们就做这么一件事情。

        接下来分享互联网的情况,大家知道12306这个网站,它看似简单,但对商业模式却产生了很大的变革。在12306之前大家买票肯定是跑到窗口排队,会有专门的服务人员卖票,全国有十几亿人,有这么多人买车票能有多少人提供服务。所以这就会成为很大的瓶颈,我们做了这样一个事情,与其让他们来服务我们,不如我们自己服务自己。这就是互联网的思想,就是自己通过网络买票或者干别的事情,就是把自己从买票的变成了卖票的。但同时带来对系统的压力有多大大家也知道,包括淘宝、天猫、12306。如何面对互联网突然之间海量并发的访问,如何来支撑这样一种业务模式,实际上云计算就是一种非常好的工具。

        有一个故事,大家都知道药监局的一个平台,药监局大概在08年的时候,有药检系统多个,一个系统管的是药品生产、药品出厂,弄完之后在销售的时候又进入到了另外一个系统里,然后销售的时候又到另外一个,这个药品从出库进入到经销商卖出去,进入哪些环节,其实他们也不清楚,他们要分很大的力气才知道这个药品搞出去了。当他们自己想把所有的信息统一起来,他们就可以把系统打通,打通之后他们内部的成员可以很高效的查到药品什么时候生产,卖到什么地方,这样的话可以很快很及时的查到这个药品的去处,但这个时候还只限于工作人员能用。但是今天如果说我想看我的药品到底是真药假药,怎么卖下来的时候,系统也会满足这个需求。就有药检平台牵上阿里云这么一个事情。它原来做关键业务的查询大概需要60分钟,在今天我们的OTS大概100多个结点,成本非常低,然后它的关键业务查询只要2.7秒,如果我们发现有假药的事情出现,可以非常迅速的反映过来,并且查到事情的真伪。这就是我们帮助中国药监局做的事情。

        大家不知道有没有想到过,现在的移动、APP中端本身就是一个采集点。不管是高德地图还是百度地图,当你装完以后其实你的所有行为轨迹都已经获取了,通过你移动的速度,通过人群的分布点我们会核算出这条干线上交通堵不堵。百度上有一个热力图,它就是根据人群在一个地域里的分布,通过一些算法模型最后算出哪些区域人多人少。这样看来其实采集点特别多,而且成本特别便宜,所以这个应用的效率和精度远远高于传统专业设备来做的事情。这就是移动互联网加大数据的强大之处。

        再讲一下云计算对于业务的创新。像支付宝,有那么多卖家跟买家在上面做了那么多事情,买卖东西;有多少存款;好评、差评多少,这些信息是非常珍贵的,我们以前没有用,不是不想用,是没有能力来用。后来有了平台之后,我们可以在每天晚上的时候,把所有的人全部算一遍,算他的信用额度。比如商家是一个卖家,我们算出他的存款、交易行为,算出他的信用额度是50万,突然有一天他比较缺钱,想贷个40万,那他只要在上面点一个按纽,所有都是自动的,不需要担保,不需要盖章,不需要找人托关系,大概几秒钟就可以完成。这个项目的提升是百倍、千倍的,但坏账率它可以做到小于0.3%,而银行的坏账率应该是在3%左右,我们的坏账率远远小于银行的,这是很大的应用场景。讲另外一点,大家在网上有很多的行为,看了这么网页,搜索了什么东西,买了什么,我们根据网页内容的关键字就可以推定出这个人对什么感兴趣,包括他的职业、性别、年龄、收入等等,通过这些数据的分析,然后拥有这样的数据之后,再做一些有针对性的推送之类。互联网的信息量大,当你进来想买东西的时候要去找,其实最好的是不用找,我知道你想要什么,我推荐给你。比如说一个人他总是在网上搜汽车配件,而且他又买了汽车配件,而且我大概知道他老搜的是什么车的配件,我们就可以根据他的行为清楚的知道他想要什么,这是数据分析发展的一个方向。其实数据分析有两块,一个是宏观层面的,一个是微观层面的。

        我们也接触了很多物联网的项目,他们也都是迁到云上来,在国外是放在亚马逊上,今天是放在阿里云上,其实也很简单,飞利浦的CITYTOUCH就是把所有整个城市的路灯通过CPIS连上网络,然后定期报出信息到控制中心,控制中心也建在云上,然后通过指令来进行路灯的开关、控制、报修等操作。

        阿里云的事情中我们只是做平台,平台搭起来之后会拉厂商一起来构建互联网的城市。这个平台上我们攒了包括人口信息、电力信息、交通信息、餐饮信息、交易信息等很多的数据。按照以前的说法,每个行业是个烟囱,相互之间的数据很难共享,但其实把数据打通之后,很多事情就可以做的更好,更漂亮。举个例子,比如我们发现一个店铺他在税务局的营业额10万,另外一个店铺可能是100万,但是从另外的数据发现,10万的店铺他进油的时候交换成本是1万,而100万的店铺进油成本只花了5000,那么可以通过数据分析进行报警,告诉工商说这家店铺有嫌疑。因为他可能没有从正规渠道进油,这个信息发到工商局的时候工商局就可以开始检查。现在大家所有的钱都是要转帐的,但是现金的支付是没有任何记录的,将来有没有可能我们在每次支付的时候,把这个信息记录到网站中,所有的电子支付、现金支付都是透明的,那这个时候行贿、受贿没有地方可以去。这是我们梦想做的事情,阻力很大,但我们可以往这里推。我们搭云平台,跟政府一起尽可能把这些数据采集起来,然后从更大层面做这个事情。

        我们为什么要做云计算,其实以前也有人问云计算到底在什么地方?是不是真的很先进?其实说实话云计算的架构技术还是M,就是你能不能做到X,可以管理5000台机器,能不能做到X管理10000台机器,有很多细节的工程上的东西需要去做的,传统的IT有很大的问题。云计算要解决的根本问题就是当我不想要资源的时候,我就不要资源,当我想要资源的时候,能迅速调集很大的资源。但如果你是自己找了几十台机器,其实本质上没有任何改变。比如说接入到里面之后,我们会把方圆100公里的机器划成一个R,把机房的机器像一个机房可以建立R,当用户想要资源的时候,我可以在大的R里面调出资源让他使用。当你有很大需求量的时候,马上就会有交易资源出来,当然也可以释放出来。所有的计算都是你用多少算多少,所以传统的IT面临比较大的问题。以前很多IT系统每个部门之间,很多信息是绝密的,相互之间打通面临着很多障碍,但其实把这个放在云计算上的时候,所有权限的管理控制是非常容易的,其实只要通过管理员、网管就可以完成这样的操作。

        回到阿里云本身,讲讲我们自己做了些什么。其实有很多公司在做云计算,云计算是一个很复杂、很庞大的工程。比如说你研发了一个A,写完了一个代码,那它就会跑起来,它叫可运行状态。但是要真正让云计算可运维,要开发许多的工具,今天整个阿里集团只有大概1000个运维工程师,那之前他们可能运维的是几万台的机器,现在运维的是几十万台,将来可能运维上百万台。这些人要在足不出户的情况下管理上百万的机器,当一个机器发生任何一个问题的时候,他们就会出现解决这个问题。如果做不到这个就不要作云计算。不能把用户的数据丢掉,不能让用户的数据泄露出来,这是最关键的事情。有了这个可靠性、安全性之后才会谈大数据。如果这两点不能得到保障的话,谈大数据是没有意义的。

        在可运维之后是处于可服务状态。在有了一套很强的管理体系,建立在高科技发展情况下,保证非常高的可靠性。在intnet开放的时候,保证受到任何攻歼的情况下能保证用户的安全,做到这些的情况下,对客户进行可服务。所以在阿里云上的安全享受的是跟淘宝、天猫一样的安全。有这么多用户跑到云上面之后,怎么来对用户进行计量、计费,客户关系环境,包括提供服务支持,这是一个很庞大的体系,需要层层建立。因为阿里云只做平台,所以要在现在的环境中建立一个生态的系统,我们希望有更多的第三方公司把淘宝、支付宝很多很好的一些第二方的产品都开放出来。

        简单讲一下阿里云很核心的产品“飞天”,这个产品大概是在09年的时候,由银行代码写出来的。最核心的是分布系稳定系统、调度。飞天集群的概念,是我们底下的数据中心,在物理机房里面我们采用的所有的S,所有单机上的操作系统运用的都是阿里的技术。实际上我们拉了一个版本下来,然后进行加强、优化形成一个版本装在上面。飞天其实就把一些集群整合了一台机器。在集群内部跟R是不同的概念,从操作系统层面看不太一样,比如说磁盘它就是一个大硬盘,对于任务的提交,用户的感知我们会自动的完成图片分到结点上。但是对于R的概念,使用户知道他这台机器分布在哪里,但是对外不是统一的,这是两个不同的概念。还有一个就是监控,系统的监控跟我们分析是合在一起的。这个系统其实非常复杂,它不像传统的监控,只是把数据采集上来,大致知道怎么回事。我们怎么知道交换器出故障,网络、网卡出故障,其实我们有这样的监控系统,我们会通过一些例子来训练我们的机器,训练我们的模型。模型训练出来之后当故障报警的时候,通过把数据灌到模型里去就可以知道大概发生什么样的问题。这个系统是很复杂的,它本身也有很强的安全管理。

        基于飞天的话我们提供了很多的服务,包括弹性计算、云服务器。存储和数据库有存储服务、结构化等等。大规模计算的话有ODPS,然后还会提供算法平台,算法的分析。安全与管理会有云端以及监控这样的产品。其中要说的是阿里云只是开发出来很小的产品,后面会源源不断的开放更多的产品。我们还会持续的往下走,做云计算已经是一个投入巨大,也是比较执着、坚韧的事情,如果不这样做的话可能做产品就做死了。其实之前也有很多云计算公司,包括百度、腾讯也做云计算。但是阿里坚持的一个哲理就是在这次IT的浪潮中各自打好让大家上来享受更专业、更安全的基础设施。不需要再去买任何硬件、找任何机房、买那么多防火墙,配那么多安全配置,什么都不用管,专注于把自己的业务做好就可以了。因为在做平台这块我相信我们是非常好的,我们做我们擅长的事情,然后我们的客户做他们擅长的事情,我们其实想把这个市场的系统搭起来,让大家一起来用。

        云服务器可能是占用最多的一款产品,其实产品很简单,跟区域性很像。但它本身有很多的特性,比如支持自定义快照、自定义NMAGE、故障切换、在线迁移、网络组隔离、防APP欺骗、自定义防火墙功能、支持防DDos攻击、动态升级、分布式文件存储等等。我们开放存储,视频行业跟我们存储是比较相关的。一些客户希望把他的视频接入到阿里云上来。阿里云本身的话有很多的应用,在视频接入的时候经常采用接近原则,比如说你是北京的业务那就接到北京的R里面。然后接下来就是说每个摄象头可能有一个M或者八个M,这个没有关系,就是用户通过他的宽带接入到网络等等。

        如果在一个城市里可能通过局域网进来,整个开放存储他的上行流量其实是不收费的,所以成本比较低。进来之后我们这边有一个集群,分三层。每一个集群可以做到5000台机器,大概是40个PD。就是只要有这么大的用户需求量,我们就会发布集群上面,我们会预估用户量来做更多的集群支持。对于一些写入存储量还有一些其他什么的都不是问题。每一个请求我们都从集群挑一个东西给他。我们采取附带方式,把附带最前的拎出来给新的用户服务。当业务量上升之后,我们现在集群支持不住的时候,我们就考虑别的策略。所以知道有没有地区性的业务可以做到对系统的抵御。还有用户整个系统的接入是直接接到我们这边还是接到一个中间环节,通过中间环节接到我们这边来。这是有一些差异的可以考虑一下。对于直接接入到我们这里来要一个代码,从摄象头那边直接发出APP的请求。通过这种统计写应用程序然后再转到开放存储里面,这跟开放程序相关。

        监控的话,我们会对用户的云服务器的协议和端口进行监控,并且可以进行相应的报警。然后对云服务器里面的网络等监控提供相应的信息。

        安全的话,云计算里面其实安全是一个很重要的话题。假如用户有数据丢了,对用户来说是非常大的损失。所以我们所有的数据都是有备份的,除此之外在安全上面的防范措施管控非常严格,只有我们的人能够进去。而且进去也是24小时监控,很多地方是两把钥匙两个人同开才能进去,这个层面就是防止任何人出问题。对于机房来说也有很高的要求,比如抗震的级别、层高、包括电源、消防,这些都是对我们自己的要求。在网络层面,网络保护控制,对于云计算产品本身会有很多的安全加固,比如端口安全检测、应用层的防火墙等等。我们也担心如果我们本身不过关,那导致损失的是非常大的。

        因为视频行业大家都比较关注大数据,大数据无外乎两点,一点就是数据的采集,一个是数据的分析。当上千万、上亿的数据进来能不能把数据实时采集下来、存储下来?能不能在很短的时间内把数据分析完?我们自己的数据平台的话,数据采集可以跟我们的OTS,就可以把数据实时的存下来,然后离线计算,放在OTS进行分析。除了离线计算,把任务切成一片一片力度,然后通过排流水的方式每次进去一片数据完成一小片任务,完成之后再排流水往后走,这样就建立了一个准实时的计算。这样用户只要关注自己的领域、模型、菜单检测等等。

        最后云计算对比传统模式有哪些优势:

        一、大规模;

        二、低成本,因为有了大规模才会有低成本;

        三、高安全,做云计算的人一定是非常专业的安全团队、运维团队,开放团队来搭建保卫这个平台。不管是从基础技术设置的检测,包括安保、管控,都是非常专业的。

        四、服务的可运营;

        五、生态系统的搭建其实是云计算的核心,云计算是一个数据分享平台,只有把数据放到上面来,才能做很多的事情;

        六、数据与服务的统一。

        这就是我今天所讲的,谢谢大家。

声明:凡注明为其它来源的信息均转自其它平台,目的在于传递更多信息,并不代表本站观点及立场。若有侵权或异议请联系我们。

千家智客微信公众号

扫描下方二维码,关注千家智客微信公众号(qianjiacom),随时随地知晓智能行业天下事!

编辑:钟丽

相关推荐

100/100字符

全部评论(0)