深度学习与容器结合,才云Caicloud帮助企业快速落地AI应用

调研 | 李喆 张宏祥撰写 | 张宏祥2015年10月成立的才云,是国内容器行业入局较晚的创业公司,但其创始团队出身Google,拥有每周运行20亿容器的原生Google经验。聚焦数据分析和AI领域的才云,发展迅速,已成为业内不可忽视的力

彩云图一.jpg

调研 | 李喆 张宏祥

撰写 | 张宏祥

2015年10月成立的才云,是国内容器行业入局较晚的创业公司,但其创始团队出身Google,拥有每周运行20亿容器的原生Google经验。

聚焦数据分析和AI领域的才云,发展迅速,已成为业内不可忽视的力量。

彩云图二.jpg

容器云管理平台Caicloud Compass,打造云端操作系统中台

Caicloud Compass是才云深度整合Kubernetes的容器云管理平台。目前开源容器技术更多支持无状态应用,对企业核心系统上大量的有状态应用支持得并不是很好。才云Compass不仅可以承载无状态的云原生应用,还打通了有状态应用,尤其是大数据类应用,从而实现了对企业核心系统的统一管理。

打通有状态应用,不只是让该应用在容器平台上运行,更是要对应用运行的全生命周期进行管理。

以AI任务为例,才云Compass除了支持TensorFlow在容器平台上的运行,还实现了从数据获取、特征工程转换、模型分布式训练、模型验证、模型灰度发布、GPU资源监控管理等整套流程的打通,提供面向数据分析应用的DevOps、CI/CD解决方案,并实现与其他应用的资源隔离。

这些都不是原生容器和Kubernetes技术所支持的,需要进行大量技术创新。

打通企业业务和数据,实现对企业核心系统的统一管理,才云希望将Caicloud Compass打造成企业的云端操作系统中台,提高企业的资源利用率和运营效率。

人工智能云平台Caicloud Clever,助力企业挖掘数据价值

目前,数字化转型已经成为潮流,才云希望利用好企业的大规模计算能力,分析挖掘出海量企业数据中的深层价值,真正帮助企业降本增效,实现业务创新。

因此,才云推出了人工智能云平台Caicloud Clever,一个服务于算法科学家,专注于深度学习开发流程优化的数据科学平台。

在Caicloud Compass的支持下,Caicloud Clever集数据导入、数据处理、模型开发、模型训练、模型评估、服务上线等功能于一体,提供一站式全方位的深度学习建模流程,算法科学家无需再关注底层资源,即可快速打造智能业务,从而降低了企业的AI使用门槛。

由于才云创始团队出身Google,才云最大优势在于大规模复杂场景和数据分析业务的管理。因此,才云瞄准服务器规模和业务流量较大的头部或腰部企业,目前重点服务金融、制造、电商、新零售等行业,已拥有数十家客户,标杆客户包括中国银联、唯品会、海尔集团、锦江国际等,平均客单价数百万元。

近日,爱分析对才云创始人兼CEO张鑫进行了访谈,他对才云的发展情况、未来战略,以及行业未来发展趋势等方面,进行了详细阐述,现分享部分内容如下。

深度学习与容器结合,才云Caicloud帮助企业快速落地AI应用

彩云图三.jpg

重视产品化水平,减少定制化工作

爱分析:才云还提供AI模型服务,这块是否会涉及到企业的业务流程,需要投入较重的人力?

张鑫:才云不是一家算法外包公司,AI模型服务是向客户传递才云平台价值的一种手段;同时才云聚焦于视觉相关的可标准化AI模型产品,与平台一起联动形成一站式行业解决方案。

目前大量AI公司做的工作,也多是把学术论文中的公开算法进行复现,就取得了很好的效果;随着TensorFlow这类优秀框架的开源,算法门槛也进一步降低;Google的广告业务背后有大量数据分析,但核心算法其实是最经典的逻辑回归。

因此,算法并不是企业业务真正的核心,有很多好用的通用算法,企业真正缺乏的是提供AI工具和算力的平台。

才云提供AI模型服务时,非常有选择性,只是去做一些已经有过积累,或是基于开源工具能够快速创建出来的模型,并不会深钻到用户业务中,建立完整模型。

爱分析:如果客户有复杂的AI模型需求,会与其他AI公司进行合作吗?

张鑫:是的。才云自身拥有一个小而精的AI模型服务团队,基于擅长的领域进行建模,此外,建立了一些合作伙伴关系,合作伙伴可以基于才云的平台去提供终端解决方案。

爱分析:AI市场还处于早期,才云主要瞄准哪些客户群体?

张鑫:第一,已有GPU资源的企业。它们可能有容器可以解决CPU等资源的调度,但如何管理GPU,如何同CPU进行混合调度是一个痛点。这类企业会更注重容器云平台本身的价值,而不是AI的业务模型。

第二,TensorFlow的用户。过去两年TensorFlow迅速落地,做机器学习的企业,大概率都用过TensorFlow,它们对TensorFlow的API、基于TensorFlow的建模方法已经很熟悉了,痛点是TensorFlow的分布式部署、在GPU上进行自动调度、打通DevOps等。这类客户对上层AI解决方案的要求也不高。

爱分析:才云会帮助客户做传统业务上云的改造吗?

张鑫:这个同样不是才云的主营业务。改造的过程更多是人力服务,而且要深入企业业务系统,做很多定制化的东西。

才云为了帮助企业传统业务上云,会提供一些工具、平台层面的接口及支持,传统应用的一些常用的点,才云也会将其抽象出来,沉淀到产品里。传统应用与才云的平台进行对接时,才云希望能与企业的技术团队一起来做。才云除了销售产品,还会将知识传递和赋能给企业的技术团队,实现双赢。

才云对很多企业甚至会开放产品源代码,给予企业自主可控的权利和选项,而且通过开放的API,企业可以自己完成很多定制开发的工作。

爱分析:开放源代码是否会对公司业务造成隐患?

张鑫:第一个隐患是企业拿到源代码后,就不需要才云了。但目前还没有发生过这种情况,对技术人员来说,完全读取别人的源代码,可能比自己写还复杂。

第二个隐患是代码泄露问题。首先,才云会从法律层面保护自己。其次,才云产品的迭代速度非常快,即使旧的代码被泄露,才云也有信心竞争过对方。最后,一家公司的核心竞争力和壁垒在于它的知识,即使面对同样的代码,如何使用、如何产生最佳实践,大家的能力也是不一样的。

综合考虑下来,才云认为开放源代码利大于弊。

爱分析:才云目前的团队规模与结构?

张鑫:全职员工超过100人,70%是研发人员,包括个位数的算法团队,才云非常注重产品化和效率,交付团队的人均产出比在赛道内同比处于较高水平。

订阅模式将逐渐普及

爱分析:未来传统企业会像互联网公司一样,逐步把容器部署到裸机上吗?

张鑫:我认为会。举两个例子:

第一,才云的第一个客户是锦江国际,刚开始使用才云的中台时,只是部署锦江旅游的一个创新业务,但现在已经在才云平台上部署了95%的业务,而且准备把底层的虚拟化去掉。

第二,银联作为才云的客户,其云闪付平台使用的是裸机加上容器,放弃了原先使用的IaaS。

企业在使用容器时,不愿意放弃下面的IaaS,主要是考虑到存储和网络问题,以及容器不适合有状态应用。Kubernetes的存储接口非常灵活,已经可以直接对接多种存储。在对网络的策略支持上,Kubernetes的确非常简陋,但才云做了很多工作,平台已经可以做到对网络资源的限流和把控。对于有状态应用,才云的平台也已经可以做到统一管理。

爱分析:才云在AI业务这块,未来是否会有新的收费模式?

张鑫:以才云的客户唯品会为例,唯品会在全球八个国家有电商业务,底层使用了微软Azure公有云基础设施。才云与Azure合作,为唯品会提供上层数据分析业务的管理,唯品会按照订阅模式付费。

我认为在AI平台业务上,订阅模式的使用会越来越多。GPU是一种昂贵的资源,需要几个月漫长采购周期,训练完模型后,可能还会出现资源闲置的现象,因此,采购GPU对多数企业并不划算。随着产品和市场的成熟,企业会更希望有一个弹性的付费方式,基于云端的订阅模式会越来越普遍。

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论