定位大数据分析平台,Kyligence凭开源优势谋全球业务扩张

2018-02-12 10:37 爱分析ifenxi 阅读 2100

定位大数据分析平台,Kyligence凭开源优势谋全球业务扩张

调研 | 李喆 倪贤豪 

撰写 | 倪贤豪

基于开源软件推出企业级产品或服务是开源软件的典型盈利模式,于Kyligence亦是如此。

Kyligence是领先的大数据分析创新公司, 由Apache Kylin核心成员组建。Apache Kylin是世界领先的开源OLAP on Hadoop项目,是首个来自中国的Apache软件基金会顶级开源项目。

2017年是Kyligence成立的第二年,爱分析拜访了Kyligence联合创始人兼CEO韩卿,对这一年的得失做了复盘。

2017年Kyligence的发展可以从开源软件和企业级产品两方面阐述。

开源软件Apache Kylin方面,2017年的主要改进是:增加了对于雪花模型的支持,有利于减少冗余,节省存储空间;引入了Spark,相比于原来用MapReduce构建Cube,效率更高;除此之外,还增加了对于云存储框架的支持并修补了不少BUG。

至于Kyligence本身,2017年也取得了长足的进步。可以概括如下:丰富产品组合,打造行业案例,完善组织架构,明确战略方向。

完善产品体系,数据仓库的架构趋于完备

KAP(Kyligence Analytics Platform),是Kyligence的核心企业级产品。该产品基于OLAP构建数据仓库,以数据立方体的预计算来实现秒级查询。

定位大数据分析平台,Kyligence凭开源优势谋全球业务扩张

2017年,Kyligence团队围绕核心产品KAP做了产品体系完善。

截至2017年底,KAP已是十足的基于Hadoop的数据仓库,拥有了较为完整的数据仓库框架。具体来说,KAP的完善由两部分组成。

第一,Apache Kylin的改进带来的产品升级。

KAP是以Apache Kylin为核心的产品。Apache Kylin在2017年的这几次版本发布带来的新特性也同样赋予了KAP。这也是基于开源软件开发企业版本为盈利模式带来的优势之一。

第二,Kyligence针对KAP推出了很多企业级的功能,比如安全性管理等,并就企业客户的需求重点做了性能优化。

结合已研发的替代HBase用于Cube存储的KyStorage,KAP作为数据仓库的架构已经完备。作为数据仓库,这也是Kyligence给予其的定位。

除了KAP外,Kyligence在云端也做了投入,于2017年底推出了Kyligence Cloud及Kyligence Robot(KyBot)。前者基于KAP提供云上可扩展的企业级OLAP on Hadoop服务。后者则利用日志分析、数据统计及AI,对Apache Kylin及KAP系统问题做诊断、优化,并可集成于KAP使用。

定位大数据分析平台,Kyligence凭开源优势谋全球业务扩张

拥有整套数据仓库框架的KAP接入客户业务系统,通过ETL工具对数据做抽取、清洗、转换、载入、刷新等操作后,便能为客户提供快捷有效的服务,比如秒级查询、高级复杂筛选、数据可视化能力等等。

加上内置的KyBot、KyAnalyzer、KyStorage等模块以及云端版本Cloud,Kyligence针对不同行业的需求形成了整体解决方案。其中,在所布局的几大行业中均已形成了标准化的解决方案,如金融业的多维分析平台,通信业的用户行为分析平台,互联网电商领域的运营管理平台,以及针对手机厂商的日志分析平台。考虑到Kyligence不做定制化内容,后续在规模复制上会有一定优势。

目前,Kyligence的解决方案适用的应用场景众多,比如数据查询和分析,用户行为分析,数据可视化及日志数据分析等等。这主要还是数据仓库类产品比较常见的场景,但考虑到多维数据模型下,数据立方体预计算带来的秒级查询能力很强,在数据查询相关场景,Kyligence做的更为深入。

另外,Kyligence的目标市场主要还是数据仓库及BI市场,具体到客户层面,Kyligence目前更多地定位于大客户,致力于为客户的核心分析业务提供服务。

在数据仓库细分市场上,传统的领导者诸如Teradata、IBM等有着很强的竞争力和市场地位,KAP拥有完整的数仓架构后,将具备更强的挑战该市场众多先入玩家的能力。

在BI市场方面,虽然推出了自有敏捷BI工具KyAnalyzer,完善了数据仓库的应用层结构,但Kyligence的核心策略是与其他展现、可视化厂家深入合作,通过Kyligence认证体系(KCP),与Tableau, MicroStrategy,Cognos,PowerBI,SmartBI等进行对接,完成兼容性测试,因此未来可以预见Kyligecne与其他BI玩家将会有更多的市场合作形式。

优化组织架构,国内外市场齐齐发力

2017年Kyligence的另一个改变在于团队方面。

相较于年初的20多人,如今团队规模已扩大3倍,达到了60余人,研发人员占比达到了60%~70%,其余人员则以销售及相关行政人员为主。

当前,Kyligence的获客模式还是以直销和合作伙伴推荐为主,但渠道的建设在后续会加强力度。与销售环节相对的,Kyligence的收费方式是按年订阅,具体的报价基于节点数,客单价多在百万级以上。

组织架构上,过去的一年中Kyligence建立了专门的售后队伍,研发人员得以从繁重的运营维护任务中抽身出来,专注于产品和技术的研发。

至于战略的执行上,Kyligence在2017年贯彻了在金融、电信、制造及零售等领域的布局,坚持对于客群的定位,拿下了一批标杆客户。

此外,Apache Kylin作为中国第一个贡献到Apache软件基金会的顶级开源项目,在助力开源社区建设的同时,也享受到了社区的反哺。

除了直销获客外,不少客户是开源软件Kylin的用户转化而来。2017年,Apache Kylin用户由原先100多家增加到了500多家,其中不乏Adobe、百度、美团、链家、农业银行等中大型企业。

未来加大力度建设开源生态,注重开源用户到付费用户的转化,会给Kyligence带来不小的红利。

最后,在全球化上,Kyligence也取得了突破。2017年5月,Kyligence美国分公司正式成立,现在美国团队也已成立并开始跟进项目。Kyligence Cloud这款产品也对海外市场的开拓有所助力,对于尚未建立办公室的国家和地区,Kyligence可以通过Cloud为当地客户服务。

定位大数据分析平台,Kyligence凭开源优势谋全球业务扩张

近期,爱分析对Kyligence联合创始人兼CEO韩卿做了访谈,现将部分内容分享如下。

云端产品推出,Kyligence初探海外市场

爱分析:KAP是一款OLAP on Hadoop产品,针对HBase推出了KyStorage这一替代功能,过去的一年有无新的进展?

韩卿:KyStorage的主体工作已于2016年完成,2017年更多的是原有基础上的优化。

2017年更多的还是针对KAP的新功能的引入,包括BI的整合,以及对于聚合查询的支持等。

可以说,在用户角度来看,KAP已经是一个数据仓库了,不再依赖HBase,只是将数据存储在HDFS上,是一个纯粹的Hadoop上的数据仓库。

爱分析:对于已经使用很多Hadoop集群的金融企业来说,使用KAP会否面临兼容性的问题?

韩卿:不会。对于已经使用Hadoop的企业,只需将KAP安装即可,并不会出现兼容性问题。

爱分析:Kyligence现在主要能解决客户的哪些需求?

韩卿:第一,Kyligence为用户提供了将部署在旧有OLAP系统上的应用迁移出来的很好选择。

旧有OLAP系统已经很难支撑今天大数据的场景,客户急需将应用迁移到大数据平台上,而Kyligence是很好的选择。

第二,Kyligence能简化用户自旧有系统迁移应用的复杂程度。用户从旧有系统迁移到KAP上,不需要写任何程序,绝大多数操作都只是配置、安装、调优。

爱分析:客户从旧有平台迁移到KAP,会遇到哪些挑战?

韩卿:对客户来说,面临的挑战是在旧有平台上的应用版本比较陈旧,需要做必要的升级。

对Kyligence来说,旧有平台和KAP之间不可能完全兼容,我们需要解决兼容性的问题,确保迁移过来的应用良好运行。

爱分析:Apache Kylin在2017年发布了几个新版本,主要有哪几方面的更新?

韩卿:2017年4月30日推出的v2.0是Kylin诞生以来的最重要更新之一,引入了Spark Cubing以及云存储框架的支持、增加了雪花模型的支持等等。8月中旬的v2.1主要是修复了超过100个Bug以及扩大数据输入源和SQL的支持。11月初的v2.2则是在稳定性和安全性上的改进。

爱分析:KAP的应用场景都有哪些?

韩卿:应用场景可以分为几大类:

一、业务部门的实时数据查询和分析。比如金融业的持卡用户行为分析,管理会计领域的财务指标分析,电商领域的运营数据多维分析等。

二、业务数据可视化。KAP提供内置的敏捷BI工具KyAnalyzer,并支持主流的BI工具接入,实现数据可视化。

三、手机日志数据分析。比如手机厂商对海量日志数据的分析。

四、运营管理平台。KAP具备的秒级查询能力,丰富的RestAPI接口,以及对现有Hadoop集群的良好兼容,能很好的胜任运营管理平台的功能要求。

爱分析:前端展现上,KAP与主流BI工具的兼容性如何?

韩卿:兼容性很不错。在过去的一年,我们投入很大的精力去拓展与主流BI的连通性。

为此,我们推出了面向合作伙伴厂商的产品认证体系,适用场景不仅包括KAP与BI厂商的对接,还包括KAP与Hadoop及云计算平台的对接等。

此外,我们还推出了新版本的ODBC(Open Database Connectivity,开放数据互联)驱动,提供了一组对数据库访问的标准API,提高了对Tableau等主流BI的支持。

爱分析:KAP的产品定位是什么?

韩卿:KAP现在的定位就是数据仓库。从抽取数据,到后续的数据分析、查询,包括前端展现,不管是通过内置BI工具还是接入主流BI厂商的工具,可以说已经是一个全站的数据仓库。

与市面上其他做数据仓库产品的友商相比,KAP的定位可进一步细化到Data Mart(数据集市)方向。对于一个企业的决策层来说,并不需要整个Data Lake的数据来辅助决策,更多地只需要与决策相关的数据即可。这部分数据对Data Lake的占比可能也就在20%-30%。Kyligence重视的也正是把这部分与决策相关的数据做深。

爱分析:Kyligence Cloud产品的客群定位是?

韩卿:Cloud主要关注业务急速扩张的中大型企业。这类企业的特点在于绝大多数资源都投注在了业务上,对于大数据分析平台的建设力度往往不足。对此,Kyligence Cloud能很好地予以帮助。

此外,我们还通过Cloud去探索海外市场。国外在云的成熟度和普及度上比国内高,对于还未能建立海外办公室的地区,以Cloud产品能更方便快捷地给以客户服务。

爱分析:Kyligence Robot产品能满足客户什么需求?

韩卿:这款产品的定位是在线的诊断和优化平台,目前面向Apache Kylin用户、KAP企业版(含高级企业版)客户及Kyligence Cloud客户。

在2018年,我们会投入更多的资源在上面,在服务好上述客户的同时,也让开源用户受益。

爱分析:Kyligence开拓海外市场是出于什么考虑?

韩卿:一方面是因为Kylin是开源技术,有很多开源社区过来的海外客户。另一方面就是出于Kyligence全球化战略的考量,通过产品出海,我们能获得更好的发展。

新人不断冒头,国内数仓领域还在蓬勃发展期

爱分析:近年来,国内做大数据基础软件的公司越来越多,对此您怎么看?

韩卿:首先,中国在过去的20年时间里,培养了一个巨大的开发者群体,素质素养很高。

其次,过去10年里,国内互联网发展迅速,包括移动应用等的发展,积累了海量的数据,随之而来的技术挑战是史无前例的。当国内的相关从业者具备解决这类问题的能力时,那么在全球范围内也就具备了优势。

最后,开源技术和开源社区的发展带来了很大的冲击,国内从业者可以通过开源让全球社区对其实力有所认知,也在其中获得了很大的受益。

以上两方面促成了这一现象。

爱分析:对于数据分析、数据仓库这类底层技术的需求,您认为还有哪些行业存在很大需求?

韩卿:制造业对此的需求相当旺盛。

中国是制造大国,同时制造业的产业升级也面临着很大的挑战,可以看到这些年制造业出现了急剧变化。现阶段制造业的转型是离不开数据和数据分析的。这其中蕴藏着极大的需求。

爱分析:数据分析和数据仓库在制造业有哪些应用场景?

韩卿:一方面是精细化管理。不管是通过互联网还是物联网,收集上来的数据通过数据仓库、数据分析完成查询、分析等工作,为企业决策提供帮助,把企业管理做深做细。

另一方面就是智能制造和下游的工业物联网。对于制造企业而言,如何通过自动化技术,提升整体实力,进而达成智能制造。数据分析和数据仓库能在其中起到很大的作用。

定位头部客户,标准化产品有利于规模复制

爱分析:目前合作的各行业客户,大多处于什么规模?

韩卿:在目前开展的业务中,更偏向和各行业的头部客户开展合作,比如行业里的TOP 10,TOP 100。

爱分析:目前的团队规模如何?人员结构与2017年初有何变化?

韩卿:团队人数从去年的20多人多人增加到了60多人。人员结构和去年差不多,研发的占比在60%~70%,剩下的是销售和市场人员。

爱分析:销售模式以直销还是渠道为主?

韩卿:还是以直销为主,同时也在做渠道,新一年会在渠道上做更大投入。

爱分析:收费方式是怎样的?

韩卿:Kyligence采取的是按年订阅的方式,根据节点数报价。这也是目前唯一的收费方式。

爱分析:有无做定制化内容?

韩卿:没有。目前Kyligence不提供内容定制,目前所有客户使用的都是同一个发行版。

爱分析:Kyligence的目标市场是?

韩卿:企业级数据仓库和BI的市场都是我们的目标市场,比如Teradata、IBM等厂商在数据仓库和数据分析上的市场等。