【深度】人工智能的最核心——场景为王

评估一个人工智能公司,最重要是看其有没有好的场景。有了好的场景,从而可以有数据积累,这才是人工智能公司技术不断提升的根本和价值。而所谓的算法,不是人工智能公司的竞争门槛,其领先程度不会超过6个月。

作者:海通证券 郑宏达

算法和计算力瓶颈已突破,数据为关键

1.1  场景化数据的获得,是当下人工智能发展之关键

1956年,美国达特茅斯大学会议标志着人工智能研究的正式诞生,推动了了全球第一次人工智能浪潮。但这一次人工智能的春天只持续了20年,原因是当时过于重视算法和方法论,而导致了人工智能在处理问题范围的局限性。

如今,人工智能研究的发展已经历了近六十年的沉浮,从硬件的计算能力、到深度学习算法、计算机视觉技术和自然语言处理等各领域都有了本质上的飞跃,人工智能已经从一个学术层面上的探索发展成一种可推动产业结构变革的新兴生产方式。结合资本市场和行业发展的角度,现今我们对人工智能的思考和展望更应回归投资的本源。

随着CNN、RNN等算法成熟和GPU对计算能力的提高,现今人工智能所需要面临的是如何使应用深化,从而对产业发起变革。因此,在算法、计算力、数据三个要素中,大量的数据,特别是场景化、标签化的数据获得成为重中之重。能否获得场景化的数据,不仅可决定人工智能在行业中的效用力,同样也是将人工智能切实落地,证实其并非资本市场泡沫的根本。

1.2  经历二次低谷,算法和计算力的瓶颈已突破

从人工智能的发展历史看,其一共经历了三次黄金发展期和两次低谷。从1956到1974年是人工智能发展的第一次黄金时期。这一阶段涌现出了大量人工智能的解决方案和未来研究方向。

然而1974到1980年,算法和计算能力的局限使人工智能迎来了第一次低谷。一方面,人工智能所基于的数学模型和数学手段被发现有一定的缺陷,逻辑证明器、感知器、增强学习等等只能做很简单、非常专门且很窄的任务,稍微超出范围就无法应对;另一方面,计算机的运算能力有限,而无意识的直觉和判断需要大量超预期的计算能力。算法和计算能力的局限使人工智能。

image.png

20世纪80年代,BP算法的突破使人工智能迎来了第二次繁荣。人工智能数学模型方面在80年代出现了众多重大发明,其中包括著名的多层神经网络(1986)和BP反向传播算法(1986)等。此时“知识处理”成为了主流人工智能研究的焦点,卷积神经网络的全新方式学习和信息处理方法逐渐被应用于字符识别和语音识别软件,获得了商业上的成功。而随后,由于专家系统使用的Symbolics和Lisp等机器陈旧而难以维护,受硬件和资金限制,人工智能的低谷又一次来临。

从20世纪90年代年以来,摩尔定律让计算越来越强大,当更强大的计算能力被转移到人工智能研究后,显著提高了人工智能的研究效果。随着新的计算引擎,如GPU等开始应用于人工智能,计算力的问题逐渐解决,正式进入了第三次黄金发展期。

回顾人工智能的发展历史,第一次低谷遇到的瓶颈是对于认知算法的基础性障碍,而第二次低谷遇到的瓶颈是计算成本和数据成本问题。在漫长的六十年发展历程中,人工智能的两大必备条件——算法和计算力和成本的瓶颈已一一得到了突破,那么算法应用方向明晰(计算机视觉、语音交互、深度学习),新型计算架构已满足所需的计算力的背景下,场景化数据集的规模和质量,可能是下一个瓶颈,同样也是可实现人工智能飞跃的下一个突破点。

 人工智能下一阶段驱动力,超大场景化数据集    

人工智能发展进入了数据推动人工智能更新迭代的阶段。一方面,强人工智能和通用智能在目前还未成熟,特定场景下的垂直型人工智能深化应用成为方向;另一方面,一方面,随着人工智能进入移动互联网时代,由于各类型的终端设备的使用,各个行业数据都呈现指数级的增长,从图像、声音、视频到位置、轨迹、动作等,多维度场景化的数据分布使垂直化人工智能开发成为可能。

场景化下的数据集的驱动力。从技术角度来看,大规模情景标签数据集的可用性可以使模型性能不断优化,Google Brain的Jeff Dean在论文中说明,即使在300倍ImageNet规模的数据集下,计算机视觉模型的性能仍没有遭遇平台;从应用角度来看,场景化的数据对于垂直领域的人工智能开发应用更具有实用性,完整性和准确性,在此驱动下真正实现商业化落地的可能性更高。

2.1  算法非门槛:模型性能随训练数据呈线性增长

今年 3 月,谷歌大脑负责人 Jeff Dean 做了一场题为《通过大规模深度学习构建智能系统》的演讲。Jeff Dean 在演讲中提到,当前的做法是:

解决方案 = 机器学习(算法)+ 数据 + 计算力

那么在计算力呈百倍的提高,模型深度和容量不断扩大的趋势下,未来有没有可能变为:

解决方案 = 数据 + 100 倍的计算力

从计算机视觉领域来看,在之前二十年,主要是深度学习模型的应用使该领域取得了明显的突破和长足的发展。但自2014年来,模型的容量和复杂性,以及硬件的计算能力都在进一步的增加,而用以训练的数据集规模却没有相应的扩大。因此,专家们推测,:模型的精度和准确性还可以随着训练数据量的增加,而提高数十倍、甚至数百倍,并且可能没有上限。

image.png

模型性能随训练数据量呈线性增长

为了证实这一推测,谷歌机器感知组建立了一个名为“JFT-300M”的数据集,是ImageNet的300倍。与ImageNet相似,JFT-300M数据集中包含的不仅仅为简单的图像,其中还包含了10亿多个标签(单图像可有多个标签),此外,研究人员还在10亿图像标签中,挑选出了大约375M的高精度标签。

最后的试验结果比专家们的推测更为喜人。1)大规模标签化数据集的适用提升了表征学习的效果,进而提高了视觉任务的表现;2)视觉模型的性能和训练数据两级有着异常线性的关系,而且目前为止,并没有表现出平台期效应。

image.png

从Google的这项实验,采取的是大量的标签化数据集以用于训练计算机视觉,还并没有焦聚在特定任务的数据集上,如果使用大规模的最优标准化数据集,其对模型性能的影响力可能还会更强。在未来,获取大规模的特定任务数据集将是研究人员以及人工智能公司的重要及核心任务

2.2  底层算法开源化:Google Video Intelligence API

对于人工智能是计算机下一个产业投资大方向相信早已是大部分人的共识,近年来随着云计算带来的基础IT架构演进、实体经济数据化转型的带来的大数据、GPU等基础硬件带来的计算能力以及深度学习算法带来的提升,人工智能应用领域不断扩大。

从投资的角度,一个公司要在人工智能领域获得成功,其所需具备的必要条件和关键本质到底是什么,是技术和算法驱动?是高质量的大数据?是更懂人工智能的团队?是清晰的商业模式?抑或是所占据的市场、渠道和应用场景?

我们认为:评估一个人工智能公司,最重要是看其有没有好的场景。有了好的场景,从而可以有数据积累,这才是人工智能公司技术不断提升的根本和价值。而所谓的算法,不是人工智能公司的竞争门槛,其领先程度不会超过6个月。

2016年以来,场景式的人工智能逐渐找到了属于自己的位置,哪怕是那些在人工智能积累较为深厚的巨头,也只在某些有典型应用场景的地方推出相应产品。

比如,以亚马逊Echo为代表的智能音箱获得巨大成功,谷歌的Google Home、苹果的HomePod也不甘落后,纷纷抢占智能家居的重要入口,抢占让人在安静的家庭环境下表达自己的意愿这个重要场景。又比如GE的数字化改造、通过AI预测能源需求、帮助更准确地启动风力涡轮机,Google DeepMind通过分析谷歌服务器的访问情况帮助其数据中心冷却和支持系统减少能耗等等,针对企业端的场景更多的是实现更精细化的控制、通过识别不同模式或规则自动作出响应、带来效率改进。

image.png

天然具备场景化数据源的子行业猜想

大量场景化的数据为人工智能应用于各种情景提供了发展的土壤,没有数据就不会有智能。

从行业角度来看,人工智能更适合于拥有大数据、且数据量可以实现自我推动的公司,没有数据的人工智能是无法前行的。我们认为,安防、医疗、无人驾驶,医疗和金融将是人工智能率先突破的场景。

此外,情景驱动对应用型人工智能企业的数据处理能力提出了要求。企业不仅需要采集数据,还需要利用深度学习将这些数据转化为人工智能的“知识”,最后根据企业的需求,转化为相应的应用决策。

因此,有能力采集、获取、处理场景化数据的企业,才可以准确利用人工智能切实解决行业痛点,实现效率或者精确性的提高,进而形成纵向的生态链,完成场景闭环,使人工智能和自己具体的行业相结合,全面的利用数据,创造更多的商业价值。

3.1   安防场景:视频监控前端龙头,掌握数据入口优势  

对于安防来说,人工智能有着天然的应用场景,特别是公安、交通等领域,海量视频数据、视频分析作为重要辅助破案手段,传统录像摘要分析的低效,早已不能适应,需求升级换代催生了基于AI的智能安防产品。人工智能,特别是深度学习算法的发展彻底打开了安防产品“智能化”的发展空间,解决了复杂数据的问题。拥有准确率更高、环境适应性更强和识别种类更丰富等主要优点的深度学习算法完美解决了传统图像识别和图像处理技术在处理安防大数据时的痛点,使得安防平台“智能化”真正具备了可行性。

而在深度学习、计算机视觉算法开源化的大趋势下,未来训练数据集上的差异对计算机视觉解决方案的优劣影响权重增加,具有特征性的场景数据集的获得,是AI视频真正落地应用的关键。而安防行业是天然的数据源,具有繁多的数据种类、PB级的数据量等特征,非常适合进行AI视频算法训练。

3.1.1 视频监控类公司拥有的场景化数据节点丰富

出于对安防的需求日益提升,我国在视频监控上的投入和前端覆盖率也在不断增加。据统计资料显示,自2005 年来,“平安城市”建设累计投入超5000 亿,其中视频监控设备投入约占1/3,北上广深等一线城市的治安视频监控摄像机投放均已超25 万台,根据城市人口规模和管辖面积来分析,每个省会直辖应安装25 万台摄像机,地级市安装15 万台,市辖区安装10 万台,县级市安装8 万台, 县级区安装3 万台,县和自治县安装1 万台,预测未来总计安装约27082 万台监控摄像机,数据入口庞大,并且未来三四线城市还有很大发展空间。

image.png

3.1.2 海康威视和大华股份等前端龙头企业,占据数据入口优势 

以海康威视和大华股份为代表的龙头企业,占据智能安防监控入口优势,针对安防视频数据的海量增长,公司具有优化深度算法,为用户提供优质有效内容的核心竞争力。在底层算法逐渐开源的背景下,处于上游硬件龙头企业依靠强大的资金优势和海量视频信息资源,将着眼布局上游产业,涉足算法和芯片环节,从整体产业链角度提升公司AI视频核心竞争力。

从海康威视和大华股份的研发投入力度上看,目前这两家行业龙头企业在研发端的投入均超过10亿,已推出数款如“深眸”、“睿智”等前、后端智能产品。我们认为,海康威视和大华股份已不再是单纯的硬件公司,而是软件、场景和数据公司。

3.1.3 商汤等算法公司,与企业合作以获取数据支撑

人工智能独角兽企业商汤科技,依托其自有的人脸技术、人群分析、图像识别等先进算法,商汤科技构建了以SenseVideo和SenseEmbedded为核心的产品平台,推出全新智能视频解决方案。提供危险预警、语义检索、决策分析等业务功能,具有理解、分析和预测等特性。

image.png

在安防监控方面,商汤科技与安防企业东方网力共同设立公司,以视频监控系统、安防软件、大数据为基础,开发智能交通管理系统。在互联网金融领域,其合作伙伴包括银联、京东金融、招商银行等,涉及真人检测、身份证、OCR等业务。

3.2  医疗场景:医学图像数据及医疗数据为基点

对于人工智能的产业应用,医疗是正逐步开拓并有巨大发展空间的领域,从医药信息检索,到网上挂号预约,再到病情用药与调理的专业医疗咨询、通过大数据建立的精准用户健康画像,以及辅助诊疗等等,“人工智能+医疗”的服务领域和对象覆盖了医生、病人再到健康爱好者等方方面面。

在疑难杂症的诊疗方面,人工智能能提高确诊率

对于辅助诊疗方面,人工智能在这方面的最大优势在于准确率高,特别是针对一些疑难杂症。最典型的例子便是IBM的Watson,其从早期的认知学习智能软件,转型为后来的认知解决方案云平台公司,从帮助医生诊治疾病,向云系统和预测性分析、性格分析领域迈进。非结构化医学影像数据的认知技术的进步,以及大量医学文献的学习,使其可以迅速达到一个“专家”所掌握的所有知识。

另外,人工智能助于获取更广泛和深入的数据

智能医疗服务的另一个维度是患者和家属,以及需要保健的正常群体。一方面,他们需要大数据和智能分析来选择自己的所需的诊治方式和程序,以及适合自己的保健措施和信息。比如通过“虚拟助手”监测治疗,自动化地规划健康饮食、监控睡眠、提供药物和测试提醒等,并及时跟踪反映患者治疗情况。而如果未来能进一步打通医疗数据的互通互认,以可穿戴医疗设备为代表的“虚拟助手”监测将会迎来一个真正的爆发点。

3.2.1 IBM Watson通过并购获取数据源

Watson 是IBM 打造的人工智能生态系统,是目前人工智能基础平台领域的技术领导者。其中医疗领域被视为IBM旗下的“登月计划”,Watson也成为全球首个人工智能医疗专家。沃森具有强大的自然语言处理能力,其云平台可以将丰富的临床、研究和社会数据集合起来建立一个医疗领域的云数据中心,可以协助医疗保健从业者从多个信息源了解病人病情,包括病历、药学、医疗索赔信息、移动应用、健身设备,然后根据这些信息为患者提供服务。  

image.png

Watson通过一系列的并购与合作完善在医疗领域的布局。15 年 8 月,IBM以 10 亿美元价格收购医疗影像公司 Merge,后者是美国最有影响力的医疗影像公司,拥有 300 亿张 X 光、MRI、CT 影像图。收购后Watson将获得美国7500家医疗网站的使用权,充分利用其海量医疗图像和数据提升Watson人工智能的强度。 

2016年2月,Watson又以26亿美元收购医学数据分析的公司Truven,Truven 拥有 2.15 亿病人资料,8500 个客户, 5000 位医疗领域各方面的专家,其中包括有临床医师、流行病学家、统计学家、政策专家、健保专家、健保咨询师等。Truven 使用的云端技术、统计分析方法、使用者健康数据,也将会整合进 Watson Health。

image.png

除了IBM 的Watson,各大科技巨头也纷纷引入第三方,进行医疗数据方面合作。谷歌的DeepMind 也大量使用英国国家卫生署的匿名数据,设计新型人工智能,以更快解决严峻的眼疾问题等。  

3.2.2  思创医惠:医疗信息化提供商,以数据为源升级智能化平台

思创医惠为专业医疗信息化提供商,公司联合国内14 家主流大型医院和数家研究机构及院校共同成立“智慧医疗联盟”,由国家卫生计生委医院管理研究所牵头发起,对医疗大数据进行学术研究和挖掘,为中国医院研究医疗大数据智能诊断提供技术支撑,形成数据共享、资源共用的研究平台。

此外,公司通过医疗耗材抢占数据入口,将病人的临床信息、医药流通环节以及医院的运营数据模块,都整合进入物联网云平台,通过软硬件的管理把数据分发到各种微小化应用之中。物联网云平台的建立,一方面使信息交换更流畅,另一方面也助于公司积累相关数据,利于未来更多智能化应用的开发。

3.3  无人驾驶场景:对多维数据获取能力要求高 

人工智能在无人驾驶领域的运用主要体现在以下三个关键环节: 

(1)环境感知环节的图像识别;(2)高精度定位、路径规划与决策;(3)车车交互、车与环境交互下的车联网和智慧交通管理。

在对待无人驾驶技术的问题上,目前有两大流派:其一是传统车企,他们采取温和渐进的策略,讲究从Level 1 至Level 4 的循序渐进。首先以高速公路为中心实现自动驾驶技术, 然后逐渐推广到主要公路乃至普通公路,希望通过每一代车型搭载的ADAS 高级驾驶辅助系统不断升级的方式,直到最后实现完全自动驾驶。

其二是科技企业新进入者,包括智能汽车科技公司和共享汽车软件公司。他们选择了一条不同的道路,试图一步到位直接打到Level 4 的境界。例如谷歌的无人驾驶汽车仅设置启动和停止两个功能按键,车辆行驶、道路选择等均由车载电脑操控。

image.png

但无论是传统车企还是科技巨头,开拓自动驾驶开发的第一步就是数据的获取。无人驾驶的数据包含多个维度,包括车辆数据、高精度地图数据、车与车交互数据等等。

3.3.1 四维图新:入股HERE,高精地图数据实力再巩固

公司目前是全球第四大、中国最大的数字地图提供商,同时在电子导航行业市场规模最大的前装车载导航领域已经连续十一年领航。

在2016年12月,公司与腾讯、新加坡政府投资公司共同投资SIWAY公司,通过参股公司SIWAY收购HERE10%股权。HERE 是全球最大导航电子地图和位置服务商。其前身Navteq创建于1985 年,是全球最大的电子地图开发商之一。

目前,HERE 制作和维护约200个国家的地图数据,汽车前装市场市场占有率80%;拥有全球领先的地图采集和制作技术以及先进的位置服务平台,是目前唯一能与谷歌相抗衡的地图数据和位置服务企业。

四维图新拥有的高精度地图的开发能力、与德国三大车厂的资本关系以及进一步拓展的战略投资联盟,使其能够在无人驾驶领域处于关键环节和领先地位。

3.3.2 东软集团:产品+解决方案双管齐下,智能驾驶业务稳健前行

东软汽车电子业务布局广泛。作为国内汽车电子龙头企业,东软拥有26年的业务经验,覆盖了汽车电子的主要细分领域。主要核心业务板块有:车内交互、智能互联、联网安全、辅助驾驶和新能源汽车等产品。依靠全面的业务布局,东软成为了国内最大的车联网整体方案供应商,也是车载网络安全行业的标准制定者,自动驾驶行业领先者。

在2015年7月,公司与日本阿尔派合资组建东软睿驰。东软睿驰的业务快速发展,陆续推出电池管理系统(BMS)、电池包(PACK)、智能充电桩(ICS)等产品。公司持续扩大和提升产品线,达到了国际汽车业质量管理体系要求的国际公认的前沿水平,产品品质、技术和管理水平获得高度认可。

在自动驾驶方向上,东软睿驰的业务主要分为产品路线和解决方案路线。产品路线上目前的FCW/ MOD等L0级警告类产品已实现前装量产,用于横、纵向控制的L1级别的AEB/LKA明年有望前装量产。解决方案路线的核心自动驾驶中央域控制器上的硬件上可支持多路摄像头和雷达探测,软件方面提供了开放架构,融合了传感器和第三方接入等特征。该产品在2017年美国CES展上获得了同业的广泛关注。分步落地的自动驾驶产品,使公司在出行场景中占得先机。

3.4  金融场景:数据获取门槛较高 

目前金融行业中,受人工智能影响较大的业务领域主要有金融数据收集、远程开户、人脸支付、智能投顾等。

image.png

从产业结构来看,金融数据互联网金融平台和传统金融机构都是金融大数据的生产者和使用者。传统金融机构尽管拥有大量的金融数据,但许多数据缺乏相对应的技术,尚无法充分进行利用。中国金融市场由于发展时间不长,在数据的数量和质量上较欧美发达国家都有着一定的差距。此外,由于特殊的监管环境,金融机构数据集中不能提供给第三方使用,而用户行为数据掌握在2C的互联网公司手中。另外,中国《证券法》和《证券投资顾问业务暂定规定》将投顾和资管牌照分卡,客观上限制了如智能投顾等业务的进一步发展。

因此,能够获取金融场景下数据,并将其与人工智能技术要素相结合的公司将得到良好的发展。其中包括有一定金融牌照和业务基础的IT厂商和互联网企业,以及智能化转型中的传统金融机构。最能结合场景数据应用于人工智能的公司,将凭借自身强大的数据量和广泛的数据维度,实现对其自身算法模型乃至产品的优化与完善。从而在市场竞争中占据优势。

3.4.1 恒生电子:从证券交易信息化切入智能投顾

恒生电子基于其多年开发证券和金融信息化软件的经验,为财富管理、交易过程的信息化推出了众多产品,覆盖业务横跨债券、期货、基金、保险、银行理财等。在智能化趋势下,公司通过并购多家人工智能创业公司,布局智能金融领域。

公司在金融领域的多年经验及数据积累所带来的竞争优势明显。如公司的智能小梵,就是以恒生电子过去17 年积累的大数据处理及颗粒化成果为技术基础,进行股票和咨询信息的提炼,并加入语音识别等技术,实现自然的人机交互,帮助用户迅速获得股票基金等金融产品的专业资讯。此外,在智能投顾和智能投资方面,公司也分别推出了BiRobot3.0和iSee机器人。基于丰富的数据源,在大数据分析、机器学习和推荐引擎等技术的加持下,恒生电子的智能投顾产品呈现出更为精准的智能决策辅助系统,并使得普通理财用户也能得到千人千面的专业决策服务。

3.4.2 同花顺:从互联网金融信息服务向人工智能延伸

同花顺在网上证券行情交易系统、金融资讯和大数据服务、手机金融信息服务、基金销售服务等领域具有突出的领先优势。公司是最大的网上证券交易系统供应商之一,为客户提供了一系列涵盖广泛、独具特色的金融大数据分析系统平台和软件。公司网上证券行情和交易系统得到全国90%以上的证券公司使用。公司也是国内领先的互联网金融信息服务提供商,专业从事互联网金融信息与大数据分析服务。

公司试水人工智能领域较早,在2015年就以金融大数据为支撑,开发人工智能产品,并采用自然语言理解等人机交互的技术提高产品服务。作为证券交易和分析平台,公司在B端和C端有着天然的流量优势,海量训练数据可以使公司的算法模型不断完善。另外,区别于支付宝和微信,公司的数据是特定投资分析场景下的直接数据,针对性强,直接利用价值更高。数据优势是公司在行业内竞争的优势和壁垒。公司的”i 问财” 目前是国内最大的语义理解库,该数据库未来或可对标美国的Kensho公司,为普通投资者推算与某个特定事件相关联的股票的股价趋势,如自然灾害、药物审批、经济政策对股市的影响。同时,在大数据背景下,公司通过海量金融经济数据,为量化基金提供“因素数据”,通过该类合作,公司分享了基金公司的管理费。

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论