苹果MR梦,埋着一颗大彩蛋

库克的“乔布斯时刻”

科技界的“春晚”如期而至。

北京时间周二,苹果将在开发者大会上公布首款MR(混合现实)头显—Reality Pro,这款产品此前曾倍受外界瞩目,鉴于苹果在历代消费电子产品引领潮流式的形象,同时也被认为是拯救消费电子市场的下一代重磅产品。

生成式AI的进步日新月异,市场幻想着大模型最终能走出电脑PC,部署到万千智能终端,以及初具雏形的具身智能。以大模型为基础的应用生态可能涉及一次全新的流量分配,对于历次突破交互革新的苹果产品而言,机遇和挑战是共存的。

未来这家科技巨擘将如何顺应潮流,或许能从即将发布的这款产品里探寻一些线索。


01

AI推动交互革新


苹果历史上的重量级产品,无不以突破性的交互界面惊艳众人。iPod用的是点击轮,iPhone和iPod时代是多点触控,而到了Apple Watch变成了数字皇冠。

与当前主流VR产品不同,苹果这款MR头显首次同时实现了眼动交互和手势追踪这意味着用户可以在不用手柄装置的情况下,通过眼动和手势来进行人机交互。

用户可以通过眼动交互来选择某个按钮、应用程序或者是列表项目,然后通过拇指和食指捏在一起的动作激活某个特定的任务,可能引入的“空中打字”正是基于眼手协作实现的豪华功能。

但如果再加上生成式AI,相当于又多了一个和机器交互的接口。通过结合其他交互技术,如眼动追踪和手势追踪,用户可以更加方便地实现复杂的任务,同时也能够提高交互的效率。

比如NLP,用自然语言模型去理解用户的自然语言输入,识别用户的意图和需求,然后执行相应的指令,提供更加智能和个性化的服务,进而提高用户的交互体验和满意度。

Meta前段时间发布了一个图像分割基础模型(SAM),融合了类似NLP的提示学习方式,支持用户使用各种交互方式实现图像分割,瞬间一键抠图,比如输入文字,鼠标悬浮,视频识别,堪称机器视觉里的GPT。

来源:百度

举个例子,在虚拟现实场景中,用户可以通过眼动追踪和手势识别技术来进行基本的操作,如选择物品和移动场景等。

但是对于更加具体和复杂的操作,用户可以通过自然语言输入来实现,如通过手势选择一个物品,再通过自然语言输入来指定其属性,如“把这个箱子变成红色”。这样,用户可以更加方便地实现复杂的任务,同时也能够提高交互的效率和满意度。

头显设备为多模态交互提供了更加便利和自然的交互方式,未来结合生成式AI将会为用户提供更加智能、个性化和灵活的服务。

想象如果这一切最终都能在虚拟现实中应用,交互自此即可告别笨拙的鼠标和键盘,可操作性提升了不止一个量级,更不止于二维的操作界面


02

新世界的引擎


在进入虚拟世界(VR)之后,这款MR计划为用户提供一个简洁的切换模式,只需要“转动”特定按键,沉浸式的数字世界便会向电影场景落幕般淡出,然后回到现实。

这种切换几乎让MR的内容开发花费成倍增加,因为不仅要打造一个完整的虚拟世界,在AR模式下还要让虚拟形象附着在现实世界里。

早在 2017 年,苹果公司就推出了AR开发平台 ARKit,开发人员可以在该平台上为 iPhone 和 iPad 设备构建 AR 内容体验。截至去年 1 月,苹果公司的 App Store 中已有超过 14,000 款 AR 应用游戏。ARKit 已成为目前最大的 AR 开发平台。

经过几年的算法积累,平台在内容创作形式上类似于“我的世界”和“Roblox”两款游戏,用户可以轻松构建自己的3D世界和虚拟角色,并让虚拟角色在现实世界里走动。

用户使用自己形象的虚拟人进行视频对话,与Meta的Horizontal平台相类似,但比起只有“上半身”或“头部”形象,这款新头显将会在一对一视频聊天里逼真地渲染用户的全身。

来源:bilibili

头显对内容体验的要求,几乎与硬件交互一样重要。苹果在MR内容领域不断扩张,汲取优秀的技术人才。据不完全统计,自2015年以来,苹果已经在过去7年时间里收购了超过7家创企,为其MR内容服务,包括与迪士尼等媒体公司合作开发沉浸式内容,已经在健康、教育、游戏、试听四大场景有所布局。

生成式AI未来可以在场景搭建,角色创作,虚拟人交互方面发挥重要作用,很可能成为苹果后续发力的方向。

并且此前外媒也曾披露过,苹果正在招聘有生成式人工智能背景或感兴趣的员工,虽然这点迹象不足以证明苹果以后会将大模型融入到头显生态中,但这项技术在虚拟世界里有待挖掘的巨大潜力,苹果的想法已经冒出。

自年初以来,上周随着英伟达正式步入“万亿俱乐部”,与其余四位俱乐部成员(苹果、微软、谷歌、亚马逊)一起贡献了标普500指数涨幅(9.5%)的95%,五位成员市值增加了2.87万亿,而其他495支股票的总涨幅仅有0.3%,这就好比五个猛男拉着一辆停在下坡的大卡车。

这些科技大厂除了能在即将衰退的美国经济下还能保持过硬的业绩,市场更为看重的,是他们能够在这场AI风暴中掌握主导地位,而且能够在各自业务的基础上深化模型应用。

此前生成式AI结合智能终端已经有了雏形,之前国内阿里大模型发布之际,用户通过智能音箱和大模型进行交互,对话语音助手也的确在生成式AI加持下变得人性化不少。

来源:bilibili

也有使用者将ChatGPT接入siri,让后者秒变“大聪明”。但还没等到部署自己的大模型,上个月ChatGPT就率先杀进苹果的移动生态里了,这款应用程序不止可以免费下载,还集成了OpenAI的开源语音识别系统Whisper,支持语音输入。但是据外媒透露,苹果因为担心机密数据泄露,一直禁止员工在工作中使用chatGPT或其他外部AI工具。

来源:微博

这家有着强大护城河的移动生态帝国缔造者不应该仅仅只有这点担忧,随着ChatGPT开放插件功能,OpenAI可以用更为高效的方式帮助人们提高交互质量,这对于依靠设备和操作系统来支配移动流量的模式来说是一次彻底的颠覆,苹果当然要守住这个擂台。

Reality Pro也会拥有自己的应用商店和操作系统,据称主界面与iOS大致相同。虚拟世界更像是为了体验生成式AI的空间,本来围绕虚拟场景的构建就可以通过AI作为引擎来加速生成,由算力提供能量,节省了巨大的工作量和开发成本。

而且,有了虚拟人作为社交替身,用户在与AI驱动的NPC交互的过程里获得更多沉浸感和探索空间,接近美剧《西部世界》的体验。英伟达上月末推出的模型代工服务,能够为游戏中的语音、对话和角色动画提供AI模型,给NPC添加实时交互的功能。

来源:英伟达官网

在支持Steam VR的一个多人游戏创作沙盒Modbox中,开发者使用了Open AI的GPT以及Replica的自然语音合成技术,创造了能够和人类玩家进行生动、自然、自由对话的NPC。

AI技术还是元宇宙的重要支柱,虚拟内容继续丰富,那么变现潜力也在提升。Roblox认为元宇宙应该包含八大要素:身份、朋友、沉浸感、低延迟、多元化、随地、经济系统、文明。彼时Facebook要从一家社交媒体公司转型元宇宙公司,英伟达推出了专门打造元宇宙的虚拟协作平台Omniverse。

苹果则用了七年来打造通往新世界的入口,库克最初的想法,是打造一款外观类似普通眼睛、可以日常佩戴且能够替代iphone的AR眼镜,并非一个虚无缥缈的概念,但是要让人们理解并接受这些科技公司兜售的东西并不容易,Meta就是很好的例证。


03

苦日子接着过


头显设备市场里,Meta致力于占领下一代消费终端生态,是目前的领军企业,市占率高达七成左右,但依旧还在为理想买单,去年该项业务收入亏损持续扩大,达到了137.2亿美元。

据IDC数据,2022年AR/VR设备市场表现十分惨淡,出货量仅有880万台,与此前1390万台的预计差了近五百万台。在今年一季度,VR/AR产品出货量跌幅进一步下降至54.4%。

把拯救市场的希望寄托在苹果头显上,连Meta都会觉得可笑。

这款Reality Pro的出售价格高达3000美元,价格相比Meta的高端机Quest Pro翻了一倍。后者在去年10月份发售后迅速调低了价格,上市后便遭遇了销量和口碑的滑铁卢,根据调研机构预估,其出货量应不超过25万台。

关于苹果头显出货量的预估一路下调。一些供应链人士透露,下半年的订单需求量预计在40万-50万台左右,这与之前媒体披露的百万台销量相去甚远。更有咨询机构悲观认为,这款新的头显产品因为价格昂贵,生产难度较大,正式推出了后也只能吸引一小批开发人员,最终可能不超过10万台。

另一边,结合近期发展较快的AI大模型,Meta选择了雨露均沾。早在苹果开始招聘AI从业者之前,扎克伯格曾在2月宣布成立新的产品部门,专注于生成式人工智能。

虽然调整转型都需要相当大的投入,AI工具毕竟能融入到Meta的广告、信息流和短视频业务里,帮助公司与Tik Tok竞争,公司产品化速度相当快,没过多久就推出了一款名为LLaMA的大语言模型。

苹果将以一款昂贵的设备来重塑这类产品,而Meta高端头显的尝试虽然已经暂时败北,也没有彻底停滞产品系列的延续,恰好在抢在前几天发布了首款消费级MR头显Quest 3。

混合现实就是能够在虚拟环境里同时看到现实的场景信息,是这款Quest 3的主要卖点,Meta通过中间的深度传感器来还愿用户所处环境的真实感,为了同时渲染真实—虚拟场景,搭载了高通Snapdragon XR2的4nm芯片。

尽管同时具备混合现实的概念,但在价格上要比Reality Pro亲民不少,售499美元,大约六分之一的水平。即使没有眼球、手势追踪等功能,也可以当成苹果头显的低配版,和人家错位竞争一把。

来源:Meta 官网

VR这个赛道经历了苦涩的一年,元宇宙可能是投资人最不想听的三个字。但小扎对于元宇宙的信仰是坚决而热烈的,裁员节流都无法将Meta从这个Reality Lab这个深坑里拉出。

去年财报公司宣布将业务重心由元宇宙切换到AI上来,但Q1该部分的业绩亏损甚至超过了裁员之前的水平,面对市场的质疑,盈利压力空前的大。Quest 3要等到今年秋季正式发布,Meta已经抢先预热了,这是抱着和苹果头显“荣辱与共”的想法,而按照今年疲弱的消费预期,有可能一损俱损。


04

尾声


扩散式创新总是先从一小批狂热的技术爱好者出发,由他们的态度来推测主流市场是否接受新的技术,企业家则会认真研究非连续性创新的过程,给大众揭开新技术的面纱,等到大众跟风接受新的产品和服务,就会推动市场进入龙卷风般的高速增长时期。

来源:《猩猩游戏》

苹果初代产品并不一直都那么惊艳,也许会有些许颠簸和嘲讽,但胜在有一批忠实用户愿意帮助其打造生态粘性,再通过硬件迭代推向大众客户,找到更好的使用场景。

公司本身的硬件基础和移动生态也比Meta丰富不少,市场也会更愿意为其买单,而且从不过分渲染元宇宙,一个打不开用户认知的概念。随着消费者越往深探索虚拟空间,不远的将来生成式AI将作为整个新世界的引擎。返回到现实世界,一个彩蛋已经埋下。(全文完)   

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为任何实际操作建议,交易风险自担。

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论