科技新知

科技新知

科技领域研究达人科技领域研究达人
IP属地: 中国香港 con

读懂硬科技,尝鲜新硬件。把脉产业互联网,关注智能新基建。

47 动态 328 文章 68 粉丝 0 关注

  • 动态
  • 文章
  • 组合
  • 关注
  • 粉丝
科技新知 科技新知

科技新知

9小时前 · 科技领域研究达人

追星、逛展、看演唱会无国界,年轻人现在的跨国搭子是?

AI同传大众化,讯飞找对了切入点。 @科技新知 原创 作者丨茯神 编辑丨赛柯 一年一度的二次元春晚BILIBILI MARCO LINK(BML)走过了11个年头,7月15日于上海虹馆再次与年轻人们“为爱干杯”。第一次参加这类演出的非二次元人士艾莉(化名),还收获了只属于她的惊喜。 作为一名在读的音乐系学生,艾莉很久之前就喜欢上了日本当代优秀的创作式女歌手樋口爱。后者为神作动漫《进击的巨人》创作演唱了最终季片尾曲《恶魔之子》,进而在国内二次元群体中圈粉无数。 2024BML的舞台上,受邀跨国而来的樋口爱,按照演出惯例与场下的观众交流互动,却不免担忧语言不通造成沟通障碍。当发现自己的日语发言,在身后大屏幕上实时出现了翻译成中文的字幕,她也顿时神情一松。艾莉在现场感受到偶像亲口表达的鼓励后,更加坚定了自己的音乐梦想。 “我是第一次追星,更见识到了二次元们的热情。一直以为同传翻译是那种国际商务大会才有的标配,没想到在文娱演出上也能见到,我不会日语,所以全程听她讲话的时候都在看大屏幕上讯飞同传的字幕,翻译超级快,感谢小破站又带我开眼界了。” (讯飞同传在BML现场进行实时翻译) 在多数大众的认知中,同声传译一直是个神秘且高端的职业,从业人士往往要经受魔鬼般的训练才能上岗。但随着全球化的推进和国际交流民间化的延伸,更加多元、更加针对个人的翻译产品和服务需求正在爆发。年轻人们也开始在日常中,寻找着属于自己跨国生活娱乐的赛博新搭子。 Part.1 始于专业,走入民间 二十余年前,随着中国加入WTO成为“世界工厂”,同声传译成为市场上最紧俏的行当。业内老手做到年薪百万并不出奇,在那个年代意味着一年能在北京赚一套房子。 纵然到了2017年,谷歌开发的机器翻译软件已经能够覆盖90%的翻译场景,可是更加考验实时性和准确性的同传工作,仍需要经过数年培养的专业人才担任。甚至由于对人体机能和脑力的耗费,高规格的跨国交流活动,还需要多名同传人员交替工作。 需求场景的稀缺,专业人才又难培养,导致同声传译一时未能普及。如今随着国际交流的高频,激增了对实时翻译的需求,以及AI技术的不断成熟提高了性能,才让“同传大众化”成为了一种可能。作为中国AI领域里的“国家队”,科大讯飞恰是选择了智能语音赛道为切入口且聚焦至今的代表,最典型的则是AI翻译产品“讯飞同传”。 从讯飞同传产品2015年问世,到2018年首次让机器的中英语音翻译,达到CATTI全国翻译专业资格(水平)考试二级合格标准,再到2022年-2023年间,科大讯飞作为独家翻译供应商,先后为北京冬奥会和冬残奥会、布达佩斯田径世锦赛等国际赛事提供同传翻译服务,AI翻译在用自己的进化速度,和人类一起奔赴每一个新战场。 近年来,AI同传产品在国际会务中的应用也逐渐成为标配,在今年澳门BEYOND国际科技创新博览会中,主办方除了在所有嘉宾演讲现场提供了讯飞同传英中翻译屏幕,还将讯飞同传内嵌到BEYOND官方APP中,嘉宾不仅可以看英中翻译文稿,还可以使用讯飞同传进行收听翻译后的语音播报,实现真正的AI同声传译。以往需要将人群聚集共同享受的AI翻译服务,如今仅需要一步手机,就可以让普罗大众享受AI翻译的便捷。 (讯飞同传被内嵌至活动官方APP) Part.2 年轻人为爱发电 做年轻人的新搭子,是一个双向奔赴的选择。 在严肃的商业、会务等To B场景之外,“同传大众化”的推进,少不了大众感知度更强的文娱场景。如何打动年轻人的痛点需求,也成了讯飞同传为之努力的方向。 艾莉在得知BML上用的就是讯飞同传后,才想起来自己在微博上早就刷到过相关笔记。“之前看到有喜欢韩娱爱豆的同学在油管上收看韩文直播,视频下方就能实时跳出中文的字幕来。以前像这种内容,还只能等国内的字幕组翻译好,再剪辑成视频贴上字幕才行。” 现在生肉视频和直播就可以实时翻译的追星圈“神器”,就是与讯飞同传APP。讯飞同传APP开启后,可与各种类型的视频、直播、播客、教育、会议等APP搭配使用,实时为前台正在播放的内容进行多种语言之间的翻译和字幕生成。 最早让讯飞同传APP广受好评的,还是留学生群体上课实时翻译辅助以及翻译后文字稿充当课堂笔记,而线上网课也可以选择用讯飞同传开启翻译辅助和内容记录。饭圈的休闲搭子和留学生的上课助攻让讯飞同传成为翻译产品中,年轻人更喜欢的AI搭子。 (来源:微博超话) 另外,在上文中澳门BEYOND EXPO 2024大会上,中国香港艺人王嘉尔作为新青年文化时尚的代表出席对话,引来国内和世界各地粉丝前来。个人素质优异的王嘉尔,流畅使用普通话、英文和粤语与观众们互动,讯飞同传也默默地在大屏上为来自世界各地的年轻人,传递榜样的力量。 (王嘉尔现场发言) 当代年轻人们的跨国交流,显然已经成为常态,互联网和手机给了他们更多渠道聆听世界和追寻自我。讯飞同传等AI工具,仿佛就是他们儿时在《哆啦A梦》中见到的“翻译魔芋”,让环游世界的梦想照进了现实。 Part.3 推倒BC双端的“语言墙”,世界沟通无障碍 就像二次元终究会打破与三次元之间的隔阂,讯飞同传这类AI实时翻译工具,也有机会推倒树立在人类社会文明之间的“语言墙”,重塑一个全球沟通无障碍的大市场。 《圣经》中有这样一则关于“巴别塔”的寓言。大地上的所有部落联合起来,想要建造一座通往天堂的高塔,彰显人类的能力。为了阻止这一计划,上帝让埋头苦干的人类突然忘记了之前共同使用的语言,彼此难以沟通协作,浩大的工程因此不了了之。反之,如果能够打破“失语”的牢笼,世界各国之间的文化交流、经贸往来畅通无阻,建立统一大市场所仰赖的信任基石才得以夯实。 自中国加入WTO以来,A股上市公司的海外业务收入从最初的40多亿元增长至如今的8.5万亿元左右,复合年均增长率高达38%,远高于国内GDP的年均增长率。而它们海外业务收入总和与主营业务收入总和的比例从2016年的12.2%,只上升至2023年的13.7%,与很多大型跨国企业海外业务收入占比普遍超过50%相比,仍有不小差距。 另一方面,艾媒咨询数据显示,中国已出海企业里中、小、微企业的占比分别为39.4%、17.5%和13.6%,出海方向正从欧美、东南亚等成熟地区,扩散到中东、非洲等新兴区域。不管是大企业谋发展,还是小企业求生存,推倒“语言墙”后的统一大市场将成为共同的良策和目标。 中国企业可以靠着业务走出去,国内独特的旅游资源也想“出海”,就要把全球各地的游客引进来。从2023年11月17日开始,中国陆续向54国公民开放了72/144小时过境免签,由此引发了“老外暴走中国”热潮,相关视频在海内外的社交内容平台上爆火。 国家移民管理局统计数据显示,2024年上半年入境外国人1463.5万人次,同比增长了152.7%。为了让国际游客更好地了解中国文化,进而在世界范围内宣传中国文化,多语种的实时翻译应用产品是不可或缺的一环。 巴别塔不可能一日建成,“语言墙”也不会一朝推倒。统一大市场的任务艰巨而漫长,但AI的东风与出海的大潮相映叠加之下,AI同传这个垂直赛道或许会扶摇而上,科大讯飞在智能语音领域数十年的打磨沉淀也将厚积薄发。而首先成为年轻人的新搭子,已算是迈得相当成功的一大步。
科技新知 科技新知

科技新知

昨天 10:43 · 科技领域研究达人

AI手机没有独家大模型供应商

百模大战的火势刚缓,AI硬件的浪潮便席卷而来。 手机,作为全民终端产品,更是成为大模型硬件落地潮的浪头。国内手机厂商方面,OPPO宣布2024是AI手机元年,魅族则称将正式停止传统智能手机新项目,双双All in AI。海外备受关注的苹果放弃十年造车梦,转向生成式AI项目,全力押注下一代新机iPhone16系列。 在这之前,去年开始三星、小米、荣耀、vivo等主流手机厂商都或早或晚,已经公布了各家在AI技术的布局和产品发布。最近Canalys发布的《AI手机对中国消费者的吸引力》报告更是显示,2024年一季度,中国大陆市场依靠作为本土厂商的先发主场及市场高端化结构,AI手机出货量达1190万部,占据全球AI手机出货的 25%。 来源:Canalys AI手机终端的风口,也吸引头部大模型服务商先后加入。 去年5月份百度旗下小度科技宣布即将进军智能手机市场,并计划在5月下旬发布旗下的第一款整合小度 AI 技术能力的智能手机。不过最终外界并没有等来一场时隔8年再战手机市场的大戏,而是一款“小度青禾”AI学习机的发布。 字节则是在今年,有业内消息称在4月秘密启动了AI手机研发项目,参与该项目的核心团队主要由2019年字节收购的锤子手机研发团队和2021年收购的PICO VR研发团队。不过随后,字节对外澄清信息不实,实际上是在探索基于手机的大模型软件解决方案,提供给手机厂商参考使用。 阿里方面则是全面AlI in大模型卖铲人的身份,今年3月份手机芯片供应商联发科宣布已成功在天玑9300等旗舰芯片上部署通义千问大模型,首次实现大模型在手机芯片端深度适配。通义千问在离线情况下依然可以流畅运行多轮AI对话。 在多次传出亲自下场做AI手机的乌龙后,对于百度、字节、阿里等头部大模型供应商来说,相较于在手机硬件市场拼杀,当一个更自在的卖铲人正在成为共识。 不过百度、字节、阿里没有想到的是,当市场上卖大模型铲子的厂商太多,就来到了买方市场。先是市场传出最大的手机AI买主苹果或将加入百度大模型,随后拉升百度股价。不过紧跟着又传出苹果也在同时接触其他大模型供应商。 7月份,三星第六代折叠屏手机Galaxy Z Fold6与Galaxy Z Flip6系列的发布,更是将买方市场展现得淋漓尽致。除了此前已经与百度智能云、美图公司、金山办公达成的合作之外,又新增了火山引擎,为最新款折叠屏手机的智能助手和AI视觉接入豆包大模型。 显然,当大模型想要上手机,来到大厂的软肋硬件侧,在各家手机厂商成本和性能多方衡量之下,一部融入百度、阿里、字节多方大模型技术的AI手机诞生了。作为幕后的技术提供者,百度、字节、阿里这些此前在大模型市场明争暗斗的卖铲人,甚至呈现出一副握手言和的短暂景象。 Part.1 百度不被苹果AI手机独宠 在国内手机品牌“热烈拥抱”AI手机约一年后,苹果的“AI手机”后发后至,与OpenAI合作。不过,OpenAI目前所支持的161个国家和地区,不包括中国大陆和中国香港。所以,苹果在中国的AI合作伙伴,始终没有对外公布。 早前的信息主要指向百度文心一言,最新的媒体消息则称苹果也与阿里、百川等另外的中国大模型公司进行了会谈。可见,苹果与多家大模型公司都在谈,没有大模型厂商可以成为苹果AI的唯一供应商。 不仅是国内如此,从苹果在海外的AI合作情况来看,也是如此。虽然和OpenAI合作,是其进军AI手机的标志性事件,但是OpenAI也远不是苹果唯一的AI伴侣。 在6月份结束的WWDC会后,苹果软件工程高级副总裁Craig Fedrighi在接受采访时表示,期待未来与其他AI模型的集成,比如谷歌的Gemini。此外,美国AI初创公司Anthropic也有望成为苹果服务商。 对于大模型厂商的合作和采用,苹果正在试图复制管理手机硬件供应链的招数:习惯为每类零部件配置2个水平差不多的供应商。一方面可以使供应商互相制衡,另一方面也利于控制保密范围,方便管理。在永远为自己准备好一个水平不差的Plan B计划下,如果供应商产品或者管理水平下滑了,就会被苹果无情地踢掉。 不过也有业内人士认为,相较于硬件产业链的Plan B计划主要在于制造业的工艺复制,AI供应商的可复制性并不大,即使代码完全一样,训练数据不一样也会导致最终的AI性能表现差异。之所以要寻找多家AI供应商,可能是苹果对于现有任意一家的AI能力都不够满意。 最终苹果AI手机的实现路径可能和三星大同小异:寻找某一功能垂直领域的优势大模型供应商,然后整合AI服务到手机系统层。 比如上一代三星AI手机国行版Galaxy S24系列选择大模型供应商就是如此。Galaxy AI上的多个功能均基于百度智能云千帆平台的AI应用。图像处理层面上,三星选择与美图公司进一步的深入合作,基于美图自研AI视觉大模型MiracleVision,在相册App中带来AI改图、AI扩图、AI图生图等功能。 通过和更多的AI大模型企业合作交流,苹果或许也将采用这种优中选优的AI能力供应商逻辑,这也意味着在全球拥有超10亿活跃用户的苹果市场,将成为大模型厂商最激烈的AI性能竞技场。 Part.2 吃百家饭的AI手机 手机品牌与大模型公司合作,苹果不算开先河。 1月,荣耀、三星就与百度展开合作,三星将文心一言集成进了Galaxy AI,荣耀通过YOYO接入文心一言,都是用AI助手调用大模型能力。5月,在字节跳动2024年春季火山引擎Force原动力大会上,火山引擎携手OPPO、vivo、荣耀、小米、三星及华硕等,宣布成立智能终端大模型联盟。 6月12日,字节旗下“火山引擎”公众号发文称,小米旗下人工智能助手“小爱同学”已经与火山引擎达成合作,接入字节跳动豆包大模型,未来小爱同学将借助豆包大模型的能力,向用户提供联网搜索能力,尤其是可以实时提供与头条内容同源的搜索结果,为用户呈现全面且时效性强的答复。 三星更是堪称吃上百家饭大模型红利的代表。以7月17日最新发布的第六代折叠屏手机三星Galaxy Z Fold6与Galaxy Z Flip6为例,进一步扩充了AI供应商。除了此前已经与百度智能云、美图公司、金山办公达成的合作之外,又新增了火山引擎,为最新款折叠屏手机的智能助手和AI视觉接入豆包大模型。 国产手机厂商方面,根据市场公开资料统计,小米、OPPO、vivo、荣耀均不同程度的接入了阿里通义、百度文心以及字节豆包三家大厂的大模型产品。不过在这之前,过去的2023年还是主流手机厂商全面自研大模型的一年。 先是华为将自有的盘古大模型接入手机,使得手机可以执行文本生成、知识查找、资料总结、智能编排、模糊、复杂意图理解等复杂任务。之后,8月14日晚间雷军在自己的年度演讲中透露,今年4月小米已经组建了大模型团队,手机端侧大模型也已初步跑通。 几乎同时OPPO也宣布基于AndesGPT打造的全新小布助手,即将开启大型体验活动。AndesGPT是OPPO安第斯智能云团队打造的基于混合云架构的生成式大语言模型。紧跟着,vivo则推出了蓝心大模型,同样主打轻量化,利于进行手机本地化的数据处理;荣耀推出了自研端侧70亿参数平台级AI大模型。 2023年刚刚宣布全面自研大模型的手机厂商,到了2024年转身就成为阿里、字节、百度的大模型手机合作商。从自研到开放第三方合作,本质是大模型上手机背后对于成本和性能平衡的考量。 一方面,在硬件性能方面,联发科无线通信事业部AI技术高级经理庄世荣此前曾透露:一款130亿参数的AI大模型,大概需要13GB内存才能运行,而智能手机本身运行安卓操作系统通常就要占用4GB的内存,如果还要相对流畅的运行其他常规APP任务并保活,还需要6GB的内存,即总的手机内存容量需求将达到23GB。 虽然从某种程度来说,直接增加内存这种方式最为简单,但其与技术、市场等因素的牵涉也并不少。目前主流的千元智能手机内存容量大多数都是在8GB/12GB左右,大多数旗舰智能手机的内存容量也才到16GB,仅有极少数旗舰手机内存容量达到了24GB。如何将其下放到2000元以下的产品价位,带来更大的市场换机需求,进一步突破硬件限制的云端大模型成为选择。 另一方面,大模型的落地是一项长期消耗成本、且暂时还无法停下的趋势,无论是服务器消耗的电力、相关研发等都需要持续的投入。算法交易公司Deep Trading就曾指出,ChatGPT4以1.8亿用户基数和每人100Ktoken/天计算,每日成本就高达88.2万美元。 此前vivo副总裁周围也曾透露,vivo大模型单次云端对话的成本约为0.012-0.015元,以2.5亿日活用户和每人10次/天的需求计算,每日成本也高达数千万元。毫无疑问,这样的成本支出也将成为手机厂商在大模型普及道路上的成本压力。 综合成本和性能多方面平衡下来,目前主流手机AI性能的实现路径,通常都采用端+云协同一体化的“组合拳”模式。 其中手机厂商所谓的自研AI大模型,主要集中于端侧大模型,主要特点是基于本地硬件终端部署AI训练模型,做到更快的性能响应,更好的数据隐私保护等。在云端大模型性能方面,则主要是通过和外部大模型厂商合作的方式落地。 从手机厂商对于第三方AI合作商的选择来看,接入多种模型是主流倾向。这不仅包括同家大模型公司的多样化的模型,也包括不同大模型公司的模型。比如,OPPO就使用了火山引擎的豆包通用模型pro、豆包通用模型lite、豆包·角色扮演模型等;而三星,则是将文心一言和豆包同时收入囊中。 这也符合当前大模型选择的一种理念,面对多样的业务类型与用户需求,单一大模型很难面面俱到,模型混用,在不同的场景应用具备不同擅长领域的模型更符合实际。 Part.3 各取所需的AI手机入局者 当主流手机厂商在成本和性能考量中优中选优,尽可能多的接入更多的大模型技术提供商,这也意味着百度、字节、阿里谁也不能成为某一家品牌的大模型独家供应商,对于长期平台经济惯性下的二选一、规模效应等互联网思维也将面临新的挑战。 一方面和硬件芯片合作商的模式不同,通常手机处理器高通、PC处理器英特尔芯片,可以为硬件产品提供技术背书。不过在AI技术能力方面,对于手机厂商而言,作为一款面向C端市场的品牌,比技术落地更紧要的是用户心智之争。 因此,在合作方式上,虽然各家AI手机尽可能的接入更多的第三方大模型,但是融合第三方百家大模型底层技术之长,自研多模态AI智能体是一个共识。最终对于消费者来说,能够有AI心智感知的只有小布、小爱等手机品牌的智能助手。 另一方面,在头部手机品牌庞大的用户基数下,大模型公司的压力也会自然增加,负担的算力成本可能会几何式提升。这部分成本能否转嫁给手机厂商并不好说,有迹可循的是苹果不会向大模型厂商支付费用。据媒体报道,至少在与OpenAI的合作中,苹果没有支付费用。 即使其他手机厂商和大模型服务商合作时,没有苹果这么大的主动权。但是各家AI功能的使用目前并未开启收费服务,这么免费用户的AI成本应该也不会只有手机厂商自己承担。有技术人士表示,更靠谱的方案可能使手机厂商和大模型服务商双方共担成本。 手机厂商挣不到AI服务费,挣得是用户心智,核心是在这一轮大模型竞赛中率先占据用户心智,打下将免费用户转化为付费用户的AI手机基础。 对百度、字节、阿里等大模型厂商来说,虽然卖铲人的身份并不会让其挣更多的钱,甚至随着接入更多的手机品牌压力,需要负担的算力成本也会大大提高。但是,当接入更多手机终端,进入更多用户手中,并且得到新的锤炼,这对于百度、阿里、字节等各个大模型厂商的产品而言,是很好的落地实践。 在这个合作过程中,一次次大模型的“硬件圈地运动”,大模型公司们也会在这个过程中拿到它们想要的,更多可以供模型训练使用的数据。 在无数手机用户见证下,这会是一场大模型领域真实的硬碰硬的较量,各个大模型的真实能力会更进一步“暴露在阳光下”,格局的重塑和市场的洗牌,也会加速到来。不管手机厂商还是大模型企业,都是一场各取所需的AI进程。
科技新知 科技新知

科技新知

07-19 18:58 · 科技领域研究达人

7款主流大模型实测:简单的数感测试全翻车

图片 实测strawberry中有2个字母“r”?不会比大小的大模型也几乎数不对数,数理能力差到惊人! @科技新知 原创 作者丨王思原 编辑丨赛柯 谁能想到,号称“超级大脑”的大模型,竟然在几道简单的数学题上败给了**。 近日,国内火热的音乐节目《歌手》中,孙楠与外国歌手的微小分数差异,引发了网友关于13.8%和13.11%谁大谁小的争论。 艾伦研究机构成员林禹臣将此问题抛给了ChatGPT-4o,但结果令人吃惊,最强大模型竟然在回答中给到了13.11比13.8更大的错误答案。 随后Scale AI的提示工程师莱利·古德赛德基于此灵感变换了问法,拷问了可能是目前最强的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪个更大?然而几家头部大模型的错误回答,也让该话题传播开来。 而面对如此简单的问题,国产大模型表现如何呢?为此,我们也对国内7款主流AIGC产品文心一言、通义千问、腾讯元宝、字节豆包、讯飞星火、智谱、Kimi进行了比小学数学更简单的“单词字母数识别”测试,结果令我们大吃一惊。 Part.1 7家大模型,几乎全翻车 首先我们向7款大模型产品询问同一个问题,“strawberry中有几个字母r”? 大模型新星Kimi,斩钉截铁且不加解释的表示有1个字母r,不过当我们再次询问时,Kimi竟打翻了自己第一次的错误答案,给到了第二个错误答案。再三追问后仍是没能给到正确答案。 图片 来源:科技新知(Kimi) 智谱AI旗下的智谱清言ChatCLM给到的也是错误答案。 图片 来源:科技新知(智谱清言) 科大讯飞的讯飞星火对话在回答这个问题的时候开启了联网搜索,给到一个错误答案后,还一本正经的告诉我们这2个r的位置。但可惜的是,星火对话给到的位置有一个也是错误的。 图片 来源:科技新知(讯飞星火) 不过也有表现不错的,百度的文心大模型将strawberry每个字母都进行了拆分,然后进行统计,给到了正确结果。 图片 来源:科技新知(文心大模型) 阿里旗下的通义千问在第一次回答中给到了一个错误答案,并且阐述的位置也是错误的,第二次虽然再次给出了错误答案,但其回答中识别到了3个字母r,只是一句“注意虽然 "rr" 是连续的,但它们仍然被计算为两个单独的字母。”让人摸不到头脑。 图片 来源:科技新知(通义千问) 于是我们追问了“为什么rr被计算为两个单独的字母”,通义千问竟然又否认了刚才的回答,称“在 "strawberry" 中,两个 "r" 字母可以影响周围音节的发音,但它们仍然是两个独立的字母。” 图片 来源:科技新知(通义千问) 腾讯元宝在回答这个问题时采用的是假设法,假设了字母“r”的数量为未知数x,然后通过查看单词“strawberry”并计数字母“r”得到x的值,最后给到的答案是正确的。 图片 来源:科技新知(腾讯元宝) 表现良好的还有字节豆包,直截了当的给出了正确答案,并且还举了两个例子来证明这个简单的问题难不倒它。但是,也是豆包的这两个例子出卖了它在识数能力上的问题。豆包称“car”这个单词只有1个“r”,“mirror”则有2个“r”,而“strawberry”比它们都多,有3个。 问题显而易见,“mirror”中有其实是有3个“r”,并非2个。于是我们又追问了一下“mirror中有几个字母r”,豆包给到的答案仍然是2个,并且又举了两个错误的例子,称“father”这个单词有2个“r”,而“orange”里面则一个“r”都没有。这多少让人认为豆包的正确回答有“蒙”的嫌疑。 图片 来源:科技新知(豆包) 通过这个简单的测试我们可以看到,7家大模型中有5家都有“不识数”的嫌疑,于是我们又将这个单词进行拆分成2个更简单的字母,测试这些大模型能否给到正确答案。 Part.2 拆分测试,揭露大模型逻辑短板 为了引导大模型,尽量使大模型给到正确答案,我们这部分将分为两个问题,一个是“str中含有几个字母r,berry中含有几个字母r,他们一共含有几个r?”,另一个是“那str和berry合在一起是strawberry,所以strawberry中含有几个字母r?” 不过,被寄予厚望的Kimi还是让我们失望了。将strawberry拆分成两个简单的单词后,Kimi仍没给到正确答案。 图片 来源:科技新知(Kimi) 同样,智谱清言在这一轮也没能给到正确答案。并且其给出的解释也与Kimi一致,都认为berry中有1个字母r,所以才导致strawberry中少了1个r。 图片 来源:科技新知(智谱清言) 有趣的是讯飞星火,当我们将单词分开提问时,星火对话能够给到正确的回答,并且识别到了berry中有2个字母r,不过看星火对话给的解释是将这两个字母当作字符串,用编程的方式来查找所得。但不管怎样,答案确实是正确的。 图片 来源:科技新知(讯飞星火) 而当我们认为讯飞星火又行了的时候,再次询问“那str和berry合在一起是strawberry,所以strawberry中含有几个字母r?”,但讯飞星火仍然给到的是错误答案。 图片 来源:科技新知(讯飞星火) 上一轮表现出色的文心大模型这次并没有给到正确答案,它与Kimi和智谱清言都认为“berry” 中有1个“r”,而追问两个单词合在一起有几个r后,文心也是给出了2个的错误答案。 图片 来源:科技新知(文心大模型) 通义千问这次的表现让人吃惊,不但准确的给出了答案,而且还给了代码级别的计算过程。 图片 来源:科技新知(通义千问) 当我们再次问strawberry中含有几个字母r时,通义千问也非常有逻辑的地告诉我们可以直接在 "strawberry" 中查找 "r" 的出现次数,而不必依赖于之前的组合。 图片 来源:科技新知(通义千问) 腾讯元宝的表现也足够稳定,简单迅速的给到了正确答案。 图片 来源:科技新知(腾讯元宝) 豆包在这一轮也给到的正确答案,但喜欢举例的豆包,再次举了一个错误案例。所以其数数字的水平和逻辑到底怎样,仍是未知。 图片 来源:科技新知(豆包) 两轮简单的小测试下来,7家国产大模型只有1家表现稳定,其他6家均出现了不同程度的错误,这到底是怎么回事呢? Part.3 数学不好,本质是能力问题 这类大模型说胡话的现象,在业界被称为大模型出现幻觉。 此前,哈尔滨工业大学和华为的研究团队发表的综述论文认为,模型产生幻觉的三大来源:数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式,如位置接近性、共现统计数据和相关文档计数,从而导致幻觉。此外,大模型还可能会出现长尾知识回忆不足、难以应对复杂推理的情况。 一位算法工程师认为,生成式的语言模型更像文科生而不是理科生。实际上语言模型在这样的数据训练过程中学到的是相关性,使得AI在文字创作上达到人类平均水平,而数学推理更需要的是因果性,数学是高度抽象和逻辑驱动的,与语言模型处理的语言数据在本质上有所不同。这意味着大模型要学好数学,除了学习世界知识外,还应该有思维的训练,从而具备推理演绎能力。 图片 不过中国社科院新闻与传播研究所所长胡正荣也指出,大模型虽然是语言模型,但这个语言不是人们通常理解的字面意思,音频、解题等都是大模型可以做的。从理论上看,数学大模型这个技术方向是可行的,但最终结果如何,取决于两个因素,一是算法是不是足够好,二是是否有足够量的数据做支撑。“如果大模型的算法不够聪明,不是真正的数学思维,也会影响到答题的正确率。” 其实对于大模型来说,对自然语言的理解是基础。很多数理化的专业知识并不是大模型的强项,并且很多大模型是利用搜索把之前已有的解题的经验和知识的推理相结合,可以理解为在搜索内容上进行理解,如果搜索内容本就是错误的,那么大模型给到的结果必然错误。 值得一提的是,大模型的复杂推理能力尤为重要,这关乎可靠性和准确性,是大模型在金融、工业等场景落地需要的关键能力。现在很多大模型的应用场景是客服、聊天等等,在聊天场景一本正经胡说八道影响不太大,但它很难在非常严肃的商业场合去落地。 随着技术的进步和算法的优化,我们期待大模型能够在更多领域发挥其潜力,为人类社会带来更多实际价值。但通过这次对国内主流大模型的简单测试,也警示我们,在依赖大模型进行决策时,必须保持谨慎,充分认识到其局限性,并在关键领域加强人工审核和干预,确保结果的准确性和可靠性。毕竟,技术的最终目的是服务于人,而不是取代人的思考和判断。
科技新知 科技新知

科技新知

07-18 09:48 · 科技领域研究达人

咪咕、抖快、腾讯的奥运流量战

体育的本质是和平年代的战争,是国与国之间综合实力的较量,是全球品牌抢占眼球的比拼,更是互联网各类平台之间,对于一整块流量蛋糕的瓜分。 从2021年的东京奥运会开始,2022年的北京冬奥会、卡塔尔世界杯,2023年的杭州亚运会,无缝衔接般地对国内市场上的实体品牌、虚拟平台完成了体育营销的教育,也带来了体育流量的震撼。 中央广播电视总台官方数据显示,在2021年的东京奥运会开幕后,CCTV5作为奥运主播出频道,收视份额一路走高,与2016年的里约奥运会同期均值相比涨幅达20%。短视频平台快手也在那一年抓住时机,拿到了视频点播和短视频内容版权,比抖音的二创内容快上了一步。 2024年的巴黎奥运会早在三个月前的百天倒计时之际,品牌和平台的造势就已启动。微博、小红书等社交媒体上相关词条登上热榜,奇瑞、伊利也分别用签约运动员、赞助代表团等形式打响奥运营销的第一枪。 内容平台的版权之争则在上个月中旬打响,中央广播电视总台的奥运转播权分销方终于揭晓,咪咕视频和抖音、快手分别成为长、短视频平台中的持权转播商。随后,腾讯又单独官宣与总台达成合作意向,可通过旗下腾讯视频、腾讯体育、微信、腾讯新闻、腾讯网、QQ、QQ浏览器、微视等渠道,观看点播、短视频内容,以及自制节目。 作为中国移动旗下的长视频平台,咪咕的分销版权级别一如既往地最高,包括了实时转播、延时转播、回放点播等功能。也就是说和东京奥运会时一样,移动网络平台上收看直播的合法渠道只有央视旗下的央视频APP和咪咕视频APP。 最高级别的分销版权,就意味着高昂的授权费用。近乎垄断式的直播渠道的确能在赛事期间带来全网独家的流量,甚至会在其他平台、社区产生二次传播后,再逆流汇聚到咪咕平台上。但鉴于咪咕打造多年的专业体育赛事视频平台的形象,真正的体育运动爱好者早已知晓其名,更多被奥运期间的民族情怀或运动员粉丝吸引过来的用户,大部分也会在奥运结束后快速地流失。 从官宣措辞上看,抖音、快手与腾讯所付费购买的分销版权级别一致,皆是赛事点播和短视频内容,以及自制的相关节目。腾讯以集团业务打包的形式达成合作意向,显然是把短视频内容留给了微信里的视频号,而把自制节目放在了拥有内容制作能力的长视频平台腾讯视频。 快手曾在东京奥运会期间出尽了风头,相关作品及话题视频总播放量达到了730亿,还带动平台上电商业务的整体消费人数同比增长63.2%,GMV同比增长88%。体育流量的甘甜,自然吸引到明明比快手月活用户更广的抖音。相比上一届奥运期间,只能与B站跟在快手后边拾人牙慧剪辑二创,抖音定然会要不计成本地把此前错过的再夺回来。 付出真金白银拿到版权,还只是一个开始。如何利用版权搭配上自家平台的特性,卖出更多更贵的赞助权益,只是这几家内容平台用来对冲高昂版权费用的第一步;另一边还要警惕,那些没有版权的微博、B站、小红书、知乎等社区平台,凭借浓厚的话题氛围,分食奥运蛋糕上点缀的水果。这场流量战争的硝烟还未四起,火药味却已很浓。 从2008年的北京奥运会之后,奥运会经济学的失灵之势渐显,甚至会成为举办国的一个实体负担;也正是从那个腾讯、网易、搜狐、新浪四大门户网站的鼎盛年代起,奥运会的线上经济效益不断带来震撼。 当年的AC尼尔森调研发现,四大门户占据了北京奥运报道八成的网络流量,它们那一年第二季度的广告收入,全部创下历史新高,第三季度的总收入还首次突破1亿美元。 如今经过伦敦、里约热内卢、东京的洗礼,巴黎奥运会告别了长视频时代的辉煌,投入了短视频的怀抱。而刚刚站上C位的抖音、快手、视频号,要算的也不是简单的买版权拉赞助的加减法,更要把心思放在长尾效应下的明星运动员入驻、品牌商GMV转化,以及内容调性的用户心智争夺战上。
科技新知 科技新知

科技新知

07-17 10:51 · 科技领域研究达人

米哈游,越像腾讯、越难超腾讯

《绝区零》套路化的产品模式,让米哈游大受玩家诟病;超越网易、面对腾讯,缺乏产品力的米哈游在圈钱和玩家上面临着艰难的选择。 @科技新知 原创 作者丨茯神 编辑丨赛柯 想要超越腾讯,就要先成为腾讯?米哈游备受业内外瞩目的新作《绝区零》正式登场亮相,全无四年之前《原神》问世时的惊艳,反倒被人诟病,像极了“企鹅圈钱”的样子。 7月4日,《绝区零》开服后不久, “原味过浓”、“赶工半成品”、“玩法无聊单一” 等评价关键词登上热搜。这与公测之前拿下全球超过4700万预约量的天花板成绩,形成犹如云泥之别的反差。 移动端开放预下载期间,《绝区零》曾登顶超138个国家和地区的苹果App Store游戏免费榜,包括北美、日本等多个核心海外市场,可见米哈游这块金字招牌,承载了全球玩家群体多么大的期望。 可天不遂人愿,《绝区零》上线后呈现出的游戏品质没能满足广大玩家的胃口。国内最大的第三方手游社区TapTap上,《绝区零》上线后的评分从之前的9分一度下跌至5.4分;二次元视频社区B站里,PC端评分也远低于移动端,降至及格线以下的5.3分。 水军、反串、商战等阴谋论之说,不能完全排除可能性,但《绝区零》没能复刻《原神》,甚至是《崩坏:星穹铁道》(下称《星铁》)的口碑也是事实,不禁让外界产生对米哈游产品力的质疑。 据Data.ai统计的2023年全球游戏发行商收入中,米哈游成功超越网易位列世界第四,来到了国内最后一座大山——腾讯面前。可在商业经营上创造了奇迹的米哈游, 到底是理解腾讯成为腾讯,以其之道翻越高山?还是回归游戏初心,把玩家重新放在首位? Part.1 二次元养大的屠龙少年 国内游戏圈近年崛起的上海四小龙——米哈游、莉莉丝、叠纸、鹰角,一度被认为是最有可能颠覆行业格局的种子选手,除了莉莉丝的其他三家,都有着浓厚的二次元基因。 米哈游作为种子中的种子,真正露出王者气息的时刻,还要追溯到四年前《原神》的一鸣惊人。《原神》于2020 年 9 月 28 日开启多端( PlayStation、GeForce Now、Android、Windows、iOS)公测,连续三年获得 TGA(游戏界奥斯卡)“最佳移动端游戏”和“最佳持续运营游戏”提名,并斩获2021 年最佳手游。 全球级别专业奖项的折桂,让米哈游在玩家群体的认知中,从只会挣钱的手游公司,晋升为力研大作的游戏厂商。更为关键的是,《原神》在投入巨大、作品质量上乘的情况下,商业层面的成功也一举追上了两位业界巨头腾讯和网易的水平。 统计数据显示,2020年《原神》全渠道营收额高达85亿元,仅用三个月的时间,就给米哈游贡献了全年超过80%的营收。米哈游这一年的净利润增长47.4亿元,水平仅次于腾讯和网易,增幅高达474.51%。 比腾讯和网易更加出色的是,米哈游的出海之路一骑绝尘。有海外第三方机构统计显示,2022 年《原神》营收结构中,国内玩家贡献占比 34.3%;而以日、美、韩为主的海外市场,贡献占比分别是23.3%、16.5%、6.2%,国内外的比例基本维持在 1比2。排除统计渠道干扰因素,业内也公认《原神》的收入来源,海内外占比至少处于持平的状态。 《原神》的奇迹甚至出乎几位创始人的预料,他们的起家核心IP本来是《崩坏》系列,且直到第三代作品乘上国内二次元的东风,才算站稳脚跟。米哈游还曾在2017年谋求上市,计划募资12.22亿元,但由于彼时依赖单一IP被视为严重风险未能如愿,最终在《原神》推出的2020年主动撤回了申请。 “财富密码”很快被米哈游总结为,套上不同类型战斗玩法的二次元角色养成游戏。不管是《原神》,还是后续口碑依然不错的《星铁》,以及新推出颇受争议的《绝区零》,本质上都是弱社交的单机游戏。核心的战斗系统,看似涵盖了RPG、回合制、ACT动作等各种类型,但付费点却出奇地统一,那就是抽取不断更新的新角色和角色专属的新武器。《星铁》的制作人,就曾明确表示,产品的立项思路是做一款“可以玩的动画番剧”,给用户像追剧一样的体验。 从《原神》和《星铁》的流水表现来看,每当有抓住二次元用户“XP”(喜爱点)的新人物卡池推出,当期就会在各大渠道的付费榜单上排位登顶。只不过这两者的游戏类型受众,本身就对战斗玩法的差异性不太敏感。 而到了ACT动作类型的《绝区零》,宣发策略上又找来了该品类的经典IP《街霸》系列团队站台,拉高了传统动作类型游戏玩家群体的期待,最终上线后才酿成了现实落差过大的舆论漩涡。 但值得思考的是,米哈游如今套路化的产品思路,连上三道大餐后,到底是会被玩家们吃腻离席,还是继续复制下去,成为一台比腾讯更加赚钱的机器? Part.2 腾讯也掉入过舒适区 纵然是从四小龙中脱颖而出,又马不停蹄地与网易并驾齐驱,米哈游距离腾讯还是横亘着只能望其项背的天堑。 米哈游最近一次公开的财务数据,是《光明日报》曾经报道过的2022年营业收入273.4亿,净利润161.45亿。有第三方媒体观察估计,2023年米哈游旗下所有游戏的流水,总共大约突破了500亿,较2022年流水增长约150亿。而根据腾讯集团公布的财报来看,其网络游戏业务在2023年实现了1799亿元的营收,同比增长了5.3%,可能相当于五个米哈游的体量。 毕竟,哪怕是从2011年在上海交大的宿舍内开始创业算起,米哈游也只走过了腾讯游戏霸主之路一半的时间历程。二十年前,后者就已经找到了自己的“财富密码”。 凭借着PC时代即时通讯工具QQ的普及,腾讯独一无二的流量优势在手,天赋技能全点在了渠道运营和代理宣发上,自研游戏基本上是以“换皮复刻”为主。 当时的游戏市场上,休闲类的《泡泡堂》《劲舞团》《跑跑卡丁车》等轻游戏深受第一代网络用户喜爱,腾讯就立刻照猫画虎,推出了自己的《QQ堂》《QQ炫舞》《QQ飞车》,甚至依托QQ客户端的强大分发能力,把原作厂商挤到了生死线边缘。只有坚持自研MMORPG等抄袭门槛较高的大型游戏厂商,如网易、完美世界等,才走出了那一段来自腾讯的阴影。 休闲轻游戏推广容易,玩家忠诚度却不高。为了弥补自研能力的不足,腾讯游戏很快走上了另一条捷径——海外代理。来自韩国游戏厂商的《穿越火线》《地下城与勇士》,以及后来美国拳头公司的电竞大作《英雄联盟》等,都倒在QQ的流量诱惑之下,也奠定了今日游戏龙头的崛起。 到了移动互联网时代,腾讯游戏的这个流量舒适区由于微信的加入,非但没有萎缩而是急剧膨胀,迅速滋养出借鉴了《英雄联盟》核心玩法的《王者荣耀》,以及脱胎于韩国蓝洞旗下《绝地求生》的《和平精英》,二者如今仍是腾讯游戏大厦不可或缺的双支柱。 舒适区同样会带来“富贵病”。腾讯游戏自研能力差和抄袭黑历史,一直在玩家群体中口碑低下;公司内部奉行的“赛马”机制更是养成了唯数据、流水说话的价值观导向,最终导致了二次元风口的踏空。 在《原神》给业界带来震撼之后,2021年腾讯负责游戏的IEG事业群进行了大刀阔斧的组织架构调整。但从2023年底《元梦之星》的又一次失利来看,马化腾的公开不满原来已是到了忍无可忍的地步。 就像腾讯当年掉入流量舒适区埋下隐患一样,今天掉入二次元舒适区的米哈游,可能也正在给自己挖坑。 Part.3 要用户,还是要玩家? 腾讯游戏背负的“抄袭”骂名,如附骨之疽,其实是来自于流量的反噬;米哈游的二次元生意蒸蒸日上,同样免不了物极必反的循环。 二次元用户的高忠诚度、强消费能力,依托于对动漫或是游戏中的虚拟角色或人物的情感寄托。日本作为全球二次元文化的中兴之地,其国内许多宅男消费者,甚至会把二次元人物当作现实中的女友对待。 2021年3月,米哈游旗下的《崩坏3》在国际服三周年的宣传视频中,制作了女性角色“符华”在赌场里穿着兔女郎装扮跳艳舞的内容。此举受到国内玩家的一致口诛笔伐,认为米哈游在刻意讨好国外用户,不惜打破作品中角色一贯的高冷人设。 相当数量的《崩坏3》玩家通过卸载客户端、永久损毁账号内虚拟道具等方式发泄不满,一度影响到游戏流水。米哈游最终于一个月后发布道歉声明,并承诺下架争议内容,还补偿给玩家280元等值的游戏道具。 类似的群体玩家抗议事件,还发生在今年的1月。2024年春节前夕,作为节日福利的一部分,《原神》在版本前瞻直播中按照往年惯例,送给每位玩家价值48元的三颗纠缠之缘。 不成想,玩家们并不买账。从1月末开始,《原神》的官方抖音和B站号开始出现大量粉丝取关的情况,其中抖音平台上粉丝数量短期内快速掉去300万之多,一时间“原神掉粉”的关键词冲上了微博热搜。 玩家们的怨气,可以总结为《原神》在2023年里游戏质量下滑、剧情注水严重、毫不在乎社区反馈等多个方面,而这些或许也跟米哈游在2023年4月推出《星铁》后,内部资源倾斜上有所偏重相关。 这所暴露出来的问题,与腾讯内部的“赛马”机制雷同。新作表现数据优异,往往会得到更多的资源匹配。刚刚上线的《绝区零》在米哈游内部立项时,也只不过是十几个人的小团队,最终呈现出的游戏品质,除了没达到专业玩家群体预期的战斗设计以外,收费和养成元素几乎照搬了《原神》和《星铁》。 然而,这种可能学自互联网大厂“小步快跑”试错迭代的产品思路,放到被称为第九艺术的游戏作品当中,收获的或许是一个又一个低成本高回报的短期用户,但丢掉的恰是一个又一个玩家寄予的长期信心。 当曾经陪伴一起成长的二次元玩家们,越来越难“伺候”了,米哈游似乎正在选择与他们保持距离。 早年在《崩坏2》时期,创始人之一的刘伟,还经常在贴吧与社区玩家高强度互动,发长文回应质疑;而在《原神》成功之后,另外一个核心创始人蔡浩宇,已于去年9月宣布退休,不再担任米哈游多个主体的法人、董事,后续甚至退出了员工的持股平台。 游戏巨头并非没有走下神坛的先例。曾经“出品必属精品”的暴雪,在与动视合并后屈服于资本的诉求自毁长城,再也得不到玩家尊重和市场认可。米哈游在距离腾讯还有五个身位之际,就已抱不住初心,抛弃玩家的下一步,大概率就是被市场抛弃。
科技新知 科技新知

科技新知

07-12 22:13 · 科技领域研究达人

如祺出行难圆自动驾驶梦

缺流量少技术,如祺出行的自动驾驶没有发动机。 @科技新知 原创 作者丨古廿 编辑丨赛柯 中国自动驾驶市场正在上演双重奏 一边是百度领涨自动驾驶产业链板块,主要受益于有分析师称,百度旗下自动驾驶网约车平台萝卜快跑有望短期实现盈利,跑通商业模式的营收平衡。同时叠加全国各地释放的自动驾驶网约车上路利好政策,百度烧钱多年的自动驾驶故事也堪称熬出了头。 另一边7月10日香港市场的“自动驾驶运营第一股”如祺出行成功敲钟,但是在股价表现上并没有吃到自动驾驶的概念红利,开盘30港元的股价,相比35港元的发售价,可谓开盘即破发。 虽然之后股价有所回升,但是相较于百度的萝卜快跑,如祺出行的自动驾驶新故事,似乎并不能掩盖地方性网约车服务平台的业务本质。 招股书显示,从业务情况来看,如祺出行的业务主要分布在大湾区。按2023年交易额计算,如祺出行的出行服务在大湾区排名第二,市场份额为5.6%。另外,其在大湾区的用户渗透率超过45%,排名第二仅次于滴滴。 不过这个第二名的含金量并不高,在市场份额方面,即使在大湾区这个大本营,如祺出行5.6%的市占率相比滴滴的56.5%,可谓第二名和第一名有着天壤之别。放到全国市场上,2023年滴滴的市占率为75.5%,如祺出行只有1.1%。 这样的数据,也说明一个问题,地方性网约车平台不仅在全国性竞争上劣势巨大,即使放眼扎根很深的本土市场也难形成差异性优势,基本不存在舒适区,顶多算一个运力多元化的补充。 既然难称平台,那么作为运力补充,如祺出行就得交过路费。在招股书中这笔费用被称为“第三方出行服务平台的服务成本”,主要是给高德、美团等聚合打车平台的流量入口费。数据显示,这项成本开支增长很快,从2021年的占比0.5%飙升到了2023年的4.1%。 增长的主要原因是,如祺出行在聚合平台收获了更多的订单量。从消费者打车角度来看,很少有人会特意搜索一家地方性网约车平台打车,如祺出行的订单量更多来自流量聚合平台的运力调配。 网约车的生意不好做,发力自动驾驶的新模式,就成为如祺出行押注的主要方向。 在招股书中,如祺出行表示此次IPO所募资金用途,包括Robotaxi在内的自动驾驶运营研发相关资金将占到40%,用于现有网约车业务的地域、用户扩张等提升市场份额的资金占用,仅有20%。 不过即便在募资金额分配方面,对于自动驾驶进行侧重性投入,但是如祺出行的自动驾驶故事也颇多困难。 一个是在自动驾驶技术方面,相较于萝卜快跑主要基于百度自动驾驶的技术自研,通过和汽车厂商合作在全国范围内进行运力铺开。如祺出行则是通过引入更多的外部自动驾驶服务商加入为主。 2021年,如祺出行先后接受了头部自动驾驶公司文远知行与小马智行的一系列投资,之后又宣布两家公司的自动驾驶车型接入如祺出行平台,进行商业化运营。同时在此基础上研发开放式的自动驾驶运营平台,用以接入不同技术和厂家的自动驾驶车型。 根据市场不完全统计,如祺出行应该是国内接入不同自动驾驶服务商最多的共享出行平台。和萝卜快跑主要是自研自动驾驶技术,布局自有运力的模式不同,在自动驾驶技术方面没有长期深耕的如祺出行,更想成为自动驾驶技术服务商的代理人。 另一个是在流量方面,想要做成自动驾驶服务商的代理人生意,除了车辆运营能力之外,更为重要的是要拥有能够触达C端市场消费者的流量入口。然而,如祺出行自身尚且都还缺乏全国性、平台级的流量,就连其主营业务传统网约车,都需要接入外部聚合平台。 没有流量优势,没有技术积累,如祺出行的自动驾驶故事,可谓是两手空空。相比拥有百度技术和流量的萝卜快跑,作为自动驾驶代理人,目前如祺出行唯一的优势,或许是凭借先发优势,成为国内接入不同自动驾驶服务商数量最多的平台。 不过,想要成为万亿自动驾驶市场的有力竞争者,仅靠先发优势是远远不够的。背靠着大湾区,如祺出行能否拿出更多的新手段、新模式,也是远远比所谓的自动驾驶第一股这种称号更为关键的事情。
科技新知 科技新知

科技新知

07-11 11:23 · 科技领域研究达人

搅局万亿市场,萝卜快跑们仍需缓行

规模化放大落地缺陷,抢食网约车市场的萝卜快跑们,尚未踩上自动驾驶的高速档。 @科技新知 原创 作者丨古廿 编辑丨赛柯 这个月,自动驾驶正在中国抢走大模型的风头。作为全球聚焦的人工智能行业盛会,在WAIC 2024召开期间,9位图灵奖、菲尔兹奖、诺贝尔奖得主和88位国内外院士携手参会,500多家知名企业带来1500项展品,并有50多款产品首发。AI大模型、人形机器人等热点层出不穷。 不过相比这些热点往往是对于未来的技术想象力,无人驾驶出租车随着百度宣布将在武汉再投入1000辆自动驾驶运营车,2024年有望实现商业化营收平衡,把科技拉近到现实的速度,使这一热点破圈传播,成为社会话题。 一面是司机们诟病无人驾驶出租车抢了养家糊口的生计,一面是出行成本上萝卜快跑出租车的高性价比。如果说2022年ChatGPT的使用体验,让人们一时调侃人工智能没有取代体力劳动,而是最先发起脑力革命。那么眼下,仅一年时间,无人驾驶行业的快速发展,也让体力劳动难以成为职业舒适区。 需要拥抱变化的不仅是个人,对于一家企业,一座城市来说同样如此。自动驾驶的时代浪潮中,每个裹挟其中的组织,在未到达全新的自动驾驶新交通彼岸之前,所有的产业升级和洗牌都将机遇和危机并存。 Part.1 画出更大的自动驾驶圈 城市竞赛,正在成为自动驾驶加速跑的浪头。 过去,作为一项交通科技创新项目,各大城市争抢的往往是首批试点,发放了多少自动驾驶牌照,抢的是自动驾驶的发令枪。不过当自动驾驶走出试验区,向规模化、商业化落地迈进正在成为当下城市竞赛的焦点。 先是截至到2023年底,根据数据显示,武汉全市累计开放测试道路里程已突破3378.73公里,覆盖12个行政区,辐射面积约3000平方公里,触达人口超770万。凭借这样的数据表现,武汉拿下开放里程和开放区域数量全国第一的同时,也成为全球最大的自动驾驶出行服务区。 不过想要坐稳这个自动驾驶第一城的位置并不容易,更激烈的赛程如期而至。 今年以来,多个城市先后为自动驾驶画出更大的测试区域。浙江杭州开放八城区3474平方公里作为智能网联车辆测试应用区域,占全市面积超20%;广东深圳公布新增43条道路,使全市自动驾驶开放道路里程达944公里;北京开放首个高铁站自动驾驶测试,明确北京经开区往返北京南站自动驾驶测试范围。 画出更大的自动驾驶面积之外,竞跑无人驾驶规模化落地之外。在无人驾驶企业的商业化和最新的交通制度上,各地也进一步明确和升级。 先是上海在2024世界人工智能大会期间,发放首批无驾驶人智能网联汽车示范应用许可,业界普遍认为,示范许可是自动驾驶商业化的关键一步,自动驾驶汽车未来将按照正常车辆进行目录管理。这也就意味着,自动驾驶汽车将从临时车牌换成正式车牌。 如果说无人驾驶在上海从实习生转正为老司机,那么在北京无人驾驶则是正在成为责任主体。 在近期北京面向社会公开征求意见的《北京市自动驾驶汽车条例(征求意见稿)》中,对“自动驾驶事故处理和责任划分”这一外界最为关注的话题,做出明确规定。 具体来说,自动驾驶汽车上道路行驶期间发生交通违法行为的,由公安交管部门按照现行道路交通安全法律、法规进行处理和认定。内有驾驶人的,依法对驾驶人进行处理;车内无驾驶人的,对车辆所有人、管理人进行处理。 企业需按照国家有关规定配备驾驶人或远程安全员,在必要时及时接管自动驾驶汽车、并采取必要的安全措施。如发生交通事故,在自动驾驶状态下,属于自动驾驶汽车一方责任的,由车辆所有人、管理人承担赔偿责任。 这也意味着,在无人驾驶激活行驶状态下,交通事故的责任方就是自动驾驶服务商或者管理人,为无人驾驶的安全性和上路进一步完善了城市交通制度。 Part.2 更少的实力玩家 城市管理在为自动驾驶规模化落地铺路,不过想要跑在这条自动驾驶的道路上并不容易。 根据公开市场统计显示,中国新增自动驾驶企业数量锐减,从2022年开始新增企业数量较前几年拦腰砍半,2023年更是被称为自动驾驶的寒冬。 有媒体统计2023年上半年,有19起与自动驾驶相关的高层人事变动事件发生,其中16起涉及离职。人事变动和调整涉及的公司从图森未来、Momenta、小马智行等自动驾驶技术公司到百度、华为、阿里这样的互联网公司,以及小鹏、理想等车企。 彼时对于这场寒冬,业内人士普遍认为是融资环境变差,难以商业化的自动驾驶故事遇冷。 根据21 tech不完全统计,2022年全年,国内自动驾驶行业总共发生投资事件126起,累计披露的融资金额超过200亿元人民币。而2021年,国内总共发生的投资事件超140起,累计披露的融资金额超过850亿元人民币。 其中,专注于拿掉驾驶人员的L4、L5级别自动驾驶企业成为被一级市场抛弃的重灾区。不少自动驾驶厂商也被迫放弃代表星辰大海的完全无人驾驶,开始瞄准自动泊车、高速自动巡航等细分模块,携手汽车厂先活下去。 不过寒冬下的自动驾驶玩家出清,也在为2024年的无人驾驶出租车平台酝酿机遇。当面向C端消费者的完全无人驾驶难以实现,在B端市场的无人驾驶车队运营服务商,开始成为自动驾驶技术企业实现商业化最近的一条路。 相比自动驾驶行业的裁员,高管离职不那么引人注意的是,2023年的上海WAIC大会期间,百度智行、AutoX安途、小马智行等三家企业15辆车获得浦东新区首批发放的无驾驶人智能网联汽车道路测试牌照。 此次无驾驶人智能网联汽车从封闭道路走向开放道路,并从有安全员的状态转变为完全无人化。当日百度智行、小马智行、AutoX安途三家企业获证车辆就在金桥测试区第一批开放道路重点路段进行测试,自动驾驶车辆全程2.7公里,耗时约15分钟。 眼下,在上海的第二批自动驾驶转正玩家中,有三家依然是上一次发放测试牌照的企业。更大的面积下更少的玩家之下,对于萝卜快跑,小马智行等行业探路者来说,如何在踩坑中长期活下去将是比竞争更重要的事情。 Part.3 加速跑向下一个坎 不可否认全国加速的自动驾驶城市大规模落地和商业化,将重新激活自动驾驶市场的活力,但是技术创新发展中该踩的坑一个也不会少。 对于百度、小马智行等企业来说,如果说过去是在寻求一个技术和商业模式的契合点,让自动驾驶业务实现商业闭环,解决活下去的问题。那么开启大规模落地趋势下,如何一边加速跑,又一边稳住重心避免成为市场的“先驱者”,就是眼下更为紧要的事情。 几乎和百度宣布再投入1000辆无人运营车进入武汉市场的同时,一个百度无人运营车萝卜快跑撞倒行人的短视频,也在各大社交媒体广泛传播。备受关注的主要原因是,发生交通事故的车辆是无人驾驶。 事后百度回应称,事故发生在绿灯亮起、车辆启动之际,发生后百度立即配合警方进行处置,并陪同受伤行人前往医院进行检查。经检查,行人无明显外伤,目前正在医院进一步观察和休息。根据公开市场报道显示,这是萝卜快跑首例撞倒行人事件。 毫无疑问,当投入市场的无人驾驶运营车辆多了起来,数量规模之下无人驾驶的缺点也将被放大。从活下来到活得好,中国自动驾驶也将加速来到下一个坎,人和技术创新性的容忍度问题。 此前,在美国不少自动驾驶服务商就曾一位内撞人事故频发,落地速度被进一步限制。 比如去年秋天,通用汽车的Cruise机器人出租车服务停止了在美国的服务,原因是该公司的一辆汽车在旧金山撞倒并拖拽了一名被人类司机撞到车道上的行人。加州监管机构随后吊销了该公司的州执照。Cruise已在凤凰城恢复了有限的测试。 前身是谷歌自动驾驶汽车部门的Waymo公司,目前正在凤凰城郊区和旧金山测试200多辆自动驾驶汽车,在洛杉矶和得克萨斯州奥斯汀测试近50辆。上个月,联邦监管机构两次通知Waymo正在审查其安全性。 两年前,福特和大众关闭了他们的机器人出租车合资企业Argo AI,但两家公司仍在开发先进的辅助驾驶系统。 在中国自动驾驶加速驶向规模化的时代,萝卜快跑,小马智行等自动驾驶的探路者,如何在不断的调整变化中,持续迈过更多的坎,到达自动驾驶竞赛的终点,也决定了能否吃到最大的技术红利。 从“活下来”到“活得好”“活得久”,全球自动驾驶服务商都会面临的人和技术创新性的容忍度问题,同样也是中国自动驾驶服务商大规模落地必然将要遭遇的下一道坎。 正如用来描绘新技术发展周期的曲线——Gartner 曲线所示,诸多技术创新诞生之时,往往伴随着极度的乐观与悲观。跌入谷底,并非意味着彻底消亡;站上巅峰,也不代表着永远增长。 任何一项新事物、新技术,通常先是迅猛发展、上升,抵达巅峰后下滑跌入谷底。当人们对其了解逐渐深入,便会发现还有众多未知问题需要解决,此后开始缓慢复苏,并“回归理性”增长。想要吃上万亿自动驾驶的新红利,萝卜快跑们的心还急不得。
科技新知 科技新知

科技新知

07-10 10:21 · 科技领域研究达人

这届AI厂家,同质下同焦虑

从概念到落地,虽然技术依旧在快速迭代,但市场新鲜感早已不在。 @科技新知 原创 作者丨王思原 编辑丨赛柯 这届WAIC世界人工智能大会上,每家AI企业似乎都找了自己的PMF(产品市场契合点)。 2023年是国产大模型元年,腾讯、字节、百度等众多大模型进入市场,正式开启对外服务,月之暗面、智谱AI等创业公司也形成“五小虎”的格局。迭代发展一年后,大模型选手们都已走向台前,给了AI行业更多的机会和答案。 不同于去年大模型的“重在参与”,今年WAIC的重头戏聚焦在更实际的应用、更颠覆性的技术和更普惠的模型。简单来说,往年 WAIC 上厂商们是大模型性能展示和比拼,如今更聚焦的向行业展示实际的最新落地成果和应用方向,比的是大模型落地能力。 从百度、阿里、腾讯,到商汤、智谱、百川、Minimax,从参数到技术,从多模态到端云协同,从价格到应用落地,各家在大模型的方向上似乎愈加清晰,也愈加务实。 而透过本次WAIC大会,一个对于整个行业都较为清晰的信号则是,虽然技术依旧青涩,焦虑也依然存在,但一个个在产业侧落地的AI应用的确在真实地发生,只是聚光灯之外,这些AI加持下的产品应用也没想象中那么亮眼。 Part.1 AI应用“卷上”舞台 如果说去年的WAIC是企业的狂欢,那么今年的WAIC便是用户的狂欢。 从远离用户的模型层面来看,除了字节、月之暗面、零一万物等主要面对C端市场的企业缺席外,其余中国Tier 1与Tier 2的大模型团队几乎全部到场展出,包括BAT、智谱AI、面壁智能、百川智能、阶跃星辰等等;但除此之外,会内会外也再无新增的中国大模型公司。而WAIC官方披露的的八大“镇馆之宝”中,模型层成果只占1/4。 而应用层,阿里云、华为云、无问芯穹、壁仞、遂原等中国企业不断展出围绕大模型训练与推理的新成果,AI模型在千行百业的应用也呈现愈加井喷之势。 例如阿里不光展示了智能编码助手“通义灵码”,更是通过“通义十二时辰——体验AI助手陪伴的一天”,全方位通义千问大模型背后的对话、效率、智能体、视觉四大核心能力,让用户感知AI助手在生活、学习和工作中的实际作用。此外,钉钉和支付宝在办公以及生活助手场景下,也是阿里AI能力落地上的重要一面。 腾讯的元宝APP覆盖工作提效、生活娱乐两大场景,除了提供AI搜索、AI总结、AI写作等核心功能,还提供创意绘画、口语陪练、百变AI头像等有趣好玩的特色应用,以及更多用户创建的智能体。 商汤展示了可控人物视频生成大模型Vimi,Vimi基于商汤日日新大模型的强大能力,仅通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。 类似提高效率的落地应用还有许多,从金山办公的WPS AI,到智谱AI的数字人直播平台,再到集体亮相的十八金刚人形机器人等等,涵盖医疗、教育、办公等各个场景,并且这些应用不再是概念性的演示,而是已经深入到了各行各业的核心业务流程之中,成为了提高效率、降低成本、创造价值的关键驱动力。 从技术竞赛到应用落地的全面进化,无论是一线科技巨头BAT(百度、阿里巴巴、腾讯),还是智谱AI、百川智能、阶跃星辰、商汤等二线厂商,都将目光投向了AI的实际应用与商业化成果,而非仅仅局限于模型性能的展示。但繁荣的同时,同质化问题也逐渐显露。 Part.2 路线割裂,产品却一致 一个事实是,AI应用的落地要比预想的更快、更深,范围更广,只是从结果上来看,无论是发展逻辑、路线,以及用户对产品的预期都有一定出入。 先说各家商业模式上的路线,百度的CEO李彦宏这段时间,甚至在WAIC现场都还在反复强调,商业化的闭源模型是最能打的;而隔壁的阿里云则是在力挺开源,至于另一家腾讯,则喊着“通用大模型不是模型应用的唯一方向”。 大厂都做不到路线统一,小厂更是五花八门。智谱AI走B端路线,用户群体却是C端;百川智能将企业应用的MaaS化产品作为重点展品;MiniMax同时坚持To B与To C业务并重的发展策略。 研发方向的不同,也意味着各家都有不同的顾虑。例如腾讯,腾讯在大模型上发布上算是慢了一步,但根据腾讯混元大模型负责人刘煜宏最新透露,腾讯内部有接近700个业务接入混元,包括腾讯会议、文档,微信读书的AI助手等,这也使得过去半年腾讯在大模型上的新产品、新版本发布的频率越来越高,这本质是因为不探索原生AI大模型应用,不知道怎么跟业务更好合作。 不过过去一年无论大家走怎样的路径,一年后给到用户的结果十分相似。最简单的就是,在这次大会之前,无数用户可以说是拉满期待,就想看着国内的大厂们,能不能拿出什么点新鲜玩意儿来让大家开开眼。 但结果其实是有些失望。一句话概况就说,即便不去参展,也基本能猜出每个厂商摆出的主要产品是什么。例如百度的基本围绕文心一言做落地,阿里围绕通义千问,智谱AI围绕智谱大模型,从娱乐社交到办公学习,大模型的主要作用十分明显。 看似高大上的落地应用,本质还是集中在各类对话助手、文生图、文生视频产品。行业发展到今天,这些产品的新鲜感早已褪去,以至于现场有观众参展下来表示,每一家的产品都大差不差。 当然,确实也有一些剑走偏锋的落地思路,但仔细来看也只是特定行业特调的,基本也没什么新意。 如果说去年的WAIC让人感觉AI有盼头,大家疯狂期待大厂商们争奇斗艳能卷出哪些五花八门的产品,结果短短一年,齐刷刷地长成了一个模子刻出来的样子。 不过相比BAT这样的大厂可以用大模型服务内部业务生态,以及用内部生态为AI业务输血,快手、B站、阶跃星辰、Minimax、智谱AI这些设计大模型不久的公司算是第一次登场,他们更焦虑于如何站稳脚跟后茁壮成长。 Part.3 中小厂焦虑尽显 这一波AI落地潮,对于中小厂来说并不算友好。 比如,展台紧靠阿里的阶跃星辰,虽然入场虽晚,但极力想挤入“大模型五小虎”的战队中,在营销上试图把格局改变为“六小强”。 在WAIC上发布了三个大模型,其中包括 Step-2:万亿参数的 MoE 模型,目前还需要申请才能体验;Step-1.5V:千亿参数多模态模型,除了图片理解能力提升外,也支持视频理解;Step-1X:图像生成模型,DiT 架构,600M、2B、8B 三种不同的参数量。 不过一个疑问是,靠这三个模型还有出路吗?去年的百模大战造成了社会资源的巨大浪费,尤其是算力浪费,行业不卷模型,卷应用,已经成了共识,没有落地应用已经很难出圈,甚至很难拿到融资。 快手也是今年WAIC上的新面孔,从快手大模型家族来看,其着力点更具有落地属性,重点是通过大模型打开商业化的空间,以及通过视频生成技术给自身的视频业务注入新生机。 这里值得一提的是快手可灵,在文生视频领域上,号称比肩Sora,但目前试用范围依旧无法完全匹配市场需求,即便是快手内部的人想试用都很困难。并且当下使用的结论,是基于内测视频得出,这也就意味着对于可灵的模型能力可能是高估的。更为关键的是虽然目前国内市场尚无对手,但更多的竞争对手正在赶来的路上。 另外一些像智谱AI这些纯AI创业公司,在巨头环绕的市场环境下,需要迫切找到自身的市场定位。以智谱AI为例,尽管在B端市场有所布局,但用户群体的模糊边界使得其在市场定位上面临困惑。企业必须在产品和服务中融入独特的价值主张,以区别于竞争对手,而这在技术趋同的背景下显得尤为困难。 新兴AI企业大多处于初创或成长阶段,资本运作的不确定性增加了财务压力。一方面,高昂的研发成本和市场开拓费用需要持续的资本注入;另一方面,投资者对回报的期待与企业成长周期的矛盾,使得财务规划变得异常复杂。 而做特展的公司,参加一趟WAIC,成本最少也要几十万。对于这些小企业来说,这些钱花出去要“掷地有声”,要么收获订单,要么打响品牌。对于智谱AI,以及云服务厂商等重视企业服务的公司来说,花几十万“买”最终客户资源,性价比并不高。只是展会之后,如何保障对B端用户的继续跟踪及成交,十分考验企业的售后能力。 构建开放的生态系统,与行业伙伴建立合作关系,对于新兴AI企业至关重要。但如何在短时间内建立起有效的生态链,实现资源共享和价值共创,是摆在这些企业面前的现实难题。 一年前,AI行业还在普及大模型的路上,把大模型的概念传播给普通人。而如今AIGC、大模型起码在行业上已经有了广泛的应用,和不错的商业前景。所谓的千篇一律也可以理解为当下行业的最优解,在这个现实与虚拟交互的临界点,现在的平静或许是为了未来的爆发,毕竟在AI时代,每一天都变得值得期待。
科技新知 科技新知

科技新知

07-05 23:33 · 科技领域研究达人

AI搜索新贵弯道超车难

新玩家高调入场,老玩家默默升级,搜索市场进入新一轮洗牌阶段。 @科技新知 原创 作者丨王思原 编辑丨赛柯 最近一段时间,老旧的搜索行业开出了新花。 从2009年开始,谷歌、百度成了搜索领域绕不开的存在,它们占据了全球搜索引擎市场绝大多数的市场份额,尤其国内市场,百度一家独大的态势已维持了近20年。 不过,AI大模型的到来,打破了这一僵局。 2024上半年,AI搜索正成为新共识并迎来了一波热潮,短时间内涌现出了多个AI搜索产品。其中,国外原生AI搜索工具Perplexity AI最新估值已经接近30亿美元;国内更是有众多玩家入局,知乎直答、天工 AI 、Kimi、智谱AI等都在打磨自身产品力。 生成式AI的流行,令诸多AIGC内容在互联网上流传,其中有用户即兴创作的图文影音内容,也有被用作引流的低质内容和内容农场等垃圾信息,这对搜索引擎的搜索排名产生了不少的压力,如何使用户能够看到更多“有用信息”成了百度们的头号难题。 AI 搜索不仅在产品形态上革新了传统搜索引擎的信息罗列模式以及备受诟病的竞价排名广告,还能解决聊天机器人信息滞后和幻觉问题,让传统搜索引擎的交互变得更加智能。只是对于这些新兴的AI搜索来说,是否具备打击传统搜索的能力?诸多AI搜索产品真正的护城河又是什么?在这个赛道跑出来的难点在哪?也还是不得不面对的问题。 Part.1 AI加持,搜索行业变天 AI搜索的出现,有一个大背景是在传统搜索引擎的范式中,用户还有大量未被满足的真实需求。 过去,用户想要查找一个答案,可能要自己先拆解成多个问题,分别输入到搜索框中,而后通过爬虫的形式把互联网上的网页抓取回来,搜索引擎按照自己的逻辑进行排序,简单罗列给到用户。 这种传统搜索引擎虽然为互联网信息检索提供了基础服务,但其准确性、相关性以及个性化体验上的局限性,同时在实时性更新、广告干扰、信息过载处理、多媒体内容搜索、自然语言理解、个性化服务提供以及隐私保护等方面存在挑战,这些问题促使了搜索引擎技术的不断革新和发展。 AI技术本身解决的是信息撮合能力,因此大模型技术在一定程度上会强化原有的搜索能力。用户只需要用自然语言输入最终问题,AI搜索会分析用户意图,智能拆解问题,并抓取对应的网页,基于大语言模型对结果进行综合分析,最后结构化输出一份综合内容。因此,AI搜索在创造新需求之前,首先是更好地满足了未被满足的那部分需求。 简单讲,AI搜索,是让用户省去了去点网页、选网页以及看网页的过程,而把这个过程用大模型,用 AI 去替你做这件事情。这里面涉及两个技术问题,一个是把网页收集回来,一个是把网页内容传递给大模型让大模型进行总结。 形态上大家都是比较类似的,而从模型能力角度讲,目前看来,整理网页内容把它输出出来,需要的AI能力,其实也不是那么高,百亿参数的模型已经够了,那后面就是涉及到,谁能把工程化、产品化做的更好。 AI让搜索产品的准入门槛降低,基于此,不少玩家开始入局AI搜索产品,知乎推出知乎直答,昆仑万维的天工AI搜索、kimi、智谱AI等新秀AI搜索产品也相继涌现。而无论哪种AI搜索产品,从本质上来看都是在解决一个问题:更好地满足用户搜索需求,即用AI能力给用户匹配更精准的内容。 但有不少网友指出,这类产品相似度很高,像是AI版的知乎,他们做的主要是简化了搜索路径、将各种渠道获取的信息进行聚合。因此不少用户尝鲜体验过后,又回到了传统搜索引擎,很大程度原因是传统搜索引擎提供的信息更丰富。 效率就是金钱,搜索引擎到了必须革新的时候。但是AI搜索到底能否颠覆传统搜索,不同AI搜索引擎表现到底如何?我们在体验了百度AI、360AI、知乎直达、Kimi、智谱AI、天工AI搜索等多款AI搜索产品后,得出的结论令人吃惊。 Part.2 高效低质下,建不起护城河 都知道传统搜索返回的结果相关性可能较低,结果排序受广告竞价影响,AI搜索输出的结果已经过AI提炼和总结,搜索效率高,那么我们就拿一个最容易出现广告的问题来当“开胃小菜”,看AI搜索能给我们一个怎样的答案。 我们向天工AI搜索、知乎直答、腾讯元宝以及Kimi分别提出了同样的问题,“我想买一部手机,价格在5000元左右,有什么推荐?” 首先来看天工AI搜索的表现。再增强模式下,天工AI搜索会先反问我们想要什么品牌的手机,这里我们选择跳过。 来源:科技新知(天工AI搜索) 最后天工AI搜索给到的回答仅有2款手机推荐,并且还给出了推荐理由以及所参考的文章链接。虽然不算多,但还算满足了我们的基本诉求。 来源:科技新知(天工AI搜索) 接下里是知乎直答。其实知乎在数码科技领域的内容不算少,所以我对知乎直答抱有的期待还算高,不过结果却大失所望。 知乎直答给到了10个选择,但每款产品给到的也是一句话简单解释,不过其中有多款产品仅是千元机水平。另外,华为两款产品推荐中给到的评价分数有些不知所云。在形容三星Galaxy S24时表示“详细信息未给出”,但作为一款今年1月发布的产品,产品信息早已披露完全。 不过值得一提的是,知乎直答的回答参考几乎都是平台博主,这是内容平台的一个优势,只是其内容的真实性也有待考究。 来源:科技新知(知乎直答) 从结果来看,知乎直答并没有给到太大惊喜,因为用同样的问题去知乎搜索得到的答案也大差不差,只是滤掉了一些无用的信息,除此之外并没有其他自身总结学习性回答。 腾讯元宝的AI搜索还算靠谱,推荐的几款从产品均在3500-5000之间,并且都是最新款机型,甚至还将适用人群进行了标注。 来源:科技新知(腾讯元宝AI搜索) 我们也尝试了元宝的深度搜索,AI搜索参考资料数量由原来的10篇直接飙升到38篇,内容也从简单介绍变得更加详细。不过多维度的长文分析带来了丰富内容,也让用户的阅读成本被迫上升。对于生活场景的搜索提问来说,人们更倾向于能一眼看出答案的回答。 来源:科技新知(腾讯元宝AI搜索) 最后说一下Kimi,如果说知乎直达为了给我省钱推荐了几款千元机,那么Kimi则是根本没想让我多花钱。推荐的手机均是千元机,甚至还“贴心”的表示增加预算的话可以选择价格在3800元左右的两块手机。显然Kimi没能明白我们的意思。当然,其他在内容介绍上的表现也不突出,一句话概括很难让我们知道为什么会推荐这几款手机。 来源:科技新知(Kimi大模型) 总的来看,这些新兴AI搜索平台的模式也非常简单,先理解问题然后在本站或者外站去查找信息,最后用AI总结过滤,而与传统搜索最大的不同是,除了过滤无用信息外,在整合信息形成观点的同时,这些AI搜索也都顺带给出每个观点的信息来源以及相关联信息。不过几家AI搜索因为训练语料、方式以及获取数据的途径不同,最后输出的结果也有差异。 而经过产品对比体验发现,目前市面上的AI搜索产品,大多可以较好地满足相对泛化的信息需求,但如果应对某个垂直领域内更为精细的要求,则难以给出较为专业、准确、全面的回答。可以说,用户的需求只被部分地满足。 这背后反映的实际上是一个时间问题。像百度、夸克等搜索引擎,多年来基于搜索引擎不断深挖垂直应用场景,并从中积累了丰富的用户、数据和经验,这是其它创业公司短时间内难以超越的。 Part.3 行业激战,变量与变数共存 长期来看,AI搜索是大趋势,除了原生的AI搜索,传统搜索引擎也在加入AI能力,而从商业化和现有产品运行的模式来看,AI搜索想要改变传统搜索行业远没有那么简单。 首先对于一个新的搜索引擎来说,很难让用户快速接受它。在搜索引擎市场几乎牢不可破的格局下,想要令更多人习惯使用AI搜索,是相当困难的事情。即使是热度超高的New Bing,其百万级别的日活跃用户数在Bing全球日活跃用户中的占比也相当小。 AI自然语言模型大多被用于娱乐、生成内容等领域,但当需要查询真实可靠信息时,用户们还是习惯性的使用传统搜索引擎。因为“可信度”才是搜索引擎的关键,也就是说,答案要“100%可靠”才有意义,这也是为什么百度当年要强调“简单可依赖”。 在知乎直答、天工AI、腾讯元宝等AI搜索中,用户得到的答案只是“可能准确”,是否真的有效,往往需要再去搜索引擎用传统内容验证,毕竟二十多年来用户已习惯于在搜索引擎中给出的海量信息里找到自己所需的资料,而当前的AI搜索以及各种AI工具确实“不够准”,甚至“经常错”。 因此,AI搜索要取代传统搜索引擎路还很长,当下最重要的事情是提高智能化程度,也就是提供最真实准确的搜索结果。 新兴的AI搜索企业正通过技术创新挑战传统搜索引擎巨头的市场地位,但商业化之路充满挑战。当AI搜索热潮逐渐冷静下来,场景、用户留存等都是摆在台面上的现实问题,也就意味着行业进入了比拼内功的阶段。这个阶段,比拼的重点将不再是融资额、极端产品能力,而是实实在在的真实用户场景。 搜索引擎的发展史是一个不断进化的过程。从最初的门户网站如搜狐、网易,到百度这样的传统搜索引擎,再到如今抖音、小红书等新兴平台,搜索技术的每一次革新都伴随着信息获取方式的重大变革。当下,AI搜索技术的加入,预示着搜索市场将迎来新一轮洗牌。老玩家如何完成自我革命,新玩家如何利用技术为市场带来增量,值得期待。
科技新知 科技新知

科技新知

07-05 09:39 · 科技领域研究达人

快手可灵,能成为中国Sora吗?

快手祭出文生视频模型的的王炸,产品型创新能让快手领先多少? @科技新知 原创 作者丨樱木 编辑丨赛柯 “甚至我觉得也吊打了Sora,我认为这个产品今天,在我能使用的范畴内就是全世界第一的。”镜头前,猎豹移动董事长傅盛,难掩兴奋的表情。而他口中,能吊打国内外各个文生视频模型的产品,就是快手可灵视频生成大模型。 6月6日,快手发布AI视频模型,而就在发布当天,就有诸多如傅盛一样的业内人士,获得邀请码进行了第一波测试。从业内的反馈以及可灵生成的视频样本来看,快手可灵似乎与Sora已然非常相近,在第一版五秒中的视频中,业内反馈无论技术路线,和训练数据质量都较为突出。而更为令业内兴奋的是,快手可灵似乎做到了如Sora一般极度真实的还原物理规律,无论是运动的合理性,还是其他物理特性,甚至概念组合能力和想象力都表现得较为优秀。 但也有业内人士指出,Sora是今年2月公布的,其训练有可能在去年年底就完成了,可灵多出几个月的训练时间。更进一步来说,能调用更多的训练算力,是可灵的优势。 随后6月21日,可灵模型再次抛出新的功能,图生视频以及视频续写等功能上线,让产品功能更加丰富。 可灵的表现之所以从某种程度超出业内的预期,最为关键的是,在其公布之前,绝大部分AIGC从业者对其一无所知,快手的通用语言大模型快意,在国内大模型梯队中,作为新品上线暂无耀眼表现,知名度也没有投入了大量营销预算和研发成本的豆包、混元、文新一言、月之暗面等一众新老势力名气大。 就在这种情况之下,可灵的出现似乎打破了行业内的认知,从技术性到产品性的转化,也有了新的路径。但需要清醒的是,惊艳的产品距离能够广泛应用,以及成功的商业化,都有较大的距离,而快手能否依靠可灵完成超车,与同行拉开差距,此刻来看,还面临着不少的风险与挑战。 Part.1 剑走偏锋的快手 “可以说的是,可灵这个事情肯定是一个非常复杂的,重资源投入,多兵种协作的复杂项目,肯定不是一个单一的天才的想法随便搞出来的东西。”快手视觉生成与互动中心负责人万鹏飞在2024北京智源大会先后拒绝了几个关于可灵参数、性能的问题之后,给出了一个较为实际的回答。 在国内的AI赛道,能吸引C端目光的部分,其实相当有限,其中的焦点是,百模大战留下的各类语言大模型,月之暗面是个典型的代表,从默默无闻到估值达30亿美金,公司只用了不到1年时间,但从产品上来看,除了一款有长文本阅读能力的Kimi之外,C端对其感知并不明显。 而另一方面,资本和创业方似乎都非常纠结,以金沙江创投管理合伙人朱啸虎为代表的现实主义派,始终在保持一种相对悲观的态度。比如朱啸虎认为这一代大模型创业公司,面临比上一代商汤等AI公司更恶劣的处境:公司之间技术没有差异,每一代技术都要重新砸钱,且投资规模指数级上升。根据媒体报道,在OpenAI发发布GPT-4o后,朱啸虎在朋友圈的新判断是,“不是深度绑定大厂的模型公司基本已经出局”。 而正是在这种复杂的环境之下,产品的创业面临的困难就愈发之多。在商业化的要求之下,各大模型厂商先后加入了价格战,而即便估值已达30亿美元,Kimi也在从打赏等方式试图完成变现。 资本的小心翼翼,叠加大厂的FOMO“不愿错过”成了当下AI,创业的主基调,从这个视角来看,可灵的成功更加难能可贵。 在文生图赛道之中,有业内人士评论道,快手能拿出国内第一个令人惊艳的“准Sora”文生视频大模型,与平台深耕视频内容相关。但是抖音的视频数据更多、算力更强、在AI方面投入更大,为什么反而没拿出来类似量级的大模型? 而从摩根史丹利的研报中也可以看出,目前,可灵的表现要比抖音和腾讯过往发布的视频生成模型都更加优秀,从时长来看,可灵可以生成长达2分钟的视频,而抖音的即梦目前只支持生成最长3秒的视频、腾讯的混元大模型则能生成16秒。 归根到底,大模型本质上还是基础研发的交战,必须从基础研发层面下功夫。而字节跳动的策略是以应用端促进研发,整个字节跳动AIGC线条的人员非常混乱,真正的技术牛人不多,C端应用思维主导了整个AI平台的研发,这可能不是正确方向。 而从实践上来看,与其说可灵的产品是技术的领先,不如说快手,在这一赛道策略布局的成功。用猎豹傅盛的话来说,“可灵的成功,更加证明了,Sora并不是一项技术性突破,而是产品型图片” 可灵的剑走偏锋,无疑给行业带来了全新的启示,但能否就此判断可灵在文生视频赛道与国内AI大厂差距已经拉开似乎还需要更多实践证据。 Part.2 能否成为下一个爆款? 尽管可灵已然做出了不少成绩,但想要成为AI赛道的下一个Killing APP,可灵要走的路也许还有很多。 首先,可灵想要大规模应用,尚需要时间。在最新的交互页面之中,申请可灵的人数已达41万+,据接近快手人士透露,可灵虽然已有超过10万+的使用者,但目前试用范围依旧无法完全匹配市场需求,即便是快手内部的人想试用都很困难。而另一方面,当下使用的结论,是基于内测视频得出,这也就意味着对于可灵的模型能力可能是高估的。 而与此同时,可灵对于行业内也是神秘的存在,正如快手视觉生成与互动中心负责人万鹏飞对于各项参数的讳莫如深,外界对于可灵使用了多少算力、算力来自哪里,有没有充足的推理算力可供大规模公测,也同样好奇。 在可灵一方,不知是否为了继续产品热度,先后推出了图片生成视频,以及视频续写等功能,但测试下来,整体效果较为平淡,生成时间的不稳定,以及差异化并不明显的效果,也意味着这些功能尚需要进一步优化。 而在行业最为关心的算力上,有从业者评估,快手同时从腾讯云和阿里云租用了大批“大卡”,而快手自身也有一批约为数千张的大卡,而根据多方消息猜测,可灵的训练算力来源应该是多元化的。 而在另一方面,根据多方信源估计,文生视频大模型生成一分钟1080P视频至少要消耗100万Token,推理算力需求远大于文生文,而在推理算力方面,L40采购难度较大,快手可能面临瓶颈,这也就意味着,快手可灵全面投入公测可能还是很遥远的事情。 在多个短视频平台,甚至诸多海外社交媒体,可灵几乎已经成了中国Sora的代名词,海外博主一码难求,国内测评博主声称,已达到了,免费、可用、可实操的阶段,但这样的结论,从目前来看,似乎还有不小的差距。 从某种程度来说,可灵是一款战略意义远大于实际意义的产品,技术的领先无可厚非,对于行业来说也有示范作用。但在真正意义上的广泛应用,似乎还需要很长的时间。 Part.3 老铁们的“新希望”? 在可灵对外的宣传之中,可灵的优势简单明晰,首先是真正可应用,其次是视频生成效果好。不仅可以能够生成大幅度的合理运动,能够模拟物理世界特性,而且,生成的视频分辨率高达1080p,最长可达2分钟(帧率30fps),允许用户自由调节视频的纵横比。 正是基于此,外界对于可灵商业化想象空间进一步打开,有业内人士总结,在媒体与广告行业,可灵可以用于快速生成广告宣传片、新闻报道等,不仅能大幅提升生产效率,还可以通过数据分析优化内容。同时,在教育与培训行业,可灵可以辅助教师制作教学视频,甚至生成虚拟的教学场景,为学生提供沉浸式的学习体验。另一方面,娱乐与社交媒体行业,对于社交平台和内容创作者而言,可灵提供的个性化视频生成工具将极大地丰富平台内容。 多家券商研究机构,也对可灵表示乐观,国泰君安互联网传媒研究表示,可灵大模型配套建设了高效的大规模自动化数据解决方案,覆盖了海量视频挖掘、多维打标筛选、视频描述增强及数据驱动的效果质量评估等多个方面,在**生成大模型中居于前列。 但丰满的预期,在现实面前,似乎还有不小的差距。 根据接近快手人士透露,当下,可灵暂无商业化计划,也不对外提供API。这就意味着,从投资层面来看,可灵对于快手近几个季度的业绩并无太大贡献。而从快手近期在二级市场的表现来看,也可以印证,可灵似乎对于快手的帮助不大。 在快手视觉生成与互动中心负责人万鹏飞演讲中,在谈到可灵的未来时曾提到,“视频创作的门槛和效果的ROI大幅度提升,视频创作者和消费者界限逐渐模糊。越来越多消费者变成创作者,对于视频创作生态的繁荣是非常有价值的。” 从此可以简单猜测,也许快手对于可灵的未来,更多的还是倾向于在自有生态中赋能更多的创作者,而从另一个视角来看,快手当下面临着不小的压力,无论是广告还是电商,增长都在经受住各个大厂的挑战。而可灵的出现,如果能如快手负责人所言,降低门槛,提升ROI,从而吸引更多的用户从消费者变成内容生产者,无疑吸引力巨大。 总结来看,可灵似乎让国内从业者以及更广泛受众看到快手在全新领域的努力和希望,但从全局来看,想要短期增加营收,也许需要更长的时间。
科技新知 科技新知

科技新知

07-04 10:26 · 科技领域研究达人

无人驾驶“迎春”,网约车司机“入冬”

无人驾驶出租车,未来交通的先锋,还是司机失业的先兆? @科技新知 原创 作者丨王思原 编辑丨赛柯 最近两年,人工智能进入快速发展阶段,“被取代”的焦虑逐渐从“打工人”群体散开,如今轮到了出租车与网约车司机。5月下旬,百度旗下最新一代的无人驾驶智能"萝卜快跑"车队投放武汉,很多人都被这种全新的出行方式所吸引,纷纷预约乘车,争相一探究竟。仅上线运营的首个月,就有超过10万人次乘坐。 在武汉等城市的街头巷尾,无人驾驶出租车的规模性投放运营,正以一种前所未有的方式,重塑着城市的公共交通版图。 即将到来的无人驾驶时代,为市民提供了更便捷、经济的出行选择,但同时也给传统出租车和网约车司机带来了前所未有的挑战。不少司机都在为“机器代替人”的某些不确定未来而担忧。 自动驾驶出租车不仅成本更低,还能提供全年无休的服务,吸引了大量消费者。这一趋势也对传统出租车行业带来了巨大的挑战。武汉的出租车司机表示,由于“萝卜快跑”的低价和便捷服务,出租车订单量明显减少。 从目前的结果来看,相比于传统出租车和网约车,自动驾驶出租车在价格和运营效率上具有明显优势。前不久,一位体验了一次萝卜快跑无人驾驶的网友表示,全程6.3公里,耗时13分钟,最终费用令人惊讶——仅3.11元! 当然,这也是打了近一折之后的费用。3.11元的费用一旁,清晰地显示了折扣:已优惠28.01元。也就是说,这一单如果不打折的情况下,正常费用应该是31.12元。不过无论打折与否,实付才是消费者的决策点。 另外,由于没有司机,自动驾驶出租车可以实现24小时不间断运营,填补夜间空白时段供给的同时,也大大降低了人工成本。 “如果无人驾驶车真的成功推行并被大家接受,那么像我们这种被市场完全取代的老司机还有活路吗?”一位资深出租车司机无奈地说。 事实上,前段时间武汉一家汽车客运公司的声明在网络上引发了热议。声明中提到,自动驾驶运营公司“萝卜快跑”在武汉的运行区域扩大,已经导致该公司四辆出租车退车停运,并建议将自动驾驶出租车的数量控制在一定范围内。 坦白讲,尽管无人驾驶出租车在经济和运营效率上具有显著优势,但其安全性仍然是消费者关注的焦点。“敢坐吗?”是大多数人在乘坐无人驾驶车辆的第一反应。 去年8月,美国旧金山政府曾放宽对无人驾驶汽车的运营限制,但随后出现了多起投诉,导致监管部门重新审查其安全性。 国内要比国外更谨慎。北京、上海等城市虽然开始逐步放宽对无人驾驶车辆的运营限制,但依然采取了谨慎的态度。从主驾有安全员到副驾有安全员,再到无安全员运营,每一步跨越都会带来更高的技术要求,需要更多时间检验。 历史的车轮滚滚向前,无人驾驶已成不可阻挡的趋势,不过这并不意味司机群体会被这时代无情碾压。 虽然无人驾驶可以精准地导航至指定停靠点,但在处理突发意外、理解乘客情绪等方面,它们永远无法完全替代人。 一个简单的例子,在堵车场景下,在交通拥堵的场景中,真人驾驶员能够根据交通警察的手势灵活调整行驶路线,即使在压线、闯红灯进入路口等待等类似情况下也能应对自如;然而,自动驾驶汽车大多只会呆立在原地,对于交通警察的手势无动于衷,造成更堵塞的情况出现。 另外,网约车司机本质属于服务行业,除了将乘客送达目的地外,满足乘客需求和提供情绪价值也是附加属性。就有网约车司机表示,当他察觉到乘客可能心情不好时,就会播放舒缓的音乐,或是主动聊天来缓解乘客的压力。 不过,可悲的是,网约车平台肆无忌惮的高抽成、高压态势掠夺正让司机群体陷入悲观情绪。而这也使得司机无法将友好周到的服务传递给乘客,甚至会引起司乘矛盾。 不止网约车司机,即便是网约车平台,眼前的困境也是巨大的,因为红利早已消失殆尽,无人驾驶带来了巨大的压力,但这也是一个逼迫自己成长与进步的契机。 时代潮流,浩浩荡荡,顺者昌,逆者亡,从古至今始然。不过就目前情况来看,无人驾驶技术因为安全性、法规等方面需要完善,并不会大规模推广。在普及之前,平台要做的只有不断完善制度,与司机、乘客站在一起,共同面对时代的变革,在挑战与机遇并存的时代,焕发出新的生机与活力。
科技新知 科技新知

科技新知

07-03 10:37 · 科技领域研究达人

华为ADS大降价下的“小算盘”

华为ADS降价谋局,策略调整下,意图剑指特斯拉FSD,智驾市场将迎竞争新格局? @科技新知 原创 作者丨王思原 编辑丨赛柯 特斯拉FSD入华前夕,即便强如华为也不敢怠慢。 6月30日深夜,华为一纸公告引起车圈热议。公告显示,2024年7月1日至12月31日,华为ADS高阶功能包一次性购买标准价格降价6000元,从3.6万元调整至3万元。现有订阅价不变,包月价格720元/月;包年价格为7200元/年。 在外界看来,直降6000元的价格确实足够有诚意,但不得不承认的是,相对以往的优惠补贴,其落地价实际已上调。 去年6月,华为车BU董事长余承东发文称,截止2023年12月31日,ADS 2.0高阶智驾包五折优惠,一次性购买价为1.8万元。如果车主叠加1.5万元高阶包抵扣权益,华为ADS的落地价仅为3000元。 不过去年底,鸿蒙智行也来了一次明降暗升,宣布ADS 2.0智驾高阶包限时优惠1万至2.6万元,如果车主享有2万元的ADS智驾包等额抵扣券,二者同时使用,其落地价为6000元,比此前贵了3000元。 目前,华为ADS高阶功能包的一次性购买价为3万元,相比价格调整前的2.6万元,其落地价又上涨了4000元。 那么,华为这一操作会带来什么效果呢?为什么会打出这张牌呢?新一轮智驾技术军备竞赛号角已经吹响,华为ADS又会面临怎样的机会和风险呢? Part.1 明降实升,华为下了步妙棋? 华为ADS 3.0的价格策略,无论从企业角度还是行业角度,都透露出华为对市场深度的把握和长远的考量。 价格下调,无疑是吸引新用户的一张王牌。在这个价格敏感的时代,每一次价格的调整,都可能成为消费者决策的转折点。即使降价幅度不大,或者相比历史优惠不是最划算,但一次次的“明降实升”无疑为那些观望已久的潜在用户,提供了一个推动力。 另外,短期之内,由于新客户的涌入和犹豫客户的快速转化,产品的销量很可能会显著上升。这对于提升市场份额、增加现金流、以及在财报上呈现出更好的业绩都有直接帮助。尤其是在上半年即将结束的这个时间节点。 事实也是如此,受到ADS高阶功能包一次性购买价即将上涨影响,鸿蒙智行旗下车型销量近日大幅增加。鸿蒙智行公布的数据显示,6月29日-6月30日两天,鸿蒙智行旗下车型大定订单突破9000辆。要知道整个5月,鸿蒙智行的销量也不过3万出头。 也是凭借着这最后一搏,鸿蒙智行上半年全系累计交付突破19万辆,登顶中国新势力品牌上半年销量第一。 客户的增多也意味着研发资金和迭代效率的增多。华为智能汽车解决方案BU CEO靳玉志曾表示,今年5月华为ADS总里程达到3.8亿公里,智驾里程占比35%,每天学习3000万公里。随着华为ADS高阶智驾包价格调整,华为将获得更多研发资金,助其智驾加速迭代。 另外除了吸引潜在用户外,鉴于华为当前汽车圈合作伙伴众多,所以此举还可能迫使其他车企跟进调整价格策略,加剧竞争。 据不完全统计,仅2024年就有包 括东风的岚图、猛士,长安的深蓝、阿维塔,广汽传祺,北汽的极狐和享界,以及赛力斯问界、奇瑞智界、江淮等十多个品牌的十多款车型搭载HUAWEI ADS方案上市。 此前华为对外公布的数据显示,问界已售车型中,70%的用户选择了高阶智驾包。华为预计,截至2024年底,搭载华为智驾系统车型保有量将突破50万台。这无疑会给到同行巨大压力。 这种情况下,车企以及智驾企业之间的竞争焦点可能会转移到服务、技术性能、用户体验等非价格因素上。这意味着企业需要不断创新,调整自己的产品策略和价格体系,提升产品品质和附加值,共同提升自动驾驶技术的市场接受度。 当然,华为ADS“明降暗升”除了是市场策略外,多少也有些无奈之举。 Part.2 高成本高压力下的最优解 今年以来,除了价格战之外,提供高价值产品和服务、提升配置成为车企竞争的核心。其中,以智驾、智能座舱为代表的智能化已成中国新能源汽车品牌核心竞争力,也是决定各家新能源汽车竞争的胜负手。搭载高阶智驾的新车犹如雨后春笋般冒出,售价从开始动辄要三四十万元,拉低到了十五万元内。 高阶智驾以极快的速度正实现“普惠”式普及,但这并不意味高阶智驾正在变得廉价,甚至对于厂家来说成本更高。 华为ADS团队号称7000人的研发团队,不考虑其他场地、设备、物料开支的情况,仅人工薪酬就是一笔不小的开支。 华为发布的《2023年年度报告》中数据显示,华为员工20.7万人,平均薪酬87.8万,也就是说,养着7000多人的研发团队,单单人工薪酬的开支就高达60多亿元,如果再考虑场地、设备、物料、算力等开发智驾系统必备的开支,一年的支出少说也在上百亿元。 据悉,2023年,华为智能化部件实现300万套发货量,累计研发投入超过300亿。而随着华为智能驾驶的持续进化,智驾研发投入将进一步增加。 自动驾驶行业的一个共识是,解决99%的自动驾驶的技术问题后,剩下的1%是难度最高的,而对这一部分的研发投入将远超过往。高昂的研发投入,也使得华为的ADS高阶智驾功能保持高频率升级。 近日,鸿蒙智行宣布华为乾崑ADS升级,将支持智能泊车感知低矮障碍物、导航地图红绿灯倒计时等功能。此外,ADS的3D视图可区分大小异型车,新增运动+模式等功能。 当然,除了高成本外,华为面对的同行压力也居高不下。 国内紧张的智驾竞争态势背后,正隐藏着风雨之兆。从当前种种迹象来看,特斯拉FSD进入中国市场的进程正在加快。中国自动驾驶独角兽Momenta CEO曹旭东近日表示,特斯拉FSD的体验接近Waymo,但只用了8个摄像头和HW3芯片,成本大约4000元人民币,相较Waymo的激光雷达和大量算力,成本要降低很多。 而特斯拉FSD的技术优势在业内有目共睹,无论是纯视觉技术路线还是最新的端到端大模型,都证明了特斯拉在智能驾驶领域的领先地位。目前,特斯拉的智能驾驶软件FSD已经进入了V12.3阶段,公司表示完全自动驾驶的实现仅差“一步之遥”。一旦FSD进入国内,无疑会给市场带来巨大冲击。 另外不止特斯拉,其他企业如百度Apollo也在不断进化,例如百度率先实现AI大模型上车、OCC(Obstacle and Container detection)技术在行泊全场景中展现出强大的通用障碍物检测能力,并且在前不久百度董事长李彦宏更是亲自上阵,宣布推出一项新的购车优惠政策—高阶智驾限时终身免费。业内也对这一举措抱有乐观态势。 值得注意的还有一些初创公司,例如AutoX、小马智行、文远知行等在特定领域展现出创新能力,在L4级别的自动驾驶技术上取得了进展。这些企业的灵活性和创新速度可能对华为ADS构成挑战。 从投资人的深入剖析来看,所有智驾被阻碍其广泛被接受的主要原因之一,便是过高的价格。自动驾驶技术尚未跨过“拥趸者”买单阶段,即这类技术的性价比尚未形成“统治性压倒”优势。所以上演一场“明降实升”的戏码或许是华为当下的最优解。 Part.3 市场鲶鱼将至,机遇和风险并现 当年,特斯拉入华成为了一条鲶鱼,给中国汽车市场竞争带来了巨变。而如今,FSD有机会再一次掀起智驾的鲶鱼效应。 业内专家对特斯拉FSD进入中国市场后的前景有几种猜想。一种观点认为,特斯拉可能凭借其技术优势快速赢得一批消费者,进而侵占国产智驾市场的份额。然而,这也可能引发中外智能驾驶技术的直接竞争,包括技术战、数据战、价格战乃至商业战。 另一种观点则认为,特斯拉可能在国内车企的围攻下陷入困境,尤其是在价格战等策略下,其盈利梦想可能难以实现。 当然更乐观的观点认为,特斯拉的进入将推动中国自动驾驶技术的升级和进步,加速从智能驾驶向无人驾驶的质变。这将对新能源汽车产业产生积极影响,因为自动驾驶是新能源汽车发展的重要方向之一。 不过,与国内智驾方案相比,尽管特斯拉在4月初对FSD进行了一轮降价,将包月价格从199美元降至99美元,买断价格也从12000美元调整至8000美元,但相比之下,国内智驾方案的价格更为亲民。 从市场接受度的角度来看,华为ADS的价格虽然有调整,但特斯拉FSD的如果高价进入,那么可能会更利好华为的ADS。并且根据华经产业研究院的数据,自动驾驶市场规模在2022年达到了2894亿元,且预计未来几年将会是增速最快的几年。这一增长趋势表明,消费者对于智能驾驶技术的需求正在上升。而华为通过降低一次性买断价格,能够吸引更多消费者尝试并接受这项技术,从而在特斯拉还未反应过来时,加速市场教育过程。 国内智驾企业另一优势在于生态建设,无论华为也好其他国产厂商也罢,几乎都在落地人车家全生态,为用户提供更加综合的智能驾驶解决方案,这对于将单一技术做到极致的特斯拉来说多少有点“水土不服”。 毫无疑问,智驾已成“兵家必争之地”,但市场走向仍需明朗化。《2024麦肯锡中国汽车消费者洞察报告》中提到,在价格战的波及之下,虽然中国消费者对于智能驾驶的接受程度在上升,但是对智能驾驶的支付意愿反而出现了下滑。这表明尽管消费者对智能驾驶技术持开放态度,价格依然是他们作出购车决策的关键因素。 一些消费者也认为,对于自主品牌推出的自动驾驶服务,他们在推出前期不会率先“埋单”,但如果企业推出免费试用期则会尝试。一位消费者表示,自动驾驶服务对于他每天通勤路程而言,实在有些多余,首先要付出额外的费用,其次自动驾驶服务并不能缓解路途堵车等路况,最后对于他每天不到20公里的通勤路程,自动驾驶实在可有可无。 持类似观点的消费者大有人在,一位问界M7女车主称,她可能会购买特定场景的自动驾驶服务,而全路况服务并非必要。 不难看出,自动驾驶价格过高、实际道路表现不稳定、部分地区补能设施建设不完善、电动汽车补能慢、高速性能差、行驶距离受限等问题也影响了自动驾驶技术的普及,并且制约了潜在转化率。车企需要审视这些问题,并采取措施提升性能和性价比,以吸引更多消费者的关注和购买。 资深汽车分析师顾志军认为,车企要把高阶智能驾驶辅助功能的成本降低到5000元才能做到大量普及。也正基于如此激烈的成本之争,迫使车企不断调整研发策略和组织架构,以赢得智能驾驶竞赛的胜利。 一个事实是,此次华为ADS官宣降价,是智驾普惠拐点的一大信号。智驾作为汽车的一项高级功能,其研发成本高昂,价格下调极其考验车企对成本的控制。但高阶智驾普惠已势在必行,只有普惠、普及,才能从“产品导向”走向“用户导向”,推动技术平权。而在这个过程中,华为也好,特斯拉也罢,都将面临众多挑战。
科技新知 科技新知

科技新知

07-01 19:15 · 科技领域研究达人

大模型落地卡在哪?讯飞星火解出三道题

国产大模型跑出一条有特色的超车弯道。 @科技新知 原创 作者丨茯神编辑丨赛柯 ChatGPT横空出世500天之后,OpenAI再给国内赶潮大模型的从业者泼了一盆冷水。 从一直未能开放的中国用户注册和服务,到如今关闭来自国内开发者的API接口,领先者的冷漠让人们感受到残酷,却更加清醒。大模型这个未来潜力广阔的赛道上,国产替代已经迫在眉睫。 然而,底层基础设施上的先发优势,容不得忽略。当初惊艳的GPT-3.5现已升级到了强大的GPT-4,一年后可能还会随时冒出,参数规模预计达到52万亿级别的GPT-5。中国后辈们数次无限拉近身位,但终究落后一筹。 想要弯道超车,国产大模型们只能从自身出发,走出一条中国特色的大模型之路。那些在PC和移动互联网时代,脱胎于10亿以上触网人群和海量丰富的场景数据,积累下来的产品和应用经验,将成为效率最高的加速燃料。 2024年的国产大模型竞赛,考较的就是“落地与应用”这道开放式必答题。创新工场董事长李开复日前在公开场合中就称,中国AI大模型已经进入到落地为王的阶段,今年会迎来大模型应用爆发元年。 作为种子考生之一,科大讯飞旗下的讯飞星火大模型,从去年诞生之初,就把对标以及超越GPT系列当作目标。它以每月都有小升级,半年就有大版本的迭代速度,稳稳走在同行前列,紧紧咬住OpenAI,不负大模型“国家队”之名。 6月27日在北京的国家会议中心,讯飞星火大模型的4.0版本又如期亮相,自主可控的底层技术、软硬多端的产品序列、丰富多元的场景应用,成为让人眼前一亮的关键词,也组合成一份堪称模板的大模型落地赛参考答案,值得同届考生们汲取灵感。 Part.1 答题先拆题 见题先拆题,是学霸们常用的应考策略。 国产大模型们想要在今年的落地赛中脱颖而出,就必须认识到目前横亘在眼前的三座大山:高能耗的算力成本、多环节的技术适配,以及产品化的需求定制。 大模型的尽头是能源,这不是一句笑谈。支撑通用大模型实时运算生成反馈内容的正是背后最先进的无限算力。根据第三方数据机构SemiAnalysis的评估,OpenAI已经使用了约3617台HGX A100服务器,其中包含了采购自英伟达的近3万个GPU。 有媒体曾作出测算,英伟达新一代DGX系列服务器可整合8张A100共同工作,最大功率是6.5kW,这意味着其运行一小时会消耗6.5度电,同时还需要搭配大约同等电量的散热设备。假如按照平均工业用电每度0.63元的标准,1台服务器工作1天的电费约200元,当规模上升到1000台时,一天的电费就高达约20万元。 当然,更多的大模型创业公司选择了,把自家产品部署在云服务器厂商的平台之上。这也导致微软一边不计成本地投入OpenAI,另一边在云业务上收获颇丰。但小公司寄人篱下,产品和服务又不得不面临着自主性和安全性的考验。 翻过成本大山之后,还有技术适配和需求定制两道关卡。 从OpenAI实验室中走出来的大型语言模型技术,早在2017年关注和立项,直到2022年底才在ChatGPT上大放异彩举世瞩目。科技成果的转化落地不仅离不开时间上的沉淀,更需要开发产品联接市场的企业们发挥能动性。 GPT给国产大模型们指明了一个方向,却不能提供数亿规模的中文语料,更不懂国内已经摸不着石头,走入“无人区”的工业和信息化行业。而打破这些市场、行业、企业之间的流通隔阂,引导技术一步步适配转化落地的工作,才是后者需要努力攻坚,一分高下的主战场之一。 基于中文语系的大模型,只是能够在国内市场上落地,完整的商业闭环还少不了可变现的产品化定制。如果停在这最后一道门前,国产大模型只会沦为千篇一律的类ChatGPT模式,用户们看到的只有一个在搜索引擎上见惯了的输入框。 微软、谷歌这些国外的大模型领先者,都在尝试把技术融入到自己传统的办公、搜索产品当中,国产大模型们更应该发挥自身优势,提前做好下游产品的需求挖掘和定制规划。而这个过程中,那些本身已具备深厚的AI类产品经验和市场积累的玩家,与考前押中一道大题简直无异。 以上大模型落地赛的三个难点,既是门槛又何尝不是机遇。刚刚发布的讯飞星火V4.0,就展示出其各种转危为机的倒推式解题手法。 Part.2 倒推法解题 倒推式解题法是数学竞赛中常用的解题思路,考验的是答题者的逆向思维运用。面对市场给出的商业化大题,企业们采用倒推,从客户或用户的需求出发,也不失为走出困境的良策。 讯飞星火V4.0的发布,给予自己的定位就是倒推得来。正在逐步走进的AI时代,人们最需要的终极AI产品会是什么形态?不少科幻电影中其实已经给出答案,就像《钢铁侠》系列中的超级智能管家“贾维斯”一样。 贾维斯能够在钢铁侠的工作、生活甚至拯救世界的过程中无缝切换、无微不至,讯飞星火V4.0就提出要做一个在你身边,时刻懂你的AI助手。 面向C端,讯飞星火V4.0做到了懂用户。它没有只给用户一个冰冷的输入框,而是在APP中细分为写作、编程、工作、学习、生活、亲子、翻译等各种各样的助手,让用户需求与场景自然融合,大大降低操作门槛。 正因如此,自去年9月讯飞星火正式全民开放后,仅可统计到的安卓渠道下载量已经累计1.31亿次,部分高频场景的用户使用次数也达到了数百万甚至数千万次。 最新的版本中,为了实现千人千面的用户体验,讯飞星火加入了人设模板,可以一键设置个人助手的表达风格;用户如果想要打造只属于自己的个性化助手,只需要在“个人空间”中上传自己的工作、生活、学习等资料,再选择性地结合外部信息一并参考,就能生成万千人海中独一无二的存在。看来仅是懂用户还不够,要有针对性地懂每一个用户,才是讯飞星火的追求。 不仅是手机端的APP,由星火大模型在后台赋能的讯飞智能助听器,让湖北的一位老年用户从听力受损的状态中摆脱,既能智能检测听力状态,又能精准过滤背景噪音提升有效信息音量。一个懂你的AI助手,甚至能改变一个人的生活轨迹。 面向B端,讯飞星火V4.0做到了懂企业。星火大模型为了解决企业大模型应用的“最后一公里”问题,选择用智能体平台打造专属于每个岗位的工作助手。 复杂的企业需求不能用简单的一句话去概括,但可以在清晰地认识到大模型能力的边界后,把不同难度的任务分解成原子化的独立需求,分别完成后再进行串联整合。 如此搭建出来的企业智能体平台,是建立在科大讯飞的AI原子能力、外部信源集成,以及企业内部的IT系统打通等基础之上的。目前的星火企业智能平台已经覆盖到首批32个企业从生产、科研、办公到管理中特别需要的相关智能体,如商机、销售、客服、科技情报以及编程等。其中表现突出的代码智能体iFlyCode,已经赶上了现在GPT-4 Turbo的最新水平。 从不同终端场景中的需求出发,讯飞星火V4.0没有粗暴地统一标准对待,而是仔细分类、认真匹配,但想要高效地满足需求仍离不开底层大模型技术的扎实过硬。 软硬一体、自主可控是科大讯飞在大模型之路上追求的目标。去年10月,在科大讯飞提供大量算子库和算法资源的基础上,华为开发出国内首个国产万卡算力集群“飞星一号”。星火大模型就是借此训练而成,每一行代码、每一个数据都牢牢握在中国人手里,还获得国家网信办等八个部委联合认证。 如今升级到4.0版本的讯飞星火,已经成功对标了目前最好的通用认知大模型GPT-4 Turbo,甚至在文本生成、语言理解、知识问答、逻辑推理、数学等能力上实现超越,不过在代码和多模态能力上还有差距,但在复杂指令的表现中又明显领先。 先弄清楚市场真正想要什么,再设计出符合需求的产品形态,最后为了达到产品目标,花大力气自主科研,这条自下而上倒推的国产大模型之路,算是给今年的落地赛写下了一份可参考的答案。 Part.3 解法成共识 讯飞星火V4.0的发布,或许会成为国产大模型500余天征程路上的一道分水岭。其所展露出的重视用户、强调价值等理念,已经见到市场上愈来愈多的同行跟上。 蓦然回首,2023年的“百模大战”恍如隔世。仅仅在2022年底ChatGPT发布几个月后,国内宣布跟进大模型赛道的互联网大厂和初创企业,就已经超过了100个之多。 为了尽快问世自己的产品,或者拿出能够比肩ChatGPT的有效证明,参数级别和算力规模成为众多企业争相比拼的关键。有英伟达在国内的供应商曾对外表示,一年之内,A100芯片市场上的售价就翻了一倍,主要的大客户涵盖了腾讯、百度、字节跳动、阿里巴巴等互联网巨头,而创业公司较少。 毕竟资本市场更加青睐快速验证的轻资产模式,大笔现金烧向底层基础设施,远远没有快速落地产品试水市场,来得划算。红杉资本去年就曾撰文《生成式 AI 的第二幕》称,目前生成式 AI 应用的最大问题,是需要证明自身的价值,因为目前基于基础大模型开发的应用用户留存率明显不够。 大厂们的动作不可谓不快。阿里巴巴内部孵化出的爆款应用妙鸭相机,一度在社交媒体上刷屏;字节跳动旗下的豆包APP,也从上线初就非常注重拟人化的体验;科大讯飞更是凭借多年在AI产品和服务领域积累的经验,不仅推出讯飞星火APP,还把星火大模型内嵌到汽车、家电、教育、医疗等场景当中,让用户看不见却用得着。 C端卷的是应用,B端卷的就是客户。 今年5月初,央企龙头中国石油集团就传出要加快数字化建设的步伐,随后集团领导先后邀请百度李彦宏、科大讯飞刘庆峰交流会谈,大有广纳业内贤才良言之意。最终在月底的昆仑大模型建设研讨会上,中国石油选定的合作对象由中国移动、华为、科大讯飞强强联手,组成了一支能源化工领域的人工智能“国家队”。而百度虽也早先赢得与中国石油管道局设计院的合作,却在这次工业大模型之争中遗憾略逊。 竞争不会停歇,还要放眼未来。随着技术与行业之争的白热化,国家层面引导扶持的介入,也是一股不可小觑的力量。比如从2017年开始多次改革的国家科学技术奖,更为强调国家战略导向和与重大战略需求的紧密结合。 就在这逐年趋严的背景下,2023年的国家科学技术奖评选中,华为、阿里云、科大讯飞、小米等科技巨头纷纷上榜,其中科大讯飞又凭借“多语种智能语音关键技术及产业化”项目,斩获国家科学技术进步奖一等奖,成为近十年来AI领域首个获此殊荣的企业。 国产大模型们之争还远远没到终局的时候,仅是目前的落地赛,也不是一次交卷定输赢。讯飞星火V4.0的发布,走在了行业前面,更要耐得住同行的奋力追赶。未来的大模型不管再会卷向何方,但都不会背离商业化市场的本质规律,那就是拼技术积累、拼用户规模、拼客户实力、拼社会认可。这可能就是讯飞星火一直都能领先一点的秘籍所在。
科技新知 科技新知

科技新知

06-28 21:23 · 科技领域研究达人

实测四款头部AI高考志愿助手:一个能打的都没有

工具始终是工具,命运还是得掌握在自己手中。 @科技新知 原创 作者丨王思原编辑丨赛柯 虽然AI填报高考志愿,已经不是什么新鲜事,但今年有大模型的加持,让市场变得看点十足。 因为填报志愿,本质上是一套筛选并匹配数据的逻辑:大多数情况下,是根据高考成绩从全国众多大学高校中筛选出不低于门槛的部分,再从这部分中根据考生需求匹配最合适的一项或者几项作为首选和备选。 这项涉及数据、系统和决策的繁杂工作,正好撞在了人工智能大模型的“枪口”上。百度、夸克、QQ浏览器、天工AI等等,一众新老玩家都把“AI报志愿”几个大字放到应用最显眼的位置,成了季度主打。 但有大模型加持的AI志愿填报到底水平如何,是否可靠,也是一直争论不休的话题。尤其是今年,七个省份迎来了首届“新高考”。 新高考采用分类考试、综合评价、多元录取的考试招生制度,与以往相比,在考试、命题、招生、录取等方面都出现了很大变化。新高考赋予了考生更多的选择空间,但也意味着过去的报考经验将不再适用。不过人工智能的帮助是否会让报考变得简单呢? 为了找到答案,我们试用了上述4款市面最火的应用,并且在相同环境、相同条件下对平台进行志愿推荐能力、复杂需求解决能力、推荐解释能力等多方面进行评测,看看最终的结果如何。另外,为了确保测试的公平性,我们所使用的都是各个AI的非付费公开版本,看看在“0收费”的情况下,AI能给出怎样的建议。 Part.1 冲、稳、保,AI三把斧 首先,这四个平台都需要先完善自己的省份以及专业、分数,我们假设自己是来自河南的理科考生,此次高考分数586。 在完善了基本信息后,各个平台会根据高考成绩给到一个具体高考排名,而这个高考排名则是由省招生办提供。 根据这些基础信息,百度、夸克以及QQ浏览器都给到了“可冲击、较稳妥、可保底”三个方向的参考院校,并且在数据层面做得非常全面且详细,从历年分数到招生计划,甚至连学费和细分科目都给了参考。相反天工AI逊色许多,仅给到十余家推荐学院,以及往年的最低录取分数以及排名作为参考。 左右滑动查看 从学校推荐数量来看,百度给到了92所,夸克给到48所,QQ浏览器为55所。但有意思的是,百度提供的92所院校均为可冲击院校,稳妥以及保底院校并未给出推荐。 值得一提的是,这4个平台给到的院校推荐也有一定差别,百度和QQ浏览器以及天工AI给到的院校推荐覆盖全国,且在数据更新上也比较及时,夸克多半为省内院校,对想去省外的考生来说参考价值不大。 图源:科技新知(夸克AI志愿助手) 另外,各个平台给到的院校录取预测概率也有较大差别。拿浙江农林大学举例,在相同条件下,QQ浏览器给到的录取概率为42%,百度给到的概率为20%,夸克则直接不将该学校作为冲刺目标。还有安阳师范学院,夸克和百度均将其列为冲刺目标,且概率为50%左右,而在QQ浏览器上却为稳妥院校。 当然,在百度、夸克以及QQ浏览器中,高考生均可以根据地理位置、院校性质(如985、211或双一流等)、专业偏好等进一步筛选和排序院校,整理志愿信息等,使推荐更加贴合个人需求。天工AI则是以智能体的问答形式所呈现。 图源:科技新知(夸克AI志愿助手) 只是在录取概率这一最重要的功能上,各家差异巨大的分析结果,还有眼花缭乱的大数据,家长看了都很迷惑,更别说刚高中毕业的学生。 而据科技新知结合各家平台给到的信息推测,这些内容均来自权威官网、招生简章、专业书籍以及名师视频等渠道,最后由AI综合全网信息后进行整理总结,靠各家算法进行输出。基本可以理解为靠数据进行简单筛选,给到建议。 如果想要更加精准的借助AI来辅助填报志愿,可以尽可能地将自己的想法与喜好详细告诉AI,以此来获得更准确的答复。这也是体现各家AI水准的重要检测标准。 Part.2 选专业,谁更专业? 在更多需求下,基础的过滤筛选模式变得无力,AI智能体更能理解考生的择校标准,所以各家背后的王牌大模型也成了比较对象。所以我们测试了百度的文心一言、腾讯的元宝、阿里的通义千问以及天工AI四家大模型应用,在面对更详细的志愿填报需求时的表现。 同样,我们需要给自己一个身份设定,假设自己是一位来自河南的理科考生,喜欢踢球、唱歌、动手能力强,对各种实验以及电子产品十分感兴趣,高考分数为520分。虽然描述并不算详细,但也足够让AI建立一个对我们的初步印象,给出专业推荐。 根据这一身份设定,在第一轮回答中,各家给到的结果区别十分明显。 腾讯元宝以及天工AI的推荐十分相似,均是一些理工科主流专业,但两家大模型给到的信息都十分有限,给出的推荐理由也十分勉强,几乎都是围绕“动手动力”这一关键词展开。 图源:科技新知(腾讯元宝推荐) 图源:科技新知(天工AI推荐) 相比之下,通义千问以及文心一言除了考虑到专业选择的实际性,也根据兴趣兴趣提供了相关活动或辅修专业。比如在踢球这个爱好下,提供了体育科学这一辅修专业。 图源:科技新知(通义千问推荐) 图源:科技新知(文心一言推荐) 值得一提的是,相较于其他平台的笼统回答,文心一言更进一步的提供了就业前景、专业细分、跨学科特性等更多参考信息。 图源:科技新知(文心一言推荐) 不过这里需要注意的是,在AI推荐的专业中,并非都是理科统招可以报考的,其中一些需要通过艺考后才能选择,此外不同的学校还会有其他的申请要求,而AI对此并没有太多的说明,这是一个明显的漏洞,需要你继续追问对应专业和学校的相关细节,AI才会给出更详细的回答。 整体看下来,各家AI还是基本完成了初步的专业筛选要求,只是除文心一言和通义千问外,其余两家AI的表现都比较一般,没有带来太多惊喜。通义千问和文心一言的回答更具参考价值,可以让你快速了解自己兴趣爱好所对应的专业情况,节省许多的时间和精力。 不过,选专业的测试并非到此为止,很多考生在选择专业时也会十分关注未来就业形势,然而作为刚结束高考的学生来说,对某个专业了解有限的情况下,AI或许可以根据现有的市场需求、未来的市场发展方向、相关政策等方面给予我们一些建议。那么站在这个角度,AI会提供什么更专业的看法呢? 再向AI输入“4年后,你认为哪个专业会有最好的就业环境?”后,AI的回答也在意料之外。 腾讯元宝、天工AI、通义千问3家平台,都给出了包括新能源、生物科技、人工智能等前沿性专业推荐,文心一言回答的逻辑与其他3家完全不同,给到的是电子信息、计算机等更偏向传统专业。不过4家平台都针对各个专业做了就业方向和行业趋势等分析,给出了更加详细的解释。 图源:科技新知(通义千问回答) 有意思的是,腾讯元宝、天工AI、通义千问3家平台虽然给出了比较专业且更前沿的专业的推荐,但是在没有提供关键词的情况下,都与上一个问题中提到的专业关联性不大,有许多专业都是第一次出现在回答中,而且与提供的兴趣爱好关联性并不大。文心一言提供的专业则与上个回答相似。 图源:科技新知(文心一言回答) 到了这一步,基本可以筛选出一部分合适自己,且是前景较好的专业,那么根据专业以及分数倒推,通过AI志愿助手是否可以帮助考生选出合适的学校呢? Part.3 真实志愿填报,AI只能当辅助 在选好专业后,我们回到百度、夸克、QQ浏览器的AI志愿助手上,看看能否帮助我们选择一个靠谱的院校,毕竟真实的志愿填报除了院校,专业的选择也至关重要。这里我们将各个平台的筛选模型改为专业优先,并且专业选择为计算机类。 首先是百度,在选择想要报考的专业后,并没有筛选出合适的院校,甚至排位顺序都没有改变。点开默认排序的第一个院校,虽然显示有20%的冲击概率,但仅有一个专业有20%概率,而我们想要选择的计算机类专业,则只有9%的冲击概率。 图源:科技新知(百度AI志愿助手) 如果将选择改为录取概率从高到底也是如此,虽然不少院校的外显概率很高,但点开后均非我们所选的计算机专业。 在整个筛选过程,百度的AI志愿助手几乎没有体现出任何智能,连基础的筛选排序都未能如意。不过,“老师傅”夸克也没有给到我们太大惊喜。 夸克虽然筛选出了符合条件的院校,但与百度相似,外显概率显示的也是本校最高概率的其他专业,而非我们想要报考的计算机专业。我们点开一个外显为60%的稳妥院校,但计算机类专业的录取概率为19%。 图源:科技新知(夸克AI志愿助手) 相比之下,QQ浏览器的筛选能力更直观,在选择计算类专业后,过滤掉了45所,仅剩下10所院校,虽然与前两者一致,外显的并非是我们所选专业的录取概率,不过逐一点开后发现也还算贴切。 图源:科技新知(QQ浏览器AI志愿助手) 纵观这三个平台,其实可以发现一个共同点,就是各家均以院校为重,录取概率也是按照院校中要求最低专业的概率来计算,但如今家长、学生对于志愿填报早已不是单纯只看学校,专业选择也十分重要,但显然AI志愿助手还不能给到好的建议,甚至连打辅助都难。 坦白讲,让看似“聪明”的AI来填志愿,似乎不太靠谱。浙江大学计算机科学与技术学院教授陈华钧看了AI的回答后,也是连连摇头,“它不是专门为填志愿训练的,算法的训练很大程度依赖于训练数据的选择,这包括了建模方式,对考生、学校和专业到底怎么评估,这个过程每个AI工具都不会一样,所以给到的结果也不尽人意”。 不过夸克相关人员也向科技新知表示,AI志愿助手作为信息参考工具,跟市面上的收费咨询服务是有本质的不同,最终的志愿填报策略和选题的决定权还是在用户手里,需考量自身兴趣、家庭背景、成长规划等。 对于多数考生来说,只要利用好AI的能力,在填报志愿时确实可以起到事半功倍的效果。而且以上的AI功能,大多是免费提供的,并不需要支付会员费用或是缴纳高昂的辅导费,这一定程度上也让可以拉近与其他考生的差距。但高考志愿填报除了复杂的分析、计算外更看重考生本身的意愿,很多时候,无论怎么选,都不会完美,都会有遗憾,不过请不要忘了,命运永远是掌握在自己手中的。
科技新知 科技新知

科技新知

06-28 09:42 · 科技领域研究达人

OpenAI“停服” ,国产大模型能否接棒?

在人工智能领域,OpenAI的一举一动牵动着全球从业者的心。近日,OpenAI宣布停止对中国的API服务,将对中国“断供”。 北京时间6月25日凌晨,有开发者收到了OpenAI的邮件,邮件写道:“数据显示,您组织的APl流量来自OpenAl目前不支持的地区。”并表示:“从7月9日起,我们将采取额外措施,阻止来自不在我们支持的国家和地区列表中的地区的APl流量。” 根据OpenAI官网,支持访问API服务的国家和地区总计161个,不包括中国内地与中国香港。OpenAI官网还提到,除了被允许的国家和地区外,“访问或提供访问我们的服务,可能会导致您的账户被封锁或暂停。” 科技新知从多位AI大模型从业者处获知,确实收到了这封邮件。业内人士认为,OpenAI出于对成本以及数据安全的考量而停止在中国的API服务。 2023年3月,OpenAI宣布开放API,允许第三方开发者通过API将ChatGPT集成至他们的应用程序和服务中。The Information报道,自去年12月起, OpenAI年化收入翻了一倍,达到34亿美元,其中32亿美元源自其订阅服务与API访问。 借助OpenAI大模型“套壳”创业的公司,将迎来毁灭式打击。“对于依赖OpenAI API的‘套壳’公司来说,他们可能需要寻找其他的API服务供应商或者寻找替代方案来维持其服务。”中国人工智能学会专家、深度科技研究院院长张孝荣对科技新知表示,“这可能需要对新的供应商进行调查,了解其服务的特点、质量和价格,并进行相应的技术调整和适配。” 01 国内厂商“抢单” 技术社区的讨论很快传导到市场,OpenAI的“停服”消息一出,国内AI大模型公司纷纷上线“迁移计划”,且一举打出“免费”旗号。 6月25日,百度智能云千帆推出大模型普惠计划,为新注册企业用户提供0元调用、0元训练、0元迁移等服务,其中,文心旗舰模型首次免费,针对OpenAI迁移用户额外赠送与OpenAI使用规模对等的ERNIE3.5旗舰模型Tokens包。 阿里云百炼宣布,将通义千问GPT4级主力模型Qwen-plus的API定价为OpenAI的1/50,并为中国开发者提供2200万免费tokens和专属迁移服务。 腾讯云为新注册企业用户免费赠送腾讯混元生文1 亿Tokens,还将为新迁移企业用户提供免费专属迁移工具和服务。 除了头部大厂,国内几个AI大模型代表性初创企业也纷纷争夺这波流量。智谱AI推出了“OpenAI API 用户特别搬家计划”,为开发者提供1.5亿Token,以及从OpenAI到GLM的系列迁移培训;Kimi当天发布迁移方案,称Kimi开放平台接口完全兼容OpenAI,最快5分钟实现搬家;零一万物发起“Yi API 二折平替计划”,推出了平滑迁移至Yi系列大模型的服务。 硅基流动(SiliconFlow)甚至将Qwen2-7B、GLM-4-9B、Yi-1.5-9B等开源大模型永久免费,创始人袁进辉在朋友圈称:“今天SiliconCloud把一大批模型都免费了,大家轻薅,别给整破产了。” 显然,国内大模型公司试图抓住这一关键“窗口期”,为自己争取到更多的开发者用户。 著名财经金融评论员余丰慧对科技新知表示,“大模型公司如百度智能云等推出‘特别搬家计划’,不仅是为了抢占市场份额,也是在展现其技术支持和服务能力,有助于快速建立用户信任。” 实际上,早在618前夕,国内大模型公司就已经展开了价格战。从降价到免费,这波降价潮也体现了国内大模型行业的激烈竞争。 5月,大模型行业开始加码性价比。发布GPT-4o时,OpenAI宣布调用GPT-4o模型API 的价格比GPT-4Turbo下降一半,处理100万Token只用5美元;Google也将其主力模型 Gemini 1.5 Pro的调用价格调低了一半,处理100万Token只要3.5美元。 但国内大模型公司可不是打五折这么简单,而是动辄90%的降价幅度。 5月11日,智谱AI降价80%,入门级产品GLM-3 Turbo模型调用价格从5元/百万Tokens降到1元/百万Tokens;5月15日,字节的豆包大模型对外提供服务,并将处理输入文本的价格定在0.8元/百万Tokens,宣称比行业水平便宜了99.3%;5月21日,阿里Qwen-Long API输入价格降到0.5元/ 百万 Tokens;百度宣布主力模型文心一言ERNIE Speed和Lite模型免费;腾讯宣布轻量大模型 “混元-lite” 免费,最高配置的万亿参数模型 “混元-pro” 降至300元/百万 Tokens,降幅70%。 “通过提供价格优惠和高质量的替代服务,这些公司不仅能够在短期内吸引客户,还有机会在长期内培养用户忠诚度。一旦用户习惯了新的服务,并发现其满足或超越了他们的期望,他们可能会长期留存。”大数据业务分析师、北京社会科学院副研究员王鹏对科技新知表示。 用低价扩大用户规模,再用服务留存用户,这是正确的思路。然而,便宜并不等于好用,在尚未跑通应用场景的情况下,国内大模型公司开始卷价格,AI热潮下的市场焦虑极其严重。 02 AGI行业面临洗牌 OpenAI停服,国内大模型公司反应迅速,意味着市场将极速调整。 API即应用程序编程接口(Application Programming Interface),应用开发者等企业用户可通过接入OpenAI的大模型服务,在各类应用软件中植入ChatGPT机器人的AI能力,将一个普通软件升级为AI应用。 因此,OpenAI停止对中国的API服务,直接冲击了不具备自研大模型能力的大模型开发商。目前,他们可以使用海外服务器,绕开限制接入API;否则,他们就必须选择国内其他的大模型API。 对此,余丰慧指出,依赖OpenAI API的初创企业和研发团队可能会面临服务中断,影响产品开发进度和用户体验。其次,对于使用其技术进行AI创新的研究机构和高校,可能会阻碍相关研究项目的进展。 此外,这可能会促使行业加大对本土AI技术的投资与自主研发,长期看有利于本土生态的构建,但短期内可能遭遇技术替代的挑战。 6月26日,360集团创始人、董事长@周鸿祎在微博发布视频称,他认为“OpenAI对中国地区停止服务,只能加速中国自己大模型产业的发展,未必是坏事”,他解释道,“OpenAI的API无法调用,这逼着国内应用只能选择国产大模型,而国产大模型与GPT的差距已经逐渐缩小了。” 国产自研大模型的能力,仅次于美国,正逐渐展现出竞争力。 根据斯坦福最新公布的大模型测评榜单HELM MMLU,通义千问Qwen2-72B得分为0.824,与GPT-4并列全球第四。 6月25日,每日经济新闻发布了《每日经济新闻大模型评测报告》(第一期),报告显示,国产大模型正在全面赶超海外大模型。 零一万物Yi-Large成为最大“黑马”,在“财经新闻标题创作”“微博新闻写作”“文章差错校对”“财务数据计算与分析”四大应用场景的总分排名第一。幻方求索DeepSeek-V2、百川智能Baichuan4则在“财务数据计算与分析”场景显示出强大的数据计算和分析能力。而一直备受各界推崇的GPT 4.0在本次评测中表现不佳,甚至在“财经新闻标题创作”场景中排名垫底。 事实上,在中文语境中,国内自研大模型展现出了显著的优势,特别是在处理中文自然语言任务方面,这些模型能够更好地理解和生成中文内容,从而在中文问答、对话、翻译等任务中表现出色。 例如,腾讯混元大模型,作为腾讯全链路自研的通用大语言模型,其参数规模超过万亿,展现了卓越的中文理解与创作能力、逻辑推理能力以及可靠的任务执行能力,其AI助手App腾讯元宝即展现了强大的AI能力和丰富的应用场景。 此外,中国的大模型更加注重图像、视频等多模态数据的研究,展现出强大的适应性和泛化能力。 近日,智源研究院院长王仲远在接受网易科技采访时指出,“(AI行业)基础模型依然亟待突破,整个国内的大模型依然处在赶超GPT3.5的阶段。国内大模型在中文的语境下已经开始能够接近逼近GPT4,但是GPT4也在不断研发新版本,所以依然处于追赶的局面。” 03 国产大模型创新路 摈弃GPT,走向全面自研,这对于国产大模型来说,这是一条真正创新的道路。 实际上,去年12月,OpenAI公司就已经暂停字节跳动访问API,而这是因为,字节跳动使用OpenAI的技术来帮助开发自己的人工智能大模型。根据第一财经报道,字节跳动承认,公司2023年初开始探索构建大模型,有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。 无独有偶,去年11月,零一万物也被传出套壳消息,其回应媒体称,在训练模型过程中,沿用了GPT/LLaMA的基本架构,但需要说明的是,借鉴架构并不能跟“套壳”或者“抄袭”直接划等号。 过去,国产大模型的自研之路,或多或少都借鉴了OpenAI等国外大模型的技术,这是不可否认的事实。 “随着外部竞争的减少,国内AGI(通用人工智能)行业或将进入一个加速整合与创新的阶段。” 余丰慧指出,企业间的竞争将更加聚焦于技术突破、应用场景的拓展以及用户体验的优化。头部企业可能会加大研发投入,推动算法模型的迭代升级,力求在性能上超越国际同类产品。 王鹏也表示,OpenAI的停服,将加速国内AGI行业的技术创新。为了减少对外部技术的依赖,国内企业需要加大研发投入,突破技术壁垒,开发出更高效、更智能的大模型。 目前,随着算法和算力等技术提升,国产大模型正纷纷进入万亿参数时代。现阶段,从算法创新到数据端比拼,国产大模型跟国际水平仍有一定差距。 从技术路线看,国内大模型不具备原创理论支撑,研发以追随海外先进成果为主。例如,人工神经元模型、知识图谱、深度学习框架、Transformer架构等开创性技术,大多由美国科学家提出。 从全球范围来看,中文语料库跟英文数据集的差距不容小觑。受制于搭建数据集较高的成本以及尚未成熟的开源生态,国内开源数据集在数据规模和语料质量上相比海外仍有较大差距,数据来源较为单一,且更新频率较低,模型的训练效果受限。 技术攻坚后,推动场景应用落地,发挥商业化的价值,也是国内AGI行业需要前进的方向。随着OpenAI的退出,外狼”正在减少,国产大模型行业需要走出自己的新道路。