清华大学 中国首个sora 火了

中国首个长时长、高一致性、高动态性视频大模型——Vidu。 对标 sora

4月27日,在2024中关村论坛年会未来人工智能先锋论坛上,清华大学联合生数科技正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。

该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容,画面效果跟Sora极为接近。

自 Sora 发布之后,「国产 Sora」的争夺战就打响了。但当行业都聚焦于「长」这一特性时,却都忽略了 Sora 的背后其实是综合效果的提升,例如长时序下的一致性、真实度、美观性等等。

从综合效果看,「Vidu」是首个也是唯一在效果层面全面对标 Sora 的视频模型,不仅仅在国内,在全球范围,也是继 Sora 之后首个完成突破的视频模型。从具体效果,可以显著看到几处明显的优势。

可以看出,它生成的视频不再是持续几秒的「GIF」,而是达到了十几秒(最长可以达到 16 秒左右)。当然更令人惊喜的是,「Vidu」画面效果非常接近 Sora,在多镜头语言、时间和空间一致性、遵循物理规律等方面表现都非常出色,而且还能虚构出真实世界不存在的超现实主义画面,这是当前的视频生成模型难以实现的。在短短两个月的时间,生数科技能实现到这般效果,着实令人惊喜。

今年年初,OpenAI发布Sora爆火后,掀起了全球竞逐AI视频生成的热潮,也让外界对大模型的关注焦点从单模态转向多模态。而Vidu的发布,则是国内首个具备“长时长、高一致性、高动态性”等特点的视频大模型。

据相关人士介绍,Vidu能够支持生成更加多样化、更长时长的视频内容,同时面向未来,灵活架构也将能够兼容更广泛的模态,进一步拓展多模态通用能力的边界。

生数科技成立于2023年3月,核心团队来自清华大学人工智能研究院,此外还包括来自北京大学和阿里巴巴、腾讯、字节跳动等科技公司的多位技术人才。

去年,生数科技完成多笔融资,投资方包括蚂蚁集团、锦秋基金等。今年3月,生数科技完成新一轮数亿元融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。

浦银国际表示,多模态被视为AIGC行业2024年重要趋势之一。根据量子位《中国AIGC应用全景报告》,2024年我国AIGC应用市场规模将达到人民币200亿元,预计到2026年,中国AI市场规模将达千亿级别;到2030年,中国AIGC应用市场规模将达万亿元。

从概念股业绩数据来看,75只已出2023年年报的多模态AI概念中,33股实现业绩增长或扭亏,其中大华股份、云鼎科技、浙文互联、洲明科技、万兴科技、盛视科技2023年业绩翻倍增长,利欧股份、新大陆、佳都科技、千方科技等扭亏为盈。

清华大学,生数科技的控股母公司瑞莱智慧及战投智谱华章,都是并行AI云的客户。

逻辑不强不做,没有预期不做

强逻辑的加持和推进是投机的核心

梦想在诗和远方,永远只看当下!

因为热爱--所以执着

永远只做顺势

富哥小圈逻辑不代表任何资金及媒体观点

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论