清华大学中国首个sora 火了-格隆汇

清华大学中国首个sora 火了

04-29 11:23

13,192

中国首个长时长、高一致性、高动态性视频大模型——Vidu。对标 sora

4月27日，在2024中关村论坛年会未来人工智能先锋论坛上，清华大学联合生数科技正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。

该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT，支持一键生成长达16秒、分辨率高达1080P的高清视频内容，画面效果跟Sora极为接近。

自 Sora 发布之后，「国产 Sora」的争夺战就打响了。但当行业都聚焦于「长」这一特性时，却都忽略了 Sora 的背后其实是综合效果的提升，例如长时序下的一致性、真实度、美观性等等。

从综合效果看，「Vidu」是首个也是唯一在效果层面全面对标 Sora 的视频模型，不仅仅在国内，在全球范围，也是继 Sora 之后首个完成突破的视频模型。从具体效果，可以显著看到几处明显的优势。

可以看出，它生成的视频不再是持续几秒的「GIF」，而是达到了十几秒（最长可以达到 16 秒左右）。当然更令人惊喜的是，「Vidu」画面效果非常接近 Sora，在多镜头语言、时间和空间一致性、遵循物理规律等方面表现都非常出色，而且还能虚构出真实世界不存在的超现实主义画面，这是当前的视频生成模型难以实现的。在短短两个月的时间，生数科技能实现到这般效果，着实令人惊喜。

今年年初，OpenAI发布Sora爆火后，掀起了全球竞逐AI视频生成的热潮，也让外界对大模型的关注焦点从单模态转向多模态。而Vidu的发布，则是国内首个具备“长时长、高一致性、高动态性”等特点的视频大模型。

据相关人士介绍，Vidu能够支持生成更加多样化、更长时长的视频内容，同时面向未来，灵活架构也将能够兼容更广泛的模态，进一步拓展多模态通用能力的边界。

生数科技成立于2023年3月，核心团队来自清华大学人工智能研究院，此外还包括来自北京大学和阿里巴巴、腾讯、字节跳动等科技公司的多位技术人才。

去年，生数科技完成多笔融资，投资方包括蚂蚁集团、锦秋基金等。今年3月，生数科技完成新一轮数亿元融资，由启明创投领投，达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。

浦银国际表示，多模态被视为AIGC行业2024年重要趋势之一。根据量子位《中国AIGC应用全景报告》，2024年我国AIGC应用市场规模将达到人民币200亿元，预计到2026年，中国AI市场规模将达千亿级别；到2030年，中国AIGC应用市场规模将达万亿元。

从概念股业绩数据来看，75只已出2023年年报的多模态AI概念中，33股实现业绩增长或扭亏，其中大华股份、云鼎科技、浙文互联、洲明科技、万兴科技、盛视科技2023年业绩翻倍增长，利欧股份、新大陆、佳都科技、千方科技等扭亏为盈。

清华大学，生数科技的控股母公司瑞莱智慧及战投智谱华章，都是并行AI云的客户。

逻辑不强不做，没有预期不做

强逻辑的加持和推进是投机的核心

梦想在诗和远方，永远只看当下！

因为热爱--所以执着

永远只做顺势

富哥小圈逻辑不代表任何资金及媒体观点

格隆汇声明：文中观点均来自原作者，不代表格隆汇观点及立场。特别提醒，投资决策需建立在独立思考之上，本文内容仅供参考，不作为实际操作建议，交易风险自担。

清华大学中国首个sora 火了

相关阅读

评论

清华大学 中国首个sora 火了

相关阅读

评论

清华大学中国首个sora 火了