我国自研视频大模型面向全球上线

　　输入文字描述或上传图片，就能生成一段逼真视频。近日，我国自主研发的通用视频大模型Vidu（www.vidu.studio）面向全球正式上线。据悉，这款视频大模型开放文生视频、图生视频两大核心功能，提供4秒和8秒两种时长选择，分辨率最高达1080P，生成一段4秒的视频片段经实测仅需30秒。

　　Vidu由清华大学联合北京生数科技有限公司共同研发，于今年4月在2024中关村论坛年会上首次发布。清华大学人工智能研究院副院长、北京生数科技首席科学家朱军介绍，Vidu具有“长时长、高一致性、高动态性”的特点，可根据文字和图片生成高清视频，且能保持高流畅、高动态的画面效果。截至目前，Vidu可支持一次性生成最长32秒的视频。

　　“Vidu能模拟真实物理世界，生成细节复杂且符合物理规律的场景，例如合理的光影效果、细腻的人物表情等，还能创造出具有深度和复杂性的超现实主义内容。”朱军说，对于科幻、西部、浪漫、动画等多类型电影，Vidu能生成符合对应风格的画面片段，还能生成影视级特效画面，如烟雾、炫光等效果。

　　据介绍，在动态性方面，Vidu可生成复杂动态镜头，支持大幅度、精准的动作生成，能在画面里实现远景、近景、中景、特写等不同镜头的切换，能直接生成长镜头、追焦、转场等效果。

　　记者从北京生数科技有限公司获悉，除文生视频和图生视频的两大基础功能外，为了给用户提供更多样化和个性化的视频创作体验，Vidu还上线“动漫风格”和“角色一致性”两大新功能。在“图生视频”板块中，利用“角色一致性”功能，用户可上传人像图或自定义的角色图，通过文字描述就可指定图中角色在任意场景中做任意动作。该功能简化了视频制作流程，也提升了创作自由度。

　　据悉，操作Vidu无需申请，用户直接使用邮箱注册即可上手体验。Vidu的技术突破源于研发团队在机器学习和多模态大模型方面的长期积累，其核心技术架构由团队在2022年就提出并持续开展自主研发。（记者魏梦佳）

友情提示

本站部分转载文章，皆来自互联网，仅供参考及分享，并不用于任何商业用途；版权归原作者所有，如涉及作品内容、版权和其他问题，请与本网联系，我们将在第一时间删除内容！

联系邮箱：1042463605@qq.com

我国自研视频大模型面向全球上线

友情提示

嫁给密春雷的董卿，“上当”了！

诬陷朱军性骚扰6年后，名利双收的弦子，如今怎么样了？

小逄观星｜我忽然也有了信心

项立刚：柔宇破产说明那些名校毕业，技术出身者去创业不容易成功

曝北航女生作弊被抓，清华男友暴打辅导员，照片被扒，高考722分

掌握人生主动权的女生，太飒了！

原配抓小三，男子从妻子手中解救小三头也不回的就走啦！！

遇到这样的大爷应该怎么做？

文在寅卸任后待遇：每月1400万韩元退休金，配备65名警卫全身而退

过了60到70岁的老人一定要注意，听听她怎么说？

男子举报“邻居家有车有房吃低保”，纪委调查：该家庭三人享低保符合条件，不存在违规

京A摩托车车牌含金量有多高？路权有多牛？看完你就知道了

领克Z20上市限时13.59万元起

特朗普能挽救美国霸权吗

三战是否已经开始？普京回应

哈登生涯总得分超越邓肯

幼儿园“小学化”倾向？教育局回应

中方反制加拿大2个机构及20名人员