随着OpenAI又出王炸,其最新推出的文生视频大模型Sora点燃了市场热情。

今日,当虹科技、因赛集团、万兴科技、会畅通讯、易点天下等20CM涨停,数码视讯大涨超14%,华扬联众、新国脉涨停,云从科技涨超8%。

《科创板日报》记者获悉,当虹科技、虹软科技、云从科技等上市公司在相关领域已有探索。多家机构表示,文生视频技术的发展将带动AI在媒体、游戏、电商等行业应用落地的机遇,也将推动对算力、光模块等基础设施的持续需求。

▍多家上市公司有相关技术积累

当虹科技相关负责人向《科创板日报》介绍,其技术主要集中在文生视频、生成式视频的识别等方面。

我们的文生视频技术已取得一定进展。在生成视频时长和效果方面,还在逐渐突破。在生成式视频的识别上,生成式人工智能飞速发展,甚至肉眼真假难辨。我们的AI智能审核技术,可对人工智能生产的视频进行分析和识别。”

生成式视频技术为视频生产效率带来革命。同时,海量的生成式视频,尤其是三维空间视频,对传输和存储带来非常大的挑战。当虹科技方面称,通过点云模型转换及压缩算法,可以为三维体积视频“瘦身”,最终实现高达800倍的视觉无损压缩,解决三维体积视频的传输难题。

易点天下董秘王萍此前接受媒体采访时称,公司接入了GPT-4、Anthropic、PaLM、LLAMA、ChatGLM、通义千问、盘古、百度文心等大模型,通过闭源模型的微调工程化,还有开源模型的重训练,形成了符合易点天下自身业务场景模型,实现了包括营销数字人模型、企业知识库模型、素材生成模型、AI问答客服模型、AI垂直电商模型等业务场景模型。

对于文生视频大模型Sora的发布,易点天下证券部人士对《科创板日报》记者表示,Sora大模型还没有开放接入,未来有望利用其降本增效。目前公司的AI产品和落地应用是数字人生成。

云从科技相关负责人向《科创板日报》记者介绍,文生视频是多模态大模型的功能之一,公司在视觉方面积累较为深厚。

目前,云从科技的从容大模型基于diffusion架构实现了图像视频生成能力,围绕人物图像、视频数据进行建模,通过文本和音频实现对图像和视频内容进行生成、控制、编辑。应用上,云从科技与天津港、华为等共同开发港口大模型PortGPT,其核心是AI智能体天天,通过AI生成交互画面,协同数据分析,提高港口运转效率及安全性。此外,云从科技还在文生图像、视频等跨模态领域有所布局,包括发布数字人能力平台,生成AI视频;与中国电信合作AI营销海报生成等。

《科创板日报》记者进一步获悉,虹软科技的大模型技术引擎虹软ArcMuse,近期也再次升级,将支持面向商拍的商业视频自动生成。据介绍,在产品功能落地上,ArcMuse引擎实现了两大功能:一是商品展示视频的自动生成,二是服装模特视频的自动生成。提交一张平面模特图,ArcMuse引擎几分钟能生成一段视频,模特将在视频中展示服装的细节,包括向左/向右摆造型,还可以360度缓慢转身。

▍AI向3.0阶段升级 带动算力侧、行业应用等发展机遇

自2023年初以来,AI大模型浪潮席卷全球并持续火热,Sora大模型在文生视频上的进一步突破,被认为将加速推动人工智能“奇点”临近。

商汤智能产业研究院院长田丰对《科创板日报》表示,Sora大模型的出现印证了AI 2.0向AI 3.0升级的三个方向

第一、模型认知,从“现象”到“本质”:不仅学习视频,更需要全面理解物理世界的底层规则。

其二、多模态模型展现,从“2D到3D”:先创作好二维图片(视频是连续的一组图片),再创作精准度越来越高的3D视频(可降维到2D展现)

第三、人机协作,从展现到交互,从交互到改造:当人能够完成与仿真的虚拟物体精确交互、复杂任务时,意味着逐步掌握了物理世界的智能改造能力,当下的视频生成、大模型软件“皆是序章”。

中金公司认为,首个文生视频模型诞生,长期或为工业数字仿真、场景模拟、机器人多模态识别转换带来改变,或利好制造业数字化改造

除OpenAI的Sora大模型外,谷歌于2月15日也发布了其大模型Gemini1.5,并将上下文窗口长度扩展到前所未有的100万个tokens。

国金证券称,OpenAI视频生成模型Sora及Gemini1.5 AI模型预计将对AI芯片的需求大幅提升,OpenAI CEO奥特曼计划募集七万亿美元资金,颠覆AI芯片和芯片制造。随着AI大模型不断升级,AI芯片、HBM芯片、AI服务器、光模块/光芯片及交换机等相关产业链持续受益。这两个模型的发布对短视频、影视剧制作、文本创作等领域均有望带来巨大变革

本文源自科创板日报

友情提示

本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!

联系邮箱:1042463605@qq.com