对标GPT-4 Turbo的“日日新5.0”,市场给予了最直接的反馈。

4月24日早上,在底部徘徊一段时间的人工智能公司商汤大幅飙升,盘中涨幅一度超过36%。约11点14分,商汤已暂停交易,停牌前上涨31.15%。

证券时报记者从商汤科技获悉,“基于昨日‘日日新大模5.0’发布会受到市场极大关注,依照上市规则及港交所建议,公司将进一步刊发相关公告。”业内人士表示,预计商汤今天下午将恢复交易。

4月23日,商汤科技在上海举行的SenseTime技术交流日活动现场发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,同时升级“日日新SenseNova 5.0”大模型体系,且称综合能力全面对标GPT-4 Turbo。

“日日新”大模型5.0发布

商汤科技打造新型人工智能基础设施——商汤AI大装置SenseCore,打通算力、算法和平台,并在此基础上建立“商汤日日新SenseNova”大模型及研发体系。

自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。此次更新主要增强了知识、数学、推理及代码能力,全面对标GPT-4 Turbo,主流客观评测上达到或超越GPT-4 Turbo。

在文科能力方面,“日日新5.0”的创意写作能力、推理能力以及总结能力均大幅提升,相同的中文知识注入后,可以获得更好的理解总结及问答,为教育、内容产业等垂直应用场景提供有力辅助。

商汤科技董事长兼CEO徐立在现场演示中,问了“日日新5.0”和GPT-4同一个趣味推理问题:“妈妈给圆圆冲了一杯咖啡,圆圆喝了半杯后,将它加满水,然后她又喝了半杯后,再加满水,最后全部喝完。问圆圆喝的咖啡多,还是水多?”结果显示,“日日新5.0”回答正确。

在理科能力方面,“日日新5.0”数理能力、代码能力及推理能力也达到业内领先水平,为金融、数据分析等场景落地提供坚实基础.

在应用产品层面,“日日新SenseNova5.0”也实现了多模态能力,支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展示,还具备丰富的多模态交互能力。

“一个生日蛋糕,上面写上‘happy birthday’的字样,有草莓点缀,紫色奶油”,在交流日体验现场,证券时报记者看到,工作人员在商汤日日新·秒画文生图大模型中输入这句话,片刻即可生成四幅逼真的生日蛋糕照片。

徐立表示:“商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”

首推全栈大模型产品矩阵

在洞察中心化算力需求向端侧扩展的未来趋势及企业级在边缘侧的AI需求,商汤科技此次还在业内首次推出“云、端、边”全栈大模型产品矩阵,其中包括应用于终端设备的“商汤端侧大模型”,以及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”。

生成式AI正加速向产业落地。在交流活动上,商汤邀请到金山办公、海通证券、小米、阅文集团、华为等多位生态伙伴嘉宾,共同探讨和交流大模型技术在办公、金融、出行等不同领域的应用及前景。

自2023年起,商汤与金山办公达成深度合作,基于“日日新”大模型的代码生成及工具调用能力,助力WPS 365打造办公新质生产力平台,为企业构建专属的“企业大脑”。

在个人出行场景,小米汽车SU7的智能车舱中即应用了商汤的大模型技术,基于商汤端云大模型解决方案,小米小爱同学为车主提供智能化交互体验。小米集团小爱总经理王刚在与商汤科技联合创始人、首席科学家王晓刚对话时表示:“商汤的云边端全栈组合,可以很好地赋能和适配小米物联网生态。”

此外,商汤现场还发布了基于昇腾原生的行业大模型,共同打造面向金融、医疗、政务、代码等大模型产业生态。

“文生视频”已在路上

在本次技术交流日现场,徐立还带来了三段完全由大模型生成的视频,并强调文生视频平台对于人物、动作和场景的可控性。

证券时报记者获悉,商汤科技在文生视频平台方面也取得了技术突破,未来,通过输入一段文字或一个完整的描述,就可以生成一段视频,而且人物的服饰、发型、场景都可以根据预先设定,保持视频内容的连贯性和一致性。

“一方面,现阶段大模型发展已进入落地阶段,如何与产业、应用场景结合是关键一环。”徐立表示,“另一方面,‘尺度定律’路径逐渐清晰,‘涌现’时刻不定出现,前瞻探索最先进的大模型技术也是重中之重。”

上海已有24款大模型通过备案

商汤“日日新”大模型是上海大力发展大模型的缩影。在商汤科技SenseTime技术交流日活动上,上海市经信委副主任张宏韬表示,人工智能是上海引领新一轮科技革命和产业变革的战略性技术。2018年以来,上海借助世界人工智能大会这一平台,加速发展人工智能,尤其是2023年大模型的问世,驱动人工智能进入新阶段,迎来了新机遇。

“在这样的形势下,上海加速打造自主可控的技术大模型,加快垂直领域的应用落地,这对构建产业生态具有重要的意义。” 张宏韬说。

经过近5年的发展,上海目前已初步形成人工智能较为完善的产业生态,产业集群发展有序推进,规上企业数量、产业规模和人才实现了三个“倍增”。

面对新形势新要求,上海去年出台了推动大模型产业发展的11条措施,引进培育各类大模型企业集聚发展。目前,上海企业和科研机构已有24款大模型通过国家相关部门备案,数量居于全国前列,并形成了在工业、金融、文旅、航运、物流、安防等多个领域垂直落地的典型案例。

张宏韬表示,上海将持续激活要素资源,打造智能算力的调度平台,实施算力补贴,降低企业创新成本,加快高质量语料库的建设和开源开放,鼓励各类资本加大对人工智能的投入和支持,持续优化人工智能产业生态。

友情提示

本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!

联系邮箱:1042463605@qq.com