中国青年报客户端上海7月7日电(中青报·中青网记者 王烨捷)7月4日至7日,2024世界人工智能大会举办期间,很多创新企业拿出了“看家本领”。中青报·中青网记者注意到,大会上不仅人形机器人多得看不过来,各种大模型解决方案也令人印象深刻。

来自本次大会组委会的官方信息显示,本次大会展览规模、参展企业数、亮点展品数、首发新品数均达历史最高。展览总面积5.2万平方米,500余家企业参展,上海市外企业和国际企业占比超50%,展品数量超1500项。

展览现场一排又一排的人形机器人形成震撼效果。中青报·中青网记者 王烨捷/摄

针对一些大模型文字转视频时长不够长、内容不够真实的问题,快手在大模型论坛上,发布了其视频生成大模型可灵、图像生成大模型可图等产品。其中,可灵能生成清晰的高画质,有首尾帧控制、镜头控制等新功能,创作者单次生成的文生视频时长增加至10秒;可图则宣布正式开源。

视频为快手相关负责人介绍视频生成大模型可灵。中青报·中青网记者 王烨捷/摄

快手副总裁、大模型团队负责人张迪表示,将用大模型技术重塑快手业务。在内容生产方面,快手打造“新一代AIGC创作、素材工具”和低门槛、智能化的内容生产体验;在内容消费领域,快手升级了内容理解和分发体系,提升用户的消费体验。

值得关注的是,国内首部AIGC原创奇幻短剧《山海奇镜之劈波斩浪》预告片也在世界人工智能大会上亮相。可灵为该剧提供深度技术支持。“可能半年以前,大家都没法想象真正用AIGC来制作电影,(现在它)来了!”张迪说。

这场大会上,中国计算机学会(CCF)与快手携手宣布共同成立“CCF-快手大模型探索者基金”,并同步开启基金申请通道。该基金计划于年内推出12个研究项目,课题最高可获30万元支持,旨在应对AI技术迅猛发展的趋势及业界对前沿技术的迫切需求,聚焦新一代大模型的关键技术研发。基金特别针对“大语言模型”、“视觉理解与生成”、“视频处理大模型”、“代码大模型”以及“语音大模型”五大核心领域。

现场,“扫描全能王”等实用办公软件的母公司合合信息也拿出了看家本领,展示大模型“加速器”解决方案。在大模型训练的上游阶段,“加速器”中的文档解析引擎将助力大模型突破在书籍、论文、研报等文档中的版面解析障碍,从源头为模型训练与应用输送纯净的“燃料”,助力大模型跑得更快。

文档解析技术是支撑大模型语料训练的关键技术之一,面临从海量文档中高效提炼“智慧燃料”的艰巨任务。合合信息此次发布的文档解析引擎最快1.5秒可解析百页长文档中的文本、表格、图像等非结构化数据,是当前市面上同类文档解析引擎中处理速度最快的产品之一。同时,引擎还具备优秀的文档“理解力”,可智能还原文档阅读顺序。

展会现场,参观者可选择物理、医学、金融、社会学等多个知识领域的文档,向大模型提问专业问题,例如对特定表格内容的总结、关键要素的分析等。此外,这种文档解析引擎还能把复杂的漂亮图表,变成“干货”。

图表变“干货”。合合信息供图

很多人在使用大模型时会遇到“已读乱回”的情况,合合信息大模型“加速器”加载了acge_text_embedding模型(简称“acge模型”),它能像“指南针”一样,引导大模型在信息的汪洋大海中准确定位目标,减少“幻觉”发生,提升回答问题的准确性和针对性。

目前,这款大模型“加速器”已被多家大模型厂商应用于金融、医学、财经、媒体等多领域的文档的解析中。

来源:中国青年报客户端

友情提示

本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!

联系邮箱:1042463605@qq.com