主页 › 阅读 › 热点 › 探访北京新质生产力·走出实验室｜看不见的大模型，看得见的生产力

探访北京新质生产力·走出实验室｜看不见的大模型，看得见的生产力

北京商报发布于 2024-08-05 18:42:19

65 0

2017年，人工智能首次被写入中国政府工作报告，上升成国家战略，2018年，北京智源人工智能研究院（以下简称“智源”）诞生于领创空间一个小小的办公室。那时的OpenAI上线的第一代GPT模型还没占领媒体头条。

2023年，智源将我国首个超大规模智能模型“悟道”升级到3.0，成为微软总裁布拉德·史密斯心中全球最前沿的三个AI机构之一。在大模型领域，智源是全球唯一没有背靠大厂的非企业研究机构，也是国内最早系统布局大模型技术研发、开源生态建设、人才培养和企业培育的新型研究机构。

“过去每次科技平权都能催生重大产业机会”，既有企业从业经验又有研究机构背景的新任智源院长王仲远，对科技赋能产业的体会更深。国家对人工智能的定义也更加具体：人工智能是发展新质生产力的重要引擎。

功夫下在风口之前

一次两次，月之暗面CEO杨植麟在2024北京智源大会现场被参会者围了至少三次，一年前OpenAI创始人山姆·奥特曼在智源大会视频发言时，现场的躁动同样明显。

2023—2024年，AI科学家、科技大厂CEO、明星初创企业创始人聚在各种场面为大模型布道，台上的不管是不是技术咖，或多或少都听过智源的名号，不少还直接参与过智源当年的大模型研究项目。百度CTO王海峰曾担任智源理事、智谱AI创始人唐杰曾任智源副院长、杨植麟参与过悟道的研发。

这些AI弄潮儿不是当下才与智源结缘，智源也不是在大模型风起后才投身其中。

2019年，智源开始布局大模型，2020年组建悟道攻关团队、启动大模型研发。2021年3月首发悟道1.0大模型，6月又拿出了悟道2.0，智源用1.75万亿的参数创造了当时“世界最大”大模型纪录，是OpenAI彼时最先进的大模型GPT-3参数量的10倍。

科研讲究体感，要提出问题，作出判断。“人工智能大模型时代即将到来”的判断，给了智源毫无保留的勇气，就连“大模型”这个中文词汇，都是智源最先提出的。

何为大模型？智源研究院理事长黄铁军认为要具备三个条件：规模要大，参数达百亿规模以上；涌现性，能够产生预料之外的新能力；通用性，不限于专门问题或领域，能够处理多种不同的任务。

2023年大模型进入公众视野，悟道系列模型已升级到3.0版本，涵盖语言、视觉、多模态等基础大模型，并全面开源。当时斯坦福大学关于基础模型的讨论中，智源与Google、微软、Facebook（现Meta）等科技巨头并列，成为世界大模型研究的代表性机构。

“历史上多数研究成果的出现是偶然事件，没人能规划出来，所有努力都是为了提升概率——汇聚优秀的研究人员，为他们提供能够碰撞思想、发现问题、寻找协作伙伴的社区环境。”智源研究院创始理事长张宏江给图灵奖获得者Yann LeCun自传写的序言，更像智源后发先至的原因。

要做系统工程

2018年初，北京市出台《北京市支持建设世界一流新型研发机构实施办法》，进行科技体制的飞跃式改革。12月，在科技部和北京市委市政府的指导和支持下，智源正式成立。

此前，科研管理流程复杂，从立项建议到指南发布再到经费申请、评审通过，周期漫长，难以适应强竞争环境下日新月异的科研需求。按照这种体制，研究机构2020年10月提出立项建议，最快2022年才能正式展开大模型研究。智源模式从立项到推出大模型，只用了不到5个月。

这是一种介于大学和企业的新型研发机构。新在不以论文为最终评价指标，不以产品为评价指标，而是要做创新性系统；新在把清华、北大、Facebook人工智能实验室、百度等不同机构以及企业的学者聚在一起办大事；新在瞄向大问题，保持对重大科学问题的敏锐眼光，进行前瞻布局。

“高校模式已经运行了几十年，较难有组织、有规模、跨团队地做系统性研发。企业也会投入做研发，但更倾向于研发与业务强相关的。智源会做3至5年甚至更长时间才能看到成果的研究项目”，王仲远在接受北京商报记者专访时表示。

当下，智源的信心还在于国家对人工智能的笃定。2024年3月，中共中央政治局常委、国务院总理李强在北京调研时明确：人工智能是发展新质生产力的重要引擎。

新质生产力是创新起主导作用，摆脱传统经济增长方式、生产力发展路径，具有高科技、高效能、高质量特征，符合新发展理念的先进生产力质态。它由技术革命性突破、生产要素创新性配置、产业深度转型升级而催生。“过去每次科技平权都能够催生重大产业机会，大模型可以带来新的科技平权”，王仲远坚信。

打个比方，大模型是“智力”的载体，以AI为中心的浪潮是智力运营，最底层是技术软硬件系统，最上层是AI应用，大模型处于两者中间，扮演“树干”的角色。大模型的意义是将“智力”变成像水、电、网一样的公共服务，通过云计算向大量企业或个人提供AI服务。

这是一个系统工程，“需要集中投入资源、集中人力，不能很多人在做但各做一摊，而是要形成一个技术体系。”黄铁军举例，“发展人工智能就如同炼钢和发电，需要一整套技术体系来保证生产出高质量的钢、以比较低的成本稳定地发电等。”黄铁军说。

要比产业走得更超前

智源搭建的技术体系包括：大模型全家桶、大模型操作系统、数据集、训练框架、算子库等。这些成绩和智源的愿景目标等一起挂在智源大厦一楼的墙上。

愿景目标分成机制体制、产业发展等五大板块，总结起来就是创新。“智源要做最前沿的人工智能技术的研发，去引领和预判人工智能的发展，要比产业走得更超前”，王仲远详细解释，“智源会做高校做不了、企业不愿做的研发，做3至5年甚至更长时间才能看到成果的研究项目”。

在他看来，当大模型技术能力达到一定程度后，会分出两大方向，“一个方向去跟产品结合，推动应用，发挥商业化价值。另一方面，有少量的几家机构持续做最顶尖的大模型的迭代和优化。不管企业还是研究机构，应该继续去攻坚技术”。

比如多模态，国内绝大部分的企业都选择DiT架构进行研发。“这是因为DiT是已经被验证的路线，智源希望把不同模态的信息，比如文字、图像、视频、语音，从一开始就放在一个模型里训练。”王仲远用人脑比喻，“这种多模态大模型能够看到世界、理解和推理。未来，大模型跟硬件结合，也就是具身智能, 能够进入物理世界服务人类。”

企业贴近市场，向上找场景，研发机构聚焦核心技术突破，向下做加持，智源属于第二种，和应用与场景离得较远，却用开源的方式做产业界的后盾。

“人工智能不等同于大模型，它只是人工智能的一个流派”，王仲远向北京商报记者解释。当下的智源也对类脑研究、数字心脏等其他人工智能技术全力以赴，这意味着人工智能在其他产业的想象空间没有上限。

北京商报记者魏蔚

友情提示

本站部分转载文章，皆来自互联网，仅供参考及分享，并不用于任何商业用途；版权归原作者所有，如涉及作品内容、版权和其他问题，请与本网联系，我们将在第一时间删除内容！

联系邮箱：1042463605@qq.com

探访北京新质生产力·走出实验室｜看不见的大模型，看得见的生产力

友情提示

颜料铅含量国家标准90mg，幼儿园糕点1340mg，人工智能说做不到

再见了，DeepSeek！

下探至300元价格带宴席用酒格局生变

工信部：进一步试点扩大增值电信业务开放

超七成险企上半年综合退保率降低，兑付高峰已过？

《春风习习的地方》持续热播

8月1日凌晨3点,和遇难者是一批去的,北海红树林赶海事件！

「去班味吧」南昆山站——逃离工位挑战！把压力甩进疾驰的风里

回应网民关切，江油遭校外霸凌未成年人父母表示：“感谢关心，我们希望恢复正常生活”

小说：叶家少主为报恩，隐藏身份保护妻子，却被岳母以为想吃软饭

北京胡同停车有多极限…#停车#车技

北京上空持续了两小时的无声闪电

对等关税来了！今天才发现，麦当劳、肯德基、星巴克，沃尔玛，711便利店，山姆，亚马逊，安利，海飞丝，潘婷，汰渍，强生，高露洁，舒服佳，帮宝适，美宝莲，佳洁士，环

看来及时醒悟了！澳大利亚宣布了澳大利亚在8月11日公开宣布，不继续查咱们出口的“可互换夹紧螺栓支架”有没有政府补贴了，理由是他们觉得中国公司宁波锋晖金属制品有限

2025年8月13日～8月15日，山东省天气预报

人民日报官宣全红婵事了，陈若琳摊牌或有新征程?

还有6天了！奉劝大家这期间不要出门因为8月9号-8月19号期间都属于是三伏天期间有人可能要问了三伏天不是过了吗不是9号就末伏了吗？现在给大家科普一下三伏天一共有

“婚内强奸案”后续：今日开庭，25人签名推荐信，律师作无罪辩护

探访北京新质生产力·走出实验室 ｜看不见的大模型，看得见的生产力

友情提示

颜料铅含量国家标准90mg，幼儿园糕点1340mg，人工智能说做不到

再见了，DeepSeek！

下探至300元价格带 宴席用酒格局生变

工信部：进一步试点扩大增值电信业务开放

超七成险企上半年综合退保率降低，兑付高峰已过？

《春风习习的地方》持续热播

8月1日凌晨3点,和遇难者是一批去的,北海红树林赶海事件！

「去班味吧」南昆山站——逃离工位挑战！把压力甩进疾驰的风里

回应网民关切，江油遭校外霸凌未成年人父母表示：“感谢关心，我们希望恢复正常生活”

小说：叶家少主为报恩，隐藏身份保护妻子，却被岳母以为想吃软饭

北京胡同停车有多极限…#停车#车技

北京上空持续了两小时的无声闪电

对等关税来了！今天才发现，麦当劳、肯德基、星巴克，沃尔玛，711便利店，山姆，亚马逊，安利，海飞丝，潘婷，汰渍，强生，高露洁，舒服佳，帮宝适，美宝莲，佳洁士，环

看来及时醒悟了！澳大利亚宣布了澳大利亚在8月11日公开宣布，不继续查咱们出口的“可互换夹紧螺栓支架”有没有政府补贴了，理由是他们觉得中国公司宁波锋晖金属制品有限

2025年8月13日～8月15日，山东省天气预报

人民日报官宣全红婵事了，陈若琳摊牌或有新征程?

还有6天了！奉劝大家这期间不要出门因为8月9号-8月19号期间都属于是三伏天期间有人可能要问了三伏天不是过了吗不是9号就末伏了吗？现在给大家科普一下三伏天一共有

“婚内强奸案”后续：今日开庭，25人签名推荐信，律师作无罪辩护

探访北京新质生产力·走出实验室｜看不见的大模型，看得见的生产力

下探至300元价格带宴席用酒格局生变