作者丨赵晓晓
编辑丨关雎
图源丨零一万物
5 月 13 日,上午 10:00,李开复准时出现在鼎好大厦的A座20层,一身藏蓝色西服套装,浅色衬衫配领带,三七分的发型,跟去年 3 月份的一场分享会上穿着几乎一致,唯一区别是脸上多了一副眼镜。
这是零一万物成立一年后,李开复首次在媒体面前公开露面,他回答了关于新品和零一万物的一切,并首次对去年涉及Llama架构的争议做出回应。
零一万物去年7月上线,11月发布了首个模型Yi-34B,半年后的今天又发布了新的千亿参数闭源模型 Yi-Large 和首个国内to C产品 “万知 AI”,李开复还亲自出任万知的CEO。
在斯坦福的开源评测项目 AlpacaEval 2.0 上,Yi-Large 英语能力主要指标 LC Win Rate(控制回复的长度) 排位世界第二,仅比 OpenAI 今年 4 月发布的新版 GPT-4 Turbo略输一点,胜率(Win Rate)则排到了第一。在中文能力上,SuperCLUE 更新的四月基准表现中,Yi-Large 位列国产大模型之首。
斯坦福AlpacaEval 2.0 Verified认证模型类别,英语能力评测:零一万物的Yi-Large Preview 的 LC Win Rate为51.9%,排第二,Win Rate为57.5%,排第一。
去年零一万物陆续上线的 4 个海外产品中,有一个生产力产品的 ROI (投资回报率)已经实现了 1,这就表示增长还可以更激进。海外产品的收入主要来自C端用户付费,“今年会有1-2亿元收入、近千万用户。” 李开复说。
这是一场既要速度又要技术的较量。今天的AI环境与上一次四小龙时代完全不同,它能带来真实的价值,大模型的临界点是AI普惠点,谁先点燃这个点,它会成为一个行业里的巨头。
有人把李开复称为“最年长的” 中国大模型创业者,他今年已经 62 岁,零一万物也成为中国六家大模型独角兽之一。40 年前,李开复在博士论文申请信里写到,“AGI就是我的梦想。”
“我这次创业,十年都不会套现。”李开复说。
做AGI 时代的微软
去年 3 月的分享会上,李开复把AI 2.0定义为“绝对不能错过的一次革命。”它的巨大跃迁之处是克服了AI 1.0单领域、多模型、没有实现商业化的限制,能带来真实的价值。
“比如生产力的 AI 应用,过去从来没有一刻可以做到别人帮我写报告、写文章和做 PPT,也从来没有一个软件,可以帮我分析总结一千页、甚至一万页的文字。”李开复说。
2022 年底,ChatGPT出现后对市场进行了最快速度的教育。GPT4发布后,成为大模型领域的“一个金标准”,同时还点燃了 to B 跟 to C 的机会。
一家公司如果抓住了一次技术浪潮,它会成为一个行业里的巨头,如果两次技术浪潮都能抓住,它就会成为一个世界性的卓越公司。
“所以我们要自己下场做。”李开复说。
李开复1983 年开始在卡耐基梅隆大学攻读计算机博士,对人工智能领域已经有近 40 年的研究。过去十几年,他一直是创业者背后的支持者,这次走向台前,是因为他相信这是人类有史以来最重要的技术,不能错过这次革命。
零一万物的起点是海外,to B。
去年 9 月,零一万物在海外上线了4 款产品,其中有一个生产力产品的 ROI(投资回报率)已经实现了 1。这意味着,零一万物从用户手中收到的订阅费,已经低于获取用户成本加 GPU 的成本,摆脱了“烧钱获客。”
李开复和团队有一个标准,一般至少要看到ROI达到 0.6 才会开始推,否则用户越多越亏钱。如果产品推到了 1,就表示增长还可以更激进。4款海外产品里,娱乐、陪伴类的ROI 还在较低的阶段,生产力产品已经给零一万物带来了一个亿的收入,有近千万的用户。
去年11 月发布的开源模型Yi-34B,在权威榜单中超越了Meta AI研发并开源的 Llama2-70B、阿联酋的技术创新研究所开发的Falcon-180B等大几倍的模型,成为当时世界范围内开源最强基础模型之一。
发布会开始的前夕,零一万物的团队连夜在 Hugging Face、魔搭社区等海外社区上线了六个 API ——Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark ,“一早起来就看到Reddit上的讨论非常火热。”
目前,零一万物的海外产品模型选型是Yi-Large 加 GPT-4 的组合,“最开始推出的时候我们的自研模型还没有做好,Yi-Large在海外上线后,会成为我们实时对比测试自研模型的平台。”零一万物生产力产品负责人曹大鹏说。
“现在我们完全有底气把已经达到PMF(Product Market Fit,产品与市场互相匹配)的产品,再推回中国。”李开复说。
海外的AI生态已经非常繁荣,很多AI原生应用已经诞生,甚至达到了数千万美金的收入,也有很多的成熟产品和公司用OpenAI的 API做出了自己的第二曲线新业务。相比之下,国内会慢一点,还在探索阶段。
零一万物暂时不做国内的to B业务,不接项目制的订单,是因为李开复觉得国内还没有逃离上次 AI 1.0 的魔咒——一些很优秀创业公司,陷入了一个高成长但低质量的恶性循环里。
to C相对好做一些,万知是零一万物的第一款C端产品,精准切入了“找、读、写” 职场人的三大需求,也是业内第一款具有“AI-First”理念、将模型能力与应用场景完美融合的to C应用产品。
“所有的应用都应该是AI-First、AI-Native,没有AI就不成立。”李开复说,“比如PPT 制作功能,在国内外就很少看到。”Google前CEO艾瑞克·史密斯对此给予的肯定是,“信息包装是500亿美金的市场”。
零一万物会做很多事,海外、国内,to B、to C,它Day One 就是一个全球化的是公司。公司已经启动下一代 Yi-XLarge MoE 模型训练,冲击 GPT-5 的性能与创新性。
“我们的理念就是要做AGI 时代的微软。”李开复说。
每个公司都要找到自己的TC-PMF
任何时候,创业者都要学会在相对充分的资源里,寻求成本和效率的最优解。
李开复定义了一个新的词汇:TC-PMF——在寻找产品与市场匹配点的基础上,加上了技术(technology)和成本(cost),这是一个四维的匹配。
强调技术和成本,是因为李开复认为,PMF已经不能完整地定义大模型的创业了,因为要考虑到模型现在的技术能力、之后的发展情况和推测成本。
“现在的AI 和移动互联网有一个很大差别,就是移动互联网没有推理成本。”李开复说。
比如某些应用需要 AI 不能有幻觉,那么现在的技术就有挑战;有些应用需要大尺寸的模型或者长文本窗口,但这可能带来 50 秒的推理延迟,如果处理一百万token ,就要花 75 块钱。
在移动互联网时代,PMF曾是众多初创企业追求的核心目标,用户规模增长所带来的边际成本很低。但在大模型时代,模型训练和推理成本都很贵,是每一个创业公司都会面临的增长陷阱,很多公司会因此胡乱烧钱,走向破产。
“所以每个公司都要找到自己的 TC-PMF。”李开复说。他把TC-PMF即将在一个应用领域出现的那个点叫AI普惠点,只有达到这个点,技术、模型和成本之间才能达到最完美的匹配状态。而在这个点来临之前,企业要先把产品做出来,等待时机,成为一个Popular App。
抖音成为Super app的时间点有两个,第一个点是4G的普及,第二个点是安卓千元机的普及,两个点的先后到来,一下子把短视频市场扩大了100倍。
最快找到的方式是自己做推理引擎,这需要很强的模型团队、AI Infra(基础层)团队和应用团队,三个团队成为一体,互相配合。这是一件听起来简单,但做起来很难的事情,也是企业自建推理引擎遇到的最大挑战。
零一万物团队是国内极少数能吸引到谷歌、微软在内的高水平算法人才的公司,除了团队之间配合默契外,他们尤其重视 AI Infra的优化工作:从选择服务器到设计机房和部署 GPU,再到建向量数据库,都是自己来,自己掌握降低推理成本的节奏。
“好处是,别人的推理成本降低十倍时,我们可能降二十、三十倍。”李开复说。多方面优化GPU 成本后,其训练千亿参数的 Yi-Larege 模型时,同比下降了一倍左右;接入自研向量数据库后,成本比用第三方向量数据库下降至18%。海外 TC-PMF 已经进入ROI为正的阶段。
必须自己找 TC-PMF,还因为李开复相信,“没有一种技术可以吃一辈子,一定要找到技术之外的壁垒。”
他举例,移动互联网时代,为什么安卓、苹果、微信这么强,抖音还能杀出来?
就是因为字节跳动很早就预测到了用 AI 来推荐短视频,找到了自己的PMF,把握住时间窗口,打造了非常高的用户粘性和成长率。当它成为一个有海量用户的普惠应用,微信就再也没办法复制抖音、把它杀死了。
大模型推理成本的下降会推动中国AI大模型进入“落地为王”的阶段,李开复判断,今年会迎来“大模型应用爆发元年”,明年下半年,将迎来大模型普惠应用的井喷期。
“做AGI 是我的梦想”
李开复现在有四个身份:创新工场创始人、投资人、零一万物创始人、万知CEO(Chief Experience Officer首席体验官)。
2009 年,李开复在北京中关村成立了创新工场,开辟了中国风险投资和创业的新模式,至今他已经做了 15年的投资人。在AI 1.0时代,创新工场投了第四范式等10多家AI独角兽企业。
去年李开复 61 岁,他选择成为一名创业者,这个年纪已经是大多数人的退休年纪,只因为他看到了人类有史以来最重要的技术,才决定“再努力一把。”
这也是李开复40多年前写进博士申请信里的梦想,希望未来有机会能在AGI领域做一些事。过去几十年,他一直在研究AI可能会对人类产生的影响,并先后出版了三本相关书籍,多数人对他“儒雅”的印象也都源于他“作家”的身份。他还建议年轻人多了解AI,别只关注“AI会不会取代我们的工作。”
成为万知CEO是因为他没给自己设其他选项,“从一开始我就考虑自己做CEO,”李开复说,对于首款to C产品,他觉得前期还需要倾注更多心血去发现问题并及时修善。从万知上线到现在,他每天都会测上一百条以上的问题。
最有价值的修改建议是搜索框的加长,这是他在谷歌时遇到的问题,用户在搜索框输入两三个字搜不出来东西,输入十个字结果就变好了,最后解决方案是做了一个更长的搜索框。
据零一万物 API 平台负责人蓝雨川透露,零一万物今年在C端收入会在1-2 亿元,微软的Office每年有几十亿美金的收入。“生产力产品市场的天花板非常高,我们也在思考如何把人工智能工作空间做得更大。”蓝雨川说,作为结果,零一万物可以扩展海外市场,比如去中东、东南亚。
过去一年,李开复成为非常有热度的人物,一多半是因为零一万物在短时间内上线,又在短时间内推出了多款新品,并在天使轮就成为独角兽。另一小半是因为陷入Llama架构的争议。
“套壳的说法纯属子虚乌有,当时有很多技术专家写过详细文章解释了。”李开复说,中国大模型的架构都是基于Transformer或 Llama 的架构,技术圈对 Llama 架构这个称呼本来就不同意。
“对于大模型来说,权重更高的是训练本身以及通过训练获得的参数和代码。零一万物 Yi 模型是从零开始训练,自己获得的参数和代码,没有参考任何 Llama 或其他模型的参数。” 李开复说。
今天的AI已经是个充分竞争的市场,比拼的不止是技术、团队,还有心态。对于AI,李开复是有点偏执在的,他专注于把产品做好,其他的事情交给市场去验证。
他最近还开了抖音号,但不是为了直播带货,是为了分享好的技术和产品。站在投资人身份的角度,李开复说如果他手里有很多钱,会全部投给零一万物。
这次创业,李开复的期望是“冲一下万亿美元”,AGI是一个很大很大的梦想,不能只是为了赚点钱。
他也承诺投资人,十年不会套现。
友情提示
本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!
联系邮箱:1042463605@qq.com