中国大模型生存战:巨头围剿,创业难熬
来源:晚点Latepost(ID:postlate)撰文:王与桐 贺乾明 程曼祺编辑:程曼祺 黄俊杰“如何能卖掉部分手里的大模型创业公司股份?”今年 10 月上旬一场聊天中,数位投了大模型的投资人到场。惬意的音乐中,他们讨论着这个不算轻松的话题。而整个投资市场,大半年前还在为争抢份额头疼。当时有一位投资人告诉我们,没有拿到份额的机构 “没资格谈选择”,而他拿到了所有 “第一波大模型” 公司的投资机会,并投到了他认为最好的一家。现在,悲观的心态在投资人中蔓延:大模型赛道,创业公司可能很难打赢大厂——他们高估了增长拐点到来的速度,也低估了中国大公司的决心与行动力。一位大厂高层给出判断,做大模型,“一年低消也要 20 亿-30 亿美元”,这超出任何一家中国大模型六小龙的总融资额。当游戏变成需要持久烧钱的拉锯战,天平开始倾倒。创业公司与大公司间的攻守易位,发生在不到 12 个月之间。1中国的大象,真的能跳舞“去年字节的 AI 战略是不及格,但完全不影响今年的满分表现。” 昆仑万维创始人周亚辉今天在社交媒体上说,“这符合我对这个组织快速迭代能力(卷死人能力)的预期。”不到 12 个月里,字节跳动在大模型上后来居上。相比 2023 年 3 月率先发布大语言模型的百度,和 2020 年就研发多模态大模型的阿里,向来看重 AI 的字节并没有跟上大模型的第一声发令枪。一位字节人士去年曾告诉我们,在 ChatGPT 横空出世前,字节更看重 AI for Science,“押错了宝”。那之前,约有 100 多人的字节 AI Lab NLP (自然语言处理)组里,只有不到 10 人在研究大语言模型。长期观察中国 AI 发展的一位研究人员当时也告诉我们,相比其他大公司,字节去年做大语言模型 “相当于是从零开始”。他推测,字节很有可能收购一家公司,但头部的创业公司里,没一家愿意卖。字节大模型研发负责人朱文佳,去年四季度 OKR 的首要目标还是 “让语言模型整体效果达到 GPT-3.5”。当时百度和一批头部大模型创业公司的进度已来到追赶 GPT-4。而今年夏天之后,字节大模型口碑迅速翻转,其产品数据和影响力也今非昔比。据数据分析机构 QuestMobile,字节豆包 App 今年 9 月的日活已达 760 万,成为中国日活最大的 AI 产品;同为生产力场景的 Kimi 智能助手(Kimi 手机版),同期日活则在 130 多万。一位接近豆包的人士称,只要字节想投放,“豆包日活很快就能破千万”。来到 10 月,豆包的日活已达 945 万。而去年 11 月,第一还是百度文心一言,当时豆包日活不到 130 万,比文心少几十万。从生产力到娱乐陪伴,从对话产品到 Agent 工具再到文生图,字节陆续推出了十几个 AI 应用,饱和式地覆盖了几乎所有主要 AI 产品方向。字节还做了 AI 硬件——在今年 10 月推出能与豆包语音对话的 Ola Friend 耳机,近期还在研发 AI 眼镜。投流竞争也不是字节的困扰,而是它相对创业公司的优势。字节每年的利润有数百亿美元,比六小龙加起来的融资总额还多几倍。同期,一批创业公司进入调整期。我们了解到,今年下半年,至少 5 家大模型创业公司出现人员调整:智谱 AI 高峰期有 1000 多人,今年一度缩减上百人,不少交付、销售人员离开;零一万物调整了数十人的团队,集中在产品和运营部门;MiniMax 的商业化和部分产品运营团队总计减员约 50 人;月之暗面则因收缩海外业务,减少 10 余位员工;百川智能也减员约 20 人,主要调整了 C 端产品人员。智谱和零一万物回复称,调整业务后,他们也在持续招人,总人数稳定。百川回复称 “我们没有任何裁员”。一些技术人才也从创业阵营转向巨头:如字节今年就招募了零一万物原预训练负责人黄文灏,和智谱 AI 的一名资深研究员……还有许多人未浮出水面,字节大模型团队里用花名的人越来越多。曾经每个月都有的大模型融资消息,也有近半年不再出现。一位投资人感叹:“一般来说,新技术出现时,创业公司的逻辑是用更少的资源、更小的团队,依靠更领先的技术洞察,使产品或服务先一步爆发,以对抗大公司的资源优势,让巨头陷入所谓‘创新者的窘境’。”可惜,一个变量的存在——字节跳动,“它这么有资源,又这么努力”,创业公司很难像商学院教材里写的那样 “以灵活与敏捷应战大公司的缓慢”。中国的大象真的能跳舞。2去年冬天阿里、字节射出反方向子弹共同造就如今创业公司过山车轨迹的,是同时酝酿于去年冬天的两种大厂策略。经历了 2023 年 2 月王慧文自掏 5000 万美元启动 “光年之外”,到一批新公司涌现,再到光年之外突然被美团收购,AI 大模型的融资水温本已由热转凉。一位去年跟踪了 4 家大模型公司的投资人,曾 “辛辛苦苦要到了” 六小龙中某一家的份额,而到下半年,他认为大模型已没有机会:“年初时我见这些 founder,他们还说一年就能追上美国。到年底,大家发现钱不容易拿到,人也挖不来。”此时,阿里的激进投资,一举扭转了市场情绪。去年底,阿里开始密切接触当时大模型公司中排位相对靠后的月之暗面。当时经过两轮融资,估值来到 8 亿美元的月之暗面已寻求新融资数月。原本的交易方案不足为奇:以投前 9 亿美元获得约 1 亿美元融资,潜在领投方是小红书。如果成功,月之暗面会成为中国第 5 家估值超 10 亿美元的大模型独角兽。而年底入局的阿里却提出,将投前估值抬到 15 亿美元,小红书此后放弃了领投。这笔交易最终在 2024 年春节前谈定,阿里大手笔投资月之暗面近 8 亿美元,持股比例约 40%,月之暗面投后估值来到 23.4 亿美元,与之前的第一,MiniMax 相当。这符合阿里云的战略:做智能算力供应商。类似微软与 OpenAI 的组合,阿里用算力加现金,投资了一批大模型公司。也是在去年冬天,阿里开始接触 MiniMax,并在今年初投资了约 6 亿美元。阿里的出手,改变了创业公司的身位,带来了弹药,也带来了比钱和算力更莫测难求的势能。从今年 2 月 8 亿美元融资曝光,到 3 月 Kimi 获得 300% 的用户增速,发布 200 万上下文的长文本新功能,今年上半年,月之暗面一直处于口碑与影响力的上升通道。被刺激起 FOMO(害怕错过)情绪的投资机构,也继续贡献着融资。阿里之后,又有源码、高榕等机构投了月之暗面。当日历翻过年中,小阳春里的热情很快被巨头的阴影所笼罩。而字节快速包抄的种子,也萌芽于去年冬天。当时,一位投资人像往常那样循着 AI 论文去拜访作者,他惊讶地发现:不少人刚和字节创始人张一鸣一对一聊过,这其中还有尚未毕业的博士生。他马上和自己投资的一位大模型创始人说:“这是个危险的信号。”“这说明字节变了。” 这位投资人认为,那之前,字节的大模型研发主要由朱文佳、李航(AI lab 负责人)等人负责,“他们的精力分配,他们能不能跟上最前沿的技术,都让人怀疑。”危险的信号在今年逐渐变成危险的事实。字节的 AI 技术骨干持续增加,包括今年 2 月加入的 Google 原 VideoPoet 项目负责人蒋路,8 月加入的零一万物黄文灏,和阿里通义大模型原技术负责人周畅。一位接近此事的人士说,当黄文灏提出离职,称要 “奔赴 AGI 梦想”,并讲了字节开的条件时,“他们都不好意思挽留。”几位之前就认识周畅,听说他离职后想创业的投资人也告诉我们,当时 “根本约不上”“发消息不回”。这很可能是因为,字节的行动比投资人更快。一位接近周畅的人士告诉我们,字节高层也一对一和周畅聊过,并表达了追求顶尖 AI 技术的决心,这更符合周畅的技术抱负。一些阿里研发人员曾向我们表达共同的困惑:通义做得很好,为何要用这么多钱和算力支持外面的团队?同时,字节也在整合内部力量,快速完善 AI 新部门——Flow。我们了解到,Flow 现在已是和抖音、火山、飞书等平级的主要业务部门。有数位字节人士告诉我们,如果 Flow 特别想调哪个人,原部门一般会同意。一些分散在字节各部门的产品也在向 Flow 汇聚,如猫箱原属抖音 BG,盒马爱学原属字节教育。广义的 Flow 大部门现在有 3 部分:AI 产品团队 Flow,大模型研发团队 Seed,和产品研发支持团队 Stone。Flow 部门的总负责人为朱骏,他同时是豆包产品的总负责人。留着一头长发的朱骏今年 45 岁,他在字节面对面活动里曾说,自己曾为感受世界而去酒吧驻唱。他联合创立的 Musical.ly 在 2017 年被字节收购,成为抖音产品形态的基础之一。朱骏加入字节后,负责过战略投资、TikTok、产品和战略等。与朱骏搭档的 Seed 负责人是朱文佳,此前是 TikTok 产品技术负责人。2015 年,朱文佳从百度加入当时刚成立 3 年的字节,是把深度学习应用到今日头条上的第一批技术骨干。朱文佳之下,字节有 4 个主要模型研发方向,分别是:朱文佳百度时期的同事、字节原搜索技术负责人乔木带队的大语言模型,字节智能创作团队负责人杨建朝带队的视觉模型(蒋路即在杨建朝团队),以及王雨轩带队的语音模型。新近加入的周畅则将探索一个更前沿的方向——世界模型。“接触过他的人都觉得他很有技术野心。” 一位字节人士说。Stone 则于今年下半年从 Flow 产品团队中拆分,向字节工程技术负责人洪定坤汇报。这让朱骏可以更专注于产品的洞察、设计和运营。将近 10 个月前,周亚辉曾在社交媒体上评价:“这波 AI 中,字节 AI 战略也就 40 分,还是靠了家底厚……当然以一鸣同学天才般的智力和悟性,Hands on 估计不出 3 月,就会从 40 变 80 甚至 90 分。”那时周亚辉预言:“字节的业务战略 vs 阿里的资本战略对决会是一大看点。”现在,两种策略确实开始交锋。收束思路、整备团队后,字节的射程逐渐覆盖一批创业公司。而创业公司们,也只能带着从阿里那里获得的资金和算力,投入这场艰难的战争。3不要正面竞争,然后呢?创业的一条道理是:不要与大公司正面竞争,尤其是不要在大公司的强项上竞争。目前大模型创业的两难是,to C AI 产品仍跳不出移动互联网生态,而字节、腾讯等公司在这里积累已久。其中,大公司最擅长,创业公司也绕不开的一个环节就是投放和流量获取。第一波投放战争起于今年 3 月。Kimi 智能助手在 “拉一个用户要 20-30 元” 的传闻中实现了 300% 的增速,成为话题中心。后来杨植麟告诉我们,其实 Kimi 只有 30% 的增长来自投放,而且称 “我们肯定不是投放最多的”。关于投放上到底花了多少钱,各公司面对第三方数据,标准回复是 “不准确”“没这么多”。相对可监测的数据是投放素材量和用户情况。据广告营销数据平台 DataEye,Kimi 智能助手 10 月的投放素材超 18 万条,是豆包的 4 倍多。但目前,豆包的日活和月活都更胜一筹,据 QuestMobile,豆包 App 9 月月活为 4200 多万,Kimi 智能助手为 1000 万出头。在投放上,字节的可怕之处在于不只有钱,还有效率。字节掌握了中国最大的聚合广告投放平台 “穿山甲”,同时有抖音等流量巨大的超级 App。从今年 4 月起,抖音 App 就不再接受其它 AI 产品的投放。同时,豆包作为字节系产品,在抖音投放时很可能有折扣。当年字节大力做教育产品时,就有类似的操作。“现在创业公司一上来也得去字节买流量,这是最尴尬的。” 一位投资人说。投放和流量,只是字节等大公司在移动产品生态里的强项之一。他们过去还积累了产品设计、留存转化和商业化策略等 App 生产链条里的诸多能力。据 QuestMobile 数据,今年 9 月,豆包 App 的 30 日留存率 [1] 达到 34.5%,而 Kimi 智能助手和 MiniMax 的海螺 AI 都是约 28%。一位月之暗面人士告诉我们,他们在 9 月逐一列出了豆包有,而 Kimi 没有的功能点,开始仔细分析去年还不被视为对手的豆包。大公司也在更强势地争取大模型 API 客户。AI 儿童玩具公司 Haivivi CEO 李勇告诉我们,此前他们一直用 MiniMax 的语音模型,而当其产品在抖音热卖后,字节联系到他们,称可提供优惠价的豆包大模型 API ,还承诺升级抖音店铺。李勇说,现在 Haivivi 会同时调用 MiniMax 和豆包的语音模型。几乎投了所有头部大模型公司的阿里,也是创业公司的 API 和 To B 业务潜在对手。阿里是中国最积极做开源大模型的公司。到今年 9 月,其 Qwen 系列开源大模型的总下载量已超 4000 万次,衍生出了 5 万个大模型,仅次于 Meta 的 Llama 系列。这可能会让本想购买创业公司大模型 API,或让创业公司定制模型的客户转而投向开源生态。我们了解到,去年为大客户定制一个大模型,最高订单额可达 1000 万元,而今年则快速降到了百万元级别,乃至更低。在更底层的模型研发上,字节也展现出 “饱和” 进攻的姿态。视频生成模型是一个缩影。据了解,月之暗面从去年 10 月就开始做视频模型,起步很早;而在去年四季度朱文佳的 OKR 中,尚看不到视频模型的相关描述。到今年 9 月,字节已发布了 2 个视频生成大模型——PixelDance 和 Seaweed,前者来自 AI Lab,后者来自 Seed。字节尚未发布的类似探索还有更多。而 MiniMax 视频模型团队只有约 10 人,月之暗面的视频模型团队也是相似规模。MiniMax 在今年 8 月底发布了视频生成模型,月之暗面则至今还没发布。投资人也逐渐认清现实:模型能持续比字节好,比开源的也好,而且好得很明显,这很难,最终要赢在产品。创业公司可能的出路是:找大厂看不上的、小众的产品方向,或愿意干脏活、累活。Kimi 和豆包激烈交战的生产力方向,普遍被认为价值高、智能含量高。而在类 Character.ai 的陪伴和虚拟社交产品上,巨头暂时没拿出那么多火力。据了解,Flow 旗下的 “猫箱”,目前日活在 65 万左右,字节另有一款类似产品 “小黄蕉”,已被放弃。而 MiniMax 的 Talkie 加星野的总日活则约有 500 万。其中,据 QuestMobile 数据,星野 9 月日活为 94 万,30 日留存率达到 60%,超过猫箱的 44.8%。另一条路是等待。美团创始人王兴曾说:大多数人以为战争由拼搏组成,其实战争是由等待和煎熬组成。一位投资人认为,现在大公司正处在 “上头” 期,但 “一旦一件事干了几年还拿不到结果”,内部张力会涌现,尤其是组织上的拉扯。这时如果创业公司还在场,可能有机会。百度已出现了类似的张力。在百度,训练基础大模型、开发 to C 大模型产品和提供 to B 大模型方案,分属三个事业群。一位百度人士说,到今年中,当百度模型训练团队希望调动更多算力,训更强的大模型时,会遭遇 GPU 不够用的情况,需要集团高层出面协调——同样是 GPU,放在 to B 业务,马上就有收入,而训练新模型,回报则不明确。在字节,我们了解到,一些一线员工并不想转岗去 Flow,因为这是个变动不居、正在 “跑马圈地” 的部门。也有字节员工认为豆包是 “ ICU 产品”——离开投放的插管就活不下去。近期,字节在与创业公司竞争一位人才时,未能获胜。我们了解到,华为诺亚方舟的一位 AI 研究员已加入月之暗面,将带领团队探索类似 OpenAI o1 的大模型技术。他也曾接到字节邀请,但选了创业公司。不过,中国掌握极强产品能力和流量资源的不止字节。微信还没出手呢。4半熟的技术,半新的战场“大模型这么嗨,我也没觉得怎么样,如果不建立自己的商业闭环,只是把悲剧又加速重演一遍。”一位 AI 计算机视觉公司创始人今年 3 月对我们说。当时,多个大模型创业公司的估值已突破 100 亿人民币。就像如今情形的一场预演,当计算机视觉的商业化场景转向安防后,战争不再发生于创业者之间。真正的威胁来自成立了十几年的安防行业巨头海康。创业公司高薪招博士、发论文,更懂 AI 视觉识别,但要从头学习研发硬件产品、搭建营销体系。海康每年卖出数百亿元硬件产品,有完善的供应链和销售体系,对安防需求有长期洞察,但需要引入 AI 技术。在这位创业者看来,大模型时代只不过是换了一批创业公司,对手从海康威视换成了资源更多、决心明确的 BAT 和字节。上一次,创业公司都没有赢。所有依靠新技术的创业,都是在和大公司赛跑——看创业团队先补上完整的商业化体系,还是大公司先学会新技术。这一竞赛的结果,取决于新技术能在多大程度上颠覆原有体验,新技术的进入门槛有多高、赛道有多长。大模型确实比驱动上一波 AI 热潮的人脸识别等技术有更高的资源门槛,从头训练大模型也是一个更综合、复杂的技术工作,涉及 GPU 调用、模型架构设计、数据处理、调优等多个环节。复杂度远超 AI 视觉。技术门槛之外,创业公司和大公司间的竞赛结果,也取决于新技术是否能找到新生态:这里应该有新的供应链、新的硬件载体、新的渠道和新的需求与用户来源。它们尚未被大公司深度染指。一位投资人类比了大模型和移动互联网浪潮:移动互联网是新软件、新硬件同时出现,从电脑到手机,带来了 App 的强劲自然增长,当时的流量成本也低得多。“现在是新软件有了,还没有新硬件。” 他指在智能手机后,尚没有出现规模足够大、能承载足够多应用的硬件载体。但实际上,大模型产品现在的软件也还是 “半新状态”:由大模型支撑的很多产品,仍是一个个 App,模型能力是提升体验的最重要动力,但需求洞察、功能设计,流量和用户获取依然重要。这是一个半熟的技术遇上半新的市场的故事。尚未成熟的技术,是创业者的机会所在:如果大模型能力还能持续进化,前瞻的技术判断和跟随能力,也许有四两拨千斤的效果。半新的市场,则是大公司的砝码:如果大模型能力提升短期遇阻,应用开发和产品表现会更依赖现有移动互联网基础设施,这就是一个烧钱、拼资源的游戏。2001 年,成立 3 年的 Google 刚成为雅虎搜索引擎供应商,当时的 CEO 埃里克·施密特(Eric Schmidt)在劝桑德伯格加入公司时说:“如果你得到了坐上火箭的机会,别管是什么位置,上去就行。”现在,去年怀着雄心挤上大模型火箭的人,都不得不调整姿态,适应新的现实。他们接下来的选择和动作,将不仅关系位置好坏,也关系着公司的生死去留。说明:发布并不意味着我们赞同其观点,只为多一个视角看待问题,部分信息和图片无法核准,如涉权益,烦请联系,我们将迅速处理,谢谢!有融资需求请加微信(FA_rzj),为方便备注,申请好友时请发送(姓名·城市·公司·职务)- The End -我们已经与阿里巴巴创新投资、达晨创投、高瓴资本、高榕资本、高特佳投资、戈壁创投、国新风投、国中创投、红杉资本、华映资本、火山石投资、IDG、经纬中国、今日资本、纪源资本、君联资本、联想之星、蓝驰创投、梅花天使基金、平安创投、启赋资本、软银中国、赛伯乐投资、赛富基金、深创投、天图资本、腾讯投资、五源资本、毅达资本、英诺天使基金、优势资本、真格基金、浙商创投、中国风投、中国文化产业投资等近千家知名投资机构2000余名专业投资人建立广泛联系和合作。帮助那个在创业的人,请分享、点赞、在看,3连击
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“号”用户上传并发布,本平台仅提供信息存储服务。
-
上一篇
-
下一篇
- 最近发表
-
- 随机阅读
- 搜索
-