中科院，刚刚跑出一只独角兽

投中网 | 蒲凡 · 2023-06-09 22:42

“今年下半年，中国泛AIGC赛道将会出现具有里程碑意义的投资交易”。

6月伊始，国产大模型明星团队MiniMax传出了新的融资消息，规模将超过2.5亿美元，推动MiniMax的整体估值规模超过12亿美元，成为标准意义上的“独角兽”。

与此同时，本轮融资也吸引了新的投资方参与，其中包括与腾讯有关联的投资实体。一旦消息坐实，MiniMax将成为腾讯在国产大模型热之后的第一次相关布局。

MiniMax的创始团队称得上是“中科院系”。它由前商汤科技副总裁、通用智能技术负责人闫俊杰成立，他博士毕业于中科院自动化所，而技术合伙人杨斌，则是闫俊杰的中科院校友。

对这笔交易，人们感叹“这体现了中国投资者对大模型赛道的兴趣仍然在上升阶段”，并通过对相关投资者和行业顾问的交谈做出预测，“今年下半年，中国泛AIGC赛道将会出现具有里程碑意义的投资交易”。

这个论述逻辑不难理解。MiniMax成立于2021年12月，用不到一年的时间就完成了两轮融资，囊括了让国内人工智能赛道多家有头有脸的代表性玩家，包括天使轮的云启资本、Pre-A轮的明势资本、高瓴创投、IDG资本、米哈游，这种堪称“众望所归”的成长速度显然很难直接用“明星团队”来简单概括。

顺带提一嘴，按我听到的消息，Minimax这一轮融资份额，各家头部VC争得可是相当激烈，但率先传出入局的却是腾讯，接下来可以再看，等融资正式发布，有没有VC最终投得进去。

更重要的是，进入2023年之后MiniMax并不是货架上的唯一选择——王慧文在即刻上官宣带资创业，5000万美元成立了“光年之外”，还争取到了王兴“仗义合伙”；李开复牵头了Project AI 2.0，喊话“AI 2.0就是来掀桌子的”；王小川同样带着5000万美元成立了“百川智能”，和百度打起了“是不是一线从业者”的嘴仗——可以说MiniMax在其初创阶段所呈现的成长节奏，清晰地折射出资本市场对于大模型赛道的坚决与耐心。

就在MiniMax新一轮融资即将完成的消息传出来四天后，也就是6月5日，光年之外将成为“腾讯大模型第一投”的消息迅速占领了热搜。据量子位的消息，光年之外以10亿美元的估值，已在近期完成了新一轮2.3亿美元（折合人民币16.3亿）融资，由源码资本领投，腾讯、五源资本和快手创始人宿华参与其中。

虽然这条消息在当天就被“辟谣”，但也有一种说法是：因为参投的美元基金碍于某些因素而不能公开确认此消息，而宿华也确实参与了这一笔的融资，并且投资额“相当可观”。

其实无论如何，从市场表现出来的热情来看，国产大模型赛道确实到了“需要独角兽出现”的时候。

独角兽？吞金兽？

首先需要明确的一点是，尽管到2023年才出现了独角兽级别的估值，但国产大模型赛道的成型其实远远早于ChatGPT的发布。第一个正式对外发布的国产AI大模型，可以追溯到2021年3月由智源研究院发布的“悟道1.0”，其中就已经包括面向中文的预训练语言模型悟道·文源、中文通用图文多模态预训练模型悟道·文澜、具有认知能力的超大规模预训练模型悟道·文汇、超大规模蛋白质序列预测预训练模型悟道·文溯。

而智源研究院的成立更是可以追溯到2018年11月在北京举办的中国（北京）跨国技术转移大会。当时北京市科学技术委员会主任许强作为代表正式发布北京智源行动计划，旗帜鲜明地指出智源研究院的使命就是“推动共享数据、智能计算编程框架和算力基础设施建设”“围绕人工智能领域重大核心基础理论问题，布局研究团队和项目”。

光年之外4月并购的AI架构公司“一流科技OneFlow”也是这个状况。创始人袁进辉2008年从清华大学计算机专业毕业，拿到博士学位，一年之后就草创了世界上最快、被微软研究院全球副总裁周以真称赞“年度最好成果”的主题模型训练算法系统LightLDA。2017年因为预判到深度学习框架市场在“大模型分布式”方向上有着空缺决定创业，对标的产品是谷歌TensorFlow和脸书PyTorch。

王慧文也因为这笔并购交易在即刻、知乎上大受好评，一个颇具代表性的观点是“袁总（指袁进辉）及OneFlow一直深耕于深度学习框架和算法部署，在大模型算法的并行训练和部署方面有很多积累，执着的技术专家”，并购OneFlow证明光年团队对LLM（大语言模型）生态的理解上，拥有比其他团队“更好的判断力”“更早的视野”——当然这都是后话。

总之早在2019年，美国白宫就在《国家人工智能研发战略规划》中敏锐指出中国将是美国人工智能的主要对手，并通过深度观察点出中国人工智能产业的短板：“缺点亦十分明显，硬件、算法、人才……人工智能框架创新能力薄弱。”

而正是这种首尾分离的行业状态，决定了中国投资者们一方面获得了相对于欧洲、日韩市场更好的配置机会，另一方面又不得不接受流向国产大模型赛道的热钱，将不可避免地长期作为沉没成本，用于“补齐”必要的水下部分。以至于当时一些路子比较野的自媒体，直接玩梗式地调侃“搞深度学习框架的那帮人，不是疯子，就是骗子”。

但即便是在公认的发达市场美国，大模型也很难说浮上了水面。

2020年3月，《福布斯》杂志指出当时人工智能行业面临的最大挑战“不是技术问题，而是如何从技术中获得价值”，论据来自麻省理工斯隆管理学院的调研。调研报告显示“在接受调查的10家公司中，有7家公司表示截止提交报道，人工智能业务在财务上带来的积极影响很小或没有……在那些90%的业务布局围绕着人工智能展开的公司里，只有不到2/5的公司表示在过去三年中从人工智能中获得了业务收益……如果将调研样本扩大到对人工智能有过‘大笔投资’的企业，这个数字也仅仅只被提到到3/5。这也意味着在所有对 AI 方面进行重大投资的公司里，有40%暂时没有因为人工智能获得过收益。”

买到即血亏，美国商业精英们很现实地选择用脚投票。美国策略顾问NewVantage Partners在2019年的调查中发现，虽然有91.5%的公司表示已经尝试了对人工智能的布局，但认为在人工智能领域布局应该加快节奏的受访投资者，从2018年92%下降到了52%。

作者因此悲观地认为这种美国企业缺乏数据驱动文化（data-driven culture），企业的决策者们缺乏了解人工智能的兴趣和动力。再加上人工智能技术本质上是一次“范式革命”，与人工智能的结合将导致全流程“端对端”的改造，——例如新产品和服务开发、客户服务、订单管理、“采购到付款”等——从而实际增加企业运营成本，作者进一步认为短时间内“即便人工智能开发出应用场景，也很难完成推广”。

2022年后，ChatGPT的出现很大程度上改变了这个现状。在过去一年，人工智能帮助13家初创团队成长为独角兽，在经济指标上打了一场漂亮的翻身仗，之前用脚投票的商业精英们纷纷回流。但这时人们又发现，当所谓的市场经济充分发挥了调配职能，人工智能干脆直接向资源导向型行业狂奔。

例如据调研机构TrendForce指出，OpenAI训练GPT-3时，大概用到2万个英伟达A100 GPU的算力；迭代到ChatGPT时GPU数量进一步上涨到了3万个以上，另外还需要搭载芯片的数千台服务器和数百个标准机柜。按照A100芯片售价1万-1.5万美元的大致区间计算，这意味着Open AI仅在GPU芯片上所消耗的硬成本至少3亿美元。

同样为了支撑大模型的不断迭代与优质体验，OpenAI也对云服务的需求也水涨船高。2017年，OpenAI在云服务上的总花费为790万美元，占公司总支出的1/4，到了2020年这笔费用上涨到了7500万美元。OpenAI也正是在2019年底决定接受微软10亿美元的投资，逐渐将更多服务转移到Azure平台上，使得云服务需求增长带来的压力得到缓解。

OpenAI甚至需要借用“钞能力”来解决人力资源。

据公开信息，截止2023年3月，OpenAI目前拥有超过200名员工，其中大部分来自谷歌和人工智能研究实验室DeepMind的母公司Alphabet，也有相当部分员工来自Meta、亚马逊、Uber。知名猎头公司Punks & Pinstripes的CEO Greg Larkin因此向传统巨头们发出警告“大公司们需要优化在人才方面的投资”。

而资源导向型行业的本质，决定了在行业平均利润短时间内无法快速提到的情况下，生产成本的增加必然会带来亏损的增加。根据5月公布的数据，2022年OpenAI的亏损相较去年翻了一番，达到5.4亿美金，主要出口正是ChatGPT的运维成本以及员工跳槽所产生的人力成本。OpenAI的CEO Sam Altman直接摊牌，表示如果要执行预期中的开发计划，OpneAI除了要提高自身的盈利能力，还需要未来几年完成多达1000亿美元的融资。

应景的是，几乎就在同期（也就是截止2023年1月），日本的日经新闻通过调研发现中国学界发表的与人工智能相关的研究论文数量是美国的两倍左右，同时在论文引用率方面美国学界落后中国约70%。

谁也没办法用三言两语来解释这个“资源集群”是怎样悄然形成的，但可以肯定的是，在这个时间节点上，中国市场几乎是配置大模型的最后机会。

投资人？CEO？

还有一个值得注意的点。据天眼查显示，5月31日，北京深言科技有限责任公司发生工商变更，股东新增腾讯旗下广西腾讯创业投资有限公司、好未来旗下公司欣欣相融教育科技（北京）有限公司等。深言科技核心团队来自清华大学，主要方向为通过 NLP 技术聚焦在大模型的一体化文本信息处理平台研发。这意味着腾讯实际上已经完成了“大模型第一投”。如果再算上MiniMax和光年之外这两笔潜在的交易，腾讯堪称完成了一场“奇袭”。

要知道此前腾讯在自研大模型方面的布局，在时间线上呈现出来是这样的：

2022年4月，腾讯就发布了混元AI大模型，其中包含NLP、CV和多模态等基础模型和众多行业/领域模型，并且在发布之前初步应用到广告创作、广告检索、广告推荐等腾讯业务场景中，实现了一定的应用效果提升；

2022年底，混元AI大模型团队推出国内首个低成本、可落地的万亿中文NLP预训练模型HunYuan-NLP-1T，速度提升至用256卡在一天内即可完成；

2023年2月，官宣成立对类ChatGPT产品“混元助手（HunyuanAide）”项目组，目标是联合内部团队构建大参数语言模型，通过性能稳定的强化学习算法训练……

这种节奏上的剧烈变化很容易让人联想到马化腾5月18日在腾讯股东大会上的讲话。会上马化腾在回应有关ChatGPT和AI相关的提问时，进行了一次无限类似于“自省”式的发言。他说：“我们最开始以为（人工智能）是互联网十年不遇的机会，但是越想越觉得，这是几百年不遇的、类似发明电的工业革命一样的机遇……关键还是要把底层的算法、算力和数据扎扎实实做好，而且更关键的是场景落地，目前（我们）还在做一些思考。我感觉现在有很多公司太急了，感觉是为了提振股价，我们一贯不是这种风格。”

结合当时的语境，很多人认为这次“自省”与腾讯最新的财报表现高度相关。虽然2023年Q1季度的财报显示，腾讯呈现出全面复苏态势，总营收、游戏营收、广告营收、金融科技及企业服务业务收入等关键数据都实现了超过10%的增长，但这些增长基本都由传统业务完成。

没有人比马化腾更懂这种局面背后的隐忧。2011年腾讯在赢得3Q大战的“胜势”下，被百度抢走了保持了五年的中国互联网企业市值头把交椅。那段时间又恰逢所谓“web2.0时代社交平台”崛起，新浪微博快速成长，人人网带着中国版Facebook的概念去纽约上市，根据潘乱写的那篇《腾讯没有梦想》，“看衰腾讯”几乎是一夜之间成为了舆论场中的政治正确，就连高盛也直言不讳地批评腾讯“管理层习惯性地持保守态度，导致腾讯的核心平台面临新浪和人人等威胁”，直接逼出了腾讯创业史上一个名场面的诞生：

2011年初，“陷入严重自我怀疑”的马化腾在一次总办会上邀请16名高管一起在纸上写下他们心中最真实的“腾讯核心竞争力”，最后在全部21个答案里筛选出两个，分别是“流量”和“资本”——刘炽平的释义是“通过资本形成结盟关系，既可以实现开放的目的，同时也可以让腾讯庞大的流量资源获得一次资本意义上的释放”。

据说腾讯因此一度出现了所谓投资部的“当权派”和做业务的“少壮派”之间的对立，但在这之后马化腾确实“Make Tencent Great Again”。

此去十二年，或许又是一个轮回。

其实，这届大模型明星创业者们说不定也是这么想的。

MiniMax虽然早在Pre-A轮融资时就被广泛认为拥有与OpenAI相似的商业模型，业务围绕着to B与to C两条线展开。但实际上to B业务起步缓慢，直到今年3月才逐渐开始AI服务接口，不到一个季度的运营时间很难帮助MiniMax API形成足够的竞争壁垒。上个月，金山办公CEO章庆元在直播里聊到大模型应用时就非常坦诚地表示“之前与MiniMax合作，接下来也会与百度深度合作”。

To C业务相对成熟，目前主打的对话式AI软件Glow目前已经积累了数百万用户，初步具备了通过“内容生成与用户反馈内循环”的“user-in-the-loop”的方式来不断迭代基础大模型的能力，在形态上已经尽可能地向ChatGPT的人类反馈强化学习机制（RLHF）看齐。但由于Glow与ChatGPT、文心一言不同，产品定位向“AI情感机器人”倾斜，MiniMax在运营层面承担着超额的压力。今年3月的下架，就被认为是其内部调整应用场景，履行年初出台的《互联网信息服务深度合成管理规定》中关于“深度合成服务提供者有义务建立健全用户管理制度、制定和公开管理规则、加强内容管理”的要求。

2月份王慧文刚刚宣布下场创业、准备寻找联创搭建核心团队的时候，同样作为并购传闻当事方的西湖心辰的创始人蓝振忠曾经在朋友圈里进行了一次“两段式的辟谣”：前半段是一次礼貌地婉拒，蓝振忠表达了“心辰打造成中国的OpenAl”的决心以及“心辰的打法更适合中国国情”的自信；后半段是一则招聘启事，蓝振忠希望招聘一名CEO，找到属于西湖心辰“Sam Altman”。

当时很多人对此的解读是，西湖心辰在等待比王慧文更合适的领路人。而庄明浩、陈巍等则相信蓝振忠是在谈一个共性问题：人工智能赛道的竞争，早就不是一个纯粹的技术问题了。