继 2 月、5 月杨植麟和梁文锋两次论文 「撞车」 后,本周,杨植麟和闫俊杰首次在大模型赛道中 「撞车」,目标则是梁文锋的 DeepSeek。
近日,月之暗面发布首款面向软件工程任务的开源代码大模型 Kimi-Dev-72B,基于 720 亿参数的 Qwen2.5-72B 模型训练,采用大规模强化学习方式优化,在 SWE-bench Verified 基准上实现 60.4% 准确率,超越 DeepSeek 等模型。而且,6 月 20 日晚,月之暗面发布首个 Agent,宣布小范围内测 Kimi-Researcher(深度研究)。
与此同时,「大模型六小虎」(智谱、百川、零一、MiniMax、月之暗面、阶跃星辰) 里面的另一家公司 MiniMax 进入新品周,连续发布五个产品:RL 训练成本仅 53 万美元 (约 380 万元)、性能比肩 DeepSeek 的开源推理模型 MiniMax-M1,成为上下文最长的推理模型;性能仅次于字节 Seedance 1.0、超越 Veo3 的 Hailuo 02(0616) 视频模型;通用智能体产品 MiniMax Agent;海螺视频 Agent;以及今天发布的 MiniMax Audio 更新版本。
值得注意的是,「大模型六小虎」 也在争夺第一股。继智谱之后,据彭博,稀宇科技 (MiniMax) 正考虑赴港首次公开募股 (IPO),估值约 30 亿美元,目标是在今年 IPO,已经与投行进行沟通。另据字母榜,六小虎里已经有五家在筹备上市。
显然,随着 DeepSeek 跻身 AI 领域 「顶流」 之列,从月之暗面 CEO 杨植麟、闫俊杰,到其他 「大模型六小虎」 企业创业者,都仿佛被 DeepSeek、字节、阿里等多座 「大山」 压得步履维艰。他们借助技术产品发声,字里行间无不透露着 「自己不希望被遗忘」。
MiniMax 创始人兼 CEO 闫俊杰近期发文表示,「第一次感觉到大山不是不能翻越。」
然而,多名业内专家告诉笔者,基座级大模型的争夺,关键还是参数的大小,而目前的情况是,这六家公司都缺少强大的计算能力,也没有足够的专业技术人员,不少高管都已经离开了字节跳动、阿里这样的大公司。因此,钱不够、卡不够、数据不够、商业化艰难,这种情况下 「大模型六小虎」 不得不分化找寻融资出路,面临多重挑战。
IDC 分析师称,2023 年-2028 年中国生成式 AI 软件市场规模大约只有 48.9 亿元,包含企业级 AI 平台、应用规模,相比算力和基础设施规模简直不值一提。「现在消费级 AI 应用培育出来市场规模并不大。」
针尖对麦芒,MiniMax 和 kimi 都对标 DeepSeek
「DeepSeek 之前,人们认为中国的 AI 模型落后了好几年,而我们意识到它们实际上只落后了几个月。」 美国白宫加密货币和 AI 事务负责人 David Sacks 近期表示,在 AI 大模型方向,中国落后美国大概是 3-6 个月。
事实上,自年初开始,DeepSeek(深度求索) 以低成本、高性能的开源模型迅速崛起,导致 「大模型六小虎」 的融资面临挑战,这六家企业正经历着前所未有的行业洗牌。从商业模式的重构到资本寒冬的侵袭,从人才流失的阵痛到技术路线的迷茫,「六小虎」 的生存图景在 DeepSeek 的冲击下呈现出复杂而严峻的局面。
「市面上 90% 的 AI 服务,都是 『伪 AI』。」 梅花创投创始合伙人吴世春近期表示,很多 AI 技术缺乏护城河,AI 技术公司若无法构建底层技术壁垒,终将面临被替代风险,行业需警惕伪创新泡沫。每次大模型升级都会对其造成冲击,所有套壳行为都只是短期套利。
「大模型六小虎」 公司早期普遍以 「通用大模型+行业解决方案」 为核心商业模式,试图通过技术授权、定制化项目和云服务获得收入,包括 API 服务、内嵌广告业务、订阅服务、定制化开发、应用合作分成等。
而如今,在 DeepSeek 热潮刺激之下,对于通用人工智能 (AGI) 的目标更为明确。
清华大学教授、智谱 AI 创始人唐杰近期分享了上述这张图,通过多种多类的多模态 AI 大模型,可以直接对标人类的大脑、小脑,形成让机器像人一样的思考能力。
而这次,MiniMax 和 Kimi 月之暗面迎来了首次在大模型赛道 「撞车」,几乎同一时间发布新产品。
其中,MiniMax 连续五天发布新品,推出了推理模型、视频模型、语音模型、Agent 智能体等技术,几乎瞄准的都是智谱现有的技术产品。
而 MiniMax 发布的 MiniMax-M1 系列模型引发广泛关注,其在处理百万级 Token 的长文本上实现了重大突破,并且其 RL(强化训练) 成本下降一个量级,成本仅 53 万美元 (约 380 万元),推理效率则数倍于竞争对手。
据论文显示,在工具使用场景 (TAU-bench) 中 MiniMax-M1-40k 同样领跑所有开源权重模型,超过 Gemini-2.5 Pro;代码能力 (SWE-bench) 方面,M1-40k 和 M1-80k 版本分别取得了 55.6% 和 56.0% 的优异成绩,显著超越其他所有开源模型,稳居第一梯队;长文本 (MRCR) 方面,依托百万级上下文窗口,M1 系列在此项任务中不仅全面超越了所有开源对手,甚至击败了 OpenAI 的 GPT-4o 和 Anthropic 的 Claude 3 Opus,在全球范围内仅以微弱差距落后于谷歌的 Gemini 2.5 Pro,位列全球第二。
目前,MiniMax-M1 已宣布开源。价格方面,针对 0-32k Token 处理层面,输入 0.8 元/百万 Token,输出 8 元/百万 Token;32k-128k Token 层面,输入 1.2 元/百万 Token,输出 16 元/百万 Token;128k-1M Token 层面,输入 2.4 元/百万 Token,输出 24 元/百万 Token。
相比文本模型,虽然 MiniMax 图生视频模型海螺 Hailuo-02 效果更好,但会员价格更昂贵,一年订阅最高 1499.99 美元 (约为人民币 10769 元),每月 12000 个积分 (约合生成 480 个视频)、10 秒视频生成,相比爱诗、生数 Vidu(一年 6710 元)、快手可灵 (钻石 5594 元) 等同行 C 端收费模式贵很多,更不用说 B 端的预付费模式了。
从 MiniMax 整体来看,一方面在于拓展产品矩阵,目前海螺 AI 与新上线的 MiniMax Agent 均已开启订阅服务;另一方面则聚焦付费意愿更强的海外市场,近期推出的模型及产品均同步在海外进行上线。
很显然,结合与 MiniMax 即将 IPO 消息来看,MiniMax 或许 「烧不动」 投资人的钱,打算用更大的利润和收入满足 IPO 上市要求,从而让 MIniMax 尽快实现 IPO 上市。
闫俊杰曾向笔者表示,当国内大模型 「价格战」 发生后,大部分公司认为大模型很贵,之后很多人认为大模型很便宜,可以放心地使用。最终非常惊人地发现,有许多传统企业非常愿意使用大模型,他们觉得反正成本低,出错了之后也不要紧,多调用一次就好了。客观地来说,这极大提高了模型调用量,从而推动模型做得更好,至少目前在非英语语种上,国内大模型水平已与 GPT 不相上下。因此,从乐观角度看,国内大模型的使用量确实在显著地增长,并且中国 AI 大模型在海外确实越来越具有竞争力。
「竞争不可避免,既然不能避免,就要努力做到最好。」 闫俊杰称,「在同等计算 GPU 条件下,尽可能训练更多的轮次、更大数据,做一些科研上的比较有挑战的事,做别人没有做过的事情。经过几次科研的突破,其实能以比较有限的资源,做出一个在国际上第一梯队多模态的表现,这个我们目前还是比较骄傲的。」
相比 MiniMax,月之暗面不再专门做文生视频、图生视频模型,而是专注于 LLM 理解和思考,直接瞄准 DeepSeek。
6 月 17 日,月之暗面发布最新开源编码模型 Kimi-Dev-72B,在 SWE-bench Verified 上取得了 60.4% 的性能提升,超越 DeepSeek,创下开源模型 SOTA 成绩。
随后,月之暗面更进一步,6 月 20 日晚发布其首个 Agent——Kimi-Researcher,采用异步执行方式,用更多时间逐步推理、检索和撰写内容。月之暗面表示,模型即 Agent,Kimi-Researcher 是基于端到端自主强化学习技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。
性能方面,在红杉中国发布的 xbench 基准测试,Kimi-Researcher 在 DeepSearch 任务中取得 69% 的平均通过率,领先该榜 DeepSeek 等其他模型。而在 Humanity』s Last Exam(HLE) 中,Kimi-Researcher 性能超过 OpenAI Deep Research(26.6%)、Gemini 2.5 Pro(21.6%),和 Gemini-Pro 的 Deep Research Agent(26.9%) 打平。
「我们也将逐步开源 Kimi-Researcher 基础预训练模型、以及强化学习后的模型,希望与大家一起推动 Agent 强化学习方向的探索。」 月之暗面表示。
据笔者了解,月之暗面也在考虑 IPO 上市或其他资本化事宜。早前有报道指出,杨植麟已在内部定下通用 AI 模型目标,减少投流而把更多资源转向 AI 模型技术能力迭代。
很显然,大家都想对标 DeepSeek。笔者了解到,近期智谱也将推出新技术产品,依然瞄准 DeepSeek。
六小虎抢大模型第一股,今年上半年 A 股 IPO 融资增长 14%
2023 年上半年,百川智能、阶跃星辰、零一万物和月之暗面成立,DeepSeek 也是这一年成立。智谱和 MiniMax 要更早些,分别是在 2019 年和 2021 年,如今估值都高达 200 亿元左右。
从时间来看,「大模型六小虎」 已经可以开始筹备 IPO 了。因此当前,六家公司都在追逐 IPO 上市之路。
今年 4 月 14 日,智谱正式提交上市辅导备案,由中金公司担任辅导机构。成为六小虎中首家启动 IPO 进程的企业。
如今,MiniMax 也在筹划赴港 IPO。
然而,时间先后并非 IPO 的最大优势,智谱未必有先发优势。据智谱公布的备案计划,上市辅导分三阶段推进:4 月完成摸底调查与方案制定;5 月至 7 月聚焦规范整改与持续尽调;8 月至 10 月进入冲刺期,筹备上市申请文件。也就是筹备 IPO,再加上审批、路演等等必要程序,距离招股书还有半年多时间,离 IPO 上市执照还有半年到一、两年的时间。
2025 陆家嘴论坛上,中国证监会宣布计划在上海以科技股为主的科创板设立新板块,以容纳尚未盈利的成长型企业。其中不仅重点提到 AI 企业,更提及将重启未盈利企业适用科创板第五套标准上市,近期兆芯、PPIO 等多家 AI 公司都是在这样一个大环境下启动 IPO。
有多家企业负责人告诉笔者,对于科创板第五套标准上市正在仔细研读,这对于很多 AI、半导体、机器人等领域处于亏损的科技企业来说是一件利好。
智谱今年 3 月曾向笔者透露,2024 年以来,智谱的 ARR 商业化收入取得了 100% 以上的增长。
「在 B 端,在 API 价格大幅普惠的情况下,智谱 MaaS 开放平台 API 年收入同比增长超过 30 倍;在 C 端,2024 年三季度上线付费功能以来,『智谱清言』 预计年收入超过千万元。目前,智谱清言拥有超过 2500 万用户。」 智谱称。
不过,「大模型六小虎」 陆续出现高管离职情况,对于企业发展和市场观感等极为不利,有可能成为上市阻碍。
- 智谱 AI 在 2025 年上半年有 4 名高管离职,包括首席运营官张帆、智谱应用 AI 与合作副总裁李惠子等,但公司表示这些变动不会影响整体融资和业务进展。同时,公司引入了 Midjourney 前高管,强化 C 端市场布局。
- MiniMax 公司合伙人魏伟等商业化负责人离职,但官方表示这是 B 端业务进入新发展阶段的正常调整。
-
零一万物联合创始人谷雪梅、技术副总裁戴宗宏等核心成员离职创业,并获得创新工场投资支持。
零一万物创始人兼 CEO 李开复今年 3 月表示,DeepSeek 掀起的行业变革彻底颠覆了 AI 行业发展模式,可能让 OpenAI 创始人辗转难眠。他预测,中国市场最终可能只剩下 DeepSeek、阿里巴巴和字节跳动三家主要的 AI 模型公司,其中 DeepSeek 目前势头最强。
然而,从大环境来看,当前资本市场环境极佳,是 AI 公司上市的好时机。
德勤中国资本市场服务部发布的最新报告显示,2025 年上半年 (数据预估至 2025 年 6 月 30 日),A 股市场将有 50 只新股上市,合计融资 371 亿元。相较去年上半年的 44 只新股合计融资 325 亿元,今年上半年 A 股的 IPO 数量、融资额同比均上升 14%。
其中,19 只新股将于上海证券交易所上市融资 202 亿元人民币,同时深圳证券交易所录得 26 只新股融资 150 亿元人民币。北京证券交易所将有 5 只新股融资 19 亿元人民币。创业板以新股数量成为最活跃的市场板块,而上海主板则以融资金额带领其他的市场板块。
港股方面,德勤报告显示,今年上半年,港股有 40 只新股融资 1021 亿港元,与去年同期的 30 只新股融资 132 亿港元相比,代表新股上市数量增加 33%,融资总额攀升 673%。接近四分之三的 2025 年上半年的融资额来自 4 只超大型 A+H 新股及 1 只 H 股上市。
仅在 6 月 (截至 2025 年 6 月 22 日),港交所、上交所官网就有超过 60 家企业提交 IPO 上市招股书。
展望 2025 年下半年,对于港股,目前有超过 170 宗正在处理的上市申请个案,包括超过 5 家公司每家或会融资最少 10 亿美元,德勤中国资本市场服务部预计 2025 年全年港股新股市场可从 80 只新股融资 2000 亿港元。除了年内或会录得 25 只 A+H 新股外,大部分的上市项目将会来自科技、消费业等。
德勤中国资本市场服务部上市业务华北及华西区主管合伙人任绍文解释指出,上半年港交所凭借多只超大型新股荣升第一。鼓励内地龙头企业来港上市、简化 A 股上市公司的申请上市程序,及更理想的估值、更佳的市场流动性及资金承接能力均一一推动新股市场的动力。
任绍文指出,只要未出现重大负面的地缘政治或宏观经济干扰,其对港股在 2025 年具备条件争取全球 IPO 市场领先地位持审慎乐观态度。
「越来越多 A 股上市公司,包括来自全国中小企业股份转让系统 (即新三板),正积极利用香港这个国际融资平台,拓展全球资本、提升品牌影响力,实现 『出海』 的战略。同时,随着 『科企专线』 等政策新措施落地,将有更多生物科技及特专科技企业来港上市,为市场注入更多增长动能。港股上市制度持续优化,吸引了大量新经济企业及潜在上市申请人,资本市场的深度与竞争力不断提升,进一步巩固其作为全球领先上市平台的地位。」 任绍文称。
A 股方面,德勤预计,在目前新环境下,随着证监会推出进一步深化科创板改革的 「1+6」 政策措施,以及在创业板正式启用第三套标准支持优质未盈利创新企业上市等政策的实施,接下来 A 股市场有望逐步活跃,尤其是高科技企业的上市。
德勤中国资本市场服务部华北区上市业务合伙人杨红梅指出,国家对科技及创新行业的支持将推动科技、新能源等新质生产力到资本市场募融资金,并将成为 2025 年下半年 A 股市场的亮点。(本文首发于钛媒体 App,作者|林志佳,编辑|盖虹达)