2025 年 6 月 18 日 下午 3:37

OpenAI 发布最强推理模型 o1,公司计划以 1.07 万亿估值进行新一轮融资|天顺财经 AGI


北京时间 9 月 13 日凌晨,美国 OpenAI 公司发布全新模型技术产品 o1,包括两种版本 o1-preview 和 o1-mini,前者具有高级推理功能,在推理数学、编程、科学等问题的能力上有显著提高,性能接近理化生博士水平;后者则是一款更小巧、专为代码生成优化的模型。

这就是此前传言中高级推理能力强大模型的 「Strawberry」 项目。也有人分析称,o1 是 Orion 大模型简称。

OpenAI 表示,对于复杂推理任务而言,新模型代表着 AI 能力的崭新水平,因此值得将计数重置为 1,给它一个有别于 「GPT-4」 系列的全新名号。同时,这也预示着,AI 时代迎来崭新的起点——能够进行通用复杂推理的大模型重要到来。

需要注意的是,o1 目前的聊天体验还比较基础。不同于其前身 GPT-4o,o1 目前无法浏览网页或处理文件分析功能。尽管它具备图像分析功能,但该功能暂时关闭,等待进一步测试。此外,o1 还有消息量限制——目前 o1-preview 每周限额 30 条、o1-mini 每周 50 条。

即日起,o1-preview 和 o1-mini 两个版本已经在 ChatGPT Plus/Team 和 API 接口渠道上线,企业和教育用户将于下周初获得优先访问权限。

OpenAI CEO 奥尔特曼 (Sam Altman) 表示,「这是我们迄今为止功能最强大、最一致的模型系列 o1,也是迄今为止我们最好的推理模型。虽然 o1 仍然存在缺陷并有限,但使用时的感觉依然更加令人印象深刻。」

具体来看,OpenAI o1 可以解决比以前 GPT 时期的科学、编码和数学模型更难的问题。

OpenAI 的研究负责人 Jerry Tworek 透露,o1 模型背后的训练与之前的产品有着根本性的区别。之前的 GPT 模型旨在模仿其训练数据中的模式,而 o1 的训练旨在让其独立解决问题。在强化学习的过程中,使用奖励和惩罚机制来 「教育」AI 使用 「思维链」 来处理问题,就像人类习得拆解、分析问题的方式一样。

o1 上线之后,现在 ChatGPT 可以在回答问题前先仔细思考,而不是立即脱口而出答案。就像人类大脑的系统 1 和系统 2,ChatGPT 已经从仅使用系统 1(快速、自动、直观、易出错) 进化到了可使用系统 2 思维 (缓慢、深思熟虑、有意识、可靠)。这让它能够解决以前无法解决的问题。

所谓推理大模型,就是 AI 会在回答之前花更多时间进行思考,就像人类思考解决问题的过程一样,而非预测单词生成的序列。比如通过文字点开 AI 思考的过程,还会出现 AI 表示 「我在思考这个事情这么做行不行」、「啊时间不够了得尽快给出答案」 等。OpenAI 确认,这里展示的并不是原始的思维链,而是 「模型生成的摘要」,公司也坦率承认这里有保持 「竞争优势」 的因素。

根据测试,在国际数学奥林匹克 (IMO) 资格考试中,GPT-4o 仅正确解答了 13% 的问题,而 o1 模型正确解答了 83% 的问题。而在编程能力比赛 Codeforces 中,o1 模型拿到 89% 百分位的成绩,而 GPT-4o 只有 11%。

OpenAI 发现,随着更多的强化学习 (训练时计算) 和更多的思考时间 (测试时计算),o1 的性能持续提高。而且扩展这种方法的限制与大模型预训练的限制有很大不同,OpenAI 也还在继续研究。

OpenAI 技术文件称,实验结果表明:o1 超越了人类专家的表现,性能接近理科博士水平,成为第一个在该基准测试中做到这一点的模型。而在下一个更新的版本中,AI 在物理、化学和生物学的挑战性基准测试中,表现能够与博士生水平类似。

除了 OpenAI o1-preview 外,OpenAI 今晨也同步推出了 o1-mini 模型,更快、更便宜,定价也比 preview 版本降低了 80%,适用于需要推理但不需要广泛世界知识的场景。

很显然,尽管新的 OpenAI o1 还不具备更全面问题解决能力,但显著提升的推理能力使其在科学、编程、数学等专业领域具备了更大的用途,以及 AI Agent 相关技术的下限和上限被整体拉高,大幅提升科学研究和生产端的能力,对于消费端来说意义不算太大。

英伟达首席科学家 Jim Fan 表示,新的 o1 需要消耗更大的算力和数据,并且能够形成数据飞轮效应,正确的答案及其思考过程可以成为很好的训练数据。从而不断改进推理核心,类似 AlphaGo 的价值网络随着 MCTS 生成更多精炼数据而改进。

天风国际称,OpenAI o1 系列模型大幅增强推理能力,并宣布新的 Scaling 范式:通过 RL 解锁 Test time compute(推理时间)。

此外,9 月 11 日彭博社报道称,OpenAI 正在商谈以 1500 亿美元 (约合 10675.35 亿元,1.07 万亿元) 的估值进行新一轮融资,有望从投资者那里筹集 65 亿美元,投资方包括苹果、英伟达、微软等。同时,OpenAI 还在谈判以循环信贷安排的形式从银行借款 50 亿美元。

成立于 2015 年的 OpenAI,一直处于科技行业向 AI 快速转变的中心,其发布的聊天机器人产品 ChatGPT 于 2022 年首次亮相,引发全球 AI 投资热潮。OpenAI 首席财务官 Sarah Friar 近日在内部备忘录中表示,新一轮融资将支持公司对计算能力和其他运营费用的需求。她强调,该公司的目标是允许员工在今年晚些时候的收购要约中出售部分股份。

(本文首发于天顺财经 App,作者|林志佳,编辑|胡润峰)

- Advertisement -spot_img

推荐阅读