今年 4 月,OpenAI 发布了其旗舰推理模型o3 ,该模型在包括 Codeforces、SWE-bench 和 MMMU 在内的多个 AI 基准测试中取得了最佳 (SOTA) 成绩。o3 模型还支持外部工具,例如网页浏览、Python 解释器等。
尽管 o3 是 OpenAI 推出的最强大的模型,但由于其价格与其他替代方案相比较高,并未被开发者广泛采用。随后Google的 Gemini 2.5 Pro模型以四分之一的价格提供了几乎相同的性能,而 Anthropic 的 Claude 3.7 模型则以相似的价格提供了更好的编码性能。
今天,OpenAI 响应开发者的反馈,将 o3 模型的价格降低了近 80%。o3 模型发布时的价格为每百万输入词元 10 美元,每百万输出词元 40 美元。从今天起,OpenAI 将价格降至每百万输入词元 2 美元,每百万输出词元 8 美元。此次降价使 o3 对开发者而言更具吸引力。
您可以参考下面的基准对比表,该表是Google上周在 Gemini 2.5 Pro 六月更新发布期间发布的,以了解 OpenAI 的 o3 与其他领先型号的对比情况。
除了降价之外,OpenAI 还将于今天晚些时候推出其新的旗舰推理模型 o3 Pro。o3 Pro 模型预计将在几个关键的 AI 基准测试中超越 Gemini 2.5 Pro 6 月更新,定价可能为每百万输入词元 10 美元,每百万输出词元 40 美元。