OpenAI推出新推理模型GPT-o3和o4-mini 可访问外部工具如浏览器或Python解释器
OpenAI 在今天推出了该公司最新的推理模型 GPT-o3 和 GPT-o4-mini 版,这些模型在多个 AI 基准测试中获得了最佳的结果,而且这些模型还能够访问外部工具例如网络浏览器和 Python 解释器等。
OpenAI 表示这些新模型经过训练能够推理何时以及如何使用工具以正确的输出格式生成详细的响应,而凭借最先进的推理能力和工具访问权限,用户可以获得比 GPT 其他模型都更好的查询响应。
其中 o3 模型是目前 OpenAI 最强大的推理模型,在 Codeforces、SWE-bench 和 MMMU 基准测试中都创下了新的 SOTA 基准,该模型还支持图像上传,因此用户也可以用这个模型分析图像、图标和图形等。
o4-mini 则是个体积较小的模型,该模型的特点是速度更快和成本更低,尽管模型体积较小但该模型在数学、编程和视觉任务方面的表现和 o3 相当,在 AIME 2025 竞赛中 o4-mini 与 Python 解释器配合使用时得分为 99.5%,由于该模型效率比 o3 还要高,因此在处理高容量的推理任务时 o4-mini 模型更好。
OpenAI 称这两个新模型给出的响应都更加自然和更具对话性,因为模型可以参考记忆和过去的对话,OpenAI 在底层使用大规模强化学习来提升性能,也通过强化学习来训练这个两个模型使用外部工具。
客户端方面 ChatGPT 付费订阅用户现在就可以通过模型选择器切换到新的 o4-mini、o4-mini-high 和 o3 模型,ChatGPT 免费用户则可以在文本选择器中使用思考来试用 o4-mini 模型,OpenAI 还计划在未来几周推出 o3-pro 模型并提供全面的工具支持。
API 方面,o3 模型每百万输入是 10 美元,每百万输出是 40 美元;o4-mini 定价与 o3-mini 相同,都是每百万输入 1.1 美元,每百万输出为 4.4 美元,这些价格相较于其他模型来说还是比较贵的,如果处理大量不是非常重要的任务可能选择其他价格更便宜的模型可以节省不少成本。