OpenAI发布o3-mini,可免费使用、3大推理模式

2025-02-15


OpenAI已经正式推出了新模型o3-mini,该模型现已在ChatGPT和API中上线。

对于Pro用户,他们可以无限制地使用o3-mini。而Plus和Team用户的使用速率限制将是o1-mini的3倍。免费版的ChatGPT用户虽然也可以免费体验o3-mini,但会有使用次数的限制。

值得一提的是,o3-mini具备了网络搜索功能,并且能够展示其完整的深度思考过程。不过,令人遗憾的是,o3-mini目前并不支持视觉推理功能。

图片

o3-mini是OpenAI推出的首款小型推理模型,它集成了多项满足开发者需求的特性,如函数调用、结构化输出以及开发者消息功能,使得模型能够无需额外调整即可直接投入实际应用。

与OpenAI的o1-mini和o1-preview模型一样,o3-mini也支持流式传输功能。

此外,开发者还可以根据实际应用场景的需求,在低、中、高三种推理强度之间灵活切换:

当面对复杂难题时,可以选择高推理强度,让模型进行更深入的思考;而当面对对延迟敏感的问题时,则可以选择低推理强度,以确保响应速度。

在性能表现上,OpenAI对o3-mini进行了针对STEM(科学、技术、工程和数学)推理的优化。在数学、编码和科学领域,中等推理强度的o3-mini性能与OpenAI的o1模型相当,但响应速度更快。专家评估指出,o3-mini给出的答案相比OpenAI的o1-mini更为准确、清晰,且推理能力更强。

在美国数学竞赛(AIME 2024)中,o3-mini在低推理强度时的表现与o1-mini相近,中等推理强度时与o1相当,而在高推理强度时则超越了o1-mini和o1;在博士水平的科学问题测试中,o3-mini在不同推理强度下的表现同样出色。

图片

在研究级数学测试中,o3-mini凭借其高强度的推理能力,展现出了比前代模型更优越的表现。在竞赛编程领域,随着推理强度的提升,o3-mini的Elo评分也稳步上升,全面超越了o1-mini,并且在中等推理强度下,其表现与o1相当。

在软件工程测试中,o3-mini更是脱颖而出,成为了表现最佳的模型。

此外,在响应速度方面,o3-mini的平均响应时间为7.7秒,相较于o1-mini的10.16秒,快了整整24%。

图片

在OpenAI发布新模型之后,网友上来就是灵魂发问,这个会比Deepseek的R1更好吗?

图片

感谢新增网络搜索功能,非常喜欢这个。

图片

功能建议:请在ChatGPT中增设一个选项,使用户能够选择DeepSeek R1作为运算模型,这一功能可以参照Perplexity AI的设计。非常感谢!

图片

虽然不支持视觉功能,o3仍然遛的起飞。

图片

经过对o3-mini的评估,我至今对它感到非常满意。我很高兴它现在能够在我庞大的代码库中展示其思考推理的过程。我注意到了DeepSeek所带来的积极影响,这真的很棒,仅凭一些简单的功能就能极大地提升用户体验,帮助用户保持投入并激发新的思考。

图片

o3-mini高推理模式,Plus用户每周只有50条消息?

图片

到目前为止,我对o3-mini的印象相当不错。虽然它本有可能表现得更加出色,但实事求是地说,o3-mini的表现已经非常令人满意了。

图片


分享