一文带你快速了解 GPT 最新模型 o1！国内直接使用！

拥抱编程的世界 2024/9/21

# 一、GPT-o1 简介

北京时间 9 月 13 日午夜，OpenAI 正式公开一系列全新 AI 大模型，旨在专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题，OpenAI 发布最强模型 o1 ！o1 系列分包含三款模型，OpenAI o1、OpenAI o1-preview 和 OpenAI o1-mini。

OpenAI o1：高级推理模型，暂不对外开放。

OpenAI o1-preview：这个版本更注重深度推理处理，每周可以使用 30 次。

OpenAI o1-mini：这个版本更高效、划算，适用于编码任务，每周可以使用 50 次。

为什么取名叫 o1，官方原文如下：

For complex reasoning tasks this is a significant advancement and represents a new level of AI capability. Given this, we are resetting the counter back to 1 and naming this series OpenAI o1.

翻译过来是：

对于复杂推理任务来说，这是一个重要的进展，代表了人工智能能力的新水平。鉴于此，我们将计数器重置为 1，并将这一系列命名为 OpenAI o1。

OpenAI 将计数器重置为 1，并将其命名为 OpenAI o1，强调其与传统 GPT 系列相比，更注重推理。这标志着一个新的 OpenAI o 系列的开始，类似于我们所熟知的 GPT 系列。

此外，o1 标志着大型学习模型（LLMs）训练方法的转变，更加强调在训练和推理阶段投入计算资源。

o1 模型并不是在所有情况下都旨在取代 GPT-4o。对于需要图像输入、函数调用或一致快速响应时间的应用，GPT-4o 和 GPT-4o mini 模型仍然是最佳选择。

# 二、OpenAI o1 如何工作

当您与 o1 交互时，首先会注意到的是，与 GPT-4o 相比，它生成响应的时间明显更长。这种故意的暂停反映了模型对推理的强调。o1 在响应之前花费更多的时间“思考”，允许它处理复杂的任务并在逻辑、数学、编程和科学中解决更难的问题。

o1 所花费的长反应时间，我们可以理解为类似人类的“深思熟虑”。可以发现随着训练时间（强化学习的增加）和思考时间（测试时的计算）的延长，o1 模型的表现逐渐提升。

拟人化的推理模式是 o1 的主打功能之一，与传统模型不同，它在回答问题之前会进行深入的思考，生成一个较长的内部思维链。这种思维链的产生使得 o1 能够更好地理解问题的本质，分析问题的各个方面，从而给出更准确和合理的答案。

# 三、与 GPT4o 相比 GPTo1 有什么特点？

o1 系列在推理测试中的表现足以吊打所有现有的 AI 大模型，在处理物理、化学和生物等需要强推理的理科问题时，o1 的表现甚至和该领域的博士生水平不相上下。

AIME 2024，一个高水平的数学竞赛，GPT4o 准确率为 13.4%，而这次的 o1 预览版，是 56.7%，还未发布的 o1 正式版，是 83.3%。

代码竞赛，GPT4o 准确率为 11.0%，o1 预览版为 62%，o1 正式版，是 89%。

博士级科学问题 (GPQA Diamond)，GPT4o 是 56.1，人类专家水平是 69.7，o1 达到了恐怖的 78%

与 OpenAI o1 相比的主要 AI 模型 GPT-4o：GPT-4o 是一种更通用的模型，非常适合一般的日常对话和文本生成。它也比 o1 型号更实惠，并且响应时间更快。但 OpenAI o1 在推理能力和解决复杂问题方面更胜一筹。 Claude（Anthropic 的 AI）：Claude 被设计为一个有道德的 AI，特别关注安全。定价相对合理，响应速度快，但不具备 OpenAI o1 的复杂问题解决能力。虽然相比 o1 更具成本效益，但 OpenAI o1 对于复杂的推理任务具有优势。 Google Bard：Google Bard 非常适合信息搜索和网页浏览，特别是在基于实时信息进行响应时。至于定价，它通常是免费的，但 OpenAI o1 更擅长解决复杂的数学和科学问题。下面是 OpenAI 新模型 o1 和 GPT-4o 的性能对比。结果分为四类。

这种强大的推理能力无疑是现有的 AI 大模型所缺乏的，但 o1 的出现打破了这一现状。

也就是说，o1 在科学、数学和编程领域都有强大的潜力，能够帮我们解决更多的实际问题，而不只是像以往一样仅能用于写作绘画音乐等文艺领域。

# 四、怎么使用 GPT-o1

目前，ChatGPT Plus 和 Team 用户可以体验 o1-preview 和 o1-mini 等模型。可以从 ChatGPT 的“模型选择器”中选择模型。API 用户中，只有花费超过 1000 美元的“大佬“们才能优先体验。（升级 plus 含国内镜像详细教程：升级 PLUS (opens new window)）

目前，o1-preview 每周限 30 条消息，“迷你版“o1-mini，每周可用 50 次。使用次数比较少，OpenAI 表示正在努力提升用户的可使用次数，并让 ChatGPT 能自动针对给定提示词选择使用合适的模型。此外，o1 还不能浏览网页或处理图片，所以有些日常任务还是得靠我们的老朋友 GPT-4o~（下图是国内镜像网站，不是套盒网站：了解更多 (opens new window)）

网站的简介一文带你快速了解GPT-4o！内含免费使用指南！

订阅ChatGPT PLUS

Choose mode