关于OpenAI的语言模型o1和o3的五秒思考
- 2024年9月,公司展示了o1语言模型的预览版。
- OpenAI宣布了o3和o3-mini模型。
- 之前的模型被称为o1。
- 公司故意跳过一个数字,“是出于对Telefonica(一家以O2品牌运营的电信公司)的尊重,以及延续起坏名字的传统,”OpenAI的CEO Sam Altman说。
- 开发者训练o3在回答用户查询前“思考”。
- 模型会有轻微的延迟。
- 它会在给出它认为最准确的答案前重申其推理过程,据TechCrunch报道。
- 用户可以“调整”推理时间——给模型的时间越多,它处理请求的能力就越好。
- 在ARC-AGI测试中,该测试旨在衡量AI学习超出其训练数据的技能的能力,o3得分为87.5%。
- 85%的得分被认为是“人类水平”。
- TechCrunch指出,在外部测试之前,这些结果应谨慎对待。
- 目前,这两个模型对公众不可用,但将开放进行公共安全测试——安全研究人员将能够测试它们。
- 根据Altman的说法,OpenAI计划在2025年1月底发布o3-mini,随后是o3。
- OpenAI在2024年9月推出了o1语言模型的预览版(专注于推理密集型任务)。
- 在12月初,公司发布了o1的完整版本,并增加了一个ChatGPT Pro订阅,提供“独家”版本的访问。