OpenAI 最强 AI 模型:GPT-5.6 系列登场,编程跑分超 Claude Mythos 5 - 爱游戏

OpenAI 于 6 月 27 日正式推出了其最新的 GPT-5.6 系列模型。根据美国政府的要求,目前该系列模型仅对少数“可信赖的合作伙伴”开放预览。

此次发布的模型系列包含三个版本:

  • 旗舰版 Sol:每百万输入 token 收费 5 美元(约合人民币 34 元),每百万输出 token 收费 30 美元(约合人民币 204.3 元)。
  • 均衡版 Terra:每百万输入 token 收费 2.5 美元(约合人民币 17 元),每百万输出 token 收费 15 美元(约合人民币 102.1 元)。
  • Luna:注重速度和成本效益,每百万输入 token 收费 1 美元(约合人民币 6.8 元),每百万输出 token 收费 6 美元(约合人民币 40.9 元)。

OpenAI 还改进了提示词缓存机制,以降低重复提示词的调用成本并提高可预测性。

在性能方面,OpenAI 表示 GPT-5.6 Sol 是其目前最强大的模型,引入了新的 Max 推理能力,并配备了用于加速复杂任务的 Ultra 模式,该模式利用子智能体技术。

在编程能力测试中,Sol 在 Terminal-Bench 2.1 基准测试上取得了新高。在标准模式下,其得分达到 88.8%,超过了 Claude Mythos 5 的 88.0%;而在启用 Ultra 模式后,得分更是达到了 91.9%。

在生物学领域的 GeneBench v1 测试中,GPT-5.6 模型在消耗更少 token 的情况下,展现出比 GPT-5.5 更强的性能。

网络安全方面,GPT-5.6 Sol 在漏洞研究和利用等需要长序列处理的安全任务上表现出显著提升。在 ExploitBench 测试中,它仅用约三分之一的输出 token 即可达到与 Mythos Preview 相似的效果。

安全设计上,GPT-5.6 Sol、Terra 和 Luna 采用了分层防护策略,包括内置的拒答机制、实时生成过程分类器、账户级风险审查、差异化访问控制、监控和执法措施。对于高风险场景,系统可以暂停生成过程,并由更强大的推理模型进行复核,若检测到违规,内容将在展示前被拦截。

OpenAI 计划在未来几周内正式向公众开放 GPT-5.6 Sol、Terra 和 Luna。此外,OpenAI 还计划于 7 月在 Cerebras 平台上提供 GPT-5.6 Sol 的服务,最高速度可达每秒 750 token,初期将仅面向部分客户。

爱游戏体育围绕ayx不断创新,回应用户的真实需求。

爱游戏体育专注实时更新,比分毫秒必达,为用户提供专业可靠的体验。

mr. robul islam

精选爱游戏内容,爱游戏体育与你一同发现更多精彩。

围绕深度分析,洞悉赛事乾坤,爱游戏体育持续打磨更优质的服务。

3 Comments

  • 爱游戏体育
    2024年5月15日
    回复

    作为一家深耕体育数据服务领域的科技公司,爱游戏体育科技(北京)有限公司自2011年成立以来,便以专业、高效为核心,致力于为全球体育爱好者提供前沿赛事资讯与精准数据。

    • Amron Morg 2024年5月10日 回复 爱游戏体育致力于成为最值得信赖的体育赛事信息与数据服务平台,赋能每一位体育爱好者,提供全方位的赛事资讯与数据服务。
  • 爱游戏体育
    Dec 08 2022
    Reply

    爱游戏体育始终坚守“赋能每一位体育爱好者”的使命,通过整合海量全球热门赛事信息,并辅以深度分析与实时比分,力求为用户打造无与伦比的赛事浏览体验。

爱游戏体育专注实时更新,比分毫秒必达,为用户提供专业可靠的体验。

follow us

爱游戏体育围绕爱游戏不断创新,回应用户的真实需求。