复制成功

分享至

主页 > 数字货币 >

Claude Fable 5完整教学:官方handbook 8大prompt精华

2026.07.02

Claude Fable 5完整教学:官方handbook 8大prompt精华
Claude Fable 5 是 Anthropic 2026 年 6 月 9 日推出的旗舰模型,主打 1M context、多天无人监督自主运作、xhigh effort 级推理。Fable 5 曾于 6 月 12 日因商务部出口管制暂停,6 月 30 日解除禁令重新上线,是 Anthropic 目前 API 可用的最高等级模型。

本文汇整 Anthropic 官方《Prompting Claude Fable 5》handbook 精华,拆解 Fable 5 相比 Opus 4.8 的核心行为改变,以及对应的 prompt 与 harness 调整方式。适合开发者、AI Agent 建构者、企业技术决策者作为 Fable 5 上手的第一份中文完整指南。

Fable 5 是什么:1M context、xhigh effort、多天自主运作

Fable 5 API 型号 claude-fable-5,同时具备以下规格:

  • Context window:1M token(百万级 context),单次 output 最高 128K tokens
  • 定价:Input $10/M tokens、Output $50/M tokens(prompt caching 可打 9 折);美国本地推论加价 1.1 倍
  • 可用平台:Claude API、Claude Platform on AWS、Amazon Bedrock、Google Cloud、Microsoft Foundry
  • Adaptive thinking:唯一 thinking 模式,无法关闭;thinking.display 可设为 summarized(读 summary)或 omitted(不读,预设)
  • Safety classifier:Fable 5 内建拒绝分类器,涉及攻击型资安、生物与生命科学、model reasoning 提取的请求会被拒(HTTP 200 但 stop_reason: refusal),Mythos 5 版本无此分类器,仅开放给 Project Glasswing 受核准客户
  • 资料保留:30 天(不可用 ZDR 零资料保留)
  • Anthropic 官方对 Fable 5 相对 Opus 4.8 的改进定调为 7 项:长时序自主(Long-horizon autonomy)、复杂问题单次通过率(first-shot correctness)、视觉、企业工作流、程式码审查与除错、模糊需求处理、并发子代理。这 7 项改进的共同底层逻辑是同一件事:Fable 5 可以在用户不看的时间里持续稳定产出。

    核心典范转向:从Prompt Engineering 进到Loop Engineering

    Fable 5 最大的心法转变不是 prompt 写更好,而是从 prompt 步骤改成设计 loop。过去 Opus 4.6/4.7 的心法是:写一个好 prompt、Claude 回一个好答案。Fable 5 的心法是:设计一个能让 Claude 自我修正的环境回圈,让它反复 plan → act → review → improve,直到任务完成。

    Anthropic 在官方 handbook 明确给出这条 loop 设计指令:

    建立一种方法,在构建过程中每隔 [X] 个时间间隔检查自己的工作。每隔 [X 个时间间隔] 运行一次此方法,使用子代理根据规范验证你的工作。

    这一段的翻译:「建立一套自我检查机制,以 [X] 为间隔验证你自己的工作。每 [X] 间隔跑一次验证,用子代理对照规格检查。」关键是用一组独立 context 的验证子代理(fresh-context verifier subagents),而不是让主 agent 自我批评—因为主 agent 已经有偏见。

    这个转向也回应了 abmedia 过去报导的「Harness Engineering」概念—AI 的下一个战场不是模型,而是模型外面那层架构;以及 Akshay 提出的「模型只是回圈中的一个节点」观点。Loop engineering 是 Anthropic 对这条思路的官方版本。

    Effort 参数分级:5 级控制Fable 的token 花费

    Effort 是 Fable 5 最重要的成本控制旋钮,分成 5 级,由高到低影响 Claude 愿意花多少 token 在 thinking、tool calls、text response 上:

  • max:最高能力、无成本上限。用于需要最深推理的前沿问题。频繁调用会产生大量成本,不建议常态使用
  • xhigh:延伸能力,适合超过 30 分钟、token 用量以百万计的长时序 agent 与程式码任务
  • high(预设):复杂推理、困难程式码、agent 任务。等同不设 effort 参数
  • medium:平衡速度、成本、效能的中间值,适合需要平衡的 agent 任务
  • low:最省成本,适合简单任务、子代理、高流量情境
  • Anthropic 官方对 Fable 5 的建议是:从 high(预设)开始,对能力最敏感的工作用 xhigh,例行工作降到 medium 或 low。官方特别强调:Fable 5 在 low effort 下的表现,常常超过前代模型的 xhigh 表现—这是 Fable 5 世代模型能力提升的直接证据。如果任务完成但比预期慢、或想要更互动的工作节奏,直接降 effort。

    另外 Anthropic 提醒:在 high 与 xhigh effort 下要设较大的 max_tokens,因为这是 thinking + response text 的总硬性上限;起始建议 64K tokens,再依实测调整。

    官方 8 大 Prompt 范本:handbook 精华整理

    Anthropic handbook 提供了 8 段可直接复制的 prompt 范本,涵盖 Fable 5 最常出现的行为偏差。以下逐条整理与翻译。

    范本 1:防止过度规划(避免无限考虑选项)

    免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

    加⼊OKEx全球社群

    和全球数字资产投资者交流讨论

    扫码加入OKEx社群

    相关推荐

    industry-frontier