Claude Fable 5完整教学：官方handbook 8大prompt精华

2026.07.02

Claude Fable 5完整教学：官方handbook 8大prompt精华
Claude Fable 5 是 Anthropic 2026 年 6 月 9 日推出的旗舰模型，主打 1M context、多天无人监督自主运作、xhigh effort 级推理。Fable 5 曾于 6 月 12 日因商务部出口管制暂停，6 月 30 日解除禁令重新上线，是 Anthropic 目前 API 可用的最高等级模型。

本文汇整 Anthropic 官方《Prompting Claude Fable 5》handbook 精华，拆解 Fable 5 相比 Opus 4.8 的核心行为改变，以及对应的 prompt 与 harness 调整方式。适合开发者、AI Agent 建构者、企业技术决策者作为 Fable 5 上手的第一份中文完整指南。

Fable 5 是什么：1M context、xhigh effort、多天自主运作

Fable 5 API 型号 claude-fable-5，同时具备以下规格：

Context window：1M token（百万级 context），单次 output 最高 128K tokens

定价：Input $10/M tokens、Output $50/M tokens（prompt caching 可打 9 折）；美国本地推论加价 1.1 倍

可用平台：Claude API、Claude Platform on AWS、Amazon Bedrock、Google Cloud、Microsoft Foundry

Adaptive thinking：唯一 thinking 模式，无法关闭；thinking.display 可设为 summarized（读 summary）或 omitted（不读，预设）

Safety classifier：Fable 5 内建拒绝分类器，涉及攻击型资安、生物与生命科学、model reasoning 提取的请求会被拒（HTTP 200 但 stop_reason: refusal），Mythos 5 版本无此分类器，仅开放给 Project Glasswing 受核准客户

资料保留：30 天（不可用 ZDR 零资料保留）

Anthropic 官方对 Fable 5 相对 Opus 4.8 的改进定调为 7 项：长时序自主(Long-horizon autonomy)、复杂问题单次通过率(first-shot correctness)、视觉、企业工作流、程式码审查与除错、模糊需求处理、并发子代理。这 7 项改进的共同底层逻辑是同一件事：Fable 5 可以在用户不看的时间里持续稳定产出。

核心典范转向：从Prompt Engineering 进到Loop Engineering

Fable 5 最大的心法转变不是 prompt 写更好，而是从 prompt 步骤改成设计 loop。过去 Opus 4.6/4.7 的心法是：写一个好 prompt、Claude 回一个好答案。Fable 5 的心法是：设计一个能让 Claude 自我修正的环境回圈，让它反复 plan → act → review → improve，直到任务完成。

Anthropic 在官方 handbook 明确给出这条 loop 设计指令：

建立一种方法，在构建过程中每隔 [X] 个时间间隔检查自己的工作。每隔 [X 个时间间隔] 运行一次此方法，使用子代理根据规范验证你的工作。

这一段的翻译：「建立一套自我检查机制，以 [X] 为间隔验证你自己的工作。每 [X] 间隔跑一次验证，用子代理对照规格检查。」关键是用一组独立 context 的验证子代理(fresh-context verifier subagents)，而不是让主 agent 自我批评—因为主 agent 已经有偏见。

这个转向也回应了 abmedia 过去报导的「Harness Engineering」概念—AI 的下一个战场不是模型，而是模型外面那层架构；以及 Akshay 提出的「模型只是回圈中的一个节点」观点。Loop engineering 是 Anthropic 对这条思路的官方版本。

Effort 参数分级：5 级控制Fable 的token 花费

Effort 是 Fable 5 最重要的成本控制旋钮，分成 5 级，由高到低影响 Claude 愿意花多少 token 在 thinking、tool calls、text response 上：

max：最高能力、无成本上限。用于需要最深推理的前沿问题。频繁调用会产生大量成本，不建议常态使用

xhigh：延伸能力，适合超过 30 分钟、token 用量以百万计的长时序 agent 与程式码任务

high（预设）：复杂推理、困难程式码、agent 任务。等同不设 effort 参数

medium：平衡速度、成本、效能的中间值，适合需要平衡的 agent 任务

low：最省成本，适合简单任务、子代理、高流量情境

Anthropic 官方对 Fable 5 的建议是：从 high（预设）开始，对能力最敏感的工作用 xhigh，例行工作降到 medium 或 low。官方特别强调：Fable 5 在 low effort 下的表现，常常超过前代模型的 xhigh 表现—这是 Fable 5 世代模型能力提升的直接证据。如果任务完成但比预期慢、或想要更互动的工作节奏，直接降 effort。

另外 Anthropic 提醒：在 high 与 xhigh effort 下要设较大的 max_tokens，因为这是 thinking + response text 的总硬性上限；起始建议 64K tokens，再依实测调整。