v2.1.100 が本日リリースされた。地味に見えるが、--resume 時のプロンプトキャッシュ全ミスというクォータ爆速消費に直結するリグレッションがついに修正されている。あわせて Write ツールの大幅高速化、モデルの出力トークン上限拡張、そして先週から問題になっていた Max プランのクォータ問題の現状を整理する。
1. v2.1.100:--resume のプロンプトキャッシュ全ミスを修正(最重要)
対象:--resume でセッションを再開しているほぼ全ユーザー
v2.1.100 で修正されたバグの中で最も影響が大きいのはこれ:
--resume実行時、deferred tools・MCP サーバー・カスタムエージェントを使っているセッションで、最初のリクエストがプロンプトキャッシュを100%ミスしていた(v2.1.69 以来のリグレッション)
セッションを再開するたびに、Claude Code は「前回のコンテキストをキャッシュから引き継ぐ」はずが、実際はキャッシュを無視して新規リクエストを投げていた。MCP サーバーや deferred tools(ToolSearch 含む)を使っているほぼすべてのユーザーが対象になる。
なぜこれが重要か: プロンプトキャッシュヒットは入力トークンコストを最大 90% 削減する。これがミスし続けていると、--resume のたびに消費クォータが 10〜20 倍に膨らむ。Max プランでのクォータ爆速消費の原因のひとつがここにある可能性が高い。
v2.1.100 のその他の修正
| 修正内容 | 詳細 |
|---|---|
| Edit/Write 失敗 | PostToolUse フックでフォーマッタが同一ファイルを再書き込みすると “File content has changed” で失敗していた |
| PreToolUse フック | exit code 2 + JSON stdout でツールをブロックする動作が正しく機能していなかった |
| auto モードの境界無視 | 「プッシュしないで」「X より先に Y しないで」などのユーザー指示を auto モードが無視することがあった |
| フルスクリーン重複表示 | スクロール時に同一メッセージが 2 か所に表示されるバグ修正 |
| アイドル時トークン表示 | ”/clear to save X tokens” の X が累積値ではなく現在のコンテキストサイズを正しく表示するよう修正 |
| プラグイン MCP スタック | セッション起動時にプラグインの MCP サーバーが「接続中」のまま止まるバグを修正 |
| Linux seccomp | apply-seccomp ヘルパーが npm ビルドと native ビルド両方に同梱されるよう修正(unix-socket ブロックが正常に動作するように) |
# アップデート
npm update -g @anthropic-ai/claude-code
claude --version # 2.1.100 が表示されれば OK
2. Max プランのクォータ爆速消費問題:現状と対策
対象:Pro / Max プランで Claude Code を使っているユーザー全般
3/23 以降、Max プラン($200/月)のユーザーから「20 分でクォータを使い切ってしまう」という報告が相次いでいる。Anthropic も問題を認め、「想定より大幅に速くクォータが尽きるケースがある」と公式に認めた(The Register、DevClass)。
原因として判明しているもの
-
プロンプトキャッシュのバグ(→ v2.1.100 で修正済み)
--resume時のキャッシュ全ミス(上述)。セッション再開のたびに全コンテキストを再送信していた。 -
カウンターの desync バグ
GitHub Issue #41788 では「v2.1.89 以降、クォータが 70 分以内に枯渇するようになった」との報告。内部のクォータカウンターが実際の消費と乖離している可能性。 -
ピーク時間の制限強化
Anthropic の Thariq Shihipar が「需要増に対応するため、ピーク時間帯の 5 時間セッション制限を調整している」と認めた。約 7% のユーザーが以前は引っかからなかった制限に当たるようになったという。
今すぐできる対策
# 1. /clear でコンテキストを定期的に整理
/clear
# 2. コンテキスト使用量を確認
/cost
# 3. 長いセッションは意識的に区切る
# → 新しいタスクは /clear から始める
- 古いバージョンにダウングレードが有効だったという報告があり、
2.1.34まで戻すと改善したという声も(v2.1.100 で根本原因のひとつが修正されたため、まずは最新版に上げることを推奨)。 - キャッシュ最適化が効くよう、CLAUDE.md は簡潔に保つこと。長い CLAUDE.md はキャッシュ効率を下げる。
3. Write ツール:大ファイルへの diff 計算が 60% 高速化
対象:タブ・&・$ を含む大きなファイルを頻繁に編集するユーザー
v2.1.98 で導入された最適化。Write ツールがファイル差分を計算する際のアルゴリズムが改善され、タブ文字・&・$ を含む大規模ファイルで最大 60% 高速化された。
合わせて SSE(Server-Sent Events)転送の計算量も O(n²) から O(n) に改善(v2.1.90)。会話が長くなるにつれてレスポンスが指数的に重くなっていた問題も解消している。
実務での影響:
- 大きな設定ファイル(
yaml、json)やインフラコード(Terraform、CloudFormation)への編集が体感的に速くなる - 長時間セッションでのレスポンス劣化が起きにくくなる
4. Opus 4.6 & Sonnet 4.6 の出力トークン上限が大幅拡張
Claude Code で使えるモデルの出力上限が引き上げられた。
| モデル | デフォルト出力 | 最大出力 | コンテキスト |
|---|---|---|---|
| Opus 4.6 | 64k トークン | 128k トークン | 1M トークン |
| Sonnet 4.6 | 32k トークン | 64k トークン | 1M トークン |
さらに Message Batches API では output-300k-2026-03-24 ベータヘッダーを使うと両モデルとも最大 300k トークン出力が可能になった(ストリーミング必須)。
# Batches APIで300k出力を使う例(Python SDK)
response = client.beta.messages.batches.create(
requests=[...],
betas=["output-300k-2026-03-24"]
)
大量のコード生成(ファイル一括生成・大規模リファクタリング・テスト自動生成)で恩恵が大きい。ただし大きな出力はクォータ消費も大きくなるため注意。
5. サブエージェント × ワークツリーのアクセス権バグが修正
対象:isolation: worktree でサブエージェントを動かしているユーザー
v2.1.98 で修正されたバグ:
- サブエージェントが自分のワークツリー内のファイルを Read/Edit できないというアクセス拒否バグを修正
- サブエージェントの作業ディレクトリ(
cwdオーバーライド含む)が親セッションの Bash ツールに漏れ出すバグを修正
# エージェント定義での worktree 分離(CLAUDE.md / カスタムエージェント)
agents:
- name: refactor-agent
isolation: worktree
# ← これで各エージェントが独立したブランチで作業
並列エージェントで大規模タスクを分割する場合(複数ファイルのリファクタリング、並列テスト生成など)、このバグが残ったままだとエージェントが途中で止まっていた。最新版に上げることで解消する。
今日の変更まとめ
| トピック | バージョン | ポイント |
|---|---|---|
--resume キャッシュ全ミス修正 | v2.1.100 | クォータ問題の根本原因のひとつが解消 |
| PostToolUse フック+Edit 競合修正 | v2.1.100 | format-on-save と Claude の編集が干渉しなくなる |
| auto モード境界無視修正 | v2.1.100 | 「プッシュしないで」などの指示が守られるように |
| Max プランのクォータ問題 | 進行中 | Anthropic 公認。v2.1.100 で一部改善見込み |
| Write ツール 60% 高速化 | v2.1.98 | 大ファイルの編集が体感的に速く |
| 出力トークン上限拡張 | モデルレベル | Opus 4.6 は 128k、Batch API なら 300k |
| ワークツリー subagent アクセス修正 | v2.1.98 | isolation: worktree での並列エージェントが正常動作 |
参考ソース:
- Release v2.1.100 · anthropics/claude-code - GitHub
- Claude Code v2.1.100 Release Notes - ClaudeWorld
- Changelog - Claude Code Docs
- Anthropic admits Claude Code quotas running out too fast - The Register
- Anthropic admits Claude Code users hitting usage limits ‘way faster than expected’ - DevClass
- Max 20 plan: rate limit 100% exhausted within ~70 minutes after reset - GitHub Issue #41788
- Claude Code by Anthropic - Release Notes - Releasebot
- What’s new in Claude 4.6 - Claude API Docs