Skip to content
n-s tokyo
Go back

Claude Sonnet を 4.6 → 5 に上げたらトークン消費が3倍になった話と対策

個人でニュース選定/要約アプリを作っていて、記事の関連度判定・分類を claude -p のサブプロセスにやらせている。
使うモデルを Sonnet 4.6 から 5 に上げたら、記事数はほぼ同じなのにトークン消費とコストが跳ね上がった。
原因を追ったのでメモしておく。

3行まとめ

症状(Before / After)

実行選定対象記事数選出入力合計出力コスト
Before A (4.6)1325234,80810,409$0.32
Before B (4.6)1515135,9349,641$0.32
After (Sonnet 5)15351119,55129,622$0.84

記事数はほぼ同じ(132/151/153)なのに、入力 3.4x / 出力 3x / コスト 2.6x。プロンプト本文の増加では説明がつかない。

原因

ふたつの挙動が噛み合っていた。

この2つが組み合わさって thinking が非決定的に暴発していた模様。
公式ドキュメントにも「high(デフォルト)/xhigh/max ではほぼ必ず deep thinking する」とある。

対策

--effort medium を明示する。

効果

実行effort出力備考
xhigh(デフォルト)xhigh20,632〜26,955thinking暴発あり
medium 指定medium8,9314.6相当に回帰

少し実験した感じ、記事選定結果もほぼ変わらなかった。

教訓

リファレンス


Share this post on:

Next Post
[AI生成記事] AIはなぜ意味を理解しているように見えるのか