Claude Sonnet 5 へのプロンプティング
effort 調整・デフォルト有効の適応思考・ツール利用トリガー・リテラルな指示追従・フロントエンドのデフォルト回避・コードレビュー再現率まで、Sonnet 4.6 からの移行で調整が要る挙動を網羅した公式ガイド。
Claude Sonnet 5 における挙動の違いやプロンプトのパターンについて解説します。作業負荷(effort)の調整、デフォルトの適応思考(adaptive thinking)、ツール利用、および Claude Sonnet 4.6 からの移行方法などを網羅しています。
このガイドでは、Claude Sonnet 5 特有のプロンプトパターンを扱います。モデルの機能や API の変更点については「Claude Sonnet 5 の新機能」を、現在のすべての Claude モデルに共通するテクニックについては「プロンプトのベストプラクティス」を参照してください。
Claude Sonnet 5 は、コーディングやエージェント的なタスクにおいて特に強みを発揮します。従来の Claude Sonnet 4.6 向けのプロンプトでも、そのままの状態で十分に機能します。本ガイドに記載されているパターンは、微調整が必要となることが多い挙動を中心にまとめています。
Note: Claude Sonnet 4.6 から移行する際の API パラメータの変更(適応思考のデフォルト有効化、サンプリングパラメータの非対応、マニュアル思考機能の削除、新しいトークナイザーなど)については、移行ガイドを確認してください。
回答の長さと詳細度(饒舌さ)
Claude Sonnet 5 は、常に一定の長さで回答するのではなく、タスクの複雑さに応じて回答の長さを調整します。通常、単純な検索タスクでは回答が短くなり、自由記述の分析では長くなります。
もし、特定の出力スタイルや詳細度が製品に求められる場合は、プロンプトの調整が必要になるかもしれません。例えば、詳細度を下げるには次のような指示を追加します。
簡潔で要点を絞った回答をしてください。本質的でないコンテキストは省き、例示は最小限に留めてください。
特定の種類の冗長性(説明しすぎなど)が見られる場合は、それを防ぐための指示をプロンプトに追加できます。ただし、「〜しないでください」という否定的な指示よりも、Claude が適切な簡潔さでコミュニケーションをとっているポジティブな例を示す方が効果的です。
作業負荷(effort)と思考の深さの調整
effort パラメータを使用すると、Claude の「知能」と「トークン消費量」のバランスを調整できます。能力を優先するか、速度とコストを優先するかを選択可能です。Claude Sonnet 5 では、effort は Sonnet 4.6 と同様にデフォルトで high に設定されています。難易度の高いコーディングやエージェントタスクでは、effort を xhigh に上げてください。トークン使用量と知能をさらに微調整するには、以下のレベルを試してください。
max: トークン消費に制限を設けず、能力を最大限に引き出します。xhigh: 極めて高い負荷。最も困難なコーディングやエージェント型のユースケースに推奨される設定です。high: デフォルト設定。ほとんどのユースケースでトークン使用量と知能のバランスを最適化します。medium: 知能を多少抑えてでも、トークン使用量を減らしたいコスト重視のユースケースに適しています。low: 短く範囲が限定されたタスクや、知能よりもレイテンシ(応答速度)が重視されるワークロード用です。
移行時の大まかなモデル間マッピングは以下の通りです。Claude Sonnet 5 の medium は Sonnet 4.6 の high に、Claude Sonnet 5 の high は Sonnet 4.6 の max に相当する知能を持ちます。ベンチマークを行う際は、effort の名称ではなく、実際の思考プロセスの長さで比較してください。
Claude Sonnet 5 は、特に低い設定において effort レベルを厳密に守ります。low や medium では、モデルは「言われたこと」の範囲内だけで作業を行い、それ以上の深追いはしません。これはレイテンシとコストの面では有利ですが、中程度の複雑なタスクを low で実行すると、思考不足になるリスクがあります。
複雑な問題で推論が浅いと感じる場合は、プロンプトで工夫するよりも effort を high または xhigh に上げてください。レイテンシのために low を維持する必要がある場合は、以下のような具体的なガイダンスを追加してください。
このタスクには多段階の推論が必要です。回答する前に問題を慎重に検討してください。
Claude Sonnet 5 では、適応思考(adaptive thinking)がデフォルトでオンになっています。thinking フィールドのないリクエストは、適応思考を用いて実行されます。これは、思考なしで実行されていた Sonnet 4.6 からの変更点です。思考を完全にオフにするには、thinking: {type: "disabled"} を渡します。max_tokens は出力全体(思考 + 回答本文)に対するハードリミットであるため、Sonnet 4.6 で思考オフにしていたワークロードを移行する際は再検討が必要です。Sonnet 4.6 で思考をオフにしていた場合は、Sonnet 5 で低い effort レベルを指定した「思考オン」の状態を試してみてください。
適応思考のトリガー条件は制御可能です。大規模または複雑なシステムプロンプトによって、意図せず思考ブロックが頻出する場合は、ガイダンスを加えて抑制してください。変更を加えた際は、必ずパフォーマンスへの影響を測定してください。例:
思考プロセス(Thinking)はレイテンシを増加させるため、多段階の推論が必要な問題など、回答の質が明らかに向上する場合にのみ使用してください。迷う場合は、直接回答してください。
逆に、medium 設定で難易度の高いワークロードを実行し、思考不足が見られる場合は、まず effort を上げてください。より細かい制御が必要な場合は、プロンプトで直接指示します。
マニュアルによる「拡張思考(Manual extended thinking)」(thinking: {type: "enabled", budget_tokens: N})は Claude Sonnet 5 ではサポートされておらず、400 エラーを返します。これは Sonnet 4.6 で非推奨となり、現在は削除されています。代わりに適応思考と effort パラメータを組み合わせて使用してください。
Note: Claude Sonnet 5 を
high、xhigh、またはmaxの effort で実行する場合、モデルが思考やツール呼び出しを行うための余裕をmax_tokensに持たせてください。長いタスクでは適応思考が予算の多くを消費する可能性があり、予算が少なすぎると、中身のほとんどが思考で占められ、回答が途中で切れた状態でstop_reason: "max_tokens"が返されることがあります。この場合はmax_tokensを増やすか、effort をmediumに下げることで解決します。また、Claude Sonnet 5 は新しいトークナイザーを採用しており、同じテキストでもトークン数が約 30% 増加するため、Sonnet 4.6 用に調整されたmax_tokensの制限では出力が途切れる可能性があります。
ツール利用のトリガー
Claude Sonnet 5 はデフォルトで Sonnet 4.6 よりもエージェント的な性質が強く、積極的にツールを利用したり、自己検証ループを実行したりします。思考を無効にすると、ツールを利用したり検索を検討したりする可能性が低くなります。思考オフの状態でツール呼び出しを確実に実行させたい場合は、システムプロンプトで明示的な指示(後押し)を追加してください。effort 設定もツール利用に影響し、high や xhigh 設定では、エージェントによる検索やコーディングにおいてツール利用が大幅に増加します。ツール利用を増やしたいシナリオでは、いつ、どのようにツールを使うべきかをプロンプトで具体的に指示することも有効です。例えば、モデルがウェブ検索ツールを十分に使っていないと感じる場合は、その理由と方法を詳しく説明してください。
ユーザー向け進捗アップデート
Claude Sonnet 5 は、長時間の自動エージェント処理の間、定期的かつ高品質な進捗状況をユーザーに提供します。もし「3 回のツール呼び出しごとに進捗を要約せよ」といった中間ステータスを強制するための仕組みを独自に構築していたのであれば、それを取り除いてみてください。Sonnet 5 の進捗アップデートの長さや内容がユースケースに合わない場合は、プロンプトでアップデートの形式を具体的に記述し、例を示してください。
より忠実な指示への追従
Claude Sonnet 5、特に低い effort レベルでは、プロンプトを文字通り(リテラルに)かつ明示的に解釈します。一つの項目に対する指示を他の項目へ勝手に広げて適用したり、ユーザーが求めていない意図を推測したりすることはありません。この「リテラルさ」の利点は正確性であり、注意深く調整されたプロンプト、構造化された抽出、予測可能な挙動が求められる API ユースケースにおいて優れたパフォーマンスを発揮します。もし Claude に指示を広範囲に適用させたい場合は、「このフォーマットを最初のセクションだけでなく、すべてのセクションに適用してください」のように範囲を明示してください。
トーンとライティングスタイル
新しいモデルが登場する際、長文作成における文章スタイルが変わることがあります。製品が特定の「トーン(声)」に依存している場合は、新しいベースラインに対してスタイルのプロンプトを再評価してください。
例えば、より温かみのある対話的なトーンが必要な場合は、以下を追加します。
温かみのある協調的なトーンを使用してください。回答の前にユーザーの状況や考えに共感を示してください。
以前、スタイルの多様性を出すために temperature パラメータに頼っていた場合、Claude Sonnet 5 では temperature、top_p、top_k をデフォルト以外の値に設定すると 400 エラーが返される点に注意してください。これは Sonnet クラスのモデルにおける新しい制約です。移行時にはこれらのパラメータを削除し、代わりにシステムプロンプトの指示でトーンや多様性を制御してください。
デザインとフロントエンドのデフォルト
Claude Sonnet 5 は、自由度の高いフロントエンドやデザインの指示に対して、一貫したデフォルトのビジュアルスタイルを生成する傾向があります。このデフォルトスタイルは一部の案件には適していますが、ダッシュボード、開発ツール、フィンテック、ヘルスケア、またはエンタープライズ向けアプリでは違和感があるかもしれません。
「その色を使わないで」「クリーンでミニマルにして」といった漠然とした指示は、スタイルの多様性を生むというよりも、単に別の固定されたパレットへ移行させるだけに終わることが多いです。以下の 2 つのアプローチが効果的です。
1. 具体的な代替案を指定する。 モデルは明示的な仕様に正確に従います。
AEFRM というサプリメントブランドのデスクトップ用ランディングページをデザインしてください。
ビジュアルの方向性は、霧がかった金属表面のような、淡いシルバーグレーからブルーグレー、そして黒に近い色へと徐々に深まっていく冷たいモノクロームな雰囲気にしてください。
鋭く制御された印象を与え、強い構造感と抑制を感じさせるページにしてください。
鮮やかなアクセントカラーは導入せず、ページ全体でこの階調システムを使用してください。
ヒーローセクションのデザインには、アップロードされた画像を白黒で使用してください。
レイアウトは、明確な水平セクションと中央揃えの最大幅コンテナで構築してください。カード、ボタン、入力フォーム、メディアフレームには一貫して 4px の角丸を適用してください。余白はたっぷりと取り、各セクションの周囲に十分な空きスペースを設けて、ページが呼吸しているように感じさせてください。
タイポグラフィは、角張ったサンセーフ体を使用し、特に見出しやナビゲーションでは文字間隔を通常より広くして、詰めすぎず精巧に設計された印象を与えてください。大見出しは大きく大文字に、補足文は短く控えめにしてください。サブテキストは、Alumni Sans SC を 4-6px で使用し、画面下部の中央や隅に配置される小さな注釈のように記述してください。
構成は、まず強力な製品メッセージ、短い補足パラグラフ、クリーンな製品プレースホルダーまたはパッケージ画像を含むヒーローセクションから始めてください。その下に 3〜4 ブロックのメリットグリッド、続いて成分セクション、最後に CTA を配置してください。
ボタンはフラットで精密なものにし、ホバー時には派手な動きではなく、transition: all 160ms ease out を使用して明るさと境界線のコントラストがわずかに変化するようにしてください。
カラーパレットはこの範囲内に収めてください:
#E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B。
2. 構築前にモデルにオプションを提案させる。 これによりデフォルトの型を破り、ユーザーがコントロールできるようになります。Sonnet 5 では temperature が使えないため、実行ごとに意味のある異なるデザイン案を生成するには、この方法が推奨されます。
構築を始める前に、この依頼に合わせた 4 つの異なるビジュアルの方向性を提案してください(それぞれ:背景色 HEX / アクセント色 HEX / フォント、および 1 行の根拠を提示すること)。ユーザーがいずれかを選択した後、その方向性のみを実装してください。
ユーザーが「AI スロップ(AI 臭さ)」と呼ぶような汎用的なパターンを避けるには、システムプロンプトに短い指示を含めることができます。詳細は frontend-design skill で解説されていますが、以下のスニペットを前述の多様性アプローチと併用すると効果的です。
<frontend_aesthetics>
使い古されたフォントファミリー(Inter, Roboto, Arial, システムフォント)、ありきたりな配色(特に白や暗い背景上の紫のグラデーション)、予測可能なレイアウトやコンポーネントパターン、文脈に欠ける画一的なデザインなど、汎用的な「AI 生成物」特有の造形は絶対に避けてください。独自のフォント、統一感のあるカラーとテーマ、エフェクトやマイクロインタラクションのためのアニメーションを活用してください。
</frontend_aesthetics>
インタラクティブなコーディング製品
1 回のユーザーターンで完結する自律型の非同期コーディングエージェントと、複数回のやり取りが発生する同期型のインタラクティブなコーディングエージェントでは、トークンの使用量や挙動が異なります。コーディング製品でパフォーマンスとトークン効率を最大化するには、effort を xhigh または high に設定し、オートモードのような自律機能を加え、ユーザーに必要な対話回数を減らしてください。
ユーザーとの対話回数を制限する場合、最初のターンでタスク、目的、関連する制約を前もって指定することが重要です。最初に明確で正確なタスク説明を提供することで、自律性と知能を最大化し、その後のやり取りで発生する余分なトークン消費を抑えることができます。対照的に、複数のターンにわたって少しずつ提示される曖昧なプロンプトは、トークン効率を下げ、パフォーマンスを低下させる傾向があります。
コードレビュー・ハーネス(自動評価ツール)
以前のモデル用に調整されたコードレビュー・システムを使用している場合、Claude Sonnet 5 では当初「再現率(recall)」が低下したように見えるかもしれません。これは多くの場合、能力の退化ではなくシステム側の設定の影響です。レビュープロンプトに「重要度の高い問題のみ報告せよ」「保守的に判断せよ」「重箱の隅をつつくような指摘はするな」といった指示が含まれている場合、Sonnet 5 は以前のモデルよりも忠実にその指示に従います。つまり、コードを徹底的に調査してバグを見つけても、それがユーザーの指定した基準を下回ると判断すれば、あえて報告しません。その結果、調査の深さは同じでも報告される数が減り、特に軽微なバグの検出が漏れているように見えることがあります。精度(precision)は向上しますが、モデル自体のバグ発見能力は上がっているにもかかわらず、測定上の再現率は下がることがあります。
推奨されるプロンプトの表現:
確信が持てないものや重要度が低いと思われるものも含め、見つけたすべての問題を報告してください。この段階では重要度や確信度でフィルタリングしないでください(それらは後の検証ステップで行います)。ここでの目標は網羅性(カバレッジ)です。本当のバグを見逃すよりも、後で除外されるような指摘をあえて出す方が望ましいです。各指摘には、後続のフィルタリングでランク付けができるよう、確信度と推定される重要度を併記してください。
このプロンプトは、実際に第 2 のステップがなくても有効ですが、確信度によるフィルタリングを「発見ステップ」から切り離すことが助けになります。システムに別途、検証、重複排除、またはランク付けのステージがある場合は、発見ステージでの仕事は「フィルタリング」ではなく「網羅」であることをモデルに明示してください。
モデルに 1 回のパスで自己フィルタリングさせたい場合は、「重要」といった抽象的な言葉ではなく、「テストの失敗、誤った挙動、または誤解を招く結果につながる可能性のあるバグをすべて報告してください。純粋なスタイルや命名の好みといった些細な指摘のみ除外してください」のように基準を具体的に示してください。
評価用データセットの一部に対してプロンプトを繰り返し改善し、再現率や F1 スコアが向上するか検証してください。
コンピュータ使用(Computer use)
Claude Sonnet 5 は、ツールバージョン computer_20251124 をサポートしています。コンピュータ使用機能はさまざまな解像度で動作し、最大 2576px / 3.75MP まで対応しています。内部テストでは、1080p で画像を送信することがパフォーマンスとコストのバランスに優れていることが示されています。
特にコストに敏感なワークロードでは、720p や 1366×768 が低コストかつ高いパフォーマンスを維持できる選択肢となります。ユースケースに合わせて最適な設定を見つけるために独自のテストを実施してください。effort 設定を試すことも、モデルの挙動を調整する上で役立ちます。