コンテキスト(仕様)が増えると、Claudeは何を忘れるか — 1,300行→7,000行で測った「優先枠」の話
mediumAI 要約
QAエンジニアがClaudeを使ったテスト設計において、仕様書のコンテキスト量(1,300行→7,000行)を増やした際にモデルが何を「忘れる」かを検証した実験記事。長いコンテキストでは優先的に処理される情報と無視される情報に偏りが生じることを実測し、「強いモデルを使えば解決する」という単純な仮説に疑問を呈している。QAや開発の実務でAIに大量仕様を投げる際の注意点として関連性がある。
Claudeコンテキスト長QAテスト設計プロンプトエンジニアリング