AnthropicがClaude Opus 4.8を公開、誠実性の向上とエージェント性能の強化が柱

Web Designing Web記者が、Webに携わる人向けにニュースをピックアップ。話題の本質を整理し、実務に役立つポイントをコンパクトにまとめました。

Claude Opus 4.8の発表ページ。コーディングやエージェントタスクでの性能向上を示すベンチマーク結果が掲載されています

Anthropicは米国時間5月28日、上位モデルの最新版「Claude Opus 4.8」を公開しました。

今回のアップデートで特に強調されているのが「誠実性」の改善です。証拠が不十分なのに自信を持って結論を主張してしまうAI全般の問題に対し、Opus 4.8では根拠のない主張を行う確率が前バージョンと比べて大幅に低下したとしています。

あわせて、Claude Codeにおいて複数の処理を並行して実行し大規模なタスクに対応する「Dynamic Workflows」機能(研究プレビュー)が追加されたほか、Claudeの対話アプリ上でモデルの思考の深さをユーザー側で調整できる「Effort Control」が全プランで利用可能になりました。価格はOpus 4.7と同じく、入力100万トークンあたり5ドル、出力100万トークンあたり25ドルです。

Editor’s Eye

AIをコードレビューや仕様確認に使う場面が増えるなか、事実と異なることを自信満々に主張してしまうモデルは実務では使いにくい。「誠実性」の改善は、開発補助ツールとしての信頼性に直結する改善といえます。

文:小平淳一

  • URLをコピーしました!
目次