【要点】
◎OpenAIはChatGPT Atlasのプロンプトインジェクション対策を説明。完全解決は困難としつつ、自動レッドチーミングで攻撃手法を発見・修正し、継続的にリスク低減を図っている。 (ITmedia)
【要約】
OpenAIは、AI統合型ブラウザ「ChatGPT Atlas」におけるプロンプトインジェクション対策について説明した。AtlasはWeb閲覧や操作を代行する高汎用エージェントであるため、悪意ある指示が埋め込まれたコンテンツにより、意図しない情報送信などが起き得る。同社はこの課題を「完全解決は困難な長期問題」と位置付け、自動攻撃者AIによるレッドチーミングを通じて新手法を発見し、迅速に修正する対応ループを構築。敵対的学習を施した新モデルと防御策も更新した。
【ニュース】
◆OpenAI、「ChatGPT Atlas」のインジェクション対策について説明 「完全に解決されることはまずない」 (ITmedia, 2025/12/23 10:40)
https://www.itmedia.co.jp/news/articles/2512/23/news067.html