Startup Portfolio
AIセキュリティのActiveFence、プロンプトインジェクション検知で業界最高精度を達成
AIの安全性を専門とするActiveFenceは、「AI Security Benchmark Report: Prompt Injections」を発表し、自社モデルが業界をリードするF1スコア(0.857)と精度(0.890)を達成したと公表しました。誤検知率も5.4%と低く、堅牢性とユーザー体験の両立を実現したとしています。このベンチマークは、28,000件以上の良性・攻撃的プロンプトを対象に、OWASPやMITRE ATLASで定義されたカテゴリに基づいて評価が行われました。その結果、ActiveFenceのモデルは、実際の攻撃を高い精度で検知しつつ、ユーザーに不要な介入を与えない最適なバランスを示しました。また、13言語にわたる多言語環境でも優れた性能を発揮しており、グローバル規模での導入に対応しています。
プロンプトインジェクションは、ガードレールの突破や機密情報の漏洩、有害コンテンツの生成につながる深刻な脅威として注目されており、生成AIを活用する企業にとって最も重要なセキュリティ課題の一つです。ActiveFenceの取り組みは、コパイロットや顧客対応エージェント、クリエイティブツールの安全な活用を後押しするものとなります。
ActiveFenceの共同創業者兼CEOであるNoam Schwartz氏は、「強固なガードレールと優れたユーザー体験のどちらかを選ぶ必要はありません。両立は可能であり、このベンチマークがその証明です」と述べています。さらに、同社のChief Product & Engineering OfficerであるAvi Golan氏も、「我々のモデルの多言語対応力と高いF1スコアは、企業が進化し続ける脅威に対応するための持続的な保護を提供します」と強調しました。
ActiveFenceについて
ActiveFenceは、生成AIの誤用や攻撃から企業やプラットフォームを守るAIセキュリティ企業です。同社のソリューションは、3億人以上のユーザーを保護し、117以上の言語に対応しています。リアルタイムガードレールや継続的なレッドチーミングにより、プロンプトインジェクションや有害コンテンツの生成を防ぎ、安全かつ信頼できるユーザー体験をグローバルに提供しています。