推論・画像理解・コーディングを単一モデルに統合する小型生成AIモデルのMistral、低推論コストの「Small 4」を発表

Mistralは、推論、マルチモーダル理解、エージェント型コーディングを単一モデルに統合した新しい小型モデル「Mistral Small 4」を発表しました。これまで企業は、推論用、画像理解用、コーディング用と複数のモデルを使い分ける必要がありましたが、Small 4はそれらを一つにまとめることで、AIスタックの簡素化を目指しています。さらに、推論の深さを調整できる仕組みも備えており、用途に応じて応答の重さや詳細さを変えられる点が特徴です。Small 4は、小型モデル市場で競争を続けるQwenやClaude Haikuなどと同じ土俵に立つ製品です。Mistralは、このモデルの強みとして、出力が比較的短くまとまることによる低レイテンシと低コストを挙げています。企業にとっては、同等のタスクをより短い応答で処理できれば、推論コストや応答速度の面で有利になります。

このモデルは、2025年6月に公開されたMistral Small 3.2の後継にあたり、Apache 2.0ライセンスで提供されます。Mistralによると、Small 4では、高速なインストラクションモデル、高度な推論エンジン、マルチモーダルアシスタントのどれかを選ぶ必要がなくなり、一つのモデルでそれらをすべて利用できるようになります。設定可能な推論強度と高い効率性を兼ね備えたことが、大きな訴求点となっています。モデル規模としては、総パラメータ数が119 billionでありながら、各トークン処理時にアクティブになるのは6 billion parametersに抑えられています。Mistralは、この構成によって、自社の複数モデルが持っていた機能をSmall 4に統合したと説明しています。推論能力はMagistral、マルチモーダル理解はPixtral、エージェント型コーディング性能はDevstralに由来しており、256Kのコンテキストウィンドウも備えています。そのため、長文の会話や分析業務にも向いているとされています。このモデルはMixture-of-Expertsアーキテクチャに基づいて構築されています。128の専門家モジュールを持ち、そのうち各トークン処理時には4つだけが有効になる仕組みです。Mistralは、この構成により効率的なスケーリングと専門化が可能になり、推論負荷の高い応答でも高速に処理できるとしています。また、テキストだけでなく画像も処理対象とし、文書やグラフの解析にも対応します。

Small 4には、新たにreasoning_effortというパラメータも導入されています。これにより、企業はモデルの振る舞いを動的に調整できます。たとえば、Mistral Small 3.2に近い軽量で素早い応答を返すように設定することもできれば、Magistralのように複雑な課題に対して段階的な推論を示す、より詳細な応答へ切り替えることも可能です。この柔軟性は、単純な業務処理から複雑な分析業務までを一つのモデルでカバーしたい企業にとって魅力となります。ハードウェア面では、MistralはSmall 4が同等モデルより少ないチップ数で動作できるとしています。推奨構成は、Nvidia HGX H100またはH200を4基、もしくはNvidia DGX B200を2基とされています。さらに、Nvidiaとの協業により、オープンソースのvLLMおよびSGLang上での推論最適化も進められており、さまざまな導入環境で高効率かつ高スループットの運用が可能になるとしています。

ベンチマーク面では、MistralによるとSmall 4はMMLU ProなどでMistral Medium 3.1やMistral Large 3に近い性能を示しています。特にインストラクション追従性能は高く、文書理解のような高頻度なエンタープライズ業務に適しているとされています。一方で、推論負荷の高い課題では、Qwen 3.5 122BやQwen 3-next 80B、Claude Haikuなどに劣る場面もあります。ただし、MistralはSmall 4が大幅に短い出力でこれらに近いスコアを達成している点を重視しています。特にインストラクトモードでは、テストしたモデルの中で最も短い2.1K文字の出力で済み、Claude Haikuの14.2K文字、GPT-OSS 120Bの23.6K文字と比べて、推論コストとレイテンシの低下につながるとしています。NeurometricのCo-founder兼CEOであるRob Mayは、Small 4の特徴としてアーキテクチャ上の柔軟性を評価する一方で、小型モデルの増加が市場の断片化をさらに進める可能性にも言及しています。また、企業にとってモデル選定は何を最適化したいかによって変わるとしつつ、信頼性と構造化出力、レイテンシと知能の比率、そしてファインチューニング容易性とプライバシーの3点を重視すべきだと述べています。

Mistralについて
Mistralは、オープンソースとエンタープライズ活用の両面で存在感を高めている生成AI企業です。小型から大型まで複数のモデル群を展開し、推論、マルチモーダル理解、コーディング支援など幅広い用途に対応しています。近年は、効率性と柔軟性を重視したモデル設計を進めており、企業がコスト、性能、制御性を両立しながらAIを導入できる基盤づくりを目指しています。

TagsAI