Startup Portfolio
インド発の主権AIを切り拓くSarvam AI、OCR精度84.3%でGeminiやChatGPTを上回る成果
インド・ベンガルールを拠点とするAIスタートアップのSarvam AIは、インド市場に特化したタスクにおいて、Google GeminiやChatGPTを上回る性能を示し、世界の注目を集めています。特に光学文字認識分野では、Sarvam AIが開発したSarvam Visionが、olmOCR Benchで84.3%の精度を記録し、主要なグローバルOCRモデルを凌駕しました。この成果は、インドが自国主導で世界水準のAIモデルを構築できることを示す象徴的な事例となっています。Sarvam AIは、海外の基盤モデルに依存せず、国内で基礎モデルを構築する「主権AI」を重視しています。その狙いは、インド特有の言語や文書、音声といったローカル課題に対して、より高い精度で対応することです。Sarvam Visionは、複雑な文書構造や多言語が混在するインド特有の資料を正確に読み取ることに強みを持ち、実運用に近い評価指標であるOmniDocBench v1.5でも93.28%の精度を達成しています。この一貫した性能は、企業や研究者から高い評価を受けています。
また、Sarvam AIは音声分野でも存在感を示しています。テキスト読み上げモデルのBulbul V3は、11のインド言語に対応し、35種類以上の自然な音声を生成します。長文や複雑な文字体系でも安定した発話を実現しており、将来的には22言語への拡張が計画されています。Bulbul V3は、ElevenLabsなどのグローバル音声AIと競合する水準に達しており、インド言語向けのユースケースではコスト効率と実用性の高さから支持を集めています。これらの成果は、Sarvam AIの共同創業者であるPratyush KumarがXで公開したことで世界に広まり、テック業界の識者からも評価の声が相次ぎました。インドは長年AI人材の供給拠点として知られてきましたが、中核的なAIイノベーションは国外で進むケースが多い状況でした。Sarvam AIの台頭は、その構図を変え、銀行、教育、行政サービスなど、多言語対応が不可欠な分野において主権AIの実用性を高める可能性を示しています。
一方で、大規模な計算資源の確保や、英語中心の国際ベンチマークとの競争といった課題は残されています。Sarvam AIは、汎用性よりもインドの言語的多様性に即した深い最適化を重視する戦略を取り、独自の価値を築こうとしています。Sarvam AIの取り組みは、インドがAI分野で単なる追随者ではなく、目的特化型の革新を通じて世界の潮流を形作る存在になりつつあることを示しています。
Sarvam AIについて
Sarvam AIは、インド発の主権AIを掲げるスタートアップで、インドの言語や文化、実務環境に最適化された基盤AIモデルを開発しています。OCRや音声合成などの分野で高精度なモデルを提供し、国内外の企業や公共機関が多言語環境でAIを活用できる基盤を構築することを目指しています。
関連ニュース








Sarvam AI に興味がありますか?
最新ニュース

複数AIの視点を統合する検索AIのPerplexity、回答を比較検証する新機能「Model Council」を発表
2026/02/10

音声AIインターフェースを即時生成するVoiceTechのAirminal、ElevenLabsのスタートアップ助成に採択
2026/02/10

CFOの支出管理を高度化するFinTechのDatarails、契約とサブスクリプションを可視化するSpend Controlを発表
2026/02/10

データとAI基盤を牽引するDatabricks、年率65%超成長で売上ランレート54億ドルを突破しLakebaseとGenieに大型投資
2026/02/10

AIによる家計管理を身近にするFinTechのCleo、英国市場へ再参入
2026/02/10
