Startup Portfolio
音声AIのSarvam AIがインドの11言語に対応した音声モデル「Bulbul-v2」を発表
インドのAIスタートアップSarvam AIは、インド国内の11言語に対応する新しいテキスト読み上げ(TTS)モデル「Bulbul-v2」を発表しました。このモデルは、インド各地域の自然なアクセントを再現し、まるで本物の人間が話しているかのようなリアルな音声を提供することを特徴としています。
同社はLinkedInの投稿で、「このAIが生成する音声はロボット的でも演技的でもなく、非常に自然です」と説明しています。また、高速な処理性能を持ち、企業やブランド向けのカスタム音声にも対応可能だとしています。
Sarvam AIによると、「Bulbul-v2」はインドの音声AI分野において新たな基準を打ち立てるモデルであり、低遅延モデルやインド市場に適した価格設定のAPI提供を通じて、国内でのAI技術普及を促進するとしています。さらに、Sarvam AIはインド政府の推進する「IndiaAI」ミッションの一環として、インド独自の大規模言語モデル(LLM)の開発企業として初めて選ばれました。
Bulbul-v2は特にインド国内の言語やアクセントに最適化されており、人間らしい自然な抑揚で話すことができます。また複数の言語や混合言語のテキストに対応しており、リアルタイムで音声合成が可能です。音声のピッチ、スピード、音量を細かく制御できる点も特徴です。
同モデルは8kHzから24kHzまで複数のサンプルレートをサポートし、数値や日付、複数言語が混ざったテキストの正規化処理を賢く行うこともできます。さらに、利用者は用途や好みに応じて音声の質感を細かく調整することが可能です。
Sarvam AIについて
Sarvam AIはインド・ベンガルールを拠点とするAIスタートアップで、特に音声合成(TTS)技術を専門としています。インド独自の言語やアクセントに最適化した高性能な音声AIモデルを提供しており、インド政府のAI推進プロジェクトであるIndiaAIにも参加しています。
関連ニュース
Sarvam AI に興味がありますか?
最新ニュース
「SusHi Tech Tokyo 2025」に弊社 秋元 Co-Founder & General Partnerが登壇
2025/05/09
AIデータ基盤のVAST Data、Google Cloudと提携しAI開発を加速
2025/05/09
FinTechのStripe、決済向けAI基盤モデルとステーブルコイン対応口座を発表
2025/05/09
ヘルステックのRevSpring、MedTech Breakthrough Awardsの最優秀患者コミュニケーションソリューションに選出
2025/05/09
企業向けAIチャットボットのMistral、収益が3倍増の中、新製品「Le Chat」を発表
2025/05/09