1. Home
  2. News
  3. 言葉を超えて声を理解する感情知能を備えた最初の音声AIチャットボットを開発する"Hume AI"がSeries Bで$50Mを調達
2024/03/28

Startup Portfolio

言葉を超えて声を理解する感情知能を備えた最初の音声AIチャットボットを開発する"Hume AI"がSeries Bで$50Mを調達

Hume AIは、EQT Venturesがリードし、Union Square Ventures、Comcast Ventures、LG Technology Venturesなどが参加したSeries Bで$50Mを調達した。

リアルさを次のレベルに引き上げるAIチャットボットを開発するGenertive AIスタートアップのHume AIの主力製品は、感情インテリジェント音声インターフェースで、人間の話し手の感情表現を測定できるため、話し手の言っていることのニュアンスをよりよく理解することができます。現在ベータテストが行われているHume AIのEmpathic Voice Interface(EVI)は、ChatGPTのような会話AIとは一線を画し、会話相手の声のトーンを理解することで、各インタラクションに深みを与え、それに応じて応答を調整します。

EVIは、何百万もの人間との対話から得られたデータに基づいて訓練されており、ユーザーがいつ話し終えたかを理解し、ほぼ瞬時に適切な音声応答を生成することができます。

Hume AIの創業者でChief Scientist兼CEOは、GoogleのAI研究者時代に意味空間理論の概念開拓に貢献しました。意味空間理論とは、感情表現と経験を理解するための計算論的アプローチです。

同社のEVIが人間の声のニュアンスをよりよく把握するのに役立つのは、この基礎技術です。同社の目標は、人間の会話の自然な音声パターンを正確にエミュレートし、より魅力的でリアルなボイスファーストの生成AI体験を可能にすることです。

EVIは、標準的な大規模言語モデル機能と表情測定技術を組み合わせた一種のマルチモーダル生成AIを使用して構築されました。同社はこの斬新なアーキテクチャを「共感的大規模言語モデル(eLLM)」と呼んでおり、これによってEVIは、人間の話し手の文脈や感情的反応に基づいて、使用する言葉や声のトーンを調整することができます。

これは巧妙で、話し手が会話のターンを終えるタイミングを正確に検出する能力を備えているため、700ミリ秒以下の待ち時間で、ほぼ即座に応答を開始することができます。また、感度が高く、ユーザーが会話を中断させると、会話を停止します。その結果、より流動的で人間的な会話インタラクションが可能になりました。

会話が遅く、やや機械的なことで知られる他の多くのGenerative AIチャットボットとは異なり、Hume AIのEVIとのチャットは、純粋に本物の人間と会話しているような感覚になります。同社の音声チャット体験は登録なしでここから試すことができます。

Hume AIは来月、APIをベータ版として公開する予定で、開発者はこれをあらゆるアプリに統合し、より没入的で共感的なチャット体験を提供できるようになります。APIにはeLLMだけでなく、リアルなチャットを促進するために必要な人間の感情表現を測定するツールも含まれます。

EVIは共感的な会話機能に加えて、高速で信頼性の高い文字起こしや音声合成機能をサポートしており、幅広いシナリオに対応できます。開発者は、他のLLMと統合することで、EVIをさらに強化することができます。

「音声はタイピングの4倍速く、目と手を解放し、曲調、リズム、音色により多くの情報を伝える。だからこそ私たちは、言葉を超えて声を理解する感情知能を備えた最初のAIを開発したのです。あなたの声に基づいて、いつ話すべきか、何を話すべきか、どのように話すべきかをより的確に予測することができるのです」とHume AIの創業者でChief Scientist兼CEOは説明します。

Hume AIは、昨年9月にEVIのベータ版を2,000社以上の企業や研究機関のウェイティングリストに提供し、すでに一定の評価を得ています。そのため、マウントサイナイ大学、ハーバード大学医学部、ボストン大学医療センターの研究室と研究提携を結び、患者の微妙な声や表情を理解することで転帰を改善する方法を探っています。既存のアプリケーションには、標準化された患者スクリーニング、トリアージ、標的診断、メンタルヘルス状態の治療などがあります。

Hume AIは、生成的AIチャット体験の最先端にいるように見えるが、技術が進化するにつれ、厳しい競争に直面する可能性が高い。例えば、ChatGPTの生みの親であるOpenAIは、音声と音声認識機能を組み込んだ "Voice Engine "の開発に取り組んでいると言われています。

 

TagsAIBig Data

関連ニュース

Contact

AT PARTNERSにご相談ください