1. Home
  2. News
  3. 大規模言語モデル(LLM)を使用してAIモデル用の高品質なトレーニングデータを生成する"Refuel AI"がSeedで$5.2Mを調達
2023/06/16

Startup Portfolio

大規模言語モデル(LLM)を使用してAIモデル用の高品質なトレーニングデータを生成する"Refuel AI"がSeedで$5.2Mを調達

Refuel AIは、General CatalystとXYZ Venturesが共同リードしたSeedで$5.2Mを調達し、ステルス状態から抜け出しました。

大規模言語モデル(LLM)を使用してAIモデル用の高品質なトレーニングデータを生成するRefuel AIは、調達した資金でエンジニアリングチームを6人から12人に増やし、プラットフォームとLLMインフラにさらに投資して、7月末の商用ローンチに備える計画です。また、オープンソースのライブラリやコミュニティにも資本を投下する予定です。

「具体的な例としては、LLMを利用したデータラベリングの限界に挑戦するコンペティションを開催し、最高1万ドルの賞金を提供します」と共同創業者は説明しています。

スタンフォード大学の卒業生であるNihit DesaiとRishabh Bhargavaによって設立されたRefuelは、オープンソースのライブラリであるAutoLabelへのアクセスも公開しており、どのAIチームも自分の環境と好きなLLMでデータを簡単にラベル付けできるようになっています。

これらの製品は、AIの開発を遅らせ、企業が次世代技術を製品やビジネス機能に組み込むことを妨げているデータの課題に対する答えとして提供されるものです。

今日、あらゆる企業がAI企業になるべく、社内の専門家やサードパーティベンダーと協力して、さまざまなビジネス固有のユースケースをターゲットにできるモデルを開発しています。この作業は非常に困難なものですが、どのAIプロジェクトも出発点は同じで、クリーンでラベル付けされたデータです。これが正しく行われれば、プロジェクトは簡単に実現することができます。

さて、企業は自由に使える多くのデータを持っていますが、そのすべてがデフォルトでトレーニング可能なわけではありません。この作業は通常、人間のチームによって処理され、数週間から数カ月を要します。これでは、今日のAIの需要に対応できません。

「私たちが話を聞いた多くのチームは、学習させたいモデルや作りたい製品について、トレーニング用のデータさえあれば、素晴らしいアイデアを持っていました。そのとき、きれいなラベル付きデータを思考のスピードに合わせて利用できるようにすることが、私たちが注力したいことだとわかったのです」とRefuelの共同創業者は説明しています。

2人の共同創業者は2021年にRefuelを立ち上げ、専門のLLMを使用して、あらゆるビジネスやあらゆるユースケースのデータセットの作成とラベル付けを(人間と同等かそれ以上の品質で)自動化する専用プラットフォームを構築するに至りました。

同社によると、企業ユーザーは、データセットをアップロードし、LLMにデータのラベル付けを指示するだけで、このプラットフォームを利用できるようになるといいます。また、ガイドラインやいくつかの例を示すことで、高品質のトレーニング用データのみを提供することも可能です。

「1時間以内に、彼ら(ユーザー)はAIモデルのトレーニングを開始するのに十分なデータを手に入れ、それをモデルトレーニングのインフラにシームレスに接続することができるようになります。これらのチームは、(特に本番環境から)より多くのデータを収集すると、ラベル付け、パフォーマンス測定、モデル再トレーニングのためのデータセットの改善のためにRefuelに再ルーティングすることができます」とCEOは付け加えました。

一部の企業によるプライベートベータテストでは、データの作成とラベリングのプロセスを最大100%高速化できることが確認されています。これらの企業の名前は明かさなかったが、Refuel AIはソーシャルメディアやフィンテック、ヘルスケア、人事、eコマースなど、複数の垂直分野から関心を持たれていると説明しています。

現在、データラベリングの分野では、Tasq AISnorkel AISuperAnnotateといったプレーヤーと競合しています。

 

TagsAI

関連ニュース

Contact

AT PARTNERSにご相談ください