Startup Portfolio
Webから高ボリュームのWebスクレイピングを作成する"Reworkd AI"がSeedで$2.75Mを調達
Reworkd AIは、Paul Graham、AI Grant、SV Angel、General CatalystなどからSeedで$2.75Mを調達した。昨年、Panache VenturesとY CombinatorからPre-Seedで$1.25Mを調達しているため、これまでの資金調達総額は$4Mになります。
Webから高ボリュームのWebスクレイピングを作成するReworkdは、より少ない人員でより多くのウェブをスクレイピングすることができます。
AIの時代において、Webスクレイパーは非常に重要な存在となっています。2024年のBright Dataの最新レポートによると、組織が公共のウェブデータを使用する最大の理由はAIモデルの構築です。問題は、Webスクレイパーが伝統的に人間によって構築され、特定のウェブページにカスタマイズされるため、高コストであることです。
顧客は、Reworkdに何百、あるいは何千ものウェブサイトのリストを提供し、取得したいデータの種類を指定します。すると、ReworkdのAIエージェントはマルチモーダルコード生成を使用してこれを構造化データに変換します。エージェントは各ウェブサイトをスクレイピングするためのユニークなコードを生成し、そのデータを顧客が自由に使用できるように抽出します。
例えば、すべてのNFL選手の統計データが欲しい場合、各チームのウェブサイトのレイアウトが異なるとしても、Reworkdのエージェントはリンクと抽出したいデータの説明だけでそれを行います。32チームなら数時間節約できますが、1,000チームなら数週間節約できます。
Reworkdは、顧客のデータニーズの長い末尾を捕らえることができると述べています。これは、AIエージェントが、大手競合他社が見過ごすことの多い小規模な公共ウェブサイトのスクレイピングに特に優れていることを意味します。例えば、Bright DataはLinkedInやAmazonのような大規模なウェブサイトのスクレイパーをすでに構築していますが、人間が小規模なウェブサイトのスクレイパーを構築するのは手間がかかりすぎるかもしれません。Reworkdはこの問題に対処しますが、他の問題も潜在的に引き起こす可能性があります。
「公的な」ウェブデータとは何か? ウェブスクレイパーは何十年も存在していますが、AI時代において論争を引き起こしています。膨大なデータの無制限のスクレイピングは、OpenAIやPerplexityを法的な問題に巻き込みました。ニュースやメディア組織は、AI企業が有料のコンテンツを無断で抽出し、広く再現していると主張しています。Reworkdはこれらの問題を避けるために慎重な措置を講じています。
Reworkdは、市場の特定のギャップに対処するAIエージェントを作成しています。企業はAIの進歩が急速に進んでいるため、より多くのデータを必要としています。より多くの企業が自社のビジネスに特化したカスタムAIモデルを構築するにつれて、Reworkdはより多くの顧客を獲得する立場にあります。モデルのファインチューニングには、質の高い構造化データと大量のデータが必要です。
Reworkdはそのアプローチが「自己修復型」であると述べています。つまり、ウェブページの更新によってウェブスクレイパーが壊れることはありません。スタートアップは、AIモデルに伝統的に関連する幻覚問題を回避できると主張しています。Reworkdのエージェントは、ウェブサイトをスクレイピングするためのコードを生成しているからです。AIが誤ってウェブサイトから間違ったデータを取得する可能性はありますが、Reworkdのチームはオープンソース評価フレームワーク「Banana-lyzer」を作成し、その精度を定期的に評価しています。
Reworkdは、AIエージェントを運用するための推論コストをかなり負担していますが、これらのコストが低下するにつれて、価格競争力がますます高まると予想しています。OpenAIは最近、業界をリードするモデルの小型版「GPT-4o mini」をリリースしました。これにより、Reworkdの競争力が向上する可能性があります。
関連ニュース
Reworkd AI に興味がありますか?
最新ニュース
Eコマース管理プラットフォームChannelEngineが、Amazonでの収益性を向上させるための回収管理ソリューションVendor Hubを発表
2024/09/08
ドロップシッピングとマーケットプレイス自動化プラットフォームCymbioが「Cymagery AI」を発表
2024/09/08
AIを活用した人材インテリジェンスおよびスキルアセスメントプラットフォームMultiverseが、AI諮問委員会を設立し、労働力変革の取り組みを指導
2024/09/08
AIを活用した全身スキャンHealthTechスタートアップ、Neko Health
2024/09/08
Vast Dataの次世代データプラットフォームが主役に:ストレージから戦略へ
2024/09/08