Startup Portfolio
大規模AIプロダクト向け推論のBaseten、AWSと戦略的協業契約を締結 大規模AI推論を高性能かつ安全に提供
高スケールAIプロダクト向け推論基盤を提供するBasetenは、Amazon Web Services, Inc.(AWS)とStrategic Collaboration Agreement(SCA:戦略的協業契約)を締結したと発表しました。これにより、Basetenの高性能推論サービスがAWS上でAIアプリケーションを展開する顧客にも広く提供されることになります。Basetenが解決しようとしているのは、「大規模でカスタムなAIモデルを本番環境でいかに効率よく動かすか」という、多くのAIネイティブ企業が直面するクリティカルな課題です。Baseten Inference Stackは、1GPUあたりで処理できるリクエスト数を増やしつつ、レイテンシを低減し、スループットを高めることで、エンジニアリングチームがサーバ管理や細かな最適化から解放され、プロダクトイノベーションに集中できるように設計されています。
今回のSCAにより、BasetenとAWSは技術統合と共同のGo-to-Market活動を一段と強化します。エンタープライズ顧客は、自社のAWSインフラ上でBasetenの推論スタックを利用できるようになり、セキュリティとコンプライアンスを確保しながら、自社データとシステムへの完全なコントロールを維持したまま、高性能な推論基盤を取り込むことが可能になります。既存のAWS契約とリソースをそのまま活用しながら、容易なセットアップ、自動スケーリング、高速なモデルレスポンスを実現できる点も特徴です。BasetenのCEO兼Co-FounderであるTuhin Srivastava氏は、「AWSは当社が顧客に卓越した推論性能を提供するためのインフラ基盤です。この協業を通じて、Basetenの推論スタックとAWSのセキュアなグローバルインフラを組み合わせることで、最も要求の厳しいAIワークロードも、データを完全に自社管理しつつ実行できるようになります」とコメントしています。
Basetenはまた、ハイブリッドなデプロイモデルを採用しており、顧客は自社のAWS VPC上で専用環境として推論ワークロードを実行しつつ、ピーク需要時にはBaseten Cloudへシームレスに拡張することができます。この柔軟なアーキテクチャは、AWSの堅牢でスケーラブルな基盤を活かしながら、必要なタイミングで中断なくスケールできる俊敏性と一貫したパフォーマンス、レジリエンスを提供します。高性能なエージェント型AIワークフローを提供するScaled Cognitionは、その代表的なユースケースです。同社はAgentic Pretrained Transformer(APT-1)をミッションクリティカルなワークロードで超低レイテンシかつエンタープライズセキュアに提供する必要がありましたが、Basetenの推論スタックを自社VPC内のAWS GPU上にデプロイすることで、最初のトークンまでの時間を120ms未満に抑え、全体のレイテンシを40%削減することに成功しました。Scaled CognitionのVP of EngineeringであるJordan DeLoach氏は、「Basetenとのハイブリッドクラウド連携と、既存のAWSコミットメントの中で最新GPUにアクセスできたことがローンチ当日からの成功の鍵でした。開発者体験もチームから高く評価されています」と述べています。今回の協業は、AIソリューションを展開する企業に対し、柔軟性・性能・ビジネス価値を両立した推論基盤を提供するという、BasetenとAWSの共通したコミットメントを改めて示すものです。
Basetenについて
Basetenは、大規模AIプロダクト向け推論分野のリーダーとして、業界で最も高度な推論スタックを提供するスタートアップです。パフォーマンス、信頼性、コスト効率を重視した設計により、顧客はオープンソースモデル、カスタムモデル、ファインチューニングモデルを本番環境で無限にスケールさせることができます。応用研究と本番グレードのインフラ、シームレスな開発者体験を組み合わせることで、Basetenは急成長中のAI企業の野心的なプロダクトの裏側を支えています。同社はBOND、CapitalG、IVP、Spark、Greylock、Convictionなど著名VCから出資を受けています。
関連ニュース








Baseten に興味がありますか?
最新ニュース

AI向け行動データのSnowplow、AWS UK・アイルランド「Rising Star Partner Award 2025」を受賞
2025/12/07

AIソフトウェア開発のReplit、Googleと提携拡大し「Vibe Coding」を企業向けに本格展開
2025/12/07

次世代5GセキュリティのOneLayer、EricssonのIndustry 4.0パートナープログラムに参画
2025/12/07

プロテオミクスのOncoHostが、Technology Solution of the Year」を受賞
2025/12/07

FemTechのMaven Clinicと4Kira4Moms、MPact for Families第4期フェローとして2団体を選出
2025/12/07
