クラウドGPU料金比較【RunPod/Vast.ai/Lambda/AWS】コスパ徹底検証

GPU収益化

「GPUを借りて Stable Diffusion や Ollama を動かしたいけど、どのサービスが一番安いの?」という疑問に、2026年6月13日時点の公式サイト実データで答えます。

RunPod・Vast.ai・Lambda Labs・AWS EC2 を対象に、料金・スペック・使い勝手を実際のデータと Playwright スクリーンショットで比較しました。結論から言うと、個人利用のコスパ最強は RunPod か Vast.ai で、RTX 4090 が $0.34〜$0.40/hr で借りられます。

本記事では RunPod と Vast.ai の料金ページを直接スクレイピングし、AWS は公式 Pricing API(b0.p.awsstatic.com)から実データを取得して比較しています。

この記事のポイント

  • RunPod は RTX 4090 が from $0.34/hr、H100 が from $1.99/hr(公式サイト実取得)
  • Vast.ai はマーケットプレイス型。RTX 4090 が $0.40/hr 中央値、A100 80GB が $0.84/hr から
  • AWS EC2 は g4dn.xlarge(T4)$0.526/hr から。H100 は p5.48xlarge(8枚構成)で $55.04/hr
  • 個人の画像生成・LLM 推論には RunPod か Vast.ai の RTX 4090 が最もコスパが高い
  • 企業・長期利用には Lambda Labs(予約枠)または AWS(SLA付き)を検討する

比較の前提(取得環境・日付)

本記事の料金データは以下の方法で取得しました。

注意

クラウドGPU料金はサービス側の在庫・需給・為替レートによって頻繁に変動します。本記事の数値は 2026年6月13日時点 の実取得値です。最新料金は必ず各公式サイトでご確認ください。

プロバイダ 取得方法 取得日 信頼度
RunPod urllib で runpod.io/gpu-instance/pricing を直接 HTTP 取得 2026-06-13 ★★★★★(実測)
Vast.ai Playwright で vast.ai/pricing をレンダリング後に取得 2026-06-13 ★★★★★(実測)
AWS EC2 b0.p.awsstatic.com Pricing API(JSON)から取得(hawkFilePublicationDate: 2026-06-12) 2026-06-13 ★★★★★(実測)
Lambda Labs 公式サイト(Cloudflare 保護のためプログラム取得不可)→ 公称値を参考記載 参考値 ★★★(参考)
RunPod GPU料金ページ(Playwright撮影 2026-06-13)
RunPod GPU料金ページ(Playwright撮影 2026-06-13)

RunPod — 個人向けコミュニティGPUの最安値候補

RunPod は GPU を所有するプロバイダーが余剰リソースをコミュニティに提供する モデルと、RunPod 自身が用意するクラウドの 2 種類があります。公式サイト(runpod.io/gpu-instance/pricing)の HTML を直接取得したところ、以下の「from 価格」を確認しました。




RunPod 公式サイト実取得(2026-06-13)
$ python3 -c “import urllib.request, re; …”
# runpod.io/gpu-instance/pricing から HTTP 200 で取得
# HTML サイズ: 206,805 bytes

H100 80GB from $1.99/hr
RTX 4090 from $0.34/hr
RunPod vs Vast.ai RTX 4090 時間単価比較(実測)
RunPod vs Vast.ai RTX 4090 時間単価比較(実測)

RunPod の料金体系

RunPod には 2 つのティアがあります。

  • Community Cloud:GPU 保有者が提供するリソース。最安値だが稼働率・安定性はやや劣る
  • Secure Cloud:RunPod 直轄のデータセンター。価格は少し高いが可用性が高い

上記の「from $0.34/hr」は Community Cloud の RTX 4090 最安値です。Secure Cloud では $0.44/hr 前後になることが多いです(在庫状況により変動)。

RunPod はポッド(Pod)という概念でインスタンスを管理します。Ubuntu 22.04 / 24.04 のテンプレートが用意されており、pytorch/pytorch:latest などの Docker イメージも選択できます。起動まで 1〜3 分程度で、秒単位の課金なので短時間のテストにも使いやすいです。

著者アイコン
著者アイコン

RunPod は日本語サポートがないのが難点ですが、ドキュメントが充実していて英語でも詰まりにくいです。コンソール画面はシンプルで、VPS の感覚で使えます。

Vast.ai — マーケットプレイス型で価格競争力が高い

Vast.ai は 世界中の GPU 保有者が出品するオークション型マーケットプレイス です。Playwright で vast.ai/pricing を実際に取得したところ、2026年6月13日時点で以下のライブ価格を確認しました。

Vast.ai GPU価格一覧(Playwright撮影 2026-06-13)
Vast.ai GPU価格一覧(Playwright撮影 2026-06-13)
Vast.ai マーケットプレイス実測価格一覧
Vast.ai マーケットプレイス実測価格一覧
GPU モデル アーキテクチャ VRAM 中央値 ($/hr) 価格幅 ($/hr) 在庫
B300 (Blackwell Ultra) Blackwell 288 GB $5.63 $3.75〜$6.88
H200 (Hopper) Hopper 141 GB $3.45 $1.97〜$4.41
H100 SXM (Hopper) Hopper 80 GB $2.00 $1.47〜$3.64
A100 SXM4 (Ampere) Ampere 80 GB $0.84 $0.40〜$2.00
RTX 4090 (Ada) Ada Lovelace 24 GB $0.40 $0.13〜$2.67
RTX 5090 (Blackwell) Blackwell 32 GB $0.51 $0.21〜$53.33
RTX 3090 (Ampere) Ampere 24 GB $0.22 $0.16〜$0.36

Vast.ai の大きな特徴は A100 80GB が $0.84/hr(中央値)から借りられる点です。RunPod や Lambda Labs での A100 は通常 $1.00〜$1.99/hr なので、Vast.ai のマーケット価格はかなり安い水準です。ただし価格は需給によって大きく変動する点(RTX 5090 で $0.21〜$53.33 という幅がある)には注意が必要です。

Vast.ai 利用の注意点

Vast.ai はプロバイダーが個人・企業の余剰 GPU を提供するため、突然インスタンスが停止する「インタラプティブル」モードと、安定した「オンデマンド」モードがあります。長時間の学習タスクには必ずオンデマンドを選んでください。また、出品者によってはストレージ速度・ネットワーク品質にばらつきがあります。

Lambda Labs — 研究者向けの固定枠クラウド

Lambda Labs(旧 Lambda GPU Cloud)は AI 研究者・スタートアップ向けに特化した GPU クラウド です。残念ながら 2026年6月13日時点では公式サイトが Cloudflare のボット保護下にあり、プログラムによる料金取得はできませんでした。

公称値として広く知られている料金は以下の通りです(参考値・要公式確認)。

インスタンス GPU VRAM vCPU RAM 参考価格
gpu_1x_h100_sxm5 H100 SXM5 80 GB 26 200 GB ~$2.49/hr(参考)
gpu_1x_a100_sxm4 A100 SXM4 80 GB 30 200 GB ~$1.99/hr(参考)
gpu_1x_a10 A10 24 GB 30 200 GB ~$0.75/hr(参考)
Lambda Labs 公式サイト(Playwright撮影)
Lambda Labs 公式サイト(Playwright撮影)

Lambda Labs の強みはインスタンスの安定稼働と予約枠(Reserved)の提供です。GPU 学習タスクで数週間〜数ヶ月の長期利用を考えるなら、Reserved プランで大幅な割引が得られます。

AWS EC2 GPU インスタンス — エンタープライズ向けの本格構成

AWS EC2 の GPU インスタンスは、公式 Pricing API(b0.p.awsstatic.com)から実データを取得しました。取得データの公示日は 2026年6月12日です。

AWS EC2 GPU インスタンス料金一覧(API実取得 2026-06-13)
AWS EC2 GPU インスタンス料金一覧(API実取得 2026-06-13)
インスタンス GPU(枚数) vCPU RAM $/hr(US East) 用途
g4dn.xlarge T4 × 1(16GB) 4 16 GiB $0.526 推論・軽量学習
g6.xlarge L4 × 1(24GB) 4 16 GiB $0.805 推論・中規模モデル
g5.xlarge A10G × 1(24GB) 4 16 GiB $1.006 推論・Stable Diffusion
p3.2xlarge V100 × 1(16GB) 8 61 GiB $3.060 深層学習(やや古め)
g5.48xlarge A10G × 8(192GB) 192 768 GiB $16.288 大規模学習
p5.48xlarge H100 × 8(640GB) 192 2048 GiB $55.040 最大規模学習・推論

AWS の重要な特徴はH100 を含む GPU インスタンスがほぼすべて「複数 GPU 構成」という点です。個人が H100 を 1 枚だけ借りることはできず、p5.48xlarge(H100 × 8 枚、$55.04/hr)を丸ごと借りる必要があります。1GPU 換算で約 $6.88/hr になります。




AWS Pricing API 実取得コマンド(2026-06-13)
$ python3 -c “import urllib.request, gzip, json; …”
# b0.p.awsstatic.com Pricing API から gzip JSON を取得
# hawkFilePublicationDate: 2026-06-12T07:30:40Z

p3.2xlarge (V100 16GB) $3.0600/hr US East (N.Virginia) Linux
g4dn.xlarge (T4 16GB) $0.5260/hr US East (N.Virginia) Linux
g5.xlarge (A10G 24GB) $1.0060/hr US East (N.Virginia) Linux
p5.48xlarge (H100×8) $55.0400/hr US East (N.Virginia) Linux

正直、AWS の GPU インスタンスは個人の画像生成や LLM 推論に使うには割高です。ただしSLA(稼働保証)・VPC によるネットワーク分離・IAM によるアクセス管理が使えるため、商用サービスやセキュリティが必要な企業用途には適しています。

4社 料金・スペック総合比較表

クラウドGPU 4社比較表(実測・2026-06-13)
クラウドGPU 4社比較表(実測・2026-06-13)
プロバイダ RTX 4090 (24GB) A100 80GB H100 80GB 課金 日本語 SLA
RunPod from $0.34/hr from $1.99/hr 秒課金 ×(英語)
Vast.ai $0.40/hr(中央) $0.84/hr(中央) $2.00/hr(中央) 秒課金 ×(英語)
Lambda Labs ~$1.99/hr(参考) ~$2.49/hr(参考) 時間課金 ×(英語)
AWS EC2 —(同等なし) $6.88/hr(1GPU換算) 秒課金 ○(日本語)

RunPod と Vast.ai の数値は公式サイト実取得値(2026-06-13)です。Lambda Labs のみ Cloudflare 保護のため参考値です。AWS は公式 Pricing API 実取得値(公示日 2026-06-12)です。

CPU・ストレージの参考ベンチ(Ubuntu 24.04 実測)

GPU インスタンスではモデルのロード速度(ストレージ I/O)が体験に直結します。参考として ubuntu:24.04 Docker コンテナで実測した値を示します。

sysbench CPU・dd ディスクI/O実測(ubuntu:24.04 Docker)
sysbench CPU・dd ディスクI/O実測(ubuntu:24.04 Docker)



ubuntu@linuxlab: ~
$ docker run –rm ubuntu:24.04 bash -c “lsb_release -a 2>/dev/null; uname -r; nproc”
Description: Ubuntu 24.04.1 LTS
Release: 24.04
6.8.0-111-generic
8 (コア数)

$ sysbench cpu –threads=2 –time=10 run # 3回計測
Run 1: events per second: 2256.05
Run 2: events per second: 2670.17
Run 3: events per second: 2600.58
平均: 2,508.9 events/sec(3回計測 / threads=2 / time=10s)

$ dd if=/dev/zero of=/tmp/test bs=1M count=512 conv=fdatasync
536870912 bytes copied: 420 MB/s(コンテナ内 /tmp)

GPU クラウドで気にすべきポイントは sysbench の数値よりもNVMe ストレージ帯域です。70B 規模の LLM(70GB 超)をロードする場合、ストレージ帯域が 500 MB/s なら約 140 秒、3,000 MB/s の高速 NVMe なら 23 秒でロード完了します。Vast.ai でインスタンスを選ぶときは「disk_bw」の表示を確認してください。

用途別の選び方

用途別クラウドGPU選び方ガイド
用途別クラウドGPU選び方ガイド

①画像生成(Stable Diffusion XL・FLUX)

SDXL のモデルは 6〜8 GB 程度の VRAM を使います。RTX 4090(24GB)があれば快適に動き、バッチ生成や LoRA 学習も視野に入ります。RunPod や Vast.ai の RTX 4090($0.34〜$0.40/hr)が最もコスパが高いです。

1 時間で $0.40 として、1 日 2 時間使っても月 $24(約 3,600 円)です。自宅に GPU を買う(RTX 4090 は約 30 万円)よりはるかに安い選択肢です。

②LLM 推論(Ollama・vLLM・llama.cpp)

70B モデルを 4bit 量子化で動かすには 40〜48 GB の VRAM が必要です。RTX 4090(24GB)では 13B 〜 30B が上限です。70B を快適に動かすなら A100 80GB(Vast.ai で $0.84/hr〜)または H100 SXM($2.00/hr〜) を選びましょう。

③ファインチューニング・強化学習

Llama-3 70B の LoRA ファインチューニングには H100 SXM × 1〜2 枚が現実的です。RunPod(from $1.99/hr)か Vast.ai($2.00/hr 中央値)を利用し、学習が終わったら即停止するのが最も費用を抑えられます。

④商用・本番 API サービス

SLA・セキュリティ・スケールアウト自動化が必要な場合は Lambda Labs(予約枠)か AWS EC2 が選択肢になります。コストは RunPod/Vast.ai の 2〜5 倍になりますが、稼働保証・監視・IAM などのエンタープライズ機能が使えます。

サーバー代を抑えるヒント

  • 推論 API の Web サーバー部分(FastAPI・Nginx)は GPU インスタンスではなく VPS で動かすと大幅に安くなる
  • Vultr の $6/月プランでも Nginx + FastAPI のリバースプロキシは動く。GPU インスタンスへのプロキシ設定で月コストを最適化できる
  • RunPod には Serverless(API エンドポイント)機能もあり、推論時だけ GPU を使う構成が作れる

RunPod の始め方(5分でGPU起動)

手順1:アカウント作成とクレジット追加

runpod.io にアクセスしてメールアドレスでアカウントを作成します。クレジットは $10 から購入可能(クレジットカード決済)。$10 あれば RTX 4090 を約 29 時間使えます。

手順2:GPU インスタンスを選ぶ

「Deploy」→「GPU Cloud」から GPU タイプを選択します。Filter by GPU で RTX 4090 と入力すると候補が絞り込まれます。

手順3:テンプレートを選択して起動

用途に合わせてテンプレートを選択します。

  • PyTorch:runpod/pytorch:2.4.0-py3.11-cuda12.4.1-devel-ubuntu22.04
  • Stable Diffusion:runpod/stable-diffusion:latest
  • カスタム:任意の Docker イメージ(Docker Hub 対応)

「Deploy On-Demand」をクリックすると 1〜3 分でインスタンスが起動します。SSH 接続または JupyterLab 経由でアクセスできます。




RunPod インスタンス起動後の確認コマンド例
$ nvidia-smi
+—————————————————————————–+
| NVIDIA-SMI 550.xx.xx Driver Version: 550.xx.xx CUDA Version: 12.4 |
+——————————-+———————-+———————-+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
+===============================+======================+======================+
| 0 NVIDIA GeForce RTX 4090 Off | 00000000:01:00.0 Off | N/A |
| 0% 38C P8 28W / 450W | 0MiB / 24576MiB | 0% Default |
+—————————————————————————–+

停止忘れに注意

GPU インスタンスは起動中は常に課金されます。使い終わったら必ずインスタンスを停止(Stop)または削除(Terminate)してください。RunPod にはコスト上限アラートも設定できるので活用しましょう。

まとめ

クラウドGPU 4 社を実データで比較した結果をまとめます。

まとめ

  • 個人の画像生成・LLM 推論には RunPod(RTX 4090 from $0.34/hr)か Vast.ai($0.40/hr 中央)が最安
  • A100 80GB が必要なら Vast.ai の $0.84/hr(中央値)が割安。RunPod より選択肢が多い
  • AWS は個人利用には割高だが、SLA・VPC・IAM が必要な商用サービスには適している
  • Lambda Labs は研究者向けで安定稼働が強み。料金はプログラム取得不可のため公式で要確認
  • GPU インスタンスの隣に Vultr などの安価な VPS を置くと、Web サーバー代を節約できる

GPU クラウドを使い始めるなら、まず RunPod で $10 のクレジットを入れて RTX 4090 で Ollama を動かしてみるのがおすすめです。「GPU がある環境」の快適さを実感してから、長期利用かどうかを判断するのが賢い使い方です。

コメント

タイトルとURLをコピーしました