クラウドGPU料金比較【RunPod/Vast.ai/Lambda/AWS】コスパ徹底検証

「GPUを借りて Stable Diffusion や Ollama を動かしたいけど、どのサービスが一番安いの？」という疑問に、2026年6月13日時点の公式サイト実データで答えます。

RunPod・Vast.ai・Lambda Labs・AWS EC2 を対象に、料金・スペック・使い勝手を実際のデータと Playwright スクリーンショットで比較しました。結論から言うと、個人利用のコスパ最強は RunPod か Vast.ai で、RTX 4090 が $0.34〜$0.40/hr で借りられます。

本記事では RunPod と Vast.ai の料金ページを直接スクレイピングし、AWS は公式 Pricing API（b0.p.awsstatic.com）から実データを取得して比較しています。

この記事のポイント

RunPod は RTX 4090 が from $0.34/hr、H100 が from $1.99/hr（公式サイト実取得）
Vast.ai はマーケットプレイス型。RTX 4090 が $0.40/hr 中央値、A100 80GB が $0.84/hr から
AWS EC2 は g4dn.xlarge（T4）$0.526/hr から。H100 は p5.48xlarge（8枚構成）で $55.04/hr
個人の画像生成・LLM 推論には RunPod か Vast.ai の RTX 4090 が最もコスパが高い
企業・長期利用には Lambda Labs（予約枠）または AWS（SLA付き）を検討する

比較の前提（取得環境・日付）
RunPod — 個人向けコミュニティGPUの最安値候補
1. RunPod の料金体系
Vast.ai — マーケットプレイス型で価格競争力が高い
Lambda Labs — 研究者向けの固定枠クラウド
AWS EC2 GPU インスタンス — エンタープライズ向けの本格構成
4社料金・スペック総合比較表
CPU・ストレージの参考ベンチ（Ubuntu 24.04 実測）
用途別の選び方
RunPod の始め方（5分でGPU起動）
まとめ

比較の前提（取得環境・日付）

本記事の料金データは以下の方法で取得しました。

注意

クラウドGPU料金はサービス側の在庫・需給・為替レートによって頻繁に変動します。本記事の数値は 2026年6月13日時点 の実取得値です。最新料金は必ず各公式サイトでご確認ください。

プロバイダ	取得方法	取得日	信頼度
RunPod	urllib で runpod.io/gpu-instance/pricing を直接 HTTP 取得	2026-06-13	★★★★★（実測）
Vast.ai	Playwright で vast.ai/pricing をレンダリング後に取得	2026-06-13	★★★★★（実測）
AWS EC2	b0.p.awsstatic.com Pricing API（JSON）から取得（hawkFilePublicationDate: 2026-06-12）	2026-06-13	★★★★★（実測）
Lambda Labs	公式サイト（Cloudflare 保護のためプログラム取得不可）→ 公称値を参考記載	参考値	★★★（参考）

RunPod GPU料金ページ（Playwright撮影 2026-06-13）

RunPod — 個人向けコミュニティGPUの最安値候補

RunPod は GPU を所有するプロバイダーが余剰リソースをコミュニティに提供するモデルと、RunPod 自身が用意するクラウドの 2 種類があります。公式サイト（runpod.io/gpu-instance/pricing）の HTML を直接取得したところ、以下の「from 価格」を確認しました。

RunPod 公式サイト実取得（2026-06-13）

$ python3 -c “import urllib.request, re; …”
# runpod.io/gpu-instance/pricing から HTTP 200 で取得
# HTML サイズ: 206,805 bytes

H100 80GB from $1.99/hr
RTX 4090 from $0.34/hr

RunPod の料金体系

RunPod には 2 つのティアがあります。

Community Cloud：GPU 保有者が提供するリソース。最安値だが稼働率・安定性はやや劣る
Secure Cloud：RunPod 直轄のデータセンター。価格は少し高いが可用性が高い

上記の「from $0.34/hr」は Community Cloud の RTX 4090 最安値です。Secure Cloud では $0.44/hr 前後になることが多いです（在庫状況により変動）。

RunPod はポッド（Pod）という概念でインスタンスを管理します。Ubuntu 22.04 / 24.04 のテンプレートが用意されており、pytorch/pytorch:latest などの Docker イメージも選択できます。起動まで 1〜3 分程度で、秒単位の課金なので短時間のテストにも使いやすいです。

RunPod は日本語サポートがないのが難点ですが、ドキュメントが充実していて英語でも詰まりにくいです。コンソール画面はシンプルで、VPS の感覚で使えます。

Vast.ai — マーケットプレイス型で価格競争力が高い

Vast.ai は世界中の GPU 保有者が出品するオークション型マーケットプレイスです。Playwright で vast.ai/pricing を実際に取得したところ、2026年6月13日時点で以下のライブ価格を確認しました。

Vast.ai GPU価格一覧（Playwright撮影 2026-06-13）

GPU モデル	アーキテクチャ	VRAM	中央値 ($/hr)	価格幅 ($/hr)	在庫
B300 (Blackwell Ultra)	Blackwell	288 GB	$5.63	$3.75〜$6.88	高
H200 (Hopper)	Hopper	141 GB	$3.45	$1.97〜$4.41	高
H100 SXM (Hopper)	Hopper	80 GB	$2.00	$1.47〜$3.64	中
A100 SXM4 (Ampere)	Ampere	80 GB	$0.84	$0.40〜$2.00	高
RTX 4090 (Ada)	Ada Lovelace	24 GB	$0.40	$0.13〜$2.67	高
RTX 5090 (Blackwell)	Blackwell	32 GB	$0.51	$0.21〜$53.33	高
RTX 3090 (Ampere)	Ampere	24 GB	$0.22	$0.16〜$0.36	低

Vast.ai の大きな特徴は A100 80GB が $0.84/hr（中央値）から借りられる点です。RunPod や Lambda Labs での A100 は通常 $1.00〜$1.99/hr なので、Vast.ai のマーケット価格はかなり安い水準です。ただし価格は需給によって大きく変動する点（RTX 5090 で $0.21〜$53.33 という幅がある）には注意が必要です。

Vast.ai 利用の注意点

Vast.ai はプロバイダーが個人・企業の余剰 GPU を提供するため、突然インスタンスが停止する「インタラプティブル」モードと、安定した「オンデマンド」モードがあります。長時間の学習タスクには必ずオンデマンドを選んでください。また、出品者によってはストレージ速度・ネットワーク品質にばらつきがあります。

Lambda Labs — 研究者向けの固定枠クラウド

Lambda Labs（旧 Lambda GPU Cloud）は AI 研究者・スタートアップ向けに特化した GPU クラウドです。残念ながら 2026年6月13日時点では公式サイトが Cloudflare のボット保護下にあり、プログラムによる料金取得はできませんでした。

公称値として広く知られている料金は以下の通りです（参考値・要公式確認）。

インスタンス	GPU	VRAM	vCPU	RAM	参考価格
gpu_1x_h100_sxm5	H100 SXM5	80 GB	26	200 GB	~$2.49/hr（参考）
gpu_1x_a100_sxm4	A100 SXM4	80 GB	30	200 GB	~$1.99/hr（参考）
gpu_1x_a10	A10	24 GB	30	200 GB	~$0.75/hr（参考）

Lambda Labs の強みはインスタンスの安定稼働と予約枠（Reserved）の提供です。GPU 学習タスクで数週間〜数ヶ月の長期利用を考えるなら、Reserved プランで大幅な割引が得られます。

AWS EC2 GPU インスタンス — エンタープライズ向けの本格構成

AWS EC2 の GPU インスタンスは、公式 Pricing API（b0.p.awsstatic.com）から実データを取得しました。取得データの公示日は 2026年6月12日です。

AWS EC2 GPU インスタンス料金一覧（API実取得 2026-06-13）

インスタンス	GPU（枚数）	vCPU	RAM	$/hr（US East）	用途
g4dn.xlarge	T4 × 1（16GB）	4	16 GiB	$0.526	推論・軽量学習
g6.xlarge	L4 × 1（24GB）	4	16 GiB	$0.805	推論・中規模モデル
g5.xlarge	A10G × 1（24GB）	4	16 GiB	$1.006	推論・Stable Diffusion
p3.2xlarge	V100 × 1（16GB）	8	61 GiB	$3.060	深層学習（やや古め）
g5.48xlarge	A10G × 8（192GB）	192	768 GiB	$16.288	大規模学習
p5.48xlarge	H100 × 8（640GB）	192	2048 GiB	$55.040	最大規模学習・推論

AWS の重要な特徴はH100 を含む GPU インスタンスがほぼすべて「複数 GPU 構成」という点です。個人が H100 を 1 枚だけ借りることはできず、p5.48xlarge（H100 × 8 枚、$55.04/hr）を丸ごと借りる必要があります。1GPU 換算で約 $6.88/hr になります。

AWS Pricing API 実取得コマンド（2026-06-13）

$ python3 -c “import urllib.request, gzip, json; …”
# b0.p.awsstatic.com Pricing API から gzip JSON を取得
# hawkFilePublicationDate: 2026-06-12T07:30:40Z

p3.2xlarge (V100 16GB) $3.0600/hr US East (N.Virginia) Linux
g4dn.xlarge (T4 16GB) $0.5260/hr US East (N.Virginia) Linux
g5.xlarge (A10G 24GB) $1.0060/hr US East (N.Virginia) Linux
p5.48xlarge (H100×8) $55.0400/hr US East (N.Virginia) Linux

正直、AWS の GPU インスタンスは個人の画像生成や LLM 推論に使うには割高です。ただしSLA（稼働保証）・VPC によるネットワーク分離・IAM によるアクセス管理が使えるため、商用サービスやセキュリティが必要な企業用途には適しています。

4社料金・スペック総合比較表

プロバイダ	RTX 4090 (24GB)	A100 80GB	H100 80GB	課金	日本語	SLA
RunPod	from $0.34/hr	—	from $1.99/hr	秒課金	×（英語）	△
Vast.ai	$0.40/hr（中央）	$0.84/hr（中央）	$2.00/hr（中央）	秒課金	×（英語）	△
Lambda Labs	—	~$1.99/hr（参考）	~$2.49/hr（参考）	時間課金	×（英語）	○
AWS EC2	—（同等なし）	—	$6.88/hr（1GPU換算）	秒課金	○（日本語）	◎

RunPod と Vast.ai の数値は公式サイト実取得値（2026-06-13）です。Lambda Labs のみ Cloudflare 保護のため参考値です。AWS は公式 Pricing API 実取得値（公示日 2026-06-12）です。

CPU・ストレージの参考ベンチ（Ubuntu 24.04 実測）

GPU インスタンスではモデルのロード速度（ストレージ I/O）が体験に直結します。参考として ubuntu:24.04 Docker コンテナで実測した値を示します。

sysbench CPU・dd ディスクI/O実測（ubuntu:24.04 Docker）

ubuntu@linuxlab: ~

$ docker run –rm ubuntu:24.04 bash -c “lsb_release -a 2>/dev/null; uname -r; nproc”
Description: Ubuntu 24.04.1 LTS
Release: 24.04
6.8.0-111-generic
8 （コア数）

$ sysbench cpu –threads=2 –time=10 run # 3回計測
Run 1: events per second: 2256.05
Run 2: events per second: 2670.17
Run 3: events per second: 2600.58
平均: 2,508.9 events/sec（3回計測 / threads=2 / time=10s）

$ dd if=/dev/zero of=/tmp/test bs=1M count=512 conv=fdatasync
536870912 bytes copied: 420 MB/s（コンテナ内 /tmp）

GPU クラウドで気にすべきポイントは sysbench の数値よりもNVMe ストレージ帯域です。70B 規模の LLM（70GB 超）をロードする場合、ストレージ帯域が 500 MB/s なら約 140 秒、3,000 MB/s の高速 NVMe なら 23 秒でロード完了します。Vast.ai でインスタンスを選ぶときは「disk_bw」の表示を確認してください。

用途別の選び方

①画像生成（Stable Diffusion XL・FLUX）

SDXL のモデルは 6〜8 GB 程度の VRAM を使います。RTX 4090（24GB）があれば快適に動き、バッチ生成や LoRA 学習も視野に入ります。RunPod や Vast.ai の RTX 4090（$0.34〜$0.40/hr）が最もコスパが高いです。

1 時間で $0.40 として、1 日 2 時間使っても月 $24（約 3,600 円）です。自宅に GPU を買う（RTX 4090 は約 30 万円）よりはるかに安い選択肢です。

②LLM 推論（Ollama・vLLM・llama.cpp）

70B モデルを 4bit 量子化で動かすには 40〜48 GB の VRAM が必要です。RTX 4090（24GB）では 13B 〜 30B が上限です。70B を快適に動かすなら A100 80GB（Vast.ai で $0.84/hr〜）または H100 SXM（$2.00/hr〜）を選びましょう。

③ファインチューニング・強化学習

Llama-3 70B の LoRA ファインチューニングには H100 SXM × 1〜2 枚が現実的です。RunPod（from $1.99/hr）か Vast.ai（$2.00/hr 中央値）を利用し、学習が終わったら即停止するのが最も費用を抑えられます。

④商用・本番 API サービス

SLA・セキュリティ・スケールアウト自動化が必要な場合は Lambda Labs（予約枠）か AWS EC2 が選択肢になります。コストは RunPod/Vast.ai の 2〜5 倍になりますが、稼働保証・監視・IAM などのエンタープライズ機能が使えます。

サーバー代を抑えるヒント

推論 API の Web サーバー部分（FastAPI・Nginx）は GPU インスタンスではなく VPS で動かすと大幅に安くなる
Vultr の $6/月プランでも Nginx + FastAPI のリバースプロキシは動く。GPU インスタンスへのプロキシ設定で月コストを最適化できる
RunPod には Serverless（API エンドポイント）機能もあり、推論時だけ GPU を使う構成が作れる

Vultr で Web サーバーを格安に立てる →

RunPod の始め方（5分でGPU起動）

手順1：アカウント作成とクレジット追加

runpod.io にアクセスしてメールアドレスでアカウントを作成します。クレジットは $10 から購入可能（クレジットカード決済）。$10 あれば RTX 4090 を約 29 時間使えます。

手順2：GPU インスタンスを選ぶ

「Deploy」→「GPU Cloud」から GPU タイプを選択します。Filter by GPU で RTX 4090 と入力すると候補が絞り込まれます。

手順3：テンプレートを選択して起動

用途に合わせてテンプレートを選択します。

PyTorch：runpod/pytorch:2.4.0-py3.11-cuda12.4.1-devel-ubuntu22.04
Stable Diffusion：runpod/stable-diffusion:latest
カスタム：任意の Docker イメージ（Docker Hub 対応）

「Deploy On-Demand」をクリックすると 1〜3 分でインスタンスが起動します。SSH 接続または JupyterLab 経由でアクセスできます。

RunPod インスタンス起動後の確認コマンド例

停止忘れに注意

GPU インスタンスは起動中は常に課金されます。使い終わったら必ずインスタンスを停止（Stop）または削除（Terminate）してください。RunPod にはコスト上限アラートも設定できるので活用しましょう。

まとめ

クラウドGPU 4 社を実データで比較した結果をまとめます。

まとめ

個人の画像生成・LLM 推論には RunPod（RTX 4090 from $0.34/hr）か Vast.ai（$0.40/hr 中央）が最安
A100 80GB が必要なら Vast.ai の $0.84/hr（中央値）が割安。RunPod より選択肢が多い
AWS は個人利用には割高だが、SLA・VPC・IAM が必要な商用サービスには適している
Lambda Labs は研究者向けで安定稼働が強み。料金はプログラム取得不可のため公式で要確認
GPU インスタンスの隣に Vultr などの安価な VPS を置くと、Web サーバー代を節約できる

GPU クラウドを使い始めるなら、まず RunPod で $10 のクレジットを入れて RTX 4090 で Ollama を動かしてみるのがおすすめです。「GPU がある環境」の快適さを実感してから、長期利用かどうかを判断するのが賢い使い方です。

Vultr で Linux VPS を試す（$100 クレジット付き） →

DigitalOcean で Droplet を作成する →