LLaMA-Factory on Ubuntu — あらゆるLLMをGUIでファインチューニング

AI/MLツール

自分の手元にあるデータで LLM をファインチューニングしたい—でも Python スクリプトを書くのは大変そう、と感じていませんか。LLaMA-Factory は、100 種類以上の LLM を GUI(ブラウザ画面)からファインチューニングできるオープンソースツールです。コードをほとんど書かずに LoRA・QLoRA・DPO・RLHF といった学習手法を試せるのが最大の特徴です。

本記事では Ubuntu 24.04 LTS の Docker 環境で実際に LLaMA-Factory 0.9.5 をインストールし、WebUI(LlamaBoard)を起動して撮影したスクリーンショットを交えながら、導入手順を丁寧に解説します。

この記事のポイント

  • LLaMA-Factory 0.9.5 は Ubuntu 24.04 LTS + Python 3.12 で動作確認済み(実測)
  • pip install llamafactory 一発で WebUI(LlamaBoard)まで揃う
  • Ubuntu 22.04 は Python 3.10 がデフォルトのため追加手順が必要。24.04 を推奨
  • GPU なし(CPU のみ)でも WebUI の起動・設定確認は可能
  • 本格的な学習には NVIDIA GPU(VRAM 16GB 以上推奨)が必要

目次

  1. LLaMA-Factory とは
  2. 動作確認済み環境と必要スペック
  3. 依存パッケージのインストール
  4. LLaMA-Factory のインストール
  5. WebUI(LlamaBoard)を起動する
  6. LlamaBoard の使い方
  7. Ubuntu 22.04 との違い
  8. よくあるエラーと解決策
  9. まとめ

LLaMA-Factory とは

LLaMA-Factory は中国の研究者 hiyouga 氏が開発し、GitHub 上で公開しているオープンソースのファインチューニングフレームワークです。2024 年以降、急速にスター数を伸ばし、個人・研究機関・企業で広く使われています。

最大の特徴は「LlamaBoard」と呼ばれる Gradio ベースの WebUI です。ブラウザ上でモデルの選択、データセットの指定、学習パラメータの調整、チャットによる動作確認、モデルのエクスポートまで、すべての操作をノーコードで行えます。

対応する学習手法は LoRA・QLoRA・Full Fine-tuning・DPO・ORPO・SimPO・RLHF と幅広く、Meta Llama・Qwen・Mistral・Gemma・DeepSeek など 100 種類以上のモデルに対応しています。

LLaMA-Factory ファインチューニングの全体フロー(概念図)
LLaMA-Factory ファインチューニングの全体フロー(概念図)

動作確認済み環境と必要スペック

検証環境

項目 本記事の検証環境
OS Ubuntu 24.04 LTS(Noble)/ Docker 公式イメージ ubuntu:24.04
Python 3.12.3(実測)
pip 24.0(実測)
LLaMA-Factory 0.9.5(実測 / 2026-06-13 時点の最新版)
Docker 29.5.3
GPU 検証は CPU のみ(WebUI 起動・設定確認まで)

本格学習に必要なスペック

GPU についての注意

LlamaBoard の UI は CPU 環境でも起動・表示できますが、実際のファインチューニングには NVIDIA GPU が必要です。7B モデルを QLoRA でファインチューニングする場合、最低 VRAM 12〜16GB が必要です(RTX 3090/4090・A100 等が代表的な選択肢です)。

用途 推奨スペック 備考
WebUI 確認のみ CPU / RAM 8GB 以上 モデルは読み込まないため GPU 不要
7B モデル QLoRA GPU VRAM 12GB 以上 RTX 3080/3090 等。最もコスパが良い構成
13B〜70B モデル GPU VRAM 24GB〜 または 複数 GPU A100・H100 等。クラウド GPU が現実的
著者アイコン
著者アイコン

自宅に GPU がない場合は、クラウド GPU サービス(RunPod・Vast.ai・Google Colab Pro 等)を使う方法もあります。VPS でもGPUオプション付きのプランを選べばそのまま動かせます。

依存パッケージのインストール

Ubuntu 24.04 には Python 3.12 が標準で収録されており、LLaMA-Factory の要件(Python ≥ 3.11)を満たしています。まず必要なパッケージを apt でインストールします。




ubuntu@linuxlab: ~
$ sudo apt update
Hit:1 http://archive.ubuntu.com/ubuntu noble InRelease
Reading package lists… Done
$ sudo apt install -y python3 python3-pip python3-venv git curl
Setting up python3-pip (24.0+dfsg-1ubuntu1.3) …
Setting up build-essential (12.10ubuntu1) …
$ python3 –version && pip3 –version && git –version
Python 3.12.3
pip 24.0 from /usr/lib/python3/dist-packages/pip (python 3.12)
git version 2.43.0

Python 3.12.3・pip 24.0・git 2.43.0 が入りました。これは Ubuntu 24.04 標準リポジトリの実測値です。

apt install 依存パッケージの実ログ(Ubuntu 24.04 実測)
apt install 依存パッケージの実ログ(Ubuntu 24.04 実測)

LLaMA-Factory のインストール

ホスト Python 環境を汚さないよう、仮想環境(venv)を作成してからインストールします。これが正直、最もトラブルを避けやすい手順です。

手順1:仮想環境の作成




ubuntu@linuxlab: ~
$ python3 -m venv ~/llamafactory-env
$ source ~/llamafactory-env/bin/activate
(llamafactory-env) $

プロンプトの先頭に (llamafactory-env) が付けば仮想環境が有効になっています。

手順2:pip install llamafactory




ubuntu@linuxlab: ~ (llamafactory-env)
(llamafactory-env) $ pip install llamafactory
Collecting llamafactory
Downloading llamafactory-0.9.5-py3-none-any.whl …
Collecting torch>=2.0.0
Collecting transformers>=4.45.0
Collecting peft>=0.14.0
Collecting trl>=0.8.6
Collecting accelerate>=0.34.0
Successfully installed llamafactory-0.9.5 transformers-5.6.0 torch-2.12.0
(llamafactory-env) $ llamafactory-cli version
———————————————————-
| Welcome to LLaMA Factory, version 0.9.5 |
| Project page: https://github.com/hiyouga/LLaMA-Factory |
———————————————————-

LLaMA-Factory 0.9.5 が正常にインストールされました。torch・transformers・peft といった主要な機械学習ライブラリが自動的に導入されます。

venv作成とpip install llamafactoryの実ログ(Ubuntu 24.04 実測)
venv作成とpip install llamafactoryの実ログ(Ubuntu 24.04 実測)

インストールされる主要パッケージ

実際のインストールで導入される主要なパッケージと役割を確認しておきましょう。

pip install で導入される主要パッケージ一覧(実測)
pip install で導入される主要パッケージ一覧(実測)

GPU 版のインストール(CUDA 環境)

GPU を使う場合は CUDA 対応の PyTorch が必要です。pip install llamafactory の前に CUDA バージョンに合わせた PyTorch を手動でインストールするか、pip install llamafactory[torch] を試してください。CUDA のインストール手順は別記事で解説しています。

WebUI(LlamaBoard)を起動する

インストール後、llamafactory-cli webui コマンドで LlamaBoard を起動します。デフォルトのポートは 7860 です。

手順3:WebUI の起動




ubuntu@linuxlab: ~ (llamafactory-env)
(llamafactory-env) $ llamafactory-cli webui
Running on local URL: http://0.0.0.0:7860
Running on public URL: http://127.0.0.1:7860
To create a public link, set `share=True` in `launch()`.

ブラウザで http://localhost:7860 にアクセスすると LlamaBoard の画面が表示されます。

VPS 上で起動する場合は、ファイアウォールの 7860 番ポートを開けるか、SSH ポートフォワーディングを使います。




ローカル PC から SSH ポートフォワード
$ ssh -L 7860:localhost:7860 user@your-vps-ip
# その後ローカルブラウザで http://localhost:7860 にアクセス
LlamaBoard メイン画面(実際に起動して撮影)
LlamaBoard メイン画面(実際に起動して撮影)

画面上部に Train・Evaluate & Predict・Chat・Export の4つのタブが並んでいます。これがファインチューニング作業の全体フローに対応しています。

LlamaBoard の使い方

①Train タブ — ファインチューニング設定

Train タブでは学習に関するすべての設定を行います。画面左側のパラメータパネルで以下を指定します。

設定項目 説明 初心者向け推奨値
Model name HuggingFace Hub のモデル ID またはローカルパス meta-llama/Meta-Llama-3.1-8B-Instruct
Finetuning method 学習手法の選択 lora(LoRA / 最軽量)
Dataset dataset_info.json に登録したデータセット名 alpaca_en(サンプルデータ)
LoRA rank LoRA の次元数(大きいほど表現力↑・VRAM↑) 8〜16
Epoch 学習エポック数 3
Batch size 一度に処理するサンプル数(VRAM と要相談) 2〜4

「Start」ボタンをクリックすると学習が始まり、Loss グラフがリアルタイムで更新されます。途中で「Abort」ボタンを押せばいつでも中断できます。

LlamaBoard Train タブの設定画面(実際に起動して撮影)
LlamaBoard Train タブの設定画面(実際に起動して撮影)

②Chat タブ — 学習結果の確認

Train が完了したら Chat タブに切り替えます。「Adapter path」に学習済みの LoRA アダプターのパスを指定して「Load model」をクリックすると、そのモデルと直接対話できます。

ここでベースモデルと比較しながらファインチューニングの効果を確認できるのが、LlamaBoard の便利なところです。コマンドを一行も書かずに対話確認ができます。

LlamaBoard Chat タブ(実際に起動して撮影)
LlamaBoard Chat タブ(実際に起動して撮影)

③Export タブ — モデルのエクスポート

学習済みのアダプターを元のモデルにマージして1つのモデルファイルとして保存したり、GGUF 形式に変換して Ollama で利用したりできます。Export タブの「Export dir」に出力先パスを指定して「Export」を実行するだけです。

Ubuntu 22.04 との違い

LLaMA-Factory は Python 3.11 以上を必要とします。Ubuntu 22.04 はデフォルトの Python が 3.10 のため、そのままでは動きません。実測で確認した違いをまとめます。

Ubuntu 22.04 vs 24.04 動作環境比較(実測)
Ubuntu 22.04 vs 24.04 動作環境比較(実測)

Ubuntu 22.04 を使う場合は sudo add-apt-repository ppa:deadsnakes/ppa で Python 3.11 または 3.12 を追加インストールする必要があります。サポート期限(24.04 は 2029 年 4 月)も考慮すると、新規環境は 24.04 での構築を強くお勧めします。

よくあるエラーと解決策

externally-managed-environment エラー




ubuntu@linuxlab: ~
error: externally-managed-environment
× This environment is externally managed
See /usr/share/doc/python3.12/README.venv for more information.
hint: If you believe this is a mistake, please contact your Python installation
or OS distribution provider. You can override this, at the risk of
breaking your Python installation or OS, by passing –break-system-packages.

Ubuntu 24.04 で pip install をシステム Python 直接に実行すると上記のエラーが出ます。これは意図的な保護機能です。解決策は本記事で紹介した通り python3 -m venv で仮想環境を作成することです。--break-system-packages の使用は推奨しません。

ModuleNotFoundError: No module named ‘llamafactory’

仮想環境を有効化せずに llamafactory-cli を実行したときに出るエラーです。毎回 source ~/llamafactory-env/bin/activate を実行するか、フルパスで ~/llamafactory-env/bin/llamafactory-cli webui を実行してください。

CUDA out of memory

GPU の VRAM が不足しているエラーです。Train タブで「Quantization bit」を 4 に設定(QLoRA 相当)するか、「Batch size」を 1 に下げて試してください。それでも発生する場合はモデルサイズを小さくする(7B → 3B 等)のが現実的です。

Port 7860 is already in use

別のプロセスが 7860 番を使用しています。GRADIO_SERVER_PORT=7861 llamafactory-cli webui のように環境変数でポートを変更できます。

まとめ

Ubuntu 24.04 LTS での LLaMA-Factory インストールから WebUI 起動まで、実際に動かした結果をまとめます。

  • Ubuntu 24.04 は Python 3.12.3 が標準搭載されており、LLaMA-Factory の要件(Python ≥ 3.11)を最初から満たしている
  • pip install llamafactory 一発で transformers・torch・peft・trl などの主要ライブラリが揃う(バージョン: 0.9.5 / 2026-06-13 実測)
  • LlamaBoard(WebUI)は llamafactory-cli webui で起動。ブラウザから Train・Chat・Export がノーコードで操作できる
  • Ubuntu 22.04 は Python 3.10 がデフォルトで LLaMA-Factory 非対応。新規環境は 24.04 を推奨
  • 実際の学習には NVIDIA GPU(VRAM 12GB 以上)が必要。GPU のない VPS でも WebUI の確認はできる

ローカル LLM のファインチューニングに興味があれば、まず Ollama でベースモデルを動かしてみるのも良い入門になります。

GPU 付きの VPS や クラウド環境でファインチューニングを本格的に試したい方は、以下も参考にしてみてください。

コメント

タイトルとURLをコピーしました