コンテンツへスキップ
Linuxらぼ

ollama トークン 速度

ベンチマーク

ローカルLLMモデル別トークン生成速度を実測比較【Llama/Qwen/Gemma】

「ローカルでLLMを動かしたいけど、Llama・Qwen・Gemma のどれが速いの?」——結論から言うと、今回テストした0.5〜1.5Bクラスでは qwen3:0.6b が約259 tok/s で最速、同じ1Bクラスの gemma3:1b…
2026.06.17
ベンチマーク

最近の投稿

  • ClickHouse on Ubuntu — 超高速列指向OLAPデータベースの構築
  • Apache Spark on Ubuntu — 分散データ処理環境の構築と入門
  • Apache Airflow on Ubuntu — ワークフロー自動化基盤の構築と運用
  • FastAPI on Ubuntu 本番デプロイ — Nginx+Gunicorn+systemdで運用
  • Ubuntu メール認証設定 SPF/DKIM/DMARC — 迷惑メール判定を回避

最近のコメント

  1. Hello world! に WordPress コメントの投稿者 より

アーカイブ

  • 2026年6月

カテゴリー

  • AI/MLツール
  • GPU
  • GPU収益化
  • Ollama
  • VPS比較
  • サーバー構築
  • データエンジニアリング
  • ベンチマーク
  • メールサーバー
  • ローカルLLM
  • 未分類
  • 開発環境
Linuxらぼ
© 2026 Linuxらぼ.
  • ホーム
  • トップ