ollama トークン速度

ローカルLLMモデル別トークン生成速度を実測比較【Llama/Qwen/Gemma】

「ローカルでLLMを動かしたいけど、Llama・Qwen・Gemma のどれが速いの？」——結論から言うと、今回テストした0.5〜1.5Bクラスでは qwen3:0.6b が約259 tok/s で最速、同じ1Bクラスの gemma3:1b…

ベンチマーク