ベンチマーク ローカルLLMモデル別トークン生成速度を実測比較【Llama/Qwen/Gemma】 「ローカルでLLMを動かしたいけど、Llama・Qwen・Gemma のどれが速いの?」——結論から言うと、今回テストした0.5〜1.5Bクラスでは qwen3:0.6b が約259 tok/s で最速、同じ1Bクラスの gemma3:1b… 2026.06.17 ベンチマーク