Gemma 4 12B Opus Reasoning Q4 · 17.3 t/s @ 32k on Spark

Throughput at each benched context window (single measurement).

Context	KV	Throughput
@ 32k peak golden	q8_0	17.3t/s

gemma4-12b-opus-reasoning-q4

testingreasoningllamacppgoldengguf

Golden fleet target — auto-scaffolded from recipe gemma4-12b-opus-reasoning-q4.

golden 32k/q8_0 @ 17.3 tok/s — fill~14745 — bench-agent-v2 — tool_ok=True

yuxinlu1/gemma-4-12b-opus-reasoning-gguf — gated or private repo on HuggingFace, no public link available.
Golden recipe definition ↗