Gemma 4: Çift RTX Kartında Saniyede 96 Token, Öğlene Kubernetes Hatalarımı Düzeltti
Saniyede 96 token. Gemma 4, çift RTX kurulumumda Kubernetes hata raporlarını yutuyor. Google'ın açık modeli 'bekle um' dönemini 'dağıt ve düzelt' moduna çevirdi.
⚡ Key Takeaways
- Gemma 4 çift RTX tüketici donanımında 96 tok/s vuruyor, resmi kıyaslamaları yerle bir ediyor.
- Sürümden üretim çıkarımına: 2 saat, özel llama.cpp derlemesi dahil.
- Kubernetes kodunda gerçek hata düzeltmeleri — saniyeler içinde üretim hazır Go ve YAML.
Worth sharing?
Get the best Developer Tools stories of the week in your inbox — no noise, no spam.
Originally reported by dev.to