클라우드플레어의 'Unweight': 품질 저하 없는 22% LLM 압축 [믿거나 말거나]
이제 당신의 AI 질문이 더 저렴해질지도 모른다. 클라우드플레어의 Unweight는 LLM을 22%까지 줄이면서도 품질 저하 없이, 대중을 위한 더 빠른 추론을 약속한다. 하지만 아직 샴페인을 터뜨리긴 이르다.
⚡ Key Takeaways
Worth sharing?
Get the best Developer Tools stories of the week in your inbox — no noise, no spam.
Originally reported by Cloudflare Blog