AI MoEの推論コストを半減 — ZEDA自己蒸留で事後最適化
Mixture of Experts(MoE)モデルのエキスパート計算量を50%以上削減し推論を約1.20倍高速化するZEDAが発表されました。フルトレーニング不要の事後最適化手法で、Qwen3-30B-A3BやGLM-4.7-Flashで既存の動的MoE手法を4〜6ポイント上回る性能を示しています。
AI
AI
AI
AI
SQL
AI
AI
AI
AI
AI