AI arXiv論文:LLMのデュアルパス設計で計算効率を大幅改善
arXivで公開されたデュアルパスアーキテクチャ論文が、LLMのスケーリング効率を改善する新手法を提案しています。各レイヤーに深い経路と広い経路を並列設置してトークンごとにルーティングし、同一計算量で従来設計を上回る言語モデル性能を達成しました。
AI
AI
AI
AI
AI
SQL
AI
AI
AI
SQL