AI TFGN、LLM規模の継続学習でリプレイ不要のアーキテクチャを実現
arXivに投稿されたTFGNは、タスクラベルもリプレイバッファも使わずにLLM規模の継続学習を実現するアーキテクチャです。LLaMA 3.1 8Bで後方転移-0.007・勾配分離99.59%以上を達成し、既存知識を保ちながら新ドメインの習得が可能です。
AI
AI
AI
AI