AI SWE-INTERACTが示すAIコーディング支援の限界:マルチターンで性能が半減
新ベンチマーク「SWE-INTERACT」により、フロンティアモデルは要件が段階的に開示されるマルチターン設定で性能が約50%から25%に低下することが判明しました。AIコーディング支援の現実的な限界を明らかにした研究です。
AI
AI
AI
AI
AI
AI
AI
AI
AI
AI