AI RA-RFT: 検索で「類推」を教えLLMのAIMEスコアを改善
arXiv論文RA-RFT(2606.13680)が、意味的類似度ではなく推論有用性で事例を検索する手法と強化学習を組み合わせ、AIME 2025でGRPO比+7.1ポイントを達成しました。推論認識型検索は既存の強化学習改善と直交する新しい精度向上軸として注目されます。
AI
AI
AI
AI
SQL
AI
AI
AI
AI
AI