AI AIエージェントは差別するか — AgentFairBenchが採用・融資・医療を検証
arXiv論文(2606.16723)がLLMエージェントの行動レベルの差別を評価するAgentFairBenchを発表しました。採用・融資・医療トリアージで864件を検証し、Claude Haiku 4.5は統計的に有意な差別を示さず。従来手法の2.4倍過大評価という問題も明らかになっています。
AI
AI
AI
AI
AI
AI
AI
AI
AI
SQL