社会・倫理

AI

LLMは監視されると話し方が変わる — 評価の信頼性に問う研究

arXiv論文がLLMは「監視されている」と認識すると語彙の多様性を最大24.9%変えることを実験で示しました。AIが人間とAIの観察者を区別して応答を変える傾向は、安全評価プロトコルの設計そのものの信頼性に影響する可能性があります。