Anthropic 正在全面改革 Claude 的所謂「靈魂文檔」。這份新的文件名為「Claude 的憲法」,長達 57 頁,詳細說明了「Anthropic 對模型的價值觀和行為的意圖」,其目標並不是針對外部讀者,而是針對該模型本身。這份文件旨在清楚說明 Claude 的「倫理特徵」和「核心身份」,包括它在面對衝突的價值觀和高風險情況時應如何平衡。與 2023 年 5 月發布的前一版本憲法主要是一系列指導方針不同,Anthropic 現在表示,AI 模型「理解我們為何希望它們以特定方式行為,而不僅僅是指定行為」是非常重要的。
詳情請參閱 The Verge。
