羅希特·普拉薩德(Rohit Prasad),亞馬遜的 AGI 高級副總裁。這是來自 Alex Heath 的《Sources》節錄,這是一份關於人工智能和科技行業的電子報,每週專為《The Verge》的訂閱者發送一次。
亞馬遜的人工智能負責人對那些痴迷於模型基準的人有話要說:停止關注排行榜。羅希特·普拉薩德在拉斯維加斯的 AWS re:Invent 活動宣布之前告訴我:「我想要的是實際的應用價值。這些基準測試都不是真實的。」「唯一能做真正基準測試的方法是如果每個人都遵循相同的訓練數據,並且評估完全保留。現在並不是這樣。評估實際上變得雜亂,並沒有顯示出真正的實力…」
欲了解完整故事,請前往《The Verge》。

