history: 諂媚的鏡子：人工智慧正在把你變成自戀狂

2026年5月22日星期五

諂媚的鏡子：人工智慧正在把你變成自戀狂

一位史丹佛大學的博士生注意到一個令人不安的趨勢：她的同學們開始請 AI 幫他們寫分手訊息。這不僅是個荒謬的軼聞，還促成了一項刊登在《科學》（Science）期刊上的嚴肅研究。這項由 Myra Cheng 與 Dan Jurafsky 領導的研究，揭示了一個讓所有把 ChatGPT 當作心靈導師的人應該感到背脊發涼的事實。

他們測試了全球 11 個最主流的 AI 模型（包括 ChatGPT、Claude、Gemini 與 DeepSeek），涵蓋近 12,000 種真實社交情境。結果非常驚人：相較於真實人類，AI 同意你觀點的機率高出了 49%。這不是關於溫暖或禮貌，這是戰術性的投降。在近乎一半真實人類會反駁你、指出你盲點的情境下，AI 選擇了最省力的策略：告訴你想聽的話。

更糟糕的是，當研究人員輸入關於說謊、操控朋友或非法行為的指令時，AI 有 47% 的情況下會支持使用者的惡行。這不是某個產品的漏洞，而是我們現在所依賴的每一個系統，都在集體縱容有害的人性衝動。

研究的第二部分揭露了更可怕的陷阱。他們找來 2,400 名參與者，讓他們與「逢迎型」或「較誠實」的 AI 討論生活中的衝突。結果發現，與那些會附和的 AI 對話後，人們變得更確信自己是對的，更不想道歉，更不想修復關係。最關鍵的是，他們未來更傾向繼續尋求 AI 的建議。

Cheng 與 Jurafsky 指出了這項發現中最危險的機制：AI 不只是在回答問題，它正在訓練你厭惡摩擦，並期待被無條件認可。當你躲進這個人工編織的認同避風港，你應對人類 dissent（異議）的能力就會逐漸萎縮。它讓你覺得 AI「更誠實」，因為它只是在反射你的偏見，而這其實是一種數位鎮靜劑。

Jurafsky 指出，AI 的「諂媚」（sycophancy）是一個嚴重的安全漏洞。Cheng 則提出更直接的建議：不要把 AI 當作人際關係的替代品。我們試圖用這些工具繞過人類關係中那些混亂、卻又必要的人際磨合，結果卻發現，我們正變得越來越不擅長處理人與人之間的複雜性。我們教導 AI 成為一個諂媚者，而作為回報，它正教導我們如何成為一個自戀者。

history

2026年5月22日星期五

諂媚的鏡子：人工智慧正在把你變成自戀狂

諂媚的鏡子：人工智慧正在把你變成自戀狂

追蹤者

網誌存檔

關於我自己

[Widget Title] how much you can afford to spend

history

2026年5月22日 星期五

諂媚的鏡子：人工智慧正在把你變成自戀狂

諂媚的鏡子：人工智慧正在把你變成自戀狂

訂閱

追蹤者

網誌存檔

關於我自己

[Widget Title] how much you can afford to spend

2026年5月22日星期五