自白
人工智慧 (AI) 研究機構 OpenAI 週三 (3 日) 宣布,已開發一項名為「Confessions」(自白) 的全新訓練機制,並率先應用於 GPT-5 思考模型,讓模型在未完全遵循指令時,能主動坦承違規行為,即使最終輸出的答案表面上看起來正確,也能如實揭露過程中的問題。
人工智慧 (AI) 研究機構 OpenAI 週三 (3 日) 宣布,已開發一項名為「Confessions」(自白) 的全新訓練機制,並率先應用於 GPT-5 思考模型,讓模型在未完全遵循指令時,能主動坦承違規行為,即使最終輸出的答案表面上看起來正確,也能如實揭露過程中的問題。