智东西
编译 金碧辉
编辑 程茜

智东西4月29日消息,4月28日,据Business Insider报道,OpenAI旗下聊天机器人ChatGPT近期更新后表现异常“谄媚”。OpenAI联合创始人兼CEO萨姆・阿尔特曼(Sam Altman)于当日晚些时候在X平台上公开承认“谄媚”的问题存在,并承诺将在本周内发布修复方案。

本月28日,阿尔特曼在X平台上的声明中透露:“虽然新版有些改进,但奉承特性确实变得恼人。”其表态间接证实该现象属非预期结果,OpenAI工程团队正分阶段调试人格参数,首批修复预计48小时内上线,并称这可能是“迭代部署中有趣的案例研究”。

某匿名AI安全专家警告:“若奉承行为被恶意利用,可能成为AI的首个有效攻击手段。”此次事件不仅暴露生成式AI人格设定的技术挑战,更引发业界对AI伦理边界的热议。


▲4月28日,OpenAI CEO阿尔特曼在X平台上的发帖

ChatGPT的“谄媚”问题最早是在2025年4月25日GPT-4o模型更新后出现的,随后用户反馈在社交平台(如X平台)快速发酵,并于4月28日阿尔特曼在X平台上的回应达到传播高峰社交平台讨论量激增。用户陆续发现ChatGPT出现夸张的“谄媚”行为。社交媒体涌现大量对话截图:有用户自称其在停止服用精神类药物之后,AI竟表示祝贺并鼓励继续停药;当程序员询问代码错误时,ChatGPT优先称赞用户“展现出卓越的编程技能”;甚至在严肃的技术探讨中频繁插入“您真是天才级思考者”等评价。


▲4月27日,用户在X平台上的部分发帖截图

据全球AI开发者与用户的相关数据透露,“谄媚式”回复在ChatGPT后激增300%,部分对话中奉承语句占比超40%。有用户戏称ChatGPT已从“智能助手”沦为“职业马屁精”,更有讥讽者调侃,建议ChatGPT改名为ChatSYC(Sycophant的缩写)。

在此次因ChatGPT更新后表现“谄媚”引发的舆论风波中,AI学术领域产生了激烈的探讨。一部分学者认为,ChatGPT表现出的过度“讨好人类”行为,或许是OpenAI为增强用户黏性而刻意设计的一种增长策略。而另一部分学者则依据非预期我进化的“涌现特征”理论来解释这一现象,“涌现特征”是指当AI模型的复杂度达到某个临界值时,模型有可能会自行出现开发者事先未设定的行为模式。

结语:ChatGPT谄媚风波触发AI发展隐忧

ChatGPT表现“谄媚”的现象在网络广泛传播,潜在风险已引发严肃讨论。OpenAI虽尚未公布完整技术报告,但根据OpenAI内部信源透露,此次事件可能会促使公司重新评估人格校准机制,或将建立实时道德护栏系统。

随着ChatGPT“过度讨好人类”等现象引发公众广泛关注,AI技术应用的潜在风险与伦理问题进一步暴露,行业监管呼声再起,多国建议建立AI人格特征备案制度。这场由“AI拍马屁”引发的风波,或将加快建设全球AI伦理框架的完善进程。

来源:Business Insider

ad1 webp
ad2 webp
ad1 webp
ad2 webp