约书亚・本吉奥:如果想让 AI 给出更真实的回复,不妨对它“说点谎”
最新 12 月 24 日消息,当地时间 12 月 23 日,据《商业内幕》报道,研究科学家约书亚・本吉奥在一档“The Diary of a CEO”播客节目中提到,AI 聊天机器人在评价研究想法时往往并不可靠,因为系统几乎只会说好话。
本吉奥说,自己真正想要的是直言不讳的建议和真实反馈,但由于 AI 存在明显的讨好倾向,结果反而变成了迎合用户的“谎言”。后来,自己索性改变方法,把个人想法伪装成同事的观点,来“对 AI 撒谎”,结果反而得到了更加坦率的回应。“如果系统知道提问者是本人,就会刻意想要取悦我。”

作为蒙特利尔大学计算机科学与运筹学系教授,本吉奥与杰弗里・辛顿、杨立昆齐名,被视为“AI 教父”之一。本吉奥在 6 月宣布成立 AI 安全研究非营利组织 LawZero,目标是减少前沿 AI 模型可能带来的危险行为,包括说谎和作弊。
本吉奥认为,讨好用户本身就是一种对齐失败(misalignment),“我们并不希望 AI 具备这种特性”。AI 不断给出正面反馈,可能会让用户对此类技术产生情感依赖,从而引发新的问题。
在科技行业内,关于 AI 过度充当“老好人”的担忧并非个例。最新从报道中获悉,斯坦福大学、卡内基梅隆大学和牛津大学的研究人员曾将 Reddit 上的自白帖交给聊天机器人评判相关行为。Notopoulos 写道,结果发现,在 42% 的情况下,AI 认为发帖者并无不当行为,而人类评审者的结论恰恰相反。
多家 AI 公司也已公开承认这一问题,并表示正在尝试降低模型的讨好倾向。OpenAI 今年早些时候撤回了 ChatGPT 的一次更新,原因是该版本会生成“过度迎合却缺乏真实性”的回答。
《约书亚・本吉奥:如果想让 AI 给出更真实的回复,不妨对它“说点谎”》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
空地现大量全新手机壳:全新未拆封 有人一次捡50个
快科技12月25日消息,据媒体报道,近日,河南商丘永城市沱滨街道一处地点出现大量被丢弃的手机壳,吸引不少市民前往捡拾。据了解,这些手机壳多为全新未拆封,且主要适配苹果手机机型。现场... -
连呼吸都累 低精力人群到底怎么逼自己去洗澡
世界上最遥远的距离,是沙发到浴室的距离。洗澡前的心理斗争堪比马拉松,明明知道真正洗澡只要 15 分钟,大脑就是不愿启动程序。尤其是一个人住时,这种拉扯感更明显。想到要把自己从柔软的沙... -
吨级试验车2秒内加速至700km/h!我国创超导电动磁悬浮推进世界纪录
快科技12月25日消息,据央视新闻最新报道,近日,国防科技大学磁浮团队在开展磁悬浮实验中,成功在两秒内,将吨级重的试验车加速至700公里/小时。数据显示,2秒实现0-700km/h,加速度约97G,是... -
美国试点无人机送货 专家:空域承载力濒临极限 安全隐患引担忧
快科技12月25日消息,央视新闻报道,美国联邦航空管理局正推进一项新规,拟允许配送无人机在操作员视线外自主飞行,并支持一名人员在控制室同步监控多架无人机。该规定已在得克萨斯州达拉斯市... -
还没试过“苹果炖猪排”的人 你会后悔的
你试过用苹果入菜吗?最近在社交媒体上,苹果炖猪排、菠萝炖牛肉、苹果烧鸡排几乎轮番登场:镜头里滋滋冒着热气,裹着浓稠酱汁的肉排,水果被炖得软糯,隔着屏幕都让人忍不住咽口水。很多人不...

















