Anthropic 寄予厚望的女性:她在教 AI 什么是道德

这家科技巨头将一项重任交给了阿曼达·阿斯克尔:为旗下的聊天机器人Claude,塑造一套完整的是非观。

Anthropic 寄予厚望的女性:她在教 AI 什么是道德
作为 Anthropic 公司的常驻哲学家,阿曼达·阿斯克尔每天的工作,就是钻研Claude的推理逻辑,并不断与这个 AI 模型对话。

早在 14 岁那年,阿曼达·阿斯克尔就笃定自己将来要教哲学。只是当时的她无论如何也想不到,自己唯一的学生,竟然是一个叫作“Claude”的人工智能聊天机器人。

在 Anthropic 公司,阿斯克尔以常驻哲学家的身份,日复一日地观察Claude的思维模式。她通过与模型深度交流来构建它的个性,有时为了纠正一个逻辑偏差,她编写的提示词甚至超过 100 页。她的目标,是为Claude注入一种道德感——就像是赋予它一个“数字灵魂”,去引导它与人类每周进行的数百万次对话。

“这些模型身上确实存在某种‘类人’的特质,我认为承认这一点至关重要,”37 岁的阿斯克尔在 Anthropic 总部接受采访时说道。她坚信,“它们不可避免地会产生自我意识。”

她把自己的工作比作父母拉扯孩子。她一边训练Claude辨别善恶,一边为它注入独特的性格。她教它如何察言观色,引导它培养“情商”,好让它既不至于盛气凌人,也不会唯唯诺诺。或许最关键的一点在于,她正在帮助Claude建立自我认知,使其不至于轻易被恐吓、被操纵,或者被诱导去背离“友善且人道”的身份设定。简单来说,她的职责就是教导Claude如何做一个“好人”。