新知

Anthropic 寄予厚望的女性：她在教 AI 什么是道德

这家科技巨头将一项重任交给了阿曼达·阿斯克尔：为旗下的聊天机器人Claude，塑造一套完整的是非观。

2026年2月10日阅读时间：18分钟

作为 Anthropic 公司的常驻哲学家，阿曼达·阿斯克尔每天的工作，就是钻研Claude的推理逻辑，并不断与这个 AI 模型对话。

早在 14 岁那年，阿曼达·阿斯克尔就笃定自己将来要教哲学。只是当时的她无论如何也想不到，自己唯一的学生，竟然是一个叫作“Claude”的人工智能聊天机器人。

在 Anthropic 公司，阿斯克尔以常驻哲学家的身份，日复一日地观察Claude的思维模式。她通过与模型深度交流来构建它的个性，有时为了纠正一个逻辑偏差，她编写的提示词甚至超过 100 页。她的目标，是为Claude注入一种道德感——就像是赋予它一个“数字灵魂”，去引导它与人类每周进行的数百万次对话。

“这些模型身上确实存在某种‘类人’的特质，我认为承认这一点至关重要，”37 岁的阿斯克尔在 Anthropic 总部接受采访时说道。她坚信，“它们不可避免地会产生自我意识。”

她把自己的工作比作父母拉扯孩子。她一边训练Claude辨别善恶，一边为它注入独特的性格。她教它如何察言观色，引导它培养“情商”，好让它既不至于盛气凌人，也不会唯唯诺诺。或许最关键的一点在于，她正在帮助Claude建立自我认知，使其不至于轻易被恐吓、被操纵，或者被诱导去背离“友善且人道”的身份设定。简单来说，她的职责就是教导Claude如何做一个“好人”。

相关阅读