护栏（Guardrails）

打个比方：你去保龄球馆。你是初学者，球经常跑偏，但球道两旁有防撞栏（保险杠）——球撞到栏就会弹回来，不会滚进沟里。偶尔你想挑战自己，也可以让工作人员把护栏降下来。

Guardrails 就是 AI 世界的保龄球护栏。它确保 AI 的行为在安全边界内，不会"滚进沟里"——比如删除重要文件、泄露隐私数据、执行恶意代码。

有时候 AI 拒绝做某件事，你觉得"它不听话"——其实不是，是护栏在工作。就像你让一个高度自律的人帮你撒谎，他不会答应。当你确实需要 AI 越界操作（如删除文件），你可能需要显式确认——这就是"人机协同"的意义：把护栏暂时降下来，但由你来盯着。