一般是后触发审查。
当然也可以训练过程中加入特殊要求,某些敏感话题直接拒绝回答。
更多的情况是训练的时候不给他输入这类敏感数据,大模型就不知道怎么回答了。相当于你没教过他这个知识他就真不懂。
后触发是你问的问题大模型回答过程中调用审核功能,实时审查,触发敏感词就拦截撤回答案。
Please Login to reply.
这种看起来比较贴近