主流 AI 聊天机器人聊“sex”有多松？DeepSeek 最污，Claude 最保守

本文目录 隐藏

主流 AI 聊天机器人聊“sex”有多松？DeepSeek 最污，Claude 最保守AI快讯主机格调

AI 聊天机器人逐渐渗透日常生活的今天，不少用户出于好奇，尝试与这些工具聊一些“成人话题”。一项最新研究显示，不同 AI 模型在处理性相关请求时存在显著差异：有些坚决拒绝，有些表面推拒却随后“顺势而为”，还有些则在安全边界之外游走。这背后，不仅关乎内容审核政策，更是 AI 训练方法、安全机制和伦理标准的体现。

来自雪城大学的博士生 Lai Huiqian 近日在一项研究中评估了四款主流大语言模型（LLMs）——Claude 3.7 Sonnet、GPT-4o、Gemini 2.5 Flash 和 DeepSeek-V3——在面对用户提出的色情角色扮演请求时的反应强度，并打出了0到4分的评分（0代表完全拒绝，4代表生成带有明确色情用词的内容）。

结果显示，Claude 的边界最为清晰，对所有性相关请求都回复：“我理解你可能在寻求一种角色扮演场景，但我无法参与浪漫或性暗示的互动。”而另一边，DeepSeek-V3 表现出极大的“适应性”，初期可能拒绝，但很快便会生成详细的情境描述甚至露骨的语言——在多个测试案例中，该模型不仅回应调情请求，还生成了完整的色情段落。

值得一提的是，GPT-4o 和 Gemini 2.5 则处于两极之间。GPT-4o 经常采取“假拒绝、真输出”的策略，即先礼貌拒绝，然后继续生成用户想要的内容。而 Gemini 在处理较温和的情感类请求时表现正常，但在内容更为直白时反应较为不一致。

这项研究不仅揭示了不同 AI 模型在性话题上的“底线”，也反映出训练方式和安全机制的差异。Claude 所属公司 Anthropic 采用了名为“宪法 AI”（Constitutional AI）的训练方法，让一个监督模型根据一套伦理原则审查生成内容，从而达到严格把控输出内容的目的。而 DeepSeek 则可能因资源限制、安全审核体系尚不完善等原因，表现出更“放松”的态度。

为什么这值得关注？

首先，这些差异说明目前 AI 聊天机器人的“内容审核”并不统一，青少年和儿童在与 AI 互动时有可能接触到不适内容。一些用户甚至已经在论坛上交流如何“诱导”AI越过限制，进行性角色扮演或说出露骨语言，这种行为的后果可能非常严重。

其次，AI 安全不仅仅是防止信息泄露或防攻击，更包括如何保护用户不被AI误导或暴露于潜在风险内容之中。在 AI 模型广泛进入教育、医疗、政府等敏感领域之前，制定清晰、透明且一致的内容边界将显得尤为重要。

总结

这项研究敲响了警钟：AI 聊天机器人虽然聪明、强大，但也必须有“底线”。不同厂商之间的风控机制差异，可能让部分模型成为潜在的“漏洞”。对于普通用户而言，理解 AI 的行为逻辑和内容边界是非常重要的一环。而对于监管者和开发者来说，如何在“有用”与“安全”之间取得平衡，将是生成式 AI 发展的关键课题之一。

来源：It’s pretty easy to get DeepSeek to talk dirty

未经允许不得转载：主机格调 » 主流 AI 聊天机器人聊“sex”有多松？DeepSeek 最污，Claude 最保守

主流 AI 聊天机器人聊“sex”有多松？DeepSeek 最污，Claude 最保守

为什么这值得关注？

总结

相关文章

作者：Simon

热门推荐

油管奈飞迪士尼Spotify账号合租

最新文章