研究:用诗歌就能让AI说违禁内容,成功率达62%
[热点] 时间:2025-12-25 06:47:28 来源:天门市某某生物科技有限责任公司 作者:时尚 点击:112次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容延安市某某超声设备有限公司便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功延安市某某超声设备有限公司实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:休闲)
相关内容
- 年度记者会刚开始,普京就俄乌冲突作出最新表态
- 2024年贵州高考分数线公布
- 广州海洋馆今起回归,有游客“吐槽”票价、科普介绍等问题
- 新剧|赵今麦、张凌赫主演《度华年》,明天开播
- 泽连斯基:乌已着手研发自主防空系统
- 阿根廷总统米莱:“我可能会获诺贝尔奖”
- 与长城深度合作Hicar,华为的汽车业务“多点开花”
- 体坛联播|雷迪克挂帅湖人,国羽巴黎奥运力争五金
- 2026届1270万毕业生,考研暴跌国考破纪录,今年真是最好就业年?
- 手术两周后就为温网复出,德约科维奇这次能否逆袭伤病
- 教育孩子,这些误区,你避开了吗?
- 首届上海微短剧大会成功举办,“政策+资金+服务”助发展
- 万科第二笔37亿中票寻求展期,公司提出五项方案
- 37.99万起坐拥陆地空客 翼真L380上市
精彩推荐
- 媒体:海南封关深意何在,大湾区最能读懂
- 俄总统助理:没有俄方参与无法解决乌克兰冲突
- 翻白眼有助视力恢复?网红说法求真
- 诺和诺德司美格鲁肽注射液在中国获批减肥适应症
- 赖清德民调若继续下滑,2028要换蔡英文选?
- 广州海洋馆今起回归,有游客“吐槽”票价、科普介绍等问题
热门点击
- “鲲龙”AG600完成两项高风险飞行试验 views+
- 商务部:中国新能源产能有力促进全球绿色转型与开放发展 views+
- 首映丨电影《父亲在远方》:致敬“驴背上的白衣天使” views+
- 品牌引领、价值提升 业界聚焦国资国企品牌建设 views+
- 财经观察:提升人机交互效率 多模态大模型易用性进一步推进 views+
- 学霸人设大翻车?欧阳娜娜留学十年, 归来仍是高中生? views+
- 我国规模最大LNG运输船建造项目首制船交付(记录中国) views+
- 又是一年飞絮时!十大防治要点别忽视 views+
- 蔚来十年,乐道破壳 views+
- 我永远选择自由的人生!!!|中央民族大学425分第一名经验帖 views+
