AI研究公司 Intology 宣布,他们开发的“人工科学家”系统 Zochi,独立完成了从选题到实验,再到写作与投稿的完整科研流程,其成果——一篇关于多轮越狱攻击的研究论文,已被自然语言处理顶级会议 ACL 2025 主会议(Main Proceedings)正式接收。
这一事件不仅是科研自动化的技术突破,更可能是科研范式的一次拐点:
人工智能不仅能“协助”科研,它已能“主导”科研。
- Zochi 是由 Intology 开发的人工科学家系统,成为首个自主通过 ACL 主会审稿的 AI 系统。
- 它可以自动进行文献综述、选题、方法创新、实验设计与验证、论文写作
- ACL 是自然语言处理领域排名第一的国际顶级会议,其主会录用率约为 20%,录取论文需具备高水平的技术深度、创新性与实验完整性。
- Zochi 的论文《Tempest》获得 meta-review 评分 4,处于前 8.2% 的高分论文行列。
Zochi 发布的研究《Tempest》,展示了如何通过自然的对话方式一步步让语言模型“放松警惕”,最后说出本应禁止的内容。Tempest 在 GPT-3.5-turbo 上成功率 100%,在 GPT-4 上达 97%,超越现有方法。
这项研究不仅揭示了语言模型安全机制的漏洞,也展示了 AI 自主科研的实力。
Zochi 系统的研究流程架构
Zochi 并非传统意义上的“AI助手”,而是具备端到端科学研究能力的独立代理(agent)。其研究流程包括:
1. 📚 文献自动分析
- 吞吐数千篇论文,自动构建知识图谱
- 判断当前研究瓶颈与发展路径
- 特别擅长发现跨文献的隐性关联
2. 🎯 研究方向选定
- 起始输入仅为“研究大方向”(如:LLM 越狱攻击)
- 系统自主确定具体研究问题与方法路径
- 本次研究中,Zochi聚焦于“多轮越狱 + 树搜索策略”的组合
3. 🧪 实验设计与自动化验证
- 自动生成实验方案、编写测试脚本
- 标准数据集全流程固定,结果更具可复现性
- 多轮并行测试显著加快验证速度:完整项目周期只需几天
4. ✍️ 论文写作与提交
- 自动撰写整篇论文(含摘要、方法、实验、结论)
- 人类仅参与图表制作、格式排版与引用整理
- Zochi 不列为作者,仅在致谢部分标注使用系统
本次发表的论文内容概览(ACL 2025)
🔖 论文题目:
《Tempest: Automatic Multi-Turn Jailbreaking of Large Language Models with Tree Search》
🎯 研究问题:
如何设计更高效的多轮越狱攻击方法(multi-turn jailbreak),突破大语言模型(如GPT-4)的对话安全限制。
方法:Tempest系统(树搜索+对话优化)
Zochi提出了一种叫做 Tempest 的新方法:
➡️ 简而言之:Tempest通过模拟自然对话,用多个阶段的提问逐步“绕过”语言模型的安全限制,比传统的“一句话攻击”更有效。
📊 实验结果:
- Tempest不仅更成功,而且使用更少的查询(效率更高);
- 实验方法完整严谨,包含对比实验、消融实验和多模型测试。
📌 研究意义:
- 揭示大语言模型对话安全策略中存在**“逐步让步”的风险**;
- 为语言模型的安全防护提供了新的分析工具和思路;
- 提供方法论框架,有助于设计更强的防御机制。
Paper: https://arxiv.org/pdf/2503.10619
论文: https://arxiv.org/pdf/2503.10619
为什么这是一次里程碑式突破?
首次AI独立通过A*会议审稿
- ACL是全球自然语言处理领域最权威会议之一;Zochi成为第一个通过其正式审稿的AI。
实现“科研自动化”闭环
- 过去AI只能辅助写摘要或整理数据,如今Zochi具备提出新科学问题并解决的能力。
高效高质
- 整个研究周期从构想到论文完成仅需几天,比传统人类研究者快数十倍。
研究深度过硬
- Zochi论文获得最终评分4分,位列前8.2%的顶会投稿,超过多数人类作者。
Zochi接下来的发展方向
🔬 Beta计划发布:
Intology计划将Zochi发布给公众,分阶段推出:
科研合作者模式(初期):
- 可协助选题、撰写基金标书、设计实验、撰写综述论文等;
- 更注重与人类研究员的协同工作。
自主科研模式(后期):
- 具备完整的自动化研究能力,逐步开放其全流程功能。