AI 界的“抄袭门”?SID 指控 Chroma 疑似“借鉴”技术,真相如何?

AI 界的“抄袭门”?SID 指控 Chroma 疑似“借鉴”技术,真相如何?

人工智能领域又迎来一场“重量级对决”,这次的主角是 AI 检索领域的两家公司:SIDChroma。事情的起因并不复杂,但后续发酵却火药味十足,一来一回间已然成了全网关注的焦点。

如果你还不知道发生了什么,这篇文章会带你理清事件脉络,同时聊聊背后代表的技术现状和行业现象。


问题核心:SID 指控 Chroma 抄袭研究成果

近日,AI 检索初创企业 SID 的 CEO Max Rumpf 在社交平台 X(原 Twitter)发布长文,公开指控开源向量数据库 Chroma 的 Context-1 模型涉嫌“大量借鉴” SID 的核心研究成果,并未给予任何引用或感谢。

事件回顾:交情还是套路?🤔

Max Rumpf 在他的发文中直接晒出了一系列关键邮件,这些内容揭露了两家公司之间的互动:

  1. 2025 年 10 月
    Chroma CEO Jeff Huber 曾主动联系 Rumpf,以套近乎的名义询问对方正在开发的模型细节。Rumpf不疑有他,回复称他们正在开发一种“智能体检索模型”,目标类似 Cognition 的 SWE-Grep——纽约时报曾称其为“AI 检索界的未来之星”。

  2. 2025 年 12 月
    SID 发布了备受瞩目的 SID-1 技术报告,详细阐述了其技术框架和研究成果。Rumpf 甚至主动将报告分享给 Huber,而后者简短回复了一个“恭喜”,此事看似无异议就此结束。

  3. 2026 年
    Chroma 突然推出了自家 Context-1 模型,这不仅让 SID 震惊,更重要的是,Context-1“撞脸”了 SID-1 的诸多技术细节,却始终未提及 SID 的任何贡献。


两大模型:SID-1 和 Context-1 的雷同点

Rumpf 在公开信中详细列举了 SID-1 和 Context-1 的多项相似点,包括但不限于以下几个方面:

  1. 技术框架的整体结构相似

    • 两者均为强化学习驱动的智能体检索模型
    • 定位高度一致:都针对前沿推理模型做检索子代理。
  2. 训练方式及成本优化路径一致

    • 使用 合成数据 进行训练。
    • 都宣称在成本与延迟方面达到了“帕累托最优”(效率与质量对比达到最佳平衡点)。
  3. 具体实现高度相似

    • 图表设计被指完全相同,比如速度/成本视图的双视图切换
    • 使用类似的技术手段如 4 路并行推理 配合 RRF(倒数排名融合) 进行聚合。