AI 界的“抄袭门”?SID 指控 Chroma 疑似“借鉴”技术,真相如何?
人工智能领域又迎来一场“重量级对决”,这次的主角是 AI 检索领域的两家公司:SID 和 Chroma。事情的起因并不复杂,但后续发酵却火药味十足,一来一回间已然成了全网关注的焦点。
如果你还不知道发生了什么,这篇文章会带你理清事件脉络,同时聊聊背后代表的技术现状和行业现象。
问题核心:SID 指控 Chroma 抄袭研究成果
近日,AI 检索初创企业 SID 的 CEO Max Rumpf 在社交平台 X(原 Twitter)发布长文,公开指控开源向量数据库 Chroma 的 Context-1 模型涉嫌“大量借鉴” SID 的核心研究成果,并未给予任何引用或感谢。
事件回顾:交情还是套路?🤔
Max Rumpf 在他的发文中直接晒出了一系列关键邮件,这些内容揭露了两家公司之间的互动:
-
2025 年 10 月:
Chroma CEO Jeff Huber 曾主动联系 Rumpf,以套近乎的名义询问对方正在开发的模型细节。Rumpf不疑有他,回复称他们正在开发一种“智能体检索模型”,目标类似 Cognition 的 SWE-Grep——纽约时报曾称其为“AI 检索界的未来之星”。 -
2025 年 12 月:
SID 发布了备受瞩目的 SID-1 技术报告,详细阐述了其技术框架和研究成果。Rumpf 甚至主动将报告分享给 Huber,而后者简短回复了一个“恭喜”,此事看似无异议就此结束。 -
2026 年:
Chroma 突然推出了自家 Context-1 模型,这不仅让 SID 震惊,更重要的是,Context-1“撞脸”了 SID-1 的诸多技术细节,却始终未提及 SID 的任何贡献。
两大模型:SID-1 和 Context-1 的雷同点
Rumpf 在公开信中详细列举了 SID-1 和 Context-1 的多项相似点,包括但不限于以下几个方面:
-
技术框架的整体结构相似:
- 两者均为强化学习驱动的智能体检索模型。
- 定位高度一致:都针对前沿推理模型做检索子代理。
-
训练方式及成本优化路径一致:
- 使用 合成数据 进行训练。
- 都宣称在成本与延迟方面达到了“帕累托最优”(效率与质量对比达到最佳平衡点)。
-
具体实现高度相似:
- 图表设计被指完全相同,比如速度/成本视图的双视图切换。
- 使用类似的技术手段如 4 路并行推理 配合 RRF(倒数排名融合) 进行聚合。
登录后可查看完整内容,参与讨论!
立即登录