专注AI大模型可解释性的初创公司 Goodfire 在官网宣布,完成 5000 万美元的 A 轮融资,本轮融资由 Menlo Ventures 领投,Anthropic PBC、Lightspeed Venture Partners 等参与。
这距离该公司去年推出仅过去不到一年,且距其首次700万美元融资仅隔六个月。

总部位于旧金山的 Goodfire 推出了平台 Ember,旨在帮助开发者理解大模型的运行机制。大模型大量名为人工神经元的代码片段组成,传统上,识别哪些神经元参与处理特定提示及其交互方式是开发难点。
而通过 Ember,开发者输入提示后可映射出模型中参与处理的组件,这种可视化能力有广泛应用场景:当 大模型 生成不准确响应时,开发者能定位问题组件并禁用;还能识别易受提示注入攻击的组件并进行修复,提升模型安全性。

在模型定制方面,Ember 可帮助企业优化开源 大模型。例如开发客服聊天机器人时,可剔除无关组件以构建更高效的模型。开发者还能通过自然语言指令定制模型功能,如要求模型在响应中加入双关语,Ember 会自动定位并更新相关组件。此外,平台支持检索增强生成(RAG)技术集成,通过 “条件” 功能简化外部数据接入,并提供模型能力映射工具。
Goodfire还积极开源技术成果,其开发的稀疏自动编码器(SAE)可自动化解析神经网络内部结构。去年该公司为 Meta 的 Llama 3.3 70B 模型开发了 SAE,本月又开源了针对 DeepSeek R1 推理模型的两款 SAE,后者揭示了 R1 减少输出错误的具体步骤。
(文:AIGC开放社区)