ICML2025|多模态理解与生成最新进展:港科联合SnapResearch发布ThinkDiff,为扩散模型装上大脑

多模态理解与生成新方法ThinkDiff在ICML2025上提出,仅需少量数据和计算资源,让扩散模型具备推理能力,并通过视觉-语言训练和掩码策略传递VLM的多模态推理能力,大幅提高图像生成质量。

深谋科技独家发布真正为人类服务的新一代人形机器人核心技术「声波传感 · 意念控制 · 高精视觉 · 类脑智能」

2025世界人工智能大会将举行,深谋科技亮相H3馆D710展位。深谋展示其面向新一代人形机器人的全栈自研技术布局,包括动态视觉伺服系统、六维力传感器等。

K2发布后,Kimi 研究员集体在X和知乎上搞起了“团建”

本文介绍了Kimi K2的发布过程及其背后的故事。文章描述了Kimi在知乎等社交媒体上进行了开放的技术分享,并通过内部工程师和研究员的讨论,让K2模型变得立体化。同时,Kimi团队还强调其公司的独特品味和文化氛围。最终,Kimi通过更透明的方式展示了自己,与整个技术社区建立了紧密联系。