月度归档: 2025 年 2 月
ICLR 2025|高达 128 倍下采样的 Autoencoder!DC-AE:高效加速高分辨率扩散模型
utoencoder,以加速高分辨率扩散模型
。
>>
加入极市CV技术交流群,走在计算机视觉的最前
机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA
ByteDance Research团队提出WMP(World Model-based Perception),通过模拟训练世界模型和策略,实现在多种复杂地形上的出色控制表现。
GPT还是DeepSeek?不如全都要!南洋理工、IDEA等提出首个多智能体系统LLM Routing框架
和 Agent 的局限性。受到人类团队分工协作的启发,将多个 LLM 驱动的智能体组合成一个团队,
AudioSourceRE 更新DeMIX Pro,新AI模型重新定义语音分离
AudioSourceRE 发布了DeMIX Pro v6.1更新,引入了强大的语音分离模块和增强的残余音轨处理,为音乐、广播和电影制作带来了新的可能性,包括从歌曲中移除说唱。
提前退休!我用联网版Grok3对狙DeepSeek,OpenAI的Deep Research要凉了
天把Grok3免费了。这操作 OpenAI 估计学半年都学不会。
而且因为Grok3 Deep Se
最低调「六小虎」阶跃星辰开年首秀:Agent落地智能终端,印奇也来了
阶跃星辰在2025年生态开放日上回应DeepSeek,宣布开源两款多模态模型,并提出AGI的下一个阶段应为多模态推理及AI Agent。
那么多接入 DeepSeek 的,终于有一家支持 Function Call 了!!!
DeepSeek R1 最近上线支持 Function Call 版本。通过标准化接口调用外部工具和服务,扩展大模型能力边界。特工们发现扣子上线了这一功能,并基于 Claude 生成演示动画解释 Function Call 原理及其价值。Function Call 对 LLM 来说有三大价值:认知基座、外部信息补充和规约。特工小鹏提到清华系开源智能体框架 Eko在 Function Call 上的应用灵活性,强调 R1 在类似框架下具备强能力潜力。模型可以自主判断是否调用插件以及调用哪个插件,并能处理复杂需求。不过,存在偶发问题需要改进。