月度归档: 2025 年 3 月
仅靠CPU也能跑DeepSeek、QwQ!浪潮信息发布全新方案,更懂中小企业的AI服务器来了
元脑CPU推理服务器在满足企业日常需求的同时大幅降低硬件成本与运维复杂度,助力中小企业便捷高效地使用AI技术提升业务效率。
统一细粒度感知!北大&阿里提出UFO:无需SAM,16个token让MLLM实现精准分割
本文介绍了一种名为UFO的方法,它能够通过开放式的语言界面实现分割和检测任务,无需额外解码器,利用多模态大模型的图像表征能力。
小米汽车首曝自动驾驶研究:相机和LiDAR联合重建框架Uni-Gaussians
论文提出Uni-Gaussians方法,利用高斯基元实现相机与激光雷达数据的联合重建。该方法在Waymo公开数据集上评估表现优异,能够准确模拟动态驾驶场景中的各种移动实体,并保持高质量渲染质量。
GPT-4.5刚出来就被攻破了?成功率破90%, MBZUAI团队出品
文章介绍了一篇关于对抗攻击的研究成果,该研究提出了一种新的方法M-Attack来提高对大型视觉语言模型的攻击成功率,并成功应用于多个商业模型中。
斯坦福HumanPlus:人形机器人实时控制与模仿学习的完美结合!
人形机器人通过斯坦福大学ALOHA团队开发的人形模仿框架HumanPlus实现了高效控制和模仿学习,为服务机器人、工业自动化、教育及医疗康复等领域提供了新工具。
OpenAI 发布新型音频模型,听起来比以往任何时候都更像人类
OpenAI发布了两款新的音频模型GPT-4o-transcribe和GPT-4o-mini-transcribe,旨在提升语音转文本的准确性,并引入可操控性文本转语音功能。此举为自然、直观的口语对话迈出了重要一步。
打造一个完全本地运行的多智能体图书写作系统
本文介绍了如何使用Agentic构建一个大规模抓取网页、编排工作流并生成20k单词书籍的工作流程,技术栈包括Bright Data、crewAIInc和Gemma 3等。
人形机器人“一家三口”组团游公园,傅利叶新型号“GR-3”或将亮相?
傅利叶智能展示了其最新的人形机器人在‘机器人游园会’上的表现。小尺寸的机器人因其便携性和能量效率成为教育等场景的重要载体,并在未来有望突破个性化服务、医疗辅助等领域。