DeepSeek今日连开3源!针对优化的并行策略,梁文锋本人参与开发

DeepSeek开源周第四天发布三项优化并行策略的技术成果,包括DualPipe、EPLB和Profiling Data。DualPipe是一种双向流水线并行算法,旨在减少计算与通信阶段的气泡;EPLB是MoE模型负载均衡器,确保计算资源平衡利用;Profiling Data提供了实际应用中的效果数据可视化支持。

速递|ElevenLabs发布独立语音检测模型,旨在精细化理解和转录语音

ElevenLabs筹集1.8亿美元支持其首个独立语音转文本模型Scribe,旨在与竞争对手如Gladia、Speechmatics等竞争。该模型在超过99种语言中表现优异,已在多家企业提供服务,并正进军语音检测领域。

摆脱编码器依赖!Encoder-free 3D多模态大模型,性能超越13B现有SOTA 上海AI Lab港中文等团队新作

无编码器3D LMM通过混合语义损失和层次几何聚合策略提升了对3D物体的理解,不仅克服了点云分辨率变化和嵌入语义差异的局限性,在Objaverse基准测试中性能优于现有SOTA模型。

Figure机器人进厂打工,8小时速成物流分拣大师!自研VLA模型全面升级

Figure公司通过自研VLA模型Helix,在8小时内训练完成机器人包裹分拣任务,并实现超越人类的效率和精度,展示了视觉-运动控制策略在物流场景中的巨大潜力。

语音合成也遵循Scaling Law,太乙真人“原声放送”讲解论文 港科大等开源

Llasa团队分享了他们基于Transformer的语音合成模型的研究成果,该模型展示了通过扩展计算资源来提高语音合成效果的能力。研究揭示了训练时间和推理时间扩展对性能的影响,并开源了代码和权重以供其他研究人员参考。

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

Figure的机器人通过改进后的Helix系统和视觉自体感觉模型,仅用30天便完成了从汽车工厂到物流中心的工作转型。技术升级让Figure走进工厂的速度更快了,该公司创始人表示未来四年将交付10万台人形机器人,并预计2025年成为机器人量产的关键之年。