DeepSeek一口气开源3个项目,还有梁文锋亲自参与,昨晚API大降价
DeepSeek 发布了DualPipe和EPLB两个新工具以及训练和推理框架的分析数据,旨在帮助社区更好地理解通信-计算重叠策略和底层实现细节。
DeepSeek 发布了DualPipe和EPLB两个新工具以及训练和推理框架的分析数据,旨在帮助社区更好地理解通信-计算重叠策略和底层实现细节。
首个商业级扩散大型语言模型Mercury发布,每秒生成超过1000个token,性能和效率显著提升。相比现有自回归LLM,其速度提高了5到10倍,同时保持了高精度。
CVPR 2025 共收到 13008 篇有效论文,最终录取 2878 篇(接收率 22.1%),创历史新低。部分审稿人被发现不负责任并拒收 19 篇论文,引发讨论。
OpenAI 发布了对 Deep Research 模型的最新准备度框架评估,将其评级为中等风险。模型在网络安全方面被评为中等风险,并展示了缓解后的 Deep Research 模型在多种任务上的表现。
MIT团队提出的新算法Diffusion Forcing Transformer(DFoT)让视频扩散模型生成了比之前长近50倍、上千帧的长视频,论文介绍了历史引导算法及其在不同数据集上的效果。