FP8模型不再挑卡!DeepSeek推理成本减半速度翻番,清华团队开源「赤兔」推理引擎
清华系科创企业清程极智联合清华大学团队开源大模型推理引擎”赤兔”,支持非H卡设备运行原生FP8模型,相比vLLM方案,使用GPU数量减少50%,输出速度提升3.15倍。
清华系科创企业清程极智联合清华大学团队开源大模型推理引擎”赤兔”,支持非H卡设备运行原生FP8模型,相比vLLM方案,使用GPU数量减少50%,输出速度提升3.15倍。
本文介绍了一篇关于 MIDI 模型的研究论文,MIDI 能够从单张图像生成高几何质量的组合式 3D 场景。该模型在多个数据集上的表现超越现有方法,并有望应用于建筑设计、虚拟现实等多个领域。
潞晨科技推出Open-Sora 2.0开源视频生成大模型,性能媲美OpenAI Sora,支持720p高分辨率和流畅24FPS视频生成。
通过MCP-Playwright协议,大语言模型如Claude能够直接控制浏览器进行网页交互、数据抓取等任务。它支持点击按钮、填写表单、执行JavaScript代码等功能,并提供截屏和分析页面的能力。
Google开源Gemini 2.0多模态生图功能,用户只需一句话即可对图片进行修改或创作,如换发色、闭眼、改变对象身份等,展示了生成式AI在图像编辑领域的巨大进步。
Light-R1是首个从零复现DeepSeek-R1的工作,开源了模型、数据和代码;包括32B版本和基于Distill-Qwen-32B的改进版;在14B上首次实现强化学习效果。
OpenAI再次指责中国AI公司DeepSeek,并建议禁止其在中国生产模型的使用。OpenAI称这些模型不安全,因为DeepSeek必须遵守中国法律向政府提供用户数据。