日期: 2025 年 3 月 19 日
英伟达全力发展AI Agent!开源专属大模型,最强AI工厂
英伟达在GTC 2025大会上发布专用于AI Agent的Llama Nemotron模型,并推出了性能更强的Blackwell Ultra AI工厂。
AMD开源30亿小参数模型,媲美Qwen-2.5
AMD开源了最新小参数模型Instella-3B及其微调版本。该模型性能超越Llama-3.2-3B和Gemma-2-2B,并在多个基准测试中表现优异。
无需百卡集群!港科等开源LightGen: 极低成本文生图方案媲美SOTA模型
LightGen 是由香港科技大学 Harry Yang 教授团队联合 Everlyn AI 和 UCF 提出的一种新型高效图像生成模型,旨在解决主流生成模型依赖大量数据和计算资源的问题。论文提出通过知识蒸馏和直接偏好优化策略,在有限的数据和计算资源下实现了高质量图像的生成,并在多个实验中展示了与 SOTA 模型相当甚至超过的性能表现。
焱融YRCloudFile发布面向AI推理的分布式KV Cache特性
专注于AIGC领域的专业社区报道了焱融科技YRCloudFile支持大模型推理场景的KVCache特性,显著提升推理性能和效率。