酷!字节、USC、斯坦福等开源的一个动态人体图像动画模型:X-Dyna
X-Dyna 是一个基于扩散模型的动态人体图像动画工具,能利用单张人像图片和驱动视频生成逼真的人物形象动画及表情、动作迁移等应用。
X-Dyna 是一个基于扩散模型的动态人体图像动画工具,能利用单张人像图片和驱动视频生成逼真的人物形象动画及表情、动作迁移等应用。
本文介绍了5个AI和机器学习相关项目及工具:s1用于测试时间缩放提高推理效率;R1-V通过强化学习提升视觉语言模型泛化能力与训练效率;deepseek.cpp是一个基于C++的CPU-only推理实现,旨在为DeepSeek大语言模型提供支持;Logic RL成功复现了DeepSeek R1 Zero逻辑难题数据集上的问题解决能力;OpenHealth则是一款本地运行的AI健康助手。
春节期间DeepSeek大放异彩,华为将其集成到智能手机,性能有待提升。对比官方应用和ChatGPT,其在道德伦理、逻辑数学方面表现一般,在中文写作任务中表现出色但口语化不足。上下文长度及回答准确性仍需优化。
John Schulman从OpenAI跳槽到Mira Murati的新创业公司,该公司的工作与AGI相关,并已吸引多名顶尖研究员和工程师。
跨境电商平台Temu和SHEIN等在利用美国‘最低限度’关税豁免规则快速扩张后,面临特朗普签署的新关税政策冲击。这些新政取消了之前的免税规则,对来自中国商品加征10%关税,并暂停了墨西哥和加拿大的订单。这导致卖家纷纷调价以应对新情况,Temu和SHEIN们需要展示自身的竞争力。
OpenAI 公开了其最新模型 O3-mini 系列的新功能,用户现在可以看到模型在解答井字棋问题过程中的详细推理步骤。但 OpenAI 仍保留了部分处理步骤来确保安全性与透明度平衡。
OpenAI公开了O3-mini的推理思维链,允许免费用户和付费用户查看。模型回答了一个关于为什么今天不是星期五的问题时展示了复杂的思考过程,并使用蔡勒公式进行了计算。此外,开发者还讨论了完整思维链对AI的理解和调试影响。
中国在生成式AI领域快速追赶美国,DeepSeek-R1开源模型发布引发市场波动。文章指出,尽管计算能力重要,但算法创新降低了训练成本,预计AI应用开发将带来巨大机遇。