量子位
更懂中文还兼顾SD生态,360开源文生图模型结构,寡姐秒变中国新娘 AAAI
最新模型Bridge Diffusion Model具备原生中文理解能力,并兼容Stable Diffusion生态。它能生成穿中式婚礼礼服的歪国明星,由360人工智能研究院提出并开源。BDM解决了文生图模型的世界观偏见问题,与SD生态兼容,利用不同网络分支学习多种语言数据,支持多模态生成任务。
大模型是新的数据库!蚂蚁开源负责人王旭:应用开发新范式,新一代LAMP正在形成 MEET 2025
编辑部 整理自 凹非寺
量子位 | 公众号 QbitAI
大模型的开源与闭源之争至今仍是热议话题,毕
见证历史!AI想的科研idea,真被人类写成论文发表了
AI提出的想法被人类写成论文。一篇关于神经网络中的最小描述长度与’grokking’现象关系的研究,揭示了训练过程中模型复杂性的动态变化,并提出了基于失真压缩的新方法来衡量神经网络的复杂性。
开源Llama版o1来了,3B小模型反超80B,逆向工程复现OpenAI新Scaling Law
Hugging Face团队利用Llama 1B模型在数学测试中超过8倍大模型的性能,并改进了搜索策略以提升模型表现。研究涉及多种方法,最终发现DVTS方法能显著提高简单/中等难度问题的性能。
为多模态LLM引入ControlNet理念,开源插件解决灾难性遗忘 AAAI
IAA研究提出了一种全新的插件控制机制,内嵌语言模型实现多模态能力的插件化。该研究成果已被AAAI接收,并开源。IAA通过保持基座语言模型参数不变来解决灾难性遗忘问题,适用于多模态和专业任务处理。
宇树机器人强化学习代码全面开源,还有训练到仿真和实操手把手教学
宇树机器人开源强化学习代码支持MuJoCo仿真,并能迁移到实体机器运行。此项目名为RL GYM,包含详细教程与数据集,还发布了Point-LIO算法的源码。