月度归档: 2025 年 8 月
图灵奖得主Sutton再突破:强化学习在控制问题上媲美深度强化学习?
Sutton 提出的新算法 Swift-Sarsa 结合了时序差分学习 SwiftTD 的核心思想与 True Online Sarsa (λ),用于线性控制问题。实验表明,Swift-Sarsa 在操作性条件反射基准测试中的性能随元步长和初始步长参数的变化而变化,并且结合预处理方法后在复杂问题上可达到与深度强化学习算法相当的性能水平。
Qwen3-SmVL:基于Qwen3和SmolVLM拼接打造1 GB显存可跑的中文超小多模态大模型
觉编码器,通过特征对齐
+
指令微调构建的中文超小多模态大模型,
可在
1 GB
显存设备完成推理,
保姆级教程:眼睛一闭一睁,Coze开源版就部署好了
几天前开源 Coze Studio 需要4核8G硬件条件。火山引擎带来了 ECS 和豆包新模型 doubao-seed-1.6-thinking,部署方案独家开源,部署过程非常便捷。介绍开源版 Coze 的主要功能和优势,如能创建智能体、生成提示语等。
DeepSeek 论文夺冠,智谱开源 GLM-4.5,OpenAI 学习模式上线! AI Weekly 7.28-8.3
斩获 ACL 最佳论文
:梁文锋团队的原生稀疏注意力技术将长文本处理速度提升 11 倍,可支持百万
ACL’25最佳论文解读 大模型也会‘弹簧回弹’?揭秘 LLM 对齐的脆弱根源
分享ACl 2025最佳论文《Language Models Resist Alignment: Evidence From Data Compression》提出并量化了Elasticity概念,揭示语言模型具有“抗对齐”现象,即使轻微下游微调也会使模型迅速回弹至预训练分布。
国产LLM大爆发的一周,Hugging Face热榜被承包了!
这一周国产开源大型语言模型如火如荼,GLM-4.5、Qwen3等发布,覆盖视觉感知和复杂推理能力;阶跃星辰Step3及腾讯混元3D大模型也相继开源,推动人工智能技术迭代。
实测3060可跑!Flux官方最佳模型
Flux.1 Krea Dev 是由 BFL 与 Krea 合作开发的先进文本生成图像模型。黑森林称这是目前最好的开源权重 FLUX 模型,专为文本到图像生成而设计。文章展示了多幅图片,包括金发水手、红发人物、皇室风范者、猫耳少女和传统服饰女子等,背景信息丰富且细节生动。