Vision-R1:多模态领域的DeepSeek R1-Zero,7B参数比肩OpenAI O1

Vision-R1项目通过两阶段策略解决了多模态推理数据稀缺的问题,提出冷启动初始化和RL训练方案,并创新性地引入PTST策略和HFRRF奖励函数,显著提升了模型在多个数学推理基准测试中的表现。

重磅!谷歌开源Gemma-3模型:支持多模态、128K输入,27B版本在大模型匿名竞技场超过DeepSeeK V3,免费商用授权

Google开源第三代Gemma 3系列大模型,包含4个不同参数规模版本,支持多模态输入,并且表征能力非常强大。Gemma 3系列在多个评测中表现优秀,排名全球第9。

有关manus的思考:传统浏览器的回光返照!AGI应用到底将以什么形式出现?

一款名为 Manus 的泛任务 Agent 迅速走红,但批评者认为其技术创新有限。MCP 是 Anthropic 推出的开源协议,旨在充当 AI 与外部服务或数据之间的桥梁,为未来的互联网发展描绘了一幅新的蓝图。

大模型领域新书推荐!献给想要转型LLM应用开发的朋友

2025年,DeepSeek现象席卷全中国。文章探讨了AI时代开发者对大模型应用开发的需求与挑战,指出这一领域技术标准未定型且无序化。作者通过整理个人笔记,撰写了《探秘大模型应用开发》一书,帮助读者系统了解大模型开发知识。

与deepseek撞了个满怀!公众号连载文集《探秘大模型应用开发》出版了!

2025年初,DeepSeek大模型凭借超低训练成本和高推理能力迅速走红,并登顶全球苹果应用商店免费榜。然而,开发者们面对大模型开发还缺乏系统知识和最佳实践。《探秘大模型应用开发》一书通过整理归纳大量碎片化信息,帮助读者理解大模型技术,解答相关疑问。