2025年3月4日8时 - 第10页共11页

IBM 悄无声息的发布了 granite-3.2-8b 开源模型

2025年3月4日8时作者 NLP工程化

Granite-3.2-8B-Instruct-Preview 是一款早期发布的 8B 长上下文模型，专为增强推理能力而进行微调，基于 Granite-3.1-8B-Instruct 构建，并使用开放许可开源数据集和合成数据训练。

2025年3月4日8时作者 NLP工程化

SkyPilot：一个统一平台，能在Kubernetes或多种云平台上运行AI和批处理作业，提供简洁界面、统一管理及优化成本等特性。

2025年3月4日8时作者 NLP工程化

使用 SGLang + SkyPilot 实现高吞吐量 DeepSeek-R1 服务的教程介绍分享。

2025年3月4日8时作者开源星探

ViDoRAG 是一款专注于视觉文档的开源 RAG 系统，由阿里巴巴通义实验室联合中科大、上海交大推出。它通过多模态混合检索和多智能体迭代推理解决传统 RAG 方法在处理复杂视觉文档时的信息关联性不足和推理能力有限等问题。

2025年3月4日8时作者 GitHubStore

TrendPublish是基于AI的趋势发现和发布系统，支持多源数据采集、智能内容总结和自动发布到微信公众号。通过Bark通知系统确保内容及时触达粉丝，提高运营效率。

2025年3月4日8时作者机器之心

AIxiv专栏分享了一项名为AVD2的研究成果，旨在提升自动驾驶系统对事故场景的理解。通过生成与自然语言描述一致的事故视频并结合多任务学习技术，AVD2增强了事故分析能力，并提出了一个新的数据集EMM-AU来推动相关研究。

2025年3月4日8时作者机器之心

DeepSeek R1 正在对整个科技领域产生巨大影响，颠覆人们有关 AI 的认知。在移动端，革新

2025年3月4日8时作者 AIGC开放社区

专注于AIGC领域，讨论微软&OpenAI、百度文心一言等大语言模型的发展与应用。提出Inner Thinking Transformer架构（ITT），通过动态分配计算资源和思考步骤提升模型性能而不增加参数，显著优于基线模型。

2025年3月4日8时作者机器之心

研究者提出了一种多元推理方法，结合多种模型和方法来提高推理模型在复杂基准上的准确率。该方法通过交互式定理证明器、代码自动验证和 best-of-N 算法等技术，显著提升了 IMO 组合问题和 ARC 谜题的解决能力，并解决了大量人类无法解答的问题。