月度归档: 2025 年 3 月
IBM 悄无声息的发布了 granite-3.2-8b 开源模型
Granite-3.2-8B-Instruct-Preview 是一款早期发布的 8B 长上下文模型,专为增强推理能力而进行微调,基于 Granite-3.1-8B-Instruct 构建,并使用开放许可开源数据集和合成数据训练。
SkyPilot:在任何基础设施(K8S 或 14+ 云平台)上运行 AI 和批处理作业
SkyPilot:一个统一平台,能在Kubernetes或多种云平台上运行AI和批处理作业,提供简洁界面、统一管理及优化成本等特性。
让文档更“聪明”!通义实验室ViDoRAG:开启视觉文档智能处理新纪元!
ViDoRAG 是一款专注于视觉文档的开源 RAG 系统,由阿里巴巴通义实验室联合中科大、上海交大推出。它通过多模态混合检索和多智能体迭代推理解决传统 RAG 方法在处理复杂视觉文档时的信息关联性不足和推理能力有限等问题。
耶鲁、剑桥等高校联合推出 MindLLM 医疗行业 AI 工具了
人工智能工具MindLLM能将fMRI数据转化为自然语言文本,显著提升脑科学研究水平,但引发隐私保护、责任归属及伦理道德等多方面问题。
微信公众号智能发布工具TrendPublish
TrendPublish是基于AI的趋势发现和发布系统,支持多源数据采集、智能内容总结和自动发布到微信公众号。通过Bark通知系统确保内容及时触达粉丝,提高运营效率。
ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景
AIxiv专栏分享了一项名为AVD2的研究成果,旨在提升自动驾驶系统对事故场景的理解。通过生成与自然语言描述一致的事故视频并结合多任务学习技术,AVD2增强了事故分析能力,并提出了一个新的数据集EMM-AU来推动相关研究。
中科院、百度提出新架构:突破参数限制,实现高效推理
专注于AIGC领域,讨论微软&OpenAI、百度文心一言等大语言模型的发展与应用。提出Inner Thinking Transformer架构(ITT),通过动态分配计算资源和思考步骤提升模型性能而不增加参数,显著优于基线模型。