微软上线两款新模型:增强RAG和AI Agent

微软在官网宣布上线了Cohere的Embed 4和Command A两款新模型,主要用于增强RAG以及AI Agent。Embed 4是一个多模态嵌入模型,支持超过100种语言。Command A是Cohere最新发布的旗舰大模型,专为企业场景中的高性能文本生成而设计。

这本书为啥全网都在追?我看了3页就明白了!

Sebastian Raschka 的《从零构建大模型》是一本帮助读者理解并实战大模型开发的书。通过直接、清晰的教学方式,本书涵盖了从数据准备到模型部署的全流程,适合Python基础和普通笔记本硬件条件的开发者。

通俗易懂地说说DeepSeek的原理

DeepSeek 是一款在 AI 领域表现卓越的语言模型,它不仅性能超越 OpenAI 的 ChatGPT,在 App Store 下载排行榜中位居第一。其训练过程包括预训练和后训练两阶段,通过预测互联网文本数据中的下一个 Token 来学习语言规律,并采用指令微调和基于人类反馈的强化学习进行后训练优化。

NeurIPS 2024 让大语言模型使用代码解决图分析推理任务

本文提出了一种通过编程来提升大模型解决图分析推理任务能力的方法,并展示了在开源和闭源模型上进行实验的结果,使用新的基准数据集ProGraph验证了这一方法的有效性。