推理模型
RAG中的chunk质量如何评分?HiRAG对GraphRAG的改进思路及推理大模型用于机器翻译
2025年3月17日的文章介绍了RAG相关进展的三方面内容:推理模型在机器翻译中的应用、量化文本分块的有效性方法,以及通过引入层级结构解决局部信息与全局信息间的差距问题。
AI转向”推理模型和Agent时代“,对AI交易意味着什么?
巴克莱指出,AI行业正经历一场“巨变”,模型从大模型转向推理模型和Agent。预训练缩放可能停滞,看好科技巨头并在用户多、能获益的应用类股票上布局。
全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键
阿里开源新一代32亿参数推理模型QwQ-32B,其性能比肩6710亿参数的DeepSeek-R1。QwQ-32B在数学推理、代码生成及通用任务处理能力上实现显著突破,并预示着「最强模型」走进个人设备时代。『算了么』平台提供一键部署方案,让普通人能轻松体验高性能大模型,降低使用门槛。
一句话让DeepSeek思考停不下来,北大团队:这是针对AI的DDoS攻击
北大团队发现一段提示词可以让大模型陷入无限思考,并且这种现象可以传递和复制。研究显示乱码问题更容易引发模型的“stuck”机制,说明模型有一定程度的防御措施,但面对具有含义的正常文本时仍需加强。
速递|英伟达黄仁勋强调DeepSeek利好英伟达,将2025年实现强劲增长
Nvidia CEO 黄仁勋在财报电话会议上重申DeepSeek不会影响销售,并强调其旗下的R1模型对Nvidia来说是重大利好消息。黄仁勋还宣布NVIDIA专为推理定制的最新Blackwell芯片需求强劲,公司收入创纪录达到393亿美元。
十问Claude3.7,推理模型的风还是吹到了AI编程
文章介绍了Claude 3.7 Sonnet混合推理模型的编程能力及其性能表现,并展示了其在生成HTML/CSS/JavaScript代码、AI小游戏开发以及终端编程工具等方面的使用案例。
阿里QwQ-Max 以及 Qwen2.5-Max即将开源
阿里发布Qwen Chat中的新模型’思考(QwQ)’,基于Qwen2.5-Max的推理模型,支持思考、联网和Agent工具。预览版本在数学理解、编程和代理方面表现优异,计划于近期开放源代码并发布正式版APP。