Qwen
阿里QwQ-Max 以及 Qwen2.5-Max即将开源
阿里发布Qwen Chat中的新模型’思考(QwQ)’,基于Qwen2.5-Max的推理模型,支持思考、联网和Agent工具。预览版本在数学理解、编程和代理方面表现优异,计划于近期开放源代码并发布正式版APP。
阿里 Qwen Chat 平台上线“深度思考”功能了
阿里Qwen团队在Qwen Chat平台上线了‘深度思考(QwQ)’功能,该模型基于Qwen2.5-Max构建,具备多模态推理能力,涵盖数学理解、编程和AI智能体领域。通过联网搜索与思维链展示结合的模式,重新定义AI的’思考’方式。
Claude 3.7、QwQ-Max-Preview等推理大模型发布跟踪:兼看大模型逻辑推理技术总结及几点思考
近日推理大模型相关前沿回顾包括Claude 3.7的发布,Qwen的QwQ模型开源,FlashMLA的开源及PaliGemma 2 Mix模型的开源。文章还总结了大模型逻辑推理技术,并提出了一些值得思考的问题。
大模型轻量化系列解读 (八):降低 LLM 中因 Activation Spikes 导致的量化误差
型语言模型在后训练量化时面临的激活量化挑战,发现GLU激活中的“激活尖峰”会导致显著的量化误差。为此
一个基于工作流 workflow 的低代码平台:Flock
基于LangChain和LangGraph构建的解决方案,提供持久化对话、可观察性等功能,适用于快速构建聊天机器人和RAG应用。亮点包括工具调用、检索增强生成及人机协作等特性。
微软开源OmniParser V2,直接将DeepSeek-R1变成使用电脑的 AI Agents~
微软发布OmniParser V2,一款开源屏幕解析工具,能够将任何LLM变成能操作计算机的Agent,并包含改进后的数据集和模型,实现更低延迟和更高准确率。