大模型
大语言模型
智能体的能力范围有限,在某些复杂场景下很难发挥其作用,因此最好的方式需要把人力与大模型的能力相结合——人机协同
最近发现智能体能力有限,尤其在复杂真实场景中存在边界理解、工具调用限制等问题。为弥补缺陷,建议人机协同模式:智能体负责快速自动化处理,人力负责最终决策和责任兜底。
Grok 4 实测全纪录:数学、写作、编程全拉垮,马斯克最强 AI 翻车了?
Grok 4发布引发争议,实测表现不佳。在数学推理和写作测试中多次出现错误,编程能力也未达到预期,对比其他模型存在明显差距。
再看文档古籍修复前沿方案:定位、预测、图像重建三阶段融合思路
2025年7月11日,北京晴。文章介绍了文档智能在历史文献修复中的应用,包括数据合成和三阶段模型(OCR辅助的损坏定位、损坏内容预测、历史外观恢复)。AutoHDR-Qwen2-1.5B等开源项目展示了这种方法的效果。
近期代表性开源大模型梳理:Decoder转Encoder-Decoder、多模型组合新趋势
近期开源了4个大模型:SmolLM3小模型、T5Gemma模型、NextCoder-32B模型和DeepSeek-TNG-R1T2-Chimera专家组合模型,文章介绍了这些模型的特点及模型合并方案,并推荐MergeKit库来执行模型合并。
企业级智能体开发中所遇到的问题以及解决方案
企业级智能体架构存在单智能体和多智能体两种模式。单智能体开发主要面临工具调用链路长、提示词过长及工具响应错误等问题,而多智能体开发则需解决不同智能体之间数据格式不一致及调度问题。总体而言,智能体开发理论简单但实现复杂。
马斯克 Grok 4 来了!史上最强、最贵、最敢说 AI?土耳其:已封杀!
马斯克在发布会上介绍了xAI的新模型Grok 4,表示它达到了博士水平。Grok 4分为标准版和Heavy版本,后者由四个智能体构成,适用于复杂任务。Grok 4的价格为300美元/月或3000美元/年,并且支持多种输入方式和API调用。