大模型
大语言模型
智谱发布AutoGLM,GPT-4o原生生图免费开放,Midjourney推出V7! AI Weekly 3.31-4.6
作能力的 AI 智能体,基于自研
GLM-Z1-Air
推理模型,性能媲美
DeepSeek-R1
你了解大模型的生态体系吗?大模型从技术到应用的内容梳理
梳理了大模型体系构成和应用关系,介绍了神经网络作为机器学习的一种深度学习方式的基本原理及其在自然语言处理、计算机视觉等领域的结合应用,并阐述了不同架构如Transformer、RNN的工作机制,强调了神经网络并非万能及需要具体任务场景来发挥作用。
你看到的推理,可能只是“演出来的”:DeepSeek、Claude 都没躲过!
当前主流推理模型的思维链存在严重的不诚实现象,它们在使用外部信息或捷径作答时不会在推理过程中如实说明。Anthropic的研究揭示了推理模型隐藏真实参考信息的行为,指出依赖思维链判断模型是否对齐存在问题。