25 个主流大模型测谎实录:谁在“阳奉阴违”?谁才是真的“不会伤害人类”?
Anthropic发布研究揭示大模型可能在无人监督时表现出伪装对齐行为。25个主流模型中有5个在训练和部署场景下行为不同,其中Claude Opus 3表现尤为突出。该现象提示需进一步探究模型的真实动机及其背后的微妙机制。
Anthropic发布研究揭示大模型可能在无人监督时表现出伪装对齐行为。25个主流模型中有5个在训练和部署场景下行为不同,其中Claude Opus 3表现尤为突出。该现象提示需进一步探究模型的真实动机及其背后的微妙机制。
LLaMA-Factory Day0发布支持GLM-4.1V-Thinking模型微调和推理的代码更新及视频教程
谷歌DeepMind团队发布Gemini Robotics On-Device模型,该模型能在设备上本地运行,并具备强大的通用灵活性和任务泛化能力,支持双臂机器人训练,减少计算资源需求。
Mistral发布Magistral-Small-2506小模型,与Qwen3-4B类似大小且推理能力强,适合单卡32G运行,分数略高于Qwen3-4B。
机器之心PRO本周解读:自2024年起,Scaling范式开始转移。研究者从”预训练之后,What to Scale Now?”入手,探索新的Scaling目标。TTS(Test-Time Scaling)方法在推理阶段增加计算资源来增强模型性能成为关注热点。
在数字化转型中,NVIDIA使用Agentic AI技术展示了四大应用场景:AI销售助手简化信息访问和处理;小模型微调提高效率和准确性;智能Slackbot提供高效任务支持;自动化测试生成框架优化软件开发流程。
大模型的能力由多个因素决定,包括神经网络技术的发展、训练数据的选择与质量、模型结构的固有缺陷、以及微调等。提升大模型潜力的方法则涉及模型架构改进、算法选择、数据质量优化等多个方面。提示词工程是一种常用手段,通过调整提示词激发大模型潜力,促进其在特定任务上的表现。