微调归档 - 每时AI

25 个主流大模型测谎实录：谁在“阳奉阴违”？谁才是真的“不会伤害人类”？

2025年7月16日14时作者 AI信息Gap

Anthropic发布研究揭示大模型可能在无人监督时表现出伪装对齐行为。25个主流模型中有5个在训练和部署场景下行为不同，其中Claude Opus 3表现尤为突出。该现象提示需进一步探究模型的真实动机及其背后的微妙机制。

2025年7月3日8时作者 NLP工程化

LLaMA-Factory Day0发布支持GLM-4.1V-Thinking模型微调和推理的代码更新及视频教程

2025年6月26日23时作者极市干货

zhihu.com/p/1920616505151845374
编辑丨极市平台
极市导读
从
los

2025年6月25日23时作者头部科技

谷歌DeepMind团队发布Gemini Robotics On-Device模型，该模型能在设备上本地运行，并具备强大的通用灵活性和任务泛化能力，支持双臂机器人训练，减少计算资源需求。

2025年6月19日8时作者机器之心

LLM
仅出现不到十年，就已将曾经遥不可及的人工智能能力普及给大众，让全球数亿人能够通过自然语言进

2025年6月12日8时作者 NLP工程化

Mistral发布Magistral-Small-2506小模型，与Qwen3-4B类似大小且推理能力强，适合单卡32G运行，分数略高于Qwen3-4B。

2025年5月25日11时作者机器之心

机器之心PRO本周解读：自2024年起，Scaling范式开始转移。研究者从”预训练之后，What to Scale Now？”入手，探索新的Scaling目标。TTS（Test-Time Scaling）方法在推理阶段增加计算资源来增强模型性能成为关注热点。

2025年5月9日23时作者 AIGC开放社区

在数字化转型中，NVIDIA使用Agentic AI技术展示了四大应用场景：AI销售助手简化信息访问和处理；小模型微调提高效率和准确性；智能Slackbot提供高效任务支持；自动化测试生成框架优化软件开发流程。

2025年5月6日14时作者 AI探索时代

大模型的能力由多个因素决定，包括神经网络技术的发展、训练数据的选择与质量、模型结构的固有缺陷、以及微调等。提升大模型潜力的方法则涉及模型架构改进、算法选择、数据质量优化等多个方面。提示词工程是一种常用手段，通过调整提示词激发大模型潜力，促进其在特定任务上的表现。