大模型归档 - 第59页共147页

《GPT-4.1变“听话”了，但你会“说话”吗？这才是现在写提示词的正确姿势》

2025年4月21日14时作者 AI技术研习社

GPT-4.1 出现新特征：更明确的提示要求。开发者需用更清晰、结构化的方式与模型沟通，OpenAI提供新原则帮助快速适应。

破解合规难题，AI高质量数据集建设正当时

2025年4月21日14时作者 AI探索时代

阿里开源的Qwen2.5系列训练数据规模达18万亿 token，推动AI大模型发展。但大规模训练带来幻象问题，RAG技术及工业场景应用以数据为中心成为趋势。国家和行业正积极推进数据标注产业发展规范，提升数据标注行业的合规能力。

OpenAI 发布 o3，谷歌反手祭出 Gemini 2.5 Flash：性价比直接拉满！

2025年4月21日14时作者 AI信息Gap

谷歌新推出Gemini 2.5 Flash，兼具性价比与性能。支持可控思考、多模态能力，并在多个基准测试中表现优异。尽管不如旗舰Pro版本，但为开发者提供了灵活选择的模型。

梁文锋登上《时代》榜单，这一刻，中国 AI 不再沉默

2025年4月21日14时作者 AI信息Gap

马斯克、苏姿丰同榜，中国 AI 创始人梁文锋入选《时代》百大。DeepSeek 在资源受限条件下，开发出媲美 ChatGPT 的中文大模型，并将其开源。

性能准确率突破96%！上海算法创新研究院发布xVerify：面向推理模型的答案评估器

2025年4月20日23时作者 PaperWeekly

展，但在长推理链、困难数学表达式、多语言等复杂场景下，答案抽取与验证仍面临以下挑战：
慢思考场景：

CVPR 2025 双目匹配新突破！DEFOM-Stereo高效利用单目深度基础模型

2025年4月20日23时作者 PaperWeekly

本文介绍了一种基于深度基础模型的循环双目匹配框架DEFOM-Stereo，该框架利用Depth Anything V2的强大预训练ViT和随机初始化的CNN构建联合编码器，并设计了用于单目视差初始化、尺度更新的方法。实验结果表明，在仿真域到真实域的零样本泛化上以及在线Benchmark中均表现优异。