推理层归档 - 每时AI

QWQ-32B推理模型的魔改版本

2025年3月20日8时作者 NLP工程化

Qwen2.5-QwQ-37B-Eureka-Triple-Cubed 是一个增强版的AI模型，专注于推理和思考能力。它采用了’Triple Cubed’方法，支持128K上下文，并适用于多种任务如科学研究、创意写作等，具有高温度推理支持和性能优化等特点。

扩展测试时计算是万能的吗？Scaling What成为关键

2024年11月17日16时作者每时AI

近日，The Information 报道引发关于大模型 Scaling Laws 是否达到极限的争议。OpenAI 的新模型 Orion 相比 GPT-3 和 GPT-4 性能提升有限。业内认为传统 Scaling Laws 已经进入边际效应递减阶段，需关注扩大正确规模和优化推理时间。MIT 研究指出测试时训练在提高抽象推理任务上的性能有效。

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31