杜昕润@M-A-P:SuperGPQA:探索LLMs知识与推理能力的边界
MLNLP社区举办学术Talk邀请杜昕润分享SuperGPQA评估大模型能力,涵盖285个专业领域,覆盖轻工业等未被充分评估的学科。
MLNLP社区举办学术Talk邀请杜昕润分享SuperGPQA评估大模型能力,涵盖285个专业领域,覆盖轻工业等未被充分评估的学科。
OpenAI 放宽了 GPT-4o 图像生成的限制,允许更广泛的内容创作。Joanne Jang 解释称,这是为了减少现实世界的伤害风险,并强调保持谦逊和关注新的可能性。
合模态图(Mixed-Modality Graph)的双分支扩散模型,用于实现几何精准可控的3D室内
清华大学陈键飞团队提出的SpargeAttn无需训练且通用,实现了任意模型在4-32K上下文长度上的4-7倍推理加速,并保持了端到端精度。该方法通过选择性地压缩Q, K矩阵并预测P矩阵来节省计算,同时使用稀疏在线softmax算法进一步优化。