DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科 2025年3月4日16时 作者 量子位 夜变天??? 要知道,过去几年,各种通用评测逐渐同质化,越来越难以评估模型真实能力。GPQA、MML
NP难问题接近被AI破解!南航牛津爆改DeepSeek-R1推理,碾压人类27年研究 2025年3月4日16时 作者 新智元 能力就开始暴涨。更令人吃惊是,Qwen2.5-14B居然给出了此前从未见过的希尔伯特问题的反例!而人
实测字节免费AI编程,还让不让Cursor活了 2025年3月4日16时 作者 量子位 国内首个原生AI IDE Trae发布,无需编程知识就能使用AI开发网页小游戏。支持连续对话、自动保存代码,免费体验,字节拥抱DeepSeek模型。
半个世纪后,著名的麦凯猜想终获证明!数学家夫妇终结了一个未解群论难题 2025年3月4日16时 作者 机器之心 03 年,一位名叫 Britta Späthen 的德国研究生首次接触到了麦凯猜想(McKay co
北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准 2025年3月4日16时 作者 机器之心 多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,
台积电千亿美元投资美国!英伟达、博通秘密测试英特尔:谁输谁赢? 2025年3月4日16时 作者 新智元 台积电豪掷千亿美元在美建厂,英特尔和英伟达、博通等巨头测试其18A制程。然而,该技术延期又为英特尔的复兴之路蒙上阴影。
DeepSeek R1也会大脑过载?UC伯克利等新作揭示:少琢磨让计算成本直降43% 2025年3月4日16时 作者 PaperWeekly 样,在「用脑过度」也会崩溃,进而行动能力下降。 近日,加州大学伯克利分校、UIUC、ETH Zuri
讯飞星火X1单挑满血版DeepSeek-R1,全国产算力单机部署!中国AI再下一城 2025年3月4日16时 作者 新智元 0B小身板在数学领域全面领先,性能直接对标OpenAI o1和DeepSeek-R1。单机部署成本骤