跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

53%

大模型全员0分!谢赛宁领衔华人团队,最新编程竞赛基准出炉,题目每日更新禁止刷题

2025年6月18日23时 作者 量子位

参赛大模型全军覆没,通通0分。LiveCodeBench Pro测试揭示了LLMs在算法逻辑深度上的不足,尽管表现最佳的模型在中等难度题上的一次通过率仅53%。

分类 资讯 标签 0分、 53%、 LiveCodeBench Pro、 编程测试、 谢赛宁、 郑子涵 发表评论

成熟的编程智能体,已经学会升级自己的系统了

2025年5月5日23时 作者 机器之心

研究人员提出了一种自我改进编码智能体(SICA),能够编辑自己的代码库,并在成本、速度和基准性能方面进行自我改进,该研究展示了自我参照式元智能体编程的可行性。

分类 学术、 资讯 标签 17%、 53%、 Maxime Robeyns、 SICA、 优化方法、 标准Python、 自我改进编码智能体 发表评论

Nature 审稿人告急!学术期刊出奇招:250美元评审一篇论文?

2025年3月31日16时 作者 新智元

两家期刊实验表明,给评审人员约250美元报酬能加快评审速度而不降低质量。但专家警告,这可能改变科研生态并带来新问题。

分类 资讯 标签 1天、 53%、 Biology Open、 Critical Care Medicine、 Nature、 评审速度 发表评论

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 解析:AI Audio Stemmer 立即将歌曲拆分为可编辑的音频分轨
  • Claude Code 作者:别再沉迷功能堆砌了!最好的 AI 工具,是把控制权还给你
  • 苹果痛失AI王牌后,又有两名专家被Meta挖走
  • OpenAI发布ChatGPT智能体,能帮金融分析师做PPT和EXCEL
  • AI陪伴玩具,是营销噱头还是“情感伙伴”?

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×