跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

月度归档: 2025 年 2 月

DeepSeek开源周第二天:DeepEP通信库,解锁MoE模型通信瓶颈

2025年2月25日16时 作者 Founder Park

)和专家并行(EP)打造的高效通信库 — DeepEP。
就在半小时前,官方对此进行了发布,以下是由

分类 资讯 标签 CUDA API、 DeepEP、 Hopper GPU、 InfiniBand、 NVSHMEM、 RDMA 发表评论

AI蛋白质设计前沿教程,AAAI’25三大机构携手4小时全面剖析

2025年2月25日16时 作者 量子位

加拿大魁北克省人工智能研究所Mila、美国东北大学和MIT的研究者将在AAAI会议上组织一场关于人工智能在蛋白质设计中的应用的教程,涵盖最新进展与未来趋势。

分类 资讯 标签 MILA、 MIT、 东北大学、 人工智能、 唐建博士、 金汶功博士 发表评论

超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover来了,直接开源

2025年2月25日16时 作者 机器之心

多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

分类 学术、 资讯 标签 72.95%、 BFS、 IMO问题、 MiniF2F测试集、 广度优先搜索、 数学推理 发表评论

全球首个混合推理模型降世!程序员集体过年,最强AI编程秒全场,多平台火速接入

2025年2月25日16时 作者 智东西

首个混合推理模型Claude 3.7 Sonnet支持实时和扩展思考模式;Anthropic推出编码工具Claude Code简化开发流程;用户可选择不同模式控制思考预算。

分类 资讯 标签 Anthropic、 Claude 3.7 Sonnet、 智能编码工具、 终端命令、 编码成本、 错误回答 发表评论

全球首个混合推理模型!Claude 3.7 Sonnet来袭,真实编码力压一切对手

2025年2月25日16时 作者 PaperWeekly

区广泛发酵,不过并不是期待中的 Claude 4.0,而是 3.7 Sonnet 版本。
▲ 图源:

分类 大模型、 学术 标签 Anthropic、 Claude Code、 智能编码工具、 有害请求区分、 深度推理、 负责任研究标准 发表评论

仅靠逻辑题,AI数学竞赛能力飙升!微软、九坤投资:7B小模型也能逼近o3-mini

2025年2月25日16时 作者 机器之心

多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

分类 学术、 资讯 标签 冷启动、 强化学习、 思考(token)、 监督学习、 记忆分数、 语言混杂现象 发表评论

360联合北大震撼发布!5%参数量逼近Deepseek-R1满血性能

2025年2月25日16时 作者 新智元

中等量级推理模型Tiny-R1-32B-Preview亮相,仅以5%参数量逼近DeepSeek-R1巨兽。该模型在数学、编程和科学领域表现突出,并承诺开源技术。

分类 资讯 标签 360、 5%、 AI技术普惠、 Tiny-R1-32B、 科学、 编程 发表评论

刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!

2025年2月25日16时 作者 机器之心

DeepSeek 开源首个用于MoE模型训练和推理的EP通信库 DeepEP,优化高效通信和并行处理,支持FP8精度,并提供灵活资源调度。

分类 学术、 资讯 标签 DeepEP、 FlashMLA、 FP8精度、 MoE模型、 NVLINK、 RDMA 发表评论

WWW 2025 即插即用、轻松涨点!用不确定性助力图结构学习,提升GNN性能

2025年2月25日16时 作者 PaperWeekly

文题目:
Uncertainty-Aware Graph Structure Learning
论文

分类 大模型、 学术 标签 学术研究、 小编微信、 投稿、 知识普及、 讨论、 阅读 发表评论

全球首个混合推理模型:Claude 3.7 Sonnet来袭,真实编码力压一切对手

2025年2月25日16时 作者 机器之心

不过并不是期待中的 Claude 4.0,而是 3.7 Sonnet 版本。
图源:https://

分类 学术、 资讯 标签 Anthropic、 Claude 3.7 Sonnet、 Claude Code、 代理工作流程、 语言模型、 负责任扩展策略 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面37 页面38 页面39 … 页面241 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Agent101第五课:开始学习LangGraph
  • 智力触顶?GPT-5要拼体验了
  • GPT-5 之后,我们离 AGI 更近了,还是更远了?
  • 开源UI到代码生成工具!模块化多智能体,精准还原,支持快速原型与前端自动化!
  • GPT-5刚刚正式发布,首次面向免费用户开放

2025 年 2 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
2425262728  
« 1 月   3 月 »

归档

  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×