跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

学术

多模态,杀疯了!

2025年2月7日16时 作者 PaperWeekly

多模态大模型是实现AGI的必经之路。通过模拟人类的多模态感知能力,多模态大语言模型(MLLM)引领变革,并成功展示了实时交互的VITA-1.5模型。

分类 大模型、 学术 标签 700论文、 Geoff老师、 VITA-1.5、 多模态大模型、 头部互联网企业、 近实时的交互能力 发表评论

Deepseek R1 Zero成功复现, 三阶段RL,Response长度涨幅超50%,涌现语言混杂,double-check

2025年2月7日14时 作者 机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进

分类 学术 标签 format requirement、 GSM8K、 token error、 惩罚机制、 逻辑推理模型、 高温采样 发表评论

刘知远硬核解读 DeepSeek:大模型强化学习技术原理与大模型技术发展研判

2025年2月7日14时 作者 机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进

分类 学术 标签 MLNLP社区、 主要活动、 具体步骤、 学习资源、 论文阅读、 详细介绍 发表评论

超导材料搜索效率提升5倍!佛罗里达大学等用深度学习变革材料发现,成果登Nature子刊

2025年2月7日12时 作者 HyperAI超神经

究人员,通过深度学习模型 BETE-NET,成功预测了金属的电声相互作用 Eliashberg 谱函

分类 学术 标签 AI For Science、 扩散模型、 电声相互作用、 等变神经网络、 超导材料、 高 Tc 材料 发表评论

感谢DeepSeek,ChatGPT开始公开o3思维链,但不完整

2025年2月7日12时 作者 机器之心

OpenAI为ChatGPT上线了展示详细思维链内容的更新,但其展示的内容是经过总结和可能错误的版本。相比而言,DeepSeek可以展示完整的思维过程,并且在某些情况下能提供更好的用户体验。

分类 学术、 资讯 标签 O3-mini、 OpenAI、 思维链、 技术改进、 深度学习、 用户体验提升 发表评论

817样本激发7倍推理性能:上交大「少即是多」定律挑战RL Scaling范式

2025年2月7日8时 作者 机器之心

机器之心发布
机器之心编辑部
在追求人工智能极限的道路上,”更大即更强” 似乎已成为共识。特别是在数

分类 学术、 资讯 标签 LIMO、 工业优化、 教育应用、 数学推理、 科学研究、 高质量样本 发表评论

DeepSeek-V3 FP8量化浅析

2025年2月6日19时 作者 GiantPandaCV

水塔花桥·琉森 摄于2024.4.30
DeepSeek-V3 横空出世,训练和推理成本极低,一个重

分类 学术 标签 block、 CuTe、 CUTLASS、 EVT、 FP8、 量化 发表评论

每人50万英镑,Hinton、Bengio、黄仁勋和李飞飞等获得伊丽莎白女王工程奖

2025年2月6日16时 作者 机器之心

机器之心报道
编辑:Panda、蛋酱
恭喜!
昨天,伊丽莎白女王工程奖发布了今年度的获奖人员名单。该

分类 学术、 资讯 标签 亚历山大:最后的英雄、 光影效果、 剪纸艺术、 动画短片、 洛斯基、 记忆与时间 发表评论

突发|刚加入Anthropic的OpenAI联创John Schulman,又离职了!

2025年2月6日16时 作者 机器之心

OpenAI 联合创始人 John Schulman 离职 Anthropic,Anthropic 成为 OpenAI 在人工智能基础模型领域的竞争对手。

分类 学术、 资讯 标签 Anthropic、 John Schulman、 大语言模型、 对齐工作、 机器人强化学习、 职业生涯 发表评论

LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存

2025年2月6日12时 作者 机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000

分类 学术、 资讯 标签 LLaVA-Mini、 图像理解、 显存使用、 视频推理、 视频理解、 计算负载 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面200 页面201 页面202 … 页面283 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 12 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
293031  
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×