跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

多模态信息

全球顶尖AI来考公,不会推理全翻车!致命缺陷曝光,被倒数5%人类碾压

下午4时 2025/04/18 作者 新智元

CMU团队就此为基础,打造了一套逻辑谜题挑战。实测后发现,o1、Gemini-2.5 Pro、Cla

分类 资讯 标签 VisualPuzzles、 多模态信息、 大语言模型、 深层逻辑推理、 空间信息理解、 视觉逻辑推理 发表评论

AAAI 2025 通义实验室提出基于辩论的弱监督对齐强模型方法,探索超级对齐新范式

下午11时 2025/02/28 作者 PaperWeekly

和 weak-to-strong generalization 解决超级对齐问题的新范式。
论文标

分类 大模型、 学术 标签 Scalable Oversight、 多模态信息、 数据稀缺、 知识迁移、 语言理解、 辩论 发表评论

单卡3090帮你一口气看完《黑悟空》,港大百度打造超长视频理解引擎VideoRAG

下午4时 2025/02/13 作者 机器之心

多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

分类 学术、 资讯 标签 LongeVideos、 VideoRAG、 多模态信息、 文本信息、 知识图谱、 视觉内容 发表评论

李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪

下午2时 2024/12/18 作者 机器之心

机器之心报道
机器之心编辑部
人类的沟通交流充满了多模态的信息。为了与他人进行有效沟通,我们既使用言

分类 学术、 资讯 标签 多模态信息、 情绪预测、 泛化能力、 生成式音频-动作转换、 跨模态理解、 预训练策略 发表评论

再融30亿!「智谱AI」获多家战投与国资机构投资!

下午12时 2024/12/18 作者 机器人大讲堂

智谱AI近日完成30亿人民币融资,聚焦大模型研发。公司由清华大学技术成果转化而来,拥有深厚的人工智能背景和技术积累,旨在推动人工智能行业生态发展。

分类 机器人 标签 2500万、 30亿元、 国资机构、 多模态信息、 工业机器人、 智谱AI 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

近期文章

  • 采用 DACA 设计模式从零开始学习 Agentic AI 的教程:Learn Agentic AI
  • llama.cpp 内置的 llama-server 终于支持视觉模型
  • 一个完整的多模态推理模型发展全景图
  • 告别OCR!无需OCR的开源文档提取神器:DocExt,VLM驱动,安全高效!
  • DeerFlow:深度研究的利器,结合语言模型与多种工具,助力高效研究与知识探索

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×