跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

多模态理解

AI 时代的超级应用,是一个超级框

2025年3月13日16时 作者 APPSO

夸克升级推出「AI 超级框」,具备多模态理解与深度思考能力,能协助创意构思、健康咨询、学习解惑及专业任务处理。展示了 AI 在C端的新形态。

分类 资讯 标签 多样化任务、 多模态理解、 夸克、 深度思考、 阿里、 阿里通义系列模型 发表评论

小红书、上交发布多模态大模型新基准,Gemini 1.5 Pro准确率仅48%

2025年2月28日23时 作者 PaperWeekly

WorldSense
,一个全新的基准测试,用来
评估多模态大模型(MLLMs)的多模态真实场景理

分类 大模型、 学术 标签 多模态理解、 文字转录、 视觉信息、 视频帧采样、 音频信息、 高效训练 发表评论

马斯克正式发布Grok 3,竞技场首超1400分、Karpathy实测推理能力好于DeepSeek

2025年2月18日16时 作者 Founder Park

这样的评价:
Grok 3是首个突破1400分的模型,并且在所有类别中排名第一。
而且,Grok 3

分类 资讯 标签 Grok 3、 xAI、 多模态理解、 文本生成、 游戏业务、 融资 发表评论

最强全模态模型Ola-7B横扫图像、视频、音频主流榜单,腾讯混元Research&清华&NTU联手打造

2025年2月18日12时 作者 机器之心

多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

分类 学术、 资讯 标签 Ola、 全模态语言模型、 多模态理解、 视频-音频问答、 跨模态数据准备、 音频模型 发表评论

英伟达市值蒸发近6000亿,而DeepSeek刚刚又开源新模型!

2025年1月28日22时 作者 Datawhale

Datawhale分享
最新:DeepSeek,编辑:机器之心
龙年即将结束,但有些股民可能无心过春

分类 分享 标签 7B、 DeepSeek、 Janus Pro、 多模态理解、 技术创新、 视觉模型 发表评论

DeepSeek除夕狂飙大招:开源多模态掀翻全场!256张A100训两周碾压DALL-E 3

2025年1月28日16时 作者 新智元

新智元报道
编辑:Aeneas 好困
【新智元导读】
DeepSeek除夕又放出重磅炸弹:多模态大一

分类 资讯 标签 80%、 Janus-Pro、 多模态理解、 统一模型、 视觉生成、 视觉编码解耦 发表评论

追平满血版o1的国产多模态模型终于来了!训练细节全部公开

2025年1月20日23时 作者 机器之心

机器之心报道
机器之心编辑部
春节前最后一周,能媲美 Open AI 满血版 o1(Full Ver

分类 学术、 资讯 标签 kimi、 OpenAIo1模型、 在线镜像下降法、 多模态理解、 强化学习、 长上下文scaling 发表评论

李飞飞谢赛宁:多模态LLM「空间大脑」觉醒,惊现世界模型雏形!

2024年12月23日14时 作者 新智元

新智元报道
编辑:Aeneas 好困
【新智元导读】
李飞飞、谢赛宁团队又有重磅发现了:多模态LLM

分类 资讯 标签 LLM、 MetaMorph、 VPiT、 多模态理解、 视觉生成、 认知映射 发表评论

谷歌推出Project Mariner了

2024年12月13日10时 作者 陳寳

谷歌推出的新产品Mariner展示了AI技术在实际应用中的巨大潜力,具备多模态理解、自动化操作和持续学习等特性,在多个场景下提高了用户的网络浏览和操作体验。

分类 分享 标签 Gemini 2.0、 Mariner、 多模态理解、 智能体、 用户隐私、 谷歌 发表评论

国产模型指令跟随全球第一!来自LeCun亲推的「最难作弊」大模型新榜单

2024年11月21日13时 作者 每时AI

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
What???
一直低调行事的国内初创公司,旗

分类 资讯 标签 AGI、 FlagEval Debate、 Step系列、 多模态理解、 技术创新、 权威榜单 发表评论
较新文章
← 上一页 页面1 页面2 页面3

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×