跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

多模态模型

准确率最高只有48%?现有多模态大模型迎来大考!小红书&上海交大发布WorldSense基准

下午11时 2025/02/13 作者 极市干货

专门用于评估多模态大模型(MLLMs)在真实世界场景中全模态理解能力的基准测试集。研究发现现有的开源

分类 学术 标签 WorldSense、 全模态协作、 关键指标、 多模态模型、 方法、 研究论文 发表评论

小红书&上交多模态大模型新基准,Gemini 1.5 Pro准确率仅48%

下午11时 2025/02/12 作者 量子位

如何?
有新基准来衡量了。
就在最近,小红书和上海交通大学联合提出
WorldSense
,一个全新

分类 资讯 标签 多模态模型、 性能提升、 模型架构、 视觉信息、 视频帧采样、 音频信息 发表评论

DeepSeek官方开源多模态视觉理解和生成模型,谁说DeepSeek只能问答了?!

下午11时 2025/02/13 下午11时 2025/02/11 作者 开源AI项目落地

DeepSeek团队发布的新多模态模型Janus-Pro通过优化训练策略、扩展数据集和扩大模型规模提升了性能,实现高质量的文本到图像生成及多模态理解。

分类 开源 标签 DeepSeek、 GenEval、 Janus-Pro、 MMBench、 多模态模型、 视觉编码解耦 发表评论

大神卡帕西拿DeepSeek R1讲强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”

下午4时 2025/02/06 作者 量子位

西风 发自 凹非寺
量子位 | 公众号 QbitAI
宣布全职搞教育的AI大神
Andrej Kar

分类 资讯 标签 AIGC、 AI教育、 Eureka Labs、 个性化学习、 卡帕西、 多模态模型 发表评论

关于 DeepSeek、中美 AI、英伟达、Agent 等 23 个话题讨论

上午8时 2025/02/04 作者 特工宇宙

Lex Fridman 今早发布了一个长达五个小时的播客,内容涵盖
DeepSeek, China,

分类 分享 标签 AI模型、 多模态模型、 开源趋势、 强化学习、 稳定性改进、 编码辅助工具 2 条评论

DeepSeek是怎么练成的?万字解析DeepSeek成长史

下午12时 2025/02/03 作者 Founder Park

以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创

分类 资讯 标签 DeepSeek、 企业社会责任、 合作精神、 多模态模型、 技术伦理、 技术创新 发表评论

除夕,DeepSeek发布全新多模态模型Janus-Pro,新年暴击OpenAI!

下午2时 2025/01/29 作者 AI信息Gap

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研

分类 国际、 大模型 标签 Janus-Pro-7B、 互联网技术产品经理、 国运级科技成果、 多模态模型、 木易、 自回归Transformer 发表评论

春节献礼!DeepSeek Janus Pro开源,图像生成直逼DALL-E 3,成本狂降90%!

下午2时 2025/01/28 作者 子非AI

继 R1 引发开源社区热烈讨论后,DeepSeek 再度震撼 AI 领域,推出全新多模态大模型 Ja

分类 分享 标签 AI技术研发、 Janus Pro、 OCR分析、 中美竞争、 多模态模型、 开源技术 发表评论

组团开源,Qwen2.5-VL转角遇见DeepSeek Janus-Pro!

下午2时 2025/01/28 作者 PaperAgent

今天除夕,阿里千问开源了Qwen2.5-VL模型,包含3B、7B和72B三个尺寸,并具有感知丰富世界、作为视觉Agent、理解长视频和捕捉事件、精准的视觉定位及结构化输出等新特性。

分类 分享 标签 72B、 Qwen、 多模态模型、 视觉理解和操作、 阿里千问、 预训练语言模型 发表评论

动真格!北大团队开源全模态对齐的训练、数据和测评框架align-anything

上午8时 2025/01/21 作者 PaperWeekly

如何将全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。
在当前 AI 领域的快

分类 大模型、 学术 标签 align-anything、 多模态模型、 开源项目、 强化学习、 技术对齐、 科研交流 1 条评论
较早文章
较新文章
← 上一页 页面1 … 页面3 页面4 页面5 页面6 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4 GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

近期文章

  • DeepSeek又发新论文了!梁文锋带队提交,多项建议为AI硬件+模型协同创新铺路
  • StarRocks MCP Server 开源发布:为 AI 应用提供强大分析中枢
  • 国产TTS模型双榜第一!MiniMax实现零样本语音复刻,支持32种多语言!
  • 谷歌智能体展示强大编程能力 Agent最适配场景呼之欲出?
  • 快讯马斯克预测人形机器人将达数百亿,“成都造”AI手术机器人国际化进程再提速,青岛发力具身智能机器人设百亿基金

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×