跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

多模态模型

DeepSeek与OmniParser V2.0 重构人机协作新范式了

2025年2月17日16时 作者 陳寳

DeepSeek与OmniParser V2.0结合,使得大模型能直接操控计算机系统完成复杂任务,引发人机交互范式迁移和智能体进化。

分类 分享 标签 OmniParser V2.0、 多模态模型、 大语言模型、 安全与隐私、 微软公司、 技术共享 发表评论

准确率最高只有48%?现有多模态大模型迎来大考!小红书&上海交大发布WorldSense基准

2025年2月13日23时 作者 极市干货

专门用于评估多模态大模型(MLLMs)在真实世界场景中全模态理解能力的基准测试集。研究发现现有的开源

分类 学术 标签 WorldSense、 全模态协作、 关键指标、 多模态模型、 方法、 研究论文 发表评论

小红书&上交多模态大模型新基准,Gemini 1.5 Pro准确率仅48%

2025年2月12日23时 作者 量子位

如何?
有新基准来衡量了。
就在最近,小红书和上海交通大学联合提出
WorldSense
,一个全新

分类 资讯 标签 多模态模型、 性能提升、 模型架构、 视觉信息、 视频帧采样、 音频信息 发表评论

DeepSeek官方开源多模态视觉理解和生成模型,谁说DeepSeek只能问答了?!

2025年2月13日23时2025年2月11日23时 作者 开源AI项目落地

DeepSeek团队发布的新多模态模型Janus-Pro通过优化训练策略、扩展数据集和扩大模型规模提升了性能,实现高质量的文本到图像生成及多模态理解。

分类 开源 标签 DeepSeek、 GenEval、 Janus-Pro、 MMBench、 多模态模型、 视觉编码解耦 发表评论

大神卡帕西拿DeepSeek R1讲强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”

2025年2月6日16时 作者 量子位

西风 发自 凹非寺
量子位 | 公众号 QbitAI
宣布全职搞教育的AI大神
Andrej Kar

分类 资讯 标签 AIGC、 AI教育、 Eureka Labs、 个性化学习、 卡帕西、 多模态模型 发表评论

关于 DeepSeek、中美 AI、英伟达、Agent 等 23 个话题讨论

2025年2月4日8时 作者 特工宇宙

Lex Fridman 今早发布了一个长达五个小时的播客,内容涵盖
DeepSeek, China,

分类 分享 标签 AI模型、 多模态模型、 开源趋势、 强化学习、 稳定性改进、 编码辅助工具 2 条评论

DeepSeek是怎么练成的?万字解析DeepSeek成长史

2025年2月3日12时 作者 Founder Park

以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创

分类 资讯 标签 DeepSeek、 企业社会责任、 合作精神、 多模态模型、 技术伦理、 技术创新 发表评论

除夕,DeepSeek发布全新多模态模型Janus-Pro,新年暴击OpenAI!

2025年1月29日14时 作者 AI信息Gap

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研

分类 国际、 大模型 标签 Janus-Pro-7B、 互联网技术产品经理、 国运级科技成果、 多模态模型、 木易、 自回归Transformer 发表评论

春节献礼!DeepSeek Janus Pro开源,图像生成直逼DALL-E 3,成本狂降90%!

2025年1月28日14时 作者 子非AI

继 R1 引发开源社区热烈讨论后,DeepSeek 再度震撼 AI 领域,推出全新多模态大模型 Ja

分类 分享 标签 AI技术研发、 Janus Pro、 OCR分析、 中美竞争、 多模态模型、 开源技术 发表评论

组团开源,Qwen2.5-VL转角遇见DeepSeek Janus-Pro!

2025年1月28日14时 作者 PaperAgent

今天除夕,阿里千问开源了Qwen2.5-VL模型,包含3B、7B和72B三个尺寸,并具有感知丰富世界、作为视觉Agent、理解长视频和捕捉事件、精准的视觉定位及结构化输出等新特性。

分类 分享 标签 72B、 Qwen、 多模态模型、 视觉理解和操作、 阿里千问、 预训练语言模型 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面5 页面6 页面7 页面8 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Agent101第五课:开始学习LangGraph
  • 智力触顶?GPT-5要拼体验了
  • GPT-5 之后,我们离 AGI 更近了,还是更远了?
  • 开源UI到代码生成工具!模块化多智能体,精准还原,支持快速原型与前端自动化!
  • GPT-5刚刚正式发布,首次面向免费用户开放

2025 年 8 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 7 月    

归档

  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×