跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

多模态任务

百度文心大模型4.5系列正式开源,同步开放API服务

2025年6月30日16时 作者 量子位

百度发布文心大模型4.5系列正式开源,涵盖多种参数和任务需求的10款模型,并提供API服务与Apache 2.0协议支持。

分类 资讯 标签 Apache 2.0、 SOTA、 多模态任务、 文心大模型4.5、 百度、 飞桨 发表评论

探索多模态后训练最优解:MiMo-VL稳健优化 v.s. Seed-VL激进革命

2025年6月24日23时 作者 PaperWeekly

下,
MiMo-VL
与
Seed-VL
两大系统在后训练链条上的策略博弈,展现了当前业界对指令对齐

分类 大模型、 学术 标签 PPO变体、 Seed-VL、 多模态任务、 奖励模型、 强化学习、 数据生成流水线 发表评论

月之暗面 Kimi-VL:集多模态、高智商、强推理于一身的开源大模型

2025年5月20日14时 作者 小兵的AI视界

的一款轻量级多模态视觉语言模型,凭借其独特的架构设计和高效的训练方法,在多模态任务中展现出强大的性能

分类 开源 标签 Kimi-VL、 MoonshotAI、 图文结合、 多模态任务、 开源大模型、 智能客服 发表评论

刚刚!北大校友Lilian Weng最新博客来了:Why We Think

2025年5月18日16时 作者 机器之心

最近,北大校友、前 OpenAI 应用 AI 研究负责人 Lilian Weng 更新了一篇长长长长

分类 学术、 资讯 标签 多模态任务、 批判性思考、 数据高效训练、 注意力机制、 测试时计算、 激励模型 发表评论

让奥特曼直呼“天才”的o3 和 o4-mini,被曝捏造事实问题严重!拓展强化学习、图像思维链等亮点成陪衬?

2025年4月17日11时 作者 AI前线

之前思考更长时间而训练。
这些推理模型首次实现了自主调用并整合 ChatGPT 内的全量工具:包括网

分类 资讯 标签 o3、 o4-mini、 OpenAI、 图像处理能力、 多模态任务、 视觉生成 发表评论

Gemini 2.5 Pro真是强到没对手!谷歌不愧为AI黄埔军校!

2025年3月28日8时 作者 PyTorch研习社

Gemini 2.5 Pro 是 Gemini 模型的新成员,具备强大的推理、编程能力和多模态任务处理能力。它在多个基准测试中表现出色,并引入了逐步推理机制以提高答案准确性。

分类 分享 标签 Gemini 2.5 Pro、 Google DeepMind、 复杂问题、 多模态任务、 学术研究、 推理能力 发表评论

阿里千问携手DeepSeek引领国产开源大模型走向世界

2025年3月26日8时 作者 PyTorch研习社

阿里千问开源Qwen2.5-VL-32B-Instruct,提升视觉语言能力与数学推理。相比同类模型,其在多模态任务中表现显著优势,且在同规模纯文本能力上也取得顶级表现。

分类 分享 标签 DeepSeek-V3-0324、 Gemma-3-27B-IT、 Mistral-Small-3.1-24B、 Qwen2.5-VL-32B-Instruct、 多模态任务、 视觉语言模型 发表评论

Qwen2.5-VL-32B-Instruct开源

2025年3月26日8时 作者 NLP工程化

Qwen2.5-VL-32B-Instruct 在多模态任务中表现出色,并在 MM-MT-Bench 基准测试中相比前代模型取得显著进步。

分类 开源 标签 Gemma-3-27B-IT、 Mistral-Small-3.1-24B、 MM-MT-Bench、 Qwen、 Qwen2.5-VL-32B-Instruct、 多模态任务 发表评论

R1-Think能力如何用于RAG及多模态场景?Rank1及R1-Onevision实现思路解析

2025年2月28日14时 作者 老刘说NLP

今天继续看RAG进展,看推理模型用于RAG的两个思路。
另一个看看将R1推理路径用于多模态模型的一个

分类 大模型 标签 70亿参数、 LLaMA-Factory、 Qwen2.5-VL-Instruct、 R1、 多模态任务、 老刘说NLP 发表评论

DeepSeek-R1:强化学习驱动的AI推理模型,性能媲美OpenAI o1

2025年1月31日14时 作者 小兵的AI视界

2025
年
1
月
20
日,深度求索公司正式发布了其最新的人工智能推理模型
DeepSeek-R

分类 开源 标签 671亿参数、 DeepSeek R1、 GitHub模型库、 多模态任务、 实时推断能力、 强化学习算法 发表评论
较早文章
页面1 页面2 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Agent101第五课:开始学习LangGraph
  • 智力触顶?GPT-5要拼体验了
  • GPT-5 之后,我们离 AGI 更近了,还是更远了?
  • 开源UI到代码生成工具!模块化多智能体,精准还原,支持快速原型与前端自动化!
  • GPT-5刚刚正式发布,首次面向免费用户开放

2025 年 8 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 7 月    

归档

  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×