跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

多模态输入

最强推理模型o3来了!OpenAI副总裁不慎透露秘密被Altman“闭麦”|

2024年12月21日12时 作者 甲子光年

是的,他们跳过了o2。
作者|苏霍伊
‍
‍
编辑|王博
‍
‍
北京时间12月21日,OpenAI

分类 资讯 标签 o3 API、 o3模型、 Sora Turbo、 多模态输入、 强化学习微调、 推理能力 发表评论

谷歌通用推理模型来了:可解答数学、物理等问题,不直接给答案

2024年12月20日10时 作者 多知

谷歌DeepMind推出全新测试模型Gemini 2.0 Flash Thinking,能够通过’思考’解答物理问题,并支持多模态输入和输出。

分类 资讯 标签 Gemini 2.0 Flash Thinking、 Jeff Dean、 openai o1、 多模态输入、 谷歌 DeepMind、 通用推理模型 发表评论

一篇78页大模型GUI Agents全面综述~

2024年12月3日13时 作者 PaperAgent

本文综述了LLM驱动的GUI智能体的发展和进步,讨论了它们的历史演变、核心组件和技术,并展示了智能体如何通过自然语言处理技术执行多种任务,包括Word、Photos、浏览器、Adobe Acrobat和PowerPoint操作等。

分类 分享 标签 Claude 3.5 Sonnet、 GUI智能体、 LLM驱动、 多模态输入、 新兴决策技术、 跨平台泛化 发表评论
较新文章
← 上一页 页面1 页面2

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 高危巡检有办法了!实探工厂:机器人正替人“站岗”
  • 「DeepSeek二代」来袭!数学暴击o3,英伟达开源LLM登顶
  • Replit CEO访谈:裁掉一半员工,豪赌AI,9个月收入翻10倍
  • ICCV2025破解安防行为识别困局:从“找谁”到“在干嘛”,带来智能守护新可能
  • DeepMind率先拿下IMO金牌,却被OpenAI 抢先发布了……

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×