跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

SOTA

Qwen新开源,把AI生图里的文字SOTA拉爆了

2025年8月5日12时 作者 量子位

通义模型家族开源Qwen-Image,一个200亿参数的图像生成基础模型。主打复杂文本渲染能力,能准确生成图文混合布局、海报等高质量图像,并在多项公开基准测试中表现出色。

分类 资讯 标签 200亿参数、 Qwen-Image、 SOTA、 图像生成、 文本渲染、 量子位 发表评论

B站下场自研AI配音!纯正美音版甄嬛传流出,再不用看小红书学英语了(Doge)

2025年7月14日23时 作者 量子位

B站发布的IndexTTS2模型能够在保证音色和情感的同时实现精确时长控制,支持多种生成方式,并在多个评测中表现出色。

分类 资讯 标签 IndexTTS2、 SOTA、 代号H、 情感表达、 文本准确性、 生成方式 发表评论

ICCV 2025 Ross3D:让多模态大模型真正“看懂”三维世界!

2025年7月11日23时 作者 极市干货

在ICCV 2025上,作者提出了Ross3D方法,通过重构式视觉指令微调和3D感知自监督实现了超越其他模型的出色表现。

分类 学术 标签 FLUX-VAE、 ICCV2025、 Ross3D、 SOTA、 多模态理解、 王淏辰 发表评论

huggingface发布了3B参数里的SoTA模型 smollm3

2025年7月10日8时 作者 NLP工程化

Hugging Face 发布了3B参数的SOTA模型 Smollm3,支持Think/No-Think模式,默认不支持汉语,未来将发布其详细信息及构建方法。

分类 开源 标签 3B、 Hugging Face、 smollm3、 SOTA、 state-of-the-art、 预训练语言模型 发表评论

ICCV 2025 南开等提出REG方法,直接、高效地利用判别性信息,几十倍加速扩散模型训练!

2025年7月4日23时 作者 极市干货

本文提出了一种名为REG的方法,通过将低级图像潜在表示与高级类别令牌进行‘纠缠’来加速扩散模型的训练,并在ImageNet上实现了高达63倍的训练加速。

分类 学术 标签 63倍加速、 ImageNet、 REG、 SOTA、 南开大学、 扩散模型 发表评论

赶超DeepSeek、阿里Qwen!百度文心4.5系列模型正式开源,性能出色但领跑有点难

2025年6月30日23时 作者 头部科技

百度正式宣布开源文心4.5系列模型,该系列包含多模态异构MoE预训练、可扩展高效的基础设施以及针对特定模态的后训练技术。模型在多个基准测试中表现优异,覆盖了文本和多模态任务。

分类 资讯 标签 SOTA、 挑战、 文心4.5、 新兴公司、 百度、 飞桨 发表评论

文心大模型 4.5 系列正式开源,涵盖 10 余款模型

2025年6月30日16时 作者 AI前线

百度正式开源文心大模型 4.5 系列,涵盖多种参数的混合专家(MoE)和稠密型模型,系列权重按照 Apache 2.0 协议开源。

分类 资讯 标签 Apache 2.0、 SOTA、 开源、 文心大模型4.5、 百度、 飞桨 发表评论

百度文心大模型4.5系列正式开源,同步开放API服务

2025年6月30日16时 作者 量子位

百度发布文心大模型4.5系列正式开源,涵盖多种参数和任务需求的10款模型,并提供API服务与Apache 2.0协议支持。

分类 资讯 标签 Apache 2.0、 SOTA、 多模态任务、 文心大模型4.5、 百度、 飞桨 发表评论

AgentAuditor: 让智能体安全评估器的精确度达到人类水平

2025年6月27日16时 作者 机器之心

LLM 智能体自主决策能力提升带来安全性评估难题,研究者提出 AgentAuditor 解决方案,显著提升 LLM 评估器精确度至人类水平。

分类 学术、 资讯 标签 AgentAuditor、 ASSEBench、 LLM评估器、 SOTA、 强化推理、 精确度 发表评论

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

2025年6月17日16时 作者 量子位

DeepSeek新版R1-0528在编程能力测试中表现突出,能在网页编程上击败Claude Opus 4。实测显示其能快速生成太阳系动画、AGI主题网站及俄罗斯方块游戏代码,并且对国内用户更为友好。

分类 资讯 标签 DeepSeek、 kimi、 SOTA、 开源文本模型、 机器学习、 编程 发表评论
较早文章
页面1 页面2 页面3 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×