跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

机器之心

Index-AniSora:B站开源动画生成模型,斩获多项SOTA入选IJCAI25

2025年5月19日16时 作者 机器之心

B 站开源动画视频生成模型 Index-AniSora,支持多种二次元风格视频生成。该工作包括高质量数据集、统一扩散生成框架和评估基准等技术方案。

分类 学术、 资讯 标签 AniSora、 B站、 二次元、 人类偏好、 强化学习、 扩散生成 发表评论

AI大厦需要新的地基!

2025年5月19日16时 作者 机器之心

数据不够用了,正如前 OpenAI 首席科学家 Ilya Sutskever 在 NeurIPS 2

分类 学术、 资讯 标签 Data×AI、 RAG服务、 一体化数据底座、 大模型应用、 数据库、 混合检索 发表评论

「AI黑客」来袭,Agentic AI如何成为新守护者?

2025年5月19日11时 作者 机器之心

随着 AI 技术的快速发展,网络安全面临的威胁日益复杂化,攻击手段不仅更高效、隐蔽,还催生了新型的「

分类 学术、 资讯 标签 APT活动、 优化资源分配、 动态适应、 无相安全智能体、 精细化防护、 自主决策 发表评论

ICML 2025|如何凭「自动补全」实现100K生成3×加速?

2025年5月18日16时 作者 机器之心

随着 GPT-o3, DeepSeek R1 等具备
「超级上下文窗口
」 能力的大模型持续刷新业界

分类 学术、 资讯 标签 Llama3.1-8B、 TOKENSWIFT、 上下文惩罚、 全量缓存、 加速比、 动态KV管理 发表评论

ICML 2025 Spotlight 用傅里叶分解探讨图像对抗扰动,代码已开源

2025年5月18日16时 作者 机器之心

本文提出了一种基于傅里叶分解的扩散模型对抗净化方法,通过保留低频信息来有效去除图像中的对抗扰动,同时保持图像的语义内容和结构信息。

分类 学术、 资讯 标签 傅里叶分解、 净化策略、 对抗扰动、 扩散模型、 标准准确率、 频域角度 发表评论

刚刚!北大校友Lilian Weng最新博客来了:Why We Think

2025年5月18日16时 作者 机器之心

最近,北大校友、前 OpenAI 应用 AI 研究负责人 Lilian Weng 更新了一篇长长长长

分类 学术、 资讯 标签 多模态任务、 批判性思考、 数据高效训练、 注意力机制、 测试时计算、 激励模型 发表评论

从 VLM 到 VLA,智驾距离跨过「L2.9999」还有多远?

2025年5月18日11时 作者 机器之心

本周解读汽车智能化领域两则热点事件:一是关于L2.999级别的智驾宣传争议及L3级别自动驾驶的责任归属问题;二是分析端到端技术在自动驾驶领域的前景及其面临的瓶颈。

分类 学术、 资讯 标签 L3级别、 中国自动驾驶、 冯兴亚、 安全投入、 广汽集团、 智能驾驶 发表评论

CVPR 2025 SketchVideo让手绘动起来,视频生成进入线稿时代

2025年5月17日16时 作者 机器之心

重要研究内容,在影视制作、短视频合成和虚拟仿真等方面都有应用价值。现有的商用和开源的视频生成模型,都

分类 学术、 资讯 标签 CVPR2025、 SketchVideo、 关键帧、 手绘线稿、 扩散模型、 视频生成 发表评论

图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理

2025年5月17日16时 作者 机器之心

GPT-3 到 GPT-4o,「next-token prediction」以简单粗暴的因果建模横扫

分类 学术、 资讯 标签 AR tokens、 GenEval、 ImageNet、 Tokenizer、 强化学习、 预训练 发表评论

ICML 2025 Spotlight|南洋理工陶大程教授团队等提出基于RAG的高分辨率图像感知框架,准确率提高20%

2025年5月17日8时 作者 机器之心

模型(MLLMs)在视觉问答、推理以及 OCR 等任务上取得了显著的成功。然而,早期的 MLLMs

分类 学术、 资讯 标签 4K、 RAP、 Retrieval-Augmented Perception、 Transformer、 计算机视觉、 高分辨率图像 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面39 页面40 页面41 … 页面134 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 12 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
293031  
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×