跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

极市干货

视频任意门来了!港大&达摩院新作VideoAnydoor:向视频无缝传送物体,同时支持准确动作控制

2025年1月8日23时 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨CVer粉丝投稿
来源丨CVer
编辑丨极市平台
极市导读
香港

分类 学术 标签 VideoAnydoor、 动作一致性、 复杂图案处理、 多模态融合、 消融实验、 身份保留 发表评论

汇聚算法精英,打造新质生产力!齐鲁智算大赛正式开赛!

2025年1月8日23时 作者 极市干货

极市平台关注,获取多模态大模型解读专栏、Transformer系列等技术资源。

分类 学术 标签 Transformer架构、 多模态学习、 扩散模型、 极市平台、 生成对抗网络、 视觉语言双向预训练 发表评论

图解Megatron TP中的计算通信overlap

2025年1月6日23时 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨猛猿
来源丨大猿搬砖简记
编辑丨极市平台
极市导读
本文探讨了M

分类 学术 标签 Bulk overlap、 Pipeline chunking、 Ring exchange、 Transformer、 反向传播、 预激活 发表评论

AAAI 2025 基于真实世界雾霾驾驶视频的视频去雾和深度估计

2025年1月6日23时 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨樊俊凯
来源丨CVer
编辑丨极市平台
极市导读
本文介绍了一种

分类 学术 标签 DCL模型、 DENSE-Fog、 一致性方法、 大气散射模型、 深度估计、 视频去雾 发表评论

注意力计算减少99.5%,端侧文生图扩散模型成功范式!CLEAR:类卷积线性扩散Transformer

2025年1月6日23时 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨科技猛兽
编辑丨极市平台
极市导读
本文介绍了一种名为CLEAR

分类 学术 标签 FlashAttention、 FlashAttention-2、 Flux、 Hugging Face、 LinFusion、 Sana 发表评论

AAAI 2025|腾讯优图10篇论文入选!深度伪造检测、图像编辑等研究方向

2025年1月3日8时 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨腾讯优图实验室
来源丨腾讯优图实验室
编辑丨极市平台
极市导读

分类 学术 标签 技术交流、 极市平台、 深度学习、 热点话题、 研究进展、 贡献 发表评论

NeurIPS 2024 像素级LLM实现图像视频理解、生成、分割和编辑大统一(昆仑万维等)

2025年1月3日8时 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨AI生成未来
来源丨AI生成未来
编辑丨极市平台
极市导读
一个

分类 学术 标签 VITRON模型、 像素级对齐、 大模型研究、 混合消息传递机制、 细粒度视觉特征、 跨任务协同模块 发表评论

AAAI’25开源 SUTrack:简单的模型,统一全部单目标跟踪任务!

2025年1月3日8时 作者 极市干货

SUTrack提出了一种简单而统一的单目标跟踪框架,整合了基于RGB、RGB-Depth、RGB-Thermal、RGB-Event和RGB-Language的五个任务,显著降低了研究复杂性,并在多个基准测试中取得了优异性能。

分类 学术 标签 RGB、 RGB-Depth、 RGB-Event、 RGB-Thermal、 SUTrack、 单一目标跟踪 发表评论

参数减少99.5%,媲美全精度FLUX!字节跳动等发布首个1.58-bit FLUX量化模型

2024年12月31日23时 作者 极市干货

通过1.58-bit FLUX量化模型,显著降低了存储需求和推理内存,同时保持与全精度FLUX相当的性能,在文本生成图像基准测试中表现出色。

分类 学术 标签 1.58-bit FLUX、 字节跳动、 存储需求、 推理内存、 生成质量、 量化模型 发表评论

CUDA-MODE课程笔记|GPU集合通信(NCCL)

2024年12月31日23时 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨BBuf
来源丨GiantPandaCV
编辑丨极市平台
极市导

分类 学术 标签 Gather、 GPU集群、 NCCL、 PyTorch、 Ring AllReduce、 Scatter 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面28 页面29 页面30 … 页面38 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 美国AI巨头“大乱斗”!OpenAI晒星际之门项目进展,马斯克第一个表示不服,扎克伯格醉心四处挖人
  • 本周Github爆火,开源免费文件转换器,支持1000+文件类型。
  • 多团队共用集群太乱?用 Rancher+K3k 实现一人一套环境
  • 公安部:“智驾”非“自驾”,将探索把辅助驾驶操作纳入驾考
  • 黄仁勋:AI 将消灭所有人的工作

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×