跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

LORA

X-R1: 3B中文推理开源, 支持LoRA训练

下午2时 2025/02/19 作者 PaperAgent

X-R1更新日志包括支持LoRA训练、发布中文训练配置及模型,成功进行大规模强化学习训练,增加标准实验脚本,支持3B模型的中文推理,并在Ascend 910B上运行成功。

分类 分享 标签 7500、 LORA、 X-R1-1.5B、 X-R1-3B、 华为Ascend 910B、 奖励曲线 发表评论

炒菜、雕刻、绘画、汽车人变形!MakeAnything用扩散Transformer解锁多任务过程生成

下午4时 2025/02/15 作者 机器之心

AIxiv专栏介绍及最新研究成果MakeAnything通过Diffusion Transformer与非对称LoRA,实现了从结果到过程的转化,并在多个实验任务中取得了良好的效果。

分类 学术、 资讯 标签 LORA、 MakeAnything、 Recraft、 图文一致性、 泛化性能、 逻辑连贯性 发表评论

不容错过!Oumi 平台,集训练、评估、部署于一体的 AI 神器

下午2时 2025/02/15 作者 小兵的AI视界

据准备、模型训练到评估和部署,每一个环节都充满挑战,如何简化整个
AI
模型开发生命周期,是亟待解决

分类 开源 标签 LORA、 Oumi、 oumi-ai、 SFT、 模型训练、 科研探索 发表评论

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

下午4时 2025/02/07 作者 机器之心

版能训练哪种大模型?本文为那些 GPU 资源有限时使用 GRPO 训练的开发者提供了宝贵的指导。
自

分类 学术、 资讯 标签 gradient_accumulation_steps、 GRPO、 LORA、 max_completion_length、 max_prompt_length、 Num Generations 发表评论

字节跳动BitsAI-CR:基于LLM的代码审查系统技术揭秘

下午11时 2025/02/03 作者 机器之心

字节跳动首次披露其内部代码审查系统BitsAI-CR的技术细节,通过两阶段评论生成架构实现75%的审查准确率和26.7%的评论过时率。

分类 学术、 资讯 标签 BitsAI-CR、 LORA、 Tree-sitter、 代码审查系统、 外部验证、 字节跳动 发表评论

从智能体到世界模型,2025年AI行业还会发生哪些大事?

下午10时 2025/01/13 作者 AI新榜

今日头图使用豆包创作,提示
词“像素风,电脑屏幕上显示文字’2025 AI趋势’,科技感,蓝紫色主题

分类 资讯 标签 3D模型、 LLM、 LORA、 世界模型、 多模态预训练、 就业市场 发表评论

一篇推文看一年!Jim Fan力荐2025必读清单:50篇论文,扫盲「全领域AI实战」

下午11时 2025/01/09 作者 新智元

新智元报道
编辑:LRS
【新智元导读】
10个AI领域,50篇精品论文,每周看一篇,到2026就能

分类 资讯 标签 DPO、 LORA、 Orca、 PRM800k、 QLORA、 ReFT 发表评论

当红炸子鸡 LoRA,是当代微调 LLMs 的正确姿势?

下午11时 2024/12/30 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨
CW不要無聊的風格
编辑丨极市平台
极市导读
对炼丹界的当红炸

分类 学术 标签 LORA、 原型验证、 可控性、 可解释性、 效率、 灵活性 发表评论

造梦师手记:水墨红尘

上午10时 2024/12/21 作者 路过银河AI

基于Flux的水墨画风格LoRa,展现古风女子形象和场景。包括竹、人淡如菊等主题,每幅作品细节丰富,色彩鲜明,具有高艺术水准。

分类 分享、 大模型 标签 Flux、 LORA、 人淡如菊、 古风墨色、 魔幻现实主义、 黑白搭配 发表评论

一篇AI冬令营第一期的优秀学习笔记!

下午2时 2024/12/19 作者 Datawhale

Datawhale冬令营
学习:Task01,作者:Reacal_子轩
前言
大模型是指具有大规模参

分类 分享 标签 LORA、 图像分类、 微调、 情感分析、 语言翻译、 预训练模型 发表评论
较新文章
← 上一页 页面1 页面2 页面3

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 近期必读!Devin VS Anthropic 的多智能体构建方法论
  • 下个周末,北京见:AGI Playground 2025
  • YC S25 拆解:给AI创业者和产品经理的终极指南
  • 首例!苹果竟被AI大模型Claude写论文驳斥:R1思考幻觉的幻觉!
  • Anthropic谈如何构建生产级多智能体系统

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×