跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

LORA

零基础入门:DeepSeek微调的评测教程来了!

2025年2月28日19时 作者 Datawhale

望通过比较通俗的方式给大家直观感受大模型微调后的效果,相关是思路想法旨在起到抛砖引玉的效果,如果学习

分类 分享 标签 BERTScore、 LORA、 医疗领域、 大模型、 微调、 金融领域 发表评论

文末赠书 微信、百度都接入的 DeepSeek,企业靠啥玩转其私有化与垂直训练?

2025年2月24日23时 作者 AI前线

具实力的大模型代表,正引领着众多企业迈向智能化变革的新征程。从教育领域到金融行业,再到互联网巨头的核

分类 资讯 标签 DeepSeek、 In-training Optimization、 LORA、 Prompt Engineering、 低算力优化、 微调整解 发表评论

一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

2025年2月22日16时 作者 机器之心

多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

分类 学术、 资讯 标签 LORA、 S-LORA、 Triton、 低秩适配、 大型语言模型、 混合专家 发表评论

X-R1: 3B中文推理开源, 支持LoRA训练

2025年2月19日14时 作者 PaperAgent

X-R1更新日志包括支持LoRA训练、发布中文训练配置及模型,成功进行大规模强化学习训练,增加标准实验脚本,支持3B模型的中文推理,并在Ascend 910B上运行成功。

分类 分享 标签 7500、 LORA、 X-R1-1.5B、 X-R1-3B、 华为Ascend 910B、 奖励曲线 发表评论

炒菜、雕刻、绘画、汽车人变形!MakeAnything用扩散Transformer解锁多任务过程生成

2025年2月15日16时 作者 机器之心

AIxiv专栏介绍及最新研究成果MakeAnything通过Diffusion Transformer与非对称LoRA,实现了从结果到过程的转化,并在多个实验任务中取得了良好的效果。

分类 学术、 资讯 标签 LORA、 MakeAnything、 Recraft、 图文一致性、 泛化性能、 逻辑连贯性 发表评论

不容错过!Oumi 平台,集训练、评估、部署于一体的 AI 神器

2025年2月15日14时 作者 小兵的AI视界

据准备、模型训练到评估和部署,每一个环节都充满挑战,如何简化整个
AI
模型开发生命周期,是亟待解决

分类 开源 标签 LORA、 Oumi、 oumi-ai、 SFT、 模型训练、 科研探索 发表评论

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

2025年2月7日16时 作者 机器之心

版能训练哪种大模型?本文为那些 GPU 资源有限时使用 GRPO 训练的开发者提供了宝贵的指导。
自

分类 学术、 资讯 标签 gradient_accumulation_steps、 GRPO、 LORA、 max_completion_length、 max_prompt_length、 Num Generations 发表评论

字节跳动BitsAI-CR:基于LLM的代码审查系统技术揭秘

2025年2月3日23时 作者 机器之心

字节跳动首次披露其内部代码审查系统BitsAI-CR的技术细节,通过两阶段评论生成架构实现75%的审查准确率和26.7%的评论过时率。

分类 学术、 资讯 标签 BitsAI-CR、 LORA、 Tree-sitter、 代码审查系统、 外部验证、 字节跳动 发表评论

从智能体到世界模型,2025年AI行业还会发生哪些大事?

2025年1月13日22时 作者 AI新榜

今日头图使用豆包创作,提示
词“像素风,电脑屏幕上显示文字’2025 AI趋势’,科技感,蓝紫色主题

分类 资讯 标签 3D模型、 LLM、 LORA、 世界模型、 多模态预训练、 就业市场 发表评论

一篇推文看一年!Jim Fan力荐2025必读清单:50篇论文,扫盲「全领域AI实战」

2025年1月9日23时 作者 新智元

新智元报道
编辑:LRS
【新智元导读】
10个AI领域,50篇精品论文,每周看一篇,到2026就能

分类 资讯 标签 DPO、 LORA、 Orca、 PRM800k、 QLORA、 ReFT 发表评论
较早文章
较新文章
← 上一页 页面1 页面2 页面3 页面4 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 10 月
一 二 三 四 五 六 日
 12345
6789101112
13141516171819
20212223242526
2728293031  
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×