跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

NLP工程化

Search-R1:高效、可扩展的强化学习训练框架

2025年3月2日8时 作者 NLP工程化

高效、可扩展的强化学习训练框架Search-R1,支持3B规模的基础LLM,通过规则化奖励机制让LLM自主学会推理和搜索,提供完整的训练流程和工具支持。

分类 开源 标签 30亿参数、 Alibaba Cloud、 Search-R1、 大型语言模型、 强化学习、 规则化奖励机制 发表评论

Prompt Optimizer:一个强大的提示词优化工具

2025年3月2日8时 作者 NLP工程化

Prompt Optimizer:一键提升AI回复准确度的工具,支持多轮智能优化及主流AI模型,数据安全无忧。

分类 开源 标签 主流AI模型、 功能一键提升、 多轮智能优化、 提示词优化工具、 数据安全、 精准AI回复 发表评论

一款基于 AI 的趋势发现和内容发布系统:TrendPublish

2025年3月1日8时 作者 NLP工程化

GitHub 上的 TrendPublish 是一款基于 AI 的趋势发现和内容发布系统,支持多源数据采集、AI 智能处理,并可将内容自动发布到微信公众号。

分类 开源 标签 AI、 OpenAISpace、 TrendPublish、 多源数据采集、 微信公众号自动化发布系统、 自定义模板 发表评论

DeepSeek Profile Data:深度剖析计算与通信重叠策略

2025年3月1日8时 作者 NLP工程化

DeepSeek Profile Data详细介绍V3/R1版本中计算与通信重叠策略,并提供详细的性能分析数据,使用PyTorch Profiler可视化。

分类 开源 标签 DeepSeek Profile Data、 MoE路由策略、 PyTorch Profiler、 V3/R1版本、 性能分析数据、 计算与通信重叠策略 发表评论

DeepSeek在开源周最后一天发布的萤火文件系统 (3FS)

2025年3月1日8时 作者 NLP工程化

DeepSeek发布的萤火文件系统3FS专为AI训练中的模型批量读取样本数据场景设计,通过Direct IO和异步对齐的读取方式提高性能,减少了服务端的数据加载时间。

分类 开源 标签 3FS、 AI训练、 Direct IO、 RDMA Read、 萤火文件系统、 高效支持 发表评论

DeepSeek开源的EPLB:用于专家并行负载均衡的开源算法

2025年3月1日8时 作者 NLP工程化

DeepSeek开源的EPLB算法用于优化多GPU深度学习模型训练,提升效率并支持灵活的负载均衡策略,代码开源方便部署。

分类 开源 标签 DeepSeek、 EPLB、 多GPU负载均衡、 层级和全局策略、 深度学习模型训练、 高效负载平衡 发表评论

与 Agentic AI 相关的开源项目

2025年2月27日16时 作者 NLP工程化

Gartner 2025 技术预测中将 Agentic AI 放在首位,AutoGPT、Agent-GPT 等代表产品介绍及其特点。

分类 开源 标签 2025、 Agent-GPT、 AutoGPT、 BabyAGI、 Camel、 Gartner 发表评论

训练您自己的推理 LLM

2025年2月27日16时 作者 NLP工程化

通过Unsloth技术减少90%VRAM使用量训练自己的推理LLM模型

分类 开源 标签 90%、 DeepSeek、 GRPO、 LLM、 unsloth、 VRAM 发表评论

PDF识别大模型 olmOCR-7B-0225-preview

2025年2月27日16时 作者 NLP工程化

A 7B model in BF16 format, quantized to around 4GB, can be used on ordinary computers. Reference: https://huggingface.co/allenai/olmOCR-7B-0225-preview.

分类 开源 标签 4GB左右、 BF16格式、 OLMOCR-7B-0225-preview、 付费星球、 深度学习模型、 阿里巴巴 发表评论

提升Grok-3等大模型交互效率和效果的提示词工程技巧

2025年2月27日16时 作者 NLP工程化

围绕如何有效使用Grok-3模型进行提示词工程,文章介绍了Prompt的基本结构框架,并举例说明了提升效率的六个Top Grok-3 Prompt示例。

分类 开源 标签 Grok-3、 基本结构框架、 应用场景、 提示词工程、 知识星球、 角色扮演 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面59 页面60 页面61 … 页面92 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 阿里开源Qwen-Image,AI会写汉字了!
  • 登Science,David Baker团队提出无序区域结合蛋白设计新方法,专攻不可成药靶点
  • OpenAI 开源gpt-oss权重,Huggingface开源微调gpt-oss权重方法
  • 科研自动化的全流程智能平台AI-Researcher
  • 突发!传智元机器人联合创始人 “ 闫维新 ” 将离职

2025 年 8 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 7 月    

归档

  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×