跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

月度归档: 2025 年 2 月

手把手教你驯服DeepSeek-R1!部署+测试+性能优化万字全攻略

2025年2月27日23时 作者 极市干货

何部署和测试DeepSeek-R1模型,涵盖了从Ollama到vLLM的多种推理框架的安装与配置,并

分类 学术 标签 ITL、 Throughput、 TPOT、 TTFT、 并发请求数、 网络通信 发表评论

DeepSeek开源优化并行策略,提升训练和通信效率

2025年2月27日23时 作者 AIGC开放社区

专注AIGC领域的专业社区分享了开源优化并行策略DualPipe和EPLB。DualPipe用于V3/R1训练中减少流水线气泡,显著提高效率;EPLB通过动态调整专家负载保持平衡,避免通信开销增加。

分类 资讯 标签 DeepSeek、 DualPipe、 EPLB、 MoE模型、 大语言模型、 微软 发表评论

微软AI技术进阶课第4期【文档智能技术】,锁定3月1日20:00-21:30~

2025年2月27日23时 作者 AIGC开放社区

通过下方二维码加入训练营交流群,参与直播并完成注册可获得微软认证结业证书及社区礼包。

分类 资讯 标签 x AIGCOPEN、 前三名、 微软、 文档智能技术、 结业大礼包、 认证结业证书 发表评论

所有人都可以大规模预训练MAE – 16倍加速!

2025年2月27日23时 作者 极市干货

本文提出了一种基于原型驱动的课程学习框架,用于改进掩码图像建模(MIM)的训练过程。在同样的训练时间下,该方法比标准 MAE 训练快16倍学会 NN 任务的视觉表示。

分类 学术 标签 100 epoch、 Masked Image Modeling (MIM)、 好想吃鸡柳@知乎、 极市平台、 稳定性与效率提升、 课程学习方法 发表评论

苹果开源通用视觉模型:创新训练方法,超1000颗星

2025年2月27日23时 作者 AIGC开放社区

苹果开源的AI模型AIMv2结合图像和文本信息进行预训练,展示了出色的表现。

分类 资讯 标签 AIMv2、 图像与文本整合、 开放词汇对象检测、 苹果、 识别精度89.5%、 通用多模态视觉模型 发表评论

DeepSeek开源周Day 4:并行优化策略三连发,梁文峰亲自参与开发

2025年2月27日19时 作者 硅星GenAI

DeepSeek发布三项开源项目,包括DualPipe、EPLB和Profile-data,旨在优化模型训练中的并行策略,减少通信开销,提升GPU利用率。

分类 分享 标签 Alibaba Cloud、 DeepSeek-V3、 DualPipe、 EPLB、 专家并行处理、 智能负载均衡器 发表评论

增长还是盈利:创始人该如何掌控自己的命运?

2025年2月27日19时 作者 硅谷科技评论

动化分析和智能客服的企业解决方案,目标客户是中小型跨境电商企业。两年前,这家公司还在依赖补贴拉新、烧

分类 分享、 资讯 标签 AI、 专利、 初创公司、 大模型、 投资人、 独角兽 发表评论

与 Agentic AI 相关的开源项目

2025年2月27日16时 作者 NLP工程化

Gartner 2025 技术预测中将 Agentic AI 放在首位,AutoGPT、Agent-GPT 等代表产品介绍及其特点。

分类 开源 标签 2025、 Agent-GPT、 AutoGPT、 BabyAGI、 Camel、 Gartner 发表评论

训练您自己的推理 LLM

2025年2月27日16时 作者 NLP工程化

通过Unsloth技术减少90%VRAM使用量训练自己的推理LLM模型

分类 开源 标签 90%、 DeepSeek、 GRPO、 LLM、 unsloth、 VRAM 发表评论

PDF识别大模型 olmOCR-7B-0225-preview

2025年2月27日16时 作者 NLP工程化

A 7B model in BF16 format, quantized to around 4GB, can be used on ordinary computers. Reference: https://huggingface.co/allenai/olmOCR-7B-0225-preview.

分类 开源 标签 4GB左右、 BF16格式、 OLMOCR-7B-0225-preview、 付费星球、 深度学习模型、 阿里巴巴 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面13 页面14 页面15 … 页面241 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 阿里开源Qwen-Image,AI会写汉字了!
  • 登Science,David Baker团队提出无序区域结合蛋白设计新方法,专攻不可成药靶点
  • OpenAI 开源gpt-oss权重,Huggingface开源微调gpt-oss权重方法
  • 科研自动化的全流程智能平台AI-Researcher
  • 突发!传智元机器人联合创始人 “ 闫维新 ” 将离职

2025 年 2 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
2425262728  
« 1 月   3 月 »

归档

  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×