跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

模型训练

“AI大神”李沐终于开源新模型,爆肝6个月,上线迅速斩获3.6k stars!

2025年7月25日16时 作者 AI前线

一个音频基础模型,构建在 Llama-3.2-3B 基础之上,预训练数据包括超过 1000 万小时的

分类 资讯 标签 DualFFN、 Higgs Audio、 V2、 数据处理、 模型训练、 生成式变体 发表评论

史上最强AI代码大模型发布

2025年7月24日12时 作者 路过银河AI

0B-A35B-Instruct 与 Qwen3-235B-A22B-Instruct-2507 。

分类 分享、 大模型 标签 VLLM并行、 学习率调整、 序列并行、 微批量大小、 模型稳定性、 模型训练 发表评论

在OpenAI上班有多卷?离职员工爆料:7周打造Codex,每天熬到凌晨

2025年7月19日16时 作者 机器之心

en
揭秘 OpenAI 打工日常。
一直以来,OpenAI 都是媒体的重点关注对象,尤其在多位核心

分类 学术、 资讯 标签 Codex、 GPU计算优化、 安全性措施、 快速迭代、 智能化开发、 模型训练 发表评论

独白:OpenAI前员工的深度反思

2025年7月17日16时 作者 AI工程化

他任职期间,公司员工人数从约1000人激增至超过3000人。他亲身经历并参与了备受瞩目的Codex项

分类 分享 标签 AGI、 OpenAI、 伦理问题、 合作伙伴、 模型训练、 责任感 发表评论

还在为AI数据发愁?张文涛和鄂维南院士团队推出Data-centric AI系统

2025年7月8日23时 作者 机器之心

。然而,这些公司通常并不公开其原始数据及数据处理工具,使得学术界在大模型训练数据的构建与优化方面难以

分类 学术、 资讯 标签 DataFlow、 NumPy、 pandas、 PyTorch、 模型训练、 算子组合 发表评论

TPAMI 2025|低分辨率自注意力LRSA:语义分割的高效新范式

2025年7月1日23时 作者 极市干货

提出低分辨率自注意力(LRSA)机制及LRFormer模型,通过在固定低维空间计算全局注意力,大幅降

分类 学术 标签 低分辨率自注意力、 性能提升、 模型训练、 硬件平台、 视觉Transformer、 计算复杂度 发表评论

张鹏对谈李广密:Agent 的真问题与真机会,究竟藏在哪里?

2025年6月14日11时 作者 Founder Park

4o 和 Claude 3.5 接连登场,大模型的边界一次次被重写。但真正让 AI 产业链神经绷紧的

分类 资讯 标签 AGI、 凯祺、 广密、 推理能力、 模型训练、 跨模态 发表评论

OpenAI 高管深度剖析 ChatGPT 意识形成:AI 越像人,设计者越不能装作什么都没发生

2025年6月6日16时 作者 APPSO

永远在线,永远耐心,永远不会打断你。你崩溃,它会安慰你;你自我怀疑,它也会用熟悉的语气肯定你。
觉得

分类 资讯 标签 亲和力语言、 伦理技术设计、 功能说明、 模型训练、 用户反馈、 社会科学研究 发表评论

中文命名实体识别

2025年5月25日11时 作者 NLP工程化

阶段是联合训练下游任务模型和预训练模型,来实现中文命名实体识别任务。
一.任务和数据集介绍
1.命名

分类 开源 标签 下游任务、 代码、 模型训练、 超参数调整、 预训练模型、 验证集 发表评论

腾讯混元TurboS技术报告首次全公开:560B参数混合Mamba架构,自适应长短链融合

2025年5月23日8时 作者 AI前线

混元旗舰大语言模型TurboS位列全球
第7,在国内大模型中仅次于Deepseek。放眼国际,排在前

分类 资讯 标签 人工智能、 应用场景、 技术研究、 模型训练、 算法改进、 腾讯混元TurboS 发表评论
较早文章
页面1 页面2 页面3 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×