数据并行训练要OUT?谷歌三大研究团队合力推出“DiLoCo缩放定律”,打开AI训练新大门!

谷歌团队提出了一种新的分布式训练方法DiLoCo,该方法旨在解决超大规模语言模型(LLMs)的训练挑战。研究表明,DiLoCo在保持模型质量的同时能够显著提高扩展性,并且具有可预测和稳健的优势。

重磅论文!何恺明、Yann LeCun等改造Transformer,CVPR 2025已收录

Transformer模型可能迎来新变化。一篇最新论文提出无需归一化的Transformer模型能够达到甚至超过带有归一化层的性能,通过动态双曲正切函数(DyT)替代传统归一化层,有望进一步改进AI模型性能。

英特尔任命新CEO陈立武,华人掌舵成为半导体巨头起飞的共性“秘诀”?

英特尔新任CEO陈立武任命引发关注。他将带领陷入困境的英特尔实现转型突破。作为半导体行业元老级人物,陈立武拥有广泛人脉和技术背景。尽管面临技术落后和市场竞争激烈等难题,但外界期待其能带领英特尔重振旗鼓。

OpenAI凌晨突放大招!抛出一套智能体开发API和工具包,助力开发者构建AI代理!

OpenAI发布Responses API等工具简化AI代理开发,旨在构建实用可靠的AI Agent。新API结合了Chat Completions和Assistants API功能,并包括内置搜索、文件搜索和计算机使用工具。未来还将推出更多集成工具。

万元级AI超算!一键开启企业AI新范式!满血DeepSeek本地部署“神器”,开箱即用

2025年DeepSeek在国内引发“现象级”浪潮。Smart Brain与DeepSeek联合推出面向政府和企业用户的万元级AI智能一体机,整合了Smart Brain平台与DeepSeek技术,旨在推动AI技术在各行业的应用普及。

技术大揭底!备受争议的Manus没用MCP、整合了29项工具,基于模型Claude和Qwen

Manus是一款融合开源社区技术的通用AI Agent产品,其用户增长迅速。尽管在实际体验中有褒贬不一的声音,但Manus展示了在‘AI拼装’方面的可圈可点的技术探索,并计划进一步开放其核心技术细节。

比美国Figure AI更进一步!“稚晖君”团队抛出最新具身基座大模型GO-1,提出ViLLA架构

具身智能赛道迎来新一轮技术变革。智元机器人团队发布通用具身基座大模型Genie Operator-1(GO-1),提出ViLLA架构,通过多模态信息处理实现小样本快速泛化和卓越操作能力。