数据并行训练要OUT?谷歌三大研究团队合力推出“DiLoCo缩放定律”,打开AI训练新大门!
谷歌团队提出了一种新的分布式训练方法DiLoCo,该方法旨在解决超大规模语言模型(LLMs)的训练挑战。研究表明,DiLoCo在保持模型质量的同时能够显著提高扩展性,并且具有可预测和稳健的优势。
谷歌团队提出了一种新的分布式训练方法DiLoCo,该方法旨在解决超大规模语言模型(LLMs)的训练挑战。研究表明,DiLoCo在保持模型质量的同时能够显著提高扩展性,并且具有可预测和稳健的优势。
Transformer模型可能迎来新变化。一篇最新论文提出无需归一化的Transformer模型能够达到甚至超过带有归一化层的性能,通过动态双曲正切函数(DyT)替代传统归一化层,有望进一步改进AI模型性能。
英特尔新任CEO陈立武任命引发关注。他将带领陷入困境的英特尔实现转型突破。作为半导体行业元老级人物,陈立武拥有广泛人脉和技术背景。尽管面临技术落后和市场竞争激烈等难题,但外界期待其能带领英特尔重振旗鼓。
OpenAI发布Responses API等工具简化AI代理开发,旨在构建实用可靠的AI Agent。新API结合了Chat Completions和Assistants API功能,并包括内置搜索、文件搜索和计算机使用工具。未来还将推出更多集成工具。
2025年DeepSeek在国内引发“现象级”浪潮。Smart Brain与DeepSeek联合推出面向政府和企业用户的万元级AI智能一体机,整合了Smart Brain平台与DeepSeek技术,旨在推动AI技术在各行业的应用普及。
Manus是一款融合开源社区技术的通用AI Agent产品,其用户增长迅速。尽管在实际体验中有褒贬不一的声音,但Manus展示了在‘AI拼装’方面的可圈可点的技术探索,并计划进一步开放其核心技术细节。
具身智能赛道迎来新一轮技术变革。智元机器人团队发布通用具身基座大模型Genie Operator-1(GO-1),提出ViLLA架构,通过多模态信息处理实现小样本快速泛化和卓越操作能力。
企业通过DeepSeek等AI模型加速业务场景中的应用落地,提升效率和创新能力。主办方推出为期2天的工作坊及后续陪跑服务,涵盖技术原理、应用场景和实际案例分析等内容。