月度归档: 2025 年 2 月
刚刚,DeepSeek放出重磅论文!梁文锋亲自参与!
论文提出原生稀疏注意力(NSA)技术,有望大幅提升大语言模型处理长文本的能力和效率。NSA结合动态分层稀疏策略与硬件优化,显著提升计算速度并在训练中支持端到端训练。实验表明使用NSA预训练的模型在多个任务上性能超越Full Attention模型,并且在64k长度序列下实现显著加速。
20万卡吞金兽 Grok 3 炸裂登场,卡帕西大神亲测:性能超过DeepSeek R1!马斯克:短期不开源
克再次成为全球焦点。2 月 12 日,这位科技狂人在迪拜世界政府峰会上透露,其旗下的人工智能公司 x
春晚BOT扭秧歌的科技“秘籍” 文末赠书
蛇年春晚表演的机器人舞蹈《秧 BOT》引来广泛关注。宇树 H1 福兮利用高精度 SLAM 自主定位、多智能体协同规划等技术实现精准定位和队形稳定同步,展示了机器人在复杂环境中的应用能力。
吴永辉是谁?字节AGI计划一号位,谷歌AI扫地僧
字节跳动大模型团队再添强将。Google Fellow吴永辉加盟,加入Seed基础研究负责人职位。他曾是谷歌神经机器翻译项目及Rank Brain项目的贡献者,并参与了谷歌大模型Gemini的研发工作。
马斯克正式发布Grok 3,竞技场首超1400分、Karpathy实测推理能力好于DeepSeek
这样的评价:
Grok 3是首个突破1400分的模型,并且在所有类别中排名第一。
而且,Grok 3
马斯克发布地表最聪明 AI!号称超越 DeepSeek R1,20 万张卡砸出的「奇迹」
马斯克发布Grok 3,这款新版本采用最佳预训练模型并继续使用强化学习进行训练。它在LMSYS盲测中排名首位,并且在超级订阅计划下提供额外的推理和DeepSearch查询功能。Grok 3还包含了一个被称为下一代搜索引擎的DeepSearch产品。
AI看照片,几秒就能地理定位!因太危险被公司主动关闭,正向警方推销
GeoSpy是一款革命性的照片地理定位系统,能够仅基于一张照片精确确定其拍摄地点。该技术利用深度学习和大规模数据集来识别图像中的特征,并结合地图提供详细的3D实景地图。