突发!大佬再就业,OpenAI前CTO Mira,Lilian Weng等成立「思考机器实验室」
OpenAI前CTO Mira宣布成立新公司Thinking Machines Lab,目标是让每个人都能用上最前沿的AI技术。团队成员来自知名AI产品与开源项目。核心方向包括以人为本的多模态协作、灵活定制和坚实基础等。
OpenAI前CTO Mira宣布成立新公司Thinking Machines Lab,目标是让每个人都能用上最前沿的AI技术。团队成员来自知名AI产品与开源项目。核心方向包括以人为本的多模态协作、灵活定制和坚实基础等。
DeepSeek发布原生稀疏注意力(NSA)技术,旨在提升大语言模型处理长文本的能力和效率。NSA通过动态分层稀疏策略结合粗粒度的Token压缩和细粒度的选择优化,实现了高效长文本建模,实验结果显示NSA在多个任务中超越了Full Attention模型,并显著提升了计算速度。
马斯克旗下xAI公司发布新模型Grok 3,其算力强大、性能卓越。Grok 3在计算量上较前代提升10倍,并在各种基准测试中表现优异。该模型分为通用版本和推理模式两种形态,且包含一个智能体Deep Search。目前仅对X平台Premium+订阅用户开放。
DeepSeek-R1 开源且功能强大,MiniMax 官方已将其接入自家 AI 助手平台 MiniMax Chat 并提供限时免费服务。用户可通过选择 ‘模型选择’ 下拉列表中的 ‘DeepSeek-R1’ 来使用该模型,支持回答各种问题和评论 OpenAI。但目前仅限基于训练数据的问答功能,未来将增加联网搜索能力。
Polymath 是一家教育科技公司,旨在通过结合游戏化机制与自适应数学课程来吸引年轻儿童的关注。该公司开发了一款名为 Polymath 的沙盒游戏,让孩子在虚拟岛屿上学习数学的同时进行建造和互动。
清华大学博士生木易介绍如何使用KTransformers库在RTX 4090 GPU上运行DeepSeek-R1/V3模型,包括环境搭建、模型加载及推理参数设置等步骤。
文章概述了人工智能(AGI)的发展趋势和影响,并提出了三个观察点。AGI被视为能够解决复杂问题的人工智能系统,预计在未来十年内会变得普遍可用。文章讨论了AI成本下降、社会经济价值提升等现象,同时强调了正确决策、韧性和适应能力的重要性。