DeepSeek 论文夺冠,智谱开源 GLM-4.5,OpenAI 学习模式上线! AI Weekly 7.28-8.3
斩获 ACL 最佳论文
:梁文锋团队的原生稀疏注意力技术将长文本处理速度提升 11 倍,可支持百万
斩获 ACL 最佳论文
:梁文锋团队的原生稀疏注意力技术将长文本处理速度提升 11 倍,可支持百万
谷歌最强数学模型Gemini 2.5 Deep Think正式上线,仅限Gemini Ultra用户使用。该模型能在4.5小时内解出6题中的5道,并在国际数学奥林匹克竞赛中以35分成绩摘金。Deep Think模式提供更快、更复杂的推理输出,主要面向科研和复杂项目设计等高难度任务。
型,包括
Qwen3-235B-A22B-Thinking-2507
、
Qwen3-Coder
和
最近国产大模型竞争激烈,阿里Qwen发布新版本Qwen3-235B-A22B-Instruct-2507及Qwen3-Coder。Qwen3-235B-A22B-Instruct-2507为纯非推理模型,性能优于Kimi K2和Claude 4 Opus;Qwen3-Coder采用MoE架构,支持代理式编程任务,并提供命令行工具以接入开发环境。
吴恩达在Y Combinator举办的AI Startup School上分享了《Building Faster with AI》,强调执行速度是创业成功的关键因素。他提出,AI时代创业更看重的是实际行动和快速试错的能力,而不是完美的点子或长期的技术研发。
Kiro 是亚马逊推出的一个 AI 编程 IDE,旨在解决使用 AI 编程时原型生成快但生产质量差的问题。它提供从需求到生产的完整开发流程,并支持 Claude 模型以自动生成开发文档、设计图和测试计划。目前处于预览阶段,需要加入候补名单才能获取安装包。
员历程,团队从
Claude 3.5 Sonnet v1
和
Qwen
起步,升级至
Claude
OpenAI发布ChatGPT Agent,让聊天机器人不仅能回答问题还能‘动手’做任务。Agent内置浏览器、终端等工具箱,能自主完成如打开网页、运行代码、修改表格等多种操作,并具备一定的安全机制和权限控制。