豆包推出全新稀疏模型架构 UltraMem了
字节跳动豆包团队提出UltraMem架构,通过分层动态内存结构、Tucker分解检索和隐式参数扩展三项创新突破MoE架构的瓶颈,推理成本降幅最高83%,速度提升6倍,入选ICLR 2025。
字节跳动豆包团队提出UltraMem架构,通过分层动态内存结构、Tucker分解检索和隐式参数扩展三项创新突破MoE架构的瓶颈,推理成本降幅最高83%,速度提升6倍,入选ICLR 2025。
字节跳动开源VideoWorld视频生成模型,无需语言模型即可学习时空动态规律,降低技术门槛,具有广泛应用前景。但存在抽象概念建模困难、算力需求高等挑战。
谷歌DeepMind AlphaGeometry系列通过神经符号混合架构解决国际数学奥林匹克几何问题,显著提升解题效率和成功率。但其仍受限于预设规则和复杂推理能力不足等问题。
春节前夕发布的大语言模型R1给市场带来了全新活力,重塑了光通信产业。DeepSeek低成本AI模型大幅降低了成本壁垒,使得光通信成为AI数据传输的最佳选择,并推动了其在智慧城市、智能制造等领域的应用拓展。
OpenAI推出Operator智能体,能够执行多种任务提高办公效率,成为数字员工。其市场前景包括电商秒杀、旅行规划等应用场景,并带动产业链上下游合作发展。
LG电子发布订阅制AI智能体Q9,标志着正式踏入人形机器人市场,带来新的变革趋势和应用前景。人形机器人的出现缓解了人口老龄化带来的劳动力短缺问题,并在医疗护理、家庭服务等领域发挥重要作用。