这个扩散LLM太快了!没有「请稍后」,实测倍速于Gemini 2.5 Flash

Mercury 是一款专为聊天应用设计的扩散 LLM,其速度和效率显著提升,能够实现即时响应。Inception Labs 在 X 上宣布了这款新产品,它在性能测试中表现优异,接近 GPT-4.1 Nano 和 Claude 3.5 Haiku 等前沿模型。

SkyReels-Audio:让肖像”动”起来 – Skywork AI开创全能音频驱动的人像视频生成技术

SkyReels-Audio 是 Skywork AI 团队开发的一款创新框架,能够将静态图像或视频与语音输入相结合,生成高度逼真且唇形同步的说话人像视频。该框架基于预训练的视频扩散变换器构建,支持无限长度的视频生成和编辑,并提供多模态控制能力。

荣耀启动IPO:历经分拆与换帅,欲冲刺AI终端生态第一股

荣耀成功完成上市辅导备案,计划成为A股市场首家以AI终端生态为核心定位的企业。然而,其面临市场份额下滑的挑战。新任CEO李健掌舵下,荣耀正致力于进行深刻的AI转型,以重塑市场地位。

阿里发布信息检索Agent,可自主上网查资料,GAIA基准超越GPT-4o 模型&数据开源

阿里发布WebDancer,作为端到端自主信息搜索智能体。它能实现复杂任务如网页遍历、信息搜索和问答,并已开源训练框架。通过四阶段训练范式提升推理、工具使用及泛化能力,已在GAIA和WebWalkerQA上取得显著成绩。