必看!VividTalk:阿里、南大等联合打造,一张照片+音频秒变说话头像视频黑科技

VividTalk是南京大学、阿里巴巴、字节跳动和南开大学联合开发的人工智能技术项目,通过音频驱动生成逼真的说话头像视频。该项目采用先进的3D混合先验技术和双分支运动-VAE(变分自编码器)来实现高质量的视觉效果和自然同步对话。

骑手因包装破损被华为店索赔1.5万进展:三千元赔款已退还

杭州闪送骑手李师傅因配送华为平板电脑外包装破损遭索赔15000元。后经协商降至3000元并全额退还,但平台未经同意直接从其账户中扣款引发争议。律师指出,商家无权单方面高额索赔,赔偿金额应遵守合同约定。

SFT并非必需!推理模型仅靠RL就能获得长思维链能力,清华CMU团队破解黑盒

研究团队通过对比SFT和RL两种方法发现,长CoT的生成需要大量的计算资源。他们提出了四个关键发现:SFT并非必需但能简化训练并提高效率;推理能力随着训练计算增加而出现,但并非总是如此;可验证奖励函数对增长CoT至关重要;基模型中的错误修正等技能需要通过RL有效地激励。

阿里挖来AI大牛许主洪,接下来目标明确:要靠多模态打通AI应用了

阿里巴巴任命人工智能科学家许主洪加入集团副总裁职位,专注于AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。作为BLIP系列的研究者,他在多模态预训练方面有丰富经验,并成功将其研究成果转化为应用产品。阿里重组整合通义、夸克等产品力量,打造更具竞争力的AI To C新生态。