B站神级配音AI被曝光!一个「意外泄露」的视频,让鬼畜区UP主都沉默了

最近一个文本转语音模型演示版本在 Reddit 上火了,该模型能生成逼真且有情感的声音。IndexTTS2 模型展示了 AI 如何通过端到端的语音合成过程实现自然语言指令的情感控制,并已在多个评估基准上取得最优表现。

今年最火 AI 视频 Veo 3 大更新!上传一张图,家里的猫和鲁迅就能开口「吐槽」 附实测

VeO3 最新更新支持图片生成开口说话的视频,包括声音和动作。用户能上传一张静态图片加上文字脚本,就能生成带有语音同步的视频。Gemini 平台提供了多种选项如首帧转视频、使用 Gemini 和 Flow 生成连贯短片等。

新版 Kimi 突然发布!首个万亿开源模型不是 R2 是 K2,OpenAI 临时推迟开源 附实测体验

不到半年,国产开源大模型经历了显著变化。DeepSeek凭借高性能和性价比迅速崛起并主导了这一领域。目前,Kimi 推出的 K2 模型在多任务中表现出色,并通过官方部署支持主流推理引擎。