跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

音频质量

阿里通义开源首个CoT音频模型,音·画同步被狠狠拿捏了

2025年7月1日16时 作者 量子位

,来快速感受一下最新feel:
模拟婴儿哭声,那叫一个高低起伏、荡气回肠,整个节奏和婴儿表情姿态神同

分类 资讯 标签 ThinkSound、 刘华岱、 多样化视频、 门控融合机制、 音频质量 发表评论

OCTAVE TTS:首个能理解说话内容的文本转语音模型

2025年3月8日8时 作者 NLP工程化

OCTAVE TTS首个理解说话内容的文本转语音模型,音频质量、自然度超70%用户偏好,能生成多样化语音。

分类 开源 标签 Hume.ai、 Octave、 多样化语音效果、 文本转语音模型、 自然度、 音频质量 发表评论

Techivation 发布 M-De-Esser 2 AI插件限时优惠

2025年2月6日19时 作者 AI音频时代

Techivation 发布了M-De-Esser 2插件的更新版本,改进包括自适应处理范围、AI混音助手等功能,旨在提供更透明、更精确的去咝声效果。

分类 分享 标签 45 美元、 M-De-Esser、 Techivation、 智能功能、 音频质量、 频域处理 发表评论

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Agent101第五课:开始学习LangGraph
  • 智力触顶?GPT-5要拼体验了
  • GPT-5 之后,我们离 AGI 更近了,还是更远了?
  • 开源UI到代码生成工具!模块化多智能体,精准还原,支持快速原型与前端自动化!
  • GPT-5刚刚正式发布,首次面向免费用户开放

2025 年 8 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 7 月    

归档

  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×