国产AI音乐王炸!Mureka V7 品质飞跃+TTS V1 打字造声音,网友:继 O1 超越 Suno 后再放大招!

国内首个音乐 ChatGPT,Mureka再次迎来大升级。

Mureka 原有版本:

基座模型 Mureka V6:引入 ICL 技术,带来更开阔的声场,强化了人声质感和混音设计。

首款音乐推理大模型 Mureka O1:具备音乐思考能力,音乐结构更加连贯,乐器编排更加精准。
Mureka O1 发布后,更是一举超越 Suno,登顶全球音乐大模型 TOP 1。

而这次的Mureka V7,更强大、更完美:

  • 音乐品质更好:旋律动机和编曲质量大幅提升,人声和乐器的真实感更强,做出来的每一首歌都好听。

  • 音乐创新性更强:生成的作品对音乐从业者更具启发和创意

Mureka V7 音乐引擎

多种模型 自由创作

在模型界面,用户可以选择Mureka O1、Mureka V6和Mureka V7多个模型进行创作。

可以直接通过Mureka的网页端体验Mureka V7:

www.mureka.cn

打开Mureka官网,可以直接到达创作页面。歌曲创作有简单模式和高级模式。高级模式下,输入你想创作的歌曲名称,可以直接让AI生成相应的歌词。

MurekaV7:创作一首【中国古风与Lo-Fi Hip Hop】融合的音乐。保留古筝和笛子作为主旋律乐器,但配上慵懒、舒缓的Lo-Fi鼓点和温暖的黑胶唱片底噪。

前奏笛声一起,鸡皮疙瘩都出来了。

官方还提供了许多v7生成的有意思的例子:

  • 倾诉衷肠的叙事型乡村音乐

  • 婉约凄美的中国风歌曲

  • 展现童趣的欢快儿歌

 另外,O1生成的这首彩华,质量也是相当高:
  

以上是直接提示生成音乐。但Mureka 还有参考歌曲功能:

你可以上传一首参考歌曲,或者直接粘贴抖音链接,Mureka V7 就能基于你提供的音乐风格、节奏、情绪,定向生成与之呼应的新作品。

它内置的「音乐参考(Reference)」功能,会自动识别上传音乐的类型、节奏、配器和情感氛围,确保生成的作品在美学风格上保持一致性。

更厉害的是,Mureka 还是全球首个支持自定义音色的 AI 音乐平台。

不仅能选择歌手音色,甚至可以上传自己的声音,让 AI 为你“定制演唱”。

我自己试的时候,用《琵琶行》作为参考歌曲,选了一个二次元角色的音色:原神 · 芙宁娜,让它唱《将进酒》。

选好后,把歌词贴在左侧输入框就可以开始生成了。

这次用的参考音色是一个 AI 合成的二次元声线,再被 Mureka 克隆并演唱,虽然自然度上稍逊原生音色,但它的好处在于“可控” —— 你可以听到自己想听的声音,不再被预设所限制: 

如果不加参考音色,AI 的表现更稳定,流畅度更好,说实话,搞得还挺抽象:

不过将诗词与音乐结合,也是 不断扩展艺术边界,诗与乐相和,古诗词在 AI 的赋能下,完成了多样的艺术表达

而上面这个视频也是用 Mureka 生成的。

每次生成,它都会给出两首不同风格的版本供你选择。
歌曲生成后,你不仅可以一键发布、分享链接,还能让 AI 根据歌词自动生成一段匹配的动态视频。

在别人还在用千篇一律的 BGM 发短视频时,
用上 Mureka V7,每一个想被记录的瞬间,都能拥有一首专属的旋律,甚至一段专属的画面。

又或者整一首《跳楼机》风格的伤感现代曲,也别有味道。

 虽然这个音色还是用的上面那个,但是有点像:

继续,下面这个纯音乐生成功能就很有用了。我自己用的贼欢。

纯音乐生成功能:

Mureka V7 不仅支持通过文字 prompt 生成免版权的纯音乐,还可以上传参考音乐,自动生成类似风格的纯音乐。操作简单高效,一个链接就能复制同款音乐,非常适合用于 vlog、影视制作等。

想用 AI 博主 @赛文乔 一的背景音乐?没问题!只需将其背景音乐提取出来,自己定制生成一首原创音乐,避免了内容同质化问题。


 Mureka V7 生成的BGM:


操作非常简单,只有三步,甚至连提示词都不用填,Mureka 就能自动生成相同风格的 BGM。

这玩意儿我都搞了好几种BGM了。生成的效果都挺棒。 做视频的时候可以用上。

Mureka 的纯音乐生成功能在Vlog、电影、广播、广告、品牌推广、活动等多个领域都能发挥巨大作用。你可以为每个项目量身定制音乐,创造符合气氛和情感的作品。

例如:为一个高端护肤品牌创作广告配乐

提示词:为一个高端护肤品牌创作广告配乐。需要极简、优雅、富有高级感的音乐。以舒缓的钢琴分解和弦和温暖的弦乐为主,节奏从容。重点是,结尾需要一个时长3秒、由几个清脆音符组成的、清晰独特的“声音Logo”,用于产品特写镜头。
  • 赛博朋克雨夜的追逐场景

一首为赛博朋克雨夜追逐场景设计的纯音乐。需要冰冷、迷幻的合成器浪潮(Synthwave)风格,以强劲的复古鼓机节拍为驱动,融合一段空灵、忧郁的萨克斯独奏,整体感觉像是既在逃离,又在追寻。

傍晚驾驶美国66号公路的心情

傍晚时分,独自驾驶一辆老式皮卡,穿越美国66号公路…

清晨,开着车驶入一座雾气缭绕的沿海小镇。一首轻快、清新的独立民谣(Indie Folk),以原声吉他和悠扬的口哨声为主,伴有海鸥和海浪的细微环境音,感觉像电影的开场。

二次创作与歌曲延长

Mureka生成的音乐并不是“一次性”的,你可以对其中的任意片段进行二次创作,实现 AIGC 音乐的“可编辑性”。

默认生成的音乐长度大约为 2 分钟。如果你想继续延长,只需要补充更多歌词,点击“延长”按钮,AI 就能在原有基础上无缝续写,继续生成下去。

最重要的一点是,用Mureka生成的音乐,是可以卖的,而且是具有创作证明的那种!

除了上面这个Mureka V7音乐模型,音频模型这块,也来了个新东西:Mureka TTS V1。

这玩意儿的主打亮点,叫“Voice Design”,声音设计。

啥意思呢?就是你不用再满世界找现成的音色库去做声音克隆了。

现在,你可以直接用打字的方式,告诉模型你想要什么样的声音特征。

“我想要一个沉稳、略带沙哑的中年男性声音,语速偏慢。”

类似这样,直接用文本输入,就能得到对应的音色。

不管是真实人物的声音,还是虚拟角色的,或者是某个配音,都能用文字来控制。

这玩法,算是摆脱了过去只能在现有音色库里挑挑拣拣的限制了。

Mureka TTS V1 模型得分


实际效果如下。由于微信文章上传音频数量限制,我把它整合到一个视频里了:


Mureka V7 技术创新:

良品率

音乐 AI 不该“想到哪唱到哪”,得先有谱再填词

Mureka 团队表示:传统的 AI 音乐生成,基于逐 token 预测的范式,就像个没谱的歌手,一个音符一个音符地往外蹦。

这种自回归 (Autoregressive, AR) 模型,虽然单个音听着还行,但整体听下来,总觉得差点意思。

缺了点连贯的结构和艺术性。

为啥呢?

因为它压根不符合人创作音乐的逻辑。

人写歌,是先有个整体规划,再往里填细节。

所以,Mureka 团队在 V7 版本里,大改了 MusiCoT 这个技术。

MusiCoT,你可以理解成一个专为音乐生成的“链式思维 (Chain-of-Thought)”方法。

它让 AI 在“开口唱歌”前,先学会“谋篇布局”。

先有结构,再有细节

MusiCoT 技术在 AI 开始生成音频之前,会先引导模型搞一份全局的音乐结构规划。

哪是主歌,哪是副歌,情绪怎么走,配器怎么安排,都先想好。

这就解决了传统模型“只顾眼前,不顾大局”的老毛病。

生成的音乐,听起来乐章推进、情绪递进都更自然。

可解释的“音乐思维链”,还能参考风格

MusiCoT 还搞了条能说清楚道明白的“音乐思维链”。

它结合了 CLAP (一种语言-音频预训练模型),让 AI 的创作思路不仅能被分析、被控制,还能输入任意长度的参考音频,作为风格提示。

这样一来,AI 在搞复刻、变奏这些创作时,就更灵活了,也避免了直接抄袭的风险。

Mureka 团队做了大量实验,MusiCoT 技术在主观听感和客观指标上,效果都挺好。

不管是结构完整性、旋律连贯性,还是整体的音乐性,都比传统方法强。

在好几项评测里,表现都达到行业一流水平了。

这个版本里,MusiCoT 不光是在结构上模仿了人的创作思维,还通过 Mureka 团队数据的扩充和 Embedding 信息粒度的细化,让它的可控性和扩展性更强了,文本和音频之间的“代沟”也进一步缩小。

得益于 MusiCoT 的升级,现在有些 AI 生成的作品,已经能给音乐人提供不少创作灵感了。

不止是玩具

但我隐约觉得,这事没那么简单。
这不只是一个,写歌很好玩的玩具。

我手贱,去查了下这个领域的数据。

2023$30亿2032$66.2亿CAGR: 8.6%

Fortune Business Insights数据显示,2023 年全球数字音频工作站(DAW)市场规模已达约30 亿美元
预计到 2026 年,约 70% 的 DAW 企业将引入 AI 技术,辅助音乐创作流程。

而根据GlobeNewswire的进一步预测,到 2032 年,全球 DAW 市场规模有望突破66.2 亿美元
从 2024 年到 2032 年的年均复合增长率(CAGR)将达到8.6%

我看到的不是数字。

这是一场正在水面下进行的,无声的淘金热。

而Mureka背后的公司,昆仑万维…
他们的动作更直接。

「All in AGI与AIGC」

这是一个宣言。
一种决心。

Mureka这个名字的来源,我去查了。
结果,简单得可爱。

Music+Eureka

就是阿基米德光着身子跑出浴缸时,大喊的那声“我找到了!”的时刻。
是每个人灵感迸发时,那个独一无二的“尤里卡时刻”。

它不仅仅是一款工具。
它更像一个邀请。
邀请每个人,去找到属于自己的那个“尤里卡”。

但说真的。

在关掉那些数据和报告之后。

我一个人,在电脑前坐了很久。
我脑子里不自觉跳出了一个想法。

从前我们说“一首歌一个故事”,是因为它凝聚了太多人的心血。
但现在呢?

当创作被压缩成一个“输入框”时…
故事,会不会因此变得廉价?

我一度这样担心。
直到我换了个角度去想。

也许,是我们一直以来,都把“创作”这个词,看得太神圣了。
我们大多数人,没有那么多波澜壮阔的故事要讲。

我们有的,只是深夜里忽然想吃一碗泡面的纠结;
是等了半小时还没来的那班公交车的烦躁;
是一些没头没脑的梦,和一些说不出口的道歉。

这些微不足道,却又反复在我们生命中喧嚣的情绪。
它们算不算故事?

在今天之前,它们从未被谱写过。
而现在…好像可以了。

我终于能听到自己那些琐碎的心跳,变成了一段独一无二的旋律。
就像有朋友分享给我的,他用Mureka做的歌,歌词只有一句:“会议纪要,不用再写啦”。

简单,有点傻,但那一刻的解脱感,比任何史诗都真实。

也许对世界来说。
这些“作品”依然一文不名。

但对我们自己来说。
它就是全世界。

是我们这种普通人,第一次被真正“听”见的证据。

所以我觉得,Mureka,或者说和它一样的AI。
并没有想抢谁的工作,也没想颠覆整个行业。

它只是弯下腰来。
把原本被供奉在精英殿堂里的“乐器”,交到了我们每一个普通人的手里。

然后轻声对我们说了句:

“去玩吧。”
“现在,你可以了。”

(文:AI进修生)

发表评论