智东西
OpenAI最新音频模型一手实测!可癫可御可定制,中文有点翻车
OpenAI推出全新一代音频模型gpt-4o-transcribe、gpt-4o-mini-transcribe和gpt-4o-mini-tts,大幅提高单词识别错误率与语言准确性。同时发布的新语音转文本模型在多个基准测试上超过whisper模型,在低资源语言上的表现尤其突出。不过中文场景的音频生成效果仍需改进。
1秒钟生成3D模型!腾讯混元甩出5款开源3D模型,自研架构加速效果超30倍
腾讯混元一次性开源了5款全新的3D生成模型,其中3款模型实现了秒级3D资产生成,较之前版本提速30倍左右。模型在贴图细节、材质表达等方面也有明显提升,并支持多种主流格式的输出,可直接用于3D打印和分享。
16天闪电融资超16亿!大模型独角兽暴风吸金,已集齐成都+珠海+杭州+北京四城投资
成都高新区宣布战略投资智谱超亿元,将与智谱共同打造四川省首个基座大模型‘智谱诸葛大模型’。该项目总投资3亿元,预计未来三年赋能企业不低于500家,五年内争取不低于1000家企业。