谷歌开源Gemma 3n:2G内存就能跑,100亿参数内最强多模态模型 2025年6月27日11时 作者 机器之心 端侧多模态大模型 Gemma 3n。 模型、权重:https://huggingface.co/co
ICLR 2025|小米新一代Kaldi语音识别算法CR-CTC,纯CTC性能实现SOTA 2025年2月7日16时 作者 机器之心 多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务 2024年12月15日20时2024年11月22日13时 作者 新智元 新智元报道 编辑:LRS 【新智元导读】 Meta最近开源了一个7B尺寸的Spirit LM的多模态