阿里深夜开源Qwen2.5-Omni,7B参数完成看、听、说、写
阿里发布全新 Qwen2.5-Omni 多模态大模型,支持语音和视频聊天,并开源了7B参数的Thinker-Talker架构模型,性能优于单模态模型。
阿里发布全新 Qwen2.5-Omni 多模态大模型,支持语音和视频聊天,并开源了7B参数的Thinker-Talker架构模型,性能优于单模态模型。
阿里巴巴发布Qwen2.5-VL-32B-Instruct,参数仅为32B却在多项关键指标上超越自家72B模型及GPT-4。该模型展示了强大的数学推理、图像理解能力,并且可以在单 GPU或配置合理的Mac笔记本电脑上运行。
HuggingFace热门榜单显示中国大模型超过50%。DeepSeekR1和Qwen等模型因性能、实用性和稳定性提升而受欢迎,Apache 2.0/MIT许可协议提供法律确定性。开发者更偏好开源深度更高的中国模型,如Qwen系列支持多种参数规格及全面数据集。中国大模型已在OpenAI的Llama3之上或在某些任务上超越,其在部署门槛和性能方面均表现优异。
最近火山引擎上线了‘大模型应用实验室’,开源多个AI应用。通过一键复制开源代码,开发者可以快速搭建AI应用并实现开箱即用。火山引擎此举加速了大模型从研发到实际应用的进程,推动了人工智能生态的发展。
阿里开源发布新推理模型QwQ-32B,参数量为320亿。其性能可媲美6710亿参数的DeepSeek-R1满血版。千问团队通过大规模强化学习提升了模型的推理能力,在数学和编程任务上表现优异,并提供了API使用指南。
谷歌推出Wildlife Insights平台,帮助研究人员在线分享、识别和分析野生动物图像。该平台基于SpeciesNet AI模型训练的超过6500万张公开可用图像,涵盖2000多个标签,加速相机陷阱数据分析。
Zyphra 发布了具有高保真语音克隆功能的新文本转语音(TTS)模型 Zonos-v0.1 beta,该模型基于 Transformer 和混合架构进行训练,并提供对语速、情感和音频质量的灵活控制。