开源模型归档 - 第2页共11页

一键实现PPT演讲自由！「解说音频+视频」同步生成，效果逼近真人

2025年7月16日23时作者新智元

带真人语音和同步幻灯片的演示视频，流程像人写提纲、做PPT、录音并合成。实验使用30份文档与人工视频

2025年7月16日23时作者智东西

作者 |
程茜陈骏达
编辑 |
李水青
智东西7月16日报道，今日下午，英伟达创始人兼CEO黄仁勋在

2025年7月14日8时作者 AIGC开放社区

专注AIGC领域的专业社区关注微软&OpenAI、百度文心一言等大语言模型的发展和应用落地，报道OpenAI开源模型发布延期原因。

2025年7月13日23时作者新智元

OpenAI宣布其开源模型发布无限期推迟，引起开发者和科技爱好者失望。竞争对手如Mistral、Qwen系列等纷纷上新，加剧了开放性与商业利益之间的矛盾。

2025年7月12日8时作者智东西

国内大模型独角兽月之暗面发布并开源了其最新一代MoE架构基础模型Kimi K2，总参数量达到1万亿（1T），并在SWE Bench Verified、Tau2和AceBench三项基准测试中取得SOTA成绩。

2025年7月10日8时作者 AI寒武纪

OpenAI即将发布一款由AI驱动的网页浏览器，直接挑战谷歌Chrome浏览器。目标是利用人工智能从根本上改变消费者的网页浏览方式，并为OpenAI提供一个更直接的数据获取渠道。

2025年7月7日16时作者量子位

LLM，有时也会陷入“信息迷雾”之中：当问题简单、路径明确时，模型往往能利用记忆或一两次搜索就找到答

2025年7月1日23时作者甲子光年

摆过，即使是在2023年11月“宫斗”事件期间。
不过，美国西部时间6月29日下午《连线》杂志爆料称

2025年6月26日11时作者路过银河AI

Magenta RealTime 是一个开源音乐生成模型，由 Google 开发，能够在资源有限的环境中部署。它基于 SoundStream RVQ 编解码器和 MusicCoCa 模型工作原理。