开源归档 - 第27页共201页

首个开源AI音频驱动的「多人对话」视频生成项目，还能通过提示词控制角色动作。

2025年6月30日23时作者开源AI项目落地

MultiTalk 是 MeiGen-AI 开发的音频驱动多人对话视频生成框架，支持单人/多人对话、卡通角色生成和唱歌场景模拟。具备480p/720p灵活输出能力，最长15秒长视频生成能力，并引入优化技术提高性能。

2025年6月30日14时作者小兵的AI视界

腾讯AI Lab开源项目SongGeneration通过先进的技术架构和算法实现了高质量音乐生成。它支持文本控制、多轨合成和风格跟随等功能，并在多个应用场景中取得了优异表现。

2025年6月30日11时作者 GitHubStore

项目NativeMind提供私有AI助手，支持快速设置和多种功能如智能对话、翻译、搜索增强等。通过离线优先设计和模型灵活性确保隐私与性能兼备。

2025年6月30日11时作者每日AI新工具

GitHub Copilot、Gemini CLI OpenAI Worker、All Model Chat、Hunyuan-A13B和n8n-MCP是五个不同的AI工具或服务介绍，它们各自针对编程辅助、多模态对话、大语言模型管理和工作流自动化等方面提供支持。

2025年6月30日8时作者 NLP工程化

首个大规模多模态物理推理基准PhysUniBenchmark发布，包含3304道经验证的物理问题，支持多语言评估，开放性问题准确率仅为26.5%。

2025年6月30日8时作者 NLP工程化

AI Dataset Generator快速生成逼真数据集，支持实时预览、一键导出CSV或SQL，预览仅需约0.05美元，下载数据免费。

2025年6月30日8时作者开源星探

战。
作为一名专注分享全球开源项目与实用工具的开发者，我一直在寻找那些能够真正解决开发者痛点的OCR

2025年6月30日8时作者 NLP工程化

OptimaMCP是Optuna的Model Context Protocol服务器，支持自动化超参数优化及交互式分析结果，兼容多种工具。

2025年6月30日8时作者 NLP工程化

微软将GitHub Copilot的VSCode Chat部分开源，通过聊天方式辅助编写和理解代码。

2025年6月29日14时作者小兵的AI视界

腾讯联合清华大学深圳国际研究生院等机构推出的多模态大语言模型MindOmni，在视觉理解、文本到图像生成、推理生成等方面表现卓越。它采用三阶段训练策略和强化学习算法优化了模型的推理生成能力，支持内容创作、教育、娱乐等多个领域应用。