开源归档 - 第149页共201页

X-PLUG的Mobile-Agent，手机操作新潮流，多Agent协作让操作更智能！

2025年2月12日19时作者小兵的AI视界

能地为我们服务，成为了众多科研人员和开发者关注的焦点。
Mobile-Agent
作为一个创新的解决

2025年2月12日8时作者 NLP工程化

UC伯克利团队通过RL微调改进Deepseek-R1-Distilled-Qwen-1.5B，使其在AIME基准上Pass@1准确率高达43.1%，参数量仅为1.5B且超越OpenAI o1-preview。

2025年2月12日8时作者 NLP工程化

Microsoft开源数据Formulator工具，通过AI简化数据分析和可视化过程，支持本地运行与GitHub部署，提供数据挑战激发创意。

2025年2月12日8时作者 NLP工程化

阿里开源的InspireMusic音乐生成框架支持文本生成、续写、重建等功能，结合语义和声学标记生成高质量音乐，覆盖多种风格。

2025年2月12日8时作者 NLP工程化

Andrew NG吴恩达的AISuite支持DeepSeek模型，开发者可以通过更改字符串选择来自不同提供商的语言模型。

2025年2月12日8时作者开源星探

近期发现一款名为Zonos的新型高保真TTS模型，它能在快速生成特定情绪语音及精准模拟特定人声音效方面表现出色。支持多种语言，并提供包括情感调节、语音定制等功能。

2025年2月13日23时2025年2月11日23时作者开源AI项目落地

DeepSeek团队发布的新多模态模型Janus-Pro通过优化训练策略、扩展数据集和扩大模型规模提升了性能，实现高质量的文本到图像生成及多模态理解。

2025年2月11日14时作者小兵的AI视界

2025年开年，国产大模型DeepSeek凭借低成本、高性能和全开源特性震撼全球。从数学竞赛到汽车智能座舱，DeepSeek重塑了多个行业应用，并在技术突破和实际落地方面展现了巨大潜力。

2025年2月11日12时作者每日AI新工具

本文介绍了五个开源项目：Zonos-v0.1（多语言TTS模型）、Nanospeech（文本转语音系统）、Potpie（AI代理创建平台）、Zotero PDF2zh（PDF翻译插件）和Open Deep Research Web UI（AI研究助手）。

2025年2月11日12时作者 GitHubStore

NVIDIA AI 蓝图介绍了一种使用 NVIDIA NIM 和 ElevenLabs TTS 服务将 PDF 转换为音频内容的方法，支持私有部署和安全运行。