开源
通过简单的强化学习(RL)微调,得到了全新的DeepScaleR-1.5B-Preview
UC伯克利团队通过RL微调改进Deepseek-R1-Distilled-Qwen-1.5B,使其在AIME基准上Pass@1准确率高达43.1%,参数量仅为1.5B且超越OpenAI o1-preview。
Data Formulator:Microsoft开源的免代码数据分析工具
Microsoft开源数据Formulator工具,通过AI简化数据分析和可视化过程,支持本地运行与GitHub部署,提供数据挑战激发创意。
刚刚开源的新型TTS模型:Zonos!最低5s即可克隆高质量语音!
近期发现一款名为Zonos的新型高保真TTS模型,它能在快速生成特定情绪语音及精准模拟特定人声音效方面表现出色。支持多种语言,并提供包括情感调节、语音定制等功能。
DeepSeek官方开源多模态视觉理解和生成模型,谁说DeepSeek只能问答了?!
DeepSeek团队发布的新多模态模型Janus-Pro通过优化训练策略、扩展数据集和扩大模型规模提升了性能,实现高质量的文本到图像生成及多模态理解。
DeepSeek为啥这么火?技术内幕+应用场景大揭秘
2025年开年,国产大模型DeepSeek凭借低成本、高性能和全开源特性震撼全球。从数学竞赛到汽车智能座舱,DeepSeek重塑了多个行业应用,并在技术突破和实际落地方面展现了巨大潜力。
两个开源文本转语音模型,Zotero 文献管理软件的翻译插件
本文介绍了五个开源项目:Zonos-v0.1(多语言TTS模型)、Nanospeech(文本转语音系统)、Potpie(AI代理创建平台)、Zotero PDF2zh(PDF翻译插件)和Open Deep Research Web UI(AI研究助手)。
英伟达:将PDF文档转化为AI音频播客,让知识随时随地陪伴你pdf-to-podcast
NVIDIA AI 蓝图介绍了一种使用 NVIDIA NIM 和 ElevenLabs TTS 服务将 PDF 转换为音频内容的方法,支持私有部署和安全运行。