跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

开源

X-PLUG的Mobile-Agent,手机操作新潮流,多Agent协作让操作更智能!

2025年2月12日19时 作者 小兵的AI视界

能地为我们服务,成为了众多科研人员和开发者关注的焦点。
Mobile-Agent
作为一个创新的解决

分类 开源 标签 MobileAgent、 安全性、 性能评估、 用户体验、 自动化移动设备操作、 适应性 发表评论

通过简单的强化学习(RL)微调,得到了全新的DeepScaleR-1.5B-Preview

2025年2月12日8时 作者 NLP工程化

UC伯克利团队通过RL微调改进Deepseek-R1-Distilled-Qwen-1.5B,使其在AIME基准上Pass@1准确率高达43.1%,参数量仅为1.5B且超越OpenAI o1-preview。

分类 开源 标签 43.1%、 Deepseek-R1-Distilled-Qwen-1.5B、 OpenAI o1-preview、 Pass@1准确率、 UC伯克利、 强化学习 发表评论

Data Formulator:Microsoft开源的免代码数据分析工具

2025年2月12日8时 作者 NLP工程化

Microsoft开源数据Formulator工具,通过AI简化数据分析和可视化过程,支持本地运行与GitHub部署,提供数据挑战激发创意。

分类 开源 标签 Data Formulator、 GitHub Codespaces、 Microsoft、 UI交互、 数据挑战、 自然语言技术 发表评论

阿里开源的统一的音乐生成框架:InspireMusic

2025年2月12日8时 作者 NLP工程化

阿里开源的InspireMusic音乐生成框架支持文本生成、续写、重建等功能,结合语义和声学标记生成高质量音乐,覆盖多种风格。

分类 开源 标签 InspireMusic、 改善音质、 文本生成音乐、 阿里、 音乐续写、 音乐重建 发表评论

Andrew NG吴恩达推出的AISuite也宣布支持 DeepSeek

2025年2月12日8时 作者 NLP工程化

Andrew NG吴恩达的AISuite支持DeepSeek模型,开发者可以通过更改字符串选择来自不同提供商的语言模型。

分类 开源 标签 aisuite、 Andrew Ng、 DeepSeek、 deepseek:deepseek-reasoner、 Dify知识星球、 openai:gpt-4o 发表评论

刚刚开源的新型TTS模型:Zonos!最低5s即可克隆高质量语音!

2025年2月12日8时 作者 开源星探

近期发现一款名为Zonos的新型高保真TTS模型,它能在快速生成特定情绪语音及精准模拟特定人声音效方面表现出色。支持多种语言,并提供包括情感调节、语音定制等功能。

分类 开源 标签 Hugging Face、 RTX 4090显卡、 Zonos模型、 多语言支持、 文本到语音、 高保真语音克隆 发表评论

DeepSeek官方开源多模态视觉理解和生成模型,谁说DeepSeek只能问答了?!

2025年2月13日23时2025年2月11日23时 作者 开源AI项目落地

DeepSeek团队发布的新多模态模型Janus-Pro通过优化训练策略、扩展数据集和扩大模型规模提升了性能,实现高质量的文本到图像生成及多模态理解。

分类 开源 标签 DeepSeek、 GenEval、 Janus-Pro、 MMBench、 多模态模型、 视觉编码解耦 发表评论

DeepSeek为啥这么火?技术内幕+应用场景大揭秘

2025年2月11日14时 作者 小兵的AI视界

2025年开年,国产大模型DeepSeek凭借低成本、高性能和全开源特性震撼全球。从数学竞赛到汽车智能座舱,DeepSeek重塑了多个行业应用,并在技术突破和实际落地方面展现了巨大潜力。

分类 开源 标签 1/10、 1/70、 5%-13%、 71%、 DeepSeek-R1、 强化学习、 数学竞赛、 编程竞赛 发表评论

两个开源文本转语音模型,Zotero 文献管理软件的翻译插件

2025年2月11日12时 作者 每日AI新工具

本文介绍了五个开源项目:Zonos-v0.1(多语言TTS模型)、Nanospeech(文本转语音系统)、Potpie(AI代理创建平台)、Zotero PDF2zh(PDF翻译插件)和Open Deep Research Web UI(AI研究助手)。

分类 开源 标签 200,000、 44kHz、 Zyphra、 文本转语音模型、 阿里巴巴云、 音质优越 发表评论

英伟达:将PDF文档转化为AI音频播客,让知识随时随地陪伴你pdf-to-podcast

2025年2月11日12时 作者 GitHubStore

NVIDIA AI 蓝图介绍了一种使用 NVIDIA NIM 和 ElevenLabs TTS 服务将 PDF 转换为音频内容的方法,支持私有部署和安全运行。

分类 开源 标签 Docker Compose、 Meta Llama模型、 NVIDIA AI、 PDF转音频、 敏感数据、 私有网络 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面148 页面149 页面150 … 页面201 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 11 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
24252627282930
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×