跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

开源

开源 AI 音视频图文创作神器!一键音视频转文档,支持主流自媒体平台图文风格转换!

2025年5月9日8时 作者 开源星探

AI-Media2Doc是一款支持本地部署的音视频转图文工具,一键生成多种风格文档如公众号文章、小红书文案等,无需依赖FFmpeg。

分类 开源 标签 AI-Media2Doc、 多种文档风格、 教学辅助、 本地部署、 自媒体创作、 音视频转图文 发表评论

英伟达开源6亿参数的语音识别模型Parakeet TDT 0.6B V2

2025年5月9日8时 作者 NLP工程化

英伟达开源Parakeet TDT 0.6B V2语音识别模型,RTFx 3380排名榜首,具备精准时间戳、智能标点和特殊场景识别能力,支持多种应用场景。

分类 开源 标签 FastConformer、 Parakeet TDT、 RTFx、 TDT解码器、 V2、 语音识别 发表评论

支持1107种语言+语音克隆!Ebook2Audiobook一键解锁全球有声书

2025年5月8日14时 作者 小兵的AI视界

和空间的限制。为了解决这一问题,开源工具
ebook2audiobook
应运而生。
它能够将电子书

分类 开源 标签 AI技术、 ebook2audiobook、 EPUB格式、 GUI应用、 多语言支持、 语音克隆 发表评论

大模型评估排障指南 | 关于 LaTeX 公式解析

2025年5月8日14时 作者 Hugging Face

第二篇《大模型评估排障指南》系列文章,介绍了在使用数学评估基准时遇到的解析 LaTeX 表达式的问题,并探讨了问题的根源及解决方案。

分类 开源 标签 Hugging Face、 Math数学评估基准、 Sympy库、 准确率0.94、 分数相关问题、 区间表达式 发表评论

快讯!特朗普拟取消AI芯片出口限制。

2025年5月8日11时 作者 开源AI项目落地

特朗普政府计划取消拜登时代的先进AI芯片出口限制,以释放美国创新并确保其在人工智能领域的主导地位。

分类 开源 标签 AI芯片出口限制、 七国集团、 全球许可制度、 特朗普政府、 英伟达、 黄仁勋 发表评论

用7个工具驱动的极简AI智能体,极简的 LLM 框架Pocket Flow,机器人控制的中间件MCP

2025年5月8日11时 作者 每日AI新工具

Toolkami、AI Manus、Pocket Flow、ROS MCP Server和Absolute Zero简介,涵盖各自特点与应用。

分类 开源 标签 AI代理框架、 Devcontainer配置、 LLM框架、 Turbo模式、 自然语言指令转换、 通用AI Agent系统 发表评论

一款可作为 Loom 开源平替的跨平台视频录制工具:Cap

2025年5月8日8时 作者 NLP工程化

一款提供桌面客户端和网页版的视频录制、编辑工具,支持数据自托管,功能包括快速录制屏幕内容、视频编辑等,基于Rust开发,完全开源,性能优越且资源占用低。

分类 开源 标签 CapSoftware、 Railway、 Rust、 未知、 桌面客户端、 网页版 发表评论

Lightricks 发布了他们的开源视频生成模型 LTXV -Video-13B

2025年5月8日8时 作者 NLP工程化

Lightricks 发布开源视频生成模型 LTXV-Video-13B,支持多尺度渲染、高级控制等特性,可完全商业使用。

分类 开源 标签 13B、 Lightricks、 开源、 渲染、 物理真实性、 视频生成模型 发表评论

斯坦福大学官方AI课程:NLP+深度神经网络+Transformer

2025年5月8日8时 作者 NLP工程化

斯坦福大学官方AI课程介绍,涵盖NLP、深度神经网络和Transformer技术。

分类 开源 标签 NLP、 Transformer技术、 斯坦福大学、 深度神经网络、 知识星球、 自然语言处理 发表评论

阶跃开源了一个 Suno 级别的音乐生成模型

2025年5月8日8时 作者 NLP工程化

阶跃开源Suno级别的音乐生成模型,在A100 GPU上可20秒生成4分钟音乐,支持多种功能和语言。

分类 开源 标签 A100GPU、 Suno、 声音克隆、 歌词编辑、 连续性表现、 高质量音乐作品 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面70 页面71 页面72 … 页面201 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 11 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
24252627282930
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×