比NotebookLM更好的「开源播客」,可根据多模态内容生成30分钟以上播客音频。

之前给大家分享过一个类似的AI播客项目,今天给大家分享的podcastfy可以支持更长的内容。


长篇播客才是市场真正大量需要的。


而且还有个关键点,它可以分析多模态的内容,像是网页、图片、PDF等等。


使用体验来看,比NotebookLM要好一些。


扫码加入AI交流群

获得更多技术支持和交流

(请注明自己的职业)


项目简介


Podcastfy 是一个开源 Python 工具,能将文本、图片、网站、YouTube 视频、PDF 等多模态内容,借助生成式 AI 转化为播客。它支持自定义播客风格、声音等,可运行本地大语言模型,适配 100 多种语言模型和多种文本转语音模型,能生成短则 2 – 5 分钟、长则 30 分钟以上的播客,还可通过 CLI 和 Python 包实现自动化工作流。



DEMO



下面这段是根据两张图片生成的。




功能特点



    多源内容支持:可将文本、图片、网站、YouTube 视频、PDF 等多种形式内容转化为播客

    AI 驱动生成:借助生成式 AI 自动创建多语言音频对话,支持 100 多种语言模型

    自定义能力强:可自定义播客风格、声音等参数,满足个性化需求

    灵活部署选项:支持运行本地大语言模型,适配多种文本转语音模型

    长度可控:能生成 2-5 分钟短播客或 30 分钟以上长播客

    便捷集成:提供 CLI 和 Python 包,便于实现自动化工作流


    项目链接


    https://github.com/souzatharsis/podcastfy


     关注「开源AI项目落地」公众号

    (文:开源AI项目落地)

    发表评论