JinaAI开源升级!一个开源HTML转Markdown和JSON的小型语言模型,参数仅有1.8B。

在大数量级AI数据处理场景下,JinaAI的ReaderLM-v2语言模型通过将原始HTML转换为Markdown或JSON格式解决了资源消耗问题,并实现了更好的Markdown生成、新增JSON输出及更强的上下文和多语言支持。

社区供稿 | 书生·浦语大模型升级,突破思维密度,4T 数据训出高性能模型

上海AI实验室发布的书生·浦语3.0大模型通过数据精炼框架提升了数据效率和思维密度,实现了常规对话与深度思考能力融合。该模型使用4T训练数据达到主流开源模型18T的训练效果,并在多种评测集上性能领先。

HTML转换为高质量的Markdown支持29种语言,使用Kokoro-82M将电子书变为有声书,唱歌声音转换模型

本期内容涵盖了ReaderLM-v2、PDF to Podcast、Audiblez、RIFT-SVC和MangaNinja等五个AI工具或模型,分别用于HTML转Markdown/JSON、PDF转换音频、电子书转化为有声书、唱歌声音转换以及基于参考的动漫线条艺术上色。