开源
开源UI到代码生成工具!模块化多智能体,精准还原,支持快速原型与前端自动化!
ScreenCoder 是一款通过截图或设计稿自动生成 HTML/CSS 代码的开源工具,利用模块化多智能体框架实现精确视觉理解和布局分析,支持多种模型集成,并提供图像处理和自定义选项。
从智能座舱到客服机器人,腾讯混元Dense模型用0.5B参数打穿全场景
腾讯混元Dense模型作为腾讯开源的高效大型语言模型系列,在消费级显卡上运行,支持边缘设备到高并发生产系统的灵活部署。原生支持256K上下文窗口和快速与慢速思考模式,具有增强的Agent能力和强大的文本生成能力,适用于智能座舱、智能家居、客服系统等场景。
科研自动化的全流程智能平台AI-Researcher
AI-Researcher系统通过全新架构实现自动化科学发现,提供全流程自主化、无缝协同和先进AI整合等功能,支持两种研究需求输入模式,并具备快速安装指南。
文档处理新革命!Chunkr 专为RAG与知识库场景设计,多格式智能解析!
Chunkr 是一款基于视觉语言模型的文档处理API,能够将PDF、PPTX、DOCX等复杂文档转为RAG/LLM就绪的结构化数据。它解决了OCR识别不准和格式转换耗时等问题,支持多格式文档解析、带边界框的高精度OCR、语义分块等功能,并提供Python SDK和多种输出形式。
比NotebookLM更好的「开源播客」,可根据多模态内容生成30分钟以上播客音频。
Podcastfy 是一个开源工具,能将多种模态内容(文本、图片、网站、视频、PDF等)转化为播客,支持自定义风格和语言模型,生成长度从2-5分钟到30分钟以上的音频。
效果非常不错!阿里昨开源图形海报生成模型Qwen-Image
Qwen-Image 是一款基于20B参数MMDiT架构的多模态图像基础模型,能在复杂文本渲染和精确图像编辑方面实现重大突破。它特别擅长中文文本渲染,并具备高保真文本渲染、多种艺术风格生成及智能图像编辑等核心能力。