开源
字节开源多模态理解与生成统一模型,对视觉的理解到达开源顶峰,AI图片编辑能力超强。
字节跳动开源多模态模型BAGEL,支持图像生成、修改及动态变化理解。具备聊天、生成图片、编辑图片、风格转换和导航等能力。
轻量级AI记忆解决方案Memvid,执行不受信任AI代码MICROSANDBOX,OpenAPI 转 MCP 服务器工具
Memvid是一款AI记忆解决方案,将文本数据编码成视频进行快速语义搜索;SelfyAI让用户创建个性化智能AI代理并利用其价值;MICROSANDBOX提供安全、快速的沙盒环境以执行用户或AI代码;OpenDeRisk为应用系统提供7×24小时风险保护和根因分析;openmcp将OpenAPI规范转换为MCP服务器,并支持多种传输方式和工具集成。
盲测击败了ElevenLabs的一款TTS:Chatterbox
Resemble AI 推出免费开源 TTS 模型 Chatterbox,在盲测中击败 ElevenLabs,具备情感控制能力,并支持语音克隆和风格定制。
K8S集群化部署RAGFlow文档
RAGFlow支持通过Kubernetes (K8s)集群化部署,包括主应用、文档引擎(可选)、MinIO、MySQL和Redis等组件,从v0.15.0版本开始提供。
DeepSeek 发布DeepSeek R1-0528
DeepSeek发布R1-0528,显著提升代码生成能力,推理速度和质量提高,性能接近OpenAI的o3等前沿模型,在数学、编程和复杂任务上表现出色。