腾讯祭出开源核弹!LeVo音乐生成模型,媲美Suno,支持零样本风格迁移,歌词完美匹配
腾讯AI Lab发布高保真音乐生成模型LeVo,支持中英文歌词生成48kHz立体声音频。通过双轨建模和DPO优化确保音质、指令遵循及风格迁移能力。
腾讯AI Lab发布高保真音乐生成模型LeVo,支持中英文歌词生成48kHz立体声音频。通过双轨建模和DPO优化确保音质、指令遵循及风格迁移能力。
Kimi-Researcher 是一个多轮搜索和推理的AI Agent,在 Humanity’s Last Exam 上取得了 26.9% 的 Pass@1 分数,超越所有大模型。主要使用整体学习、自主探索和动态适应技术。
MAS-Zero 是 Salesforce 推出的一个创新框架,能够在零监督下自动设计和优化多智能体系统(MAS),显著提高系统对新任务的适应性和性能。
AnyCrawl是一款高性能网络爬虫和数据抓取应用程序,支持多样化爬取模式和多种引擎选择。它具有多线程、多进程以及Redis缓存等技术架构,并提供丰富的配置选项和灵活的API设计。
这是一个支持C/C++、Dart/Flutter 和 Ts/React-Native 的API框架,使用GGML作为推理后端,并且兼容Llama.cpp模型。目前其在iPhone 16上运行的速度为49 token/s(Gemma3 1B)和16 token/s(Qwen3 4B)。
PreenCut 是一款基于AI的视频剪辑工具,支持高精度语音转录、智能分段、自然语言搜索等功能,通过可视化操作界面实现本地部署和批量处理。它适合教育内容整理、影视后期制作等多种场景。
推荐一款由AI大模型驱动的PandaWiki知识库搭建系统,具备AI创作、问答和搜索功能。支持Markdown和HTML编辑,兼容多种输出格式,可集成第三方应用,并能导入多源内容。