开源
MagiAttention:为超长文本和异构数据训练提供线性可扩展的分布式注意力机制
MagiAttention 提供线性可扩展的分布式注意力机制,支持多种注意力掩码类型,性能与Flash-Attention 3相当,实现零冗余通信提升效率。
开源TTS领域迎来重磅新星!Dia-1.6B:超逼真对话生成,开源2天斩获6.5K Star!
由Nari Labs开发的Dia-1.6B因其逼真的对话生成能力而受到关注,仅开源两天便在GitHub收获了6.5K+Star。它支持多角色对话、拟人化表达、零样本声纹克隆等功能,并且运行效率高,音质媲美ElevenLabs和Sesame。
AI 阅读新姿势!支持MCP协议,打通微信读书与 Claude,让你的笔记活起来!
通过微信读书 MCP 服务器项目mcp-server-weread,用户可以实现与AI工具无缝集成,方便管理和分析阅读笔记。
多研发团队共同开源,AI超自然声音克隆TTS,支持中文。
TTS工具Spark-TTS由SparkAudio开发,支持中文和英文,基于5亿参数的Qwen2.5 LLM和BiCodec技术。它具有零样本语音克隆、中英混合生成等功能,实现跨语言场景应用。
Manus余温未退Suna开源平替,实时AI语音玩具,LLM增强Playwright的智能浏览器自动化工具
本文介绍了五款AI工具:Suna提供研究和数据分析功能;ElatoAI支持实时语音对话;Hyperagent增强Playwright的智能浏览器自动化;Hyper-RAG利用超图提高LLM性能;Browserbase MCP Server则通过云端浏览器自动化能力提升大型语言模型的功能。