21.7K 标星的开源TTS!FishAudio开源情感语音核弹:200万小时炼成“声优AI”!

FishAudio团队发布了全新的OpenAudio S1语音模型,在TTS-Arena榜单上荣登第一名。该模型基于200万小时音频数据训练,支持50+情感标记和多种语言,提供了旗舰版S1(4B参数)和开源版S1-mini(0.5B参数)。

阿里巴巴开源Qwen3 Embedding 多语言排行榜中排名第一,微软开源GUI-Actor 无坐标的GUI代理视觉语言模型

Qwen3 Embedding 提供不同规模的文本嵌入和重排序模型;GUI-Actor 项目实现无需坐标的GUI交互方法;MonkeyOCR 使用结构-识别-关系三元组进行文档解析;Gemini for Claude Code 将Google Gemini模型与Claude Code结合使用,并提供API转换和错误处理功能;CircuitManus 是一个通用的高级异步智能体平台,专注于电路设计并支持跨领域扩展。

提示工程101第十二课:Instruction Engineering,提升提示词质量的关键技巧

在大语言模型迅猛发展的背景下,《指令工程》成为了一门新的技能。本教程手把手指导读者使用LangChain和Qwen3实现创建基础指令、改写指令提升清晰度与专业性、探索不同结构、实践具体与通用平衡技巧以及根据模型反馈迭代优化提示词等内容,以帮助用户更高效地与AI协作并提升工作效率。