21.7K 标星的开源TTS!FishAudio开源情感语音核弹:200万小时炼成“声优AI”!
FishAudio团队发布了全新的OpenAudio S1语音模型,在TTS-Arena榜单上荣登第一名。该模型基于200万小时音频数据训练,支持50+情感标记和多种语言,提供了旗舰版S1(4B参数)和开源版S1-mini(0.5B参数)。
FishAudio团队发布了全新的OpenAudio S1语音模型,在TTS-Arena榜单上荣登第一名。该模型基于200万小时音频数据训练,支持50+情感标记和多种语言,提供了旗舰版S1(4B参数)和开源版S1-mini(0.5B参数)。
今年高考,数学难度引起热议。为此,多家国产大模型参加了全国卷一的数学测试。结果显示,部分大模型表现亮眼,如豆包Seed1.5、智谱Z1满分通过;而Qwen3和千问Kimi等表现不佳。测试旨在考察大模型在深度问题上的能力。
本文对多个大模型参加了完整的数学高考测试,并公布了得分结果。其中讯飞星火和豆包表现最佳,Qwen3屈居第三。Gemini2.5 pro、混元T1及文心X1位列第四至第五。
高效的提示词设计需在平衡上下文与简洁性之间找到恰当的点。本教程探讨如何管理大语言模型中的提示词长度与复杂度,包括通过示例展示使用Qwen3模型和LangChain库实现的具体方法。
Qwen3 Embedding 提供不同规模的文本嵌入和重排序模型;GUI-Actor 项目实现无需坐标的GUI交互方法;MonkeyOCR 使用结构-识别-关系三元组进行文档解析;Gemini for Claude Code 将Google Gemini模型与Claude Code结合使用,并提供API转换和错误处理功能;CircuitManus 是一个通用的高级异步智能体平台,专注于电路设计并支持跨领域扩展。
在Reddit上出现了一道关于立方体的推理题,多个AI模型未能正确解答。最终通过提示“最长的可见边长应该是5个小正方体”,阶跃AI给出了正确的答案125-46=79个立方体。
LocalSite AI 现已支持思维模型。一款现代化网页应用,利用AI生成HTML、CSS和JavaScript代码。支持多供应商API,包括Ollama本地模型。
在大语言模型迅猛发展的背景下,《指令工程》成为了一门新的技能。本教程手把手指导读者使用LangChain和Qwen3实现创建基础指令、改写指令提升清晰度与专业性、探索不同结构、实践具体与通用平衡技巧以及根据模型反馈迭代优化提示词等内容,以帮助用户更高效地与AI协作并提升工作效率。