开源
7.8k星星!最强开源AI生成3D技术,顶尖技术团队的碰撞,功能多到离谱。
TRELLIS是清华大学、中科院和微软联合开源的3D生成方法,支持文本或图片输入,具备高效高质量生成多种3D格式(如辐射场、3D高斯等)、灵活编辑功能的特点。
阿里 MinMo 登场,多模态语音交互 “内卷” 升级!
阿里通义实验室推出的MinMo多模态大型语言模型在语音交互领域表现卓越,能够实现无缝语音交互,支持多种任务处理和多样化可控生成。其主要功能包括全双工语音交互、多样化可控生成以及多任务处理能力。应用场景涵盖智能客服、语音助理、人机对话系统及语音翻译等场景。
AI伴侣新物种?硅胶娃娃解锁”情绪价值” 天价订阅模式引热议
成人玩偶行业推出首款AI智能伴侣MetaBox,具备可定制人格和深度对话功能。该产品售价高且需要持续付费激活AI功能,引发技术伦理边界争议。
社区供稿 | 阿里国际 Ovis2 系列模型开源: 多模态大语言模型的新突破
Ovis2是阿里巴巴提出的新型多模态大模型架构,显著提升了小规模和大规模模型的能力密度,并增强了思维链推理能力、视频处理能力和多语言OCR能力。它已在OpenCompass上展示了卓越的性能,并在多个数学推理榜单中排名前列。
让AI工具直接从浏览器获取日志browser-tools-mcp
此应用是一款用于浏览器监控和交互的强大工具,通过Anthropic的模型上下文协议(MCP)捕获并分析浏览器数据。架构包括Chrome扩展程序、节点服务器及MCP服务器三个核心组件。
A Visual Guide to Mixture of Experts (MoE)
混合专家模型(MoE)通过动态选择子模型处理不同输入,显著降低计算成本并提升表现,核心组件包括专家网络、路由机制和稀疏激活。
它太快了!“DeepSeek难民”最佳平替,双核驱动,还支持R1推理生图!
元石科技的『问小白』接入DeepSeek R1满血版后表现亮眼,秒速回答问题且支持多端使用。同时拥有R1推理生图功能和丰富的AI智能体,成为国内首家提供这些特性的产品。