SmolVLA:Hugging Face 开源的轻量级 VLA 模型,体积小 10 倍,性能却达 SOTA!
SmolVLA 是 Hugging Face 开源的一个轻量级视觉-语言-行动模型,专为经济高效的机器人设计。它拥有4.5亿参数,能够在消费级GPU甚至CPU上运行,支持在MacBook等设备上部署。通过多模态输入处理、高效推理和异步执行特性,在物体抓取与放置、家务劳动和货物搬运等多种应用场景中表现出色。
SmolVLA 是 Hugging Face 开源的一个轻量级视觉-语言-行动模型,专为经济高效的机器人设计。它拥有4.5亿参数,能够在消费级GPU甚至CPU上运行,支持在MacBook等设备上部署。通过多模态输入处理、高效推理和异步执行特性,在物体抓取与放置、家务劳动和货物搬运等多种应用场景中表现出色。
KResearch 是一个使用 Google Gemini API 进行深度研究的 Web 应用程序。AI Fleet 提供了一个管理 AI 开发者代理集群的工具。Customer Service Agents Demo 展示了基于 OpenAI SDK 的客户服务代理系统。qagent 旨在替代传统的 RAG 系统,提供智能搜索和成本优化等功能。use-mcp 是一个简化与 MCP 标准服务器连接的 React Hook。
WaterCrawl 是一个基于Python技术栈的强大网络爬虫应用,支持智能爬虫引擎、强大的搜索引擎、多语言与地区支持、实时进度监控和完整的API生态。它通过Docker容器化部署,提供开箱即用特性,适合数据驱动时代的数据采集需求。
GitHub 上的资源列表 AgentsMeetRL 总结了使用强化学习训练 LLM Agents 的开源项目和相关技术信息。
生产级智能体 “Agents Towards Production” 是一个开源项目,提供从概念验证到生产的教程、工具和代码示例,涵盖编排、工具集成、可观测性等多个方面。
Office-PowerPoint-MCP-Server 功能强大,可通过 MCP 客户端快速安装使用,支持创建、编辑 PPT,涵盖多种元素功能。
最近整理了10个热门且实用的N8N工作流模板,涵盖AI客服、网站安全检查、数据库问答助手等多种场景。这些工作流模板均免费提供,并能提升工作效率和AI生成质量。
字节跳动开源的ContentV项目通过高效训练策略和极简架构实现了高质量视频生成。支持文本到视频生成、自定义参数、风格迁移等多功能,并已上线多个应用场景。