开源框架
开源5天斩获1w星星,重新定义多智能体协作自动化,以后上班就跟玩一样。
OWL 是一个基于CAMEL-AI框架的开源多智能体协作系统,专注于复杂任务自动化。它通过动态角色分配与 60+ 智能工具协同(包括浏览器自动化、代码执行、多模态分析等),实现实时数据检索、跨平台交互和复杂逻辑处理,在 GAIA 基准测试中以58.18分位列开源框架第一。
跃问APP开源的130B语音模型 Step-Audio,快手开源运动控制DragAnything,微软智能体入门10个免费课程
Step-Audio是首个支持多语言对话、情感表达和方言的开源智能语音交互框架;Frames of Mind项目通过思维链可视化思考过程;DragAnything实现对象运动控制;《AI Agents for Beginners》课程教授初学者构建AI代理技能;Chat2Geo结合遥感数据进行地理空间分析。
微软研究院开源AIOpsLab:一个AI驱动的云运维框架
微软研究院发布AIOpsLab开源框架,旨在解决云运维中的复杂故障诊断和事件缓解问题。该工具提供了一个标准化且可扩展的平台来评估和增强不同云环境中的AI智能体,支持包括事件检测、根本原因分析和缓解在内的一系列运维任务。
UltraEval-Audio:评估音频大模型的工具
UltraEval-Audio是首个同时支持语音理解和生成评估的开源框架,涵盖34项权威Benchmark,提供一键式基准管理、内置多种评估方法等功能,助力音频大模型开发与优化。
llmware 项目是一个开源框架,旨在帮助企业构建基于 LLM 的应用程序
llmware 是一个开源框架,集成多种优化后的企业级模型,用于构建基于LLM的应用程序(如RAG和Agent),支持私有部署。
phidata 是一个开源框架,用于构建具有记忆、知识、工具和推理能力的多模态智能体(Agents)
phidata 是一个开源框架,用于构建多模态智能体,并提供美观的用户界面进行交流,参考更多文档及资源。
开源视频创建及编辑框架Revideo
Revideo 是一个开源框架,允许开发者在 Typescript 中创建视频模板并将其作为 API 端点部署。它还提供了一个 React 播放器组件用于实时预览浏览器中的变化。通过分析用户行为,Revideo 使用 Posthog 了解其使用情况。