采用 DACA 设计模式从零开始学习 Agentic AI 的教程:Learn Agentic AI
以OpenAI Agents SDK为基础框架,结合Dapr分布式技术栈,教授全栈智能体AI开发的课程内容,涵盖设计模式解析、容器化部署、Kubernetes扩展等,提供视频教程和开源代码示例。
以OpenAI Agents SDK为基础框架,结合Dapr分布式技术栈,教授全栈智能体AI开发的课程内容,涵盖设计模式解析、容器化部署、Kubernetes扩展等,提供视频教程和开源代码示例。
GitHub项目Awesome-Large-Multimodal-Reasoning-Models总结了多模态推理模型的四阶段发展历程,覆盖感知驱动、语言中心短推理、长推理以及原生多模态推理,并提供详细数据集和图表支持。
Docext 是一个基于视觉语言模型的文档结构化信息提取工具,支持发票、护照等敏感文档处理。它通过本地部署确保数据隐私,并提供自定义字段和表格提取功能,适用于多种场景如发票管理、证件录入等。
DeerFlow 是一款结合语言模型与多种工具的研究助手,支持多语言模型集成、无缝集成MCP服务和交互式修改研究计划等亮点功能。
ACE-Step 是一款由 ACE Studio 与 StepFun 联合开发的开源音乐生成基础模型,参数量为 3.5B。它支持多语言、多风格的音乐创作,并且能够在 NVIDIA A100 GPU 上仅需20秒生成一首4分钟的完整歌曲。该模型结合了扩散生成技术、深度压缩自编码器(DCAE)和轻量级 Transformer 架构,具备一键生成完整音乐、高级控制机制等核心功能亮点。
Agentica-project/verl-pipeline 提供高效灵活的解决方案支持高达70B参数模型和数百个GPU训练,集成多种主流LLM框架及强化学习算法。
PyRoki 是一个为机器人运动优化设计的Python工具包,支持从URDF文件生成可微分的机器人运动学模型,并自动生成碰撞检测原语和集成Levenberg-Marquardt求解器以提升效率。