NLP工程化
DeepSeek-V3-0324开源
DeepSeek-V3-0324 在数学推理和前端开发方面表现优于 Claude 3.5 和 Claude 3.7 Sonnet,这是 DeepSeek 最佳非推理模型。
5 个用于智能体记忆的框架,100% 开源
5个开源框架用于智能体记忆:Graphiti构建时间感知的知识图谱;Letta提供透明且长期记忆状态的智能体;Mem0结合LLM和向量存储技术主动学习适应变化;Memary赋予AI类似人类的记忆能力;Cognee将知识图谱与RAG结合维护动态知识图谱。
ThinkLLM:大语言模型算法与组件实现
ThinkLLM是一个开源项目,包含了Transformer核心算法、模型训练与优化算法、高效推理与部署算法、长序列处理算法等,帮助开发者和研究者深入理解大模型的底层机制。
开源实时目标检测模型:rf-detr,在Microsoft COCO基准测试中超过60AP
开源实时目标检测模型rf-detr在COCO基准测试中超过60AP,体积小,可在边缘设备上运行。基于DETR架构结合DINOv2,参数量分别为29M和128M。