开源
字节开源 InfiniteYou:灵活且高保真的人像再创作技术,微软Playwright MCP:进行快速可靠的网页自动化操作
InfiniteYou利用Diffusion Transformer实现高保真、个性化图像生成与编辑;pdf-craft能将扫描书籍PDF转换为Markdown和EPUB格式;Playwright MCP通过结构化数据让大型语言模型进行网页自动化操作;Oliva Multi-Agent Assistant利用Langchain和Superlinked在Qdrant数据库中查找产品并提供多智能体助手支持;AI有声书自动化生成工具利用大模型(如Gemini)自动转化为有声书。
开源实时目标检测模型:rf-detr,在Microsoft COCO基准测试中超过60AP
开源实时目标检测模型rf-detr在COCO基准测试中超过60AP,体积小,可在边缘设备上运行。基于DETR架构结合DINOv2,参数量分别为29M和128M。
AlexNet-Source-Code:2012 年的原始 AlexNet 源代码
AlexNet-Source-Code (2012年) 在ImageNet竞赛中夺冠,推动深度学习应用,包含原始参数文件和CUDA加速训练。
MuJoCo Warp:为NVIDIA硬件优化的GPU加速物理模拟器
MuJoCo Warp是为NVIDIA硬件优化的GPU加速物理模拟器,大幅提升仿真速度,并支持多种物理模型和集成NVIDIA Warp技术。
Understand-R1-Zero:深入剖析R1-Zero类训练方法
深入剖析R1-Zero训练方法,发现其已展现‘灵光一现’现象,并提出Dr. GRPO算法优化强化学习过程。仅用8×A100 GPU在27小时内实现SOTA性能。
一款开源语音RAG助手:Oliva
Oliva是基于Langchain和Superlinked的开源语音RAG助手,支持用自然语音对Qdrant向量数据库进行实时语音搜索,通过Deepgram和LiveKit实现。
开源语音 RAG 助手!用自然语音实时搜索向量数据库,革新语音交互体验!
通过语音对话实时搜索Qdrant向量数据库的开源工具Oliva降低了用户与AI的知识库交互门槛。它支持多智能体协作、实时信息检索和个性化配置,提升了效率和智能化水平。