豆包模型上新:Doubao-1.5-pro
Doubao-1.5-pro 模型针对MoE模型的四个计算象限提出异构硬件结合低精度优化策略,提升吞吐量和降低总成本。通过定制化的RPC后端、灵活配比的Prefill和Decode集群以及GPU与CPU的异步化处理,实现高效稳定的推理系统。
Doubao-1.5-pro 模型针对MoE模型的四个计算象限提出异构硬件结合低精度优化策略,提升吞吐量和降低总成本。通过定制化的RPC后端、灵活配比的Prefill和Decode集群以及GPU与CPU的异步化处理,实现高效稳定的推理系统。
LM Studio支持CUDA llama.cpp (Windows)与DeepSeek R1的结合,欢迎关注知识星球获取更多资源。
phidata 是一个开源框架,用于构建多模态智能体,并提供美观的用户界面进行交流,参考更多文档及资源。
这是一款开源的零样本人像视频动画项目X-Dyna,它能够通过驱动面部表情和身体动作将单张人像图片动画化,并且还能让背景动起来。该技术由扩散模型、动态适配器模块、局部控制模块等组成,能够生成流畅的肢体动作和自然的环境效果。
酷的PASA系统是一个智能的论文搜索代理,能自主调用搜索工具、阅读论文并选择合适的参考文献。PaSa-7B在多项指标上超越了其他基线,尤其在召回率和精确率上有显著提升,并且其架构由LLM代理、爬虫和选择器组成。
unsloth团队发布量化版本的DeepSeek-R1-Distill,Qwen-32B-Q4_K_M版压缩至20GB,在单卡上运行。欢迎支持知识星球获取更多资源。