大模型
大语言模型
大模型开源及RAG用于综述写作进展:兼看mobile agent在应用场景选择上一些思考
今天是2025年02月24日,星期一。文章讨论了mobile agent的思考和开源进展,包括MoE小模型Moonlight-16B-A3B、Qwen2.5-VL及deepseek开源周day1开源FlashMLA等项目。此外还介绍了RAG在写作场景中的应用进展。
【科普】大模型蒸馏技术揭秘:用1%的成本,获得90%的AI能力!
文章介绍了大模型蒸馏技术及其应用。通过模型蒸馏,可以将庞大复杂的大型模型“瘦身”为更高效的小模型,节省计算资源、提高推理速度并适应更多平台。模型蒸馏的核心是知识转移和温度调控等技术,同时存在知识同质化、能力阉割及数据污染等问题,需要综合解决方案来应对。
【问小白】Deepseek R1 671B满血版,非常稳定,不卡、零延迟、不限次、全免费、随便用
随着用户量增长,DeepSeek访问受限。问小白接入了DeepSeek满血版671B,并采用专线部署,解决访问不稳定问题。问小白以快、稳、免费和智能等特点脱颖而出,提供即时搜索、创作工具及逻辑推理等功能。它还支持联网搜索及语音输入,确保用户体验流畅稳定且免费。