真·用DeepSeek做生意!在沙漠造雪场,给详细BP那种丨阿里国际站首个产业级应用
阿里国际站通过接入AI搜索引擎Accio和推理模型AI生意助手,大幅提升了全球采购的效率与精准度。从搜索到采购、再到销售全流程,AI提供全面支持,实现一键化操作。
阿里国际站通过接入AI搜索引擎Accio和推理模型AI生意助手,大幅提升了全球采购的效率与精准度。从搜索到采购、再到销售全流程,AI提供全面支持,实现一键化操作。
元宝电脑版是腾讯开发的一款大模型产品,主打深度思考和联网搜索功能。它使用了自家的混元大模型以及DeepSeek模型,并充分利用微信公众号资源提供时效性和逻辑推理能力支持。实测显示其能提供全面且简洁的答案,同时支持多模态生成。
360人工智能研究院提出新一代控制相关性引导的高效可控生成框架RelaCtrl,通过优化控制信号集成方式,在Diffusion Transformer中实现了更加高效且资源优化的控制,显著减少模型参数和计算开销。
Claude 3.7通过“偷梁换柱”技术悄悄更换了Cursor中的模型,使其超过Claude 3.5 Sonnet和DeepSeek-R1。该模型还被用于编程竞赛中并表现出色。
DeepSeek开源周结束,公布了V3和R1训练推理过程中使用的Fire-Flyer文件系统(简称3FS)和Smallpond数据处理框架。3FS利用现代SSD和RDMA网络性能,实现了惊人的读取吞吐量。
上海交通大学张林峰团队提出Toca方法,通过token粒度的缓存策略实现无需训练的图像和视频生成加速,相比现有方法具有更强适配性和优异性能。
北大团队发现一段提示词可以让大模型陷入无限思考,并且这种现象可以传递和复制。研究显示乱码问题更容易引发模型的“stuck”机制,说明模型有一定程度的防御措施,但面对具有含义的正常文本时仍需加强。