ChatGPT 4o修图平替,DeepSeek中文版工作流

文章介绍了如何使用ICEdit工具实现自然语言修图,包括6G显存需求和最低1分钟的处理时间。加入DeepSeek节点可简化翻译过程,只需付费申请API密钥,并在配置文件中添加代码即可。同时提供了模型下载和安装方法。

3B逆袭7B巨头!Video-XL-Pro登顶长视频理解SOTA,单卡万帧准确率超98%

上海交通大学、北京智源研究院和特伦托大学的研究团队推出了一种新的超长视频理解大模型Video-XL-Pro,该模型通过创新的重构式令牌压缩技术实现了近一万帧视频的单卡处理,并在多个基准测试中超越了此前发布的大型模型。

公司深度报告自动生成company-research-agent框架及PP-DOCBEE文档大模型数据合成策略解析

今天是2025年5月6日,星期二,北京晴。文章介绍了两个项目:一是Deepresearch变体之公司报告自动生成company-research-agent的实现拆解,二是多模态文档大模型PP-DOCBEE的数据合成策略。前者着重于工程设计和流程细节,后者则关注数据合成的具体方法和技术。

一文看懂任务型对话系统:从传统Pipeline到大模型驱动的End-to-End

最近在做智能问答系统的项目,深感任务型对话系统从模块清晰的Pipeline架构发展为大模型驱动的End-to-End模式。文章全面介绍了任务型对话系统的概念、主流架构和应用场景,并探讨了未来大模型如何推动变革,如融合RAG架构、增强工具调用能力等。

影响大模型能力表现的因素,以及提示词在其中扮演的角色和工程化的作用和方法

大模型的能力由多个因素决定,包括神经网络技术的发展、训练数据的选择与质量、模型结构的固有缺陷、以及微调等。提升大模型潜力的方法则涉及模型架构改进、算法选择、数据质量优化等多个方面。提示词工程是一种常用手段,通过调整提示词激发大模型潜力,促进其在特定任务上的表现。