中科院、百度提出新架构:突破参数限制,实现高效推理

专注于AIGC领域,讨论微软&OpenAI、百度文心一言等大语言模型的发展与应用。提出Inner Thinking Transformer架构(ITT),通过动态分配计算资源和思考步骤提升模型性能而不增加参数,显著优于基线模型。

将越狱问题转换为求解逻辑推理题:「滥用」推理能力让LLM实现自我越狱

大语言模型在推理任务中表现出色,但可能被恶意利用。来自北航等团队提出RACE框架,通过推理增强对话攻击模型的安全对齐机制。研究揭示了潜在威胁,并提出了防御策略。

ICLR 2025|浙大、千问发布预训练数据管理器DataMan,53页细节满满

AIxiv专栏探讨了DataMan数据管理器在优化大语言模型预训练中的应用。该研究提出了一个全面的质量评分体系,用于15个常见应用领域的预训练数据质量评估和领域识别,显著提升了模型性能。

中科闻歌发布智川X-Agent平台、优雅音视频大模型更新,领先技术加速AI普惠落地

中科闻歌发布智川X-Agent和优雅平台,助力政企快速落地AI应用与创意灵感。智川X-Agent提供一站式开发平台,支持零代码构建个性化智能体;优雅平台则为多模态内容生成提供智能体支持。