人工智能
关于智能体开发范式之——ReAct(Reasoning and Acting)到底是什么?
ReAct是一种方法论和提示词模板,用于让大模型像人类一样思考并解决复杂问题,通过拆解任务、观察执行结果来不断优化答案。
字节Seed提出序贯策略优化方法,突破同传“质量-延迟”权衡问题
香港中文大学、字节跳动Seed和斯坦福大学研究团队提出SeqPO-SiMT框架,实现70亿参数规模下SOTA性能。该方法通过序贯策略优化解决同声传译中的质量-延迟权衡问题,翻译质量媲美Qwen-2.5-7B离线翻译水平。