PW的核心是其自我进化和自适应机制,LLM 会同时迭代生成、评论和改进提示和示例。此过程通过反馈和综合确保持续改进,实现针对特定任务的整体优化。
PromptWizard三个关键组件
PromptWizard 概述
-
反馈驱动改进: PW 的核心是利用迭代反馈循环,LLM 在其中生成、批评和改进自己的提示和示例。这种持续改进机制确保每次迭代都比上一次更好,从而产生高效的提示和示例。 -
多种示例的联合优化与合成: PW 生成的合成示例不仅稳健多样,而且具有任务感知能力。通过同时优化提示和示例,确保它们协同工作,有效满足特定任务要求。
-
自生成思维链 (CoT) 步骤:结合 CoT 推理可提高模型的解决问题能力。通过使用选定的少量样本,PW 为每个示例生成详细的推理链,从而促进细致入微、循序渐进的问题解决方法。
PromptWizard 的工作原理

https://github.com/microsoft/PromptWizard
https://www.microsoft.com/en-us/research/blog/promptwizard-the-future-of-prompt-optimization-through-feedback-driven-self-evolving-prompts/
(文:PaperAgent)